WordPress3.0 中文Tag Bug使Google提示重定向错误

偶尔检查一下博客的管理员工具,居然发现了一个严重问题。博客居然出现很抓取错误。

google抓取错误

唉,想一下应该就是升级到wordpress 3.0的问题,真想骂一句,XX的。在网上找了一爆料的人还很少,不过有人已经详细描述了。

原因据我观察+猜测是WordPress3.0把中文TAG的链接里面的转码统统转换为小写的了,且原来大写的转码都做了301重定向到小写。

比如说你有一个TAG叫“上海”,那么原来版本WP中转码后它的固定链接就是“tag/%E4%B8%8A%E6%B5%B7/”,其中“%E4%B8%8A%E6%B5%B7”其实就是“上海”这两个汉字的转码,但是WordPress3.0会把此固定链接转码为“tag/%e4%b8%8a%e6%b5%b7/”并且把“tag/%E4%B8%8A%E6%B5%B7/”重定向到“tag/%e4%b8%8a%e6%b5%b7/”,这样看上去没什么不妥。

但是Google的爬虫不干了,爬虫们罢工了,爬虫不等301就会马上离开并且报这个页面是“重定向错误”……这个推论的理由就是你的服务器日志文件,你会发现Google爬虫如果抓到“上海”这个TAG,会先访问“tag/%E4%B8%8A%E6%B5%B7/”,然后得到一个301重定向,但是其实Google爬虫并没有去重定向指向的“tag/%e4%b8%8a%e6%b5%b7/”页面,而是留下了“上海”这个TAG页面是“重定向”错误。

至于为什么Google爬虫不去抓取301目标页面,我猜测可能因为爬虫认为“tag/%E4%B8%8A%E6%B5%B7/”和“tag/%e4%b8%8a%e6%b5%b7/”是一个页面,而你的网站在用小花招玩弄Google的爬虫,这样的结果会给一个网站带来灭顶之灾。轻则收录数明显减少,重则给你的域名降权,或者什么影响都没有Google今天心情好……

说了那么多,解决办法是啥呢?要么滚回到2.9.2,要么就硬挺着,Google终会有一天更新了你TAG的url变成小写的转码,或许这将是一个漫长的过程,或者这将让你的网站在Google表现的不是很好,但是希望大家坚持。

以上这些话都是我从Google管理员工具和服务器日志文件慢慢观察和分析得到的结论,有很大的局限性。大家参考。也在此很无力的呼唤希望WordPress官方开发团队能给东方用户多一份关注,少一份漠视。不是要求WordPress开发团队如何如何必须这么做,而是一个有着合格的职业素质的工程师都会这么做。

wordpress漠视中国用户?xx的。

14 条评论

Ruby

我的网站也是这样啊
在Google webmasters里有170多个重定向错误,都是tags页面,郁闷
正考虑要不要在robots.txt里先禁止爬虫抓取/tags/
百度有没有这个问题?

回复
WSQ

不太白明WP3.0重新跳向的用意+1

另外,虽然我还没升到3.0,不过中文的编码一向比英文逊色一畴,所以还是英文来作标签比较保险一点。

回复

发表评论

电子邮件地址不会被公开。 必填项已用*标注

😉😐😡😈🙂😯🙁🙄😛😳😮:mrgreen:😆💡😀👿😥😎😕