WordPress3.0 Tag 大写转小写

昨天在WordPress3.0 中文Tag Bug使Google提示重定向错误(http://blog.3927.biz/wordpress-30-chinese-tag-bug/)里面讲到WordPress3.0把中文TAG的链接里面的转码统统转换为小写的了,且原来大写的转码都做了301重定向到小写。

今天测试了一下,通过header状态检查工具就可以查出来。可以使用这个工具http://www.seoconsultants.com/tools/headers/#Report查询,这个工具也可以查询301重定向状态。

比如查询 http://blog.3927.biz/tag/%E7%B3%BB%E7%BB%9F%E5%8F%98%E9%87%8F/

返回的代码是

1. Requesting: http://blog.3927.biz/tag/%E7%B3%BB%E7%BB%9F%E5%8F%98%E9%87%8F/
GET /tag/%E7%B3%BB%E7%BB%9F%E5%8F%98%E9%87%8F/ HTTP/1.1
Connection: Keep-Alive
Keep-Alive: 300
Accept:*/*
Host: blog.3927.biz
Accept-Language: en-us
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 6.0)
Server Response: 301 Moved Permanently
Date: Wed, 14 Jul 2010 14:53:16 GMT
Server: Apache
X-Powered-By: PHP/5.2.12
X-Pingback: http://blog.3927.biz/xmlrpc.php
Location: http://blog.3927.biz/tag/%e7%b3%bb%e7%bb%9f%e5%8f%98%e9%87%8f/
Vary: User-Agent,Accept-Encoding
Content-Encoding: gzip
Content-Length: 20
Keep-Alive: timeout=5, max=100
Connection: Keep-Alive
Content-Type: text/html; charset=UTF-8

Redirecting to http://blog.3927.biz/tag/%e7%b3%bb%e7%bb%9f%e5%8f%98%e9%87%8f/ ...

2. Requesting: http://blog.3927.biz/tag/%e7%b3%bb%e7%bb%9f%e5%8f%98%e9%87%8f/
GET /tag/%e7%b3%bb%e7%bb%9f%e5%8f%98%e9%87%8f/ HTTP/1.1
Connection: Keep-Alive
Keep-Alive: 300
Accept:*/*
Host: blog.3927.biz
Accept-Language: en-us
Accept-Encoding: gzip, deflate
User-Agent: Mozilla/4.0 (compatible; MSIE 7.0b; Windows NT 6.0)
Server Response: 200 OK
Date: Wed, 14 Jul 2010 14:53:17 GMT
Server: Apache
X-Powered-By: PHP/5.2.12
X-Pingback: http://blog.3927.biz/xmlrpc.php
Vary: User-Agent,Accept-Encoding
Content-Encoding: gzip
Content-Length: 8577
Keep-Alive: timeout=5, max=99
Connection: Keep-Alive
Content-Type: text/html; charset=UTF-8

 转换的的情况就是这样了。

在服务器的访问日志里面显示google蜘蛛爬取的记录是301

203.208.60.195 - - [14/Jul/2010:20:44:50 +0800] "GET /tag/%E5%9B%9E%E5%AE%B6/ HTTP/1.1" 301 20 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

5 条评论

渴慕晨光

@Lafirel
其实wp已经把含有中文的url转码成了小写的,问题是当google浏览器遇到“http://www.asgone.net/tag/服务器”这个网址时,自动识别为大写的,然后wp就再来个转小写,结果就是301。还有就是可能是google自动把所有的含有中文的url转码识别为大写的。

回复
Lafirel

我来回访了。
这几天继续观察思考了下这个问题,你继续观察你的服务器日志文件,其实只有Google爬虫和百度爬虫会去爬你的大写转码链接,然后吃一肚子301。其他蜘蛛都是爬小写的。如果有百度管理员工具,那么肯定也会使铺天盖地的301......
这说明了其实可能不是WP的原因,因为如果是WP原因,所有爬虫应该都遇到这个问题啊。
但是你想,如果不是WP的原因,为什么2.92没有这个问题....
我这几天头都快想炸了....

回复

发表评论

电子邮件地址不会被公开。 必填项已用*标注

😉😐😡😈🙂😯🙁🙄😛😳😮:mrgreen:😆💡😀👿😥😎😕