百度真的更懂中文

我算是半个Google Fans。最近一边在网上搜索资料一边攒自己的blog。渐渐的发现,百度真的更懂中文!抛开人品——前一段时间央视暴光百度虚假广告的事情——暂时不谈,就搜索质量来说,百度比谷歌做得更好!这是我的切身体验,也许其他同学会有不同看法。一直怀疑这样的结果是因为我的Google profile里面的locale设置不正确导致的——因为默认是日语搜索优先,更改成文中文优先之后仍然发现百度对中文的搜索结果明显得比谷歌优秀很多。

还有一个事情就是关于中文页面的小小细节,百度仍然比谷歌优秀。百度的主页设置了正确的lang,这保证了在即使在日语浏览器上能够正常的浏览百度的主页,而谷歌的首页却没有设置这个值。而这不过是举手之劳就能改善的——就算要求一个追求快速访问的页面遵守XHTML规范有点过分,但百度为什么做到了。谷歌进入中国也有些历史了,考虑到互联网的发展发展速度,谷歌在中国已经不算初来乍到的小毛孩,可是至今的表现仍然是水土不服!相较之下搜索的质量是如此低下,让人有点不能接受。所以有人说谷歌不是Google,并不是毫无道理。也许真的是中国互联网的环境太差劲了,“橘生淮北则为栀?”这让人不得不怀疑谷歌在中国究竟做了什么?看来边边角角的事情还是做了一些的,但是“搜索”这个核心业务却着实不见提高。如果连自己的首页都写不好,还怎么为用户提供更好的服务?

说起Google的诸多产品,我自己的抱怨还真是不少,这其中最差的就是GoogleCheckout,有一次很兴奋的想用这东西在网上买本书,结果死活不能交易,总是验证错误。还有GoogleGroup,我参加了不少中文新闻组,但是那个新闻组的邮件中汉字显示的只有蚂蚁那么大小,行宽就是一个大长条,写英文都讲究行宽不超过72字符,看中文能不能不要让我拧断脖子?你就不能多做一些本地化的工作?一个正确的lang,一个正确的字体匹配列表就有那么难么?可以说我是鸡蛋里头挑骨头吧,但是这些问题至少现在看来谷歌还是没有什么反应。百度贴吧至少有12pt的大汉字,至少用广告占去页宽控制了中文显示的宽度,难道谷歌就不能想想办法?

本文仅仅限于对谷歌中国的抱怨,这不妨碍我喜欢Google的产品。

One thought on “百度真的更懂中文

  1. 关于百度和谷歌的争论很早就开始了,这里有两篇顶Google的文章。一篇提到了索引的速度比较,
    http://kangkang.blogchina.com/mac/5958687.html
    另外一篇是分词技术。
    http://robertmao.com/archives/1345/

    “来自Google的Peter Norvig, “Statistical Learning as the Ultimate Agile Development Tool. “.
    ……
    演讲中他用分词作为例子,你可以看到采用大量数据统计为基础实现分词的核心代码只需要大概10来行Python代码, 当然这个能解决中文的问题。 一些号称中文分词是其核心技术的公司和学术人士们的确要醒一醒了,不过很多人也可能醒着但仍然扛着招牌吓人而已。 (Google的基于统计的分词应该是现在在使用中的技术,其核心很简单,但需要大量的文档作为training, 以及海量计算资源)”

发表评论