管理员 发表于 2011-11-15 12:30:08

谷歌首次公布其搜索算法调整技术详情

腾讯科技讯(中涛)北京时间11月15日消息,据国外媒体报道,谷歌首席搜索工程师马特·卡茨(Matt Cutts)周一在该公司官方博客中宣布,谷歌最近已对其搜索算法进行了10项技术调整,并在Inside Search博客网站上公布了有关这些调整的技术详情。这也是自谷歌创建以来,该公司首次对外公布其搜索算法的部分技术详情。多年以来,谷歌从未公开披露过其搜索算法的技术详情。从去年开始,一些竞争对手声称,谷歌涉嫌滥用其在互联网探索领域内的优势,即在谷歌搜索结果排名中,将谷歌自家产品和服务排在竞争对手之前。业界人士认为,谷歌周一所公布的搜索算法技术调整情况,虽然仅仅是很少一部分数据,但对于整个搜索产业而言却有着非同寻常的意义。卡茨周一称,谷歌每年会对自家搜索算法进行约500项技术调整,而最近则进行了10项调整,其中涉及用户量较少语种的算法调整,如斯瓦希里语(Swahili)等语种。卡茨还表示,谷歌已在Inside Search博客网站上公布了这些调整的技术详情。在接到其他竞争对手的投诉后,美国联邦贸易委员会(FTC)已对谷歌搜索及其他产品展开反垄断市场,以查明谷歌是否滥用用其市场优势地位。目前谷歌在全球搜索市场的份额约为69%。分析人士认为,谷歌正逐步推出多种产品和服务,今后该公司在收入来源上将逐步减少对文本搜索广告的极大依赖性。在遭到FTC反垄断调查后,谷歌聘请了12家游说公司。在此之前,谷歌还聘请了另外6家游说公司。附:卡茨周一所撰写博文全文通常情况下,我们每年会对我们的搜索算法进行约500项调整。我们这样做的目的是使搜索业务运行更为平稳,用户甚至不会注意到相关变化。我们今天这样做,是想让用户了解一下谷歌搜索结果的后台运行情况。我们今天在Inside Search网站上公布了我们过去数周内对部分搜索算法的技术调整,这些调整涉及翻译、数据片段以及自动完成等情况。如果你想了解这些调整的详细描述和完整列表,请访问Inside Search博客网站上的相应博文。

管理员 发表于 2011-11-15 12:30:51

为了帮助站长用户进一步了解谷歌搜索算法的一些技术详情,编译了完整列表和详细描述,供站长参考阅读。1.跨语言信息检索更新:对于有限的网页内容所支持的语种查询(即南非荷兰语、马来语、斯洛伐克语、斯瓦希里文、印地文、挪威文、塞尔维亚文、加泰罗尼亚语、马耳他语、马其顿语、阿尔巴尼亚语、斯洛文尼亚语、威尔士语、冰岛语),我们将能翻译相关的英文网页,并且在搜索结果中的英文标题下直接显示翻译的标题,而此功能之前只支持韩国语,且只是显示在页面的底部。现在用户只需点击翻译好的标题,即可进入已将英文翻译成查询语言的页面。2.有着更多网页内容和更少页面/菜单内容的页面摘要(Snippet):这种变化可以帮助我们通过页面摘要测试工具选出相关性更高的内容,随着团队对网页结构认识的提高,我们现在将更有可能从实际网页内容中选择,而不是页眉或菜单的一部分。3.通过去除重复样式锚文本在搜索结果中获得好的页面标题:我们发现在产生网页标题时出现了不少信号,其中一个是指向网页的链接锚文本,我们发现那些包含重复锚文本的样式链接并不相关,因此我们不太重视这些因素,搜索结果是跟网页具体内容更相关的标题。4.俄语中以长度为基础自动完成的预测:这种改进减少了俄语用户因语言长度或任意查询带来的困扰。5.丰富网页摘要(Rich Snippet)的扩展改进:我们最近扩展了丰富网页摘要的应用覆盖范围,使搜索软件应用的用户能够在搜索结果中看到具体细节,如价格及用户评论等。6.图片搜索中一项功能标记被淘汰:随着网络的发展,我们经常会重新审视一些在过去推出的功能标记的影响作用,淘汰不再发挥显著作用的功能标记,在此情况下,我们决定淘汰图片搜索中关于搜索在网络上被多个文件引用的图片的功能标记。7.更新鲜更近期的搜索结果:正如我们一周前所宣布的一样,我们已经对于如何排名新的内容做出了重大改进,这项改进影响范围将覆盖约35%的总搜索量(大约6-10%的搜索结果将有显著变化),对于给定的查询将展现出适当的新鲜感。8.完善官方网页检测:我们一直努力给用户提供最相关和最权威的结果,对此我们对如何确定网页的权威性做出了调整,这将使官方权威的网站在我们的搜索结果中拥有更高的排名。9.日期限制性查询的改进:我们改变了在用户选择特定日期范围查询时对搜索结果新鲜度的处理方式,这将有助于确保用户能得到与其指定日期范围内最相关的搜索结果。10.IME查询的预测性修复:这种变化提高了自动完成处理IME查询(查询包含非拉丁字符)的能力。
页: [1]
查看完整版本: 谷歌首次公布其搜索算法调整技术详情