博文精选 | 架构师入门感悟之十三

2021-11-22 13:19:24

F5小安

文章速览:

 

行业:互联网

 

关键字:Google、搜索引擎、

 

摘要:本文介绍了Google 搜索引擎是如何对搜索结果进行排序的。

 

阅读时长:5分钟

 

 

以下文章来源于InfoQ!作者:莫问

 

 

Questions

Google 搜索引擎是如何对搜索结果进行排序的?

Google 借助一种称为“PageRank”的算法对搜多结果进行排序。

“PageRank"的核心思想是“某个页面被其他页面引用的越多,说明这个页面排名越靠前”。

使用 PR(A)来表示“A 页面被其他页面引用的权重值”,L(A)表示“A 页面引用其他页面的总数(即出度)”,如下图,共有 4 个页面,初始每个页面的 PR 值为 1,按照上述思想,PR(A) = PR(B)/L(B)+PR(C)/L(C)+PR(D)/L(D);经过固定次数迭代,PR 值逐步减少,并趋于收敛。

按照上述思路,某个页面可以通过仅引用自己来提高 PR 权重值,或者几个页面之间引用形成了循环依赖,导致 PR 值无法收敛,如下图:

应对上述“漏洞”的思路是引入“随机点击页面的概率(业界经验值为 0.85)”,上图 PR(A)=(1-x)/4+x*PR(B)/2,其中,x 为 0.85。


总结


参考

https://www.link-assistant.com/news/google-page-rank-2019.html

https://blog.csdn.net/qq_30374549/article/details/80358196


 

 

以上是针对Google 搜索引擎对搜索结果排序的分享,希望对大家有帮助!

 

 

 

阅读原文

 

声明:本文章版权归原作者及原出处所有 。凡本社区注明来源:XXX或转自:XXX”的作品均转载自其它媒体,转载目的在于传递分享更多知识,内容为作者个人观点,仅供参考,并不代表本社区赞同其观点和对其真实性负责。本社区转载的文章,我们已经尽可能的对作者和来源进行了注明,若因故疏忽,造成漏注,请及时联系我们,我们将根据著作权人的要求,立即更正或者删除有关内容。本社区拥有对此声明的最终解释权。


发布评论 加入社群

发布评论

相关文章

博文精选 | TCP 协议灵魂问题,巩固你的网路底层基础

F5小安

2022-01-14 09:11:08 50

博文精选 | 架构入门感悟之十二

F5小安

2021-11-18 17:45:22 93

博文精选 | 架构入门感悟之十一

F5小安

2021-11-17 11:23:57 92

Login

手机号
验证码
© 2019 F5 Networks, Inc. 版权所有。京ICP备16013763号-1