搜索引擎三大基本工作原理过程

发表时间:2019-08-02 09:41作者:贵阳阳光创信网址:http://www.cqjso.cn

搜索引擎的基本工作原理包括以下三个过程:

**,在互联网上发现和收集网页信息;同时提取和组织索引数据库;然后检索器根据用户输入的查询关键字,在索引库中迅速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并且将查询的结果返回给用户。

搜索引擎的基本工作原理:

1、抓住网页

每个独立的搜索引擎都有自己的爬虫。爬网程序Spider跟随网页上的超链接,从此站点爬网到另一个站点,并爬过超链接以爬网更多页面。已爬网的网页称为网页快照。由于在因特网上应用超链接是非常普遍的,理论上,从一定范围的网页中,可以收集大多数网页。

2、处理网页

在搜索引擎捕获网页之后,仍然需要进行大量的预处理工作来提供检索服务。其中,最重要的是提取关键字并构建索引库和索引。其他包括删除重复页面,分词(中文),确定页面类型,分析超链接,以及计算网页的重要性/丰度。

3、提供搜索服务

用户输入要搜索的关键字,搜索引擎从索引数据库中找到与关键字匹配的网页;除了网页标题和URL之外,用户还提供来自网页的摘要和其他信息。

本文来源于贵阳阳光创信:http://www.cqjso.cn,转载请注明出处。

联系Q Q:569244816
联系电话:17784119448 联系地址:贵阳市南明区花果园金融街2号1411-1412
website qrcode

扫描查看手机版网站

网站首页           关于我们           营销服务           客户案例           新闻资讯           联系我们
24小时客服热线
17784119448
贵州阳光创信网络科技有限公司