扫码加入虎嗅会员

“扫一扫”立享会员服务

正确的提示信息
取消 发送 评论
取消 发送 评论
取消 发送 评论
从这里发现更多精彩
好啊
搜索历史
热搜词
搜索引擎是如何工作的?

本文转自微信公众号:KnowingAI知智(ID:Knowing_AI),作者:虞喵喵。


信息检索是什么?它和搜索引擎的关系是什么?以及,如何更好地使用搜索引擎?


点击观看视频,你对人工智能的了解就能轻松超过全世界 99% 的人类!


图文版本送给不方便打开的朋友:



信息检索(Information Retrieval)起源于图书馆的资料查询和文摘索引。计算机诞生后,信息检索的内容已经从文本检索,扩大到图片、音频、视频等各种信息的检索。



通常信息检索会包含一个 Query,即表述需求的查询字段,和一份由系统回复的、包含所需要信息的文档列表。



搜索引擎是最常见、规模最大的信息检索系统。



通过爬虫不断抓取、存储、更新互联网中的网页内容,再为它们建立与字典类似的索引目录,用户在键入关键词时,就会通过关键词在这些网页中出现次数和位置,来判断页面与 Query 的相关性,并将它们由高到低排列起来。



说起来简单,理解用户的 Query,清除重复或低质量的页面,建立高效的索引,每一项都不简单。建立一个好用的搜索引擎,往往需要分词、信息抽取、文本分类等各种各样的 NLP 技术作为支撑,小小的一个搜索框背后,凝聚着人类最顶尖的智慧。



找不到自己想要的信息?我们也可以学习使用一些高效的搜索语句,让搜索引擎更好地理解我们,有机会不妨试试它们吧!


*文章为作者独立观点,不代表虎嗅网立场

未来面前,你我还都是孩子,还不去下载虎嗅App猛嗅创新!

别打CALL,打钱
0人已赞赏

热 文 推 荐

好的内容,值得赞赏

您的赞赏金额会直接进入作者的虎嗅账户

    自定义
    支付: