手机站
网通分站
电信主站
密 码:
用户名:
当前位置 : 主页>网站运营>搜索优化>列表

什么是倒排索引?倒排表?如何建立倒排索引?

来源:互联网 作者:west263.com 时间:2008-02-22
西部数码-全国虚拟主机10强!40余项虚拟主机管理功能,全国领先!双线多线虚拟主机南北访问畅通无阻!免费赠送企业邮局,.CN域名,自助建站480元起,免费试用7天,满意再付款! P4主机租用799元/月.月付免压金!
为什么我们要说倒排索引呢?
因为倒排索引是目前 搜索引擎公司最对搜索引擎最常用的存储方式.也是搜索引擎的核心内容!
在搜索引擎实际的引用之中,有时需要按照关键字的某些值查找记录,所以我们是按照关键字建立索引,这个索引我们就称之为: 倒排索引, 而带有倒排索引的文件我们又称作: 倒排索引文件 也可以叫它为: 倒排文件 来实现快速的检索与高速的效率!

那我想问下 什么是倒排表呢?
倒排文件中的 次关键字索引 我们称做: 倒排表
其主要优点是: 在处理复杂的多关键字查询时,可在倒排表中先完成查询的交、并等逻辑运算,得到结果后再对记录进行存取。这样不必对每个记录随机存取,把对记录的查询转换为地址集合的运算,从而提高查找速度!

下面就是整个倒排表的建立过程(组图):

数据表


索引表

右项归并后的索引表

那我最后问下 我们因该怎样建立倒排索引呢?
关于建立倒排索引其实就象我们写一本小说一样 目录是章节标题对应的页码 对全文搜索来讲 倒排索引就是词对应文档编号!
下面我们举个例子:
案例1:
普通文档存在形式:
PPT (从头看起.....)==> keywords1,keywords2,keywords3,keywords4,keywords5,.............
案例2:
倒排索引翻转后的结果显示:
keywords1,keywords2,keywords3,keywords4,keywords5,............. (直接找关键字 然后在找内容页)==> PPT

不知您看懂了没! 如果还不是很清楚 我在举个例子 最简单的:
我们随便看什么书 我想 因该是分2种看法 一种是 从头到尾法! 而 另一种就是 先看目录 看那些 是我需要看的 那么 直接就翻到 该页面! 不然 和第一个人一样从头一直看 看到你想要看的 那不是 前面时间都浪费了?? 目录就起了个 关键作用! 这下因该懂了把! 如果还不清楚 不要紧 看看 上面的 倒排表 你就因该懂了... 如果还不懂或不理解 那可以来联系我了..! 联系方式见网页底部!
转自 上海SEO http://www.seo-sh.cn QQ 10171718 SWJ 责任编辑:稻草 QQ:449156

文章整理:西部数码--专业提供域名注册虚拟主机服务
http://www.west263.com
以上信息与文章正文是不可分割的一部分,如果您要转载本文章,请保留以上信息,谢谢!