电脑桌面
添加文秘网到电脑桌面
安装后可以在桌面快捷访问

Web信息检索工具的检索功能述略

栏目:财经金融发布:2010-04-27浏览:2594下载232次收藏

(郑州大学信息管理系,河南 郑州 450052)
摘 要: 在阐述web信息检索发展背景的基础上,详细介绍了当前应用广泛的web信息检索功能 ,并对其作了简单的评价。
关键词:web信息检索工具;检索工具;检索功能
中图分类号:g252.7  文献标识码:a  文章编 号:1007—6921(2008)18—0046—03

internet的诞生与发展一直是众所瞩目的焦点,网络技术的日新月异为人们共享和交流信息 提供了越来越便捷的途径,网络已经成为人们获取信息的重要渠道,根据cnnic〔1〕调查报告 显示,我国上网用户中有46.1%的用户上网最主要的目的是获取信息,搜索引擎占用户常用 网络服务的62.7%,信息检索和信息获取服务充分利用网络跨越时空传递信息的优势,是web 服务的一个至关重要的部分。现在,web发展为一个动态交互的多媒体资源融合的平台,促 使web信息检索发展为internet上主流的检索方式,虽然它的发展时间并不长,但是已由功 能单一、种类稀少进入到了功能多元化、种类多样的发展阶段。
1 web信息检索的两类检索功能
1.1 分类浏览检索功能

分类搜索引擎的分类方法是一种以主体对象为中心的实用分类体系,在类目体系纵向展开上 ,使用了多维划分和多元展开的形式,利用超文本链接,往往有针对性地同时用多个引用次 序,使用类似多表列类的方法,同时设置多个类目体系,建立多维的系统,使得用户可以从 不同的角度进行检索。在横向关系的揭示上,通过重复反映的方式充分揭示相关主题,包括 多属性主题和相关主题。

分类搜索引擎可以清晰方便地查找到某一大类信息 比较符合传统的信息查找方式尤其适合 那些希望了解某一方面或范围信息,并不严格限于查询关键字的用户,但分类搜索引擎的搜 索范围较全文搜索引擎要小许多,尤其是当用户选择类型不当时,有可能遗漏某些重要的信 息源。
1.2 关键词检索功能 

检索时直接在搜索引擎提供的检索对话框中输入要检索的关键词进行的检索,输入的关键词 可以是单个词汇,也可以是多个词汇,通过组配的方法进行比较复杂的检索。

关键词检索技术实质是人工或计算机对数据库信息内容预先进行加工,即对文献内容全面地 分析,将那些出现在文献的标题、文摘、正文中能反映文献主题概念具有实质意义的词语抽 取出来进行标引,通过文献标引来揭示文献内容,进行信息资源定位。用户根据自己的信息 需求,利用系统提供的关键词检索入口,输入自己选定的关键词,系统按照用户的查询指令 查找符合条件的对应内容,并把检索结果组织起来提供给用户的一种检索方式。
2 目前比较常用的两类检索功能
2.1 布尔检索

布尔检索是指通过标准的布尔逻辑关系词来表达检索词与检索词的逻辑关系的检索方法,主 要关系词有and、or、not。①and关系,称为逻辑与(逻辑乘),用关系词and表示,表示它 所连接的检索词必须同时出现在结果中才能满足检索条件。②or关系,称为逻辑或(逻辑加 ),用关系词or表示,表示它所连接的两个检索词中任意一个出现在结果中就能满足检索条 件。③not关系,称为逻辑非(逻辑减),用关系词not表示,表示它所连接的两个检索词中 应从第一个概念中排除第二个概念。如果说,使用多个关键词进行检索可改善关键词的检索 性能,那么,布尔检索是保证多关键词检索正确操作的基本规则。布尔检索对关键词检索效 率的改进是多功能的,即它既可用于提高检准率的目的,也可用于提高检全率的目的。不过 ,两者之间存在着互逆相关性,即使用and何not运算符会影响检全率,使用or运算符会影响 检准率。
2.2 限定桂索 

这是在网络信息检索工具中使用得相当广泛的检索方法,一般可缩小检索范围,从而减少不 需要信息的输出。限定检索均属选项,限定条件多种多样,包括:①限定字段,也称字段检 索,即限定关键词必须是处于页面中的某个位置的。如限定在标题、统一资源定位器(url) 、链接文字、网页文字 、特定站点等部分;②限定网页深度(即网页层次);③限定在某一 专题内检索。如果网络信息检索工具设有某些检索专题,则关键词可限定必须出现在某个专 题内,如新闻组、黄页、白页、电子邮件地址、广告、道路地图、股票行情,热点商业新闻 等等;④限定检索对象(站点类型 )。如新闻站点、个人同页、商业站点、非盈利站点、教 育站点、军事站点、政府站点等等(根据域名后轻);⑤限定网络资源类型。公司信息、指南 和名录、活动公告信息、拍卖信息、学习信息、新闻发布信息等等;⑥限定数据类型。如文 件、声音、图像、音像、html 的成分、内含编程语句等等;⑦限定日期。如特定日期之前 或之后的网页,最近某段时问内建立或修改的网页等等;⑧限定地区或域名。可以看出,某 些限定条件检索对减少不需要信息的输出具有重要意义。
2.3 截词检索 

截词检索,是使用截词符(通配符“*”),表示作为检索用词的关键词的某部分允许有词 形变化。截词检索包括右截词(后端截词、前方一致)、左截词(前端截词、后方一致)、中 间截词(前后方一致)和左右截词(中间一致)。

截词检索有字面成族的作用,而字面成族的词中有一部分或大部分甚至全部又是概念成族的 ,所以利用截词检索可提高检全率,但会带出一些误检的网络资源。绝大部分网络信息检索 工具都具有截词检索功能,在网络信息检索工具中使用的主要是右截词,部分支持中间截词 ,左截词则极为罕见。截词必须适可而止,截去部分过多会太大增加误检率。与截词检索基 本相同的是自动添加语法变化词。这种方法没有带出误检资源的副作用,但必须有一个词形 变化对应表作为条件。
2.4 加权检索

它是对布尔检索的改进,可

解锁后支持完整在线阅读或下载编辑海量优质内容资源

Web信息检索工具的检索功能述略

点击下载
分享:
热门文章
    热门标签
    确认删除?
    QQ
    • QQ点击这里给我发消息
    回到顶部