试比较垂直搜索引擎和传统的搜索引擎

来源:网络(转载) 作者:马毽 发表于:2012-05-08 13:46  点击:
【关健词】垂直搜索引擎;传统搜索引擎;比较
搜索引擎以其强大的检索功能备受社会关注,各种类型的搜索引擎更是层出不穷。本文选取了垂直搜索引擎和传统搜索引擎作为比较对象,从工作原理、核心技术、信息服务这三个方面进行了比较,最后总结出搜索引擎发展的方向就是更好的为用户提供服务。

  搜索引擎主要指利用网络自动搜索技术软件或人工方式,对网络资源进行收集、整理与组织,并提供检索服务的一类信息服务系统。随着网络和计算机技术的快速更新,各种类型的搜索引擎层出不穷。由于搜索引擎查询的海量结果存在信息量大、查询不准确、深度不够等缺陷,用户感觉到很难在短时间内准确的筛选并找到符合需求的信息。于是,垂直搜索引擎便应运而生。那么,它到底和传统的搜索引擎有何不同呢?
  1.垂直搜索引擎和传统搜索引擎概述
   传统搜索引擎就是早期的综合搜索引擎的统称。它是指定期收录和整理网络信息,提供关键词或浏览查询方式的网络信息检索工具。其资源包罗万象,用户可在检索栏中输入检索词来检索几乎任何类型和主题的资源。虽然它收录的资源范围广,但存在死链接较多、相关度较低等缺点。
   垂直搜索引擎即专业化搜索引擎,是专为查询某一学科或主题的信息而产生的查询工具。它是对某类网页资源和结构化资源的深度整合后提供符合专业用户操作行为的信息服务方式。其特点是“专、精、深”,且具有行业色彩。因为它的搜索器只搜集特定的主题信息的相关网页。这样大大降低了收集信息的难度,提高了信息的质量。
  2.工作原理比较
   传统的搜索引擎是通过Spider程序来自动地在互联网中搜集和发现信息,再由索引器为搜到的信息建立索引,最后由检索器根据用户的查询输入检索索引库,并将查询结果返回给用户。由于网页文件存在不规范性,传统搜索引擎所建立的索引是全文索引。垂直搜索引擎先利用特定的软件按照用户需求自动从网络服务器上搜索信息资源;再按照专题进行人工分类,建立索引,将索引好的内容存放到本地数据库。用户在检索时只需利用搜索引擎的界面接口输入检索要求,后台数据库检索软件对其进行处理,并将结果反馈给用户,用户可根据返回的摘要信息决定是否要继续访问原始站点,以得到更为详细的信息。
   由此可知,它们的工作原理是很相似的,不过垂直搜索引擎的后台索引数据库是在计算机自动搜索与人工分类相结合基础上建立的,它既能及时补充网上随时更新的信息,又能满足用户按照科学的分类体系准确的查询到满意的信息。
  3.核心技术比较
   传统搜索引擎是在整个互联网的网页中查找信息。依赖于搜索技术,抓取、索引、排序等技术。而垂直搜索引擎只在特定主题的网站上查找。采用的主要技术包括spider、网页结构化信息抽取技术、元数据采集技术、分词技术、索引技术等信息处理技术。
   所以,垂直搜索引擎可以针对专业特定的领域或行业的内容进行专业和深入的分析挖掘和定位,更精准的提供有一定价值的信息和相关服务,有效地弥补了传统的综合搜索引擎对专门领域及特定主题信息覆盖率过低的问题。同时,能够把具有相同兴趣点的人们集中在一个“主题社区”内,不仅集中提供各种专业资源,而且给大家提供了一个相互交流、共享经验和教训、展望行业发展前景的机会和场合。相比较传统搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。
  4.信息服务的比较
  (1)服务用户比较
   传统搜索引擎为用户提供一个的检索入口, 它准备了与用户提问相关的各种网络资源,供用户自行筛选。其用户群覆盖范围较广泛,涉及了所有类型的网络资源使用者。垂直搜索引擎的用户有明确的信息需求,这种信息需求可以界定在某一个特定范围内,并且满足其信息需求的信息产品是特定形式的组织化的信息,它提供的结果都是与用户需求相关的,用户不用自己再进行分析和判断。
   传统搜索引擎对用户的要求相对较高,在搜索的过程中,需要有用户对自己需求的不断调整的过程。垂直搜索引擎对用户的要求较低,直接输入检索需求即可。所以,传统的搜索引擎用户规模比较大,但是用户的需求不太明确;而垂直搜索引擎的用户需求相对明确。
  (2)信息服务内容比较
   对于搜索引擎而言,为用户提供的内容就是搜索结果。两种搜索引擎都可以提供与用户提交检索式相关的网上检索结果,但它们存在很大区别。
   信息的时效性
   从信息搜索及时性来分析,垂直搜索引擎需要获取的信息来自于某一特定领域的,这比起传统的搜索引擎漫无边际的信息抓取,具有实时性优势。由于网上的信息量巨大,传统搜索引擎的数据更新周期短则十几天,长则几个月,而垂直搜索引擎的数据更新可以以秒为单位。
   信息的描述。在描述形式上,传统搜索引擎提供的信息是网页链接,其匹配原则是网页描述与关键字的相关度;垂直搜索引擎提供的结果是结构化的数据。在描述内容上,传统搜索引擎的结果的描述的内容包括标题、描述、url链接三个部分。它们是当前URL链接上的网页整体内容的介绍,而不是针对用户检索的特定信息的介绍;垂直搜索引擎的搜索结果是从多个角度描述用户查找的特定信息。这样,用户几乎不需要点击链接就可以直接判断哪条检索结果是最需要的信息。
   信息结果的排列方式。传统搜索引擎是按照系统设定的排序算法,自动根据相关性将网页排列,用户只能被动的接受搜索引擎的排列顺序。垂直搜索引擎的排列方式可以由用户设定,用户可以自主的选择的多种方式进行排序。这为用户更好的找到需求的信息很有帮助。
   信息的查全率和查准率。传统搜索引擎的信息搜索的数量是巨大的,而垂直搜索引擎因为检索的网站数目有限,所以检索结果的数量也维持在几百个左右。而从查准率的角度看,垂直搜索引擎的准确率很高,几乎可以达到90%以上。因为这些特定的信息都是在特定的相关网站上查找的,所以可以保证它的准确性。但是传统搜索引擎是在广泛的互联网上查找,另外用户的信息需求表达不完整,其准确率相对比较低。
  5.结语
   传统搜索引擎和垂直搜索引擎的发展阶段不同,立足点不同,对数据处理的方式也不同。最终导致它们在核心技术、工作原理、检索服务等方面的差别。传统搜索引擎服务对象和服务内容广泛,用户认可程度高;垂直引擎服务对象和服务内容较窄,而指向性强。传统搜索引擎通过长期的搜索实践和总结, 制定了符合大多数用户使用习惯的服务策略和服务模式;垂直搜索引擎借鉴传统搜索引擎的同时也采取更符合具体化搜索的服务策略和服务模式。 (责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)

顶一下
(0)
0%
踩一下
(0)
0%


版权声明:因本文均来自于网络,如果有版权方面侵犯,请及时联系本站删除.