小议中文网络报纸和中国重要报纸全文数据库的综合利用

来源:南粤论文中心(WWW.NYLW.NET) 作者:王 红 陈 陶 发表于:2011-02-25 09:52  点击:
【关健词】网络报纸;报纸数据库;检索途径; 图书馆
结合作者所在图书馆的实际情况,阐述了合理挖掘网络报纸和中国重要报纸全文数据库资源,并对其进行综合利用设想和建议。最终目标是为读者提供与纸质报纸同步的剪报服务、定向查询、编制专题文献、网络咨询、海外网站报纸资源的利用和个性化服务。

1 前 言
  在高度网络化的现代信息环境下,人们获取信息的途径发生了深刻的变化。在过去传统报纸资料的检索中,报纸索引和剪报资料的配合使用是高校图书馆为读者检索报纸资料最有效的方法。而当今,互联网正在发挥着重要作用,报纸信息的查询与网络报纸及报纸数据库信息资源相结合的发展趋势已成为一种必然。
  报纸数据库的建设随着网络技术的发展也迅猛发展起来。很多报纸不仅建立了报纸数据库,而且还争相出版网络版。网络版报纸的最大优势在于它的时效性,同时也为报纸、数据库信息的搜集、提取提供了方便、快捷的途径。
  数字图书馆的建设步伐随着读者对电子资源的需求增加也随之加快,图书馆不断引进了多种电子资源。中国重要报纸全文数据库检索系统(以下简称中报库)收录了全国500余种重要报纸数据资料,采用全文检索系统,首次将所有的报纸文献包含在文史、政治、经济、教育、科技、婚姻等六大类、数十个小类的树型结构中,为报纸数据库分类检索开创了一种新型模式。
  2 网络报纸及数据库的检索途径
  目前,我校图书馆主要的中文保存报纸和剪报利用报纸都可通过进入《全国报纸电子版网址大全》(http://www.zjpj.com/zjpjimg/paper.htm)或《报刊目录电子报纸》(http://www.haogao.com/bkml/dzbz.htm)等诸多网址中查到。其中,《人民日报》数据库是我国新闻媒体中开发较早、收录最完备的数据库。该库由《人民日报》所辖的数十家报纸、杂志、网站专题数据库组成。其检索系统为目前报刊媒体中使用最普遍的单一入口全文检索系统,支持“and”“or”“not”逻辑符的运用,并可提供文献的二次检索。光明网数据库规模仅次于人民网数据库,也是由一个集团下的几家报刊数据库组成,《光明日报》数据库为其中的核心数据库,使用“阿波罗全文检索系统”,提供多途径检索,支持二次检索,检索速度较快。《中国教育报》采用图灵文霸全文检索系统,还设有全文、标题、肩题、主标题、副标题、正文、作者、日期检索入口。《中国青年报》数据库是精确检索,也提供二次检索。《经济日报》数据库以及最新版2001年经济日报光盘数据库均采用TBS全文检索系统,具有多途径、多层次检索文献的功能。《北京日报》数据库(包括京报集团所属报刊)使用I-search pro智能全文检索系统,提供任意词、分类、日期、包含、模糊、联想、智能等多途径检索,支持逻辑符“,”“+”“?”和“*”的使用,同时支持中、英文混合检索和二次检索。《解放日报》数据库还可查阅登载在《解放日报》等报纸上的文章篇目,《解放军报》数据库也提供二次检索。
  提供多途径检索是全文数据库检索系统应具备的功能。虽然我国报纸网站的发展已有较大规模,但发展水平良莠不齐,差别很大。从我国已建成的网络报纸信息数据库来看,具有3个相同的检索性能: 1)都能比较快速、简便地从作者、标题、日期、版次、人名和栏目等外表特征查找资料;2)由于用户对分类体系和分类方法不熟,使花费较多时间的分类工作没有起到应有的作用;3)不论是题录库还是全文库,其中的全文本检索使用率都最高,几乎成为唯一的内容特征查找途径。
  3 检索最新报纸的时间和范围比较分析
  把网络报纸和中报库检索最新报纸的时间和范围进行比较,其检索利用的优越性各有不同。网络报纸数据库在我国起步较晚,基本上都是近几年建成的,可供读者利用的文献还很有限。许多数据库查询专指性不强,难以查到图片内容、广告信息、标题新闻等资料,而且网站不重视对数据库的维护,显示的页面信息比较陈旧,数据库还经常无故打不开,一些数据库还有种种使用限制,比如收费等。可以看出,在网上浏览最新报纸的时间要比中报库及时得多,一般可以看到当天或前几天的报纸新闻,但网络报纸的检索时间都比较晚,没有中报库早。
  通过检索途径的比较分析,可以看出,网络报纸数据库使用检索软件上存在着诸多的问题。1)检索点不足;2)检索名称、符号使用混乱;3)检索页面简单化,揭示信息不足;4)用户缺少选择自由度;5)分类设计不符合报纸特点。人民网数据库与中报库在文献收藏量上差别是很大的;而光明网数据库查询文章的专指性、方便性均好于中报库;《经济日报》数据库则在查询文章的数量上比中报库多几倍。
  中报库设有正标题、副标题、作者、报纸名、全文检索入口,支持逻辑符“and”“or”使用,提供二次检索,还具有按时间前后升、降排序的功能,这是它优越于其他数据库检索的重要之处。作为国内首家采用分类体系编报的数据库,将所有文献划分为六大类、数十个小类,表面上看是为所有文献找到一个位置,但由于报纸本身的特点,六大类间文献量严重不均。中报库从每期报纸近50篇文章中选择10篇左右入库,收入的文章水平无疑是高的,但文章的选择较为片面,收藏量也是很有限的。
  中报库所浏览最新报纸的时间和检索量是个不定值,其信息是随中报库更新的及时程度而变。因为不能天天更新,所以没有网络报纸信息来得快,其信息一般是滞后的。比如《大连日报》《南方周末》在中报库的信息会滞后100多天。中报库还不方便检索某月某日的报纸,只有在回溯具体的专题文章时才比较方便。如果在任意查找中检索的结果数量较多时,单靠读者逐页翻找,必然很影响检索效率。因此,其查询方式还不能满足报纸的独特性。好的检索系统应该让使用者有更多的选择空间,从检索结果数量的输出到页面信息的选择可以看出,中报库在报纸的收入时间、范围、收入文献数量等方面仍存在一定的缺陷。
  4 报纸资源综合利用的设想和建议
  合理发掘网络报纸和中报库资源可以扩大为读者的服务范围。网络报纸具有信息量大、时效性强、内容直观、图像丰富、再加工方便、可交互性、检索方式多样等特点。大多数网络报纸的电子版和纸质报纸浏览效果一样,很直观,在点击查看网络报纸单篇报道或文章的同时,还可以进行复制、粘贴等操作。并且在上午8时前即可看到当天报纸刊载的文章,比图书馆所订邮发报纸的时间提前3个小时以上。图书馆利用这个时间差完全可以提供与纸质报纸同步的各项服务。通过比较可以看出,查找最新报纸文章通过上网查网络报纸比较适合,而查找比较远期的报纸文章则查中报库比较方便。 (责任编辑:南粤论文中心)转贴于南粤论文中心: http://www.nylw.net(南粤论文中心__代写代发论文_毕业论文带写_广州职称论文代发_广州论文网)

顶一下
(0)
0%
踩一下
(0)
0%


版权声明:因本文均来自于网络,如果有版权方面侵犯,请及时联系本站删除.