关于网络信息组织的综述

本文由用户“longxiaojun010”分享发布 更新时间:2023-07-03 21:15:44 举报文档

以下为《关于网络信息组织的综述》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

关于网络信息组织的综述

学 生 姓 名:李某某

专 业 班 级:信管 21-2A 班

学 号:***9

时 间:2022年12月1日

序号

作者

文章(书籍)题目

期刊名称(出版单位)、时间



[1] 黄某某 国内外信息组织述评[J]. 中国图书馆学报,2002,28( 1) :63 -66.

[2] 国家图书馆研究院 国内外图书馆学理论研究与实践进展(2009 -2010)[M]. 北京: 国家图书馆出版社.2011.

[3] 陈某某,李某某,朱某某 近年来我国信息组织研究进展与趋势[J]. 图书馆建设,2006(3):63 -67.

[4] 韩某某 网络信息资源组织方式研究[J]. 中国图书馆学报,200329( 6) :39 -41

[5] 索传军 网络环境下图书馆信息资源的组织管理 [J]. 图书情报工作,1999,43( 2):30 -33.

[6] 王某某,徐行 基于用户分类标签建立结构性的大众分类法[]. 图书馆学研究.2011(9):73 -76

[7]陈伟 用户参与的社会性标签信息组织探讨 [J].图书馆学研究.2012( 6) :79 -82

[8] 刘某某,陈静. 基于数据网格的异构信息共享平台的实现 [J]

计算机工程,2007( 9):280 -282

[9] 中国图书馆学会. 2011 - 2012 年图书馆学发展报告[M]. 北京: 中国科学技术出版社,2012

[10] 陆某某. 细粒度信息检索与知识挖掘 [J]. 图书情报知识,2012

[11] 温某某,徐某某,赖某某 知识元挖掘[M]. 西安: 西安电子科技大学出版社.2005

[12] 温某某,焦某某. 基于知识元的知识发现[]. 西安: 西安电子科技大学出版社,2011.

[13] 赵某某,蒋某某. 知识单元与指数规律[]. 科学学与科学技术管理,1984(9):39 -41

[14] 周某某,余某某,刘某某,等. 基于 XML 平台的知识元表示与抽取研究[J]. 中国图书馆学报,2006,32(3):41 -45.

[15] JISC. 数据中心: 使用、价值、影响 . 图书情报工作动态,2011

[16] 英国数字保存中心 制定数据管理与共享计划[J] 图书情报作动态,2011( 10):21

[17] 白某某 关联数据及DBpedia实例分析[J]. 现代图书情报技术,2010( 3) :33 -39

[18] 贺某某,曾某某 基于语义的馆藏资源深度聚合研究[J]. 中国图书馆学报,2012,38( 4):79 -86.

[19] 简某某,叶某某. 对完善网络信息分类组织若干问题的思考[J]. 图书馆学研究,2003( 9):38 -41



一、网络信息组织的相关基本概念及产生背景

信息组织,亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息外在的、形式的特征,如信息载体的物理形态、题名、作者、出版或发表日期、流通或传播的标记等方面的特征;信息的内容特征就是信息包含的内容,它可以由关键词、主题词或者其他知识单元表达。信息组织的基本对象就是信息的外部特征和内容特征。

信息组织是信息检索与传播的准备,是信息收集之后的首项工作。信息组织是一个信息增值的过程。在这个过程中,杂乱无章的原始信息变成一个有序、可用的信息系统,一个“粗放型”的信息集合转化为一个“集约型”的信息结合,为信息的分析研究和服务奠定基础。信息组织的基本内容包括信息选择、信息分析、信息描述与揭示、信息存储。

(1)信息选择

信息组织是信息活动的必然要求,其源起在于信息本身的自然无序状态。序是事物的一种结构形式,是指事物或系统的各个结构要素之间的相互关系以及这种关系在时间和空间中的表现,即事物发展中的时间序列及排列组合、聚类状态、结构层次等空间序列。当事物结构要素具有某种约束性,且在时间序列和空间序列呈现某种规律性时,这一事物就处于有序状态。反之,则处于无序状态。信息选择的目的就是从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息,它是整个信息组织过程的第一步。

(2)信息分析

信息分析是按照一定的逻辑关系从语义、语用和语法上对选择过的信息内、外表特征进行细化、挖掘、加工整理并归类的信息活动。它是信息描述与揭示的前提和基础,直接影响着信息组织的质量。

(3)信息描述与揭示

信息描述,亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。信息描述与揭示主要分为两种类型:一是著录,主要描述文献信息的形式特征;二是标引,主要揭示文献信息的内容特征。信息描述与揭示是信息资源组织的重要内容,在信息组织中起着至关重要的作用。

(4)信息存储

信息存储是将经过加工整理序化后的信息按照一定的格式与顺序存储在特定的载体中的一种信息活动。信息存储的目的是为了便于信息管理者和信息用户快速、准确地识别、定位和检索信息。各种文献信息检索工具书如《全国总书目》、《全国报刊索引》、《中国专利分类文摘》、《中国学术会议文献通报》等,各种光盘检索系统、联机检索系统、网络信息检索工具等都是信息存储的方式。信息存储于各种检索工具中意味着信息组织过程的终结,也即意味着信息检索的开始。

信息组织即信息的有序化与优质化,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的表征和排序,实现无序信息流向有序信息流的转换,从而使信息集合达到科学组合实现有效流通,促进用户对信息的有效获取和利用。 信息组织具有:类聚性,系统性,动态性,多重性。

二、发展现状(包括例举代表、研究理论或应用方法介绍)

信息组织在实践中的应用

在图书馆系统中的应用

图书馆是一个为信息资源建立检索点,并为用户提供服务的机构。就高校图书馆而言,它在不同的历史发展时期有着不同的信息组织模式,主要有以图书馆纸本文献为中心的传统信息组织模式,多层次的网络信息组织模试基于 Web 20的用户参与互动信息组织模式三种模式。

以基于 We 2.0的用户参与互动信息组织模式为例Web2.0是互联网发展的第二代模式,其概念最早是匙在2004年由 OR eily Media 公司的 Da e Dough aty 和 Media Live 公司的 Cra ig Cline 提出,他们认为互联网上信息的交流组织发布搜索与利用模式正在发生深刻变革互联网已进入了 W b20时代即用户决定内容。多数学者认为Web2.0是以 Flick Craig slist , Linke din , Tribe sDel . icio . us ,43this.com等网站为代表,以 Blog , Tag , SNS , RSS , Wiki 等应用为核心依据六度分隔长尾理论 XML 及 A jax 等新理论和技术实现的互联网新一代模式在 Web 20相关信息组织等技术的影响下,高校图书馆的信息组织模式正处于革新转变中,即由图书馆馆员构建向图馆员㧟㧟用户参与互动构建的模式转变。将Web20肢术与图书馆信息组织实践结合起来,主要应用是 Bog , Tag , RSS , Wi - ki 等 We 2.0技术形成了基于 We b2.0的用户参与互动信息组织模式。以学科信息门户为例在Wb2.0时代,将以专家构建模式转向专嫁㧟用户合作构建的联合组织模式引入Wb2.0信息组织技术如借助 bg , Tag , RSS , Wiki 等,充分调动用户在学科信息门户建设中的主动性和参与性,使网络用户从信息接收者转变为信息生产者和信息传播者,实现信息门户与网络用户之间的良性参与互动,建立基于 W db2.0的新一代学科信息门户。

在民间文学资源中的应用

民间文学通过口头方式使各民族的主要的知识体系和价值观念得以世代相传。在历史发展的长河中,它们有的以书面形式固定下来,有的则仍依赖口承方式传播和保存。每个国家都有自己代代相传的民间文学,并各有其特点,显示出不同国家、不同民族的丰富的文化内涵与特色。同时,不同地区、不同民族的民间文学作品在主题乃至叙事范型上有着一定的相似性,因而对于研究民族文化的多样性、交融性和文化发生发展的规律等具有重要意义。

而民间文学资源具有载体的多样性、资料的变异性、文本的版本多样性、研究文献与原始资料紧密联系性等特点,对其进行信息组织十分必要。传统的信息组织方式主要以书目控制为主,有编制汇编本、目录、索引、词典、综述等形式。

(1)汇编本

汇编本将原始资料依据地域、民族、作品类型或主题来进行汇编。这些汇编

本有的完整地保存了原始资料,有的较为真实地反映了田野调查的实际情况,有的较为集中地反映出某一时间段某一地域的民间文学的整体状况。以云南的情况为例,如云南少数民族的民间文学资料,就分别编印有《云南民族资料》(1-18辑,中国作家协会昆明分会等编,1962-1963年印;《云南民族文学资料》(1-22集,**_*文某某1964年油印);《云南少数民族文学资料》(1-7辑,云南社***文学研究所等1980-1981编印)等。从1984年开始的《中国歌谣集成》、《中国民间故事集成》、《中国谚语集成》三套集成的普gぷ鳎邮〉街荨⑾卮蠖汲闪⒘讼喙氐陌焓禄梗约晌行牡拿窦湮难XXXXX乃鸭驼砘疃嬲箍玫降淖柿鲜郧XXXXX啤8髦置窦湮难XXXXX煞值厍⒎植愦伪嗉⒂≈苹虺霭妗?ldquo;东巴经文化研究室”、“葬族文化研究所”等组织、翻译出版了众多的民族文学作品资料。各种全国性和综合性的民间文学作品汇编本中,云南的内容占有极大的比重。但是,汇编本多为内部出版物,且收藏分散,大量的原始资料仍然无法便利地检索。

(2)书目、索引

书目、索引是在原始文献的基础上编制的指引文献出处的二次文献,是书目控制的主要工具。好的书目、索引应能全面反映某一学科领域或专题的图书、论文及其他形式文献的整体状况,有些还加以提要或文摘。书目有综合书目、专题书目、引证书目。综合书目中一般以分类的形式集中相关学科或专题的文献。如我国的《民国时期总书目》、《全国新书目》、《中国国家图书书目》等,都可找到民族文学及其研究的相关类目的书目。专题书目则针对性更强,文献的收集和选择更细致。如 Crammer , Marjorie Bibi ograp hy of Ameri can Folkl ore ,( Prince George ' s Co . Md .)) Public Libra ry ,1975.)和 MacDonald , Margaret Read and Brian

Sturm . The Story tele rs Sourcebook (1983-1999.Gale,2001)等。我国编制的民间的专题书目较少,较为全面的是《民间文学书目汇要》,但遗漏较多。目前缺乏系统的民间文学作品目录、民间文学研究目录、国外民间文学研究目永等。证书目是学术著作中所附的相关参考文献目录,虽然没有专题书目的系统性,但选择性强,有极大的参考价值。我国的学术著作一般来说引证书目较为简略。索引又分论文索引、引文索引、类型索引等。论文索引中有中国社科院民族文学研究所曾某某《中国民间文学作品目录索引(1940-1980)》、《中国少数民族文学论文作品索引(1981-1983)》,中央***图书馆编制有《中国少数民族民间文学作品目录索引(1949-1977)》等。此外,一些论文集中也附有研究论文目录索引,如《**_*1977-1982))》(《云南少数民族文学论集》第二集,中国民间文艺出版社(云南版),1983),《云南民族民间文学论文要目索引(1983-1985)》,(《云南民间文艺源流新探》,云南民族出版社,1986),《东巴文化集》、《东巴文化续集》(云南人民出版社,1985,1990)附录中有《纳西族研究部分论文目录索引(1936-1991)》《东巴文化研究资料索引(续)》等等。由于专题性索引收录不全,对研究论文的信息组织,主要还是依赖于《全国报刊索引》(哲社版)、《中国社会科学文献题录》、《内部资料索引》等综合型索引中的相关类目。但是,论文集中的单篇论文难以得到分析著录和系统揭示。引文索引反映论文被引与引用状况,提示从文献引证的角度查找相关文献。传统的信息组织中对此只有综合性的组织,如 SSCI 、 A & HCI 。类型索引是民间文学作品的信息组织的一种独有的方法。以民间文学的叙事特点出发,通过功能、母题来对民间文学作品进行分类组织。为民间文学作品比较研究、类型研究、母题研究提供了极大的便利。

(3)词典

词典也是民间文学资源信息组织的一种重要方式,有的主要立足于作品,如《中国各民族宗教与神话大辞典》(学苑出版社,1993、《中国神话辞典》(袁某某,上海辞书出版社,1986);有的从研究出发,如《中国民间文学大辞典》(姜某某,上海文艺出版社,1992)。但是,词典的编制中由于篇幅的限制,多较为简略。

总体来看,传统信息组织主要是基于收藏的和基于文献资源的形式特征的。由于主要是纸质印刷本形式,无法连接其他相关媒体资料,而且是基于资料本身的编辑,抽离了其生态环境,无法完全体现信息资源的时间乃至空间维度;灰色文献的揭示和信息组织无法全面系统;缺乏分析著录,无法反映和集中隐藏在论文集、著作及单篇论文中的相关内容。传统的信息组织方式至今仍是常源控制与检索的重要方法。

大数据时代是信息时代的延伸,它不但具有信息时代的基本特征,还对人类的数据驾驭能力提出了新的挑战,这促使我们对信息组织的发展做出新的思考。

三、存在的问题或待解决的问题

概括地说,网络环境下图书馆学主要以网络信息资源为研究对象,侧重基于传统的文献信息分类组织思想与主题词表对网络信息资源组织的科学性、完备性和适应性等问题的研究; 计算机科学主要以互联网环境下用户信息搜索行为为研究对象,立足于提高网络环境下信息资源管理效率,注重于网络信息资源组织管理的智能化、高效率和简便性研究。二者不仅缺乏有效的融合,而且还缺乏对认知科学等的借鉴和利用。具体表现为缺乏对用户需求、认知心理和能力的跟踪、分析和评价:缺乏对用户需求的语义分析,对获取信息、认知和利用的关联度分析:缺乏对网络资源内容的深度揭示以及对关联关系的深度挖掘与组织。加工、组织、管理和服务仍然停留在较大粒度的文献、文件或网页层面,难以满足用户对网络信息资源发展变化的需求。因而,需要从有利于用户对信息认知和利用的角度出发,研究新的网络信息资源组织方法

四、发展趋势

近年来,国内外都十分关注网络环境下知识组织系统的理论构建、技术及实践研究,诸如概念关系揭示、语义网络构建、知识的语义化表达;叙词表、语义网络、主题图、概念图及本体等知识组织技术及其实践应用研究等9。图书馆学专家侧重于概念关系的揭示、词表的语义化、基于叙词表的学科领域本体构建以及基于本体的知识组织理论体系研究;计算机科学专家则侧重于知识的语义表达、本体构建和本体应用的关键技术等研究。总的来看,都在朝着人工智能和语义控制两个方向发展,以实现面向用户的网络信息资源的精细、深度和动态组织。

2.1 细粒度精细组织

随着用户信息需求的日益精确化,信息检索与挖掘研究呈现细粒度和语义( 关联) 化的发展趋势10。细粒度是相对于大粒度的文献和文件等而言的。一是从物理量上看,其字节数较文献或文件少:二是从语义内容上看,其所含语义内容较文献或文件少。精细组织也是相对于现有的以文献或文件等为主的信息组织方式,是指将信息资源中具有一定意义和价值的概念图表、数据等较小粒度的知识单元挖掘出来利用一定的方法和手段加以科学组织。

2.1.1 知识元 温某某等认为: 主题可再分为描述事实、数据、公式等的最小知识单位,称为知识元11。世界范围内众多研究者认为,知识的保存、管理和利用目前仍停留在以“文献”为单位的传统方式上,从而构成知识发现和利用的瓶颈。解决人类知识资源利用的办法是将知识的控制单位由“文献”深化到“知识元”,这也被认为是图书情报学取得突破的关键问题!12 。早在20 世纪80 年代,赵某某教授等就开始系统研究“知识单元”问题l3。马某某教授认为数据单元也可以称为知识单元,它是由各种事实、概念和数值等组成的。周某某、姜永常和郑某某等都提出将文献细化为知识元进行组织与服务的构想!14。世界著名期刊Natur也开始对文献中的重要知识点进行标引。中国知网几年前就开始对文献中的一些概念、图形、数据和创新点进行挖掘,并提供数字、图形、表格和概念搜索服务由此可见,由大粒度的文件网络向细粒度的数据网络发展是大势所趋。

2.1.2 科研数据 科研数据是指科研活动中产生的数据,是科研成果编写的重要依据。科技文献等信息资源中包含有大量的有价值的数据。许多用户查询信息的主要目的就是为了获取文献中所包含的数据,其价值已经开始得到越来越多的认可。美国、英国等国家的一些组织和图书馆已经开始着手对科研数据的管理与服务工作。2011 年,英国联合信息系统委员会( Joint Information Systems Committee,JISC)发布了《数据中心: 使用、价值、影响》报告15。英国科学与技术设施理事会发布了科学数据政策,要求受其资助的科研项目都必须参照最佳实践方法制定数据管理计划16。2006年,万维网的发明者 TBernersLee 在《关联数据构建笔记》等一系列文章中分析了 Web 的发展和演化,提出了当下发展数据网络( Web of data)的思想17。

2.1.3 微信息 从现有的网络应用看,人们越来越喜欢获取和使用更小粒度的信息,如备受人们欢迎的微博和微信。除此之外,诸如微数据、微数据杂志、微小说和微视频等也越来越受到人们的青睐。这不仅反映了人们信息需求的倾向,而且从信息组织、传播和利用看,其效率更高。因此深入到文献或网络资源内容之中,实现对知识元等细小粒度实体的分析、挖掘、揭示聚合便成为未来网络资源组织研究的必然选择。

2.2 语义深度聚合

揭示、描述信息内在语义及其之间的关联关系,是实现语义信息组织的基础。语义关系揭示得越丰富信息资源聚合的深度与效果就越好。所以,要实现精准发现,提供精细服务,就需要将大粒度的网络信息资源碎化为细小粒度的知识元等细小实体实现知识元的深度聚合。“聚合”借用了有机化学的概念,意即通过人工智能等技术实现知识元的融聚并产生新的知识元。聚合不同于传统信息组织与资源整合,也不仅是资源物理上的整合,而且有语义上的融合。整合的结果是1+1 =2,而聚合的结果则是 1+1>2。贺某某等按照聚合的实现方式将基于语义的知识元的深度聚合分为三种类型18:1基于概念及概念关系的聚合;2基于引证关系的聚合:3基于科研本体的聚合。基于语义的知识元的深度聚合有助于将不同主题学科、不同内涵外延、不同属性关系的知识内容进行识别、标识和关联,形成集概念主题、 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 目,更新、维护类目设置,稳中求动,使网络信息组织更加符合用户的需求。@依据用户使用设备或获取渠道和手段的不同随时优选和浓缩信息,对信息搜索结果进行后组织简某某和甘春梅等也提出了采用“动静结合”方法变化类目19,即在保证基本知识大类“静”的前提下根据用户变化的信息需求“动态”更新类目的划分例如,为了便于用户以最快捷的方式访问网站提供的热门栏目和信息,在栏目的设置上,可以不拘泥于原有分类体系的逻辑层次划分,而是根据信息量和访问频率提升某些重要栏目的级位,将网站最有价值的内容放到突出位置。因此,网络信息分类组织应该是动态的,又是相对稳定的,这样能较好地适应网络信息快速变化的要求。

概括地说,网络环境下,用户的信息需求层次日趋提高,要求信息组织管理由原来的“广、快、精、准”向“深、动、精、细”转变,具体表现为: 1由基于信息外在属性聚类的组织模式向基于语义内容深度聚合的组织模式发展;2由单某某、大粒度的信息组织模式向多粒度、细粒度组织模式发展;3由静态组织模式向动态组织模式发展;4由检索前组织向检索后组织发展。最终形成一个适应复杂信息环境、满足用户多层次需求的多粒度、多层次的动态组织模式。

[文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]

以上为《关于网络信息组织的综述》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

图片预览