以下为《大数据对信息管理的影响》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
大数据对信息管理的影响
什么是信息管理?
信息管理,一般存在两种基本理解。
狭义角度理解:信息管理就是对信息本身的管理,即采用各种技术方法和手段(如分类、主题、代码、计算机处理等等)对信息进行组织、控制、存贮、检索和规划等,并将其引向预定目标。
广义角度理解:信息管理不单单是对信息的管理,而是对涉及信息活动的各种要素(信息、人、机器、机构等)进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。
信息管理的实质就是人类综合采用技术的、经济的、政策的、法律的、人文的方法和手段对信息流(包括非正规渠道和正规渠道中的信息流)进行控制,以提高信息利用效率、最大限度地实现信息效用价值为目的的一种活动。
一、何为大数据?(what)
大数据起源
·1980年著名未来学家托夫勒所著的《第三次浪潮》,书中将“大数据”称颂为“第三次浪潮的华彩乐章”。(名称来源)
·1998年Science杂志刊登的《 A Handler for Big Data 》一文。(正式出现)
·2008年9月,Nature杂志出版“big data”专刊,用10篇文章的篇幅论述了大数据对人们生活和科学研究的影响。
·2011年5月全球知名***麦肯锡发布了《大数据:创新、竞争和生产力的下一个前沿领域》研究报告,此后“大数据”迎来了全面爆发。
·2013年被许多国外媒体和专家称为“大数据元年”。
大数据定义
·大数据是一种数据集。
·其特性通过与传统的数据管理以及处理技术对比来突显。
·在不同需求下,要求时间处理范围具有差异性。
·大数据的价值并非数据本身,而是由大数据所反映的“大决策”、“大知识”、“大问题” 。
大数据是指采用多种数据收集方式,汇集不同数据源,通过采用现代信息技术和架构能够高速分析处理的、具有高度应用价值和决策支持功能的多种类型数据及其技术集成。
大数据规模
1979 年成立于美国马萨诸塞州霍普金市的EMC 公司认为,大数据中的“大”是指大型数据集,一般在10TB 规模左右;多用户把多个数据集放在一起,形成PB级的数据量(概念提出早期)。而目前的大数据规模已经达到了EB、ZB乃至YB的级别。
大数据的3V、4V、5V
·2001年麦塔集团(META Group)分析师莱尼(Doug Laney)提出大数据3V特性:量的规模(Volume)、数据格式的多样化(Variety)和数据即时处理的速度(Velocity)。
·IDC定义了数据的4大特征,增加了数据的价值密度(Value)。
·IBM提出的5V,包括数据的真实性(Veracity)特征。
大数据产生的背景
·被动产生的数据:20时间90年代,由于计算机和数据库管理的出现,很多大型的生产经营管理系统产生的海量数据都被存储到数据库当中,如超市、银行、医院、政府通过长期经营已经逐步累积的庞大结构化数据。
·主动产生的数据:21世纪初是网络发达的年代,网络环境中积累了大量的用户行为和交互数据,这些数据以半结构化和非结构化为主。
·自动产生的数据:当代物联网和传感器开始出现以后,由机器自动产生实时数据,如射频识别(RFID)信息、定位/GPS系统数据等。
从大数据流行的时间上来看,主动产生的数据和自动产生的数据才是当前真正大数据产生的真正原因。
大数据时代到来的必然性
·现实世界的转化路径:数字化
·取之不尽的数据来源:互联网/物联网
·即时可用的计算环境:云计算
·移动泛在的信息行为:智能手机和终端
大数据自动体系
大数据处理技术体系主要涉及大数据的采集技术、存储技术、分析及处理技术、数据呈现技术4个部分。
/
信息管理专业为什么需要大数据? (why)
数据始终是信息管理关注的重点
当今没有无数据的科学,也没有无科学的数据,一切数据都有其科学内涵和科学意义。
在大数据技术支持下,数据可以转换成为信息、知识和情报,因此,数据本身又再一次重回到信息管理关注的视野中。
如果把科学理论看作一种广义的模型即对世界的一种表征,那么构建模型的数据是必不可少的,关键在于如何运用。
大数据时代科学研究范式的改变
数百年前出现理论科学,出现各种定律和定理,并运用各种模型,比如开普勒定律、牛顿运动定律等;近几十年,理论分析方法变得非常复杂以至于难以解决难题,人们开始寻求模拟方法,于是产生了科学的计算分支。
图灵奖获得者Jim Gray 在2007年提出第四种范式——数据密集型科学发现。
对大数据相关专业人才的旺盛需求
信息技术在社会、经济和生活等各个领域不断渗透和推陈出新,交通领域的交通流量监控数据、环境领域的气象水文监测数据、物流领域的商业物流数据、医疗领域的健康管理大数据、教育领域的教学过程数据等等,各个领域都积累了丰富的数据
2016 年发布的我国首份《大数据人才报告》披露,我国大数据相关专业人才仅46万,在未来3~5年内大数据相关专业人才的缺口将高达150万。
大数据相关专业人才就业市场的旺盛需求,所以信息管理学科人才培养必须与时俱进。
/
(二.2.图)
信息管理专业具有独特的优势
现有的信管专业课程设置已经具备了一定的基础或优势。
首先是已经开设了跨学科的课程,如数据库管理系统、信息科学、管理信息系统等;其次是相较于其他专业,信管专业更注重培养对信息价值和信息组织的理解;再次,信管专业的学生也能较深刻地理解数据管理生命周期和项目管理的基本知识;最后,该专业学生也具备一定的数据分析基础。
三、大数据如何影响信息管理?(how)
1.新介质:经过数字化转化,社会、经济和文化得以在无边的数字空间中飞速发展,人类的信息过程也发生了全方位、全链条、全要素的变化。
2.新场景:信息管理工作流程完全被颠覆,信息生产者、加工者和用户的角色并不固定。互联网改变了传统信息传播模式,物联网改变了传统信息传播主体,机构知识库改变了信息存在和利用的形式等等场景。
3.新空间:面对的空间是互联网、传感网和通信网三位一体的虚拟空间,在这个新空间中,信息管理工作模式发生了革命性变化。过去只能在物理空间中进行的信息加工组织传递转移到了虚拟空间,或者在物理空间和虚拟空间中交叉进行。
对信息管理理论的影响
信息链从底层到顶层分别是事实、数据、信息、知识、情报(智慧),每个不同阶段都具有不同的工作模式,也产生了不同的产品。
这个链条中,有着比较严格的进化顺序,信息管理的基础理论和实践操作中,也遵从这个框架的逻辑性。
/
在新介质、新场景和新空间下,信息链可能不再是一条直线,而是一种复合结构。
/
对信息管理实践的影响
大数据的出现提供了“数据密集型决策与管理”这一新的范式。数据驱动决策和数据驱动管理是大数据时代信息管理的具体目标。
第一是数据驱动决策。不断丰富的数据及其处理和分析技术的进步,给管理决策带来了历史性的机遇,用数据思维解决管理决策问题成为了可能和必要。
第二是数据驱动管理。大数据时代信息管理的另一个目标是数据驱动管理应用,达到精细化运营的目的。
对信息管理专业带来的挑战
大数据使得信息管理的视角、过程和方法都发生了显著的变化。
但面临着巨大的挑战:
第一,安全问题。(包括个人隐私、企业秘密、国家安全)
第二,与传统方法的相异性。(过去是因果分析、局部分析、人工分析、模型驱动分析)
第三,数据处理的需求。(复杂的数据类型处理工具、数据反冗余分类机制、实时数据生成模型)
第四,跨学科、跨专业、跨领域的交叉性研究和合作。
四、大数据应用在信息管理学的哪些领域?(with what effect)
大数据对信息管理的影响是什么?从信息管理的各个领域,即信息组织、信息检索、信息分析、信息计量、信息行为、信息服务等来展开。
一、大数据对信息组织的影响
信息组织的概念:
信息组织,也叫信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。
外部特征:信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征(题名、作者、出版社、日期等)。
内部特征:信息包含的内容,由主题词、关键词或其它知识单元表达。
信息组织的内容:
(1)信息选择
从采集到的无序的信息流中甄别出有用的信息,剔除无用信息。
(2)信息分析
按一定逻辑关系从语义、语用和语法上对选择过的信息内、外部特征进行细化、挖掘、加工整理并归类。
(3)信息描述与揭示
根据信息组织和检索的需要,对信息的主题内容、形式特征、物质形态等进行分析和记录。
(4)信息存贮
将经过加工整理序化后的信息按一定格式与顺序存储在特定的载体中。
信息组织的类型:
按信息表现形式:文字信息组织、图像信息组织、声音信息组织、视频信息组织
按信息加工程度:一次信息组织、二次信息组织、三次信息组织
按信息的传播载体
信息组织在大数据环境中应发挥的作用:
(1)大数据资源的分类。根据数据价值、数据分布状况、数据类型等指标决定信息组织的深度。
(2)大数据资源的记录与描述。 比如可以为大数据建立数据档案。
(3)大数据资源的浓缩与约减。可以对大数据进行一定程度的抽象表示,建立大数据资源的替代记录。
(4)大数据资源的定位、选择、评估与管理。通过信息描述建立的元数据。
(5) 大数据资源的交换与共享。信息组织建立的各种词表、人名表、地名表、术语表、领域本体在信息资源的交换和共享、信息系统互操作、跨库检索等方面发挥着重要作用。
大数据环境下的知识组织:
本体
本体是共享概念模型的明确的形式化规范说明。
(2)关联数据
关联数据(Linked Data)是语义Web的一种实现方式。它一般要求采用RDF数据模型,利用统一资源标识符(简称URI)命名数据实体,发布和部署示例数据和类数据,从而可以通过HTTP协议揭示并获取这些数据。
(3)知识图谱
知识图谱是一种基于图的数据结构,由节点和节点间的边组成。知识图谱本质上是一种语义网络,其节点代表实体(entity)或者概念(concept),边代表实体/概念之间的各种语义关系。
二、大数据对信息检索的影响
信息检索的内涵:
满足信息用户的信息需求而建立的、存贮经过加工了的信息集合,拥有特定的存贮、检索与传送的技术装备,提供一定存贮与检索方法及检索服务功能的一种相对独立的服务实体(包括人和检索工作单位),统称为信息检索系统(Information Retrieval System,简称IRS)。
信息检索系统的三个基本要素:人、检索工具(包括设备)和信息资料。
/
信息检索系统体系结构
信息检索的基本原理:
/
信息检索类型:
按存贮和检索的内容划分
① 文献检索 ①文本检索。
② 数据检索 ②数值检索。
③ 事实检索 ③音频与视频检索。
按检索系统中信息的组织方式划分
① 全文检索
② 多媒体检索
③ 超媒体检索
大数据环境下信息检索:
相较于之前检索工具仅仅是整理和组织数据,不能对检索工具使用者的搜索行为记录和分析,大数据下网络检索工具可以借助用户行为分析,对检索工具使用者的使用习惯、关注点等方面进行统计,这些用户数据在短期内分析结果会有点偏差,但是当数据量很大的时候,检索工具基于个性化的智能搜索就可以实现,它能在很大程度上帮助用户搜索信息。
传统信息检索与大数据信息检索对比
传统信息检索问题
大数据信息检索变革
检索范围
界限明显,范围小
面向全部数据
检索模式
集中串行检索
分布式检索
用户接口
人机交互界面单调,信息量少
可视化,高某某
检索结果
不准确,不相关,信息过载
精准,智能,个性化
大数据对信息分析的影响
信息分析的定义:
信息分析是根据社会用户的特定需求,运用现代信息技术手段和科学研究方法,对社会信息进行采集、选择、分析和论证等深层次加工活动,提供具有价值的信息服务和产品,以满足用户需要的社会活动。
信息分析方法:
信息分析方法主要源于:
逻辑学方法
系统分析方法
图书情报学方法
社会学方法
统计学方法
数学方法
……
大数据背景下信息分析面临的新环境:
数据量巨大、类型繁多
大数据环境下,信息分析面临的数据量越来越大,数据定量分析在信息分析领域越来越重要。
多源数据融合
数据来源多渠道、数据类型多样。如何快速地响应环境需求,融合多源数据,以获得对目标或同一事物的本质与状态规律的认识,是信息分析要解决的新问题。
分析技术方法多样化
关联分析法、聚类分析法、时序分析法、路径分析法、预测分析法
信息问题动态复杂
需求主体增多
全球一体化发展
国际政治经济局势复杂多变
分析对象的变化:
随机样本→全体或总体数据
传统信息分析的小样本、抽样样本、部分样本已无法代表大数据的特征,或者说大数据时代已无法从部分样本的特征中推导全体数据的特征和规律。关联、规则和规律可能隐含在大数据中,样本则可能割裂了事物之间的关联。这种变化不仅是量的变化,而是质和结构的变化。
分析对象的变化使得信息分析必须极大地提高数据搜集、处理、存储和分析能力,才能从中提取知识和有价值的信息。
数据处理方式的变化:
结构化数据→半结构化、非结构化数据
大数据通过被动、主动和自动三种方式产生,数据主体和来源日趋多元化,半结构化、非结构化数据占绝大多数。大数据环境下,这些半结构化、非结构化数据中包含更多的有价值的信息。需要改变传统信息分析结构化、标准化和精确化的信息处理方式,设计新的且适合大数据特征的数据处理方式。
分析目标的变化:
因果分析→相关分析
传统信息分析试图发现、解释和推导事物间的因果关系,在大数据环境下,事物之间的关系错综复杂,往往无法得到精确的分析结构,信息分析的目的是发现大容量数据中隐含的关联和规律,即事物相关关系的挖掘与发现。
分析模式的变化:
/
信息分析发展趋势:
集成分析:数据共享、技术整合和人员的跨领域合作
智能分析:利用云计算、机器学习等新兴信息技术实现机器智能分析
分析及服务:大数据分析工具将作为重要的服务内容向社会提供,能够为人们在大数据时代创造新的有价值的分析成果,并辅助管理决策。
四、大数据对信息计量的影响
信息计量学的定义:
信息计量学(Informetrics)是采用定量方法来描述和研究信息(情报)的现象、过程和规律的一门学科。
信息计量学的研究内容:
信息计量学理论研究。主要包括:学科基本问题的探讨;信息分布和变化规律的适用性等研究。
信息计量学方法研究。只要是从别的学科移植和综合采用一些定量的研究方法用于信息计量学研究,如统计分析法、数学模型法、引文分析法等。
信息计量学应用研究。如科学评价等。
大数据时代信息计量面临的挑战和机遇:
挑战
机遇
索引数据库是对结构化数据的存储,对于更多的半结构化、非结构化数据无法直接处理。
大数据为信息计量提供了新的数据来源,弥补了传统信息计量的不足和缺陷。
计量软件处理的数据类型是固定的,不能对多类型数据进行整合处理。
大数据为信息计量提供了新的技术和工具。
研究方法的多元化:
随着计算机技术的发展,科研人员在进行计量研究时不再局限于简单的数理统计分析,可以借助某些工具自动抓取网络中可获取的学术信息,并使用机器学习算法实现去人工化计量。
此外,可视化方法的发展弥补了传统只罗列数字和文字的简单统计图表的缺陷,合作网络图、关键词图、雷达图等可视化展示方法能更清晰直观地揭示学科结构和发展脉络,使得评价指标生动易读。
计量工具的平台化:
计量平台是对跨领域跨系统资源的深度整合,需要一种满足不同来源、不同种类资源总体需求的抽象的框架化的数据模型,同时还要求数据在成熟的网络框架基础上与更多的外部数据相关联。
科研人员不再受限于计量工具和计量方法,平台可以自动整合不同资源,系统化输出宏观及微观层面的计量指标,并对这些指标进行描述和分析。
计量对象的全面化:
大数据和云存储的发展为学科评价研究提供了良好的机遇,计量对象不再局限于传统的科学文献,学术社区中的学术信息以及网络中普遍存在的学术信息都可以作为计量研究对象。
与传统信息计量相比,大数据环境下的信息计量更全面、系统和科学。
如在大数据技术支持下,借助云计算可实现超大规模引文分析,借助自然语言处理、机器学习可以实现信息层面的全文本引文分析。
评价结果的系统化:
大数据时代的计量是对所有学术信息的全面计量,计量的结果也更加全面化、系统化。
Altmetrics指标与传统计量指标在评价上具有非对称性,结合当前的学术信息环境,引入恰当的评价指标,可以补充完善传统的以被引数量为代表的计量评价指标体系。
评价对象的全面扩充和评价指标的优化完善很大程度上提高了基于计量学的学科评价结果的科学性和系统性。
信息计量的未来发展:
1.计量评价指标的拓展革新
发掘更多的计量指标以弥补传统计量指标的不足。
2.基于多维数据聚合的学科评价
实现基于期刊文献库、学术博客、***普遍存在的学术信息的多维数据聚合。
3.信息计量和评价的智能化
实现计量数据的自动收集和处理,以及计量和评价结果的自动呈现及分析。
大数据对信息行为研究的影响
信息行为的定义:
信息行为是人类特有的一种行为,指主体为了满足某一特定的信息需求,在外部作用刺激下表现出的获取、查寻、交流、传播、吸收、加工和利用信息的行为。
随着互联网的出现,网络信息行为已经成为信息行为的主要形式。
网络信息行为的构成要素:
行为主体:
网络用户
行为形态:
①受信:获取信息;②传信:传递信息;③交流:信息交互行为;④查寻:搜索能满足自己某种需求的信息;⑤生产:用户自行加工和发布信息;⑥积累:非直接地利用信息
行为动机:
①工作;②自我提升;③认同;④生活;⑤社交;⑥消遣;⑦警戒
行为环境:
在一定时间和空间内由多种因素交互作用而形成的复杂系统
大数据背景下信息行为研究面临的新环境:
行为主体的转变
在大数据背景下,网络信息用户的参与度更高,用户除了从网络获取信息,还主动在网络上发布信息,信息生产者与信息使用者的角色相互交叉。
行为形态的变化
除了传统的信息获取、传递、交流、查寻、利用、吸收等信息行为,随着互联网与大数据技术的发展,出现了各种各样新的行为形态。如社交媒体中的评论、点赞、转发行为;信息获取中的知识付费行为;以及信息偶遇、信息规避行为等等。
(3)行为动机更加复杂
大数据环境下,用户信息行为的特征和模式均发生了变化,人们信息需求和信息行为背后的动机更加复杂,这给传统的信息行为研究带来了挑战。
(4)行为环境彻底改变
在大数据时代,移动互联网的发展和社交媒体的流行,为用户提供了一个泛在信息环境。用户信息需求更加多样化和个性化,需求的满足也突破了时间和空间的限制,用户与用户之间、用户与信息系统之间的交互更加频繁。
常规的数据来源和研究方法:
问卷 Survey
结构性方法,由参与者自行回答预设问题,优势在于广度
出声思考法 Think Aloud
要求参与者在完成指定任务时通过大声说话详细报告他们的思维过程
用户实验 Experiment
在人为控制条件下,为了确定事物之间的因果关系或相关关系而进行的一种研究方 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 行为模式相似的其他用户的历史数据进行对照,提供出最合适的商品推荐信息。
·商业组织必须思考如何利用用户生成内容(UGC)和用户靠得更近、联系得更为紧密。
长尾理论:新型的信息服务必须重视代表“个性化”的长尾部分。
知识超网络环境下组织知识资源的深度开发:
·知识是企业创新的基石,如何通过知识服务将知识资本转化为企业效益是企业需要面对的问题
·虚拟社区或虚拟知识网络(超网络)
·大型组织的知识共享系统、移动互联网中的虚拟社群和社会性软件等应用将形成知识超网络环境,个人的积极性将得到充分挖掘,知识数量极大丰富但知识质量并不稳定可靠,这使得知识组织维护日益困难,知识共享效率下降且效果不佳
·利用知识优化过程实现知识超网络环境中知识的自优化与自组织,通过知识共享服务过程与知识优化过程的有机集成为用户提供快速有效的知识共享服务
“情报即服务”的协同信息服务:
在大数据时代,传统的信息服务模式已无法满足用户复杂的信息需求,应该在准确把握用户需求基础上,面对问题、任务来开展信息服务,应提供面向问题、任务服务的情报,即“情报即服务”(Intelligence-as-a-Service)。
/
[文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]
以上为《大数据对信息管理的影响》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。