以下为《大数据职称考试知识大纲》的无排版文字预览,完整格式请下载
下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。
大数据职称考试知识大纲
大数据分析应用-中级大纲
2021 年版
目 录
一、 大数据法律法规、政策文件及相关标准 1
二、计算机基础知识 2
三、信息化基础知识 3
四、大数据安全 7
五、 数据库系统(SQL + NoSQL) 8
六、数据仓库 8
七、大数据技术与应用 9
八、大数据分析模型 9
九、数据科学 10
第一部分 基础知识模块
一、大数据法律法规、政策文件及相关标准
(一)法律法规
1、《中华人民共和国民法典》中华人民共和国主席令第四十五号
(1)了解隐私权和个人信息保护有关内容。
2、《中华人民共和国数据安全法》中华人民共和国主席令第八十四号
(1)了解数据安全制度、数据安全保护义务、政务数据安全与开放等相关内容。
3、《中华人民共和国网络安全法》中华人民共和国主席令第五十三号
(1)熟悉数据分类、重要数据备份和加密等措施。
4、《中华人民共和国电子签名法(2019 版)》中华人民共和国主席令第二十九号
(1)了解电子签名、数据电文基本概念。
5、《中华人民共和国密码法》中华人民共和国主席令第三十五号
(1)了解核心密码、普通密码、商用密码之间的区别。
(二)政策文件
1、《促进大数据发展行动纲要》国发〔2015〕50 号
(1)熟悉数据共享的范围边界和使用方式。 2、《山东省“十四五”数字强省建设规划》
(1)了解数字强省“十四五”规划发展目标及主要任务。 3、《关于促进大数据发展的意见》鲁政发〔2016〕25 号
(1)了解山东省促进大数据发展的总体目标以及大数据应用生态体系。
(三)相关标准
1、GB/T 35295-2017 信息技术 大数据 术语
(1)了解本标准的范围、术语和定义,以及密切相关的通用术语。 2、GB/T 35589-2017 信息技术 大数据 技术参考模型
(1)了解本标准的范围、术语和定义,熟悉大数据参考架构的目的、目标,熟悉大数据参考架构及其各组成部分。
3、GB/T 37973-2019 信息安全技术 大数据安全管理指南
(1)了解本标准的范围、术语和定义,了解大数据安全需求、大数据分类分级、大数据活动及安全要求、大数据安全风险评估等方面的内容。
4、GB/T 38667-2020 信息技术 大数据 数据分类指南
(1)了解本标准的范围、术语和定义,熟悉数据分类的过程,以及分类视角、分类维度和分类方法。
5、GB/T 38673-2020 信息技术 大数据 大数据系统基本要求
了解本标准的范围、术语和定义,熟悉大数据系统框架、功能要求、非功能要求。
(四)职业道德
1、掌握专业技术人员职业道德的基本要求
二、计算机基础知识
(一)面向对象技术
1、了解面向对象的发展历史,为什么引入面向对象。
2、掌握面向对象编程与非面向对象编程的优缺点。
3、掌握抽象的 5 个层次,抽象形式。
4、掌握类和方法。
5、掌握消息、实例和初始化。
6、了解继承和替换。
7、了解静态行为和动态行为。
(二)数据结构与算法
1、掌握程序性能分析的概念和方法,包括时间复杂性与空间复杂性分析。
2、掌握线性表的概念,掌握堆栈、队列、跳表和散列的描述方法与应用。
3、了解树的描述方法与应用。
4、了解图的描述方法与应用。
(三)操作系统
1、掌握操作系统的概念和操作系统结构。
2、掌握操作系统的进程管理,包括进程概念、进程调度、同步及死锁处理。
3、掌握内存管理,包括内存管理策略和虚拟内存管理。
4、了解存储管理,包括文件系统、文件系统实现、大容量存储结构和 I/O系统。
5、了解系统保护与安全。
(四)计算机网络
1、了解计算机网络在信息时代的核心作用以及计算机网络的发展历史;理解计算机网络的分类,网络标准化,网络参考模型,网络体系结构。
2、掌握物理层的基本概念,理解信道极限容量的概念以及信道最大传输速率的公式,模拟传输和数字化传输的物理层标准。
3、掌握数据链路层的基本概念,理解停等协议和连续 ARQ 协议,滑动窗口协议,检错和纠错机制。
4、掌握介质访问控制子层的基本概念,理解动态多路访问控制协议,以太网,无线局域网,数据链路层的交换技术。
5、了解网络层的基本概念,理解路由协议,拥塞控制算法,服务质量,网络互连,IP 协议,子网掩码。
6、了解传输层的基本概念,理解传输层路由协议,TCP,UDP,拥塞控制算法。
7、了解应用层的基本概念,理解 DNS,邮件系统,www,流音频与视频。
三、信息化基础知识
(一)电子政务
1、电子政务的概念、内容和技术形式
掌握电子政务的概念
熟悉电子政务的内容
熟悉电子政务的技术形式
2、中国政府信息化的策略和历程
3、电子政务应用模式
熟悉政府对政府(G2G)模式
熟悉政府对企业(G2B)模式
熟悉政府对公众(G2C)模式
熟悉政府对公务员(G2E)模式
(二)电子商务
1、电子商务的概念及基本特征
熟悉电子商务的概念
熟悉电子商务的基本特征 2、电子商务的类型
熟悉企业与企业之间的电子商务(B2B)模式
熟悉商业企业与消费者之间的电子商务(B2C)模式
熟悉消费者与消费者之间的电子商务(C2C)模式
熟悉电子商务与线下实体店有机结合向消费者提供商品和服务(O2O)模式
(三)新一代信息技术
1、物联网
掌握物联网的概念
熟悉物联网架构
了解物联网技术的应用 2、云计算
掌握云计算的概念
熟悉云计算的架构及关键技术
了解云计算服务的类型
了解发展云计算的主要任务 3、移动互联网
掌握移动互联网的概念
熟悉移动互联网的特点
了解移动互联网技术的应用 4、人工智能
掌握人工智能的概念
熟悉人工智能研究范畴
了解人工智能实际应用 5、区块链
掌握区块链的概念
熟悉区块链的系统架构
了解区块链的分类
了解区块链的应用 6、量子技术
掌握量子技术的概念
熟悉量子技术的特点
了解量子技术的应用
(四)项目管理
1、项目管理的理论与体系
了解项目管理基础知识
掌握项目管理知识体系的构成
了解 IPMP/PMP、PRINCE2 等项目管理认证体系
掌握项目管理成熟度模型
了解项目管理的量化方法 2、组织结构对项目的影响
了解组织结构对项目的影响。 3、信息系统项目典型生命周期模型
掌握瀑布模型及其瀑布模型基础上改进的模型
了解原型化模型
了解敏捷开发模型
了解软件生命周期其它模型 4、单个项目的管理过程
掌握项目整体管理的含义、作用
了解项目整体管理过程
掌握项目进度管理
了解项目成本管理
了解项目质量管理
了解项目人力资源管理
了解项目沟通管理和干系人管理
了解项目风险管理
了解项目单个项目管理的其它方法 5、信息系统安全管理
掌握信息系统安全策略
了解信息安全系统工程
了解 PKI 公开密钥基础设施
了解 PMI 权限(授权)管理基础
了解信息安全审计
了解信息系统安全管理其它方法
四、大数据安全
(一)网络安全
1、熟悉网络安全的一些基本概念、基本属性及网络安全模型等;了解网络安全评估;掌握各种类型的网络安全服务。
2、了解网络安全体系的安全服务、安全机制、安全服务配置和安全管理等;掌握 TCP/IP 协议安全体系。
3、熟悉各种网络安全技术的概念,了解物理安全、网络安全设备、系统安全、应用安全的技术知识。
4、了解网络安全运维与保障的框架、基本原理等知识,掌握安全管理的技术、设施、工具和方法。
(二)数据安全
1、了解大数据安全管理及安全需求的原则,掌握数据安全分类、定级的原则和方法。
2、了解数据采集、存储、处理、分发、删除等活动的概念,了解相关安全技术与安全要求。
3、熟悉云存储安全体系、数据生命周期中的安全风险、保障云存储安全的原则及云计算边界安全相关的概念及云计算安全架构。
4、了解大数据安全与防护保障机制、大数据安全审计、大数据安全评估与
安全管理系统。
第二部分:专业知识
五、数据库系统(SQL + NoSQL)
1、掌握关系模型概念和 SQL 语言。
2、掌握关系数据库设计方法。
3、掌握关系数据库索引的概念和使用方法。
4、掌握关系数据库查询处理与查询优化方法。
5、掌握关系数据库事务概念和事务调度方法。
6、掌握数据库并发控制技术。
7、了解非关系数据库背景、特点和分类。
六、数据仓库
1、了解数据挖掘的定义、功能、常用方法。
2、了解数据仓库的产生与发展,掌握数据仓库的定义。
3、了解数据仓库与数据挖掘的联系与区别。
4、了解常用数据挖掘工具。
5、了解数据仓库的体系结构,掌握元数据、粒度、分割的概念,了解数据仓库中的数据组织形式。
6、了解数据仓库的数据模型,包括概念数据模型、逻辑数据模型、物理数据模型。
7、掌握联机分析处理(OLAP)技术的概念、特征。
8、掌握 OLAP 中的多维分析操作,包括钻取、切片和切块、旋转。
9、了解多维联机分析处理、关系联机分析处理、MOLAP 和 ROLAP 的差异、混合型联机分析处理;OLAP 的衡量标准。
10、了解数据预处理的原因、数据预处理的方法。
11、掌握数据清洗、数据集成和变换、数据归约的概念与方法,具有应用上述方法进行数据清洗的能力。
12、了解关联规则的概念和分类。
七、大数据技术与应用
(一)数据可视化
1、了解常见可视化图形(散点图、折线图、饼图、环图、双层环图、柱状图、堆积柱状图、分组柱状图、正负条形图、雷达图)的概念,具有初步的可视化图形展示数据的能力。
(二)大数据处理技术
1、掌握云计算的概念、云计算的特征、云计算的三层 SPI 模型(IaaS、PaaS、 SaaS)。
2、掌握虚拟化技术的概念、常用虚拟化方法,了解常用虚拟化软件。
3、具有应用虚拟化技术搭建虚拟化平台的能力。
4、了解分布式计算、高性能计算、边缘计算的概念。
5.了解有监督学习、无监督学习、强化学习的概念和区别。
6、了解数据集市、数据仓库、数据中台、数据平台的概念。
7、掌握数据采集与预处理过程,掌握数据采集、数据清洗、数据转换、数据脱敏的方法。
8、了解数据存储与管理技术、大数据处理架构 Hadoop、分布式文件系统 HDFS、NoSQL 数据库、分布式数据库 HBase 的相关概念。
9、了解大数据处理环节的主要思想:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(包括大数据检索、大数据可视化、大数据应用、大数据安全等)。
10、了解大数据处理与分析的代表性流行产品。
八、大数据分析模型
1、了解常用的大数据分析模型,例如行为事件分析模型、点击分析模型、用户行为路径分析模型、用户分群分析模型等,具有应用大数据技术进行大数据分析能力。
九、数据科学
(一)概率统计与统计推断
1、掌握概率、条件概率的概念,并会计算简单的概率、条件概率。
2、理解随机事件的独立性和随机变量的独立性。
3、掌握乘法公式、全概率公式、贝叶斯公式,并会简单应用。
4、掌握随机变量分布函数的概念,掌握连续型随机变量的密度函数和离散型随机变量的分布列。
5、掌握常见分布(两点分布、二项分布、泊松分布、均匀分布、正态分布、指数分布)及其简单性质。
6、理解数学期望、方差(标准差)、相关系数的概念,并会简单计算。
7、了解多元随机变量的概念,掌握多元正态分布。
8、理解统计量的概念,理解样本均值、样本方差(标准差)的概念,并会简单计算。
9、了解点估计的概念,了解点估计的无偏性、相合性。
10、了解参数的矩估计、最大似然估计。
11、了解线性回归的基本概念。
12、了解方差分析(ANOVA)的基本概念。
(二)统计学习与数据挖掘
1、掌握感知机的定义和基本原理。
2、掌握 Logistic 回归算法原理与特点,能够使用 Logistic 回归进行数据的分类建模与参数解释。
3、掌握朴素贝叶斯算法的定义与基本原理。
4、掌握 k 近邻算法算法定义与原理。
5、掌握支持向某某(SVM)算法的思想与原理。
6、掌握决策树的算法的定义与原理,了解决策树的剪枝理论。 7、了解常见集成方法如 boosting、bagging 等。
8、掌握聚类分析的相关概念。
9、掌握主成分分析的原理。
10、了解生成式半监督学习方法、半监督 SVM、图半监督学习方法的思想与原理。
(三)深度学习与强化学习
1、掌握全连接网络(MLP)的定义与算法原理、并能够应用。
2、掌握卷积神经网络(CNN)基本概念,了解几种经典的卷积神经网络,如 AlexNet、VGG、GoogLeNet、ResNet。
3、掌握循环神经网络(RNN)原理与基本概念,了解几种常见的模型,如长短期记忆网络 LSTM、GRU。
4、掌握生成对抗网络(GAN、WGAN)的基本定义与原理,能够完成基本应用
5、掌握马尔可夫决策过程的定义,了解其算法应用范围,并能够实际应用
6、掌握经典强化学习算法(Q-learning、SARMA)的定义与原理。
7、掌握经典深度强化学习算法(DQN、DDPG、A3C、TRPO、PPO)的定义与原理,了解其算法特性。
以上为《大数据职称考试知识大纲》的无排版文字预览,完整格式请下载
下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。