国家智能视频计算技术创新中心--建设方案

本文由用户“c2292488”分享发布 更新时间:2021-02-17 16:39:52 举报文档

以下为《国家智能视频计算技术创新中心--建设方案》的无排版文字预览,完整格式请下载

下载前请仔细阅读文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

智能视频计算技术创新中心

建设方案

复旦大学

2020年7月

目录

摘要 3

一、建设意义和基础优势 4

(一)建设意义和必要性 4

(二)牵头和共建单位基础 18

(三)相关产业需求与技术创新现状(2000字)(孙毅补充) 27

二、总体思路 29

(一)指导思想 29

(二)功能定位(700字) 30

(三)建设原则(400字) 33

(四)发展目标 34

三、建设布局 40

(一)地域布局 40

(二)科技领域布局(1750字)---孙毅补充 44

四、建设任务 45

(一)关键技术攻关任务 45

(二)科研条件平台与研发体系建设 孙毅补充 56

(三)企业孵化与双创服务体系建设—倾云复研补充 56

五、管理运行机制 64

六、保障措施 73

七、进度安排(0.1万字) 孙毅补充 76

结语(300字) 77

摘要

一、建设意义和基础优势

(一)建设意义和必要性

1、人工智能是中国引领新科技革命和颠覆性创新的战略机遇

工业时代以来的多次科技革命,大大促进了人类的物质文明,加速了七千年人类文明进化历程,增强了人类认知和智慧。特别是上世纪信息革命以来,维纳的反馈控制论、香农的信息论、图灵的计算机原型等理论提出,催动工业逻辑控制器、通信路由交换机、计算机和网络快速发展,极大提高了农业、工业、交通物流业的生产效率,人类GDP从1968年1.8万亿美元增至2018年的84万亿美元,增长近50倍。当今世界,新一轮科技革命和产业革命蓄势待发,以大数据、云计算、物联网等为核心的新一代信息技术蓬勃发展,新一代人工智能依托互联网、大数据技术,正在向理论深度与应用广度方向迅猛发展,成为国际竞争的新焦某某、经济发展的新引擎;通过与产业发展的广泛结合,其必将引领未来技术创新,推动产业提升,成为信息技术和社会发展新动能。

目前,世界各国都将人工智能作为科技发展的重要支撑。2016年5月美国白宫成立人工智能委员会,将人工智能上升为国家战略技术;日本在“新机器人战略”和“人工智能中心”等超级智能社会构想的基础上,提出了“高级综合智能平台发展计划”,综合发展人工智能、大数据、物联网和网络安全等前沿技术;在欧洲,人工智能研究与应用持续升温,英国发布了《人工智能未来决策制定的机遇与影响》,法国制定了《人工智能战略》,德国颁布了《联邦政府人工智能发展战略要点》。在产业投入方面,2020年全球人工智能新增投资金额预计将达到143.5亿美元,相比2012年的14.24亿美元,增长超过10倍。人工智能领域的全球竞争已经拉开序幕。

我国也将人工智能上升至国家重大战略的高度。在2014年6月的两院院士大会上,习近平总书记指出人工智能技术将对社会经济发展产生重要影响;2016年3月习总书记视察国防大学时也指出“要把握数字化、网络化、智能化融合发展的契机,以信息化、智能化为杠杆培育新动能”,大力推进“信息化、智能化、无人化”, 预见了人工智能对社会经济、治理体系和人类生活的重大影响和竞争态势,揭示了未来人工智能科学发展的根本问题—智能发展规律与社会价值实现的关系问题;2017年7月,国务院发布《新一代人工智能发展规划》,明确我国新一代人工智能发展的战略目标。特别需要指出的是,2018年10月31日,习总书记主持中共中央政治局第九次集体学习人工智能发展现状和趋势,指出“加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手”,并强调“勇闯科技前沿‘无人区’”,“在人工智能理论、方法、工具、系统等方面取得变革性、颠覆性突破”,“在人工智能理论研究、关键核心技术占据制高点”。人工智能科学与技术已成为国家领导人高度关心、重点强调的科技发展核心领域。

另一方面,人工智能的关键共性技术研究与人才竞争日益激烈。2018年11月19日,美国商务部工业安某某宣布禁止对中国出口包括人工智能和机器学习等14类代表性新兴技术。美国通过不予发放赴美从事人工智能等相关学术与技术交流的签证、停止各高校招收来自中国的人工智能相关专业学生等措施,阻止人工智能领域的人才、学术与技术交流。从目前的国际关系预测,美国将对我国长期进行人工智能领域的全面智力封锁。在此背景下,瞄准人工智能前沿领域,依托自身力量,抢占先机、协同攻关是当前唯一选择。

**_*国经济、科技、贸易、交通等领域的龙头城市,正按照习总书记的总体布局,全力建设具有全球影响力的科技创新中心。大力发展集成电路、人工智能、生物科技是党中央交给XX的重要战略任务。当前,XX在科教资源、信息数据、基础设施、应用场景等方面拥有良好的基础优势,已具备打造人工智能领域创新策源、应用场景、制度供给和人才集聚“XX高地”的能力。XX组建的人工智能发展联盟已集聚了近300家相关企业、投融资机构及科研院所,建立了千亿级的产业基金、开放TB级的公共数据集、建成10个公共创新平台、打造6个创新场景应某某、形成60个深度应用场景;已建立生命科学、化学化工、先进制造、资源环境、电子信息等数据中心。然而,这些行业的数据处理与挖掘能力、智能算法和软件开发水平均远远落后于国外,关键核心技术和系统受制于人,智能技术的应用大大落后于基础设施的投入。据《2018年中国新一代人工智能发展战略研究院专题研究报告》显示,XX人工智能竞争力指数仅居全国第四,落后于XX、广东和浙江,XX建设具有国际影响力的科技创新中心,发展人工智能科学与技术刻不容缓。

计算机视频技术是目前人工智能技术最先形成规模化产业落地应用的技术之一,已经催生出一大批具有影响力的企业,由于其应用场景相对明确,在产业界、学术界、投资界引起较大的关注,成为当前八大人工智能关键技术之一。

习近平总书记多次指出,抓住新一轮科技革命和产业变革的重大机遇,就是要在新赛场建设之初就加入其中,甚至主导一些赛场建设,从而使我国成为新的竞赛规则的重要制定者、新的竞赛场地的重要主导者。因此,把握智能视频计算引领新科技革命和颠覆性创新的战略机遇,加强计算机视觉领域的源头创新,推进计算机视觉的工程化应用,提高计算机智能视觉科技的创新水平,为我国在新一轮国际竞争中赢得先机,对于国家安全、经济建设和区域发展都具有重大战略意义。建设智能视频计算技术综合支撑平台与驱动场景,是XX顺应世界科技发展大趋势、提升服务国家创新战略能力、加快向具有全球影响力的科技创新中心进军的战略部署与迫切要求。

2、智能视频计算是推动人工智能技术发展和产业变革的重要引擎

以视觉采集、视觉思考和视觉成像为核心的人类视觉系统,使人类具备了对外部世界复杂场景快速视觉识别的能力,随着人工智能关键技术不断取得突破,计算机视觉技术由于其应用场景相对明确,在产业界、学术界、投资界引起较大的关注,成为当前八大人工智能关键技术之一。智能视频计算期望在视频采集和视频思考方面能形成能超越人类视觉系统,成为未来人工智能技术的重要引擎之一。

近几年,计算机视觉技术实现了快速发展,其主要原因是2015年基于深度学习的计算机视觉算法在ImageNet数据库上的识别准确率首次超过人类,同年Google也开源了自己的深度学习算法。计算机视觉系统的主要功能有图像获取、预处理、特征提取、检测/分割和高级处理。

近年来,计算机视觉在学术界和产业界不断取得突破。全球计算机视觉领域三大顶级会议(ICCV,ECCV,CVPR)的投稿量逐年递增,,ICCV 2019年共收到4328篇论文投稿,相比ICCV 2017数量翻了一倍不止。ECCV 2018年该大会共收到论文投稿2439篇,涵盖对抗性机器学习,对人、物体和环境的超快三维感知、重建与理解,面部追踪及其应用,行人重识别的表征学习,视觉定位等主题。CVPR 2019年该大会共录取来自全球的论文1299篇。ImageNet大规模视觉识别挑战赛(ILSVRC)从2010年开始每年举办,至2017年终结,有力推动了计算机视觉的发展。截至2016年,ImageNet中含有超过1500万由人手工注释的图片网址,标签超过2.2万个类别,图像识别错误率已经达到2.9%,远超越人类(5.1%)。

在产业界,智能视频计算技术在智能交通、智慧安防、智能医疗、智能制造等领域具有广泛的应用。在交通领域,特斯拉(Tesla)、宝马(BMW)、沃尔沃(Volvo)和奥迪(Audi)等汽车制造商Y已经通过摄像头、激光雷达、雷达和超声波传感器从环境中获取图像,研发自动驾驶汽车来探测目标、车道标志和交通信号,从而安全驾驶。在安防领域,中国在使用人脸识别技术方面无疑处于领先地位,这项技术被广泛应用于警察工作、支付识别、机场安检,甚至在XX天坛公园分发厕纸、防止厕纸被盗,以及其他许多应用。在医疗领域,由于90%的医疗数据都是基于图像的,因此医学中的计算机视觉有很多用途。比如启用新的医疗诊断方法,分析X射线,乳房X光检查,监测患者等。在制造领域,智能视频计算可以帮助制造商更安全、更智能、更有效地运行,比如预测性维护设备故障,对包装和产品质量进行监控,并通过计算机视觉减少不合格产品。

此外,中国人工智能开放创新平台体系逐步建立,智能视频计算技术在其中起到居住轻重的作用。比如自动驾驶国家新一代人工智能开放创新平台主要基于百度Apollo开放平台,依靠智能视频计算技术,已先后开放了封闭场地循迹自动驾驶能力、固定车道自动驾驶能力、简单城市路况自动驾驶能力以及限定区域视觉高速自动驾驶能力、量产园区自动驾驶能力。未来将逐步开放限定区域城市、量产限定区域、量产简单城市道路、高速和城市道路等自动驾驶能力。城市大脑国家新一代人工智能开放创新平台完成了基于对全局视频资源的实时搜索,快速定位特定对象,能够对城市里面的交通事件、事故进行全方位的实时感知,自动发现人、车、物、事件全要素的异常,通过区域内的历史和实时视频数据,实时准确地预测全区域未来的车流、人流情况,为道路疏导、管控决策提供参考,规避拥堵和踩踏等安全隐患问题,建立城市大脑的大规模视觉计算平台,为客户按需提供智能分析能力,可实现视频分析千倍加速,处理16小时视频仅用1分钟。医疗影像国家新一代人工智能开放创新平台利用智能视频计算技术,联手医院开展人工智能医学影像研究,储备了超过20万医学标注数据库、超过8000万高质量医疗知识库以及超过1亿的开放医疗百科数据,可辅助医生诊断、预测700多种疾病,涵盖了医院门诊90%的高频诊断。智能视觉国家新一代人工智能开放创新平台,通过超算系统、训练系统、智能视觉工具链等核心基础的研发、数据系统的构建,实现智能视觉底层关键技术和共性支撑技术的突破,促进智能视觉技术与多行业的快速结合、产业赋能。

根据中***发布的2019年人工智能发展书中全球人工智能企业TOP20的榜单(如图1所示),有50%的企业以智能视频计算为核心竞争力。

/

图1 全球人工智能企业TOP20榜单 (2019年人工智能发展白皮书—中***)

因此,智能视频计算已经成为推动人工智能技术发展和产业变革的重要引擎。

3、建设智能视频计算技术创新中心是应对国际竞争的战略选择

近年来,为应对经济、社会、环境等领域产生的一系列挑战,世界发达国家纷纷制定新的科技发展战略,力图在未来经济竞争中占据有利地位。具有革命式颠覆式创新潜力的计算机视觉已经成为各国明确争抢的战略科技高地,正在引发新一轮科技与产业的国际竞争。

国际各国十分重视人工智能的发展,尤其是对于计算机视觉的重要地位达成了一致意见。以美国为例,是历史上第一个在财政预算中将人工智能作为研发优先事项的国家以及计划在人工智能领域投入10亿美元。在这其中,对于计算机视觉的重视更为凸显,国防部以及DAPRA等机构密集部署AI研发,“算法战跨职能小组”、“联合人工智能中心”成为了美国开发人工智能军事应用的大XX,面部识别、无人机扫描、外骨骼装置等可穿戴系统已在国土安全领域展开了实际应用。

于2016年10月,白宫科技政策办公室(OSTP)国家科学技术委员会(NSTC)发布《为人工智能的未来做准备》以及《国家人工智能研究与发展战略计划》两份重要报告,正式将人工智能上升到国家战略层面。这两份报告,前者探讨了人工智能的发展现状、应用领域以及潜在的公共政策问题;后者提出了美国优先发展的人工智能七大战略方向及两方面建议。2018年5月,白宫举办人工智能峰会,邀请业界、学术界政.和府代表参与,并成立了人工智能特别委员会,以改善联邦政府在人工智能领域的投入,努力消除创新与监管障碍,提高人工智能创新自由度与灵活性。特朗普政府特别强调了AI在国防安全领域的影响。

除此之外,德国也在工业4.0的基础上,强调了计算机视觉的重要性;俄罗斯则侧重于将计算机视觉的技术应用到军事和国防领域。

从世界各国的计算机视觉研究机构来看,主要集中在高校以及科研机构的人工智能实验室,他们能够获得学校乃至国家提供的自然科技资金来进行相应的计算机视觉研究。从美国来看,主要有Stanford大学vision实验室、加州大学伯克利分校CV小组、南加州大学CV实验室、卡内基梅某某大学CV实验室、美国密歇根州立大学生物识别研究组(Anil K. Jain教授)等,从其他地区来看,主要有以下的实验室机构:微软亚洲研究院计算机视觉研究组、微软剑桥研究院ML与CV研究组、香港中文大学多媒体实验室(汤某某)。除了有关实验室之外,还有很多知名的学术大牛,他们属于个体研究学者,但也有自己一整套的研究资源,主要有:MIT博士,汤晓欧学生林某某、Stanford大学博士崔某某、UCLA教授朱某某、美国Rutgers大学助理教授刘某某、香港中文大学助理教授王某某、卡内基梅某某大学研究员Robert T. Collins、MIT博士Chris Stauffer、美国伊利诺XX立大学Thomas S. Huang等。

军事国防:美国国防部以及DAPRA等机构密集部署AI研发,“算法战跨职能小组”、“联合人工智能中心”成为了美国开发人工智能军事应用的大XX,面部识别、无人机扫描、外骨骼装置等可穿戴系统已在国土安全领域展开了实际应用。

安防:同样发生在美国,基于计算机视觉技术在公共场所安防布控,可以及时发现异常情况,为公安、检察等司法机关的刑侦破案、治安管理等行为提供强力支撑。美国多地警方部署人工智能警务风险评估软件,将犯罪控制在萌芽状态。智能软件根据保存的犯罪数据预测哪些犯罪高发区域可能会出现新问题。

医疗:在医疗产业,计算机视觉可提供临床治疗中早期病理筛查能力。加州大学伯克利分校放射与生物医学成像系和放射学大数据小组在对早期阿尔茨海默症诊断研究中,通过计算机视觉技术在小规模测试(对来自 40 名患者的 40 个成像检查的单独测试)中,对平均发病超过 6 年的阿尔茨海默症病例发现率达到了100%。

工业视觉:国外主要将计算机视觉应用在半导体及电子行业,具体在质量检测的各个方面已经得到了广泛的应用,并且其产品在应用中占据着举足轻重的地位。

以上进展充分证明,近年来计算机视觉的发展迅速,已经在上述四个行业中渗透,甚至起到了改变行业的效果。因此,在未来的计算机视觉技术创新与产业竞争中,谁能抢滩占位,谁就能制定游戏规则,开辟新赛场,主导变革;谁落后于人,谁就将错失历史机遇,被动挨打,受制于人。

我国高度重视计算机视觉的研究与发展。于2015年5月,国家发改委第一次在《关于加强公共安全视频监控建设连网应用工作的若干建议》中提到将计算机视觉技术应用于安防领域的识别;于2015年7月,国务院印发《关于积极推进“互联网+”行动的指导意见》中又一次提到了计算机视觉的重要性。该《指导意见》中将人工智能作为其主要的十一项行动之一。要进一步推进计算机视觉、智能语音处理、生物特征识别、自然语言理解、智能决策控制以及新型人机交互等关键技术的研发和产业化。于2015年7月,中央办公厅、国务院联合出台《关于加强社会治安防控体系建设的意见》,又一次肯定和重视了计算机视觉在安防领域的重要性。接下来计算机视觉的发展开始从安防领域向其他领域拓展。于2016年6月28日,国家网信办出台《移动互联网应用程序信息服务管理规定》,规定中指出计算机视觉技术将要被应用在交通、金融等领域的人脸识别功能中,并要发挥出相应的价值和作用。于2016年7月1日,人民银行发布《非银支付机构网络支付业务管理办法》,提出要将计算机视觉技术应用于金融领域的人脸识别功能中。于2017年,在《国务院关于印发新一代人工智能发展规划的通知》中再次肯定了计算机视觉技术的重要作用,“研究复杂环境下基于计算机视觉的定位、导航、识别等机器人及机械手臂自主控制技术。”除此之外,该计划是所有国家人工智能战略中最为全面的,包含了研发、工业化、人才发展、教育和职业培训、标准制定和法规、道德规范与安全等各个方面的战略,目标是到2030年使中国人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。

我国计算机视觉领域取得了一系列可喜进展,基础研究总体进入了从“量的积累”向“质的飞跃”、“点的突破”向“系统能力提升”的重要时期,关键技术从以“跟跑”与“并跑”为主,向“并跑”与部分领域进入“领跑”转变,并已有产业技术冲入国际第一方队。从计算机视觉***来看,我国的表现比较凸显:

我***依旧以“四小龙”商某某、依图、旷视、云从科技为主,根据IDC做的统计,***占计算机视觉市场69.5%,剩下厂商占30.6%。除了“四小龙”,其他参与计算机视觉产***包括XX深醒科技、扩博智能、云天励飞、码隆科技、图谱科技等,云厂商包括AWS、阿里云、金某某、腾讯云、百度云,传统的安防厂商如海康、大华等。其中,商某某科技尤为是我国计算机视觉技术创新的领军人物。从数据上来看,在2019年的计算机视觉国际顶刊CVPR中,根据官网数据,商某某科技及联合实验室共有62篇论文被接收,其中口头报告(Oral)论文就有18篇。相比2018 CVPR共44篇论文入选,增幅超40%。商某某科技CVPR 2019录取论文在多个领域实现突破,包括:高层视觉核心算法——物体检测与分割、底层视觉核心算法——图片复原与补全、面向自动驾驶场景的3D视觉、面向AR/VR场景的人体姿态迁移、无监督与自监督深度学习前沿进展等。这些突破性的计算机视觉算法有着丰富的应用场景,将为推动AI行业发展做出贡献。

除此之外,从计算机视觉的行业应用角度来看,计算机视觉技术应用场景愈加广泛,从中国产业信息网统计的数据显示,2019年计***占比最高的是安防行业,占整个市场规模的58%。国内现在计算机视觉在安防领域相对比较成熟,“四小龙”中依图为2019年安防领域表现最强的厂商,其他如云从、旷视均已大力发展安防市场。

然而,目前仍然存在一些发展瓶颈:

一是关键技术瓶颈突破较少,共性技术供给乏力。计算机视觉识别算法,数学模型等基础科学研究与实际的应用场景技术创新脱节、实验室技术创新与产品开发脱节现象严重。科技与经济脱节,科研评价学术化,有的片面追求高影响因子论文发表而忽视成果的转移转化和价值实现,成果难以转化或者不能转化。特别是共性技术的孵化转化平台,技术落到具体的成熟度不够,技术供给与市场需求难以实现无缝对接。总体来看,我国计算机视觉领域科技持续性支撑不足,强劲的市场需求与匮乏的技术供给失衡。

二是平台自我造血能力明显不足。原有各类平 内容过长,仅展示头部和尾部部分文字预览,全文请查看图片预览。 新机构以及开放的创新孵化中心。新增目标检测、目标跟踪、目标分类与识别、行为分析、视频增强等领域10个以上的创新团队,成立并启用10个“大师工作室”; 研发人员达到1200人;申请专利超过1000件。突破产业关键技术5~10项,实施一批技术成果的产业化示范,培育创新企业80家以上。完成产业化基地建设规划。在图像处理、图像分析、机器视觉、模式识别、人工智能等领域新增 30个以上的创新团队,形成国际化的协同创新网络。

第三年,完成核心区所有规划基础设施和研发平台建设,完成创新体系建设,三大平台实现运行良好,实现相对完整的产业配套能力引入与建设高端团队实验室,核心区研发人员达到2000人,形成国际化的协同创新网络。完成产业化基地建设规划。突破智能视频前沿关键技术20-30项,实现一批产业技术创新与产业化示范,培育孵化 200家以上企业。

到2030年,建成综合性、集成性、开放、共享的科技创新平台,成为全球智能视频创新中心,在关键核心技术创新、战略性产业培育、高端人才培养等方面发挥突出作用,为长三角区域创新发展、促进我国智慧城市高质量发展、建设小康社会做出重大贡献。

结语(300字)

[文章尾部最后500字内容到此结束,中间部分内容请查看底下的图片预览]

以上为《国家智能视频计算技术创新中心--建设方案》的无排版文字预览,完整格式请下载

下载前请仔细阅读上面文字预览以及下方图片预览。图片预览是什么样的,下载的文档就是什么样的。

图片预览