北京智源研究院正式发布《人工智能下一个十年》研究报告

6 月 21 日,由 北京智源人工智能研究院 主办的 2020 北京智源大会 正式开幕(直播入口: https://2020.baai.ac.cn ),会期四天。智源大会是北京创建全球人工智能学术和创新最优生态的标志性学术活动,定位于“内行的 AI 盛会”,探索人工智能的下一个十年。InfoQ 将进行全程跟踪报道,为 AI 领域的从业人员带来更多前沿观点,以下内容根据智源研究院院长,北京大学教授黄铁军《2020 智源进展报告》的演讲整理而来。

会上,黄铁军表示,自设立之初,智源研究院的愿景就很明确:聚焦原始创新和核心技术,建立自由探索与目标导向相结合的科研体制;支持科学家勇闯人工智能科技前沿“无人区”,挑战最基础的问题和最关键的难题,推动人工智能理论、方法、工具、系统和应用取得变革性、颠覆性突破;营造全球最佳的学术和技术创新生态,推动北京成为全球人工智能学术思想、基础理论、顶尖人才、企业创新和发展政策的源头,成为国际优秀的人工智能创新中心;推动人工智能产业发展和深度应用,改变人类社会生活,促进人类、环境和智能的可持续发展。

智源学者

2019 年 4 月份,智源推出了第一批学者计划,聚焦人工智能的原始创新和核心技术,遴选支持智源学者 85 人,涵盖人工智能的数理基础、机器学习、智能信息检索与挖掘、智能体系架构与芯片等方向。

今年,智源学者计划扩充为五个层次,培育和支持人工智能优秀科技人才,建设世界人工智能人才高地,人数再增加 100 名,其中智源研究员和青年科学家 20+、智源新星 20+、探索者 30+、博士后 30+。其中,智源研究员面向 50 岁以下,开展方向攻关,解决人工智能重点领域的关键技术难题;青年科学家面向 38 岁以下,根据个人擅长领域或感兴趣的方向进行开放性、探索性研究;智源新星面向 33 岁以下,联合高校院所同步引进,进行人工智能开放性探索性研究;智源探索者面向有意回北京发展但尚无确定单位的人才,不拘一格、不分国籍、随进随出,可协助对接合适的北京高校院所和企业;智源博士后,依托智源博士后工作站,联合优势高校院所,开展 AI 前沿学术研究。

上述所有人才都会参与到智源社区的建设中,并开展前沿学术研究并进行成果转化,下图大致描述了可能的技术和转化方向,今年新增了认知神经基础、决策职能和机器感知三个方向,重点关注智能医疗、智能交通、智能政务等领域的落地。

智源社区正式发布

经过一年多的努力和建设,智源社区今天正式发布,目的在于培养人工智能领域问题的发现者和解决者,正式加入社区之后,还会经常看到线上论坛和学术活动,帮助每一个学者或学生找到技术交流和技术合作的伙伴。

首个机器学习领域通用数学符号集

与此同时,黄铁军宣布了智源社区的一项重要发布,即首个机器学习领域通用数学符号集。当前,研究机器学习的学者来自不同领域,论文中所用记号各异,造成论文阅读困难,通用机器学习符号集针对一些常用且容易混淆的符号,给出一套标准化建议,为解决论文写作(提供 LaTex 包)过程中的常用符号选择、符号混乱导致的交流问题等提供基础,可以统一规范,提高交流效率。

《人工智能下一个十年》研究报告

此外,智源社区也正式发布《人工智能下一个十年》的研究报告,该报告由智源研究院和清华大学共同完成,以下抽取了部分重要内容进行解读(扫码或访问 baai.org,加入智源社区,后续将可获取报告完整版)。

在科研实力上,人工智能全领域下的中国学者量和论文量都约是美国学者量的三分之一,但人均论文产出量略高;在人工智能的一些子领域中,中美论文数量大多处于伯仲之间,在人机交互、知识工程、机器人、计算机图形及计算理论领域排名差距较大。

如果聚焦到北京市,其拥有国内 AI 高校和企业的数量资源优势,在 AI 领域的论文量和人才量最多。相对而言,深圳和香港的 AI 人才在发表论文方面更加努力,人均论文产出量更多。

纵观投融资领域,中国 AI 创业热源自 2013 年,每年新成立的 AI 创业公司数量增速明显,直到 2015 年爆发到近 10 年的顶峰——一年内有 600 家人工智能公司成立,是 2012 年的 3.6 倍,此后两年 AI 创业虽有下滑趋势但仍保持较高水平,直到 2018 年、2019 年呈现断崖式下跌。

中国 AI 企业创业方向集中在机器学习、计算机视觉、自然语言处理等技术层,以及金融、教育、交通、工业等行业应用层。中国 AI 企业获得融资情况也从 2013 年起迅速整整,融资事件数量和融资金额分别在 2017 年、2018 年达到顶峰,随后开始下降,AI 投资逐渐趋于理性,获投 AI 企业主要集中在行业应用层,占比 58%。

关于未来,黄铁军在分享中也提到了两点思考:一是机器学习与深度学习在人工智能领域应用广泛并取得显著成果,但受限于底层算法,使得人工智能技术发展达到瓶颈,未来需要与数学、脑科学等结合实现底层理论的突破;二是实现具有能理解、会思考、有认知、会决策的强人工智能,离不开数据支撑和知识驱动,将知识图谱、认知推理、逻辑表达结合的认知图谱提供了一种研究思路。

智源数据开放研究中心

根据黄铁军的介绍,智源目前已经开放了乳腺癌宫颈癌基准数据集、新冠肺炎全球开放数据源、冬奥会花样滑冰数据集以及多个智源大赛数据集。

疫情期间,智源研究院开放的知识疫图,成为全球新冠疫情的智能驾驶舱:基于知识驱动,全球疫情统计数据和预测模型,对世界各地的疫情发展及风险状况进行量化评估和预测,提供复工复产各方面的辅助决策支持。

此外,智源联合清华、协和、首都医科大学共同发布面向乳腺癌的智能计算与预测平台,可以实现自动预测病变肿瘤良 / 恶性及其分子亚型,以帮助乳腺癌的诊断。

为解决智能医疗领域的医疗数据共享问题,智源研发了联邦学习多方安全计算平台,进行智能医疗领域联邦实验,突破医疗数据共享关键技术的研发。

创新中心

智源创新中心的定位是成果转化创新组织;开放智源 AI 创新生态资源攻关关键核心技术;推进 AI 原始重大创新和关键技术突破应用。致力于寻找拥有人工智能核心创新技术的 AI 科学家;怀揣梦想坚信技术改变未来的创新创业人才;推动人工智能技术落地产业的优势 AI 企业。智源将提供丰厚的研发资金、海量数据和算力平台支持;全球顶尖的学者资源和科研力量支持;北京市应用场景、优质的产业资源对接;社区内三万名顶尖工程师的人才支持。

伦理与可持续发展

通过蓝牙技术实现定位是比较切实可行的追踪方案,黄铁军表示智源希望在这一方案中实现更好的隐私保护,因此开发了智源蓝保,这是一个保护隐私的传染链密切接触者精准追踪系统,解决的痛点是复工、复产、复学过程中,精准追踪感染人员相对位置,快速排查与感染者有近距离接触风险的人员,大幅降低隔离人员比例,其技术框架为蓝牙 ID 碰撞 + 近距判断 + 本地边缘存储(如下图所示)。

黄铁军表示,智源蓝保系统的四大优势为:

一是精准判断近距离接触关系。基于移动运营商和互联网大数据的方法,难以精确判断人与人之间的近距离接触关系。基于蓝牙信号,近距离接触判断可达米级;

二是最大化隐私保护,数据不离场,不离机,不上网。充分利用个人设备与边缘存储,蓝牙碰撞记录匿名保存在个人设备,或者安装了无线感知设备楼宇的边缘存储中;

三是三维可视化界面,支持常态化防控与应急快速排查。常态化防控设备分布热度图,发生感染时追踪感染者设备轨迹与批量排查;

四是低成本、大规模、快速部署。示范楼每层部署成本低于 1000 元,单人工 3 小时,不要求网络设备进行软、硬、固件升级。

此外,北京智源人工智能研究院建立面向可持续发展的人工智能库,发布面向可持续发展的人工智能公益研究计划。

联合国可持续发展目标旨在从 2015 年到 2030 年间以综合方式彻底解决社会、经济和环境三个维度的发展问题,转向可持续发展道路。

应当通过新一代人工智能的发展促进全球可持续发展目标的实现,这是全球人工智能产学研界的共同目标。人工智能的科研机构、教育机构、企业有责任通过人工智能推动社会、经济、环境的可持续发展。