来源:学习时报 2023年11月15日
高文,中国工程院院士,北京大学博雅讲席教授,鹏城实验室主任。他见证和参与了中国计算机行业的高速发展,见证了人工智能的成长壮大。他先后主持国家级科研项目20多项,涉及人工智能、视频编码与分析、计算机视觉等前沿领域。他带领的数字视频编解码技术国家工程实验室,经过十余年的潜心研究,凭借完全自主创新,完成了我国具备自主知识产权的第二代信源编码标准体系,达到了国际标准水平。2021年,他和他的项目团队凭借“超高清视频多态基元编解码关键技术”,荣获2020年度国家技术发明奖一等奖。他和团队主导制定的AVS超高清视频编解码国家标准,还被全球超高清产业联盟采纳为国际标准。
人工智能被视为第四次工业革命的一个标志,发达国家和众多的科技公司,纷纷投入巨资展开研发和布局,我国也在全力构筑人工智能发展的先发优势。党的二十大报告指出,推动战略性新兴产业融合集群发展,构建新一代信息技术、人工智能、生物技术、新能源、新材料、高端装备、绿色环保等一批新的增长引擎。什么是人工智能?人工智能将如何改变我们的生活?如何在这场技术革命中抢占先机?
什么是人工智能
人工智能的发展历史只有六七十年。人工智能也叫人造智能,就是由人制造出来的模仿人的智能,一般通过机器人、计算机等载体表现出来。人工智能有两个重要概念:一个是通用人工智能或者叫强人工智能,如果这种智能系统的功能、能力和人一样,甚至超过人,就叫强人工智能系统;另一个是专用人工智能或者叫弱人工智能,如果这个智能系统只能干一件事,尽管可能比人厉害,那它也是弱人工智能。比如常见的刷脸识别、语音识别系统。
1956年,10位年轻的学者,其中许多是图灵奖和诺贝尔奖的获得者,在美国达特茅斯市搞了一个暑期研究所。在两个月的讨论中,他们针对人工智能应该干什么、怎么干进行了一番讨论,列出了人工智能领域需要研究的自动计算机、编程语言、神经网络、计算规模理论等问题,并形成了一个比较前沿的报告,这被公认为是对人工智能一个比较完整的描述,这一年也被称为人工智能元年。
从1956年到1976年,这20年是人工智能发展的第一个阶段,这一时期的人工智能主要是在模拟大脑工作。这种模拟不是信号级的模拟,而是在逻辑推理等更高层面上去模拟大脑。这一阶段比较珍贵的一个成果是数学定理证明,也就是用计算机自动进行数学定理的证明。包括代数定理证明和几何定理证明,都是由两位华人(王浩、吴文俊)完成的。后来研究人员发现仅仅通过模拟人的大脑来实现人工智能这条路太难走。因为当时只完成了数学定理证明这件事,战胜国际象棋冠军、机器谱曲等其他目标都没完成。人工智能逐渐从高潮跌到低谷,学者们开始反思是不是人工智能走歪路了,是不是要做点实事。
学者们开始尝试研发对社会有影响力的系统,比如医疗诊断专家系统、故障诊断系统,可以代替医生、专家去做一些诊断。另外就是模拟神经系统来做专家系统,这在字符识别、文字识别领域比较有效。后来应用到机器自动识别、自动分拣系统,包括今天的语音识别,基本上都是走的神经网络这条技术路线。
这两条技术路线使第二次人工智能发展专家系统的这30年,开创了百花齐放的局面。不过专家系统的高光时刻并没有持续太久,因为专家系统虽然做了很多,演示时效果也不错,但真正上线去用的时候效果并不理想,于是热度开始下降,直到2006年引发人工智能领域轰动的3篇重量级文章的问世,人工智能才开始了突飞猛进的发展。
这一年,多伦多大学教授辛顿、纽约大学教授杨立昆、蒙特利尔大学教授本杰奥,几乎同时发表了重量级的文章,从不同角度说明深度神经网络是大有可为的,是可以进行大规模学习训练的。只要输入的数据好,它就可以解决问题。这一系列论文发表后,大家摸索了几年小有收获,但并没有重大成果产出。直到2010年以后,斯坦福大学华裔女教授李飞飞、普林斯顿大学华人教授李凯,开发了一个规模特别大的图像数据库,然后拿去参加比赛。当时比赛标准是谁做的系统错误率更低,谁就胜出。2010年错误率最低的队是28%,2011年是26%,2012年取得了突破,降至16%。原来是辛顿的学生用辛顿公开发表文章中的技术去参加比赛,打败了所有的对手,这是一个重大进展。到了2013年,深度网络这个技术普及开来,其它路线无非是使用多深的网、多少个节点、参数怎么设定等技巧性改进,而不是方法上的革命了。到2015年系统的错误率又实现革命性突破,降至3.6%,而人的平均错误率是5%,在图像分类这件事上,神经元网络已经超过人了。这事是谁做的呢?中国学者孙剑做的,当时他和他的团队提出了残差网络。这个残差网络,不仅在图像分类应用上是第一名,围棋里面也是最厉害的。基于此,在深度网络适合的那些弱人工智能是可以进行广泛应用研究和产业化的。
人工智能的特点和成长
从感知到认知,人工智能更上一层楼。在智能水平上,感知智能日益成熟。智能可分为感知智能、认知智能和决策智能。感知智能是和我们眼看、耳听、手摸等感官直接相连的智能,现在的脸部和语音识别、机器翻译,以及诊断病人病例、产品残次识别,都发展得非常好,人工智能正在慢慢从一般的感知智能向认知智能进行升级。
类脑计算和量子计算,两条突破之路。如果做更大规模或者做和认知有关的人工智能以及强人工智能,靠现有计算机是做不到的,怎么办?就要寻找出路,在技术路线上有两个比较可能的出路。一个是类脑智能,人对信息处理的能效比非常之高,现在的计算机不行,能效比太低了,类脑计算能效比会高一些。另一个是量子计算,其能效比是极高的,把量子计算做成比较稳定的一个系统是有可能的。当然不管是类脑、量子计算,现在还有很大的不确定性,需要继续加以研究和积累。
人与机器,混合智能具备独特优势。在智能形态方面,人和计算机混合模式越来越多,这个叫人机混合智能。机器擅长做的事交给机器,机器做不好的事,人可以介入一下。这样人机混合的智能,是现阶段发展人工智能一个比较重要的技术途径。
应用先行,有助于技术发展。在应用驱动方面,以前是先把技术做好,然后转化技术去做应用。现在靠应用去拉动技术发展,这条路是人工智能一个非常重要的发展形态。深度神经网络出现时,在哪儿好用,不知道,需要找一个很好的应用场景把它用起来。如果不是辛顿的学生把它拿去参加图像网络比赛,可能神经网络的热潮还会拖许久才会到来。
未雨绸缪,防止技术失控。人工智能具有社会属性。人类会不会被人工智能奴役、摆布?这个社会属性,恰恰是我们在做人工智能时要认真对待的一个问题,要摆正人和智能系统之间的关系,对人工智能能干什么、不能干什么进行研究和立法,从法律和道德层面去约束和规范它。否则,将来可能会很被动。
中国人工智能发展的优势与差距
从2013年起,世界许多国家政府,尤其是发达国家纷纷调研人工智能对社会、经济可能带来的颠覆性影响,相继发布符合自身国情的人工智能战略。在这场事关未来的技术革命中,我们的机会在哪里?优势和短板分别是什么?
我国已经成为人工智能领域的超级大国之一。改革开放以来,我们国家在基础研究方面的投入巨大,人工智能的发展有了非常好的沉淀。一些关键核心技术,中国已经走在了世界前列,比如说人脸和语音识别技术。中国人工智能的发展与各行各业的结合和渗透是非常高的,其应用和推广比其他国家做得更好。我国人工智能发展的创新生态环境已经初步形成。百度的无人驾驶、阿里的城市大脑、腾讯的智能医疗、科大讯飞的语音识别、商汤的图像与视频处理等开放平台以及华为、寒武纪、海康威视等实体经济领域平台已经创建。全球AI指数排名,中国属于第一梯队,紧随美国,在人才、教育、专利产出等方面均有所进步。中美两国引领、呈梯次分布的全球人工智能发展总格局保持不变。
四大优势护航中国人工智能发展。第一个是政策优势,人工智能已被列为国家优先发展事项。第二个是海量数据资源优势,中国人口是美国的四倍多,手机群体和手机消费、支付量也是最大的,拥有庞大的消费、出行、医疗、旅游、物流等数据资源。第三个是应用场景优势,我国是发展中国家,很多基础设施还不够完善,这恰恰给人工智能的应用提供了一些深度场景。比如城乡的基础设施、医疗、教育、民生服务等领域的问题,人工智能系统的介入,问题可以快速得到解决。第四个是青年人才优势,我国高等教育毛入学率已达59.6%,而且学理工科的学生比例很高,这是一个非常大的人才储备库。国家自然科学基金委员会专门设立人工智能一级学科代码,资助相关基础研究、前瞻性探索和应用研究。
当然,我们也存在一些短板,特别是在四个薄弱环节急需加强。第一,基础理论和原创算法研究比较薄弱。第二,高端器件研发能力弱,比如做深度神经网络训练的GPU(图形处理器),中国在这方面差距比较明显。第三,缺乏有影响的人工智能开源开放平台。第四,缺乏相应的高端人才。据统计,中国最顶级的人工智能高端人才数只有美国的20%,已成为国家关键领域急需的高层次人才。
我们该如何布局未来
未来已来,到底是哪一个未来来了?过去三十年是变化非常大、非常快的三十年。第一个是计算机的算力增强了约一百万倍,第二个是存储容量增加了约一百万倍,第三个是通信速度增加了约一百万倍。这三个一百万倍,让我们的社会、工作、生活、学习都发生了天翻地覆的变化。而下一次影响人类社会的工业革命时间可能会发生在2030年到2040年之间,其主题将会是人工智能,人工智能将是未来一个世纪的核心技术。
国家战略、人才高地、基础建设、立法保障,一个都不能少。要想把人工智能发展好,就需要我们在很多事上起好步、布好局。一是将发展人工智能提升至国家发展战略,国家、地方和企业,要把其作为战略性新兴产业,给予大力支持。二是健全人工智能的国家研发体系。三是加快人才培养,形成一批人工智能的国家人才高地,进而带动整个人工智能理论和算法的发展。四是加强智能化基础设施建设,推动公开数据的开放、共享,同时完善相关法律法规保护数据的安全性。五是加快人工智能法律、伦理问题的研究,引导人工智能安全可控发展。六是深化国际开放合作,主动参与全球人工智能的治理和标准制定。
数据处理、开源平台、应用场景,三个抓手要记牢。利用人工智能为各行各业赋能,抓手是什么?排在第一位的是数据,没有数据,即便是弱人工智能也没法做,所以要把数据组织起来、清洗出来、利用起来并加以安全防护。第二位是创建好自己的开源平台,与我们作为人工智能大国的地位相匹配。第三位是应用场景的培育和赋能,现在很多场景还只是投资驱动的,政府要清楚哪些是优先发展的领域,市场能做能决定的事,就交给市场去做去决定,需要政府介入、调控才能做好的事,政府就要果断去干预、去培育,扶上马,送一程。这是非常关键的一个步骤。在做大做强自己,补齐自身短板弱项后,我们要和全世界人工智能同步推进,去迎接人工智能第四次工业革命的到来。
原文:https://paper.cntheory.com/html/2023-11/15/nw.D110000xxsb_20231115_1-A6.htm