算法周刊·前沿扫描｜对话董乐：小数据为何热门？如何思考通用人工智能？|人工智能

　　“小数据”逐渐热门，背后是技术演进的自然结果还是“大数据”碰壁后的重新选择？认知智能世界里的“暗物质”是什么？我们该如何期待和思考通用人工智能？

　　“我们是世界上比较早研究大数据问题的团队，差不多在17年前（2004年）就开始做大数据领域的研究。研究了大概三四年以后就发现大数据存在一些固有的问题，当时预见到这些问题用感知智能是无法解决的。后来我们就开始尝试范式转换，从2009年开始研究认知智能。”近日，北京通用人工智能研究院常务副院长董乐接受澎湃新闻（www.thepaper.cn）采访时表示。

　　北京通用人工智能研究院定位为非营利性的新型研发机构，由北京市政府、科技部支持共建，北京大学、清华大学等单位合作支撑，由全球著名计算机视觉专家、统计与应用数学家、人工智能专家朱松纯教授于2020年筹建并担任院长。其目标是实现具有自主的感知、认知、决策、学习、执行和社会协作能力，符合人类情感、伦理与道德观念的通用智能体。

　　董乐阐述道，目前大家看到比较多的AI采用的是“大数据+算力+深度学习”范式，属于感知层的智能，在真正产业落地时，当前的感知智能遇到了很多问题，比如只能做特定的人类事先定义的任务，存在长尾效应、训练成本高的问题，大量数据标注牵扯到隐私与安全性问题，此外还存在模型的不可解释、不能交流、算法偏见等各种问题。

　　“现在大家慢慢形成了共识，认知智能可能才是下一个10年人工智能要重点发展的方向。”董乐教授表示。

　　怎么理解认知智能与感知智能？

　　“乌鸦范式”和“鹦鹉范式”

　　日本一位野生动物学家采集了野生乌鸦的很多日常生活习性视频。他发现，当野生乌鸦来到城市，它需要坚果饱腹但又没有办法打开坚果。这时，它有个很偶然的发现，把坚果扔到路上，汽车开过去后坚果被碾碎了，就可以直接过去吃。

　　但它在去吃的过程中又面临一个新问题，马路上很危险，它要怎么完成这个任务？很聪明的是，它又发现信号灯，当红灯的时候，所有车都停下来，它就把坚果扔到斑马线上，坚果被车轮碾破，等信号灯指示，车都停了再下来把坚果吃了。

　　“所有这一系列动作都是它自主完成，通过要解决一个任务——安全吃到坚果，它进行了观察、推理，发现了交通的规律，然后去执行和决策。我们把这称之为‘乌鸦范式’，即“小数据，大任务”范式。它没有很高的训练成本，也不需要太多的数据训练，但它要完成一个任务目标，所以它是由任务驱动的。”董乐说道。

　　与“乌鸦范式”相对的就是“鹦鹉范式”，鹦鹉需要大量的数据反复训练，教给他什么它就说什么。它可以不断重复，但并不理解其中含义，它不能反映现实中的因果逻辑，是“大数据，小任务”范式。

　　在认知智能视野下，人工智能系统的三个关键要素是“架构、任务和数据”。董乐认为，相比于感知智能所强调的“数据、算力和模型”，这是又向前演进了一步。其中，架构最重要。“就像判断一个人的能力，并不是来自他掌握了多少知识，而是他有很完整的知识构建模型能力，那么即便目前拥有的知识不够多，但到一个新的领域，有了这样健全的架构也可以迅速习得新知识。我们认为架构是基础，任务是关键，在这个过程中数据起了一部分作用，但并不是全部的作用。”

　　比如训练AI完成椅子识别的任务。如果按照感知智能深度学习的范式，需要把大量椅子图像中的特征标注出来，再让AI学习。但此后，遇到异形的椅子，依然会出现难以识别的情况。“不光是单纯的物体识别，在包括无人驾驶和医疗等领域，都会遇到类似的问题。”董乐表示。

　　但人不需要看过很多椅子也很容易做出是否是椅子的判断，人是如何做的呢？

　　董乐概括道，“我们人会把这个任务从单纯的物体识别问题上升到对任务的理解的高度。通过视觉感知和物理想象进行判断，也就是说我们看到它，就可以想象它能不能承受让我安全地坐，以及坐上去舒不舒服，就这么简单。”

　　董乐曾在BEYOND国际科技创新博览会的论坛中提到认知智能世界里的“暗物质”。她认为，在日常生活中，我们很容易感知到视觉等感官的信息输入，但这只是冰山一角。“在感官背后的推理、想象其实发挥了巨大能量，我们将其称作‘智能暗物质’。我们会对物理和社会常识进行理解、推理，然后结合时空、因果模型作用在现实场景中，把感知和认知进行融合。”

　　AI可以学习人类这种把看不见的知识提炼出来的抽象能力，基于这样“Dark Beyond Deep”的范式转化，即通过少量数据完成“大任务”，以少量样本、简单标注，做到举一反百，以感知智能和认知智能相结合的方式来理解世界，探索智能“暗物质”。

　　对于“小数据”逐渐热门，背后是技术演进的自然结果？还是“大数据”碰壁后的重新选择？董乐认为，两个层面都有。

　　“我们不否定大数据，大数据在很多场景上确实有很大价值，但是在另外一些场景上怎么办？同时还有数据问题，成本问题，能耗问题……用大数据去解决一些根本不用大数据就能解决的问题，其实是非常不科学的。”董乐对澎湃新闻（www.thepaper.cn）表示。

　　如果粗略对比鹦鹉范式乌鸦范式的效能，董乐说道，“鹦鹉范式可能是2:8，即通用能力大约只有20%，还需要按任务要求对80%的能力进行个性化定制；乌鸦范式则是8:2，通用能力达到80%，只有20%的能力需要按任务要求进行优化迭代。”

　　对于是否认可人工智能前进道路中类脑智能的研究路线，董乐对澎湃新闻（www.thepaper.cn）谈到，“如果抛开要解决的问题和任务，单纯讨论一个技术范式或者说一种路径，我认为意义和价值都不大。每一条技术路径都有它探索和研究的某种必要性，单纯去说哪条路径可能有问题，或者有人有质疑，这都不足为奇，关键的是要解决什么问题，要把任务确定好。”

　　董乐以登山做比喻，从山脚往山顶有很多路，周围的风景也不同，过程中要解决的问题也不一样，现在从山底下往上看的时候，没有办法去评判哪条路是最好的。可能只有真正到了上面以后，再回过头来思考这个问题。

　　通用人工智能是像人一样的“人造智能”吗？

　　2014年，物理学家斯蒂芬·威廉·霍金（Stephen William Hawking）在接受英国广播公司（BBC）采访时曾表示了对一个“像人”的人工智能的担忧，“制造能够思考的机器无疑是对人类自身存在的巨大威胁。当人工智能发展完全，就将是人类的末日。”

　　此后几年，霍金也在多次演讲中表达了这样的看法。2017年，霍金在接受英国《泰晤士报》采访时更是发出警告，“人工智能进一步发展便可能会通过核战争或生物战争摧毁人类。人类需要利用逻辑和理性去控制未来可能出现的威胁。”

　　那么在当下，我们在讨论通用人工智能时指向的是霍金所担忧的人工智能吗？

　　中国科学院院士、清华大学人工智能研究院院长张钹曾在第五届中国人工智能大会上表示，“通用人工智能的发展是好事，真发展出来了也是喜事，但是这里不能把通用人工智能和强人工智能混淆。”

　　南京大学人工智能学院院长周志华曾在《中国计算机学会通讯》2018年第1期《专栏》里将“强人工智能”描述为，达到甚至超越人类智慧水平的人造物，具有心智和意识、能根据自己的意图开展行动的“人造智能”。“通用人工智能”则是希望借鉴人类的智能行为，研制出更好的工具以减轻人类智力劳动，其实质是行为智能和任务智能，本质还是“弱人工智能”，类似于“高级仿生学”。

　　“人工智能技术现在所取得的进展和成功，是缘于‘弱人工智能’而不是‘强人工智能’的研究”，周志华称，“从技术上来说，主流人工智能学界的努力从来就不是朝向强人工智能，现有技术的发展也不会自动地使强人工智能成为可能。”

　　国际人工智能联合会前主席、牛津大学计算机系主任迈克尔·伍德里奇(Michael Wooldrige)曾在2016年CCF-GAIR大会报告中说，强人工智能“几乎没有进展”，“几乎没有严肃的活动”(little progress, little serious activity)。

　　“通用人工智能是根据任务驱动，目前在有限边界内进行的，就像我们人一样，人的能力也是有边界的。”董乐对澎湃新闻（www.thepaepr.cn）表示。

　　什么样才能达到真正所说的通用人工智能？董乐认为，实际上是一个使命，一个方向，它不断让智能体以更加通用化的方式解决问题。第一个体现是，智能体能够具备普遍意义上的常识推理能力，大概百分之八九十的任务都能做到准确理解、并能实现。第二是一项技术基本在具有同样逻辑的场景中都能通用。

　　“例如在医疗、教育、金融，包括能源等领域都有大量的资源匹配的问题，决策者需要根据有限的信息实时做出预测，因此分析光快不行，要准确，准确以后还要全面，要分析出原因，这样才能更清晰更合理，”董乐表示，“我们的认知AI通用智能体，它起到的作用实际上就是把这些综合的信息，更合理化地给到需要的人手里，帮助决策者，更好、更公平地统筹、分配资源，做出最科学的决策。”

　　在当下，很多企业也在借助人工智能完成智能化转型。记者走访中发现，对于要不要自建AI团队，很多转型中的企业是有犹豫的。 “目前会看到很多国家企业也都面临这样的问题，一个是数据能不能给，第二是自己的专业能力能不能够。”董乐对澎湃新闻（www.thepaper.cn）表示。

　　董乐认为，“如果只是一个企业的应用，应该去跟专业团队合作。AI人才本身很紧缺，成本很高，如果没有很强的科学研究和工程化能力，最后会发现投入越来越多但产出不明显。如果从企业战略层面考虑要布局自己的AI团队，这是另外一个问题。单纯从结果的产出导向来说，我认为对于大部分的企业来说没有必要组建自己的专业AI队伍，找到一个优秀的专业团队，搭建好的合作模式，各自做各自擅长的事才是最优解。”

　　谈到AI对人类和社会福祉的帮助，董乐表示，实际上就是用技术的方式打破不平衡的、可能带来浪费和损耗的资源分配方式，使社会整体的运转效率得到智能化提升。“我们认为在未来50年必将产生人工智能与人类文明的碰撞与融合。其实对所有社会治理者，包括我们每一个人都要去思考，智能时代的社会，我们要去面临什么？”

特别声明：以上文章内容仅代表作者本人观点，不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。