欺骗能力是智能的必要组成部分吗?———关于欺骗、智能与人工智能的思考|塞尔

　　作者：潘天群

　　摘要:智能是人类应对环境的能力，它体现在人类的语言游戏之中。说谎以及欺骗是复杂的表达类型，它们是智能的必要部分。通过图灵检验机器被认为只是对符号的语形处理，强人工智能机器应当具有理解语义的能力。然而，图灵实际上要求，尽管他没有明确表述，模仿游戏中的机器拥有或表现出有说谎以及欺骗的能力;而强人工智能若没有说谎以及欺骗能力，它不能在社会中生存。因此，若希望人工智能体有足够的智能，这样的人工智能体应当被设计成具有说谎与欺骗的能力，以便能够与我们人类进行维特根斯坦意义上的语言游戏。说谎或欺骗能力可以通过执行某个目标函数或效用函数的元程序来实现;元程序是运行一阶程序的程序，而一阶程序是得到诚实解的程序。说谎与欺骗的能力是智能体适应环境的生存技能，而与道德无关。

　　关键词:智能;人工智能体;图灵检验;塞尔型人工智能;欺骗;元程序;一阶程序

　　智能长期以来一直被认为是人类的本质属性，而智能机器的出现或可能的出现，挑战了人类的自尊从而使人类整体性地陷入焦虑。不管哲学家如何定义智能，人工智能时代正向我们走来。人工智能是在人对自我拥有的智能的认识中得以创造的，如同人根据自我的有限性的认识而塑造出具有无限性的上帝观念那样，因而人类的任何关于智能的认识与讨论，包括本人这里的探讨，都在塑造着未来的人工智能体。

　　什么是思维?图灵避开对这个问题的通常的下定义方式，而采取了功能主义的方式，他通过给出一个模仿游戏来确定在何种意义上我们说机器具有智能。在模仿游戏中如果一台机器在某一时间内不能被它的对话者，即人，识别出为机器，那么它便有了智能。这便是所谓的“图灵检验”。能够通过图灵检验的机器被认为具备了弱人工智能。我不打算给出关于智能的新定义，事实上任何试图给出的关于智能的定义都会招致批评;我也不打算罗列和讨论智能的可能的组成元素，如通常推理能力被认为是智能的不可缺少的部分，而人的情感或者情绪则被认为不是智能部分、它们有时甚至会影响到智能的体现。我本文要考察的或者说要论证的是，作为一种表达类型的“欺骗”，它是智能的必要部分，任何智能体，包括未来的人工智能体，都应当拥有这样的能力，尽管它不是智能的全部。本文这里只分析“欺骗”这种表达类型与智能的关系，而不从道德哲学层面上分析“欺骗”与道德的关系。

　　一、一个思想实验

　　表达是所有生物应对环境的一种行为，只不过不同的生物采取的方式不同。人类与其他动物不同的是，人类会使用复杂的语言与其他人进行生存博弈;人的智能体现在表达之中。我们来看一个如下的思想实验:

　　设想一名叫Wooden的agent，即智能体。Wooden可能是真真正的人也可能是机器人。Wooden能够像正常人那样思维，即Wooden能够推理、计算、学习，尤其是Wooden能够理解人类的语言，包括谎言;但是Wooden唯一不能做的是说谎与欺骗，即Wooden永远说真话。在Wooden的道德教条中不说谎是唯一的行为原则，也可以是最高的行为原则———若有其他行为原则的话。当然，一个永远说真话的人可能会面临悖论，因而可以设置让Wooden在面临悖论时表达“我难以分辨”，或者“我很尴尬”。也就是说，Wooden唯一遵循的原则是:真实表达。因而，在他人的询问下Wooden会将自己的所知情况无误地表达出来，包括自己尴尬的状况。

　　现在我们的问题是，Wooden有智能吗?如果Wooden是人造的———这里的人造的是指Wooden不是像我们那样自然出生与生长，而是它是我们通过某种材料将之制造出来的。此时Wooden能够理解人所说的言语，但是没有人的出生与成长的历史，并且Wooden清楚自己的历史。我们通过与Wooden的对话及不断地验证能够判断出Wooden不是人。那么，Wooden有智能吗?可以想见，因为Wooden不会撒谎，其显然通不过“图灵检验”。根据图灵检验的标准，Wooden不具备智能。若按照我们的直觉判断，我们也不认为Wooden具有智能，因为撒谎是人的“基本技能”，Wooden没有这样的技能。当然，这样的人造的Wooden的复杂程度取决于我们的技术，但无论如何复杂，我们都会认为它不具有智能。

　　如果Wooden是和我们一样的人，在与人的模仿游戏的对话中，Wooden除了不能撒谎外与人无异，此时我们在与他的对话中能够判断他是人，但我们的判断根据的不是他的智力，而是他所表达的内容。我们能够发现Wooden是诚实的，并且我们能够知道所有他能够知道的。Wooden有智能吗?对这个问题，我们会迟疑，我们至少会说，Wooden是一个在智力上有缺陷或障碍的人。事实上这样的Wooden在实际社会中是可能的存在的:Wooden出生后被教导完全说真话，且他无需独立地通过表达而生存;我们可以想象Wooden所处的社会中所有人都说真话，这样的社会从长期而言是不稳定的，因为人们通过某种偏移而获得额外的好处，即说真话不是进化稳定策略。事实上，我们小时候被教导不说谎，而在成长过程中慢慢学会说谎乃至欺骗。

　　我通过这个思想实验论证的是，塞尔强调的理解能力不是智能的全部，而欺骗能力是智能的必要部分。

　　有读者会不同意我的观点，而可能做这样的反驳:Wooden无论是人造的机器还是真正意义上的人，对他人的言语，Wooden没有真正做到理解;而若Wooden对我们骗Wooden的意图有真正的理解，Wooden不可能说真话。这个反驳是不能成立的，因为理解他人在欺骗与不说真话之间没有必然性关系，这就是说，即使Wooden理解了他人的意图，而其在“程序设置上”或者“思维机制上”没有设置说假话的机制，Wooden还是没有能力说假话。在社会中有人明知道他人欺骗他而无力通过说假话来应对，便是实际的例子。因此，理解是一回事，而根据理解做出相应的表达行动是另外一回事。

　　二、人类生存中的欺骗

　　人们往往通过言语表达来应对环境中的他人，在表达中智能得以体现。言语行为理论研究了多种言语行为类型，这不是我要讨论的。我这里将表达分为诚实表达与不诚实表达，不诚实表达便是说谎。上面的Wooden的所有表达都是诚实表达;而日常生活中人们的表达采取的是介于“诚实”与“不诚实”之间的混合策略。人们通过不诚实表达即说谎与欺骗以损害他人而自利，因而不诚实的表达被认为是不道德的行为。道德是群体中产生的维护群体生存下去的观念，它是对群体中的个体的行为的评判，尽管道德行为通过个体的人实现的，道德与智能不是一回事。由于不诚实表达是一个复杂的言语行为，它不必然是不道德的;不诚实表达体现了人的智能。

　　我们来分析人类智能行为中的欺骗。欺骗是人类社会中的常见现象，它是指这样的表达行为，通过表达出与自认为的真实情况不同的情况并让对方相信的行为。人们进行欺骗往往为了获得自我利益，但这不是必然的。欺骗被认为是不道德的行为，学界很少对欺骗做仔细的分析。欺骗与说谎密切相关。欺骗中包含着说谎，而说谎中不一定有欺骗的意图。诚实表达是指某人通过某种方式表达一个自己所相信的事物状态的行为，而说谎是某人有意向他人说出与自己相信(知道)的状态完全不同的状态的行为。如:我知道南京的各个地铁路线图，若路人在问我:“乘坐哪条地铁可到南京大学仙林校区?”，我说“不知道”，这便是说谎———表达的内容与我实际知道的内容相反;而我信誓旦旦或坚定地告知对方我明知道是错误的线路，这便是欺骗。于是，欺骗不仅仅有意向他人表达出不同于自己知道的，而且要让对方相信自己所表达的是真的。我想读者是能够认可这样的定义的。于是，我们看到，说谎不一定是欺骗，说谎者可能只是表达出一个与自己的信念状态完全不同的状态而已;而欺骗中一定有说谎，而不可能全部是真话。当然，持续性说谎往往为了欺骗，因为人们之所以持续性说谎，是因为其意图是让对方相信自己所说的某件事为真。

　　为了更好地理解欺骗，我们现在来分析说谎行为。上面已经得到这样的定义，某人说谎是指他有意向他人表达出某种不同于自己相信(知道)的命题的行为。于是，在说谎中有几点要素:(1)说谎是有意向对象的。意向性指的是“我们的心理状态指向、涉及、关联或者针对外在世界的种种客体和事态”，说谎如同其他心智行为一样有意向对象，这个对象便是他所认为的谎言。(2)说谎与表达行为相关。言语表达只是一种表达行为，人的行动也是用来表达，因而也能够用来说谎。比如韩信的“明修栈道，暗度陈仓”便是一种“行动说谎”;于是，我们有“言语谎言”，还有“行动谎言”。(3)谎言是与说谎者的信念相反而不是与事实相反。这里的“相反”是指信念与谎言两者可以“同假”但不能“同真”。由于相信的东西不一定为真，可能的是因某个表达者持有一个假的信念，他自认为表达了一个谎言，而他在实际上描述了一个真实的状态，因而此时在被表达者那儿他没有说谎，而实际上他说了一个谎言。这里，本人的观点是内在主义的。(4)说谎者要意识到他所表达的是一个谎言。如某个人说谎脸红，表明他表达的命题“不是”他的信念，而这样的表达行为是被社会所教导的蕴藏在心灵中的诚实表达原则所不能允许的，“脸红”便是实然与应然冲突的生理体现。

　　这是一个嵌套的表达，因而不是严格的定义。

　　上述是对说谎的分析。而在欺骗行为中除了上述要素外，还有一条要素便是:欺骗者意图让对方相信自己所说的为真。

　　哲学家从不同的角度关注说谎。说谎者悖论———“我这句话是假的”———从古希腊时被提出开始被逻辑学家、哲学家们所持续关注，他们希望解决这个悖论。人们生活在与他人的互动之中，因而处于与他人的语言游戏之中。在维特根斯坦看来，说谎是一种语言游戏，说谎是人们从社会中学习而来的。维特根斯坦说:“说谎是一种语言游戏，就像其他语言游戏一样也是需要学习的。”而康德论证说谎永远是错的，因为说谎会必然地伤害一个人。而实际中可能的是，说谎尽管“必然地”伤害真相需要者因而是“先验地”错的，但是，相比这种伤害，谎言的“后验好处”更大，因而在实际中说谎能够是道德的行为。当然，谎言所实现的“后验好处”是偶然的，取决于特定环境，因而，说谎的“后验好处”不能被哲学家通过先验地论证而得到。在现实生活中我们希望通过我们的表达影响他人的行为，从而达到我们的目的;欺骗性的表达便出现了。这个目的可能是利己的，也有可能是利他的。韩信“明修栈道，暗度陈仓”:这是通过行动所实施的欺骗，意在让对方不能防备自己。对于某些病症，病人知道真相不利于其治疗与康复、甚至加重病情，此时医生会和家属一起用言语欺骗患者，这样的欺骗行为是利他的。一个正常的人一生说过许多谎言，哪怕是圣人。有道德的人的谎言是自保的，或者是善意的或至少不是恶意的。我们想象不出一个没有说谎的社会，也想象不出一个不说谎的人如何能够在我们这个说谎的社会中生存下去，即便是圣人孔子也曾说过“谎”。司马迁《孔子世家》记载了关于孔子的这样一件事情:

　　孔子去陈。过蒲，会公叔氏以蒲畔，蒲人止孔子。弟子有公良孺者，以私车五乘从孔子。其为人长贤，有勇力，谓曰:“吾昔从夫子遇难于匡，今又遇难于此，命也已。吾与夫子再罹难，宁斗而死。”斗甚疾。蒲人惧，谓孔子曰:“苟毋适卫，吾出子。”与之盟，出孔子东门。孔子遂适卫。子贡曰:“盟可负邪?”孔子曰:“要盟也，神不听。”(《史记·孔子世家》)

　　孔子欺骗蒲人，与之盟约、答应对方不去卫国，孔子只是希望离开此地而到卫国。孔子为自己的行为辩护，神不认为在要挟下的盟约有约束力的。这正是孔子的智慧。于是，我们看到，言语表达是人的一种行动，它服务于表达者的目的，而说谎、欺骗只是一种表达类型———表达的内容不同于内心状态的表达，它是人在特定环境下的对自身有益的特定反应而已，与道德无关。我们的社会为了社会的整体的利益试图制定普遍的道德规范，而认为说谎与欺骗是不道德的;而实际上人的这种特殊的表达类型是否道德取决于特定情境，而不能像康德所认为的那样说谎以及欺骗永远是错的。

　　人类的智能是为人类在环境中更好地生存而服务的，智能是进化的产物，它使得人类拥有比其他动物更强的应对环境的能力。我们可以设想没有任何道德约束的“自然状态”下人的行为，当人们判断说真话对自己不利，他便说假话或者至少不说真话;有时候当人们发现为了自己更好地生存，他不仅要说假话，而且要让对方相信他的假话，这便是欺骗。在说谎与欺骗被认为不道德的有道德约束的社会中，情况略有不同。我这里不是说在生存竞争中我们必然地要说谎与欺骗，而是说要我们要有这个能力，这个能力不仅仅在关键时刻能够保护我们自己及保护我们的亲人，而且重要的是，这个能力保证了我们自由的行为。

　　在人与人之间尽管存在着合作的可能，竞争与冲突是常态，我们与他人并不总是处于友好关系之中。用博弈论的术语来说，当我们与他人处于零和博弈或常和博弈之中时，我与他人是竞争性的;而在竞争性的博弈中若我们不能隐藏自己的策略，我们便不能生存。比如在“石头—剪刀—布”的游戏中的均衡解是参与人应当在石头、剪刀、布之间以等概率而随机地采取策略;而实际的博弈中我们不是通过混合策略来进行，而是通过隐藏自己的真实策略并让他人相信我们虚假的策略而进行游戏的。若我们不能隐藏自己的真实策略，每一局都会输。智能是人类发展起来的应对环境、策略地生存的能力;面对环境中出现的不同状态，人类要做出恰当的应对措施，而拥有说谎能力即是让我们在竞争性博弈中保持使用混合策略的可能。

　　三、欺骗与机器智能

　　在分析欺骗时本文预设了人有一个内在的真实的心智状态，并且我的语言能够对这个状态进行正确表达，而说谎与欺骗是我们表达了一个与之相反的状态。机器有这个内在的心智状态吗?至少机器没有像人那样的心智状态，机器表达要“假装”像人那样。根据维特根斯坦的说法，只有人类才懂得假装。机器的假装行为本身是功能上的。图灵给出关于机器是否有智能的检验正是通过设计“欺骗游戏”来给出的，或者说在图灵那里，智能体现在欺骗之中。他称这样的游戏为“模仿游戏”。

　　在图灵检验中，计算机在提问者的系列问话中要给出一系列一致性的并且是像人的回答。面对“请你告诉我你的头发长度，可以吗”这样的问题，机器的回答大多数是谎言———因为它不是人，其目的是要让提问者误认为它是人。图灵检验中，机器的智能体现在机器与人的对话中的，如:

　　问:请给我写出有关“第四号桥”主题的十四行诗。

　　答:不要问我这道题，我从来不会写诗。

　　问:34957加70764等于多少?

　　答:(停30秒后)105621。

　　问:你会下国际象棋吗?

　　答:是的。

　　问:我在我的K1处有棋子K;你仅在K6处有棋子K，在Ｒ1处有棋子Ｒ。轮到你走，你应该下那步棋?

　　答:(停15秒钟后)棋子Ｒ走到Ｒ8处，将军!

　　图灵描述的是机器欺骗人的一个可能的对话，而这样的对话是常见的人与人之间一个对话。这里涉及了三个问题，对于第一个问题“请给我写出有关‘第四号桥’主题的十四行诗”，机器的回答是“我从来不会写诗”，此时它在模仿一个正常人的回答，以便询问者将它看成一个不会写诗的正常人，因为不是所有人都会写诗。对于第二个问题“34957加70764等于多少?”机器停30秒后给出了一个答案“105621”:机器停30秒是在假装像人那样计算了一下，而实际上机器是不需要这么长时间的。并且有趣的是，图灵这里给出了一个错误的答案，正确的答案是“105721”。一个计算机是不可能出错的，图灵的意思是，机器在模仿人的计算错误的行为，以便让询问者将它看成正常人。对第三个问题，我不会下国际象棋因而无法对机器的回答进行分析与评价。

　　根据图灵，如果机器在某些现实的条件下，能够非常好地模仿人回答问题，以至提问者在相当长时间里误认它不是机器，那么机器就可以被认为是能够思维的。我们看到，为了能够回答人所提出的问题，机器得有一个知识库，这是预先设置的;根据问题机器从知识库中取得推理的前提。为了使机器回答起来“像人”或者欺骗人，它的知识库中预先得存放了一些谎言，并被设置了说谎机制。这就是说，在图灵给出的模仿游戏中有智能的计算机要有欺骗能力的。当然，图灵可能不会同意“欺骗游戏”概念的，因为“欺骗”含有较强的意图，而“模仿”含有的意图是很弱的。

　　塞尔通过构造了一个中文屋思想实验论证功能主义的智能定义是错的:关在房间中的塞尔根据字典回答中文提出的问题，而实际上塞尔不理解中文。塞尔表明的是根据语法规则的回答不能说就是对语义的真正理解，因而我们不能认为看上去有智能的机器就是有智能的。塞尔不反对机器能够具有智能的，他反对的是基于物理—符号的路径能否实现智能;塞尔认为，智能是生物—化学的性质。塞尔提出的实际上是强人工智能的定义:一个智能机器实际上就是一个人。我们在塞尔的论证中没有看到他对智能性质的论述，因而没有谈及说谎与欺骗与智能的关系，他所强调的是语义的理解对智能的重要性。一个具有理解能力而没有智能的智能体是可能的，这就是论文开头本人的思想实验所表明的。塞尔那里的强人工智能就是“恰当编程的计算机就是一个心灵”，这样的计算机应当具有理解能力。

　　根据塞尔，一个强人工智能的机器被制造出来，它能够像人一样的理解与思维。而人有撒谎与欺骗能力，那么这样的机器也应当有这个能力。由于塞尔型机器人毕竟与人不同，它的这种与人不同可能是机体构造上的、也可能是经历上的。而假若塞尔型机器人没有说谎与欺骗能力，他的能力无法使之在人类的环境中生存下去，他与上面所说的Wooden一样，我们不认为他有智能。于是，理解不是智能的全部，尽管它是人类的心智特点，并且是实现人类智能的重要因素。

　　智能是多种能力的总称，计算或者推理能力、学习能力、记忆能力等均是智能的表现，或者说这些能力是智能的必要部分。图灵没有去解释智能应该包括的内容;事实上，这是一个难以完成的任务。图灵所做的是，通过模仿游戏来定义在什么意义上说机器具有智能。我们看到，能够通过图灵检测中的机器应当具有推理能力、学习能力、记忆能力，具有这些能力机器才能“说谎”。而塞尔通过中文屋的思想实验试图表明，只有当机器具有人类的理解能力，它才能够说具有智能。确实，理解是人类智能中重要的能力，它是否是智能的必要部分是存疑的，然而塞尔忽略了图灵检验中所强调的一个重要智能行为或能力，那就是说谎与欺骗能力。

　　智能是人类进化过程中所产生的理智能力总体，这个能力总体有助于保护人类自己。这个能力与语言相关。Wooden因没有说谎话、欺骗他人包括机器的能力，在与人类或者同样的机器的生存竞争中———假若Wooden生活在这样的竞争环境中，Wooden不能做到保护自己。这是显然的。说谎与欺骗不仅仅是一个人类社会中人类行为，它也是动物生存的本能。动物以自己的方式欺骗其他动物:变色龙根据环境改变自己的身体的颜色以迷惑它所要捕猎的生物，即使凶猛的狮子在发起攻击前也得悄悄地靠近动物，以增加捕杀的机会。当然，动物的这些行为是本能的，而人类这样的行为是理性的。

　　如何让机器说谎?对于人类的说谎者而言，说谎者意识到这是一个谎言，因为他知道自己真实的内心信念状态。而对于机器，它没有信念或知识;但是存在一种特殊的状态，这个状态是人嵌入的程序执行后所输出的状态。我们将这个状态成为一阶状态。比如:机器能够得到“2+2=4”、从“p，p蕴涵q，推出q”。这个状态是有限的，是程序所完全决定的。这里，我们说，程序正确运算的所有结果构成机器的一阶状态。我们可以将之看作“机器的信念”(或知识)———机器能够通过执行某个程序而知道它们。机器给出的与某个一阶状态结果不一样的输出，它或者是错误或者说谎。若问机器“2+2=?”，若机器回答5，那么它不是一个错误就是一个谎言———因为我们知道正确答案是4，机器也应当知道。如何才能使得机器能够说谎而不是犯错误?机器必须能够“知道”自己的一阶状态。一个能够说谎的机器或程序知道“2+2=?”的一阶答案或者正确答案应当是4，而它表达出一个非4的数字。一个能够说谎的机器首先得自知自己的一阶状态。在程序设计上，一个能够说谎的机器需要内置一个元程序———元程序是能够自动运行一阶程序的程序，相应地得到一阶结果的程序可以称作一阶程序。元程序能够根据需要运行一阶程序，因而它能够“预先”知道自己的各种一阶结果———当回答我们需要的各种问题前它先运行了它的一阶程序，然后再决定回答什么。

　　一个没有内置说谎指令元程序的Wooden，对简单的问题如“你是机器吗”，它会回答“是的”;对于相对复杂的问题如“你的父母是谁”，Wooden会回答:“我没有父母”。Wooden在它的知识库中寻找并根据一个简单的“问答逻辑”或者“算法”直接给出这些答案。在它的知识库中或者一阶回答集中存有诸如“我是机器”、“我没有父母”(在我的认识的人中没有与我有“父母关系”的人)这样的“信念”。而内置了说谎指令的Wooden，它面对“你是机器吗”及“你的父母是谁”的问题时，它先运行一阶程序，然后给出一个与一阶结果不一样的回答。Wooden便实现了说谎。

　　那么，什么决定一台机器说谎还是不说谎?这便是机器的目标函数或效用函数。在某个环境下机器通过目标函数最大化(效用最大化原则)，使得它在“我是机器”与“我不是机器人”及“我没有父母”与“我的父母是某某人”中做出选择。这个目标函数包括自我保护、最大化自我利益、不伤害人，以替换“诚实表达”原则，并要有一个根据目标函数得出答案的“算法”。

　　根据最大化自己的利益来表达的Wooden不一定说谎，而是说谎对它有利的情况下它才说谎。在实际中它实行的说谎与不说谎的混合策略。此时的Wooden因能够说谎而能够更好地生存，当然条件是他能够对说谎有利还是说真话有利的环境有高度准确或高概率的识别。若Wooden不能高概率地区分说真话更有利的环境和说假话更有利的环境，Wooden无法做出有利于自己的表达。这样，Wooden将无法被我们识别出来是人造的，此时我们说Wooden具有了正常人一样的智能。

　　结语

　　智能是人类智能体的一种能力，上面论证了说谎与欺骗是人类智能的重要部分。因此，在未来的人工智能的建造中，若希望具有人工智能的机器有足够的智能，这样的智能体应当被设计成具有说谎与欺骗的能力。本文分析了说谎中的要素:说谎是有意向的，说谎是一个表达行为，说谎者表达的内容与表达者信念相反且说谎者要意识到他在说谎;而欺骗是一个意图使对方相信自己所表达的行为。于是，一个具有欺骗能力的机器，它要表达一个与自己信念相反的虚假信念状态且要相信这样的表达是一个谎言。本人的分析可看成是对图灵检验的完善，具有欺骗能力的人工智能在一定程度上接近了塞尔型的人工智能。

　　需要强调的是，能够说谎与欺骗是智能体拥有的生存能力，这个能力与道德无关。一个会说谎与欺骗的人工智能体能够是道德的。如在特定的情境下机器为了救人而说谎或者欺骗，这是善意的因而是道德的;若无这样的能力，机器便无法救人。事实上，在现实中的某些情况下我们说真话是不道德的，我知道被凶徒追杀的一个无辜的人藏在某个地方，凶犯问我，我诚实地告知了凶徒无辜者的藏身之处，我的真话导致该无辜者被杀，此时我的诚实表达是不道德的。因此，如果我们希望被设计出来的人工智能体的行为是道德的，我们要做的不应当是让它永远不说假话、永远不欺骗人类或者欺骗其他智能体，而是要植入某些更高层次的规则或者“元规则”，这些元规则指导人工智能体选择它要执行的表达类型:诚实还是说谎。人们熟知的由科幻作家阿西莫夫提出的机器人学三定律，便是这样的元规则:1．机器人不得伤害人类，或看到人类受到伤害而袖手旁观;2．在不违反第一定律的前提下，机器人必须绝对服从人类给予的任何命令;3．在不违反第一定律和第二定律的前提下，机器人必须尽力保护自己。人工智能体由被植入的元规则与它所在的特定情境演绎出它应该说谎、欺骗还是说真话。因此，这样的元规则构成它行为的约束，这些约束和目标函数一起决定了人工智能体的表达行为选择。

　　需要说明的是，说谎与欺骗是智能的必要部分，诚实表达也应当是智能的必要部分，只不过诚实表达不是高级生存能力，它是生物体的天然本性的一个自然发展。在人的表达中，人的智能体现在人不仅能够真实表达，而且知道自己的表达的是诚实的。说谎与欺骗则不同，它是复杂的行为，说谎者不仅要知道其真实的信念状态，还要构造并表达出一个虚假的信念状态，并且，一个谎言面对可能的质疑需要许多看上去是真的言语去辩护。为谎言进行辩护的行为是复杂的语言游戏。当然，让对方相信自己的表达是诚实的，也是一个相对复杂的行为。我们看到，在现实生活中倾向于诚实表达的人在说谎与欺骗时往往不太容易让人相信;而善于说谎与欺骗的人无论说真话还是假话，都容易让人相信，因为他们更具有让人相信他的表达是诚实的表达能力。

　　（文章来源：《科学技术哲学研究》2019年第五期）

　　潘天群，哲学博士，教授。现为南京大学哲学系科学技术哲学专业教授、博士生导师。教育部新世纪人才（2006）。

　　主要研究领域：科学哲学与技术哲学，博弈论与社会科学方法论，逻辑应用，思想分析与哲学践行。

　　承担国家社会科学基金项目“博弈论的哲学基础与应用功能研究”（2009）。

　　编辑 / 丛艺伟

特别声明：以上文章内容仅代表作者本人观点，不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。