上海市社会科学界联合会主管主办
摘要:在第四次工业革命中,社会机器人正坚定地从虚构走向现实。随着复杂的人工智能在日常生活中越来越普遍,社会机器人的开发亟需妥善处理机器人、人类和情境的关系。当前,不同领域的研究人员正在努力解决人类如何感知并与这些智能体互动,以及人脑在多大程度上将智能机器纳入人类社会环境等问题。人类与机器人互动的最新发现、当前挑战和未来方向呈现出跨学科视角的复杂性,并逐渐衍生出人机互动与社会认知的互惠约束问题,具体涉及人机互动的拟人化以及第二人称特征。相关思考酝酿出人机互动的社会神经科学框架。该框架聚焦拟人化人机互动在非言语交流上的多维空间与特征相似性,并借助第二人称神经科学范式比较了人−人互动和人−机互动的神经机制。机器他心的未来仍有待整合来自认知计算神经科学、社会神经科学、心理学、人工智能和机器人学等不同但互补的研究领域的发现,从而重塑社会机器人在人类社会生活中的潜力和限制条件。
作者:陈巍,绍兴文理学院心理学系教授。
本文载于《学术月刊》2023年第6期。
目次
一、从Francine到Sophia:社会机器人的他心之问
二、HRI与社会认知的互惠约束
三、 HRI的社会神经科学
四、机器他心的未来
一、从Francine到Sophia:
社会机器人的他心之问
整个故事要从1650年近代哲学之父笛卡尔去世后一则惊悚的逸闻说起。故事的主角是笛卡尔的私生女Francine,她因猩红热去世。以擅长制造复杂的自动装置而闻名的笛卡尔悲痛欲绝,决定造一个机械复制品,据说与女孩生前的样子一模一样。笛卡尔带着她到处旅行。她会“睡”在笛卡尔床边的一个小匣子里。1646年,笛卡尔受瑞典女王Kristina邀请,赴她的城堡讲学。在旅途航行的某天晚上,笛卡尔把Francine从小匣子里抱出来,在船舱里给她上发条,和她说话。糟糕的是,这艘船遇到了坏天气,迷信的船员们被笛卡尔单人房间里传来的谈话声吓坏了,他们怀疑这是某种不祥的巫术。船长与甲板上的工人在哲学家睡觉时闯入他的船舱,打开匣子并发现了可怕的东西(据传Francine能按照自己的意志坐起来)。于是,被吓坏了的船员们抓住了人偶Francine,把她带到甲板上砸成碎片扔进海里。
从Francine的黯淡结局到Sophia的精彩亮相,人类对机器人的态度一再成为格式塔心理学家Kurt Lewin趋避冲突(approach-avoidance conflict)理论的注脚。即,一方面幻想它们成为忠诚、可靠的机械助手,甚至心上人,另一方面又害怕技术失控,使人类自身被奴役或取代。我们不妨将其分别称为Francine问题和Sophia问题。前者问的是,公司会使用像Duplex这样的技巧,劫持我们的人性短板和情感漏洞,让我们爱上他们的物品吗?当你家新iPad屏幕被打碎时,你会感到心碎吗?正如有人考证的那样,在Francine被砸碎并扔到海里不久后,笛卡尔就因为无法再次面对失去她的刻骨悲痛而去世。后者问的是,如果机器人的类人特征导致人类对同胞的人性变得难以置信,那么之后会发生什么?你知道你可以作为一个主观的自我来思考和感知世界−但你怎么知道他人不是没有灵魂的僵尸(zombie)?图灵奖(Turing Award)得主Yann LeCun在Twitter上公开嘲讽:“Sophia之于AI,就像魔术之于真正的魔法。或许我们应该将其称为‘对AI的货物崇拜’‘AI界的波将金村’或者是‘AI版的《绿野仙踪》’。”如果我们接受Sophia拥有他心(other minds),那么沙特阿拉伯授予她公民权的决定不禁让人联想到船长对Francine的评价:“她像一个有灵魂的女人一样工作得足够好−意思是不怎么好。”上述趋避冲突构成了社会机器人(Social robots)的他心之问−我们在社会环境中如何感知或接受这些机器人,并与之进行有效的人机互动,当前的人工智能界究竟已经了解了多少?世界各地的主要研究机构,包括欧盟委员会和美国国家科学基金会,旨在加强其在支持机器人发展方面的作用,明确提出将机器人融入社会各个部分的战略愿景,这凸显了机器人在人类社会中预期渗透的重要性。同样,包括Facebook、Amazon和Google在内的跨国公司,以及无数较小的初创公司和中型科技公司,都在继续投入大量资金用于发展人工智能和机器人技术。人工智能体在社会环境中的存在会越来越普遍。对于社会机器人的设计与研发而言,深入了解人类社会认知在感知、与人工智能体沟通或合作时的灵活性和适应性问题迫在眉睫。目前,来自实验心理学、社会神经科学、计算机科学和机器人学的研究兴趣,推进了人类如何与人工智能体互动的问题。这些研究随着技术的进步得到了极大提升,但上述学科间仍亟需更深入、更具建设性的对话和合作。
以往的研究更多集中在人类思维与社会智能技术对接时遇到的某一方面的挑战或机会,而本文旨在整合这一新兴领域最前沿的科学观点和发现,提供一个系统的、多维的考察,阐释与这种技术的互动对人类感知、认知和行为的影响。在此基础上,促进探索人机交互领域的不同学科之间的建设性和批判性对话,这不仅能提升我们对人机关系的理解,还能为未来的研究阐明一个交叉学科的议程。在更广阔的认识论层面上,我们尝试展示一个认识论框架,从人类和机器人社会能力的角度出发,描述和研究不同层次的人机互动,从基础到复杂,跨越行为、大脑和社会认知层面。文章重点探讨人机互动与社会认知的互惠约束,阐发社会神经科学和心理学的严格实验方法如何应用于我们感知并与人工智能体进行社会互动的研究中。这一新兴的研究领域不仅可以深化对人类与人工智能体互动的神经认知机制和后果的理解,还有望为开发日益复杂的社会机器人提供启迪,有助于澄清人类与机器人之间形成社会关系的潜力和限制。
二、HRI与社会认知的互惠约束
越来越多的机器人创业公司正专注于开发家庭伴侣机器人或辅助机器人,以在复杂的、与人互动的环境中提供服务,包括学校、医院和养老院。虽然能够承担日益复杂的社会角色的机器的开发进程不断加快,但支持与这些机器进行社会交往的认知和大脑机制在很大程度上仍然是未知的。增强对人类与社会机器人互动的心理学和神经生物学基础的了解,有助于设计和编程具备社会参与性和协作性的人工智能体。同样关键的是,利用这种对人机互动的理解,进一步了解相应神经认知过程的灵活性和局限性。人机互动的认知和脑机制的研究是一个刚刚起步的领域,它面临着一些独特的挑战。例如,人工智能机器的范围很广。从小型的手持设备(如智能手机和恒温器),到形态上熟悉(或不熟悉)且可以自主行动的机械装置(如jibo、卡车造型Cozmo和显微镜造型Vyo),再到自主的类似宠物的机器人(如海豹Paro和狗MiRo),一直到真人大小的类人形机器人(humanoid)(一般只需要有机械臂和视觉系统就可以,如Buddy和origin)和人形机器人(android)(如Alexa、iCub、Pepper、Sophia和jia-jia),表明这项工作代表了一个高度可变的空间。因此,与不同形态和功能的机器人的互动可能涉及一系列不同的心理过程,使得“一招鲜吃遍天”的认知类型变得不太可能。此外,即使是最复杂的社会机器人,除了与动物和人类等有生命的智能体共享特征外,还与无生命的物体和初级机器共享特征。因此,在明确的分类基础上划分的环境的典型认知分界线被打破。当我们试图理解大脑如何构建指导与人工智能机器互动的心理表征时,一个特别的挑战出现了。
(一)HRI拟人化的社会认知之维
在科幻小说中,人工智能计算机或机器人,即使没有被编入人类情感的程序,也常常自发地体验到这些情感。例如,《黑客帝国》中的史密斯特工(Agent Smith)受到了对人类“厌恶”的影响。这是因为人工智能的出现颠覆了人类种系发生的演化心理与个体发生认识论上关于生命、心灵与理性的等级分类法:岩石(非生物)→植物(生物)→动物(有心灵)→人类(有理性)。在互动过程中,人们经常赋予机器人或计算机一个不必要的社会角色。这种倾向有着非常古老的认识论根源,也被称为拟人论(Anthropomorphism)。即,人类在情感上、智力上和生理上都偏向于社会活动,因此当出现哪怕是微小的社会线索时,深陷其中的社会反应就会被自动触发。目前还不完全清楚人类是何时发展出在他人身上看到自己的这种能力的。一种猜测认为,在大约4万年前的旧石器时代中段向上段的过渡中,我们的文化以及我们与动物和自然的关系发生了变化,拟人化已露端倪。
在20世纪40年代的一项开创性研究中,心理学家Heider和Simmel向被试展示一部黑白电影,其中简单的几何形状在屏幕上移动。当要求被试描述他们所看到的东西时,几乎每一个人都将这些形状解释为是带着能动性和目的而移动的。他们通过假设意图和动机来描述三角形的行为,和我们描述人们行为的方式如出一辙。他们中的许多人甚至围绕着移动的形状创造了一段复杂的故事。一位被试报告说:“一个男人计划去见一个女孩,女孩和另一个男人一起来了,女孩很担心,在房间的另一边从一个角落跑到另一个角落……正当二号男子把门打开时,女孩突然冲出房间。两人一起在屋外追来追去,后面跟着一号男子。但他们最终躲开了他,逃走了。第一个男人回去想打开门,但是他气急败坏,以至于无法打开它。”
在20世纪80年代个人电脑席卷全球之际,研究人员对人们围绕这些新的、广泛的电子产品的行为产生了兴趣,科技公司也投入到了如何为其产品的用户创造高效和积极的互动中。这催生了一个关于人们如何与计算机交流的研究领域−人机交互(human-robot interactions,HRI)。Nass和Reeves等通过数百项研究发现,甚至不需要构建一个角色就能让人们把计算机拟人化。例如,在其中一项经典实验中,他们将被试分成三组:一组在他们完成任务的同一台计算机上对它们的表现进行评分;一组在另一台计算机上对表现进行评分;一组在纸上进行评分。被分配到同一台电脑上的小组对电脑性能的评价比其他两组要积极得多。研究人员能找到的唯一解释是,人们不想伤害计算机的感情。他们的结果表明,被试将计算机视为一个社会行为者,并自动应用与他们在任何其他社会互动中相同的规则。例如,他们是有礼貌的。到目前为止,HRI领域的很多研究都显示了关于机器人的相同趋势:人们在与机器人互动时,会无意识地应用社会惯例。从不喜欢不“友好”的机器人,到更愿意与它们合作,甚至在别人对它们做出残忍行为时感到歉意。
HRI研究也表明一些人工智能体因为没有处理好拟人化问题而误入歧途,并在一段时间内不明就里。微软的前办公助手Clippy可能是有史以来最令人讨厌的动画人物之一。这个眉毛飘忽不定的卡通回形针本来是很有用的:如果它的软件检测到用户以“亲爱的”这个词作为文件的开头,Clippy就会弹出来,主动帮助写一封信。但是,人们对屏幕上“有帮助的”回形针的敌意招致许多投诉,并引发了很多对病毒备忘录和Clippy配件的贬低意见。Nass的研究帮助微软找到了问题所在:用户讨厌Clippy是因为他们认为Clippy是一个社会智能体,而不是一个工具,他们期望回形针能遵循社会惯例。而事实是,它的社交行为很糟糕。它不断地烦扰人们,不理解他们,像一个监视他们的唠叨者,而不是一个友好的工具。如果将拟人化的特征纳入计算机或机器人,以实现人类更熟悉的“社会”互动,这将会助力HRI更加流畅。
进一步的,HRI中的拟人化不仅仅是在非人类的智能体人和物体上看到人类的特征(如眼睛或手)(例如,类人形机器人Buddy和人形机器人iCub),其过程必然还包含积极地将人类的心理状态(如情绪、意向性)归因于非人类的智能体或机器人。我们推断和预测他人心理状态的能力,如他们的意图、信仰和情绪,塑造了我们正在进行的社会互动。这个过程被称为心智理论(theory of mind)或心智化(mentalizing),也是人类社会生活的基础。显然,在拟人化过程中,类似的心理状态归因针对非人类的智能体和对象,积极地促进了人类与这些智能体和对象的接触。因此,拟人化也可以被视为心智理论对非人类智能体的延伸。为了成功地使非人类智能体的行为人性化或拟人化,依靠与理解智能体的意图时使用了类似步骤,这暗示了拟人化与心智理论密切相关。拟人化不仅是由感知因素(例如,刺激线索如脸的存在)驱动的,还由观察者理解和预测环境的动机驱动。这种效果动机可能与探索和掌握环境有关。例如,在观察一个不熟悉的机器人的行动时,效能动机(effectance motivation)会影响人的兴趣和解释。Waytz等人的一系列实验表明,这种理解和预测世界的需要增加了拟人化,而拟人化反过来满足了这种需要。效能动机对感知他心至关重要,因为这种动机不仅推动了与非人类智能体人和物体的互动,也推动了与其他人类的互动。对另一个人行为的预测是心智理论及其基础神经网络的核心。正如Heider所描述的那样,从差异中提取不变性,从智能体的行为中推断出意图和情绪,是人类社会认知的一个基本特征。心智理论和拟人主义都是实现这一目标的方法。
(二)HRI与第二人称社会互动
HRI中的拟人化现象牵涉出心智理论问题,由此衍生而来的一个更实际的问题是,在生活世界中我们接触到机器人的方式并不是像好莱坞电影一般只呈现在巨大的屏幕中,而是期待与其产生活生生的照面。这意味着相关人工智能的模拟方法,即我们的社会心智和社会行为模型的实现方式,已经从机器人扩展到更广泛的“人工社会实体”(artificial social entities)类别,包括将屏幕上或共享虚拟环境中类人形演员的图像表征也纳入虚拟智能体的范围内。在技术实施方面,人工智能体(包含软件与硬件)和机器人之间存在共同点,即它们都需要模拟“人工社会智能”,以使它们能够处理人类的社会行为,并产生有意义的社会反应,引起人类的感知和归属,能与其他人类所引起的相媲美。然而,研究者又必须承认,机器人和智能体在基本的经验方面并不相同。不同于软件智能体,机器人是占据一定物理空间与位置的物体,它与人类智能体共享物理世界。机器人和人类的共同参考系统是真实的物理世界,两者共享了位置、距离、物理属性,可以实现真实的碰撞、触摸。
对此,我们可以从被观察到的社会信号的转化过程,反思第二人称互动对于HRI的深刻意义。在第二人称互动中,社会信号被定义为一种刺激物,它将信息从一个个体发送到另一个个体,使发送者和接收者都能受益。而提示是一种只对接收者有利的刺激。例如,我呼出的二氧化碳对想进食的蚊子而言是一种提示,但对我没有好处。
社会信号框架(Social signalling)提出,如果某种人类行为是一个社会信号,它必须满足两个基本标准。首先,发送者必须产生该行动以影响接收者。其次,该行动必须对接收者产生有利影响。重要的是,为了测试第一个标准,研究者可以改变接收信号的观众的存在。如果一个行动在发送者能被看到时被执行,而在发送者不能被看到时被抑制,就有证据表明该行动被当作信号使用。为了检验第二个标准,研究者必须评估当接收者感知到该行动时,他们的行为或心理状态变化情况。即,接收者在收到信号时是否改变了对发送者的态度?需要注意的是,接收信号应该对接收者有利,因为他们获得了关于社会世界的信息,即使这些信息是负面价值的(例如,得知另一个人是敌对的)。
总的来说,社会信号框架采取了一种渐进的方法,从发送者和接收者之间的信号交流来理解社会互动。比较一个单独的任务(例如,一个被试对机器人的反应)和一个动态的社会互动(例如,两个被试的对话)之间的认知过程是非常复杂的。例如,观看另一个人的照片或电影时,对方可以看到自己。这可能只涉及社会感知的过程。相比之下,看到另一个人并面对面地交谈,这意味着考虑对方能看到什么是可能的,并且具有重要的社会价值。这可能涉及知觉的心智化、自我反思、行动模拟和社会决策等过程。
社会信号建立在第二人称神经科学(second person neuroscience)的基本前提下,即与仅仅旁观相比,参与社会互动涉及额外的神经认知过程和社会动态。互动双方的大脑会绘制出一个具体的框架,以建立两人互动背景下的可测试假设。社会信号表明,我们需要研究和理解表演者(发送者)和观察者(接受者)的互动行为。通过使用被看或不被看的简单操作(即改变观众/接收者的存在),我们可以测试哪些行为被用作信号,并定义信号可能携带的信息内容。反之,通过改变一个社会信号的存在,我们可以测试这个信号对接收者有哪些影响。
那么,人类用户与机器人在第二人称互动中如何实现对彼此社会信号的解释?机器人如何从人类行为的观众转变为合作者?对此,Matsuda等人开展的一项经典研究可以帮助我们开启解答上述问题的思路。
该研究使用近红外光谱(NIRS)来评估类人机器人(Robovie)的人类相似性。由于人类镜像神经元系统(mirror neuron system,MNS)的活动被认为反映了被观察者的人类相似性,研究者比较了观察人类和机器人所做动作时的MNS活动,研究包括7名男性和10名女性被试,并最终对其中的14名被试进行了分析。NIRS探针被放置在双侧运动前区和初级运动区,它们是MNS的组成部分。在观察条件下,刺激物在现场或视频显示器上呈现,分为四种条件,即现场−人类、现场−机器人、视频−人类和视频−机器人。观察条件结束后,被试自己执行与观察条件下人类智能体所做的相同的动作(执行条件)。研究者确定了在观察和执行条件下都会引起明显激活的NIRS通道,并利用这些信息来确定反映MNS活动的可能区域,结果发现智能体(人/机器人)对MNS活动没有明显的影响,这表明无论智能体是人/机器人,运动相关区域的MNS反应都是类似的。然而,在少数通道中发现了呈现方式(现场/视频)的影响。对应于左腹侧前运动皮层的两个通道在现场条件下比在视频条件下的激活更强烈,特别是当智能体是人类时。相反,只有当智能体是机器人时,对应于右侧初级运动皮层的一个通道在视频条件下比在现场条件下激活得更强烈。这些发现表明,现场演示的行动所具有的第二人称特征对于揭示实际情况下HRI中人类真实大脑的活动是必要的,这将直接影响HRI的流畅性甚至有效性。在未来社会机器的开发与设计中,重要的是要考虑哪些操作算作被观看,哪些操作算作不被观看,以此来推断哪些操作涉及观众效应的额外认知过程。例如,当一个被试与另一个活的人类智能体进行面对面的对话时,很明显他们正在被观看,而一个被试在房间里(没有摄像头)独自观看电脑上的一双卡通眼睛,可能会看到一个类似人脸的图像,但其本身并没有被观看。如图1中的例子所示,可以把人类互动空间划分为X轴上的可见刺激物特征(如眼睛的图像),和Y轴上的自上而下的背景知识。面对面的对话包括对另一个人的视觉线索和他们是真实的、正在观看的知识(图1A),所以观众效应应该是活跃的。相反,观看卡通眼睛的人只有极少的视觉线索和他们没有被观看的知识(图1E),所以观众效应不活跃。从图中可以发现,处于B、C、D所在白色区域的机器人在界定社会互动中被观察属性时存在模糊性。这部分归因于前文提到的拟人化问题,但更深层次的问题是我们的大脑在感知机器人的社会属性上存在困难,由此也引发我们重新审视HRI的认知和脑机制框架。
图 1 社会神经科学研究中使用的常见刺激物
注:在二维空间中沿着自上而下(Y轴)和自下而上(X轴)的特征谱系表征。图中右上角的研究明显涉及“被观察”(A),而左下角的研究则没有(E)。白色区域的研究可能更加模糊(B-D)。
三、HRI的社会神经科学
(一)拟人化HRI:非言语交流的多维空间与特征相似性
相比之下,我们对如何感知和分类人工智能机器的理解仍然有限,更不用说社会机器人了。原因如下。首先,HRI的认知神经科学是一个新的研究领域,其研究计划处于起步阶段。其次,与人类、房屋和动物之间的划分相比,一旦涉及机器,尤其是人工智能的社会机器人时,明确的分类并不那么容易达成一致。关于机器人的“社会性”或“智能”的定义是模糊的,见仁见智,目前只能给出各种粗略分类。与物体和工具相比,机器有自动化的功能,但即使是最复杂的机器,它和人类之间也存在一道客观的界限。尽管如此,在松散定义的类别内和类别之间,机器的种类在尺寸、形状、运动轮廓和预期用途或目的方面是庞杂的。这种变化的重要性如果被忽视,就会对HRI研究的可操作性构成威胁。对此,Cross和Ramsey基于人类社会认知的视角,尝试给出一个系统维度,对物体、社会机器人和人类进行比较。它包括八个方面:先验经验预期、自动化的功能性、功能性指令系统(functional repertoire)、形态−功能的映射、尺寸、类人形态或运动、社会性、智能等。这些维度的辐合,基本可以覆盖智能手机、类人形机器人到人形机器人的分类。
在认识论上,人工智能并不是要规定哪些维度在特定的环境中是最重要的,因为维度的发展和验证需要相关领域的大量研究工作。事实上,被评估的单个特征本身可能是非线性和多维的,其重要性取决于一个人的研究问题,以及复杂的背景因素,如何将机器人介绍给人类,必然涉及他的年龄、性别、文化甚至宗教背景,以及他们对该特定机器的看法。
人类的感知通常被理解为一个多维“空间”,它映射了一系列的特征,包括面孔、身体和人格特质。在社会机器人研究中,将高阶广义分类与低阶特征(包括非社会特征)映射相结合,可能有助于建立对机器更准确的预期。例如,一个智能体可能看起来像人,但社交能力有限。例如,虽然Kondomoroid在尺寸和类人形态或运动两个维度上表现很好,但在社会性、自动化的功能性等其他六个维度表现不佳。与之相反,另一些社会机器人,虽然有类似人类的肢体,却无法复制生物运动(囿于尺寸和类人形态或运动两个维度上的缺陷)。不过,它们的社会性和自动化的功能性却远胜于前者,例如,机器人Pepper和iCub。因此,上述维度与特征组合对人类感知机器人具有重要意义,因为一个智能体可能在一个维度上相对像人类,但在其他维度上却完全不像。这很可能以迄今未知的方式影响人类的认知加工及其脑与神经机制。
与任何新的研究领域一样,研究人类与社会机器人的互动可以从其他研究领域的成功和失败中吸取经验。首先,就跨智能体的特征相似性而言,存在一种认识论风险。例如,人们可以拿一个物体(铁盒子),加上人类的特征(一双眼睛),然后在某种程度上考察我们与这个盒子互动和与他人互动的加工机制之间的相似性。然后,我们会将无意义的活动解读成有意义的互动。因为通过拟人化,物体已经被赋予了人类的心理品质。如同上文Heider等的实验揭示的那样,简单的形状可以被感知为具有类似人类的品质。
进一步支持拟人化和心智理论之间关系的证据来自神经影像学研究。这些研究表明,当个人进行拟人化时,激活的大脑区域包括被认为是心智理论网络一部分的区域。这个网络由双侧颞顶联结(TPJ)、楔前区和MPFC的部分区域组成,并牵涉到研究我们如何理解和预测其他智能体的心理状态的任务。例如,TPJ的部分不仅在标准化的心智理论任务中被激活,而且在观察非人类的社会动画时也被激活,这些动画可以触发对自主性(agency)、意图和其他心理状态的归因。最初的证据表明,这些区域的活动与更直接的拟人化测量之间存在联系。有趣的是,这种联系存在个体间差异,报告动画人物的运动是源于生物的倾向性增加的个体,其左侧TPJ和楔前叶的活动会比较高。这暗示,上述心智理论网络的区域内和跨区域的活动,有可能在那些更可能将人类心理状态归因于机器人的个体身上得到加强。
然而,相反的证据来自潜心智化(submentalizing)的研究。有研究比较了一个社会性刺激(如眼睛注视、身体面向)和一个非社会性刺激(如箭头),它们都有一个共同的特征(方向性提示)。两者在方向性提示的认知加工方面应该有一些相似性。身体或箭头朝左或朝右的偏向也会影响对空间中的位置进行判断的速度。当然,这并不意味着这些刺激物是相同的。它只是意味着它们部分地共享一个方向性线索。当人和箭头被设置在现实世界的背景中时,就更容易看到来自人和箭的方向性线索如何以不同的方式运作,例如社会线索支配着箭头的线索。因此,Cross和Ramsey认为,社会认知研究中的特征相似性是在设计和解释HRI研究时需要考虑的一个重要研究方向。
(二)第二人称HHI和HRI的神经机制比较
与专注于屏幕上静态机器人图像的工作相比,在第二人称的具身情境中开展社会机器人的研究对推进HRI研究至关重要。为了理解人们如何感知社会机器并与之互动,比如社会机器人领域旨在开发的那些机器,将这些机器置于我们在日常生活中可能遇到的更广泛的实体背景下是非常有用的。我们可以将机器看作物理存在于世界上并执行特定任务的物体和工具的一个子类。大量的认知神经科学研究描绘了人脑对感知和分类环境中的突出刺激物的反应,包括人脸、身体部位、物体和工具。这方面的工作一般都趋向于发现,物体和工具的感知需要一个核心的神经网络,包括运动前区、顶叶区、枕外侧区和颞叶区。社会神经科学的研究也表明,社会互动是由一个分布式的神经网络支持的,该网络横跨感知、情感和调节功能,支持我们与物体和工具互动的神经网络有部分分离的假说。因此,理解我们如何感知物体、工具和有生命的人并与之互动方面的进展的前提是,理解与不同实体的互动是由部分可分离的神经认知系统处理的。当前只有极少的研究开始关注上述问题。例如,Rauchbauer等人使用第二人称神经科学的新型功能性磁共振成像(fMRI)范式,比较了人类的社会互动(人−人互动,HHI)、人类与对话机器人的互动(人−机互动,HRI)。该范式确保在与人类和机器人互动伙伴对话时,社会互动任务的生态效度得到最大限度的提高。社交互动包括被扫描的被试与人类或机器人智能体之间开展1分钟的现场双向讨论,比较HHI和HRI之间的神经活动,同时采集被试的生理(依赖血氧水平、呼吸和外周血流)和行为(所有对话者的讲话记录、扫描被试的眼球追踪、人类和机器人智能体的面部记录)数据。
研究者期待被试在与人类(与机器人相比)互动时,其心智化过程和社会动机会增强。心智化要求对人类与机器人交互伙伴采取Dennett的意向立场(intentional stance)。这与内侧前额叶皮层(MPFC)的一个区域−旁扣带回皮层(paracingulate cortex)的激活有关。早先的心灵哲学一般认为,人类不会对机器人、计算机和更普遍的人工智能体采取意向立场。近期的实验室证据显示,HHI期间,人类被试与心智化有关的脑区活动增加,包括MPFC和TPJ等。那么,HRI期间,人类被试与心智化相关的颞部和MPFC是否也会产生激活?
实验结果证实了上述假设。与机器人相比,与人类同伴的互动显示了颞叶皮层的激活,包括双侧TPJ,以及下丘脑、丘脑、海马体、杏仁核和丘脑下区的皮层下区域的激活。在以往比较人类和机器人互动的研究中,已经报道了TPJ和下丘脑的激活。当明确将人类的意图赋予机器人的行为时,TPJ被激活了。考虑到下丘脑亚核释放的催产素,在HHI与HRI期间,下丘脑的激活与社会动机的增强有关。与金钱奖励相比,杏仁核的激活与社会性密切相关。它是一个处理情感和社会性相关信息的关键神经节点,对社会刺激的突出性、奖励和价值进行编码。这意味着人类在HHI和HRI过程中都会使用意向立场。
已有研究将表征相似性分析应用于fMRI数据,研究者在被试观看三种智能体(人类、人形机器人和机械外观的机器人)执行不同动作时收集这些脑成像数据。结果显示,大脑中的动作观察网络(action observation network,AON)的不同节点表征了这些动作的不同方面,而且这些表征似乎是层级化排列的。具体来说,枕颞区对低层次的动作特征(如形态和运动整合)进行编码,而顶叶区对更抽象的和语义内容进行编码,如动作类别和意图。
如果将上述研究与Rauchbauer等的发现整合起来进行分析,可以得到如下的初步结论:观察、推断和预测非人类智能体和物体的内部状态可能部分地依赖于低层次过程,这些过程与遇到人类智能体时的活跃过程不同。拟人化的两阶段过程表明,这些早期的低层次感知过程在后期通过使用来自心智理论的语言得到补充。拟人化可能是一个基本感知过程的最终结果。推断和理解智能体的行为是一个复杂互动预测过程的混合物,即从感知过程(如行动观察和预测)到类似心智理论的过程。这意味着,与非人类智能体的互动可能会触发非社会性过程,或者与人类智能体互动时活跃的过程不一一对应。这也进一步印证了重新审视HRI社会神经科学框架的价值。
四、机器他心的未来
以社会神经科学为基础的人与机器人互动在改变社会机器人面貌方面取得了重要进展,同时也加深了我们对人脑的理解。除了在基于屏幕的实验中感知机器人外,越来越复杂的分析方法和在与机器人的实时、具体互动中收集数据的趋势,可以加深我们对支持社会认知核心机制的认识。这种针对HRI神经科学研究的额外好处之一是,它可以为下一代社会机器人的开发和设计提供洞见。
社会机器人最终可能成为提供支持和照顾的社会伴侣。尽管如此,近十多年来对人类与机器人互动的神经科学贡献表明重大问题仍然存在。例如,(1)人类大脑的复杂神经机制如何支持我们与这些新奇的机械伙伴的互动?(2)随着机器人更深入地融入我们的社会生活,社会认知的表述如何变化?从结合人类神经科学和社会机器人学的研究中得到的启示,将为我们在社会层面上与自主机器人共同生活做好准备。
开发HRI的研究需要来自社会和认知心理学、社会神经科学、发展心理学和发展机器人学以及伦理学等不同学者和学科的专业知识和贡献,并开展持续对话。例如,为了建立可以在社会机器人上实施的社会认知计算模型,社会神经科学需要与人工智能和机器人学相结合。为了开发用于HRI的自然语言处理,计算语言学必须与社会机器人学联系起来。心理学研究需要与人工智能建立更紧密的联系,这样才能开发出社会信号处理的方法。由此衍生出一系列问题。例如,随着该领域向自然交互方向的发展,以前在实验室里对机器人进行被动观察的发现,会在多大程度上影响机器人的发展?实验室对机器人的被动观察(无论是在现场还是在屏幕上)在多大程度上可以复制和推广到现实世界?为了在社会环境中发挥作用,机器人是否需要作为社会智能体来构建?还是在某些情况下(如老人护理),社会机器人仅仅作为一种服务于人类中心主义的“工具”。
对这些问题的反思,重新开启了研究者对物理具身机器人(physically embodied robots)的发展或与之互动的关注。事实上,除了人工智能在数字领域的影响,许多最紧迫的社会问题也会对物理具身人工智能体在社会空间(如产品制造、教育、医疗)中的应用产生影响。对物理具身的社会机器人的关注为该领域提供了一种独特的视角。特别是对心理学和神经科学来说,人类或人工智能体的数字或虚拟表现经常被用来研究社会感知和行为。大多数关于HRI的研究都聚焦于真实和互动的循环,人类智能体的行为会引发机器人的反应,而机器人的反应又会引发人类智能体的行为后果,循环往复。对物理具身的社会机器人(或人类)的关注是走向真正理解人类社会行为的关键。在讨论HRI和旨在渗入人类(社会)环境的机器人时,我们不能忘记讨论机器人的社会影响,以及伦理和道德影响的重要性。今天研究人员的愿景是设计出能够协助我们做日常家务、医疗保健和老人护理的机器人,但这只是HRI的一些应用实例。我们还需要解决一连串重要的问题:在生活的各个领域,机器人能否替代“人情味”(the human touch)?它将如何改变我们的社会关系?我们在与机器人伙伴的关系中会形成什么样的情感联系和价值承诺?在与机器人同伴或助手长达数十年乃至几个世代的持续互动中,Francine问题和Sophia问题是否可以得到彻底的消解?这些问题仍然是开放的。希望本文能够激发我们深入反思人机互动时代产生的这些问题,在严格的科学方法与缜密的哲学论证的相互启发中探索解决之道,迎接人工智能体全面参与我们日常社会生活的新纪元。
〔 本文为国家社会科学基金一般项目“他心直接感知的神经哲学进路研究”(21BZX005)的阶段性成果〕
【点击图片查看2023年第6期目录及摘要】
扫描右侧二维码关注“学术月刊”微信公众号
责任编辑:
相关知识
人工智能与社会认知(专论) | 陈巍:机器遭遇他心: 人机互动时代的社会认知
基于媒介可供性的宠物直播受众的情境认知与情感代偿
“聪明动物”背后的认知研究(开卷知新)
【无标题】读书笔记之《智能化社会:未来人们如何生活、相爱和思考》
家犬(Canis familiaris)在社会认知、抑制控制和空间问题解决能力方面的品种差异
传媒观察丨元宇宙与拟态现实下的身体认同焦虑
了解动物的行为选择与社会干预.pptx
为导盲犬“放行” 转变公众认知是关键
不能管家的AI机器狗不是好宠物?
鸟类行为学与社会规律研究.pptx
网址: 人工智能与社会认知(专论) | 陈巍:机器遭遇他心: 人机互动时代的社会认知 https://m.mcbbbk.com/newsview73744.html
上一篇: 潦草小狗雪纳瑞:一种适应性强的理 |
下一篇: 租房养宠物需要注意哪些事项? |