开发能够识别自然人类语言的论点并参与辩论的计算机系统是一项重大挑战。人工智能 (AI) 领域最严峻的挑战之一。
现在在自然 IBM以色列研究人员的科学家Noam Slonim报告了该领域的惊人发展: 项目辩论者,一种可以与人类参与辩论的人工智能系统。 知道如何争论的AI。
结果以他们自己的方式令人惊讶,表明了该领域的研究已经走了多远。
不到十年前,分析人类语音以确定使用主题来支持结论的方式远远超出了计算能力。
从那时起,人工智能技术的进步和工程日益成熟(以及不断增长的商业需求)的结合导致了快速扩张。
全球有50多个实验室正在研究此问题,其中包括来自所有主要软件公司的团队。
因为要开发出能够与人类辩论的人工智能绝非易事
争论和论点的结构太过多样,太复杂,太细微差别,而且往往掩盖不住,以至于不容易被人们所认识。 为此,Slonim决定发起一个巨大的挑战:开发一个完全自治的系统,可以参与与人类进行的现场辩论。
Project Debater是这项工作的高潮。
首先,Project Debater是一项非凡的工程壮举。
这是一项极其雄心勃勃的事业。 与几乎所有瞄准如此高目标的人工智能研究一样,一个关键瓶颈是数据获取。您需要足够多的数据才能计算出有效的解决方案,以应对制造一台可以争论的机器的挑战。
斗士计划(Project Debater)遇到了这一障碍。 它使用两管齐下的方法做到了这一点。 第一,他将注意力集中在大约100个辩论话题上。 第二,即使是按照现代语言处理系统的标准,也可以从大型数据集中收集其原材料。
在2018年和2019年的一系列发行中,Project Debater解决了许多才华横溢且备受瞩目的人类辩论,她的表演得到了听众的非正式评估。
与Project Debater进行辩论的大纲是什么?
在其论证技术的支持和经过处理的数据集的支持下,该系统创建了一段 4 分钟的演讲,就其曲目中的某个主题展开辩论,并由人类对手做出回应。然后,他通过第二次 4 分钟的演讲对对手的观点做出反应。对手用自己的 4 分钟反驳来回应,辩论以双方都发表 2 分钟的总结陈词结束。
也许该系统最薄弱的方面是它难以模仿人类辩论的连贯性和流畅性。
然而,这种限制当然不是 Project Debater 的“错”。
尽管进行了两千年的研究,但该主题的结构仍然鲜为人知。根据研究的重点是语言使用、认识论(知识的哲学理论)、认知过程还是逻辑有效性,对于论证和推理的连贯模型至关重要的特征存在显着差异。
因此,构成一个好的论证的模型非常多样化。 相比之下,构成良好辩论的模型只不过是形式化的见解(尽管将辩论的优点编入法典的学科,如法律,在这方面具有优势)。
因此,难怪 Project Debater 的表现只是通过询问人类观众是否认为这是“一场体面辩论的例子”来进行评估。 对于所讨论话题的近三分之二,人们认为情况就是如此。
Debater 项目是主题技术发展的关键一步。 这些发现提供了一个关于人工智能系统如何工作的诱人视角。 什么? 有了人类可以轻松解释的论点网络。
在假新闻和舆论两极分化之间,人类在复杂话题的创作、处理和分享方面获得支持的需求可能很快就会变得紧迫。
人工智能可以“训练”人类进行辩论(和批判性思维)。
总结:Debater项目面临的挑战是艰巨的,但它也代表了可以促进人类推理的进步。