Meta的AI在外交中智胜人类玩家——第一个做到这一点的AI

广告

CICERO是第一个在流行的战略游戏《外交》中达到人类水平的人工智能(AI)代理。《外交》以其深刻的战略玩法和玩家在追求个人目标的同时需要共同努力而闻名,这在AI中被视为几乎不可能的挑战。

这是因为它要求玩家理解人们的动机和观点,制定复杂的计划和调整策略,并使用语言说服人们结成联盟。

在玩游戏时,CICERO的得分是人类平均水平的两倍多,在玩多局游戏的玩家中排名前10%。CICERO在《Diplomacy》中使用自然语言的熟练程度甚至导致其他玩家更喜欢使用它而不是其他人类参与者。

通过将强大的人工智能模型与战略思维和自然语言处理相结合,Meta CICERO可以胜过任何其他虚拟或人类玩家。

CICERO标志着人工智能新时代的开始,它可以通过战略推理和自然语言处理与人类在游戏中合作,从这样的技术中学习有一天可能会导致智能助手可以与人类合作。

虽然CICERO只能玩外交,但其背后的技术与许多其他应用相关。例如,目前的人工智能助手可以完成简单的问答任务,比如告诉你天气。

为了开发这一独特的技能,Meta的团队首先根据从互联网上抓取的文本对机器进行了27亿个参数的训练,然后进一步调整了来自webDiplomacy.net的4万多个人类互动。

通过开源代码和模型,我们希望人工智能研究人员能够继续以负责任的方式建立我们的工作。虽然这是一项了不起的创新,但它也有一些风险。它可以被用来通过冒充人和误导人来操纵人类,这可能是危险的,这取决于上下文。

虽然风险无法完全消除,但Meta已经致力于检测和阻止在训练系统时摄入的在线文本可能产生的“有毒信息”。

广告

留言回复

您的电子邮件地址将不会被公布。必填项被标记*