ChatGPT刚刚在一次测试中从D级升到了A级——这位教授感到震惊

广告

乔治梅森大学经济学教授布莱恩•卡普兰表示,ChatGPT在短短三个月内就取得了显著进步,在他的经济学测试中,ChatGPT的分数从D提高到了a。

Caplan对ChatGPT的进步感到惊讶,这可能导致他输掉了他人生中的第一个大赌注。今年1月,卡普兰将秋季期中考试中的问题交给了ChatGPT,测试学生对经济学的理解,而不是要求他们死记硬背课本上的信息。

旧版本的ChatGPT得分为31分(满分100分),相当于D,远低于卡普兰50%的中位数。他们的回答显示出对比较和绝对优势等基本概念缺乏理解,而且更多的是政治性而不是经济性。

ChatGPT的平庸表现也让其他学者感到失望。尽管它在1月份通过了沃顿商学院(Wharton Business School)的考试,但其教授表示,它在简单的计算上犯了“令人惊讶的错误”。Caplan对ChatGPT的回答非常不满意,以至于他打赌,在2029年之前,人工智能模型在他的七次考试中不会有六次得到A。

然而,ChatGPT-4已经取得了显著的进展。卡普兰被73%的分数惊呆了,这相当于A,是班里最好的分数之一。ChatGPT的付费升级旨在解决测试版GPT-3.5的一些早期问题,使其返回准确响应的可能性提高40%,并能更好地处理更细微的指令。

ChatGPT的改进对Caplan来说是显而易见的,因为它能够对他的问题给出明确的答案,理解之前挣扎的原则,并且在解释和评估保罗·克鲁格曼等经济学家倡导的概念方面得分完美。

卡普兰说:“我唯一能说的是,情况似乎好多了。”

卡普兰现在对机器人进行了从未见过的新测试,它的表现甚至比之前73%的分数还要好。

因此,卡普兰更有信心赢得下一个与人工智能相关的赌注。他目前与人工智能末日论者埃利泽·尤德科斯基(Eliezer Yudkowsky)打赌,后者曾与ChatGPT的创造者萨姆·奥特曼(Sam Altman)发生过冲突。他们打赌,人工智能将在2030年1月1日前导致世界末日。

他说:“我可能会输掉这场人工智能赌注,但我完全愿意再赌一堆世界末日的人工智能赌注,因为我认为这些人疯了。”

广告

留下回复

你的电邮地址将不会公布。必填字段已标记