OpenAI称GPT-4可以在SAT考试中击败90%的人类-奇迹

周二，OpenAI公布了其主要大型语言模型GPT-4的最新版本，该公司声称该模型在各种专业测试中显示出“人类水平的表现”。新的模型ChatGPT-4比以前的模型更大，在更多的数据上进行了训练，在模型文件中有更多的权重。因此，它的运行成本更高。

放大模型在人工智能研究人员中越来越受欢迎，该领域最近的许多进展都证明了这一点。这种方法包括在数千台超级计算机上运行更大的模型，训练过程可能耗资数千万美元。GPT-4就是这种方法的一个例子，它旨在获得更好的结果。

OpenAI使用微软Azure训练ChatGPT-4，因为微软已经向这家初创公司投资了数十亿美元。然而，OpenAI没有透露任何关于训练中使用的具体模型尺寸或硬件的信息，理由是竞争格局。

微软表示，必应的人工智能聊天机器人使用GPT-4。GPT-4的最新版本提供了新进展的预览，这些进展可能在未来几周内开始渗透到聊天机器人等消费产品中。

OpenAI宣布，他们的最新模型GPT-4预计会产生更少的事实错误答案，并且在对话中不太可能偏离主题。事实上，该公司声称，在许多标准化测试中，GPT-4有望比人类表现得更好。

根据OpenAI的数据，GPT-4在模拟考试中取得了令人印象深刻的成绩，在模拟律师考试中排名第90位，在SAT阅读考试中排名第93位，在SAT数学考试中排名第89位。

然而，OpenAI也承认，新模型还不完美，在许多情况下不如人类。例如，GPT-4仍然会产生幻觉，它会根据不完整或不准确的信息做出反应。OpenAI表示，新模型还倾向于在实际错误时坚持自己是正确的。

尽管存在这些限制，OpenAI认为GPT-4比其前身GPT-3.5更可靠、更有创造性，并且可以处理更细致的指令。

新模式将提供给付费ChatGPT订阅者，并作为API的一部分，允许程序员将AI集成到他们的应用程序中。OpenAI计划对750字左右的提示信息收费3美分，对750字左右的响应信息收费6美分。