周二,OpenAI公布了其主要大型语言模型GPT-4的最新版本,该公司声称该模型在各种专业测试中显示出“人类水平的表现”。新的模型ChatGPT-4比以前的模型更大,在更多的数据上进行了训练,在模型文件中有更多的权重。因此,它的运行成本更高。
放大模型在人工智能研究人员中越来越受欢迎,该领域最近的许多进展都证明了这一点。这种方法包括在数千台超级计算机上运行更大的模型,训练过程可能耗资数千万美元。GPT-4就是这种方法的一个例子,它旨在获得更好的结果。
OpenAI使用微软Azure训练ChatGPT-4,因为微软已经向这家初创公司投资了数十亿美元。然而,OpenAI没有透露任何关于训练中使用的具体模型尺寸或硬件的信息,理由是竞争格局。
微软表示,必应的人工智能聊天机器人使用GPT-4。GPT-4的最新版本提供了新进展的预览,这些进展可能在未来几周内开始渗透到聊天机器人等消费产品中。
OpenAI宣布,他们的最新模型GPT-4预计会产生更少的事实错误答案,并且在对话中不太可能偏离主题。事实上,该公司声称,在许多标准化测试中,GPT-4有望比人类表现得更好。
根据OpenAI的数据,GPT-4在模拟考试中取得了令人印象深刻的成绩,在模拟律师考试中排名第90位,在SAT阅读考试中排名第93位,在SAT数学考试中排名第89位。
然而,OpenAI也承认,新模型还不完美,在许多情况下不如人类。例如,GPT-4仍然会产生幻觉,它会根据不完整或不准确的信息做出反应。OpenAI表示,新模型还倾向于在实际错误时坚持自己是正确的。
尽管存在这些限制,OpenAI认为GPT-4比其前身GPT-3.5更可靠、更有创造性,并且可以处理更细致的指令。
新模式将提供给付费ChatGPT订阅者,并作为API的一部分,允许程序员将AI集成到他们的应用程序中。OpenAI计划对750字左右的提示信息收费3美分,对750字左右的响应信息收费6美分。
