OpenAI发布了改进的GPT-4 Turbo模型,供ChatGPT用户使用

快速导读:OpenAI宣布发布了最新版本的GPT-4 Turbo模型,供所有付费的ChatGPT用户使用。新模型在写作、数学、逻辑推理和编码方面都有所改进。它在GPQA和MATH等各种基准测试中都取得了显著进展。然而,在评估模型生成代码能力的HumanEval测试中,它的得分稍微较低。OpenAI强调了ChatGPT响应中更直接和对话式语言的用户体验的提升。此外,GPT-4 Turbo的数据集已扩展到包括2023年12月的信息。

在各个领域的性能改进

OpenAI的GPT-4 Turbo模型,适用于付费的ChatGPT用户,经历了重大改进。最新版本在写作、数学、逻辑推理和编码方面展示出了更强的能力。将4月9日版本与1月25日版本进行比较,该模型在各个类别中都取得了进展。值得注意的是,以科学数据集为重点的GPQA基准测试从39.7%提高到了49.1%。同样,MATH基准测试从64.2%提高到了72.2%。

通过更多对话式语言提升用户体验

虽然先前版本的GPT-4 Turbo在评估代码生成的HumanEval测试中表现优于最新模型,但OpenAI的主要关注点是改善一般用户体验。公司强调,ChatGPT的响应现在更直接、不啰嗦,并采用对话式语调。公告中提供的一个示例展示了生成生日晚餐邀请的短信提醒的差异。先前的模型产生了冗长的回应,而最新的模型生成了一个更短、更随意的提醒。

扩展数据集以改善上下文

GPT-4 Turbo的一个显著改进是扩展了其数据集。先前版本的数据集仅限于2023年4月的信息,而最新模型现在包括了2023年12月的数据。虽然它不具备2024年事件的知识,除非连接到互联网,但与其前身相比,它为用户提供了大约八个月额外的当前事件背景。