GPT-4o mini 横空出世！速度超越 GPT-3.5，聊天能力比肩 GPT-4，价格性能拉满

张恨水 07-28 25 抢沙发

默认

摘要： GPT-4o mini 横空出世！速度超越 GPT-3.5，聊天能力比肩 GPT-4，价格性能拉满值得一提的是它的标记器是跟GPT-4o共享改进的，所以在处理外语（非英语）文本的时...

图片来源：

出品 | 搜狐科技

作者：王一鸣

想象一下2024年新澳开奖结果查询表，GPT-3.5 是一辆汽车，速度快但消耗化石燃料，能耗非常高。GPT-4.0 是一辆电动跑车，不仅速度快，而且更节能。突然，市场上出现了一款紧凑型电动车，它的速度不如电动跑车，但绝对比 GPT-3.5 汽车快。它体积更小，承载能力有限，但非常灵活。没错，这就是 GPT-4o mini。

价格和性能都达到极限

目前，GPT-4o mini已经接过了GPT-3.5的接力棒。

GPT-4o mini是一个体积小但功能强大且性价比高的AI模型，其聊天能力甚至超过GPT-4，海量多任务语言理解（MMLU）得分达到82%。

像这样的聊天窗口是一个交流平台，我们可以在这里与 GPT-3.5 和 GPT-4 等 LLM（大型语言模型）进行交流。这些模型经过训练可以理解我们所说的话，理解人类的语言。同时，思想会生成人类可以理解的语言和内容。

通常，大型语言模型可以有十亿或更多的参数，这是用来判断和衡量它在响应提示之前可以处理多少内容的指标。这意味着 LLM 可以吸收大量的知识。

承载这些模型的硬件在我们看不到的地方消耗着巨大的能源，因为它们需要不断扩大服务器规模和跨网络访问。

小语言模型（SLM）是一种折衷方案，它提供了 AI 计算能力和速度，但不需要 LLM 那样庞大的硬件和成本。比如微软的 Phi-3 Mini，可以在手机和电脑上运行。还有谷歌的 1.5 Flash，完全可以胜任大量高频任务，比如从视频和音频中导出文档。现在我们还有 GPT-4o Mini。

根据官网介绍，各模型的输入输出Token报价为：

GPT-4o：

*每百万投入：5美元（约合36.4元人民币）

*每百万产量：15美元（约合人民币109.12元）

GPT-4o mini：

*每百万投入：0.15美元（约合人民币1.09元）

*每百万产量：0.6美元（约合4.36元人民币）

也就是说，GPT-4o mini 每百万输入和每百万输出的费用分别是 GPT-4o 的 3% 和 4%。

在可选型号中，GPT-3.5已经消失，GPT-4o mini已成为免费用户的完整选项。

GPT-4o mini不仅成本低廉，还支持多种任务场景：

1. 调用多个模型进行链式或并行计算

2. 处理大量上下文信息（例如完整的代码库或对话日志）

3. 快速实时的文本响应（例如客户服务）

在Meta发布开源模型Llama 3.1的同一天澳门四肖八码期期准正版，GPT-4o mini微调也正式上线。

从7月23日至9月23日，开发者每天可以免费使用200万次培训。

“早在 2022 年，最好的模型仍然是 Text-003（GPT-3）。它比这个新模型差很多，而且成本高出 100 倍，”X 首席执行官 Sam 表示。

API 现已开放，可以处理文本和图片，未来将支持更多类型的输入和输出，包括文本、图片、视频和音频。目前支持 128K 输入和 16K 输出。知识库已更新至 2023 年 10 月。值得一提的是，其标注器与 GPT-4o 共享改进，因此在处理外语（非英语）文本时更具成本效益。

小模型也能进行多模态推理

无论是处理文本还是多模态推理，GPT-4o mini 在学术基准测试 () 上的表现都优于 GPT-3.5 Turbo 和其他小型模型。函数调用也得到了增强，允许开发人员在外部系统上的应用程序中获取数据并执行操作，其在处理文本方面的表现也远胜于 GPT-3.5 Turbo。

GPT-4o mini 与 Haiku 和谷歌的 Flash 展开竞争，在推理能力、数学和编码能力以及多模态推理方面超越了其他小模型。

在文本推理基准MMLU中，GPT-4o mini得分为82.0%，Flash和Haiku得分分别为77.9%和73.8%。

在数学推理的 MGSM 上，GPT-4o mini 得分为 87.0%，Flash 得分为 75.5%，Haiku 得分为 71.7%。在衡量编码性能的 MGSM 上，GPT-4o mini 得分为 87.2%，Flash 得分为 71.5%，Haiku 得分为 75.9%。

GPT-4o mini 在多模态推理评估 MMMU 中得分为 59.4%，而 Flash 得分为 56.1%，Haiku 得分为 50.2%。

不过值得注意的是，研究人员对 MMLU 等基准测试持谨慎态度GPT-4o mini 横空出世！速度超越 GPT-3.5，聊天能力比肩 GPT-4，价格性能拉满，因为这些模型的训练方式存在差异，可能会使最终结果产生偏差。而且 AI 模型可能已经在其数据集中知道了这些答案。这无异于作弊，而且该过程中没有第三方评估参与。

作为模型开发过程的一部分，与Ramp等公司合作，GPT-4o mini在“从文件中提取结构化数据”和“根据电子邮件记录生成高质量回复”等任务上的表现明显优于GPT-3.5 Turbo。

下一步是将其无缝集成到每一个应用程序和网站中。GPT-4o mini 是实现这一目标的第一步澳门王中王100%的资料2024，让开发者能够更高效、更经济地构建和扩展 AI 程序。

他表示，未来人工智能会全面融入人们的日常生活，那时人工智能会更加便捷、可靠。

GPT-4o mini项目由陈晓东牵头，团队成员包括多名中国技术研究人员。

画外音

在 Meta 发布 Llama 3.1 之后，GPT-4o mini 与经过微调的 Llama 3.1 8B 登上模型赛场，在各类任务类型中角逐，却惨败。

网友们表示“从来没见过性能能和Llama 3.1 8B这么好的开源小机型”。

但有一点没有改变，无论是 GPT-4o 还是 GPT-4o mini，9.11 仍然比 9.9 “更大”。

标签： GPT-4o mini实力霸榜：文本数学和多模态推理吊打友商两个月内微调不花钱