本文作者:张恨水

GPT-4o mini 横空出世!速度超越 GPT-3.5,聊天能力比肩 GPT-4,价格性能拉满

GPT-4o mini 横空出世!速度超越 GPT-3.5,聊天能力比肩 GPT-4,价格性能拉满摘要: GPT-4o mini 横空出世!速度超越 GPT-3.5,聊天能力比肩 GPT-4,价格性能拉满值得一提的是它的标记器是跟GPT-4o共享改进的,所以在处理外语(非英语)文本的时...

图片来源:

出品 | 搜狐科技

作者:王一鸣

想象一下2024年新澳开奖结果查询表,GPT-3.5 是一辆汽车,速度快但消耗化石燃料,能耗非常高。GPT-4.0 是一辆电动跑车,不仅速度快,而且更节能。突然,市场上出现了一款紧凑型电动车,它的速度不如电动跑车,但绝对比 GPT-3.5 汽车快。它体积更小,承载能力有限,但非常灵活。没错,这就是 GPT-4o mini。

价格和性能都达到极限

目前,GPT-4o mini已经接过了GPT-3.5的接力棒。

GPT-4o mini是一个体积小但功能强大且性价比高的AI模型,其聊天能力甚至超过GPT-4,海量多任务语言理解(MMLU)得分达到82%。

像这样的聊天窗口是一个交流平台,我们可以在这里与 GPT-3.5 和 GPT-4 等 LLM(大型语言模型)进行交流。这些模型经过训练可以理解我们所说的话,理解人类的语言。同时,思想会生成人类可以理解的语言和内容。

通常,大型语言模型可以有十亿或更多的参数,这是用来判断和衡量它在响应提示之前可以处理多少内容的指标。这意味着 LLM 可以吸收大量的知识。

承载这些模型的硬件在我们看不到的地方消耗着巨大的能源,因为它们需要不断扩大服务器规模和跨网络访问。

小语言模型(SLM)是一种折衷方案,它提供了 AI 计算能力和速度,但不需要 LLM 那样庞大的硬件和成本。比如微软的 Phi-3 Mini,可以在手机和电脑上运行。还有谷歌的 1.5 Flash,完全可以胜任大量高频任务,比如从视频和音频中导出文档。现在我们还有 GPT-4o Mini。

根据官网介绍,各模型的输入输出Token报价为:

GPT-4o:

*每百万投入:5美元(约合36.4元人民币)

*每百万产量:15美元(约合人民币109.12元)

GPT-4o mini:

*每百万投入:0.15美元(约合人民币1.09元)

*每百万产量:0.6美元(约合4.36元人民币)

也就是说,GPT-4o mini 每百万输入和每百万输出的费用分别是 GPT-4o 的 3% 和 4%。

在可选型号中,GPT-3.5已经消失,GPT-4o mini已成为免费用户的完整选项。

GPT-4o mini不仅成本低廉,还支持多种任务场景:

1. 调用多个模型进行链式或并行计算

2. 处理大量上下文信息(例如完整的代码库或对话日志)

3. 快速实时的文本响应(例如客户服务)

GPT-4o mini实力霸榜:文本、数学和多模态推理吊打友商,两个月内微调不花钱__GPT-4o mini实力霸榜:文本、数学和多模态推理吊打友商,两个月内微调不花钱

在Meta发布开源模型Llama 3.1的同一天澳门四肖八码期期准正版,GPT-4o mini微调也正式上线。

从7月23日至9月23日,开发者每天可以免费使用200万次培训。

“早在 2022 年,最好的模型仍然是 Text-003(GPT-3)。它比这个新模型差很多,而且成本高出 100 倍,”X 首席执行官 Sam 表示。

API 现已开放,可以处理文本和图片,未来将支持更多类型的输入和输出,包括文本、图片、视频和音频。目前支持 128K 输入和 16K 输出。知识库已更新至 2023 年 10 月。值得一提的是,其标注器与 GPT-4o 共享改进,因此在处理外语(非英语)文本时更具成本效益。

小模型也能进行多模态推理

无论是处理文本还是多模态推理,GPT-4o mini 在学术基准测试 () 上的表现都优于 GPT-3.5 Turbo 和其他小型模型。函数调用也得到了增强,允许开发人员在外部系统上的应用程序中获取数据并执行操作,其在处理文本方面的表现也远胜于 GPT-3.5 Turbo。

GPT-4o mini 与 Haiku 和谷歌的 Flash 展开竞争,在推理能力、数学和编码能力以及多模态推理方面超越了其他小模型。

在文本推理基准MMLU中,GPT-4o mini得分为82.0%,Flash和Haiku得分分别为77.9%和73.8%。

在数学推理的 MGSM 上,GPT-4o mini 得分为 87.0%,Flash 得分为 75.5%,Haiku 得分为 71.7%。在衡量编码性能的 MGSM 上,GPT-4o mini 得分为 87.2%,Flash 得分为 71.5%,Haiku 得分为 75.9%。

GPT-4o mini 在多模态推理评估 MMMU 中得分为 59.4%,而 Flash 得分为 56.1%,Haiku 得分为 50.2%。

不过值得注意的是,研究人员对 MMLU 等基准测试持谨慎态度GPT-4o mini 横空出世!速度超越 GPT-3.5,聊天能力比肩 GPT-4,价格性能拉满,因为这些模型的训练方式存在差异,可能会使最终结果产生偏差。而且 AI 模型可能已经在其数据集中知道了这些答案。这无异于作弊,而且该过程中没有第三方评估参与。

作为模型开发过程的一部分,与Ramp等公司合作,GPT-4o mini在“从文件中提取结构化数据”和“根据电子邮件记录生成高质量回复”等任务上的表现明显优于GPT-3.5 Turbo。

下一步是将其无缝集成到每一个应用程序和网站中。GPT-4o mini 是实现这一目标的第一步澳门王中王100%的资料2024,让开发者能够更高效、更经济地构建和扩展 AI 程序。

他表示,未来人工智能会全面融入人们的日常生活,那时人工智能会更加便捷、可靠。

GPT-4o mini项目由陈晓东牵头,团队成员包括多名中国技术研究人员。

画外音

在 Meta 发布 Llama 3.1 之后,GPT-4o mini 与经过微调的 Llama 3.1 8B 登上模型赛场,在各类任务类型中角逐,却惨败。

网友们表示“从来没见过性能能和Llama 3.1 8B这么好的开源小机型”。

但有一点没有改变,无论是 GPT-4o 还是 GPT-4o mini,9.11 仍然比 9.9 “更大”。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,25人围观)参与讨论

还没有评论,来说两句吧...