图片来源:
出品 | 搜狐科技
作者:王一鸣
想象一下2024年新澳开奖结果查询表,GPT-3.5 是一辆汽车,速度快但消耗化石燃料,能耗非常高。GPT-4.0 是一辆电动跑车,不仅速度快,而且更节能。突然,市场上出现了一款紧凑型电动车,它的速度不如电动跑车,但绝对比 GPT-3.5 汽车快。它体积更小,承载能力有限,但非常灵活。没错,这就是 GPT-4o mini。
价格和性能都达到极限
目前,GPT-4o mini已经接过了GPT-3.5的接力棒。
GPT-4o mini是一个体积小但功能强大且性价比高的AI模型,其聊天能力甚至超过GPT-4,海量多任务语言理解(MMLU)得分达到82%。
像这样的聊天窗口是一个交流平台,我们可以在这里与 GPT-3.5 和 GPT-4 等 LLM(大型语言模型)进行交流。这些模型经过训练可以理解我们所说的话,理解人类的语言。同时,思想会生成人类可以理解的语言和内容。
通常,大型语言模型可以有十亿或更多的参数,这是用来判断和衡量它在响应提示之前可以处理多少内容的指标。这意味着 LLM 可以吸收大量的知识。
承载这些模型的硬件在我们看不到的地方消耗着巨大的能源,因为它们需要不断扩大服务器规模和跨网络访问。
小语言模型(SLM)是一种折衷方案,它提供了 AI 计算能力和速度,但不需要 LLM 那样庞大的硬件和成本。比如微软的 Phi-3 Mini,可以在手机和电脑上运行。还有谷歌的 1.5 Flash,完全可以胜任大量高频任务,比如从视频和音频中导出文档。现在我们还有 GPT-4o Mini。
根据官网介绍,各模型的输入输出Token报价为:
GPT-4o:
*每百万投入:5美元(约合36.4元人民币)
*每百万产量:15美元(约合人民币109.12元)
GPT-4o mini:
*每百万投入:0.15美元(约合人民币1.09元)
*每百万产量:0.6美元(约合4.36元人民币)
也就是说,GPT-4o mini 每百万输入和每百万输出的费用分别是 GPT-4o 的 3% 和 4%。
在可选型号中,GPT-3.5已经消失,GPT-4o mini已成为免费用户的完整选项。
GPT-4o mini不仅成本低廉,还支持多种任务场景:
1. 调用多个模型进行链式或并行计算
2. 处理大量上下文信息(例如完整的代码库或对话日志)
3. 快速实时的文本响应(例如客户服务)
在Meta发布开源模型Llama 3.1的同一天澳门四肖八码期期准正版,GPT-4o mini微调也正式上线。
从7月23日至9月23日,开发者每天可以免费使用200万次培训。
“早在 2022 年,最好的模型仍然是 Text-003(GPT-3)。它比这个新模型差很多,而且成本高出 100 倍,”X 首席执行官 Sam 表示。
API 现已开放,可以处理文本和图片,未来将支持更多类型的输入和输出,包括文本、图片、视频和音频。目前支持 128K 输入和 16K 输出。知识库已更新至 2023 年 10 月。值得一提的是,其标注器与 GPT-4o 共享改进,因此在处理外语(非英语)文本时更具成本效益。
小模型也能进行多模态推理
无论是处理文本还是多模态推理,GPT-4o mini 在学术基准测试 () 上的表现都优于 GPT-3.5 Turbo 和其他小型模型。函数调用也得到了增强,允许开发人员在外部系统上的应用程序中获取数据并执行操作,其在处理文本方面的表现也远胜于 GPT-3.5 Turbo。
GPT-4o mini 与 Haiku 和谷歌的 Flash 展开竞争,在推理能力、数学和编码能力以及多模态推理方面超越了其他小模型。
在文本推理基准MMLU中,GPT-4o mini得分为82.0%,Flash和Haiku得分分别为77.9%和73.8%。
在数学推理的 MGSM 上,GPT-4o mini 得分为 87.0%,Flash 得分为 75.5%,Haiku 得分为 71.7%。在衡量编码性能的 MGSM 上,GPT-4o mini 得分为 87.2%,Flash 得分为 71.5%,Haiku 得分为 75.9%。
GPT-4o mini 在多模态推理评估 MMMU 中得分为 59.4%,而 Flash 得分为 56.1%,Haiku 得分为 50.2%。
不过值得注意的是,研究人员对 MMLU 等基准测试持谨慎态度GPT-4o mini 横空出世!速度超越 GPT-3.5,聊天能力比肩 GPT-4,价格性能拉满,因为这些模型的训练方式存在差异,可能会使最终结果产生偏差。而且 AI 模型可能已经在其数据集中知道了这些答案。这无异于作弊,而且该过程中没有第三方评估参与。
作为模型开发过程的一部分,与Ramp等公司合作,GPT-4o mini在“从文件中提取结构化数据”和“根据电子邮件记录生成高质量回复”等任务上的表现明显优于GPT-3.5 Turbo。
下一步是将其无缝集成到每一个应用程序和网站中。GPT-4o mini 是实现这一目标的第一步澳门王中王100%的资料2024,让开发者能够更高效、更经济地构建和扩展 AI 程序。
他表示,未来人工智能会全面融入人们的日常生活,那时人工智能会更加便捷、可靠。
GPT-4o mini项目由陈晓东牵头,团队成员包括多名中国技术研究人员。
画外音
在 Meta 发布 Llama 3.1 之后,GPT-4o mini 与经过微调的 Llama 3.1 8B 登上模型赛场,在各类任务类型中角逐,却惨败。
网友们表示“从来没见过性能能和Llama 3.1 8B这么好的开源小机型”。
但有一点没有改变,无论是 GPT-4o 还是 GPT-4o mini,9.11 仍然比 9.9 “更大”。
还没有评论,来说两句吧...