本文作者:梁实秋

综合探讨(2023年澳门今晚特马)Hugging Face、Mistral AI 和 OpenAI 推出小模型,开启自然语言处理新赛道

综合探讨(2023年澳门今晚特马)Hugging Face、Mistral AI 和 OpenAI 推出小模型,开启自然语言处理新赛道摘要: 综合探讨(2023年澳门今晚特马)Hugging Face、Mistral AI 和 OpenAI 推出小模型,开启自然语言处理新赛道mini的参数量可以在几亿到百亿不等,从训练量...

据 Beat 报道,上周,Face AI 和 分别于 7 月 16 日和 18 日推出了自己的小型模型(SLM),有望普及高级自然语言处理能力。过去,科技公司在大型语言模型赛道上竞相追求更大、更复杂的神经网络。Beat 认为,这些小型模型开辟了新的赛道,也可能影响企业使用 AI 解决方案的方式。

小模型,顾名思义,是相对于大语言模型(LLM)而言的,一般参数量更少论述管家婆一肖一码100中奖网站,计算资源需求更低。相比于动辄数千亿甚至数万亿参数的大语言模型,三款新推出的小模型:NeMo 和 GPT-4o mini 的参数量可从数亿到数百亿不等,且在训练量和能耗上均低于大语言模型。虽然三款模型以不同的方式实现 AI 普及,但都有一个共同的目标:为更多设备和应用带来强大的语言处理能力。

小型模型如何改变边缘计算

Beat 认为,Face 是三者中最具创新性的,其设计用于在移动设备上运行,拥有 1.35 亿、3.6 亿和 17 亿个参数的三种规格,有利于在边缘设备上进行 AI 处理,并解决数据隐私和延迟的关键问题。

AI的意义远不止提高效率,让边缘设备使用AI处理,可以让设备应用在低延迟、高隐私保护的基础上运行。过去,很多复杂的AI功能因为隐私或连接问题无法实现,有了AI,这些功能或许就会变成现实。

此外,AI推出了NeMo模型,该模型拥有120亿个参数,上下文窗口高达128k。NeMo面向台式电脑,定位在大型云端模型和超紧凑型移动AI之间。前者是在云计算平台上训练和运行的大规模AI模型,后者是在资源受限的移动设备(如手机、可穿戴设备)上运行的高效紧凑型AI系统。

Beat 表示,NeMo 的计算方法可能为企业领域带来重大变革。该模型有可能利用消费级硬件实现复杂的 AI 功能民主化,而消费级硬件曾是科技巨头和资金雄厚的研究机构的独家研究对象。这可能有助于在各个行业普及 AI 驱动的应用,例如优化客户服务和提供更复杂的数据分析工具。

2.高效小机型GPT-4o mini,价格优惠

它还推出了GPT-4o mini,加入小模型的竞争,被称为目前市场上最具性价比的小模型,每百万代币投入成本仅为15美分,每百万代币产出成本仅为60美分。Beat表示,GPT-4o mini大大降低了AI集成的资金投入。

此外,GPT-4o mini 的定价策略可能会催生新一波 AI 驱动的创新浪潮,尤其是在初创企业和小型企业中。通过大幅降低 AI 集成成本,该模型有效地降低了采用 AI 驱动解决方案的进入门槛。Beat 认为,这可能会加速多个行业的技术创新和改革。此外,这种向小型模型的转变反映了 AI 社区的一个新趋势:研究人员和开发人员越来越关注效率、可访问性和细分应用。这种趋势可能会催生出更有针对性和更高效的 AI 解决方案,以优化特定任务和行业。

3. 小型模型推动绿色技术创新,减少技术碳足迹

小型模型的发展趋势也与人们对人工智能对环境影响的日益担忧相一致。小型模型在训练和运行时消耗的能量更少,从而有可能减少人工智能技术的碳足迹。随着科技公司面临越来越大的可持续发展压力,Beat 认为小型模型的低能耗和低排放可能成为一个重要的卖点。

这种向小型模型转变的环境影响可能非常深远。随着人工智能变得越来越普遍透视澳门2023历史开奖记录大全图片,更高效的模型可以节省大量能源。这可以让人工智能在绿色创新中发挥主导作用,而不是继续加剧全球变暖。

然而发展现状澳门一肖一码100准免费资料,小型模型的兴起并非没有挑战。随着人工智能变得越来越普遍,偏见、责任和道德使用问题变得越来越紧迫。如果不加以监管,通过小型模型普及人工智能可能会放大现有的偏见或产生新的道德困境。对于小型模型的开发者和用户来说,除了技术能力之外,道德问题也必须优先考虑。

结论:人工智能发展的未来指向多样化和专业化

虽然小型模型在效率和普及度上具有优势,但由于参数限制,其在很多任务上的处理能力可能无法与大型语言模型相比。Beat 表示,这表明在未来的 AI 发展格局中,将会出现各种规模的语言模型综合探讨(2023年澳门今晚特马)Hugging Face、Mistral AI 和 OpenAI 推出小模型,开启自然语言处理新赛道,而较小的模型也会有自己特定的专业领域。

展望未来,我们预计会看到各种各样的 AI 模型,无论是大型语言模型还是小型模型。一刀切的做法不可取。关键是在模型大小、性能和特定应用需求之间找到平衡。对于企业和技术决策者来说,这三个小模型代表着向更高效、专业和可部署的 AI 解决方案的转变,为 AI 在企业环境中的集成提供了新的可能性。至于小模型是否能取代目前云端大模型的主导地位,现在下结论还为时过早。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,25人围观)参与讨论

还没有评论,来说两句吧...