本文作者:叶圣陶

香港澳门6合开彩开奖网站记录,中国是否应跟随美国引领的 AI 技术路线?院士专家给出观点

香港澳门6合开彩开奖网站记录,中国是否应跟随美国引领的 AI 技术路线?院士专家给出观点摘要: 香港澳门6合开彩开奖网站记录,中国是否应跟随美国引领的 AI 技术路线?院士专家给出观点马俊】美国依靠软硬件优势,在用规模“堆”出全球最强人工智能(AI)的这条道路上狂奔不已。钱德...

未来超级智能融合将分为三个阶段

中国科学院院士陈润生在研讨会上表示,“人工智能大模型是新质量生产力的代表,大模型与超级计算融合发展非常重要,我国需要认真规划、认真思考。”中国科学院计算技术研究所研究员张云泉提到,大模型快速发展彰显出新质量生产力的特征,但也遭遇了算力瓶颈。鉴于我国在超算领域深厚的技术积累,希望超智融合(以大模型为代表的超级计算与智能计算的融合)能有效化解这一挑战。 国家信息中心信息技术和产业发展部主任单志广解释,“超智融合是随着当前基础算力、智能算力、超级计算算力等多元化发展而诞生的,即不管是混合算力资源,还是综合算力系统,都可以同时解决多种不同算力的应用需求。”

在预测未来超级智能融合的进程时,中科院院士钱德培认为,它将沿着for AI、by AI、being AI三个阶段清晰地演进,从硬件到软件全方位演进正版二四六免费资料大全,适应和推动人工智能技术的发展。for AI的第一个阶段,重点是对现有计算机系统的改造升级,开发专用硬件,确保AI任务能够得到高效的支持和执行,为人工智能研究提供坚实的基础设施。by AI的第二个阶段,将用AI改造传统计算,一方面用AI的方法解决传统的超算问题,另一方面AI也在影响传统计算机的架构,这种趋势将逐渐明显。being AI的最后一个阶段,计算机系统将表现出内在的智能特征,人工智能不再是一种附加的能力,而是计算机的核心属性和基本组成部分,计算能力或智能水平可能远远超过我们现在的超级计算或智能计算。

陈润生注意到,科研界和产业界一直在努力解决超算与智能计算的融合问题。比如最新的GB200架构,其实就是两块GPU加一块CPU,某种意义上也算是兼顾了智能计算和超算双方的优势。在两块GPU执行机器学习的布局上,又加入了CPU提供的高速数据传输。但他认为,这种架构并没有从根本上解决效率问题。“超算与智能计算的结合是必然的,会有一个有机的融合,而不是简单地把它们放在一起。”

中国工程院院士郑为民也表示,大模型的开发、训练、微调和推理都离不开算力,而算力成本在总体开支中占到大头,尤其在训练阶段占比高达70%,在推理阶段则高达95%。由此看来,算力已经成为支撑大模型发展的关键因素。

智能计算应该指“人类智能”

对于中国当前的大模型热和效仿美国“规模化”技术的道路,中国院士专家发表了自己的看法。钱德培说,中国现在的大模型比美国多,种类也多,也在做通用人工智能,但我们不仅受到美国严格的硬件限制,而且用于大模型训练的数据质量和数量也比较少。“这样做出来的大模型能比美国好吗?我觉得还是要符合中国国情,不能完全效仿美国人。”

陈润生也认为,现在国内出现的大模型,基本都是在美国提出的大模型和算法上进行改进,但对整个大模型的基础理论考虑得很少。他在研讨会上提出香港澳门6合开彩开奖网站记录,中国是否应跟随美国引领的 AI 技术路线?院士专家给出观点,与传统超级计算机采用的本地内存模式相比,智能计算表现出一个根本的区别——信息的分布式存储。这种存储方式模仿了人脑神经网络的复杂结构,通过大规模、密集互联的芯片网络承载着越来越大的模型。但如何把人类的知识有效地嵌入到这些复杂的系统中,信息在系统中具体是如何分布和存储的,其背后的算法和技术理论还没有被充分挖掘出来。“随着模型规模无节制的膨胀,一个难以克服的问题就是能源枯竭。因此,一味地增加芯片、靠增加系统复杂度来解决大模型的存储问题,并不完全可取。”

因此技术分析2023澳门码今晚开奖结果记录,陈润生认为,未来的智能计算应该还是指“人的智能”,也就是模拟人脑的运行机制。人脑很小,消耗的能量只有几十瓦,但它产生的智能却超过了最先进的人工智能,后者消耗的能量相当于一座城市的能量。“大模型、智能计算的发展,不仅需要在应用层面对模型、算法进行改进,还需要从基础理论层面有所突破。现在大模型只发展了前10%,还有90%的工作要做。我也认为,大模型绝对不是靠堆砌越来越多的芯片就能实现的,它必须像人脑一样去学习,把空间复杂度、时间复杂度压缩到更小的水平,降低能耗。所以我觉得最基础的问题,还是要研究现在的空间复杂度,完成智能计算的基础理论。如果能在基础理论方面有所进步万万没想到周立波老婆胡洁前夫,就能实现根本性、原始性创新。”

北京应用物理与计算数学研究所研究员袁国兴认为,指望一个通用的大模型来解决各行各业的问题是不可能的。现实中,不同的应用有不同的技术,需要不同的算法,对计算能力的要求也不同。比如在科学计算中,对计算精度的要求越来越高,而随着计算机规模的扩大、数据的增多,可信度却在不断的降低。美国国家航空航天局(NASA)也提出过类似的观点,他们对计算精度的要求非常高。所以未来不同的应用会有不同的大模型,用不同的计算来解决不同的问题,而现在的大模型对计算精度和算法的要求是完全不一样的。

中国信息通信研究院云计算与大数据研究所所长何宝红补充道:“计算和训练对底层基础设施的要求不同,我们也要确定在哪些场景要屏蔽差异、在哪些场景要体现差异。”

需要开发主权级大型模型

张云全表示,美国近期采取一系列动作,试图在人工智能发展上“掐死”我国,包括禁止出售高端GPU、终止大模型源代码共享、中断生态合作等。同时,当大模型计算规模达到万块甚至十万块GPU时,需要通过研制大模型专用超算来突破能耗墙、可靠性墙、并行墙等技术瓶颈。在此背景下,我国若想在短期内突破大模型算力瓶颈,有一条路可走:利用过去二十年积累的先进超算技术,研制大模型专用超算,攻克大模型算力瓶颈,使我国在大模型计算方面跟上世界最先进水平,不落后。

在介绍超智融合体系下的“主权大模型”计划时,张云泉表示,我国在超算领域有着深厚的技术积累,近年来在智能算力发展上投入了巨额资金,着力建立以超智融合算力体系为核心的系统工程,应对大模型的算力需求,希望最​​大程度发挥超算技术优势解决算力挑战。按照“主权大模型”计划的部署,“主权大模型”创新联盟将依托国家超级计算机、中科院和全国重点高校知名教授团队、智能芯片企业、大模型解决方案企业等,共同打造类似开放的组织,非盈利部门组织开展“主权大模型”研发,盈利部门组织开展“主权大模型”落地。 他提出,超级计算是“国家重器”,需要用来攻克最大、最难的挑战。主权大模型是能够支撑国家发展的根基模型,而不是普通的大模型。类似的国家超级模型也受到其他国家的高度重视。比如,美国微软公司联合发布了投资1000亿美元开发新型人工智能超级计算机的计划,日本最近也宣布将投入巨资开发国家大模型。

陈润生认为,基于中国目前的基础国情和大型模型发展的必然趋势,我们完全按照西方的做法是不现实的,短期内也难以赶上,因此,更重要的是找到发展主权级大型模型的办法。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,19人围观)参与讨论

还没有评论,来说两句吧...