香港澳门6合开彩开奖网站记录,中国是否应跟随美国引领的 AI 技术路线？院士专家给出观点

叶圣陶 07-29 19 抢沙发

默认

摘要： 香港澳门6合开彩开奖网站记录,中国是否应跟随美国引领的 AI 技术路线？院士专家给出观点马俊】美国依靠软硬件优势，在用规模“堆”出全球最强人工智能（AI）的这条道路上狂奔不已。钱德...

未来超级智能融合将分为三个阶段

中国科学院院士陈润生在研讨会上表示，“人工智能大模型是新质量生产力的代表，大模型与超级计算融合发展非常重要，我国需要认真规划、认真思考。”中国科学院计算技术研究所研究员张云泉提到，大模型快速发展彰显出新质量生产力的特征，但也遭遇了算力瓶颈。鉴于我国在超算领域深厚的技术积累，希望超智融合（以大模型为代表的超级计算与智能计算的融合）能有效化解这一挑战。国家信息中心信息技术和产业发展部主任单志广解释，“超智融合是随着当前基础算力、智能算力、超级计算算力等多元化发展而诞生的，即不管是混合算力资源，还是综合算力系统，都可以同时解决多种不同算力的应用需求。”

在预测未来超级智能融合的进程时，中科院院士钱德培认为，它将沿着for AI、by AI、being AI三个阶段清晰地演进，从硬件到软件全方位演进正版二四六免费资料大全，适应和推动人工智能技术的发展。for AI的第一个阶段，重点是对现有计算机系统的改造升级，开发专用硬件，确保AI任务能够得到高效的支持和执行，为人工智能研究提供坚实的基础设施。by AI的第二个阶段，将用AI改造传统计算，一方面用AI的方法解决传统的超算问题，另一方面AI也在影响传统计算机的架构，这种趋势将逐渐明显。being AI的最后一个阶段，计算机系统将表现出内在的智能特征，人工智能不再是一种附加的能力，而是计算机的核心属性和基本组成部分，计算能力或智能水平可能远远超过我们现在的超级计算或智能计算。

陈润生注意到，科研界和产业界一直在努力解决超算与智能计算的融合问题。比如最新的GB200架构，其实就是两块GPU加一块CPU，某种意义上也算是兼顾了智能计算和超算双方的优势。在两块GPU执行机器学习的布局上，又加入了CPU提供的高速数据传输。但他认为，这种架构并没有从根本上解决效率问题。“超算与智能计算的结合是必然的，会有一个有机的融合，而不是简单地把它们放在一起。”

中国工程院院士郑为民也表示，大模型的开发、训练、微调和推理都离不开算力，而算力成本在总体开支中占到大头，尤其在训练阶段占比高达70%，在推理阶段则高达95%。由此看来，算力已经成为支撑大模型发展的关键因素。

智能计算应该指“人类智能”

对于中国当前的大模型热和效仿美国“规模化”技术的道路，中国院士专家发表了自己的看法。钱德培说，中国现在的大模型比美国多，种类也多，也在做通用人工智能，但我们不仅受到美国严格的硬件限制，而且用于大模型训练的数据质量和数量也比较少。“这样做出来的大模型能比美国好吗？我觉得还是要符合中国国情，不能完全效仿美国人。”

陈润生也认为，现在国内出现的大模型，基本都是在美国提出的大模型和算法上进行改进，但对整个大模型的基础理论考虑得很少。他在研讨会上提出香港澳门6合开彩开奖网站记录,中国是否应跟随美国引领的 AI 技术路线？院士专家给出观点，与传统超级计算机采用的本地内存模式相比，智能计算表现出一个根本的区别——信息的分布式存储。这种存储方式模仿了人脑神经网络的复杂结构，通过大规模、密集互联的芯片网络承载着越来越大的模型。但如何把人类的知识有效地嵌入到这些复杂的系统中，信息在系统中具体是如何分布和存储的，其背后的算法和技术理论还没有被充分挖掘出来。“随着模型规模无节制的膨胀，一个难以克服的问题就是能源枯竭。因此，一味地增加芯片、靠增加系统复杂度来解决大模型的存储问题，并不完全可取。”

因此技术分析2023澳门码今晚开奖结果记录，陈润生认为，未来的智能计算应该还是指“人的智能”，也就是模拟人脑的运行机制。人脑很小，消耗的能量只有几十瓦，但它产生的智能却超过了最先进的人工智能，后者消耗的能量相当于一座城市的能量。“大模型、智能计算的发展，不仅需要在应用层面对模型、算法进行改进，还需要从基础理论层面有所突破。现在大模型只发展了前10%，还有90%的工作要做。我也认为，大模型绝对不是靠堆砌越来越多的芯片就能实现的，它必须像人脑一样去学习，把空间复杂度、时间复杂度压缩到更小的水平，降低能耗。所以我觉得最基础的问题，还是要研究现在的空间复杂度，完成智能计算的基础理论。如果能在基础理论方面有所进步万万没想到周立波老婆胡洁前夫，就能实现根本性、原始性创新。”

北京应用物理与计算数学研究所研究员袁国兴认为，指望一个通用的大模型来解决各行各业的问题是不可能的。现实中，不同的应用有不同的技术，需要不同的算法，对计算能力的要求也不同。比如在科学计算中，对计算精度的要求越来越高，而随着计算机规模的扩大、数据的增多，可信度却在不断的降低。美国国家航空航天局（NASA）也提出过类似的观点，他们对计算精度的要求非常高。所以未来不同的应用会有不同的大模型，用不同的计算来解决不同的问题，而现在的大模型对计算精度和算法的要求是完全不一样的。

中国信息通信研究院云计算与大数据研究所所长何宝红补充道：“计算和训练对底层基础设施的要求不同，我们也要确定在哪些场景要屏蔽差异、在哪些场景要体现差异。”

需要开发主权级大型模型

张云全表示，美国近期采取一系列动作，试图在人工智能发展上“掐死”我国，包括禁止出售高端GPU、终止大模型源代码共享、中断生态合作等。同时，当大模型计算规模达到万块甚至十万块GPU时，需要通过研制大模型专用超算来突破能耗墙、可靠性墙、并行墙等技术瓶颈。在此背景下，我国若想在短期内突破大模型算力瓶颈，有一条路可走：利用过去二十年积累的先进超算技术，研制大模型专用超算，攻克大模型算力瓶颈，使我国在大模型计算方面跟上世界最先进水平，不落后。

在介绍超智融合体系下的“主权大模型”计划时，张云泉表示，我国在超算领域有着深厚的技术积累，近年来在智能算力发展上投入了巨额资金，着力建立以超智融合算力体系为核心的系统工程，应对大模型的算力需求，希望最大程度发挥超算技术优势解决算力挑战。按照“主权大模型”计划的部署，“主权大模型”创新联盟将依托国家超级计算机、中科院和全国重点高校知名教授团队、智能芯片企业、大模型解决方案企业等，共同打造类似开放的组织，非盈利部门组织开展“主权大模型”研发，盈利部门组织开展“主权大模型”落地。他提出，超级计算是“国家重器”，需要用来攻克最大、最难的挑战。主权大模型是能够支撑国家发展的根基模型，而不是普通的大模型。类似的国家超级模型也受到其他国家的高度重视。比如，美国微软公司联合发布了投资1000亿美元开发新型人工智能超级计算机的计划，日本最近也宣布将投入巨资开发国家大模型。

陈润生认为，基于中国目前的基础国情和大型模型发展的必然趋势，我们完全按照西方的做法是不现实的，短期内也难以赶上，因此，更重要的是找到发展主权级大型模型的办法。

标签：中国研发芯片的院士芯片科学家回国芯片领域的院士