本文作者:梁实秋

英伟达 CEO 黄仁勋:生成式 AI 时代已来,行业将被颠覆

英伟达 CEO 黄仁勋:生成式 AI 时代已来,行业将被颠覆摘要: 英伟达 CEO 黄仁勋:生成式 AI 时代已来,行业将被颠覆我希望这会在未来发生,这是我首先要交给机器人去做的事情。Lauren:AI可能正在取代人类所做的某些事情,这对我的工作意...

出品 | 搜狐科技

作者 | 梁昌俊、王一鸣

北京时间7月30日凌晨澳门开奖现场开奖直播软件下载安装,在美国当地时间举行的发布会上,英伟达CEO黄仁勋(Huang)与《连线》资深作家劳伦·古德( Goode)举行了炉边谈话,探讨了与AI相关的技术、伦理道德,以及未来的发展趋势。

黄仁勋首先回顾了计算机行业的一些关键时刻英伟达 CEO 黄仁勋:生成式 AI 时代已来,行业将被颠覆,表示英伟达所做的一切都是基于加速计算。他提到,英伟达从 2012 年开始研究深度学习,2016 年打造了第一台计算机 DGX-1,并向公众交付,预计 2022 年会推出革命性的产品。

黄仁勋表示:“生成式人工智能现在已成为可能。这确实是一个革命性的时代,它将改变几乎所有行业。”生成式人工智能将改变科学计算、内容创作、工业可视化、机器人技术和自动驾驶。人工智能将改变一切。

同时,他认为生成式AI正在推动软件3.0的进程,“未来我们不再使用机器学习来学习新的AI,而是每个研究人员都有预先训练好的基础模型,开发软件的方式可能非常类似于建立一个由各种具备AI能力的专家组成的团队。”

对于AI的幻听问题,黄仁勋表示,GPT的强化学习人类反馈、只关注训练它做什么、以及增强生成检索的能力,这三者结合起来让文本变得更加有用和可控。

对于图像或者视频,黄仁勋表示,创造了通过更多条件来控制和对齐的方式,还可以把不同模态的数据和内容结合起来,并可以对其进行控制,改变姿势,改变位置,背后是3D增强生成技术的突破。

“我认为我们可能会看到的是,生成式人工智能现在将比以前更容易控制。”黄仁勋表示,使用生成式人工智能可以让你更好地控制生成的图像,并减少幻觉,这两者都是有助于提高生产力的工具,可能会改变我们的工作方式。

他认为,未来每个人都会拥有一个AI助手,公司里的每个工作都会有AI作为助手,并会因为AI而得到增强。“没有AI,这一切都不可能实现;没有AI,这一切都不可能实现。”他还透露,英伟达本周正在交付工程样品。

黄仁勋还宣布推出数字代理微服务,即人工智能数字人。“它能够说话、与你眼神交流,并以富有同情心的方式进行动画制作。”

对于由此引发的伦理问题,比如人们开始误认为AI是人类的问题,黄仁勋回应称,数字人技术已经很现实了,但是大家都知道它还是机器人,所以这并不可怕。

黄仁勋还强调,一直是一家软件公司,因为加速计算需要设计加速器、编写代码等,“通过重新设计整个堆栈,应用程序可以加速20倍、40倍、50倍、100倍”。

他提到,过去我们把深度学习的速度提高了 100 万倍,这就是为什么现在可以创建这些大型语言模型,而成本和能源的降低也提高了 100 万倍,这使得通用生成式人工智能成为可能。

面对技术调整和市场竞争,当被问及“什么让你夜不能寐”时,黄仁勋感叹创立一家公司确实很难。

“通用计算是最简单的方法,我们已经做了 60 年,为什么不继续做下去呢?”他认为,加速计算只有在提供非凡速度提升的情况下才有可能,而且每次开辟一个新的市场时,都要重新发明所有的计算。

对于生成式AI带来的能耗问题,黄仁勋表示,加速计算可以帮助节省大量能源,而且生成式AI具备记忆能力,减少了通过网络跑到数据中心取回并带到网络所需的时间。最后,AI并不关心在哪里进行训练,未来需要将数据中心搬到更靠近能源过剩的地方。

对于开源问题,黄仁勋强调开源非常重要,“没有开源,怎么可能各个行业、各个公司都参与到人工智能中来,才使得人工智能的普及成为可能。”

他还表示,下一波AI浪潮是物理AI,而英伟达为此打造了三台计算机,这些计算平台将共同推动全球开发者进入由物理AI驱动的人形机器人时代。

在对话的最后,黄仁勋还表示,一定会有人工智能出现,“我说过的每一句话,写过的每一个字,做过的每一件事,都可能被这些人工智能吸收……我希望这种情况在未来会发生,这也是我最想交给机器人去做的第一件事。”

以下是对话记录(经过编辑和校对)

问:从 1974 年成立至今, 的意义是什么?

黄:以前是讲计算机图形学,现在是讲计算机图形学和生成式人工智能。我们都知道 的历程,是从计算机图形学开始的。我制作了一幅关于我们历程的动画片,这些都是计算机行业最重要的时刻。

IBM 360,现代计算的发明,犹他州于 1975 年发明了可编程着色,1986 年发明了可编程着色,没有它,大多数动画电影都不可能制作出来。 成立于 1993 年, 于 1995 年彻底改变了个人电脑行业,让每个人都能使用 2001 年,我们发明了第一个可编程着色 GPU,推动了 的业务向前发展。

我们所做的一切都是为了加速计算,通过创建一个可以增强通用计算的计算模型,这样我们就可以解决普通计算机无法解决的问题。我们选择的第一个应用是计算机图形学,它是计算密集型的一部分。

从计算机图形学诞生以来,其实绘制一些原始场景都需要超级计算机,所以我们长期致力于加速计算,将CUDA推广到每一个GPU,兼容应用,是一个非常棒的决定。

2012 年,我们第一次接触人工智能(AI),当时是计算机视觉的一个突破,以深度学习为中心,一种编写软件的新方式。我们改变了公司里的一切,从处理器到系统,再到软件堆栈,所有的算法,图形学的基础研究都转向了深度学习。我们为深度学习打造的第一台计算机 DGX-1,为自动驾驶汽车和机器人等构建模型,可以做人工智能来生成图形。

:您在去年的主题演讲中提到最准一肖一码100%中,RTX 光线追踪极致是计算机图形学与 AI 相遇的重要时刻之一。RTX 在 2018 年的重要性是什么?

黄:2018年,发布了全球首个实时、交互式光线追踪平台RTX,这是计算机图形学与人工智能相遇的重要时刻之一,它使用并行处理器来计算光线追踪,但一开始光线追踪只有10帧/秒左右,分辨率为1080P。

现在有了 DLSS,它可以渲染一个像素,并使用 AI 推断其他像素。现在我们可以以每秒 300 帧的速度渲染 4K 分辨率的光线追踪,并进行完整的路径追踪模拟,这完全由人工智能驱动。

现在是 2022 年,它是革命性的,是 AI 历史上发展最快的服务。自发布以来,行业研究人员已经弄清楚了如何使用 AI 来学习一切,不仅仅是文字,还包括图像和视频的含义,以及 3D 化学、蛋白质、物理学、热力学、流体动力学、粒子物理学。

生成式人工智能已经可能实现,这是一个革命性的时代,将影响几乎每一个行业。无论是科学计算、试图以更少的努力更好地预测天气、增强创作者生成图像或为工业数字化生成数据,无论是虚拟场景、机器人技术还是自动驾驶汽车,它们都将被生成式人工智能改变。

现在我们的机器正在学习如何编写软件,为人类无法解决的问题编写软件,这是我们以前难以想象的。我们开发了机器学习软件 2.0,现在正在向软件 3.0 迈进。你可能从一个预先训练好的模型开始,然后开发软件的工作方式非常像一个拥有各种人工智能能力的专家团队,有些使用工具,有些能够生成特殊的东西,它是通用人工智能,它非常擅长推理。

: 在使用这些工具时,会产生幻觉和低质量的输出,同时消耗大量能源。您为什么对此如此乐观?您认为什么可以为我们指明方向,让生成式人工智能更有用、更可控?

黄:我们的重大突破是 RLHF(强化学习人类反馈),这是一种利用人类来生成正确答案或最佳答案的方法,以使我们的 AI 与我们的核心价值观保持一致,或者使我们的 AI 与我们希望它执行的技能保持一致。它还将只专注于它所训练做的事情,第三个突破称为检索增强生成,其中所有内容都被矢量化,在 AI 做出响应之前,它会从向量读取数据库中搜索合适的内容,然后在生成过程中对其进行增强,这对文本来说正是如此。

现在真正酷的是如何让图像做到这一点。 正在创建一个 2D 文本到 2D 多模态 AI 模型,我们与 Getty 合作,使用他们的数据库训练 AI 模型。您可以使用提示并生成图像,但您很难控制提示,它可能会产生幻觉,它可能会产生与您不完全想要的效果。单词的维度非常低,其内容极其压缩,现在很难控制图像。因此,我们创建了一种方法,可以更好地控制和调整更多条件。

我们有人工智能,其他公司可以与我们合作创建模型。他们提供数据并生成自定义人工智能模型。我们现在用它来生成 3D 模型,并将其放入其中。这是一个可以合成数据和内容的地方。它可以是 3D 人工智能,可以是动画,也可以是材料。我们用来组合所有这些多模态数据,以便实现控制,您可以更改姿势、位置,并使用正在使用的图像进行调整。

: 人工智能可能会取代人类所做的一些工作,这对我的工作意味着什么?你认为界限在哪里?

黄仁勋:这就是工具的作用。我们发明工具,工具要么帮助我们做工作,要么与我们一起工作。这样,我们就能把工作做得更好,甚至取得更大的成功,做以前不可能做到的事情。你会看到,生成式人工智能更加可控,我们用 RAG、检索、增强生成来控制它,而文本生成可以有效减少幻觉。

而生成式人工智能可以让我们更好地控制图像,减少幻觉。这两种工具都可以帮助我们更有效地工作,做我们以前做不到的事情。这样的工具不只是为艺术家准备的。我想说,我们所有的工作都可能会发生变化。

未来,每个人都会有一个AI助手,每一项工作都由AI来完成,就像软件程序员有AI帮他们编程一样。没有AI,这是不可能的;没有AI,这是不可能的。

我们本周宣布的一件事是数字代理的概念,人工智能数字代理将增强公司的每一项工作,其中最重要的用例之一就是客户服务。我们创建了客户服务,它基本上是一种微服务,位于云端。

数字人前端基本上是一个 IO,它具有说话、与你眼神交流、以富有同情心的方式进行动画的能力,你可以选择将你或你的 AI 连接到数字化身。与 AI 聊天,它会生成文本,然后将文本转换为语音,语音驱动面部动画,然后通过 RTX 路径跟踪,这就是数字人的渲染。所有这些技术都可供开发人员使用,你可以选择要使用的部分。

: 您如何看待这种做法的伦理问题?这些技术正在被推广到世界各地,您认为如此像人类的聊天机器人应该表明它是聊天机器人吗?它太像人类了,以至于人们会误以为它是聊天机器人。它是人类。

黄:它仍然很机械。我认为我们已经让数字人技术变得非常逼真,但你我都知道它仍然是一个机器人,所以我认为这并不可怕。人类的参与比对话的文本框更有吸引力。可能有人需要陪伴,医疗保健需要为门诊患者提供建议,帮助老年人,需要辅导老师来教育孩子。所有这些不同的应用场景更适合拥有一个更像人类的人来与你建立联系。

:这些都是软件开发,它们依赖于你的 GPU,但最终还是软件。与此同时,有些公司正在寻求在软件和云服务方面更深入地进入底层,并且可能正在开发自己的芯片。软件战略非常重要。对于 保持领先地位并实现增长来说,软件有多重要?

黄仁勋:我们一直是一家软件公司,因为加速计算不是通用计算。通用计算可以运行任何 C 或 C++ 程序,几乎每个人的程序都可以被编译并有效运行。

不幸的是,当你想加速流体动力学时,你必须了解流体动力学的算法,你必须设计一个加速器,你必须以一种让它理解算法的方式设计 GPU 上的代码,这样它才能很好地加速它。好处是,通过重新设计整个堆栈,我们可以将应用程序的速度提高 20、40、50、100 倍。例如,我们刚刚将 GPU 放入 GCP,这是世界领先的数据科学平台,我们实现了 50 到 100 倍的加速,超越了通用计算。

在过去的一段时间里,我们将深度学习的速度提高了 100 万倍,这就是为什么现在可以创建这些大型语言模型,而成本和能耗降低 100 万倍使得通用生成式人工智能成为可能。

通过设计新的处理器、新的系统张量核心 GPU 和交换机结构,这是一个完全突破性的 AI。当然,系统本身、算法和分布式计算库就是我们所说的 RT L1。这些都是算法。如果你不懂算法,应用程序很难弄清楚如何设计整个堆栈。

问:未来软件生态系统中最重要的部分是什么?

黄仁勋:每个领域都需要一个新的库,我们称之为 DSL,即领域特定库。在生成式 AI 中,DSL 被称为 cuDNN。对于量子模拟,它被称为计算光刻,这使我们能够帮助行业推进下一代工艺技术。库的数量不断增长,每当我们推出一个领域特定库时,我们都会加速计算进入一个新的市场。它需要这种协作、库的全栈、架构、市场营销以及围绕它的开发人员和生态系统。所以这不仅仅是建立一个加速器,你必须建立一个完整的堆栈。

:你对未来的探索和你的创新取决于很多东西。你必须不断突破物理定律的极限。总有竞争对手在追赶你。是什么让你夜不能寐?你会继续朝着你乐观的预期方向发展吗?

黄仁勋:对我来说,创办一家公司真的非常困难,事情从来都不是按照我们想要的方式发展。你必须有意识地让加速计算的未来成为现实。世界需要通用计算,因为它很容易实现。你只需要让软件每年运行速度提高一倍,每五年提高 10 倍,每十年提高 100 倍,这有什么错呢?当然,你可以缩小一个晶体管,但你无法缩小一个原子,最终 CPU 架构已经走到了尽头。所以它不再有意义了,因为技术并没有给我们带来飞跃。但加速计算在一切方面都表现出色,它可以擅长这些令人难以置信的事情,从深度学习到量子模拟到分子动力学、流体动力学,再到图形计算,所以我们创建了这个加速计算架构来做到这一点。

但这是一场逆风之战,因为通用计算是最简单的方法,我们已经做了 60 年了,为什么不继续做下去呢?所以加速计算只有在提供非凡速度提升时才有可能,当能量变成能量时,随着时间的推移,我们需要另一种做事的方法。但几乎每次我们想要发展,我们都必须学习它。这就是我们致力于机器人技术和自动驾驶的原因。汽车,打开这些市场的原因是为了了解必要的算法,了解下面的计算层,这样我们才能提供非凡的结果。每次我们开拓一个新的市场,医疗保健,数字生物学,它都需要我们重新发明所有的计算。

:生成式人工智能消耗大量能源,有数据显示,未来十年数据中心将消耗全球6%的能源,您觉得未来有足够的能源满足自己想做的事情的需求吗?

黄:首先,有两三家或三四家模型制造商正在推动尖端技术的发展。今年,可能会有三倍以上管家婆2024资料精准大全,但仍处于非常高的个位数。即使有 10 家,这些模型的规模每年都在翻一番,增长速度可能甚至更快。要训练一个两倍大的模型,你需要的数据量不仅仅是两倍;计算量每年可能会增长四倍。

这就是它备受期待的原因之一,因为我们使用相同的能源来加速应用程序。这是以恒定能源、恒定成本加速应用程序的一个例子,而且它越来越便宜。

世界上有很多公司,他们的数据中心遍布各地,而 向许多公司和许多不同的数据中心出售 GPU。那么核心发生了什么?实际上发生的第一件事是 CPU 扩展的结束和加速计算的开始。世界各地的数据中心都在转变,每个人都从 CPU 转向加速计算,因为他们想要相同的功率。加速计算可以帮助节省大量能源,节省 20 倍、50 倍,并进行相同的处理。

我们要做的第一件事就是加速每一个应用程序。如果你在进行 Spark 数据处理,使用加速的 Spark 运行它,你可以将所需的能量减少 20 倍。如果你在进行 SQL 处理,使用加速的 SQL 处理运行它,这样你就可以将功耗减少 20 倍。因此,如果你在进行天气模拟或任何科学模拟,GPU 都可以加速它。许多这些应用程序过去都是在 CPU 和通用计算上运行的。所有这些都应该加快计算速度。

现在发生的第一件事就是减少全球使用的能源量。我们有更高密度的 GPU 和加速计算,更高的能量密度,但使用的能源却少得多。它约占全球能源的 1%。但尽管数据中心消耗了全球 4% 的能源,但生成 AI 的目标不是训练,而是推理,理想情况下我们创建新的模型来预测天气,预测新材料,让我们优化我们的供应链,减少能源消耗和汽油浪费,因此目标实际上是将能源消耗减少 96%。所以从垂直角度思考 AI 非常重要。AI 客观上会提高生产力,它将使我们能够发现新的计算科学,并且会更加节能。

生成式人工智能影响的第二个方面是内存。传统的计算方式称为基于检索的计算。一切都是预先录制的。所有图像、视频都是预先录制的。一切都存储在数据中心。生成式人工智能减少了通过网络运行到数据中心以检索某些内容并将其带到网络所需的能量。数据中心并不是唯一消耗能源的地方;占总计算量的 40%。60% 的能源消耗在互联网上,移动电子、移动比特和字节。生成式人工智能将减少互联网上的能量,因为我们不必检索信息,我们可以当场生成信息,因为我们了解上下文。我们的设备上可能已经有一些可以生成响应的内容,所以我们不必检索它。

最后,人工智能不在乎在哪里训练。今天的数据中心都建在社会电网附近,因为那是我们需要它的地方。未来,数据中心将建在世界各地电力过剩的地方。能源不是大问题,但要花很多钱。也许在沙漠,也许在可持续能源丰富的地方,水资源充足的地方,我们可以把数据中心建在人口较少、能源较多的地方。太阳有很多能量,世界上有很多能量。所以我们需要做的是把数据中心搬到更靠近能源过剩的地方,而不是把所有东西都建在人口密集的地方。

:我想问您关于开源的问题,我知道您将会与马克·扎克伯格讨论这个话题。

黄仁勋:开源确实很重要。没有开源,各行业、各公司怎么参与人工智能?今天大家都在使用Llama 2.1,大家对此非常兴奋。这让人工智能民主化成为可能。让每个行业都参与到人工智能中来。

我想说第一波是加速计算,降低能耗,让我们能够满足持续的计算需求,而不是让能源继续增长。因此,加速一切,使生成式人工智能成为可能。

我们知道生成式 AI 领域有很多先驱,比如 、微软、xAI,还有很多了不起的公司都在做这件事。我们希望能够让每个企业都拥有创建自己 AI 的能力,这样每个人都会得到增强,并拥有一个可以赋能他们、帮助他们做得更好的协作式 AI。

下一波AI被称为物理AI,我们将需要三台计算机,一台用来创建AI,另一台用来模拟AI,两者都是使用合成数据生成的,第三台用来真正运行AI。这是一个三台计算机的问题,一个三体问题,非常复杂。我们为此创建了三台计算机,而在每一台计算机中,无论​​你想使用软件堆栈、算法,还是仅仅是计算基础设施,仅仅是机器人的处理器、它运行的功能安全操作系统,以及AI和计算机视觉模型还是仅仅是计算机本身,都是开放的。物理AI时代已经到来,这些计算平台共同推动全球开发者进入物理AI驱动的人形机器人时代。

:人们正在创造真正令人惊叹的数字媒体,而你们正在用你们的技术加速它的发展。未来人们对文件、格式​​、档案以及创作或生活的访问方式将发生怎样的变化?机器人也会存在,我并不担心它们会接管一切,对吧?

黄:这个问题问得好。我们深信不疑的格式之一是 Open USD,它汇集了几乎所有乐器的多种模式,并允许它们交互、组合,以及进出这些虚拟世界。随着时间的推移,理想情况下,您可以将任何格式引入其中。

在这次大会上,我们宣布通用机器人数据格式(URDF)可以兼容或吸收到Open USD中,我们会把一切变成通用语言,用标准让内容和数据可以共享,让大家可以在上面进行协作并永久存在的最佳方式之一。比如说,如果没有HTML,大家要访问所有这些来自世界各地的不同内容就非常困难。所以从很多方面来说,Open USD就是虚拟世界的HTML,我们是它的先行者,很多公司已经加入。我希望世界上的每一个设计工具都可以连接到Open USD,一旦你连接到虚拟世界,你就可以和任何人在任何地方使用任何工具进行协作。

:您说这些内容可以实现永生,您想打造一个永生的人工智能吗?

黄仁勋:肯定会有人工智能的。我说过的每一句话、写过的每一个字、做过的每件事都可能被这些生成式人工智能模型吸收。希望未来这种情况会发生,所以这是我最想让机器人做的事情。

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏

阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,26人围观)参与讨论

还没有评论,来说两句吧...