英伟达首席执行官黄仁勋在播客中与 Joe Rogan 进行了对话,重述了 2012 年向特斯拉(美股代码:TSLA)首席执行官马斯克寄芯片的往事,以及他童年在美国生活和英伟达近乎伸展的经历。黄仁勋的完整叙述如下: 2012年,在多伦多大学Jeffrey Hinton的实验室里,他的两个学生Ilya Satzkefer和Alex Krizhevsky建立了一个名为Alexnet的模型。该模型在图像识别领域的性能优于近30年来人们编写的所有计算机视觉算法。计算机视觉是真正人工智能的基础——如果你不能“看”,就让“理解”。 “他们是怎么做到的?他们只买了两张 Nvidia 显卡,然后坐火车回家。”这两款显卡均为GTX 580,均采用SLI双卡互联技术。为什么我们的显卡可以做到这一点?因为我们从1984年就开始研究一种“新的计算方式”——并行计算计算。传统的CPU是一步步执行指令的:第一步、第二步、第三步……但我们的方法是将一个问题分解成数千个小任务,并将它们分配给数千个计算核心同时处理。使用这种方法的门槛很高,但只要你能将问题转换为我们发明的CUDA格式,你的设备就可以立即成为超级计算机。计算机图形学本身就是“简易并行计算”的一个很好的例子——屏幕上的每个像素本质上都是相互独立的,我们可以一次计算400万个像素!所以我们把tech这种超级计算机技术融入到了显卡上,让游戏玩家可以用它来玩游戏。总而言之,Ilya 和 Alex 使用我们的“玩家级超级计算机”创造了震惊世界的 Alexnet。当我看到这个结果后,我意识到:这不仅仅是计算机视觉技术,这东西基本上是一个“通用函数逼近器”!什么是通用函数应用程序肟化器?当你上学的时候,老师给你一个黑盒子,里面藏着一个函数f(x)。如果输入X,就会输出相应的结果。传统编程需要您自己推导并编写函数公式,例如牛顿第二定律 F = MA。这个问题可以通过在程序中写出公式来解决。但深度学习完全不同——你不必自己写你的 mga 公式!你只需要给它大量的“输入→输出”样本,它就可以自己“学习”相应的函数公式。你今天可以学习牛顿定律,明天可以学习麦克斯韦方程组,后天可以学习薛定谔方程……只要你能提供足够的输入和输出样本,它几乎可以学习任何东西。当时我们静下心来想:“等等,这东西的用途不只限于图像识别吧?它可以解决‘全世界所有的输入输出问题’!而且整个运行规律不就是这样吗?”无数输入输出关系组成的宇宙?”那一刻,我们只知道:这才是人工智能真正爆发的起点。其实,当时还有很多重大问题需要解决。但是,我们必须证明这项技术可以“规模化”到大型系统。当时的 Alexnet 论文只使用了两块 GTX 580 显卡进行 SLI 互连,对吧?而这个配置正是你之前玩《地震》时使用的设备。因此, GTX 580 SLI 游戏配置是一款“革命性的计算机”,将深度学习带上了历史舞台,但那时人们只是用它来玩地震。想要捕捉这珍贵的瞬间。这就像《星际迷航》中的“第一次接触”——瓦肯人必须观察地球人启动曲速引擎的确切时刻。如果他们没有亲眼看到那道闪光,他们就不会来到这个世界,接下来的一切也不会发生。如果当时我没有注意到那一刻,如果那象征胜利的“光”过去了,如果我们公司没有抓住这个机会,谁也无法预测以后会发生什么。我们亲眼目睹了这一历史时刻,然后通过分析推理得出结论:这是一个“通用函数逼近器”,其用途不仅仅限于计算机视觉。只要能解决这两个问题,我们就能有所作为。第一个问题:我们需要证明这项技术实际上是可扩展的。第二个问题:世界上永远不会有足够的“输入-输出”例子来通过监督学习来教授人工智能。阿宁。正如你无法让孩子知道一切一样,数据量也会成为制约发展的瓶颈。我们需要一种“无监督学习”方法,让计算机能够自行学习。这一目标仍需要数年时间才能实现,但现在无支持的学习已成为现实,人工智能可以自行学习。人工智能为何会实现自主学习?因为我们有大量的“正确答案样本”。最常见的应用是“猜测下一个单词”。我们收集所有的人类文本数据,覆盖句子的最后一个单词,或者随机覆盖中间的一个单词,让模型继续猜测,直到猜对。例如,“玛丽亚去了银行。”这里的岸是指河岸还是岸边?光看这句话是看不出来的,但如果在后面加上“抓到一条鱼”,就可以确定指的是河岸了。我们输入数十亿个句子进入模型并让它自己学习语言模式。这就是无支持学习的用武之地。当“可扩展性”和“无支持学习”这两个主要概念同时实现时,我们认为:要把所有资源投入到这项技术上。它将帮助人类解决许多以前没有解决过的问题。那一年是 2012 年。到 2016 年,我建造了世界上第一台专为深度学习而调整的超级计算机——DGX-1。黄仁勋送给马斯克的设备叫做DGX Spark,实际上是后来推出的迷你版。第一代DGX-1的价格高达30万美元,光是研发费用就花费了nvidia数十亿美元。这不再是简单的双卡SLI连接,而是利用NVLLINK技术连接8个当时最强大的GPU。它本质上是“SLI互连技术的高度改进版本”。当我第一次向公众展示 DGX-1 时第一次GTC会议上,一片寂静,没有人明白我在说什么。那时我和马斯克已经认识他很长时间了。我们帮助他开发了 Model S 和 Model 3 的车载计算机,还构建了第一代完全自动驾驶 (FSD) 计算机。 DGX-1发布后,全球没有收到一单订单,也没有人愿意买这个马斯克。当我们坐在壁炉旁聊天时,他突然说:“我有一个非营利组织,可能真的需要这样一台超级计算机。”听到这里,我的心沉了下去……一个价值数十亿美元开发的产品,每个卖了30万美元,但第一个客户竟然是非营利组织? NVDA|黄仁勋的传奇一生:9岁旅居美国,两次濒临破产。他靠着200美元为员工买书来拯救公司。他花费了数十亿美元进行研发,但没有我不在乎。只有肌肉下了命令。 PinaI 亲手组装了第一台 DGX-1。收拾好后,我开车到了旧金山,送到了Openai当时的小办公室。那是在二楼,一个比你现在所在的房间更小的房间,里面住着彼得·蒂尔、伊利亚·萨茨克夫和其他一群人。那是OpenAi的起点,那一年是2016年。DGX-1的计算能力是1 Petaflops(每秒1万亿次浮点运算)。九年后推出的 DGX Spark 也具有 1 Petaflops 的计算能力,但只有一本书大小,售价仅为 4000 美元。这就是技术进步的速度。 1993年NVIDIA成立时,我们的目标是开发一种新的计算架构来解决普通计算机无法克服的问题。但问题是:这个“杀手级应用”在哪里?当时所有现有的应用程序都可以用普通CPU来处理,否则这些应用程序就不会已被开发出来。我们写了一份当时看来“不可能”的使命宣言,但在 1993 年我对此一无所知,只是觉得它听起来很酷。那时,《毁灭战士》和《地震》还没有出现,约翰·卡马克还没有发明第一人称射击游戏。我专程去日本去了世嘉,因为当时只有街机才有真正的3D游戏——比如《VR无双》《美国梦游》。这些街机中使用的 3D 芯片实际上是从军用飞行模拟器中提取出来的,而且非常昂贵。我想知道:我们可以将这种级别的 3D 图形集成到家用计算机中吗?于是我们和世嘉签下了人生第一份大合同:“五月盘你负责把街机游戏移植到电脑平台上,我们帮你开发下一代游戏机的芯片。”这笔钱救了英伟达的命。结果,经过两年的研发,我们发现我们选择的三个主要技术路线是全部错误:其他人使用三角形来开发 3D 图形,但我们使用二次曲面;其他人使用Z-buffer技术来自动排序图形层次结构,但我们允许程序手动排序;其他人则向前使用纹理映射技术,但最关键的三个技术决策都是错误的。 1995年中期,“我们成为最快,但每场比赛都输了”。当时硅谷大约有50家3D显卡初创公司,他们都选择了正确的技术路线,但我们却惨败。公司濒临破产,世嘉还欠着开发主机芯片的任务。我飞到日本去见世嘉社长入力庄一郎。此时我33岁,满身粉刺,瘦得像个瘦子。竹子。竹子。我对着这位白发老者说道:“我要告诉你一个坏消息:我们向你承诺的技术无法实现。他想了两天,然后回答我:“我会投资。”原因很简单,“只是因为我喜欢年轻时的你。”如果他当时用500万美元买英伟达的股票,今天可能价值1万亿美元吧?不幸的是,英伟达上市后,他们卖掉了所有股份。当时公司市值只有3亿美元。拿到500万美元的毕生积蓄后,我们仍然不知道如何把技术做好。我们解雇了主机芯片研发团队的所有成员,公司只剩下几个人。口袋里只剩下200美元,我去书店买了三本硅谷图形公司(SGI)的3D图形技术“圣经”,分发给三个架构师:“去读懂这些书,然后我们就能拯救公司。”结果,他们把书看完后,把所有通用的SGI技术方案拆了,只保留了“游戏领域需要的一小部分”,把这些功能直接硬编码到了芯片里。显卡要几百块钱具有相当于百万美元SGI工作站的图形处理速度。这就是现代 GPU 的起源。我们还做出了一个重大决定:不再追求“满足所有3D应用需求”,而是专注于一件事——游戏。我们削减了 CAD 设计和飞行模拟器的所有复杂功能,并将所有资金投入到“游戏玩家看重的图形质量”上。这就是 Geforce 显卡的诞生。后来我们想开发救生芯片Riva 128,但是公司的资金已经快耗尽了。听说有公司开发了“硬件模拟器”。可以先在模拟器中运行一下驱动,确认没有漏洞后再送芯片厂流片。我们花了公司剩余资金的一半——50万美元——买了这个模拟器——只是对对方说:“我们公司已经消失了,我们仓库里还剩下最后一个。”购买这款模拟器后,我们的芯片就实现了“一次性流片成功”。“先在模拟器中验证”流程已经成为全球芯片公司的标准作业流程。芯片流片那天,我给台积电创始人张忠谋打电话:“我想直接量产这个。”我一定会成功。”张忠谋选择了相信和支持我。Riva 128显卡横空出世,NVIDIA成为历史上速度最快的公司,营收突破10亿美元。那段时间,我总感觉整个世界都在快速旋转,完全失控。即使我躺在床上,我仍然感觉世界在旋转,心里充满了巨大的焦虑。这种感觉我一生大概只经历过几次。而现在, 33 年后,我每天早上醒来都会有这种感觉——我对失败的恐惧永远大于我对成功的渴望。我并不是什么雄心勃勃的人,我只是希望公司能够生存下来,希望我们的团队能够做一些有影响力的事情。我每天醒来时做的第一件事就是凌晨 4 点起床,每天不间断地检查数千封电子邮件,包括感恩节和圣诞节等所有假期。我对“假期”的定义是“与家人共度时光”,但即使我在度假,我仍然在工作,我的孩子也在 NVIDIA 工作,每天也同样忙碌。我们家似乎有“勤奋基因”。我9岁的时候,弟弟11岁的时候,父母把我们从泰国送到了美国(当时泰国发生政变,街上到处都是坦克)。我们和一位从未谋面的叔叔住在一起,他最终帮助我们在肯塔基州最贫穷的县之一找到了一所寄宿学校,名叫奥奈达浸信会学院。这所学校专门招收“问题青少年”和国际学生。 100%的学校学生吸烟e 并携带刀具。我的室友今年 17 岁,全身都是刚刚缝合的刀伤。我9岁时的工作是打扫100个儿童宿舍的浴室。那个地区现在是美国疫情中心危机的中心,当时是全国最贫穷的县,今天仍然如此。我们和父母沟通的方式是通过录音机。每个月我们都会记录“这个月我们做了什么?”然后送他们回泰国,他们的父母会把他们的话录下来送回去。就这样,我们整整两年没有听到父母的声音了。我还在录音带上兴奋地说:“爸爸妈妈!今天我们去了一家很棒的餐厅,整个餐厅闪闪发亮,就像未来世界一样。食物很合我的口味,汉堡也太好吃了!” - 那家餐厅实际上是麦当劳。这就是我的美国梦。我是实现美国梦的第一代移民。很难不爱这个国家。 “我坚持要求CUDA技术的开发,导致该公司股价暴涨,市值一度只有2到30亿美元——因为加入cuda功能使显卡成本翻倍,但没有人准备购买。但如果我们明明相信这是未来的方向,却选择不做任何事,那么我们的余生都会后悔。”如此一来,CUDA技术彻底改变了世界。很多人都认为成功人士每天都过着幸福的生活,但事实并非如此。成功之路充满了悲伤、痛苦、羞耻、怀疑和嘲笑。但“忍受苦难是继续这段旅程的唯一途径。”我今天拥有的所有感激、自豪和珍贵的回忆,都是我自己的。从痛苦的经历中诞生。
特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息存储通用电气服务。
注:以上内容(包括图片和视频,如有)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。