您的位置 首页 节日美文

Amazing! 老黄GTC演讲再推英伟达黑科技 |PlayMeigu

Follow Us. Let’s PlayMeigu.

关注玩美股,领取见面礼

致读者

  • 本文为【玩美股|商业领袖】2018年第33期总第233期
  • 关注和置顶玩美股公众号,尊享Premium服务
  • 全文共有:5800字| 读完需要:10分钟
【玩美股重磅报告】

玩美股先后推出Facebook、中国互联网、Google等一系列重磅报告。关注玩美股公众号,回复相应关键词,即可下载PDF报告全文。
1.《PlayMeigu首次覆盖-加拿大鹅(GOOS)》:回复“CG”或”G”。
2.《2018中国互联网展望报告》:回复“2018”或”Outlook”
3.《2017中国互联网展望报告》:回复“86”或”CN”。
4.《Facebook首次覆盖研究报告》:回复“100”或”FB”。
5.《Google首次覆盖研究报告》:回复“99”或”GOOG”。
6.《Snap IPO解读报告》:回复“32”或”s”。
7.《加拿大鹅(GOOS) IPO解读报告》:回复“GOOS”或”e”。
8.《PlayMeigu首次覆盖报告-安德玛(UA)》:回复“UA”或”ua”。
9.《PlayMeigu首次覆盖报告-Visa & MasterCard》:回复”P”或”88″。
10.《PlayMeigu首次覆盖报告-Lululemon》:回复”LU”或”lu”。

PlayMeigu玩美股群聚集大量资深美股专业和非专业人士。加微信号playmeigu,申请加入群内讨论美股。

英伟达创始人&CEO 黄仁勋 (Jensen Huang)

导读
3 月 27 日,英伟达(NASDAQ: NVDA)在总部加州圣何塞揭开第九届GPU技术大会(GTC)序幕。英伟达创始人兼CEO黄仁勋发表首场主题演讲。老黄在演讲中宣布了公司在GPU(图形处理器)、AI(人工智能)平台、自动驾驶等领域的一系列进展。他还在现场展示了“全球最大的GPU”——DGX-2工作站以及用于自动驾驶测试的DRIVE Constellation仿真系统。值得一提的是,3月18日,Uber自动驾驶测试车辆发生事故,而Uber使用了英伟达的GPU计算技术和处理器。因此,在周二GTC大会前夕,英伟达宣布暂停公司在全球范围的自动驾驶测试项目,当天公司股价收跌7.76%。

Amazing GTC!
周二,英伟达在公司总部加州圣何塞举行第九届GPU技术大会。公司创始人兼CEO黄仁勋身着标志性黑色皮夹克亮相,发表近两个半小时的主题演讲。

老黄表示,GTC是GPU计算开发者的大会,人们需要将各种领域的信息、体验可视化,因此GPU行业规模巨大。全球计算机显卡行业和计算机科学家一直在追求一个崇高的理想:重现“逼真”(photorealistic)图像。
谈到大会主题,老黄一口气说了四个Amazing: Amazing Graphics, Amazing Science, Amazing AI, Amazing Robots。作为GPU行业的领导者,英伟达利用光线追踪(Ray Tracing)、焦散(caustics)等技术重塑静态物体的图像,效果非常逼真。比如下图中高亮物体的细节,可谓是细致入微、栩栩如生。

环境光遮蔽视觉效果(应用于游戏等领域)

他在现场演示了《星球大战》的一个片段,借助一台DGX工作站的计算能力,阴影、反射等效果令人震撼。

英伟达DGX工作站

#海量PPT,尽在名片行App。名片行让您“边交职场朋友,边学习知识”【推广】

接下来是第一个发布环节:推出RTX技术 & QUADRO GV100 GPU
黄仁勋宣布英伟达正式发布RTX光线追踪技术。这项技术历时10年研发,第一次完整呈现在公众面前。
同时发布的还有基于英伟达RTX技术的Quadro GV100 GPU显卡。这款显卡可以实现实时光线追踪。其中的技术包含多个层面,比如GPU架构、算法。深度学习为光线追踪提供了必要条件。深度学习可以预测光线。英伟达Volta GPU以及RTX技术已经融入三个最重要的渲染API:英伟达OptiX, 微软DxR (DirectX Raytracing)和Vulcan。

QUADRO GV100是全球第一个基于Volta架构的工作站GPU。两台GV100可通过NVLink2连接,变成一台计算能力出众的工作站。黄仁勋发布基于英伟达RTX技术的Quadro GV100 GPU

谈到新产品Quadro GV100 GPU的价格,老黄抛出自己的一个“口头禅”:“你买的GPU越多,你省的钱越多。”(The more GPUs you buy, the more money you save.)
传统的渲染工厂包括280台双核CPU服务器,功率168千瓦。使用英伟达RTX架构和Quadro GV100 GPU渲染时,只需要14台四核GPU服务器,功率仅为24千瓦。相比之下,后者的成本是前者的1/5,空间是前者的1/7,功率是前者的1/7。

英伟达RTX技术已经应用到工具类企业(Adobe, Autodesk等)、游戏引擎开发公司(Epic Games等),覆盖游戏、媒体娱乐、产品设计、建筑设计等领域。这些企业能够创作更多(帧)的图像,更快地交付产品,节省更多的成本。RTX技术将重新定义下一代计算机显卡技术。

#想在开会时认识同行?想知道同一写字楼园区都有哪些职场人脉可以交往?名片行App来帮你忙。打开App就可以看到附近人的名片。一键交换!【推广】

全球图像处理市场怎么样?
据老黄介绍,全球每年使用光影烘焙(light baking)技术渲染的图像预计达到10亿帧,涉及游戏、电影、产品设计、建筑设计等领域。其中,游戏400部、电影500部、1200万产品设计师和15万建筑师都应用了这项技术。
以游戏为例,首先用光线追踪技术预先渲染图像,然后借助光影烘培技术渲染静态光线,形成光影贴图。一些汽车广告看起来高大上,那些汽车其实并不存在,都是用“逼真渲染”(photorealistic rendering)技术创造出来的。

“市场这么大”

黄仁勋预测,随着英伟达RTX架构和Quadro GV100 GPU的推广,全球渲染图像的数量将增长10倍。

回顾GPU的崛起,不得不佩服老黄的眼光
十五年前,英伟达预测GPU的用途会越来越广。公司希望GPU变得更加通用,帮助用户模拟现实世界,创造虚拟现实。模拟离不开各种算法,涉及粒子物理学、流体动力学、光线追踪技术等。

现实世界的模拟需要通用的超级计算架构。过去十年,英伟达GPU的兼容性越来越好,架构越来越先进。通常来说,加速器只擅长做一件事:加快计算机显卡的计算速度。GPU不断创造工具、系统、连接,为各种应用提供支持。最后达到引爆点,GPU就成了一种常用的计算架构。
GPU的发展恰逢其时。如今,各种应用程序层出不穷。AI软件开始自动编写软件,但需要超级计算机的支持。超级计算机成为科学研究的基本支柱之一。人们开始思考如何为自动化机器研发AI技术。
目前,全球有多达100万的GPU开发者,规模在过去五年增长了十倍。GTC也成了全球的顶尖科技活动之一。
推出十年以来,英伟达的并行计算平台与编程模型CUDA?达到800万下载量,其中去年的下载量占到将近50%。

科普时间:科学研究需要超级计算机
突破性科学研究需要能力更强的计算机。比如,改造人类储存能源的方式,了解地核和预测未来灾难,掌握和模拟气候变化,了解HIV病毒的病理等。这些科研项目需要用超级计算机模拟很多天。我们希望研发一台超大规模的计算机,将上面这些项目的模拟时间统统缩短到一天。超级计算机在科研领域的应用

2013年,英伟达推出Fermi GPU服务器。2018年,公司发布了Volta GPU服务器,计算速度提高了25倍。按照摩尔定律应该在五年内提高10倍的速度。
对比发现,GPU改进后的效果非常显著。传统的高性能计算集群(HPC Cluster)需要600台双核CPU服务器,功率360千瓦。而英伟达Tesla V100只要30台四核GPU服务器,功率低至48千瓦。后者的成本、空间和功率分别是前者的1/5, 1/7和1/7。

第二个发布环节:推出医疗影像专用的超级计算机Clara
实践证明,早发现早治疗,是医治疾病的有效方法。

最近,随着计算技术的提升,CT、磁共振、超声波等影像检测手段都得到了改进。事实上,英伟达的CUDA架构已经普遍应用到了医疗影像领域:收集传感信息,处理医疗影像,重建3D图像,将图像可视化和分区,利用深度学习工具检测问题。
下面左边这个图是15年前的超声波检测图像,和现在的技术差不多。右边这个图更加先进,包括3D成像、可视化、分区等技术的应用结果。

问题来了,假设全球有300-500万台医疗设备,每年新增10万台,至少要30年才能更换所有医疗设备。我们不能再等30年。我们能不能将现有的医疗设备连接到数据中心的超级计算机上?
英伟达有自己的办法。公司开发的Clara是一个数据中心,一台可视化、远程、多模式、多用户、医疗超级计算机。黄仁勋笑着说,这个描述太长了,简单来讲,Clara就是一台医疗影像超级计算机。用户可以把它放在数据中心或者云端,用来升级任何一台医疗设备。

第三个发布环节:推出“全球最大的GPU”
深度学习驱动人工智能的发展。深度学习能够自动检测数据的重要特征,通过算法重建知识结构。随着加入的信息和数据越来越多,知识结构会变得更加强大。因此,深度学习需要海量的数据和大量的计算能力。
英伟达不断发展和提升深度学习和AI所需的GPU计算能力。黄仁勋宣布推出32GB的Tesla V100 GPU、DGX-1和DGX工作站。其中,新的Tesla V100 GPU体积不变,内存翻一番。

黄仁勋宣布英伟达发布“全球最大的GPU”—— DGX-2。这是全球迄今为止最大的显卡,包括16个由NVSwitch连接的32GB Tesla V100,每秒两千万亿次浮点运算能力,512GB HBM2内存,高达14.4TB/s的吞吐量,81920个CUDA内核,占用 15 个数据中心机架空间,而体积缩小 60 倍,能效提升 18 倍,功率仅为10千瓦。

老黄掐指算了一下,这个GPU每秒传输14.4TB的数据。假设一部高清电影10G,传输1440部电影,只要一秒钟就搞定。一个人一辈子也看不了这么多电影。一秒钟下载1440部高清电影,这是什么概念!“影迷”的梦想成真了。

DGX-2的运算速度是DGX-1的10倍。要知道,DGX-1是去年9月才推出的。DGX-2的速度还是2010年11月推出的GTX 580的500倍,5年间提升了500倍。
DGX-2不仅速度更快,并且价格不菲,这款全球最强大的GPU售价39.9万美元(人民币250万元)。

这不只是一块芯片的创新,而是整个软件堆栈的创新。英伟达公司上千名工程师都参与了深度学习的创新,才取得今天的成绩,未来必将发展更快。随着数据量的飞速增加,GPU计算能力的飞速发展,深度学习网络和人工智能模型的能力和有效性必将日新月异。

还记得英伟达去年推出的GPU云吗?
去年的GTC上,英伟达推出了英伟达GPU云(NVIDIA GPU Cloud,简称NGC),但它不是一个云计算“云”,而是帮助人们便捷、简单地从零开始搭建一个深度学习项目。过去一年里,英伟达不断完善、加强NGC的功能。在大会上,黄仁勋宣布,亚马逊AWS、阿里云、DGX、GCP、Oracle云上都开始支持英伟达GPU云了。

只需要一个英伟达账号,无论在PC、DGX或者NGC哪一种平台,开发者都能跨平台接入最新的深度学习框架,利用最新的GPU计算资源。一句话,英伟达表示使用NGC以后,深度学习的模型从原型到部署都更为容易,并且可以灵活使用计算资源。
目前英伟达提供了30个云端容器,共有约两万个机构注册用户。

第四个发布环节:推出人工智能推理软件TensorRT 4.0
推理是非常困难的工作。精度、通量、能源效率、学习速度……各种变量要考虑。如何改进推理能力?
黄仁勋在现场推出了最新版本的TensorRT——TensorRT 4.0。TensorRT 4.0提供高度精确的INT8与FP16网络执行,可用于快速优化、验证及部署在超大规模数据中心、嵌入式与汽车 GPU 平台中经过训练的神经网络。
并且,TensorRT 4.0软件已集成至谷歌的TensorFlow 1.7开发系统。开发者可利用Volta Tensor Core 技术将英伟达深度学习平台的推理吞吐量提高 8 倍(相比低延迟目标下的普通 GPU 执行),从而让 GPU 在 TensorFlow 内的推理实现了最高性能。
与此同时,语音识别框架 Kaldi 对 GPU 进行了优化。GPU 语音加速意味着消费者将获得更加准确与实用的虚拟助手,并降低数据中心运营商的部署成本。
ONNX是Facebook和微软最初创建的开放格式,开发者可通过此格式,在不同框架之间交换模型。在TensorRT开发容器中,英伟达创建了可将ONNX模型部署至TensorRT推理引擎的转换器,让应用程序开发者能够更轻松地将低延迟、高吞吐量的模型部署至TensorRT。
这些附加功能让开发者能够一站式地进行软件采购,以支持其从研究、应用开发到训练和部署的所有AI计算需求。

公司还宣布,英伟达GPU 已经支持由 Google 孵育的 Kubernetes 容器编排系统了。 Kubernetes可在主机集群之间提供一个能够自动化部署、可拓展、应用容器可运营的平台,通常结合docker容器工具工作,并且整合多个运行着docker容器的主机集群。公司现场演示了Kubernetes强大的计算能力和容错空间。

然后,黄仁勋骄傲地宣布,Titan V(市面上最高级的显卡)又又又断货了。

老黄谈英伟达自动驾驶技术
黄仁勋认为,交通行业是全世界最大的产业之一,产值10万亿美元,未来所有的移动装置都将由自动驾驶技术驱动、或配备自动驾驶装置。
自动驾驶安全技术可能是这个世界最难解决的计算问题。上周特斯拉的车祸再次提醒人们安全的重要性,英伟达表示将尽全力逐步解决这个问题。
英伟达计划把车辆上的各种感应装置整合成一个超级感应器,可以测量深度、识别动作、发现障碍、理解场景、并在黑暗中识别物体。这个感应器需要进行高速实时计算,并及时做出反应动作,非常复杂。
这种算法从来没有被完整创造过。但黄仁勋有信心英伟达可以解决这个难题,对社会做出贡献。解决方案由四个部分组成:收集数据,大量数据;训练模型,世界各处的交通状况都不一样,公司必须充分训练模型;模拟场景,这是自动驾驶成功的基础;驾驶能力,计算机得有足够马力进行实时计算,在这里能源效率很重要,因为这意味着更长的电池时间,更长的行车里程。

老黄介绍说,对于在自动驾驶中收集到的海量数据,英伟达在数据工厂中动用大量的专业人员以及先进的AI工具来对其进行标记,1500名工作人员每个月大概能标记大100万幅图像。
英伟达此后通过自己的DGX超级计算机对这些标记过的数据进行处理,以此为基础构建起了感知基础架构系统(Perception Infrastructure)。老黄相信这样的做法能够让全球上千万的车辆受益。

这一系统目前已经具备专注不同方面的10个网络,而在数年后这一数目将达到20至30。每一个网络由10台DGX超级计算机负责,它们将时刻进行测试,并与收集到的数据来比对,从而达成深度学习的目的。
而这10个网络其中不少有功能上的重复,包括利用不同的传感器(相机、雷达或者光达LIDAR)对同样的场景进行分析,从而尽可能地增加数据冗余和多样性,以保证自动驾驶系统能够在所有的驾驶情况下都做出全面的分析,保证行驶的准确性和安全性。

比方说,其中的感知网络(Perception)能够探测物体避免碰撞,而可用空间感知网络(Free Space Perception)则是通过探测可用空间以规划安全行车路线。光达感知网络(LIDAR Perception)侧重又不太一样,尽管光达成像清晰度不足,但是却能极佳地反映出景深信息,从各方位补充了感知方面的完整性。

回顾DRIVE平台的发展历程
老黄表示,英伟达两年前开发了最早单芯片的解决方案PX Parker,后来发展到集成四个Parker芯片的DRIVE PX 2。

而接下来推出的DRIVE Xavier是史上最强的系统级芯片(SoC)之一,单芯片性能可以抵得上过去四个Parker芯片。在Xavier后推出的Pegasus同样也是四芯片系统,采用了两个Xavier芯片和两个Volta GPU。这两款新的解决方案性能惊人,都满足自动驾驶的需求,而且对温度和能耗都有上佳的控制,并且满足汽车ISO 26262标准中安全系数最高的ASIL-D等级。
老黄此外还展望了DRIVE平台的未来,并且宣布下一代产品将被命名为Orin,预期能用单芯片实现两个Pegasus的性能。

第五个发布环节:推出DRIVEConstellation自动驾驶仿真系统
老黄接下来介绍了自动驾驶模拟软件DRIVE SIM。他表示人类每年驾驶里程高达十万亿英里,而在美国平均每驾驶10亿英里会出现770场交通事故,但现在一个20部车的无人驾驶车队一年只能覆盖一百万英里,远远无法满足现实生活的需求,而且难以覆盖一些应急的突发路况或者天气情况。

这种背景下,DRIVE SIM能为自动驾驶研发人员提供全面的无人驾驶模拟,在很短时间内积累出海量数据。比方说下图显示的就是通过这一系统产生实时驾驶的模拟画面,并且用4个GPU在四屏上模拟出驾驶的不同视角。这些模拟的画面信息再被输入进DRIVE Pegasus中进行处理,为无人驾驶程序提供了实战演练的机会。此外,DRIVE SIM还能够重复对相同的场景和路况进行模拟,帮助无人驾驶程序在反复练习中找出最佳解决方案。

在现场演示中,除了日照背景下,测试人员还展示了该系统模拟的夜景模式,其中车灯、路灯、桥底灯光,以及警车警笛光等等光线都能通过实时动态模拟极好地进行展现,为无人驾驶程序提供了优秀的模拟场景。

老黄介绍说,英伟达为这一整套由DRIVE SIM软件和Pegasus处理器构成的平台起了个浪漫的名字“Constellation(星座)”,寓意这一平台将在云端为无人驾驶指路。英伟达也希望能够通过上千个Constellation平台来覆盖不同的驾驶路程和场景。老黄更是自信的表示,公司有信心能用一万个Constellation平台来覆盖一年30亿英里的驾驶需求。

英伟达的自动驾驶“朋友圈”越来越大
老黄表示,英伟达开放式的无人驾驶平台深受各界厂商欢迎,在汽车制造、出行、物流、地图绘制和传感等等各个产业都与世界各地多家公司建立起了良好的合作伙伴关系。前年和去年的合作伙伴数目分别为250和320,在GTC大会召开时这一数字更是达到了370。

英伟达黑科技:Holodeck实现《黑豹》炫酷场景
英伟达的VR多人交互平台Holodeck自从发布后就因其酷炫的操作方式而备受关注,但在宣传中功能强调的更多是设计为主,实战中的使用并没有太受关注。不过这次GTC大会上老黄就带领观众打开了一次“脑洞”,让人意识到了Holodeck的真正潜力。

老黄表示,尽管无人驾驶前景无穷,但是他认为人类仍然应该是最后一道保障,当AI出现故障时的应当有工作人员接手操控这些汽车,而Holodeck为此提供了全新的手段,就是允许Holodeck使用者使用VR交互界面远程操作。

在现场展示中,一位英伟达的工作人员通过Holodeck对一辆场外的无人驾驶车辆进行控制,并且通过VR在外设的方向盘顺利地完成了行驶和倒车等一系列操作。这样的黑科技无疑让人想起了漫威影片《黑豹》中瓦坎达远程驾驶汽车和飞机的场景,相信不久后的将来人类科技将真正实现身临其境的远程驾驶体验。

图为《黑豹》中瓦坎达公主Shuri远程无人驾驶的场景

【玩美股|商业领袖】推荐阅读
[八六重磅年度报告]中国互联网2018年的十五个预测

财报连续十季超出预期,英伟达再创奇迹 |PlayMeigu

直击CES-英伟达CEO霸气演讲,亮出黑科技 |PlayMeigu

用名片行App与分析师聊更多美股资讯,现在就点击阅读原文下载体验

热门文章

发表评论

邮箱地址不会被公开。 必填项已用*标注