GPU是如何用来训练AI大模型的

一说到显卡,大多数人第一反应就是,这不是给打游戏用的吗?其实显卡除了用于加速图形渲染外,还有一个王炸功能,那就是它的GPU可以作为AI芯片使用。这期视频我们就重点讲解显卡的AI芯片功能。首先我们先来了解一下显卡,打开显卡,里面是一块PCB电路板,电路板上最重要的元件就是这块GPU芯片。跟CPU芯片一样,GPU芯片内部也集成了上百亿的晶体管,但是不同的是,GPU内部的核心数能达到上万个,而CPU一般只有少数的几个核心。为什么GPU的核心数需要这么多呢?这就跟GPU处理的任务有关系了。我们以3D游戏为例,你在游戏中看到的任何画面都是通过GPU渲染出来的,游戏里面的每一个物体都是由无数个小三角形相互连接组成,每个小三角形拥有3个顶点,每个顶点在3D世界都有相应的坐标值,根据每个三角形在空间中的位置进行连线。我们就能组合成一个3D模型,然后再根据3D模型给每个三角形贴上相应的皮肤,一个3D模型就渲染出来了。整个过程看似简单,但是计算机处理起来却非常复杂。在现实世界中,人移动时,眼睛看到的物体是不断变化的,为了模拟眼睛的效果,在计算机图形学中是使用一个摄像机来代替眼睛的。那摄像机看到一个物体时,是如何将它渲染到一个2D视图屏幕上的呢?首先,物体在模型空间中,为了保持自己的形态,自身拥有一系列的空间坐标信息,想要知道物体在这个世界上是什么样的,就需要将物体从模型空间转换到世界空间。由于人眼睛看到的物体是不断变化的,所以物体在世界的坐标还需要根据摄像机的移动进行变化,因此世界空间最终还要转化到摄像机空间,最后摄像机空间会转化为视图,从而显示到屏幕。重点来了,不同的空间是如何进行转换的呢?我们以模型的一个顶点坐标为例,当它转移到世界空间时,自身信息会发生变化,我们可以获取到模型变化时的位置比例和旋转值,然后再转移到摄像机空间,同样的,我们也可以获取到摄像机的坐标和旋转值的变化。最后将这些坐标比例和旋转值放入矩阵转换中进行计算。矩阵转换听起来高大上,其实就是对这些值进行小学生都会的加法和乘法运算,最终得到一个对应2D屏幕的XYZ值,这只是对其中的一个顶点进行转换。但是在游戏中往往场景都非常的复杂,动辄十几万甚至上百万个顶点需要并行计算,但是这些大量的简单的并行计算任务是完全没有必要消耗CPU的计算资源的,所以为了解放CPU,就诞生了专门为简单的并行计算而生的GPU,它拥有成千上万个核心,当把大量的计算任务丢给GPU后,GPU会将这些任务立即分给核心上的。计算逻辑单元进行计算,从而快速得到输出结果,因此你在玩游戏时感受不到任何延迟。那GPU是如何做到大规模并行计算的呢?回答这个问题前,如果你也想学习制作知识动画,可以下载左下角的精选APP,它里面不仅可以学习机械原理、工程建设,还能了解武器装备,赶紧下载试试吧,这里有100个计算任务需要GPU处理,每个任务为一个线程,最理想的状态就是将这100个线程任务分别给100个GPU核心进行处理。问题是GPU处理的都是海量的计算任务,如果有100万个任务要处理,就需要100万个核心,这显然是不现实的。但是如果我们将100万个任务发送给1000个GPU核心去处理,可以看到,整个分配过程又会极其复杂,为了方便,我们将1000个GPU核心,每100个一组分成10组,在进行任务分配就会简单很多,对应的100万个线程任务我们也可以进行分。每1000个任务一组分成1000组,然后再进行分配,分配过程就更简单了。但是问题是每一组现成任务有1000个,对应的处理核心只有100个。为了进一步优化,我们可以将每组的1000个现成任务继续进行分组,每100个一组分成10组,这样100个线程任务就能对应100个核心进行处理了。GPU就是以这种极其高效的任务分配来提供高性能的计算服务的。其实说到这里,GPU还都是为了图形渲染而服务的,那它是如何演变成AI芯片的呢?这跟AI浪潮的来临有很大的关系。AI模型需要不停的进行大量的并行计算,特别是矩阵计算,以此来完成模型的深度学习和快速训练,而GPU刚好契合了AAI大模型计算的需求。但是其他厂商也生产了很多专业的AI芯片,为什么就英伟达能成为AI领域的天选之子呢?这就不得不说GPU的qdaqda才是英伟达。等起飞的关键。为了构建通用的并行计算架构,英伟达早在2007年就推出了Q带并行计算平台和编程模型,并且之后的每一代GPU都支持库的。有了库的后,任何人都可以在这个平台来进行开发,开发者可以随意调用GPU强大的计算能力来满足自己的计算需求。比如你编写了一段这样的库的代码,当代码发送到GPU运行后,GPU会从内存拿到相关的数据,接着CPU就会告诉GPU并行执行该程序,那么GPU就会按照需求自动将任务分成100个线程,然后分配给100个核心去计算执行。至于具体如何分配线程,程序员完全不用去关心。但是Q的在当时退出时并不吃香,因为显卡当时还仅仅用于图形加速渲染。Q的的商业价值并没有显现,这也使得很多公司并没有下场来做类似Q的的平台。但是随着AI的爆发,开发者可以通过qda调用GPU强。强大计算能力的优势以及本身GPU芯片性能过硬,一下子吸引了大量的开发者涌入带平台,其中最有名的就是chatgPPchatgPP使用了上万颗的英伟达GPU来训练自己的AI模型,这也使得chatgPP一举成为全球最有名的AI大模型。Qda也成为了英伟达最大最深的护城河,几乎全球所有的大型科技公司都在通过Q的来使用英伟达的GPU,市场份额接近90%,这也为英伟达构建了一个牢不可破的巨大生态。另外,英伟达每年还在不断的推出打破摩尔定律的超级AI芯片,使得英伟达领头羊的地位还在不停的扩大。那么问题来了,你觉得想要突破英伟达的护城河,国产GPU的出路到底在哪里呢?

我司专注于 线路板ERP线路板生产系统线路板ERP系统线路在线下单系统线路板下单系统PCB下单系统PCB小批量系统

线路板厂家。多年来一直专于线路板生产,PCB生产系统,多层板生产系统等。


Latest Blog Post

02 May 2014

Donec id elit non mi porta gravida at eget metus amet int

02 May 2014

Donec id elit non mi porta gravida at eget metus amet int

02 May 2014

Donec id elit non mi porta gravida at eget metus amet int