这期视频我们将从硬件和架构两方面为你详细讲解显卡是如何被设计出来的。我们先来说硬件,显卡里面最重要的就是这块GPU芯片。那GPU和CPU有什么区别呢?首先在核心方面,GPU拥有超过1万个核心,如果我们查看安装到主板的CPU,你会发现好点的CPU也仅仅只有24个核心。如果单从核心上看,你可能会认为GPU要比CPU强大很多倍,其实并不是这样的。如果我们把GPU比作一艘大型的货船,那么CPU就是一架大型的喷气式飞机。货船可以一次装载大量的集装箱货物,但是运行的速度较慢,而喷气式飞机飞得很快,但是容量有限,不过飞机更加灵活,它不仅可以运载集装箱,还能运载各种不同的乘客和包裹。在运算方面,GPU只能运行相对简单的指令,而CPU执行的指令则更为复杂。另外,CPU和GPU的运用领域有所不同。如果你想并行执行海量的、简单的计算任务,那么GPU可以更快的完成,如果你需要执行少量但是指令很复杂的计算任务,那么CPU则更适合。此外,如果你想要运行操作系统、支持网络连接以及各种不同的应用程序,也是需要CPU的。接下来我们就打开一块显卡来详细了解一下内部的各个硬件。这是一块大的印刷电路板,上面安装着各种不同的组件。我们先从显卡的大脑GPU讲起。打开GPU,它的内部是一款名为GA102的芯片,该芯片由283亿个晶体管构建而成。芯片很大一部分都被处理核心占据着,整个处理核心被分成了7个图形处理集群,每个处理集群里面有12个流式处理器,每个流氏处理器内部又有4个workp和1个光线追踪核心,每个word里面又分布着32个qda核心和1个张亮核心,整个GPU一共有10752个qda核。336个张亮核心以及84个光线追踪核心,正是这三种类型的核心执行了GPU的所有运算,并且每个核心功能有所不同。Q带核心可以看作一个简单的二进制计算器,可以计算一些加减乘除或者位移运算。Q带核心也是在运行游戏时运用最多的,而张亮核心可以看成一个矩阵计算器,用于计算矩阵数据,在几何变换、神经网络和人工智能领域运用比较多。光线追踪核心是最大的,但是数量也是最少的,主要用于执行光线追踪算法,可以让我们的游戏场景非常逼真。其实市场上主流的N卡都是使用的GA102芯片,那为什么用同样的芯片,显卡价格却有很大的区别呢?这是因为厂商在制造显卡芯片时,有的图案错误进入灰尘颗粒或者其他制造问题会导致有些位置损坏,从而产生电路缺陷,但是这种芯片并不会丢掉。工程师会。仔细测试芯片并将缺陷部分找出来,并永久隔离和停用这些区域。这些缺陷区域只会影响特定的流式多处理器的电路,而不会影响芯片的其他区域。因此这些芯片会根据缺陷的数量来进行测试和分类,从而分成各种不同类型的显卡。一般来说,越高端的显卡能够正常使用的核心越多,而越低端的显卡能够正常使用的核心数会相应的减少,价格自然比较便宜。说完芯片的处理核心,我们再看一下芯片的其他部分。在芯片的边缘周围有12个图形内存控制器,1个MVlink控制器和一个pcie接口,这个位置还有两个二级缓存,二级缓存的中间是图形处理集群和流式处理器的引擎。讲解完GPU芯片,我们再看看显卡上其他的组件,在GPU的周围有一圈图形内存芯片,一共24个,这些芯片被称为GDDRX芯片。当我们启动网。过游戏时,加载游戏是需要一定时间的,这个加载过程其实就是将游戏的特定场景或者环境模型从固态硬盘加载到这些图形内存芯片中。因此,为了渲染游戏不同的场景数据会在内存和GPU之间不断的传输,每秒能执行数十万亿次的计算。整个过程跟码头类似,这24个内存芯片就像24台起重机,不停的向GPU这艘巨轮上装载货物。24个内存芯片与GPU之间的总线宽度达到384位,也就是每秒能够传输1.15TB的数据。相比之下,CPU和GM内存之间的总线宽度只有64位,最大每秒只能传输64GB的数据。接下来我们来到显卡的侧边,这是显卡不同类型的外接端口,用于与显示器连接。这边这个是12伏的电源连接器转到这边,这个是用于将显卡插入到主板上的pciia插口,另外电路板上还有有比较小的组件。组成的电压调节器模块,该模块可以接收12伏的电压,并将电压转换为1.1伏以供GPU使用。由于显卡的计算量比较大,所以显卡会散发大量的热量,因此在GPU上面还有一个四管的散热器,以便将GPU和其他组件的热量通过散热器的翅片散发出去。说完硬件,下面我们接着说显卡的架构,也就是显卡的SIM,它也是显卡能够运行网络游戏、实现人工智能的关键之所在。GPU在处理任务时,会将任务分成很多的小任务进行并行处理。而通过simd,我们只需要对GPU输入单一的指令,GPU就能让大量的线程任务同时执行这个指令,从而实现海量及数据的并行计算。本质上,每条指令由一个线程完成,一个线程对应一个Q大核心,然后我们可以将每32个线程一组捆绑成一个线程数,之后向线程数中的32个线程发送相同的指令。我们。可以将多个线程数在组合形成一个流式处理器可以处理的线程块,然后将线程块再分组成一个个的网格,最后发送到GPU上进行处理。所有的这些线程块都由GPU上的流式处理器引擎进行调度和管理,它可以有效的将线程块映射到可用的流式处理器进行处理。由于这些流式处理器内部有上万个Q大核心,所以这些线程任务都会被分配到大量的大核心上进行并行运算,因此执行速度非常快。在Simd架构中,每个线程数中的32个线程彼此步调是一致的,就像士兵一样一排排的顺序通过。但是到了2016年,一种比较新的SIM架构出现了,它与SIM架构不同的地方在于任务指令的发送还是一样的,但是SIM的线程彼此之间不需要同步执行,速度有的快有的慢,所以提供了更大的灵活性。
我司专注于 线路板ERP, 线路板生产系统, 线路板ERP系统, 线路在线下单系统, 线路板下单系统, PCB下单系统, PCB小批量系统,
线路板厂家。多年来一直专于线路板生产,PCB生产系统,多层板生产系统等。
Donec id elit non mi porta gravida at eget metus amet int
Donec id elit non mi porta gravida at eget metus amet int
Donec id elit non mi porta gravida at eget metus amet int