图形计算是GPU的拿手绝活。当我们拖动鼠标时,GPU将需要显示的图形内容计算后呈现在屏幕上;当我们打开播放器观看电影时,GPU将压缩后的视频信息解码为原始数据;当我们玩游戏时,GPU将游戏画面计算并生成出来。轻点鼠标的背后,是复杂的处理过程,包括顶点读入、顶点渲染、图元装配、光栅化、像素渲染等。[5]
图形GPU广泛应用于游戏、图像处理和加密货币等场景,关注图像学的帧数、渲染逼真度、真实场景映射度等参数指标。[6]

对图形API定义的流水线实现硬件加速的不同阶段,制表丨果壳硬科技
参考资料丨《计算机体系结构基础》[5]
通用计算是GPU并行计算优势的最佳体现。科学家和工程师发现,只要数据以图形形式存在,并将GPU基础上增加部分通用计算能力,GPU就能胜任各种高性能模计算任务,也就是行业所说的通用GPU(GPGPU,General-Purpose Graphics Processing Unit)。本质上,通用GPU还是一种GPU,不过它会针对高性能计算、AI开发及许多其他惊人的突破上定制和靠拢,因此所使用的训练集更大、训练时间更短、分类/预测/推理功率更低、占用基础设施更少。[7]
通用GPU主要应用在大规模人工智能计算、数据中心及超算等场景,以支持更大的数据量和并发吞吐量。[6]
两大功能的背后,是一部漫长的发展史。
1962年, Ivan Sutherland(伊凡·苏泽兰)的论文《SketchPad:图形化人机交流》和他录制的Sketchpad操作视频成为定义现代计算机图形学的基础[8]。之后的20年内,受精度和运行强度等限制,彼时的显卡仅仅是将CPU计算生成的图形翻译成显示信号,所以只能称作图形适配器(VGA Card)[9]。直到IBM在1984年推出了MDA和CGA两款2D显卡,才意味着行业产生雏形,虽然放到现在两款产品只能算作是丑小鸭,但却标志着GPU开始走向与CPU分庭抗礼之路。
上世纪90年代,3D图形加速兴起。历史上第一块真正意义的3D图形加速卡Voodoo问世后,S3又推出第一款同时拥有2D和3D图形处理能力的显卡S3 Virge[10],此后行业便开始多点开花,逐渐诞生出NVIDIA的NV1、Matrox的Mlennium、Mystique、PowerVR的PCX1等优秀产品,一度显现出百家争鸣的盛况。繁华过后,便是残酷的大鱼吞小鱼式并购和行业整合,形成英伟达、AMD两家独大的格局。自此之后,GPU也开启了跨越式的迭代之路。

独立显卡发展历史,制表丨果壳硬科技
参考资料丨IEEE Computer SOCIETY[11],英伟达官网[12],公开资料
GPU的通用性,是在迭代中逐渐表露出来的。20世纪90年代到21世纪初,为应对更为复杂和大量的图形计算问题,GPU模式不再为固定图形流水线模式,处于图形流水线中的顶点处理器、几何处理器、像素与子素处理器的可编程性得到增强,表现出通用计算能力。随后,为解决GPU片内负载均衡问题,统一渲染处理器(Shader Processor)取代了各种可编程部件,同时流处理器(一种流计算模型上充分考虑并发和通信的计算体系)的应用奠定GPU通用计算的基础。[13]