Tensor Core:张量核心;指现代 GPU(尤其是 NVIDIA)中专门用于加速张量运算/矩阵乘法(如 GEMM)的硬件单元,常用于深度学习训练与推理(例如 FP16、BF16、TF32、INT8 等混合精度计算)。该术语也可泛指“用于张量计算的专用核心”。
/ˈtɛn.sər kɔːr/
Tensor Cores can speed up deep learning training.
张量核心可以加速深度学习训练。
By using mixed precision, the model achieved higher throughput because Tensor Cores handled the matrix multiplications efficiently.
通过使用混合精度,该模型获得了更高的吞吐量,因为张量核心能高效处理矩阵乘法运算。
该词由 tensor(张量) + core(核心/计算核心) 组合而成;“Tensor Core”作为专有名称主要由 NVIDIA 在其 GPU 架构(如 Volta、Turing、Ampere 等)中推广,用来指代面向张量/矩阵运算的专用硬件加速单元。