术语表#

数组#

JAX 中与 numpy.ndarray 对应的类型。请参阅 jax.Array

CPU#

中央处理器的缩写,CPU 是大多数计算机中可用的标准计算架构。JAX 可以在 CPU 上运行计算,但通常在 GPUTPU 上可以获得更好的性能。

设备#

用于指代 JAX 执行计算所使用的 CPUGPUTPU 的通用名称。

前向模式自动微分#

请参阅 JVP

函数式编程#

一种编程范式,其中程序通过应用和组合 纯函数 来定义。JAX 旨在与函数式程序一起使用。

GPU#

图形处理器的缩写,GPU 最初专门用于屏幕图像渲染相关的操作,但现在已变得更加通用。JAX 能够以 GPU 为目标进行数组的快速操作(另请参阅 CPUTPU)。

jaxpr#

JAX 表达式的缩写,jaxpr 是 JAX 生成的计算中间表示,并转发给 XLA 进行编译和执行。有关更多讨论和示例,请参阅JAX 内部机制:jaxpr 语言

JIT#

即时编译的缩写,JAX 中的 JIT 通常指将数组操作编译为 XLA,最常通过使用 jax.jit() 来实现。

JVP#

雅可比向量积的缩写,有时也称为*前向模式*自动微分。有关更多详细信息,请参阅雅可比向量积(JVP,又称前向模式自动微分)。在 JAX 中,JVP 是一种通过 jax.jvp() 实现的 转换。另请参阅 VJP

原语#

原语是 JAX 程序中使用的基本计算单元。jax.lax 中的大多数函数都代表单个原语。在 jaxpr 中表示计算时,jaxpr 中的每个操作都是一个原语。

纯函数#

纯函数是其输出仅基于其输入且没有副作用的函数。JAX 的转换模型旨在与纯函数配合使用。另请参阅 函数式编程

pytree#

pytree 是一种抽象,它允许 JAX 以统一的方式处理元组、列表、字典以及其他更通用的数组值容器。有关更详细的讨论,请参阅使用 pytrees

反向模式自动微分#

请参阅 VJP

SPMD#

单程序多数据的缩写,它指的是一种并行计算技术,其中相同的计算(例如,神经网络的前向传播)在不同的输入数据(例如,批次中的不同输入)上,在不同的设备(例如,多个 TPU)上并行运行。jax.pmap() 是一个实现 SPMD 并行性的 JAX 转换

静态#

JIT 编译中,指未被追踪的值(请参阅 Tracer)。有时也指对静态值进行编译时计算。

TPU#

张量处理单元的缩写,TPU 是专门为深度学习应用中 N 维张量的快速操作而设计的芯片。JAX 能够以 TPU 为目标进行数组的快速操作(另请参阅 CPUGPU)。

Tracer#

一个用作 JAX 数组的替代对象,用于确定 Python 函数执行的操作序列。在内部,JAX 通过 jax.core.Tracer 类实现此功能。

转换#

一个高阶函数:即一个将函数作为输入并输出一个转换后函数的函数。JAX 中的示例包括 jax.jit()jax.vmap()jax.grad()

VJP#

向量雅可比积的缩写,有时也称为*反向模式*自动微分。有关更多详细信息,请参阅向量雅可比积(VJP,又称反向模式自动微分)。在 JAX 中,VJP 是一种通过 jax.vjp() 实现的 转换。另请参阅 JVP

XLA#

加速线性代数的缩写,XLA 是一种用于线性代数操作的领域专用编译器,它是 JIT 编译的 JAX 代码的主要后端。请参阅 https://www.openxla.org/xla/

弱类型#

一种 JAX 数据类型,具有与 Python 标量相同的类型提升语义;请参阅JAX 中的弱类型值