JAX 调试标志#

JAX 提供了标志和上下文管理器,可以更轻松地捕获错误。

jax_debug_nans 配置选项和上下文管理器#

总结: 启用 jax_debug_nans 标志可自动检测 jax.jit 编译代码中何时产生 NaN(但不包括 jax.pmapjax.pjit 编译的代码)。

jax_debug_nans 是一个 JAX 标志,启用后,当检测到 NaN 时会自动引发错误。它对 JIT 编译有特殊处理——当从 JIT 函数中检测到 NaN 输出时,该函数会以急切模式(即不进行编译)重新运行,并在产生 NaN 的特定原语处抛出错误。

用法#

如果您想追踪 NaN 在函数或梯度中出现的位置,可以通过以下方式开启 NaN 检查器:

  • 设置环境变量 JAX_DEBUG_NANS=True

  • 在主文件顶部附近添加 jax.config.update("jax_debug_nans", True)

  • 在主文件中添加 jax.config.parse_flags_with_absl(),然后使用命令行标志(例如 --jax_debug_nans=True)设置选项;

示例#

import jax
jax.config.update("jax_debug_nans", True)

def f(x, y):
  return x / y
jax.jit(f)(0., 0.)  # ==> raises FloatingPointError exception!

jax_debug_nans 的优点和局限性#

优点#
  • 易于应用

  • 精确检测 NaN 的产生位置

  • 抛出标准 Python 异常,并与 PDB 事后调试兼容

局限性#
  • 不兼容 jax.pmapjax.pjit

  • 急切模式下重新运行函数可能很慢

  • 误报错误(例如,有意创建的 NaN)

jax_disable_jit 配置选项和上下文管理器#

总结: 启用 jax_disable_jit 标志可禁用 JIT 编译,从而可以使用 printpdb 等传统 Python 调试工具

jax_disable_jit 是一个 JAX 标志,启用后会禁用 JAX 中的 JIT 编译(包括 jax.lax.condjax.lax.scan 等控制流函数)。

用法#

您可以通过以下方式禁用 JIT 编译:

  • 设置环境变量 JAX_DISABLE_JIT=True

  • 在主文件顶部附近添加 jax.config.update("jax_disable_jit", True)

  • 在主文件中添加 jax.config.parse_flags_with_absl(),然后使用命令行标志(例如 --jax_disable_jit=True)设置选项;

示例#

import jax
jax.config.update("jax_disable_jit", True)

def f(x):
  y = jnp.log(x)
  if jnp.isnan(y):
    breakpoint()
  return y
jax.jit(f)(-2.)  # ==> Enters PDB breakpoint!

jax_disable_jit 的优点和局限性#

优点#
  • 易于应用

  • 支持使用 Python 内置的 breakpointprint

  • 抛出标准 Python 异常,并与 PDB 事后调试兼容

局限性#
  • 不兼容 jax.pmapjax.pjit

  • 不进行 JIT 编译运行函数可能很慢