jax.experimental.pallas.mosaic_gpu.GPUCompilerParams#
- class jax.experimental.pallas.mosaic_gpu.GPUCompilerParams(*, approx_math=False, dimension_semantics=None, max_concurrent_steps=1, delay_release=0, profile_space=0, profile_dir='', lowering_semantics=LoweringSemantics.Lane)[source]#
Mosaic GPU 编译器参数。
- 参数:
- dimension_semantics#
内核的每个网格维度的维度语义列表。 “parallel” 用于可以以任何顺序执行的维度,或 “sequential” 用于必须按顺序执行的维度。
- 类型:
DimensionSemantics 序列[DimensionSemantics] | None
- delay_release#
重用输入/输出引用之前等待的步数。 默认为 0,并且必须严格小于 max_concurrent_steps。 通常,如果您不在主体中等待 WGMMA,则需要将其设置为 1。
- 类型:
- __init__(*, approx_math=False, dimension_semantics=None, max_concurrent_steps=1, delay_release=0, profile_space=0, profile_dir='', lowering_semantics=LoweringSemantics.Lane)#
方法
__init__
(*[, approx_math, ...])属性
PLATFORM
lowering_semantics