jax.experimental.pallas.mosaic_gpu.commit_tmem#

jax.experimental.pallas.mosaic_gpu.commit_tmem()[源]#

提交当前线程发出的所有TMEM写入。

此函数返回后,当前线程调用 async_store_tmem 的效果将对TMEM加载、MMA以及带有 orders_tensor_core=TrueBarrier 操作可见。