jax.experimental.pallas.mosaic_gpu.commit_tmem# jax.experimental.pallas.mosaic_gpu.commit_tmem()[源]# 提交当前线程发出的所有TMEM写入。 此函数返回后,当前线程调用 async_store_tmem 的效果将对TMEM加载、MMA以及带有 orders_tensor_core=True 的 Barrier 操作可见。