jax.lax.conv_general_dilated#
- jax.lax.conv_general_dilated(lhs, rhs, window_strides, padding, lhs_dilation=None, rhs_dilation=None, dimension_numbers=None, feature_group_count=1, batch_group_count=1, precision=None, preferred_element_type=None)[源代码]#
通用的 n 维卷积运算符,支持可选的膨胀。
封装了 XLA 的 Conv 运算符。
- 参数:
lhs (Array) – 一个秩为 n+2 维的输入数组。
rhs (Array) – 一个秩为 n+2 维的内核权重数组。
window_strides (Sequence[int]) – 一个包含 n 个整数的序列,表示窗口间的步幅。
padding (str | Sequence[tuple[int, int]]) – 字符串 ‘SAME’、‘SAME_LOWER’ 或 ‘VALID’,或者一个包含 n 个 (low, high) 整数对的序列,表示应用于每个空间维度前后填充的大小。‘SAME’ 和 ‘SAME_LOWER’ 会添加填充,使输出大小与输入大小相同。填充会平均(或近似平均)地分布在两侧。如果填充是奇数,‘SAME’ 会在末尾添加额外的填充,而 ‘SAME_LOWER’ 会在开头添加。
lhs_dilation (Sequence[int] | None) – None,或一个包含 n 个整数的序列,表示应用于 lhs 每个空间维度的膨胀因子。LHS 膨胀也称为转置卷积。
rhs_dilation (Sequence[int] | None) – None,或一个包含 n 个整数的序列,表示应用于 rhs 每个空间维度的膨胀因子。RHS 膨胀也称为空洞卷积(atrous convolution)。
dimension_numbers (ConvGeneralDilatedDimensionNumbers) – None,或一个
ConvDimensionNumbers
对象,或一个 3 元组(lhs_spec, rhs_spec, out_spec)
,其中每个元素都是一个长度为 n+2 的字符串。feature_group_count (int) – 整数,默认为 1。参见 XLA HLO 文档。
batch_group_count (int) – 整数,默认为 1。参见 XLA HLO 文档。
precision (lax.PrecisionLike) – 可选参数。可以是
None
,表示后端默认的精度;一个Precision
枚举值(Precision.DEFAULT
、Precision.HIGH
或Precision.HIGHEST
);一个字符串(例如 ‘highest’ 或 ‘fastest’,参见jax.default_matmul_precision
上下文管理器);或一个由两个Precision
枚举或字符串组成的元组,表示lhs
和rhs
的精度。preferred_element_type (DTypeLike | None) – 可选参数。可以是
None
,表示输入类型的默认累积类型;或一个数据类型,表示将结果累积到该数据类型并返回该数据类型的结果。
- 返回:
包含卷积结果的数组。
- 返回类型:
当
dimension_numbers
是字符串时,每个字符通过位置标识在
lhs
、rhs
和输出中的批量维度用字符 ‘N’ 标识,在 lhs 和输出中的特征维度用字符 ‘C’ 标识,
在 rhs 中的输入和输出特征维度分别用字符 ‘I’ 和 ‘O’ 标识,并且
在 lhs、rhs 和输出之间的空间维度对应关系使用任何不同的字符表示。下面的示例使用 ‘W’ 和 ‘H’。
例如,为了表示与具有两个空间维度的
conv
函数一致的维度编号,可以使用('NCHW', 'OIHW', ('NCHW')
。另一个例子是,为了表示与 TensorFlow Conv2D 操作一致的维度编号,可以使用('NHWC', 'HWIO', 'NHWC')
。当使用后一种形式的卷积维度规范时,窗口步幅与空间维度字符标签相关联,其顺序与标签在rhs_spec
字符串中出现的顺序一致,因此window_strides[0]
会与rhs_spec
中第一个不是'I'
或'O'
的字符对应的维度匹配。如果
dimension_numbers
为None
,默认值为('NCHW', 'OIHW', 'NCHW')
(适用于 2D 卷积)。