jax.lax.conv_general_dilated_local#
- jax.lax.conv_general_dilated_local(lhs, rhs, window_strides, padding, filter_shape, lhs_dilation=None, rhs_dilation=None, dimension_numbers=None, precision=None)[源代码]#
具有可选扩张的通用 n 维非共享卷积算子。
也称为局部连接层,该操作等效于在每个输出空间位置使用单独(非共享)的 rhs 内核进行卷积。下面的文档字符串改编自 jax.lax.conv_general_dilated。
- 参数:
lhs (ArrayLike) – 一个秩为 n+2 维的输入数组。
rhs (ArrayLike) – 一个秩为 n+2 维的内核权重数组。与常规 CNN 不同,其空间坐标(H、W、…)对应于输出空间位置,而输入空间位置与输入通道位置在单个 I 维度中融合,顺序为 “C” + ‘’.join(c for c in rhs_spec if c not in ‘OI’),其中 rhs_spec = dimension_numbers[1]。例如,如果 rhs_spec == “WHIO”,则展开的内核形状为 `”[output W][output H]{I[receptive window W][receptive window H]}O”。
window_strides (Sequence[int]) – 一个包含 n 个整数的序列,表示窗口间的步幅。
padding (str | Sequence[tuple[int, int]]) – 字符串 ‘SAME’,字符串 ‘VALID’,或一个包含 n 个 (low, high) 整数对的序列,给出要在每个空间维度之前和之后应用的填充。
filter_shape (Sequence[int]) – 一个包含 n 个整数的序列,表示 rhs_spec = dimension_numbers[1] 中指定的顺序的感受野窗口空间形状。
lhs_dilation (Sequence[int] | None) – None,或一个包含 n 个整数的序列,给出要在 lhs 的每个空间维度中应用的扩张因子。LHS 扩张也称为转置卷积。
rhs_dilation (Sequence[int] | None) – None,或一个包含 n 个整数的序列,给出要在 rhs 的每个输入空间维度中应用的扩张因子。RHS 扩张也称为 atrous 卷积。
dimension_numbers (convolution.ConvGeneralDilatedDimensionNumbers | None) – None,ConvDimensionNumbers 对象,或一个 3 元组 (lhs_spec, rhs_spec, out_spec),其中每个元素都是一个长度为 n+2 的字符串。
precision (lax.PrecisionLike) – 可选。可以是
None
,表示后端的默认精度,一个lax.Precision
枚举值(Precision.DEFAULT
、Precision.HIGH
或Precision.HIGHEST
),或者一个包含两个lax.Precision
枚举值的元组,指示lhs`
和rhs
的精度。
- 返回:
一个包含非共享卷积结果的数组。
- 返回类型:
在 dimension_numbers 的字符串情况下,每个字符按位置标识
lhs、rhs 中的批处理维度,以及输出中带有字符“N”的批处理维度,
lhs 中的特征维度,以及输出中带有字符“C”的特征维度,
rhs 中的输入和输出特征维度,分别带有字符“I”和“O”,以及
lhs、rhs 之间的空间维度对应关系,以及使用任何不同字符的输出。下面的示例使用“W”和“H”。
例如,要指示与具有两个空间维度的 conv 函数一致的维度编号,可以使用 (‘NCHW’, ‘OIHW’, ‘NCHW’)。作为另一个示例,要指示与 TensorFlow Conv2D 操作一致的维度编号,可以使用 (‘NHWC’, ‘HWIO’, ‘NHWC’)。当使用后一种形式的卷积维度规范时,窗口步幅与空间维度字符标签相关联,根据标签在 rhs_spec 字符串中出现的顺序,因此 window_strides[0] 与 rhs_spec 中出现的第一个不是 ‘I’ 或 ‘O’ 的字符对应的维度匹配。
如果 dimension_numbers 为 None,则默认值为 (‘NCHW’, ‘OIHW’, ‘NCHW’)(对于 2D 卷积)。