# f32
--reset --cfg=f32
--dir=FWD_B  --batch=conv_tails
--dir=BWD_D  --batch=conv_tails
--dir=BWD_WB --batch=conv_tails

# f32 wino
--reset --cfg=f32_wino --alg=wino
--allow-unimpl=true         # allow unimplemented for groups > 1
--match=.*kh3[^0-9].*       # only 3x3 convolutions so far
--dir=FWD_B  --batch=conv_tails
--dir=BWD_D  --batch=conv_tails
--dir=BWD_WB --batch=conv_tails

# i8 (skx)
--reset
--mb=2
--skip-impl="ref:gemm"      # ! test jit version only
--allow-unimpl=true
--dir=FWD_B
--attr=irmode=down;oscale=per_oc:2.25;post_ops='sum:1.5;relu'
--cfg=u8s8u8s32  --batch=conv_tails
--cfg=u8s8f32s32 --batch=conv_tails
--cfg=s8s8u8s32  --batch=conv_tails
--cfg=s8s8f32s32 --batch=conv_tails
--dir=FWD_D
--attr=irmode=nearest;oscale=common:2.25;post_ops='sum:1.5'
--cfg=u8s8s8s32  --batch=conv_tails
--cfg=u8s8s32s32 --batch=conv_tails
--cfg=s8s8s8s32  --batch=conv_tails
--cfg=s8s8s32s32 --batch=conv_tails
