--reset
--skip-impl=ref

--dt=bf16 #bfloat16
--allow-unimpl=true   # allow unimplemented for bf16 where avx512_core not supported

--fmt=nChw16c # avx512

--dir=FWD_D
--flags=S --mb=28 --batch=bnorm_resnet_50
--flags=GS --mb=28 --batch=bnorm_resnet_50
--flags=SR --batch=bnorm_large

--attr=post_ops='relu'
--flags=GS --mb=28 --batch=bnorm_resnet_50
--attr=

--dir=BWD_DW
--flags=S  --mb=28 --batch=bnorm_resnet_50
--flags=GS --mb=28 --batch=bnorm_resnet_50
--flags=GSR --mb=28 --batch=bnorm_resnet_50

--dir=BWD_D
--flags=  --mb=28  --batch=bnorm_resnet_50


