#bert.tr.bf16.pt.mb4
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=gelu_erf --alpha=0 --beta=0 --tag=abc 4x512x4096n"bert.tr.bf16.pt.mb4*24"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=gelu_erf --alpha=0 --beta=0 --tag=abc 4x512x1024n"bert.tr.bf16.pt.mb4*1"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 30522x1024n"bert.tr.bf16.pt.mb4*1"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 512x1024n"bert.tr.bf16.pt.mb4*1"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 2x1024n"bert.tr.bf16.pt.mb4*1"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 1024x1024n"bert.tr.bf16.pt.mb4*97"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 4096x1024n"bert.tr.bf16.pt.mb4*24"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 1024x4096n"bert.tr.bf16.pt.mb4*24"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 1024n"bert.tr.bf16.pt.mb4*221"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 4096n"bert.tr.bf16.pt.mb4*24"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 30522n"bert.tr.bf16.pt.mb4*1"
#dlrm.tr.bf16.pt.mb32k
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x512n"dlrm.tr.bf16.pt.mb32k*2"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x256n"dlrm.tr.bf16.pt.mb32k*2"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x128n"dlrm.tr.bf16.pt.mb32k*1"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x1024n"dlrm.tr.bf16.pt.mb32k*2"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x256n"dlrm.tr.bf16.pt.mb32k*2"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x512n"dlrm.tr.bf16.pt.mb32k*2"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x1024n"dlrm.tr.bf16.pt.mb32k*2"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32768x128n"dlrm.tr.bf16.pt.mb32k*1"
#resnet-50.tr.bf16.pt.mb128
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x64x112x112n"resnet-50.tr.bf16.pt.mb128*1"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x64x56x56n"resnet-50.tr.bf16.pt.mb128*6"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x56x56n"resnet-50.tr.bf16.pt.mb128*3"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x128x56x56n"resnet-50.tr.bf16.pt.mb128*1"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x128x28x28n"resnet-50.tr.bf16.pt.mb128*7"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x28x28n"resnet-50.tr.bf16.pt.mb128*4"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x28x28n"resnet-50.tr.bf16.pt.mb128*1"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x14x14n"resnet-50.tr.bf16.pt.mb128*11"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x1024x14x14n"resnet-50.tr.bf16.pt.mb128*6"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x14x14n"resnet-50.tr.bf16.pt.mb128*1"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x7x7n"resnet-50.tr.bf16.pt.mb128*5"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x2048x7x7n"resnet-50.tr.bf16.pt.mb128*3"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x2048x7x7n"resnet-50.tr.bf16.pt.mb128*3"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x7x7n"resnet-50.tr.bf16.pt.mb128*5"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x14x14n"resnet-50.tr.bf16.pt.mb128*1"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x1024x14x14n"resnet-50.tr.bf16.pt.mb128*6"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x14x14n"resnet-50.tr.bf16.pt.mb128*11"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x28x28n"resnet-50.tr.bf16.pt.mb128*1"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x512x28x28n"resnet-50.tr.bf16.pt.mb128*4"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x128x28x28n"resnet-50.tr.bf16.pt.mb128*7"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x128x56x56n"resnet-50.tr.bf16.pt.mb128*1"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x256x56x56n"resnet-50.tr.bf16.pt.mb128*3"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x64x56x56n"resnet-50.tr.bf16.pt.mb128*6"
 --reset --allow-enum-tags-only=0 --dt=bf16 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd32a16b 128x64x112x112n"resnet-50.tr.bf16.pt.mb128*1"
#cosmictagger.tr.f32.pt.mb4
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x1x5x5n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 8n"cosmictagger.tr.f32.pt.mb4*90"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x8x3x3n"cosmictagger.tr.f32.pt.mb4*20"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x8x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 16n"cosmictagger.tr.f32.pt.mb4*90"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x16x3x3n"cosmictagger.tr.f32.pt.mb4*20"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x16x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 24n"cosmictagger.tr.f32.pt.mb4*90"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x24x3x3n"cosmictagger.tr.f32.pt.mb4*20"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x24x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 32n"cosmictagger.tr.f32.pt.mb4*90"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x32x3x3n"cosmictagger.tr.f32.pt.mb4*20"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x32x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 40n"cosmictagger.tr.f32.pt.mb4*90"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x40x3x3n"cosmictagger.tr.f32.pt.mb4*20"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x40x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 48n"cosmictagger.tr.f32.pt.mb4*90"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x48x3x3n"cosmictagger.tr.f32.pt.mb4*20"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 56x48x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 56n"cosmictagger.tr.f32.pt.mb4*15"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x168x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 256n"cosmictagger.tr.f32.pt.mb4*90"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x256x5x5n"cosmictagger.tr.f32.pt.mb4*25"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 168x256x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 168n"cosmictagger.tr.f32.pt.mb4*15"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 48x56x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 40x48x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 32x40x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 24x32x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 16x24x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 8x16x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 3x8x1x1n"cosmictagger.tr.f32.pt.mb4*5"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 3n"cosmictagger.tr.f32.pt.mb4*5"
#candleuno.tr.f32.tf.mb128
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 128x1000n"candleuno.tr.f32.tf.mb128*11"
#adorym.tr.f32.pt.mb1
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abcd 256x256x256x2n"adorym.tr.f32.pt.mb1*1"
#pointnet.tr.f32.pt.mb16
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x64x15000n"pointnet.tr.f32.pt.mb16*80"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x128x15000n"pointnet.tr.f32.pt.mb16*64"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x1024x15000n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 16x512n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 16x256n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x512x15000n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x256x15000n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x5x15000n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x5x15000n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x128x15000n"pointnet.tr.f32.pt.mb16*64"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x256x15000n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x512x15000n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x1024x15000n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abc 16x64x15000n"pointnet.tr.f32.pt.mb16*80"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 16x256n"pointnet.tr.f32.pt.mb16*32"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 16x512n"pointnet.tr.f32.pt.mb16*32"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 64x7x1n"pointnet.tr.f32.pt.mb16*32"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 64n"pointnet.tr.f32.pt.mb16*80"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 128x64x1n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 128n"pointnet.tr.f32.pt.mb16*64"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 1024x128x1n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 1024n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 512x1024n"pointnet.tr.f32.pt.mb16*32"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 512n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 256x512n"pointnet.tr.f32.pt.mb16*32"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 256n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 49x256n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 49n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 64x64x1n"pointnet.tr.f32.pt.mb16*48"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=ab 4096x256n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 4096n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 512x1088x1n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 256x512x1n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 128x256x1n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=abc 5x128x1n"pointnet.tr.f32.pt.mb16*16"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=sqrt --alpha=0 --beta=0 --tag=a 5n"pointnet.tr.f32.pt.mb16*16"
#mma.tr.f32.tf.mb32
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x2014x1x128n"mma.tr.f32.tf.mb32*10"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x473x1x256n"mma.tr.f32.tf.mb32*10"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x118x1x256n"mma.tr.f32.tf.mb32*10"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.f32.tf.mb32*20"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=FWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.f32.tf.mb32*10"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ab 32x128n"mma.tr.f32.tf.mb32*30"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x64n"mma.tr.f32.tf.mb32*10"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=abcd 32x29x1x128n"mma.tr.f32.tf.mb32*20"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x256x118x1n"mma.tr.f32.tf.mb32*10"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x256x473x1n"mma.tr.f32.tf.mb32*10"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=acdb 32x128x2014x1n"mma.tr.f32.tf.mb32*10"
 --reset --allow-enum-tags-only=0 --dt=f32 --dir=BWD_D --alg=relu --alpha=0 --beta=0 --tag=ABcd16a16b 32x64x8177x1n"mma.tr.f32.tf.mb32*10"
