File: mlperf_transform_list2.sh

package info (click to toggle)
rocblas 6.4.4-3
  • links: PTS, VCS
  • area: main
  • in suites: sid
  • size: 1,082,776 kB
  • sloc: cpp: 244,923; f90: 50,012; python: 50,003; sh: 24,630; asm: 8,917; makefile: 151; ansic: 107; xml: 36; awk: 14
file content (230 lines) | stat: -rwxr-xr-x 48,793 bytes parent folder | download | duplicates (2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
#!/bin/bash

./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 45 -k 45 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 45 --stride_b 2025 --beta 0.0 --ldc 64 --stride_c 2880 --batch 1424 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 54 -k 54 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 54 --stride_b 2916 --beta 0.0 --ldc 64 --stride_c 3456 --batch 1184 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 35 -k 35 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 35 --stride_b 1225 --beta 0.0 --ldc 64 --stride_c 2240 --batch 1808 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 32 -k 32 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 32 --stride_b 1024 --beta 0.0 --ldc 64 --stride_c 2048 --batch 1984 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 49 -k 49 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 49 --stride_b 2401 --beta 0.0 --ldc 64 --stride_c 3136 --batch 1296 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 38 -k 38 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 38 --stride_b 1444 --beta 0.0 --ldc 64 --stride_c 2432 --batch 1680 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 41 -k 41 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 41 --stride_b 1681 --beta 0.0 --ldc 64 --stride_c 2624 --batch 1552 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 59 -k 59 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 59 --stride_b 3481 --beta 0.0 --ldc 64 --stride_c 3776 --batch 1088 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 65 -k 65 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 65 --stride_b 4225 --beta 0.0 --ldc 64 --stride_c 4160 --batch 992 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 29 -k 29 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 29 --stride_b 841 --beta 0.0 --ldc 64 --stride_c 1856 --batch 2176 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 71 -k 71 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 71 --stride_b 5041 --beta 0.0 --ldc 64 --stride_c 4544 --batch 896 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 27 -k 27 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 27 --stride_b 729 --beta 0.0 --ldc 64 --stride_c 1728 --batch 2336 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 25 -k 25 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 25 --stride_b 625 --beta 0.0 --ldc 64 --stride_c 1600 --batch 2512 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 23 -k 23 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 23 --stride_b 529 --beta 0.0 --ldc 64 --stride_c 1472 --batch 2720 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 78 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 78 --stride_b 6084 --beta 0.0 --ldc 64 --stride_c 4992 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 21 -k 21 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 21 --stride_b 441 --beta 0.0 --ldc 64 --stride_c 1344 --batch 2976 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 85 -k 85 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 85 --stride_b 7225 --beta 0.0 --ldc 64 --stride_c 5440 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 93 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 93 --stride_b 8649 --beta 0.0 --ldc 64 --stride_c 5952 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 19 -k 19 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 19 --stride_b 361 --beta 0.0 --ldc 64 --stride_c 1216 --batch 3264 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 18 -k 18 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 18 --stride_b 324 --beta 0.0 --ldc 64 --stride_c 1152 --batch 3440 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 17 -k 17 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 17 --stride_b 289 --beta 0.0 --ldc 64 --stride_c 1088 --batch 3632 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10404 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 16 -k 16 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 16 --stride_b 256 --beta 0.0 --ldc 64 --stride_c 1024 --batch 3840 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 15 -k 15 --alpha 1.0 --lda 64 --stride_a 960 --ldb 15 --stride_b 225 --beta 0.0 --ldc 64 --stride_c 960 --batch 4096 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 14 -k 14 --alpha 1.0 --lda 64 --stride_a 896 --ldb 14 --stride_b 196 --beta 0.0 --ldc 64 --stride_c 896 --batch 4368 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 112 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12544 --beta 0.0 --ldc 64 --stride_c 7168 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 13 -k 13 --alpha 1.0 --lda 64 --stride_a 832 --ldb 13 --stride_b 169 --beta 0.0 --ldc 64 --stride_c 832 --batch 4672 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 123 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15129 --beta 0.0 --ldc 64 --stride_c 7872 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 12 -k 12 --alpha 1.0 --lda 64 --stride_a 768 --ldb 12 --stride_b 144 --beta 0.0 --ldc 64 --stride_c 768 --batch 5040 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 11 -k 11 --alpha 1.0 --lda 64 --stride_a 704 --ldb 11 --stride_b 121 --beta 0.0 --ldc 64 --stride_c 704 --batch 5456 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 7 -k 7 --alpha 1.0 --lda 64 --stride_a 448 --ldb 7 --stride_b 49 --beta 0.0 --ldc 64 --stride_c 448 --batch 8192 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 111 -k 111 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 111 --stride_b 12321 --beta 0.0 --ldc 64 --stride_c 7104 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 10 -k 10 --alpha 1.0 --lda 64 --stride_a 640 --ldb 10 --stride_b 100 --beta 0.0 --ldc 64 --stride_c 640 --batch 5952 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 92 -k 92 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 92 --stride_b 8464 --beta 0.0 --ldc 64 --stride_c 5888 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 78 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 6006 --beta 0.0 --ldc 64 --stride_c 4992 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 77 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 5929 --beta 0.0 --ldc 64 --stride_c 4928 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 147 -k 147 --alpha 1.0 --lda 64 --stride_a 9408 --ldb 147 --stride_b 21609 --beta 0.0 --ldc 64 --stride_c 9408 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 9 -k 9 --alpha 1.0 --lda 64 --stride_a 576 --ldb 9 --stride_b 81 --beta 0.0 --ldc 64 --stride_c 576 --batch 6544 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 8 -k 8 --alpha 1.0 --lda 64 --stride_a 512 --ldb 8 --stride_b 64 --beta 0.0 --ldc 64 --stride_c 512 --batch 7280 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 193 -k 193 --alpha 1.0 --lda 64 --stride_a 12352 --ldb 193 --stride_b 37249 --beta 0.0 --ldc 64 --stride_c 12352 --batch 320 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 177 -k 177 --alpha 1.0 --lda 64 --stride_a 11328 --ldb 177 --stride_b 31329 --beta 0.0 --ldc 64 --stride_c 11328 --batch 352 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18225 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 93 -k 92 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 92 --stride_b 8556 --beta 0.0 --ldc 64 --stride_c 5952 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 159 -k 159 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 159 --stride_b 25281 --beta 0.0 --ldc 64 --stride_c 10176 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 148 -k 148 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 148 --stride_b 21904 --beta 0.0 --ldc 64 --stride_c 9472 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 134 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 134 --stride_b 17956 --beta 0.0 --ldc 64 --stride_c 8576 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 132 -k 132 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 132 --stride_b 17424 --beta 0.0 --ldc 64 --stride_c 8448 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 122 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15006 --beta 0.0 --ldc 64 --stride_c 7808 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 122 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 122 --stride_b 14884 --beta 0.0 --ldc 64 --stride_c 7808 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 112 -k 111 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 111 --stride_b 12432 --beta 0.0 --ldc 64 --stride_c 7168 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 101 -k 101 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 101 --stride_b 10201 --beta 0.0 --ldc 64 --stride_c 6464 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 100 -k 100 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 100 --stride_b 10000 --beta 0.0 --ldc 64 --stride_c 6400 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 99 -k 99 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 99 --stride_b 9801 --beta 0.0 --ldc 64 --stride_c 6336 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 85 -k 84 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 84 --stride_b 7140 --beta 0.0 --ldc 64 --stride_c 5440 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 84 -k 84 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 84 --stride_b 7056 --beta 0.0 --ldc 64 --stride_c 5376 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 232 -k 232 --alpha 1.0 --lda 64 --stride_a 14848 --ldb 232 --stride_b 53824 --beta 0.0 --ldc 64 --stride_c 14848 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 232 -k 228 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 228 --stride_b 52896 --beta 0.0 --ldc 64 --stride_c 14848 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 228 -k 228 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 228 --stride_b 51984 --beta 0.0 --ldc 64 --stride_c 14592 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 162 -k 162 --alpha 1.0 --lda 64 --stride_a 10368 --ldb 162 --stride_b 26244 --beta 0.0 --ldc 64 --stride_c 10368 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 162 -k 159 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 159 --stride_b 25758 --beta 0.0 --ldc 64 --stride_c 10368 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 160 -k 160 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 160 --stride_b 25600 --beta 0.0 --ldc 64 --stride_c 10240 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 159 -k 160 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 160 --stride_b 25440 --beta 0.0 --ldc 64 --stride_c 10176 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 148 -k 143 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 143 --stride_b 21164 --beta 0.0 --ldc 64 --stride_c 9472 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 147 -k 148 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 148 --stride_b 21756 --beta 0.0 --ldc 64 --stride_c 9408 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 143 -k 143 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 143 --stride_b 20449 --beta 0.0 --ldc 64 --stride_c 9152 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 133 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 133 --stride_b 17955 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 135 -k 132 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 132 --stride_b 17820 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 134 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18090 --beta 0.0 --ldc 64 --stride_c 8576 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 134 -k 132 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 132 --stride_b 17688 --beta 0.0 --ldc 64 --stride_c 8576 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 133 -k 133 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 133 --stride_b 17689 --beta 0.0 --ldc 64 --stride_c 8512 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 111 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12432 --beta 0.0 --ldc 64 --stride_c 7104 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 99 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 99 --stride_b 10098 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 101 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 101 --stride_b 10302 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 102 -k 100 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 100 --stride_b 10200 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 101 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10302 --beta 0.0 --ldc 64 --stride_c 6464 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB N -m 64 -n 100 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10200 --beta 0.0 --ldc 64 --stride_c 6400 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 45 -k 45 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 45 --stride_b 2025 --beta 0.0 --ldc 64 --stride_c 2880 --batch 1424 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 54 -k 54 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 54 --stride_b 2916 --beta 0.0 --ldc 64 --stride_c 3456 --batch 1184 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 35 -k 35 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 35 --stride_b 1225 --beta 0.0 --ldc 64 --stride_c 2240 --batch 1808 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 32 -k 32 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 32 --stride_b 1024 --beta 0.0 --ldc 64 --stride_c 2048 --batch 1984 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 49 -k 49 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 49 --stride_b 2401 --beta 0.0 --ldc 64 --stride_c 3136 --batch 1296 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 38 -k 38 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 38 --stride_b 1444 --beta 0.0 --ldc 64 --stride_c 2432 --batch 1680 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 41 -k 41 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 41 --stride_b 1681 --beta 0.0 --ldc 64 --stride_c 2624 --batch 1552 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 59 -k 59 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 59 --stride_b 3481 --beta 0.0 --ldc 64 --stride_c 3776 --batch 1088 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 65 -k 65 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 65 --stride_b 4225 --beta 0.0 --ldc 64 --stride_c 4160 --batch 992 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 29 -k 29 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 29 --stride_b 841 --beta 0.0 --ldc 64 --stride_c 1856 --batch 2176 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 71 -k 71 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 71 --stride_b 5041 --beta 0.0 --ldc 64 --stride_c 4544 --batch 896 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 27 -k 27 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 27 --stride_b 729 --beta 0.0 --ldc 64 --stride_c 1728 --batch 2336 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 25 -k 25 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 25 --stride_b 625 --beta 0.0 --ldc 64 --stride_c 1600 --batch 2512 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 23 -k 23 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 23 --stride_b 529 --beta 0.0 --ldc 64 --stride_c 1472 --batch 2720 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 78 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 78 --stride_b 6084 --beta 0.0 --ldc 64 --stride_c 4992 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 21 -k 21 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 21 --stride_b 441 --beta 0.0 --ldc 64 --stride_c 1344 --batch 2976 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 85 -k 85 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 85 --stride_b 7225 --beta 0.0 --ldc 64 --stride_c 5440 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 93 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 93 --stride_b 8649 --beta 0.0 --ldc 64 --stride_c 5952 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 19 -k 19 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 19 --stride_b 361 --beta 0.0 --ldc 64 --stride_c 1216 --batch 3264 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 18 -k 18 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 18 --stride_b 324 --beta 0.0 --ldc 64 --stride_c 1152 --batch 3440 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 17 -k 17 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 17 --stride_b 289 --beta 0.0 --ldc 64 --stride_c 1088 --batch 3632 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 102 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 102 --stride_b 10404 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 16 -k 16 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 16 --stride_b 256 --beta 0.0 --ldc 64 --stride_c 1024 --batch 3840 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 15 -k 15 --alpha 1.0 --lda 64 --stride_a 960 --ldb 15 --stride_b 225 --beta 0.0 --ldc 64 --stride_c 960 --batch 4096 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 14 -k 14 --alpha 1.0 --lda 64 --stride_a 896 --ldb 14 --stride_b 196 --beta 0.0 --ldc 64 --stride_c 896 --batch 4368 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 112 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 112 --stride_b 12544 --beta 0.0 --ldc 64 --stride_c 7168 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 13 -k 13 --alpha 1.0 --lda 64 --stride_a 832 --ldb 13 --stride_b 169 --beta 0.0 --ldc 64 --stride_c 832 --batch 4672 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 123 -k 123 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 123 --stride_b 15129 --beta 0.0 --ldc 64 --stride_c 7872 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 12 -k 12 --alpha 1.0 --lda 64 --stride_a 768 --ldb 12 --stride_b 144 --beta 0.0 --ldc 64 --stride_c 768 --batch 5040 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 11 -k 11 --alpha 1.0 --lda 64 --stride_a 704 --ldb 11 --stride_b 121 --beta 0.0 --ldc 64 --stride_c 704 --batch 5456 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 7 -k 7 --alpha 1.0 --lda 64 --stride_a 448 --ldb 7 --stride_b 49 --beta 0.0 --ldc 64 --stride_c 448 --batch 8192 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 111 -k 111 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 111 --stride_b 12321 --beta 0.0 --ldc 64 --stride_c 7104 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 10 -k 10 --alpha 1.0 --lda 64 --stride_a 640 --ldb 10 --stride_b 100 --beta 0.0 --ldc 64 --stride_c 640 --batch 5952 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 92 -k 92 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 92 --stride_b 8464 --beta 0.0 --ldc 64 --stride_c 5888 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 77 -k 78 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 77 --stride_b 6006 --beta 0.0 --ldc 64 --stride_c 4928 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 77 -k 77 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 77 --stride_b 5929 --beta 0.0 --ldc 64 --stride_c 4928 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 147 -k 147 --alpha 1.0 --lda 64 --stride_a 9408 --ldb 147 --stride_b 21609 --beta 0.0 --ldc 64 --stride_c 9408 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 9 -k 9 --alpha 1.0 --lda 64 --stride_a 576 --ldb 9 --stride_b 81 --beta 0.0 --ldc 64 --stride_c 576 --batch 6544 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 8 -k 8 --alpha 1.0 --lda 64 --stride_a 512 --ldb 8 --stride_b 64 --beta 0.0 --ldc 64 --stride_c 512 --batch 7280 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 193 -k 193 --alpha 1.0 --lda 64 --stride_a 12352 --ldb 193 --stride_b 37249 --beta 0.0 --ldc 64 --stride_c 12352 --batch 320 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 177 -k 177 --alpha 1.0 --lda 64 --stride_a 11328 --ldb 177 --stride_b 31329 --beta 0.0 --ldc 64 --stride_c 11328 --batch 352 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 135 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 135 --stride_b 18225 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 92 -k 93 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 92 --stride_b 8556 --beta 0.0 --ldc 64 --stride_c 5888 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 159 -k 159 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 159 --stride_b 25281 --beta 0.0 --ldc 64 --stride_c 10176 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 148 -k 148 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 148 --stride_b 21904 --beta 0.0 --ldc 64 --stride_c 9472 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 134 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 134 --stride_b 17956 --beta 0.0 --ldc 64 --stride_c 8576 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 132 -k 132 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 132 --stride_b 17424 --beta 0.0 --ldc 64 --stride_c 8448 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 123 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 123 --stride_b 15006 --beta 0.0 --ldc 64 --stride_c 7872 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 122 -k 122 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 122 --stride_b 14884 --beta 0.0 --ldc 64 --stride_c 7808 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 111 -k 112 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 111 --stride_b 12432 --beta 0.0 --ldc 64 --stride_c 7104 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 101 -k 101 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 101 --stride_b 10201 --beta 0.0 --ldc 64 --stride_c 6464 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 100 -k 100 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 100 --stride_b 10000 --beta 0.0 --ldc 64 --stride_c 6400 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 99 -k 99 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 99 --stride_b 9801 --beta 0.0 --ldc 64 --stride_c 6336 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 99 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 99 --stride_b 10098 --beta 0.0 --ldc 64 --stride_c 6336 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 84 -k 85 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 84 --stride_b 7140 --beta 0.0 --ldc 64 --stride_c 5376 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 84 -k 84 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 84 --stride_b 7056 --beta 0.0 --ldc 64 --stride_c 5376 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 232 -k 232 --alpha 1.0 --lda 64 --stride_a 14848 --ldb 232 --stride_b 53824 --beta 0.0 --ldc 64 --stride_c 14848 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 228 -k 232 --alpha 1.0 --lda 64 --stride_a 14848 --ldb 228 --stride_b 52896 --beta 0.0 --ldc 64 --stride_c 14592 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 228 -k 228 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 228 --stride_b 51984 --beta 0.0 --ldc 64 --stride_c 14592 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 162 -k 162 --alpha 1.0 --lda 64 --stride_a 10368 --ldb 162 --stride_b 26244 --beta 0.0 --ldc 64 --stride_c 10368 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 160 -k 160 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 160 --stride_b 25600 --beta 0.0 --ldc 64 --stride_c 10240 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 160 -k 159 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 160 --stride_b 25440 --beta 0.0 --ldc 64 --stride_c 10240 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 159 -k 162 --alpha 1.0 --lda 64 --stride_a 10368 --ldb 159 --stride_b 25758 --beta 0.0 --ldc 64 --stride_c 10176 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 148 -k 147 --alpha 1.0 --lda 64 --stride_a 9408 --ldb 148 --stride_b 21756 --beta 0.0 --ldc 64 --stride_c 9472 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 143 -k 148 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 143 --stride_b 21164 --beta 0.0 --ldc 64 --stride_c 9152 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 143 -k 143 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 143 --stride_b 20449 --beta 0.0 --ldc 64 --stride_c 9152 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 135 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 135 --stride_b 18090 --beta 0.0 --ldc 64 --stride_c 8640 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 133 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 133 --stride_b 17955 --beta 0.0 --ldc 64 --stride_c 8512 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 133 -k 133 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 133 --stride_b 17689 --beta 0.0 --ldc 64 --stride_c 8512 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 132 -k 135 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 132 --stride_b 17820 --beta 0.0 --ldc 64 --stride_c 8448 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 132 -k 134 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 132 --stride_b 17688 --beta 0.0 --ldc 64 --stride_c 8448 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 112 -k 111 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 112 --stride_b 12432 --beta 0.0 --ldc 64 --stride_c 7168 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 102 -k 101 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 102 --stride_b 10302 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 102 -k 100 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 102 --stride_b 10200 --beta 0.0 --ldc 64 --stride_c 6528 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 101 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 101 --stride_b 10302 --beta 0.0 --ldc 64 --stride_c 6464 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA N --transposeB T -m 64 -n 100 -k 102 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 100 --stride_b 10200 --beta 0.0 --ldc 64 --stride_c 6400 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 45 -n 45 -k 64 --alpha 1.0 --lda 64 --stride_a 2880 --ldb 64 --stride_b 2880 --beta 0.0 --ldc 45 --stride_c 2025 --batch 1424 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 54 -n 54 -k 64 --alpha 1.0 --lda 64 --stride_a 3456 --ldb 64 --stride_b 3456 --beta 0.0 --ldc 54 --stride_c 2916 --batch 1184 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 35 -n 35 -k 64 --alpha 1.0 --lda 64 --stride_a 2240 --ldb 64 --stride_b 2240 --beta 0.0 --ldc 35 --stride_c 1225 --batch 1808 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 32 -n 32 -k 64 --alpha 1.0 --lda 64 --stride_a 2048 --ldb 64 --stride_b 2048 --beta 0.0 --ldc 32 --stride_c 1024 --batch 1984 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 49 -n 49 -k 64 --alpha 1.0 --lda 64 --stride_a 3136 --ldb 64 --stride_b 3136 --beta 0.0 --ldc 49 --stride_c 2401 --batch 1296 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 38 -n 38 -k 64 --alpha 1.0 --lda 64 --stride_a 2432 --ldb 64 --stride_b 2432 --beta 0.0 --ldc 38 --stride_c 1444 --batch 1680 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 41 -n 41 -k 64 --alpha 1.0 --lda 64 --stride_a 2624 --ldb 64 --stride_b 2624 --beta 0.0 --ldc 41 --stride_c 1681 --batch 1552 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 59 -n 59 -k 64 --alpha 1.0 --lda 64 --stride_a 3776 --ldb 64 --stride_b 3776 --beta 0.0 --ldc 59 --stride_c 3481 --batch 1088 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 65 -n 65 -k 64 --alpha 1.0 --lda 64 --stride_a 4160 --ldb 64 --stride_b 4160 --beta 0.0 --ldc 65 --stride_c 4225 --batch 992 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 29 -n 29 -k 64 --alpha 1.0 --lda 64 --stride_a 1856 --ldb 64 --stride_b 1856 --beta 0.0 --ldc 29 --stride_c 841 --batch 2176 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 71 -n 71 -k 64 --alpha 1.0 --lda 64 --stride_a 4544 --ldb 64 --stride_b 4544 --beta 0.0 --ldc 71 --stride_c 5041 --batch 896 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 27 -n 27 -k 64 --alpha 1.0 --lda 64 --stride_a 1728 --ldb 64 --stride_b 1728 --beta 0.0 --ldc 27 --stride_c 729 --batch 2336 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 25 -n 25 -k 64 --alpha 1.0 --lda 64 --stride_a 1600 --ldb 64 --stride_b 1600 --beta 0.0 --ldc 25 --stride_c 625 --batch 2512 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 23 -n 23 -k 64 --alpha 1.0 --lda 64 --stride_a 1472 --ldb 64 --stride_b 1472 --beta 0.0 --ldc 23 --stride_c 529 --batch 2720 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 78 -n 78 -k 64 --alpha 1.0 --lda 64 --stride_a 4992 --ldb 64 --stride_b 4992 --beta 0.0 --ldc 78 --stride_c 6084 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 21 -n 21 -k 64 --alpha 1.0 --lda 64 --stride_a 1344 --ldb 64 --stride_b 1344 --beta 0.0 --ldc 21 --stride_c 441 --batch 2976 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 85 -n 85 -k 64 --alpha 1.0 --lda 64 --stride_a 5440 --ldb 64 --stride_b 5440 --beta 0.0 --ldc 85 --stride_c 7225 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 93 -n 93 -k 64 --alpha 1.0 --lda 64 --stride_a 5952 --ldb 64 --stride_b 5952 --beta 0.0 --ldc 93 --stride_c 8649 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 19 -n 19 -k 64 --alpha 1.0 --lda 64 --stride_a 1216 --ldb 64 --stride_b 1216 --beta 0.0 --ldc 19 --stride_c 361 --batch 3264 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 18 -n 18 -k 64 --alpha 1.0 --lda 64 --stride_a 1152 --ldb 64 --stride_b 1152 --beta 0.0 --ldc 18 --stride_c 324 --batch 3440 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 17 -n 17 -k 64 --alpha 1.0 --lda 64 --stride_a 1088 --ldb 64 --stride_b 1088 --beta 0.0 --ldc 17 --stride_c 289 --batch 3632 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 102 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 102 --stride_c 10404 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 16 -n 16 -k 64 --alpha 1.0 --lda 64 --stride_a 1024 --ldb 64 --stride_b 1024 --beta 0.0 --ldc 16 --stride_c 256 --batch 3840 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 15 -n 15 -k 64 --alpha 1.0 --lda 64 --stride_a 960 --ldb 64 --stride_b 960 --beta 0.0 --ldc 15 --stride_c 225 --batch 4096 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 14 -n 14 -k 64 --alpha 1.0 --lda 64 --stride_a 896 --ldb 64 --stride_b 896 --beta 0.0 --ldc 14 --stride_c 196 --batch 4368 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 112 -n 112 -k 64 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 64 --stride_b 7168 --beta 0.0 --ldc 112 --stride_c 12544 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 13 -n 13 -k 64 --alpha 1.0 --lda 64 --stride_a 832 --ldb 64 --stride_b 832 --beta 0.0 --ldc 13 --stride_c 169 --batch 4672 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 123 -n 123 -k 64 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 64 --stride_b 7872 --beta 0.0 --ldc 123 --stride_c 15129 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 12 -n 12 -k 64 --alpha 1.0 --lda 64 --stride_a 768 --ldb 64 --stride_b 768 --beta 0.0 --ldc 12 --stride_c 144 --batch 5040 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 11 -n 11 -k 64 --alpha 1.0 --lda 64 --stride_a 704 --ldb 64 --stride_b 704 --beta 0.0 --ldc 11 --stride_c 121 --batch 5456 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 7 -n 7 -k 64 --alpha 1.0 --lda 64 --stride_a 448 --ldb 64 --stride_b 448 --beta 0.0 --ldc 7 --stride_c 49 --batch 8192 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 111 -n 111 -k 64 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 64 --stride_b 7104 --beta 0.0 --ldc 111 --stride_c 12321 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 10 -n 10 -k 64 --alpha 1.0 --lda 64 --stride_a 640 --ldb 64 --stride_b 640 --beta 0.0 --ldc 10 --stride_c 100 --batch 5952 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 92 -n 92 -k 64 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 64 --stride_b 5888 --beta 0.0 --ldc 92 --stride_c 8464 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 77 -n 78 -k 64 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 64 --stride_b 4992 --beta 0.0 --ldc 77 --stride_c 6006 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 77 -n 77 -k 64 --alpha 1.0 --lda 64 --stride_a 4928 --ldb 64 --stride_b 4928 --beta 0.0 --ldc 77 --stride_c 5929 --batch 816 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 147 -n 147 -k 64 --alpha 1.0 --lda 64 --stride_a 9408 --ldb 64 --stride_b 9408 --beta 0.0 --ldc 147 --stride_c 21609 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 9 -n 9 -k 64 --alpha 1.0 --lda 64 --stride_a 576 --ldb 64 --stride_b 576 --beta 0.0 --ldc 9 --stride_c 81 --batch 6544 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 8 -n 8 -k 64 --alpha 1.0 --lda 64 --stride_a 512 --ldb 64 --stride_b 512 --beta 0.0 --ldc 8 --stride_c 64 --batch 7280 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 193 -n 193 -k 64 --alpha 1.0 --lda 64 --stride_a 12352 --ldb 64 --stride_b 12352 --beta 0.0 --ldc 193 --stride_c 37249 --batch 320 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 177 -n 177 -k 64 --alpha 1.0 --lda 64 --stride_a 11328 --ldb 64 --stride_b 11328 --beta 0.0 --ldc 177 --stride_c 31329 --batch 352 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 135 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 135 --stride_c 18225 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 92 -n 93 -k 64 --alpha 1.0 --lda 64 --stride_a 5888 --ldb 64 --stride_b 5952 --beta 0.0 --ldc 92 --stride_c 8556 --batch 688 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 159 -n 159 -k 64 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 64 --stride_b 10176 --beta 0.0 --ldc 159 --stride_c 25281 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 148 -n 148 -k 64 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 64 --stride_b 9472 --beta 0.0 --ldc 148 --stride_c 21904 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 134 -n 134 -k 64 --alpha 1.0 --lda 64 --stride_a 8576 --ldb 64 --stride_b 8576 --beta 0.0 --ldc 134 --stride_c 17956 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 132 -n 132 -k 64 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 64 --stride_b 8448 --beta 0.0 --ldc 132 --stride_c 17424 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 123 -n 122 -k 64 --alpha 1.0 --lda 64 --stride_a 7872 --ldb 64 --stride_b 7808 --beta 0.0 --ldc 123 --stride_c 15006 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 122 -n 122 -k 64 --alpha 1.0 --lda 64 --stride_a 7808 --ldb 64 --stride_b 7808 --beta 0.0 --ldc 122 --stride_c 14884 --batch 528 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 111 -n 112 -k 64 --alpha 1.0 --lda 64 --stride_a 7104 --ldb 64 --stride_b 7168 --beta 0.0 --ldc 111 --stride_c 12432 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 101 -n 101 -k 64 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 64 --stride_b 6464 --beta 0.0 --ldc 101 --stride_c 10201 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 100 -n 100 -k 64 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 64 --stride_b 6400 --beta 0.0 --ldc 100 --stride_c 10000 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 99 -n 99 -k 64 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 64 --stride_b 6336 --beta 0.0 --ldc 99 --stride_c 9801 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 99 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6336 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 99 --stride_c 10098 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 84 -n 85 -k 64 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 64 --stride_b 5440 --beta 0.0 --ldc 84 --stride_c 7140 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 84 -n 84 -k 64 --alpha 1.0 --lda 64 --stride_a 5376 --ldb 64 --stride_b 5376 --beta 0.0 --ldc 84 --stride_c 7056 --batch 752 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 232 -n 232 -k 64 --alpha 1.0 --lda 64 --stride_a 14848 --ldb 64 --stride_b 14848 --beta 0.0 --ldc 232 --stride_c 53824 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 228 -n 232 -k 64 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 64 --stride_b 14848 --beta 0.0 --ldc 228 --stride_c 52896 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 228 -n 228 -k 64 --alpha 1.0 --lda 64 --stride_a 14592 --ldb 64 --stride_b 14592 --beta 0.0 --ldc 228 --stride_c 51984 --batch 272 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 162 -n 162 -k 64 --alpha 1.0 --lda 64 --stride_a 10368 --ldb 64 --stride_b 10368 --beta 0.0 --ldc 162 --stride_c 26244 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 160 -k 64 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 64 --stride_b 10240 --beta 0.0 --ldc 160 --stride_c 25600 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 160 -n 159 -k 64 --alpha 1.0 --lda 64 --stride_a 10240 --ldb 64 --stride_b 10176 --beta 0.0 --ldc 160 --stride_c 25440 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 159 -n 162 -k 64 --alpha 1.0 --lda 64 --stride_a 10176 --ldb 64 --stride_b 10368 --beta 0.0 --ldc 159 --stride_c 25758 --batch 400 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 148 -n 147 -k 64 --alpha 1.0 --lda 64 --stride_a 9472 --ldb 64 --stride_b 9408 --beta 0.0 --ldc 148 --stride_c 21756 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 143 -n 148 -k 64 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 64 --stride_b 9472 --beta 0.0 --ldc 143 --stride_c 21164 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 143 -n 143 -k 64 --alpha 1.0 --lda 64 --stride_a 9152 --ldb 64 --stride_b 9152 --beta 0.0 --ldc 143 --stride_c 20449 --batch 432 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 135 -n 134 -k 64 --alpha 1.0 --lda 64 --stride_a 8640 --ldb 64 --stride_b 8576 --beta 0.0 --ldc 135 --stride_c 18090 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 133 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 133 --stride_c 17955 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 133 -n 133 -k 64 --alpha 1.0 --lda 64 --stride_a 8512 --ldb 64 --stride_b 8512 --beta 0.0 --ldc 133 --stride_c 17689 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 132 -n 135 -k 64 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 64 --stride_b 8640 --beta 0.0 --ldc 132 --stride_c 17820 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 132 -n 134 -k 64 --alpha 1.0 --lda 64 --stride_a 8448 --ldb 64 --stride_b 8576 --beta 0.0 --ldc 132 --stride_c 17688 --batch 480 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 112 -n 111 -k 64 --alpha 1.0 --lda 64 --stride_a 7168 --ldb 64 --stride_b 7104 --beta 0.0 --ldc 112 --stride_c 12432 --batch 576 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 102 -n 101 -k 64 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 64 --stride_b 6464 --beta 0.0 --ldc 102 --stride_c 10302 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 102 -n 100 -k 64 --alpha 1.0 --lda 64 --stride_a 6528 --ldb 64 --stride_b 6400 --beta 0.0 --ldc 102 --stride_c 10200 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 101 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6464 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 101 --stride_c 10302 --batch 624 -i 5
./rocblas-bench -f gemm_strided_batched -r f32_r --transposeA T --transposeB N -m 100 -n 102 -k 64 --alpha 1.0 --lda 64 --stride_a 6400 --ldb 64 --stride_b 6528 --beta 0.0 --ldc 100 --stride_c 10200 --batch 624 -i 5