File: bf16_dlrm.sh

package info (click to toggle)
rocblas 6.4.4-3
  • links: PTS, VCS
  • area: main
  • in suites: sid
  • size: 1,082,776 kB
  • sloc: cpp: 244,923; f90: 50,012; python: 50,003; sh: 24,630; asm: 8,917; makefile: 151; ansic: 107; xml: 36; awk: 14
file content (29 lines) | stat: -rwxr-xr-x 4,586 bytes parent folder | download | duplicates (2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
#!/bin/bash

./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 1600 -n 512 -k 1024 --alpha -1.0 --lda 1600 --ldb 1024 --beta 1.0 --ldc 1600 --ldd 1600 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 1024 -n 512 -k 1 --alpha -1.0 --lda 1024 --ldb 1 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 1024 -n 512 -k 64 --alpha -1.0 --lda 1024 --ldb 64 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 64 -n 512 -k 1 --alpha -1.0 --lda 64 --ldb 1 --beta 1.0 --ldc 64 --ldd 64 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 2048 -n 512 -k 1 --alpha -1.0 --lda 2048 --ldb 1 --beta 1.0 --ldc 2048 --ldd 2048 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 100 -n 512 -k 2048 --alpha -1.0 --lda 100 --ldb 2048 --beta 1.0 --ldc 100 --ldd 100 --compute_type s
#./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 1 -n 512 -k 1 --alpha -1.0 --lda 1 --ldb 1 --beta 1.0 --ldc 1 --ldd 1 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 512 -n 200 -k 32 --alpha -1.0 --lda 512 --ldb 32 --beta 1.0 --ldc 512 --ldd 512 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 560 -n 200 -k 1024 --alpha -1.0 --lda 560 --ldb 1024 --beta 1.0 --ldc 560 --ldd 560 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 32 -n 200 -k 1 --alpha -1.0 --lda 32 --ldb 1 --beta 1.0 --ldc 32 --ldd 32 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 1024 -n 200 -k 1 --alpha -1.0 --lda 1024 --ldb 1 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s
#./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 1 -n 200 -k 1 --alpha -1.0 --lda 1 --ldb 1 --beta 1.0 --ldc 1 --ldd 1 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB N -m 512 -n 200 -k 1 --alpha -1.0 --lda 512 --ldb 1 --beta 1.0 --ldc 512 --ldd 512 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 1024 -n 64 -k 512 --alpha -1.0 --lda 1024 --ldb 64 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 100 -n 2048 -k 512 --alpha -1.0 --lda 100 --ldb 2048 --beta 1.0 --ldc 100 --ldd 100 --compute_type s
#./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 2048 -n 1 -k 512 --alpha -1.0 --lda 2048 --ldb 1 --beta 1.0 --ldc 2048 --ldd 2048 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 2048 -n 2048 -k 512 --alpha -1.0 --lda 2048 --ldb 2048 --beta 1.0 --ldc 2048 --ldd 2048 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 1600 -n 1024 -k 512 --alpha -1.0 --lda 1600 --ldb 1024 --beta 1.0 --ldc 1600 --ldd 1600 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 1024 -n 1024 -k 512 --alpha -1.0 --lda 1024 --ldb 1024 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 560 -n 1024 -k 200 --alpha -1.0 --lda 560 --ldb 1024 --beta 1.0 --ldc 560 --ldd 560 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 1024 -n 1024 -k 200 --alpha -1.0 --lda 1024 --ldb 1024 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s
#./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 1024 -n 1 -k 200 --alpha -1.0 --lda 1024 --ldb 1 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 512 -n 32 -k 200 --alpha -1.0 --lda 512 --ldb 32 --beta 1.0 --ldc 512 --ldd 512 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA N --transposeB T -m 512 -n 512 -k 200 --alpha -1.0 --lda 512 --ldb 512 --beta 1.0 --ldc 512 --ldd 512 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA T --transposeB N -m 1024 -n 512 -k 1600 --alpha -1.0 --lda 1600 --ldb 1600 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA T --transposeB N -m 2048 -n 512 -k 100 --alpha -1.0 --lda 100 --ldb 100 --beta 1.0 --ldc 2048 --ldd 2048 --compute_type s
./rocblas-bench -f gemm_ex -r bf16_r --transposeA T --transposeB N -m 1024 -n 200 -k 560 --alpha -1.0 --lda 560 --ldb 560 --beta 1.0 --ldc 1024 --ldd 1024 --compute_type s