package info (click to toggle)
magma 2.9.0%2Bds-2
  • links: PTS, VCS
  • area: contrib
  • in suites: forky, sid, trixie
  • size: 83,212 kB
  • sloc: cpp: 709,115; fortran: 121,916; ansic: 32,343; python: 25,603; f90: 15,208; makefile: 942; xml: 253; csh: 232; sh: 203; perl: 104

Folder: magmablas

d .. (parent)
d d rwxr-xr-x 4,096 gemm_config
d d rwxr-xr-x 58 gemv_config
d d rwxr-xr-x 106 trsm_config
- - rw-r--r-- 232 Makefile
- - rw-r--r-- 25,610 Makefile.src
- - rw-r--r-- 3,157 atomics.cuh
- - rw-r--r-- 7,711 blas_cbatched.cpp
- - rw-r--r-- 7,450 blas_dbatched.cpp
- - rw-r--r-- 7,423 blas_sbatched.cpp
- - rw-r--r-- 7,683 blas_zbatched.cpp
- - rw-r--r-- 1,268 caxpycp.cu
- - rw-r--r-- 9,868 cbcyclic.cpp
- - rw-r--r-- 3,700 cdiinertia.cu
- - rw-r--r-- 18,737 cgbsv_kernels.cu
- - rw-r--r-- 6,764 cgbtf2_devicefunc.cuh
- - rw-r--r-- 24,205 cgbtf2_kernels.cu
- - rw-r--r-- 10,996 cgbtrf_batched_fused_sm.cu
- - rw-r--r-- 43,127 cgbtrf_batched_sliding_window_sm.cu
- - rw-r--r-- 28,847 cgbtrs_kernels.cu
- - rw-r--r-- 3,272 cgeadd.cu
- - rw-r--r-- 3,482 cgeadd2.cu
- - rw-r--r-- 4,220 cgeadd_batched.cu
- - rw-r--r-- 11,786 cgeam.cu
- - rw-r--r-- 10,821 cgemm.cu
- - rw-r--r-- 11,835 cgemm_batched.cpp
- - rw-r--r-- 16,878 cgemm_batched_core.cu
- - rw-r--r-- 11,458 cgemm_batched_smallsq.cu
- - rw-r--r-- 4,232 cgemm_fermi_kernels.h
- - rw-r--r-- 4,812 cgemm_reduce.cu
- - rw-r--r-- 10,124 cgemm_vbatched.cpp
- - rw-r--r-- 11,341 cgemm_vbatched_core.cu
- - rw-r--r-- 8,407 cgemv_batched.cpp
- - rw-r--r-- 7,380 cgemv_batched_core.cu
- - rw-r--r-- 16,409 cgemv_batched_smallsq.cu
- - rw-r--r-- 3,427 cgemv_conj.cu
- - rw-r--r-- 7,140 cgemv_fermi.cu
- - rw-r--r-- 6,501 cgemv_vbatched.cpp
- - rw-r--r-- 7,276 cgemv_vbatched_core.cu
- - rw-r--r-- 3,703 cgeqr2.cpp
- - rw-r--r-- 14,186 cgeqr2_batched.cu
- - rw-r--r-- 17,467 cgeqr2_batched_fused.cuh
- - rw-r--r-- 3,748 cgeqr2_batched_fused_reg.cu
- - rw-r--r-- 3,443 cgeqr2_batched_fused_reg_medium.cu
- - rw-r--r-- 2,924 cgeqr2_batched_fused_reg_tall.cu
- - rw-r--r-- 6,917 cgeqr2_batched_fused_sm.cu
- - rw-r--r-- 7,417 cgeqr2x_gpu-v4.cu
- - rw-r--r-- 12,103 cgeqrf_batched_smallsq.cu
- - rw-r--r-- 6,092 cgerbt.cu
- - rw-r--r-- 1,741 cgerbt.h
- - rw-r--r-- 7,725 cgerbt_func_batched.cu
- - rw-r--r-- 6,129 cgerbt_kernels.cu
- - rw-r--r-- 19,263 cgesv_batched_small.cu
- - rw-r--r-- 6,842 cgetf2.cu
- - rw-r--r-- 8,680 cgetf2_devicefunc.cuh
- - rw-r--r-- 41,069 cgetf2_kernels.cu
- - rw-r--r-- 25,625 cgetf2_kernels_var.cu
- - rw-r--r-- 22,572 cgetf2_native_kernel.cu
- - rw-r--r-- 12,634 cgetf2_nopiv_kernels.cu
- - rw-r--r-- 2,412 cgetmatrix_transpose.cpp
- - rw-r--r-- 3,232 cgetmatrix_transpose_mgpu.cpp
- - rw-r--r-- 14,468 cgetrf_batched_smallsq_noshfl.cu
- - rw-r--r-- 7,706 cheinertia.cu
- - rw-r--r-- 6,382 chemm.cu
- - rw-r--r-- 7,789 chemm_batched_core.cu
- - rw-r--r-- 22,195 chemm_mgpu.cpp
- - rw-r--r-- 9,699 chemm_vbatched.cpp
- - rw-r--r-- 1,964 chemm_vbatched_core.cu
- - rw-r--r-- 28,338 chemv.cu
- - rw-r--r-- 7,176 chemv_batched_core.cu
- - rw-r--r-- 32,042 chemv_mgpu.cu
- - rw-r--r-- 20,292 chemv_mgpu_upper.cu
- - rw-r--r-- 17,176 chemv_upper.cu
- - rw-r--r-- 6,884 chemv_vbatched.cpp
- - rw-r--r-- 3,327 chemv_vbatched_core.cu
- - rw-r--r-- 5,495 cher2k.cpp
- - rw-r--r-- 8,397 cher2k_batched.cpp
- - rw-r--r-- 10,464 cher2k_mgpu.cpp
- - rw-r--r-- 11,132 cher2k_vbatched.cpp
- - rw-r--r-- 4,539 cherk.cpp
- - rw-r--r-- 5,677 cherk_batched.cpp
- - rw-r--r-- 11,990 cherk_batched_core.cu
- - rw-r--r-- 6,613 cherk_mgpu.cpp
- - rw-r--r-- 15,707 cherk_small_reduce.cu
- - rw-r--r-- 8,399 cherk_vbatched.cpp
- - rw-r--r-- 5,879 cherk_vbatched_core.cu
- - rw-r--r-- 17,398 chetrs.cu
- - rw-r--r-- 21,533 clacpy.cu
- - rw-r--r-- 1,298 clacpy_conj.cu
- - rw-r--r-- 8,600 clacpy_sym_in.cu
- - rw-r--r-- 8,729 clacpy_sym_out.cu
- - rw-r--r-- 3,561 clag2z.cu
- - rw-r--r-- 11,104 clange.cu
- - rw-r--r-- 22,715 clanhe.cu
- - rw-r--r-- 9,569 claqps2_gpu.cu
- - rw-r--r-- 4,818 clarf.cu
- - rw-r--r-- 10,844 clarf_batched_fused.cuh
- - rw-r--r-- 4,099 clarf_batched_fused_reg.cu
- - rw-r--r-- 3,818 clarf_batched_fused_reg_medium.cu
- - rw-r--r-- 3,239 clarf_batched_fused_reg_tall.cu
- - rw-r--r-- 10,995 clarf_batched_fused_sm.cu
- - rw-r--r-- 4,046 clarfbx.cu
- - rw-r--r-- 3,234 clarfg-v2.cu
- - rw-r--r-- 5,524 clarfg.cu
- - rw-r--r-- 3,201 clarfg_devicesfunc.cuh
- - rw-r--r-- 5,885 clarfgx-v2.cu
- - rw-r--r-- 8,731 clarft_kernels.cu
- - rw-r--r-- 5,803 clarfx.cu
- - rw-r--r-- 6,142 clascl.cu
- - rw-r--r-- 4,181 clascl2.cu
- - rw-r--r-- 4,208 clascl_2x2.cu
- - rw-r--r-- 4,012 clascl_diag.cu
- - rw-r--r-- 18,090 claset.cu
- - rw-r--r-- 6,544 claset_band.cu
- - rw-r--r-- 12,501 claswp.cu
- - rw-r--r-- 11,135 claswp_batched.cu
- - rw-r--r-- 2,530 claswp_device.cuh
- - rw-r--r-- 5,484 claswp_sym.cu
- - rw-r--r-- 12,584 claswp_vbatched.cu
- - rw-r--r-- 5,659 clat2z.cu
- - rw-r--r-- 4,331 commonblas_c.h
- - rw-r--r-- 3,747 commonblas_d.h
- - rw-r--r-- 3,693 commonblas_s.h
- - rw-r--r-- 4,333 commonblas_z.h
- - rw-r--r-- 5,796 cposv_irgmres_kernels.cu
- - rw-r--r-- 13,086 cpotf2.cu
- - rw-r--r-- 13,237 cpotf2_devicesfunc.cuh
- - rw-r--r-- 12,758 cpotf2_kernels.cu
- - rw-r--r-- 4,401 cpotf2_kernels_var.cu
- - rw-r--r-- 11,475 cset_pointer.cu
- - rw-r--r-- 3,015 csetmatrix_transpose.cpp
- - rw-r--r-- 3,149 csetmatrix_transpose_mgpu.cpp
- - rw-r--r-- 1,925 cswap.cu
- - rw-r--r-- 3,945 cswapblk.cu
- - rw-r--r-- 3,590 cswapdblk.cu
- - rw-r--r-- 6,537 csymm.cu
- - rw-r--r-- 3,710 csymmetrize.cu
- - rw-r--r-- 5,306 csymmetrize_tiles.cu
- - rw-r--r-- 28,530 csymv.cu
- - rw-r--r-- 17,171 csymv_upper.cu
- - rw-r--r-- 8,138 csyr2k_batched.cpp
- - rw-r--r-- 11,209 csyr2k_vbatched.cpp
- - rw-r--r-- 8,214 csyrk_vbatched.cpp
- - rw-r--r-- 8,930 ctranspose.cu
- - rw-r--r-- 7,611 ctranspose_conj.cu
- - rw-r--r-- 6,272 ctranspose_conj_inplace.cu
- - rw-r--r-- 6,120 ctranspose_inplace.cu
- - rw-r--r-- 18,045 ctrmm.cu
- - rw-r--r-- 20,793 ctrmm_batched_core.cu
- - rw-r--r-- 8,922 ctrmm_vbatched.cpp
- - rw-r--r-- 15,009 ctrmm_vbatched_core.cu
- - rw-r--r-- 8,720 ctrmv.cu
- - rw-r--r-- 19,495 ctrsm.cu
- - rw-r--r-- 42,277 ctrsm_batched.cpp
- - rw-r--r-- 13,742 ctrsm_batched_core.cpp
- - rw-r--r-- 7,548 ctrsm_inv_vbatched.cpp
- - rw-r--r-- 45,631 ctrsm_inv_vbatched_core.cu
- - rw-r--r-- 3,557 ctrsm_small_batched.cu
- - rw-r--r-- 3,642 ctrsm_small_vbatched.cu
- - rw-r--r-- 8,330 ctrsm_vbatched.cpp
- - rw-r--r-- 13,074 ctrsm_vbatched_core.cpp
- - rw-r--r-- 17,979 ctrsv.cu
- - rw-r--r-- 22,201 ctrsv_batched.cu
- - rw-r--r-- 7,913 ctrsv_template_device.cuh
- - rw-r--r-- 14,724 ctrtri.cuh
- - rw-r--r-- 8,007 ctrtri_diag.cu
- - rw-r--r-- 9,941 ctrtri_diag_batched.cu
- - rw-r--r-- 10,613 ctrtri_diag_vbatched.cu
- - rw-r--r-- 3,757 ctrtri_lower.cu
- - rw-r--r-- 10,984 ctrtri_lower_batched.cu
- - rw-r--r-- 37,261 ctrtri_lower_device.cuh
- - rw-r--r-- 3,790 ctrtri_upper.cu
- - rw-r--r-- 11,015 ctrtri_upper_batched.cu
- - rw-r--r-- 37,671 ctrtri_upper_device.cuh
- - rw-r--r-- 1,217 daxpycp.cu
- - rw-r--r-- 9,800 dbcyclic.cpp
- - rw-r--r-- 3,692 ddiinertia.cu
- - rw-r--r-- 18,520 dgbsv_kernels.cu
- - rw-r--r-- 6,610 dgbtf2_devicefunc.cuh
- - rw-r--r-- 23,894 dgbtf2_kernels.cu
- - rw-r--r-- 10,867 dgbtrf_batched_fused_sm.cu
- - rw-r--r-- 42,803 dgbtrf_batched_sliding_window_sm.cu
- - rw-r--r-- 28,294 dgbtrs_kernels.cu
- - rw-r--r-- 3,243 dgeadd.cu
- - rw-r--r-- 3,440 dgeadd2.cu
- - rw-r--r-- 4,158 dgeadd_batched.cu
- - rw-r--r-- 11,538 dgeam.cu
- - rw-r--r-- 9,356 dgemm.cu
- - rw-r--r-- 11,458 dgemm_batched.cpp
- - rw-r--r-- 17,790 dgemm_batched_core.cu
- - rw-r--r-- 11,227 dgemm_batched_smallsq.cu
- - rw-r--r-- 4,242 dgemm_fermi_kernels.h
- - rw-r--r-- 4,695 dgemm_reduce.cu
- - rw-r--r-- 9,949 dgemm_vbatched.cpp
- - rw-r--r-- 12,271 dgemm_vbatched_core.cu
- - rw-r--r-- 8,387 dgemv_batched.cpp
- - rw-r--r-- 7,321 dgemv_batched_core.cu
- - rw-r--r-- 16,057 dgemv_batched_smallsq.cu
- - rw-r--r-- 3,360 dgemv_conj.cu
- - rw-r--r-- 6,903 dgemv_fermi.cu
- - rw-r--r-- 6,426 dgemv_vbatched.cpp
- - rw-r--r-- 7,286 dgemv_vbatched_core.cu
- - rw-r--r-- 3,705 dgeqr2.cpp
- - rw-r--r-- 13,720 dgeqr2_batched.cu
- - rw-r--r-- 17,154 dgeqr2_batched_fused.cuh
- - rw-r--r-- 3,726 dgeqr2_batched_fused_reg.cu
- - rw-r--r-- 3,421 dgeqr2_batched_fused_reg_medium.cu
- - rw-r--r-- 2,902 dgeqr2_batched_fused_reg_tall.cu
- - rw-r--r-- 6,733 dgeqr2_batched_fused_sm.cu
- - rw-r--r-- 7,416 dgeqr2x_gpu-v4.cu
- - rw-r--r-- 11,984 dgeqrf_batched_smallsq.cu
- - rw-r--r-- 6,078 dgerbt.cu
- - rw-r--r-- 1,587 dgerbt.h
- - rw-r--r-- 7,711 dgerbt_func_batched.cu
- - rw-r--r-- 5,843 dgerbt_kernels.cu
- - rw-r--r-- 18,896 dgesv_batched_small.cu
- - rw-r--r-- 6,706 dgetf2.cu
- - rw-r--r-- 8,468 dgetf2_devicefunc.cuh
- - rw-r--r-- 40,545 dgetf2_kernels.cu
- - rw-r--r-- 25,276 dgetf2_kernels_var.cu
- - rw-r--r-- 22,473 dgetf2_native_kernel.cu
- - rw-r--r-- 12,501 dgetf2_nopiv_kernels.cu
- - rw-r--r-- 2,389 dgetmatrix_transpose.cpp
- - rw-r--r-- 3,209 dgetmatrix_transpose_mgpu.cpp
- - rw-r--r-- 14,371 dgetrf_batched_smallsq_noshfl.cu
- - rw-r--r-- 21,265 dlacpy.cu
- - rw-r--r-- 1,264 dlacpy_conj.cu
- - rw-r--r-- 8,474 dlacpy_sym_in.cu
- - rw-r--r-- 8,603 dlacpy_sym_out.cu
- - rw-r--r-- 5,293 dlag2s.cu
- - rw-r--r-- 11,044 dlange.cu
- - rw-r--r-- 22,659 dlansy.cu
- - rw-r--r-- 9,555 dlaqps2_gpu.cu
- - rw-r--r-- 4,622 dlarf.cu
- - rw-r--r-- 10,580 dlarf_batched_fused.cuh
- - rw-r--r-- 4,066 dlarf_batched_fused_reg.cu
- - rw-r--r-- 3,785 dlarf_batched_fused_reg_medium.cu
- - rw-r--r-- 3,206 dlarf_batched_fused_reg_tall.cu
- - rw-r--r-- 10,742 dlarf_batched_fused_sm.cu
- - rw-r--r-- 3,823 dlarfbx.cu
- - rw-r--r-- 3,135 dlarfg-v2.cu
- - rw-r--r-- 5,455 dlarfg.cu
- - rw-r--r-- 3,135 dlarfg_devicesfunc.cuh
- - rw-r--r-- 5,737 dlarfgx-v2.cu
- - rw-r--r-- 8,203 dlarft_kernels.cu
- - rw-r--r-- 5,522 dlarfx.cu
- - rw-r--r-- 6,139 dlascl.cu
- - rw-r--r-- 4,167 dlascl2.cu
- - rw-r--r-- 4,106 dlascl_2x2.cu
- - rw-r--r-- 3,974 dlascl_diag.cu
- - rw-r--r-- 17,565 dlaset.cu
- - rw-r--r-- 6,455 dlaset_band.cu
- - rw-r--r-- 12,378 dlaswp.cu
- - rw-r--r-- 10,874 dlaswp_batched.cu
- - rw-r--r-- 2,486 dlaswp_device.cuh
- - rw-r--r-- 5,449 dlaswp_sym.cu
- - rw-r--r-- 12,408 dlaswp_vbatched.cu
- - rw-r--r-- 8,152 dlat2s.cu
- - rw-r--r-- 7,592 dnrm2.cu
- - rw-r--r-- 5,598 dposv_irgmres_kernels.cu
- - rw-r--r-- 12,929 dpotf2.cu
- - rw-r--r-- 12,940 dpotf2_devicesfunc.cuh
- - rw-r--r-- 12,538 dpotf2_kernels.cu
- - rw-r--r-- 4,357 dpotf2_kernels_var.cu
- - rw-r--r-- 1,431 dsaxpycp.cu
- - rw-r--r-- 11,139 dset_pointer.cu
- - rw-r--r-- 2,992 dsetmatrix_transpose.cpp
- - rw-r--r-- 3,126 dsetmatrix_transpose_mgpu.cpp
- - rw-r--r-- 7,701 dsiinertia.cu
- - rw-r--r-- 3,536 dslaswp.cu
- - rw-r--r-- 1,898 dswap.cu
- - rw-r--r-- 3,823 dswapblk.cu
- - rw-r--r-- 3,563 dswapdblk.cu
- - rw-r--r-- 6,520 dsymm.cu
- - rw-r--r-- 7,702 dsymm_batched_core.cu
- - rw-r--r-- 22,154 dsymm_mgpu.cpp
- - rw-r--r-- 9,524 dsymm_vbatched.cpp
- - rw-r--r-- 1,887 dsymm_vbatched_core.cu
- - rw-r--r-- 3,647 dsymmetrize.cu
- - rw-r--r-- 5,243 dsymmetrize_tiles.cu
- - rw-r--r-- 28,180 dsymv.cu
- - rw-r--r-- 7,067 dsymv_batched_core.cu
- - rw-r--r-- 31,762 dsymv_mgpu.cu
- - rw-r--r-- 20,138 dsymv_mgpu_upper.cu
- - rw-r--r-- 17,011 dsymv_upper.cu
- - rw-r--r-- 6,809 dsymv_vbatched.cpp
- - rw-r--r-- 3,173 dsymv_vbatched_core.cu
- - rw-r--r-- 5,371 dsyr2k.cpp
- - rw-r--r-- 8,357 dsyr2k_batched.cpp
- - rw-r--r-- 10,432 dsyr2k_mgpu.cpp
- - rw-r--r-- 10,963 dsyr2k_vbatched.cpp
- - rw-r--r-- 4,433 dsyrk.cpp
- - rw-r--r-- 5,699 dsyrk_batched.cpp
- - rw-r--r-- 9,076 dsyrk_batched_core.cu
- - rw-r--r-- 6,549 dsyrk_mgpu.cpp
- - rw-r--r-- 15,583 dsyrk_small_reduce.cu
- - rw-r--r-- 8,378 dsyrk_vbatched.cpp
- - rw-r--r-- 3,989 dsyrk_vbatched_core.cu
- - rw-r--r-- 16,953 dsytrs.cu
- - rw-r--r-- 8,811 dtranspose.cu
- - rw-r--r-- 6,013 dtranspose_inplace.cu
- - rw-r--r-- 17,869 dtrmm.cu
- - rw-r--r-- 20,617 dtrmm_batched_core.cu
- - rw-r--r-- 8,790 dtrmm_vbatched.cpp
- - rw-r--r-- 14,866 dtrmm_vbatched_core.cu
- - rw-r--r-- 8,639 dtrmv.cu
- - rw-r--r-- 19,399 dtrsm.cu
- - rw-r--r-- 42,053 dtrsm_batched.cpp
- - rw-r--r-- 13,654 dtrsm_batched_core.cpp
- - rw-r--r-- 7,476 dtrsm_inv_vbatched.cpp
- - rw-r--r-- 45,369 dtrsm_inv_vbatched_core.cu
- - rw-r--r-- 3,414 dtrsm_small_batched.cu
- - rw-r--r-- 3,499 dtrsm_small_vbatched.cu
- - rw-r--r-- 8,225 dtrsm_vbatched.cpp
- - rw-r--r-- 13,008 dtrsm_vbatched_core.cpp
- - rw-r--r-- 17,866 dtrsv.cu
- - rw-r--r-- 21,867 dtrsv_batched.cu
- - rw-r--r-- 7,649 dtrsv_template_device.cuh
- - rw-r--r-- 13,283 dtrtri.cuh
- - rw-r--r-- 8,002 dtrtri_diag.cu
- - rw-r--r-- 9,937 dtrtri_diag_batched.cu
- - rw-r--r-- 10,609 dtrtri_diag_vbatched.cu
- - rw-r--r-- 3,537 dtrtri_lower.cu
- - rw-r--r-- 10,544 dtrtri_lower_batched.cu
- - rw-r--r-- 36,479 dtrtri_lower_device.cuh
- - rw-r--r-- 3,570 dtrtri_upper.cu
- - rw-r--r-- 10,575 dtrtri_upper_batched.cu
- - rw-r--r-- 36,890 dtrtri_upper_device.cuh
- - rw-r--r-- 7,697 dznrm2.cu
- - rw-r--r-- 815 gemm_kernel.cuh
- - rw-r--r-- 48,455 gemm_template_device.cuh
- - rw-r--r-- 2,722 gemm_template_device_defs.cuh
- - rw-r--r-- 8,641 gemm_template_kernel.cuh
- - rw-r--r-- 11,926 gemm_template_kernel_batched.cuh
- - rw-r--r-- 16,496 gemm_template_kernel_vbatched.cuh
- - rw-r--r-- 5,976 gemv_template_device.cuh
- - rw-r--r-- 5,317 gemv_template_kernel_batched.cuh
- - rw-r--r-- 4,296 gemv_template_kernel_vbatched.cuh
- - rw-r--r-- 10,915 getrf_setup_pivinfo.cu
- - rw-r--r-- 28,490 hemm_template_device.cuh
- - rw-r--r-- 4,109 hemm_template_kernel.cuh
- - rw-r--r-- 7,065 hemm_template_kernel_batched.cuh
- - rw-r--r-- 11,028 hemm_template_kernel_vbatched.cuh
- - rw-r--r-- 10,647 hemv_template_device.cuh
- - rw-r--r-- 5,933 hemv_template_kernel_batched.cuh
- - rw-r--r-- 8,098 hemv_template_kernel_vbatched.cuh
- - rw-r--r-- 1,506 herk_kernel_batched.cuh
- - rw-r--r-- 6,810 herk_template_kernel_batched.cuh
- - rw-r--r-- 6,895 herk_template_kernel_vbatched.cuh
- - rw-r--r-- 36,172 hgemm_batched_core.cu
- - rw-r--r-- 22,699 hgemm_template_device.cuh
- - rw-r--r-- 11,361 hgemm_template_kernel_batched.cuh
- - rw-r--r-- 13,960 hlaconvert.cu
- - rw-r--r-- 3,607 hlag2s.cu
- - rw-r--r-- 8,239 hlaswp.cu
- - rw-r--r-- 979 hset_pointer.cu
- - rw-r--r-- 22,425 magma_templates.h
- - rw-r--r-- 27,143 magmablas_c_v1.cpp
- - rw-r--r-- 26,015 magmablas_d_v1.cpp
- - rw-r--r-- 2,776 magmablas_ds_v1.cpp
- - rw-r--r-- 25,840 magmablas_s_v1.cpp
- - rw-r--r-- 27,262 magmablas_z_v1.cpp
- - rw-r--r-- 2,813 magmablas_zc_v1.cpp
- - rw-r--r-- 5,949 prefix_sum.cu
- - rw-r--r-- 1,211 saxpycp.cu
- - rw-r--r-- 9,792 sbcyclic.cpp
- - rw-r--r-- 7,694 scnrm2.cu
- - rw-r--r-- 3,677 sdiinertia.cu
- - rw-r--r-- 3,628 set_pointer.cu
- - rw-r--r-- 18,482 sgbsv_kernels.cu
- - rw-r--r-- 6,596 sgbtf2_devicefunc.cuh
- - rw-r--r-- 23,857 sgbtf2_kernels.cu
- - rw-r--r-- 10,837 sgbtrf_batched_fused_sm.cu
- - rw-r--r-- 42,737 sgbtrf_batched_sliding_window_sm.cu
- - rw-r--r-- 28,244 sgbtrs_kernels.cu
- - rw-r--r-- 3,201 sgeadd.cu
- - rw-r--r-- 3,384 sgeadd2.cu
- - rw-r--r-- 4,113 sgeadd_batched.cu
- - rw-r--r-- 11,450 sgeam.cu
- - rw-r--r-- 9,418 sgemm.cu
- - rw-r--r-- 11,358 sgemm_batched.cpp
- - rw-r--r-- 15,156 sgemm_batched_core.cu
- - rw-r--r-- 11,206 sgemm_batched_smallsq.cu
- - rw-r--r-- 4,220 sgemm_fermi_kernels.h
- - rw-r--r-- 4,683 sgemm_reduce.cu
- - rw-r--r-- 9,869 sgemm_vbatched.cpp
- - rw-r--r-- 9,539 sgemm_vbatched_core.cu
- - rw-r--r-- 8,257 sgemv_batched.cpp
- - rw-r--r-- 6,742 sgemv_batched_core.cu
- - rw-r--r-- 16,025 sgemv_batched_smallsq.cu
- - rw-r--r-- 3,301 sgemv_conj.cu
- - rw-r--r-- 6,816 sgemv_fermi.cu
- - rw-r--r-- 6,351 sgemv_vbatched.cpp
- - rw-r--r-- 6,776 sgemv_vbatched_core.cu
- - rw-r--r-- 3,665 sgeqr2.cpp
- - rw-r--r-- 13,643 sgeqr2_batched.cu
- - rw-r--r-- 17,119 sgeqr2_batched_fused.cuh
- - rw-r--r-- 3,724 sgeqr2_batched_fused_reg.cu
- - rw-r--r-- 3,419 sgeqr2_batched_fused_reg_medium.cu
- - rw-r--r-- 2,900 sgeqr2_batched_fused_reg_tall.cu
- - rw-r--r-- 6,713 sgeqr2_batched_fused_sm.cu
- - rw-r--r-- 7,346 sgeqr2x_gpu-v4.cu
- - rw-r--r-- 11,944 sgeqrf_batched_smallsq.cu
- - rw-r--r-- 5,987 sgerbt.cu
- - rw-r--r-- 1,573 sgerbt.h
- - rw-r--r-- 7,620 sgerbt_func_batched.cu
- - rw-r--r-- 5,817 sgerbt_kernels.cu
- - rw-r--r-- 18,825 sgesv_batched_small.cu
- - rw-r--r-- 6,681 sgetf2.cu
- - rw-r--r-- 8,439 sgetf2_devicefunc.cuh
- - rw-r--r-- 40,433 sgetf2_kernels.cu
- - rw-r--r-- 25,235 sgetf2_kernels_var.cu
- - rw-r--r-- 22,460 sgetf2_native_kernel.cu
- - rw-r--r-- 12,475 sgetf2_nopiv_kernels.cu
- - rw-r--r-- 2,386 sgetmatrix_transpose.cpp
- - rw-r--r-- 3,206 sgetmatrix_transpose_mgpu.cpp
- - rw-r--r-- 14,345 sgetrf_batched_smallsq_noshfl.cu
- - rw-r--r-- 8,646 shuffle.cuh
- - rw-r--r-- 21,161 slacpy.cu
- - rw-r--r-- 1,260 slacpy_conj.cu
- - rw-r--r-- 8,436 slacpy_sym_in.cu
- - rw-r--r-- 8,565 slacpy_sym_out.cu
- - rw-r--r-- 3,583 slag2d.cu
- - rw-r--r-- 4,999 slag2h.cu
- - rw-r--r-- 10,998 slange.cu
- - rw-r--r-- 22,613 slansy.cu
- - rw-r--r-- 9,469 slaqps2_gpu.cu
- - rw-r--r-- 4,605 slarf.cu
- - rw-r--r-- 10,556 slarf_batched_fused.cuh
- - rw-r--r-- 4,063 slarf_batched_fused_reg.cu
- - rw-r--r-- 3,782 slarf_batched_fused_reg_medium.cu
- - rw-r--r-- 3,203 slarf_batched_fused_reg_tall.cu
- - rw-r--r-- 10,719 slarf_batched_fused_sm.cu
- - rw-r--r-- 3,802 slarfbx.cu
- - rw-r--r-- 3,117 slarfg-v2.cu
- - rw-r--r-- 5,407 slarfg.cu
- - rw-r--r-- 3,126 slarfg_devicesfunc.cuh
- - rw-r--r-- 5,709 slarfgx-v2.cu
- - rw-r--r-- 8,155 slarft_kernels.cu
- - rw-r--r-- 5,492 slarfx.cu
- - rw-r--r-- 6,093 slascl.cu
- - rw-r--r-- 4,132 slascl2.cu
- - rw-r--r-- 4,068 slascl_2x2.cu
- - rw-r--r-- 3,944 slascl_diag.cu
- - rw-r--r-- 17,477 slaset.cu
- - rw-r--r-- 6,408 slaset_band.cu
- - rw-r--r-- 12,327 slaswp.cu
- - rw-r--r-- 10,848 slaswp_batched.cu
- - rw-r--r-- 2,482 slaswp_device.cuh
- - rw-r--r-- 5,433 slaswp_sym.cu
- - rw-r--r-- 12,392 slaswp_vbatched.cu
- - rw-r--r-- 5,657 slat2d.cu
- - rw-r--r-- 7,542 snrm2.cu
- - rw-r--r-- 5,568 sposv_irgmres_kernels.cu
- - rw-r--r-- 12,873 spotf2.cu
- - rw-r--r-- 12,911 spotf2_devicesfunc.cuh
- - rw-r--r-- 12,518 spotf2_kernels.cu
- - rw-r--r-- 4,353 spotf2_kernels_var.cu
- - rw-r--r-- 11,070 sset_pointer.cu
- - rw-r--r-- 2,989 ssetmatrix_transpose.cpp
- - rw-r--r-- 3,123 ssetmatrix_transpose_mgpu.cpp
- - rw-r--r-- 7,682 ssiinertia.cu
- - rw-r--r-- 1,869 sswap.cu
- - rw-r--r-- 3,811 sswapblk.cu
- - rw-r--r-- 3,534 sswapdblk.cu
- - rw-r--r-- 6,453 ssymm.cu
- - rw-r--r-- 7,630 ssymm_batched_core.cu
- - rw-r--r-- 22,085 ssymm_mgpu.cpp
- - rw-r--r-- 9,444 ssymm_vbatched.cpp
- - rw-r--r-- 1,880 ssymm_vbatched_core.cu
- - rw-r--r-- 3,628 ssymmetrize.cu
- - rw-r--r-- 5,224 ssymmetrize_tiles.cu
- - rw-r--r-- 28,021 ssymv.cu
- - rw-r--r-- 6,993 ssymv_batched_core.cu
- - rw-r--r-- 31,645 ssymv_mgpu.cu
- - rw-r--r-- 20,124 ssymv_mgpu_upper.cu
- - rw-r--r-- 16,996 ssymv_upper.cu
- - rw-r--r-- 6,734 ssymv_vbatched.cpp
- - rw-r--r-- 3,159 ssymv_vbatched_core.cu
- - rw-r--r-- 5,358 ssyr2k.cpp
- - rw-r--r-- 8,290 ssyr2k_batched.cpp
- - rw-r--r-- 10,365 ssyr2k_mgpu.cpp
- - rw-r--r-- 10,881 ssyr2k_vbatched.cpp
- - rw-r--r-- 4,418 ssyrk.cpp
- - rw-r--r-- 5,647 ssyrk_batched.cpp
- - rw-r--r-- 7,852 ssyrk_batched_core.cu
- - rw-r--r-- 6,537 ssyrk_mgpu.cpp
- - rw-r--r-- 15,518 ssyrk_small_reduce.cu
- - rw-r--r-- 8,318 ssyrk_vbatched.cpp
- - rw-r--r-- 2,912 ssyrk_vbatched_core.cu
- - rw-r--r-- 16,889 ssytrs.cu
- - rw-r--r-- 8,748 stranspose.cu
- - rw-r--r-- 5,990 stranspose_inplace.cu
- - rw-r--r-- 17,853 strmm.cu
- - rw-r--r-- 20,601 strmm_batched_core.cu
- - rw-r--r-- 8,778 strmm_vbatched.cpp
- - rw-r--r-- 14,853 strmm_vbatched_core.cu
- - rw-r--r-- 8,606 strmv.cu
- - rw-r--r-- 19,334 strsm.cu
- - rw-r--r-- 41,866 strsm_batched.cpp
- - rw-r--r-- 13,646 strsm_batched_core.cpp
- - rw-r--r-- 7,431 strsm_inv_vbatched.cpp
- - rw-r--r-- 45,217 strsm_inv_vbatched_core.cu
- - rw-r--r-- 3,401 strsm_small_batched.cu
- - rw-r--r-- 3,486 strsm_small_vbatched.cu
- - rw-r--r-- 8,177 strsm_vbatched.cpp
- - rw-r--r-- 13,002 strsm_vbatched_core.cpp
- - rw-r--r-- 17,826 strsv.cu
- - rw-r--r-- 21,811 strsv_batched.cu
- - rw-r--r-- 7,625 strsv_template_device.cuh
- - rw-r--r-- 13,152 strtri.cuh
- - rw-r--r-- 7,975 strtri_diag.cu
- - rw-r--r-- 9,911 strtri_diag_batched.cu
- - rw-r--r-- 10,583 strtri_diag_vbatched.cu
- - rw-r--r-- 3,517 strtri_lower.cu
- - rw-r--r-- 10,504 strtri_lower_batched.cu
- - rw-r--r-- 36,406 strtri_lower_device.cuh
- - rw-r--r-- 3,550 strtri_upper.cu
- - rw-r--r-- 10,535 strtri_upper_batched.cu
- - rw-r--r-- 36,819 strtri_upper_device.cuh
- - rw-r--r-- 623 sync.cuh
- - rw-r--r-- 7,450 trmm_template_device.cuh
- - rw-r--r-- 5,170 trmm_template_kernel.cuh
- - rw-r--r-- 7,565 trmm_template_kernel_batched.cuh
- - rw-r--r-- 10,156 trmm_template_kernel_vbatched.cuh
- - rw-r--r-- 2,598 trmv_template_device.cuh
- - rw-r--r-- 1,781 trmv_template_kernel.cuh
- - rw-r--r-- 16,571 trsm_template_device.cuh
- - rw-r--r-- 14,845 trsm_template_kernel_batched.cuh
- - rw-r--r-- 19,895 trsm_template_kernel_vbatched.cuh
- - rw-r--r-- 22,368 vbatched_aux.cu
- - rw-r--r-- 32,465 vbatched_check.cu
- - rw-r--r-- 1,226 zaxpycp.cu
- - rw-r--r-- 9,826 zbcyclic.cpp
- - rw-r--r-- 1,454 zcaxpycp.cu
- - rw-r--r-- 3,570 zclaswp.cu
- - rw-r--r-- 3,655 zdiinertia.cu
- - rw-r--r-- 18,712 zgbsv_kernels.cu
- - rw-r--r-- 6,719 zgbtf2_devicefunc.cuh
- - rw-r--r-- 24,187 zgbtf2_kernels.cu
- - rw-r--r-- 10,953 zgbtrf_batched_fused_sm.cu
- - rw-r--r-- 43,102 zgbtrf_batched_sliding_window_sm.cu
- - rw-r--r-- 28,842 zgbtrs_kernels.cu
- - rw-r--r-- 3,240 zgeadd.cu
- - rw-r--r-- 3,454 zgeadd2.cu
- - rw-r--r-- 4,183 zgeadd_batched.cu
- - rw-r--r-- 11,783 zgeam.cu
- - rw-r--r-- 10,770 zgemm.cu
- - rw-r--r-- 11,840 zgemm_batched.cpp
- - rw-r--r-- 11,969 zgemm_batched_core.cu
- - rw-r--r-- 11,417 zgemm_batched_smallsq.cu
- - rw-r--r-- 4,771 zgemm_reduce.cu
- - rw-r--r-- 10,103 zgemm_vbatched.cpp
- - rw-r--r-- 6,066 zgemm_vbatched_core.cu
- - rw-r--r-- 8,392 zgemv_batched.cpp
- - rw-r--r-- 6,951 zgemv_batched_core.cu
- - rw-r--r-- 16,379 zgemv_batched_smallsq.cu
- - rw-r--r-- 3,408 zgemv_conj.cu
- - rw-r--r-- 7,130 zgemv_fermi.cu
- - rw-r--r-- 6,475 zgemv_vbatched.cpp
- - rw-r--r-- 7,307 zgemv_vbatched_core.cu
- - rw-r--r-- 3,677 zgeqr2.cpp
- - rw-r--r-- 14,190 zgeqr2_batched.cu
- - rw-r--r-- 17,440 zgeqr2_batched_fused.cuh
- - rw-r--r-- 3,685 zgeqr2_batched_fused_reg.cu
- - rw-r--r-- 3,373 zgeqr2_batched_fused_reg_medium.cu
- - rw-r--r-- 2,856 zgeqr2_batched_fused_reg_tall.cu
- - rw-r--r-- 6,873 zgeqr2_batched_fused_sm.cu
- - rw-r--r-- 7,396 zgeqr2x_gpu-v4.cu
- - rw-r--r-- 12,062 zgeqrf_batched_smallsq.cu
- - rw-r--r-- 6,073 zgerbt.cu
- - rw-r--r-- 1,709 zgerbt.h
- - rw-r--r-- 7,693 zgerbt_func_batched.cu
- - rw-r--r-- 6,100 zgerbt_kernels.cu
- - rw-r--r-- 19,256 zgesv_batched_small.cu
- - rw-r--r-- 6,811 zgetf2.cu
- - rw-r--r-- 8,650 zgetf2_devicefunc.cuh
- - rw-r--r-- 41,095 zgetf2_kernels.cu
- - rw-r--r-- 25,607 zgetf2_kernels_var.cu
- - rw-r--r-- 22,524 zgetf2_native_kernel.cu
- - rw-r--r-- 12,590 zgetf2_nopiv_kernels.cu
- - rw-r--r-- 2,353 zgetmatrix_transpose.cpp
- - rw-r--r-- 3,168 zgetmatrix_transpose_mgpu.cpp
- - rw-r--r-- 14,415 zgetrf_batched_smallsq_noshfl.cu
- - rw-r--r-- 7,665 zheinertia.cu
- - rw-r--r-- 6,354 zhemm.cu
- - rw-r--r-- 7,757 zhemm_batched_core.cu
- - rw-r--r-- 22,167 zhemm_mgpu.cpp
- - rw-r--r-- 9,678 zhemm_vbatched.cpp
- - rw-r--r-- 1,911 zhemm_vbatched_core.cu
- - rw-r--r-- 28,352 zhemv.cu
- - rw-r--r-- 7,146 zhemv_batched_core.cu
- - rw-r--r-- 32,045 zhemv_mgpu.cu
- - rw-r--r-- 20,249 zhemv_mgpu_upper.cu
- - rw-r--r-- 17,139 zhemv_upper.cu
- - rw-r--r-- 6,858 zhemv_vbatched.cpp
- - rw-r--r-- 3,281 zhemv_vbatched_core.cu
- - rw-r--r-- 5,460 zher2k.cpp
- - rw-r--r-- 8,372 zher2k_batched.cpp
- - rw-r--r-- 10,442 zher2k_mgpu.cpp
- - rw-r--r-- 11,121 zher2k_vbatched.cpp
- - rw-r--r-- 4,507 zherk.cpp
- - rw-r--r-- 5,656 zherk_batched.cpp
- - rw-r--r-- 15,747 zherk_batched_core.cu
- - rw-r--r-- 6,573 zherk_mgpu.cpp
- - rw-r--r-- 15,695 zherk_small_reduce.cu
- - rw-r--r-- 8,385 zherk_vbatched.cpp
- - rw-r--r-- 5,281 zherk_vbatched_core.cu
- - rw-r--r-- 17,397 zhetrs.cu
- - rw-r--r-- 21,536 zlacpy.cu
- - rw-r--r-- 1,250 zlacpy_conj.cu
- - rw-r--r-- 8,566 zlacpy_sym_in.cu
- - rw-r--r-- 8,694 zlacpy_sym_out.cu
- - rw-r--r-- 5,268 zlag2c.cu
- - rw-r--r-- 11,103 zlange.cu
- - rw-r--r-- 22,705 zlanhe.cu
- - rw-r--r-- 9,567 zlaqps2_gpu.cu
- - rw-r--r-- 4,789 zlarf.cu
- - rw-r--r-- 10,807 zlarf_batched_fused.cuh
- - rw-r--r-- 4,038 zlarf_batched_fused_reg.cu
- - rw-r--r-- 3,750 zlarf_batched_fused_reg_medium.cu
- - rw-r--r-- 3,173 zlarf_batched_fused_reg_tall.cu
- - rw-r--r-- 10,955 zlarf_batched_fused_sm.cu
- - rw-r--r-- 4,019 zlarfbx.cu
- - rw-r--r-- 3,202 zlarfg-v2.cu
- - rw-r--r-- 5,498 zlarfg.cu
- - rw-r--r-- 3,150 zlarfg_devicesfunc.cuh
- - rw-r--r-- 5,862 zlarfgx-v2.cu
- - rw-r--r-- 8,724 zlarft_kernels.cu
- - rw-r--r-- 5,786 zlarfx.cu
- - rw-r--r-- 6,132 zlascl.cu
- - rw-r--r-- 4,159 zlascl2.cu
- - rw-r--r-- 4,186 zlascl_2x2.cu
- - rw-r--r-- 3,981 zlascl_diag.cu
- - rw-r--r-- 18,104 zlaset.cu
- - rw-r--r-- 6,512 zlaset_band.cu
- - rw-r--r-- 12,478 zlaswp.cu
- - rw-r--r-- 11,106 zlaswp_batched.cu
- - rw-r--r-- 2,479 zlaswp_device.cuh
- - rw-r--r-- 5,440 zlaswp_sym.cu
- - rw-r--r-- 12,544 zlaswp_vbatched.cu
- - rw-r--r-- 8,163 zlat2c.cu
- - rw-r--r-- 5,764 zposv_irgmres_kernels.cu
- - rw-r--r-- 13,068 zpotf2.cu
- - rw-r--r-- 13,206 zpotf2_devicesfunc.cuh
- - rw-r--r-- 12,723 zpotf2_kernels.cu
- - rw-r--r-- 4,346 zpotf2_kernels_var.cu
- - rw-r--r-- 11,464 zset_pointer.cu
- - rw-r--r-- 2,956 zsetmatrix_transpose.cpp
- - rw-r--r-- 3,085 zsetmatrix_transpose_mgpu.cpp
- - rw-r--r-- 1,890 zswap.cu
- - rw-r--r-- 3,908 zswapblk.cu
- - rw-r--r-- 3,551 zswapdblk.cu
- - rw-r--r-- 4,662 zswapdblk_batched.cu
- - rw-r--r-- 6,513 zsymm.cu
- - rw-r--r-- 3,668 zsymmetrize.cu
- - rw-r--r-- 5,258 zsymmetrize_tiles.cu
- - rw-r--r-- 28,540 zsymv.cu
- - rw-r--r-- 17,130 zsymv_upper.cu
- - rw-r--r-- 8,099 zsyr2k_batched.cpp
- - rw-r--r-- 11,184 zsyr2k_vbatched.cpp
- - rw-r--r-- 8,178 zsyrk_vbatched.cpp
- - rw-r--r-- 8,906 ztranspose.cu
- - rw-r--r-- 7,574 ztranspose_conj.cu
- - rw-r--r-- 6,218 ztranspose_conj_inplace.cu
- - rw-r--r-- 6,075 ztranspose_inplace.cu
- - rw-r--r-- 18,015 ztrmm.cu
- - rw-r--r-- 20,750 ztrmm_batched_core.cu
- - rw-r--r-- 8,878 ztrmm_vbatched.cpp
- - rw-r--r-- 14,962 ztrmm_vbatched_core.cu
- - rw-r--r-- 8,689 ztrmv.cu
- - rw-r--r-- 19,478 ztrsm.cu
- - rw-r--r-- 42,292 ztrsm_batched.cpp
- - rw-r--r-- 13,690 ztrsm_batched_core.cpp
- - rw-r--r-- 7,506 ztrsm_inv_vbatched.cpp
- - rw-r--r-- 45,629 ztrsm_inv_vbatched_core.cu
- - rw-r--r-- 3,510 ztrsm_small_batched.cu
- - rw-r--r-- 3,594 ztrsm_small_vbatched.cu
- - rw-r--r-- 8,295 ztrsm_vbatched.cpp
- - rw-r--r-- 13,019 ztrsm_vbatched_core.cpp
- - rw-r--r-- 17,955 ztrsv.cu
- - rw-r--r-- 22,185 ztrsv_batched.cu
- - rw-r--r-- 7,874 ztrsv_template_device.cuh
- - rw-r--r-- 14,807 ztrtri.cuh
- - rw-r--r-- 7,964 ztrtri_diag.cu
- - rw-r--r-- 9,889 ztrtri_diag_batched.cu
- - rw-r--r-- 10,560 ztrtri_diag_vbatched.cu
- - rw-r--r-- 3,724 ztrtri_lower.cu
- - rw-r--r-- 10,963 ztrtri_lower_batched.cu
- - rw-r--r-- 37,273 ztrtri_lower_device.cuh
- - rw-r--r-- 3,757 ztrtri_upper.cu
- - rw-r--r-- 10,994 ztrtri_upper_batched.cu
- - rw-r--r-- 37,681 ztrtri_upper_device.cuh