package info (click to toggle)
pytorch-cuda 2.6.0%2Bdfsg-7
  • links: PTS, VCS
  • area: contrib
  • in suites: forky, sid, trixie
  • size: 161,620 kB
  • sloc: python: 1,278,832; cpp: 900,322; ansic: 82,710; asm: 7,754; java: 3,363; sh: 2,811; javascript: 2,443; makefile: 597; ruby: 195; xml: 84; objc: 68

Folder: codegen

d .. (parent)
d d rwxr-xr-x 63 aoti_runtime
d d rwxr-xr-x 4,096 cuda
d d rwxr-xr-x 4,096 rocm
d d rwxr-xr-x 65 xpu
- - rw-r--r-- 0 __init__.py
- - rw-r--r-- 1,296 aoti_hipify_utils.py
- - rw-r--r-- 4,168 block_analysis.py
- - rw-r--r-- 82,422 common.py
- - rw-r--r-- 205,543 cpp.py
- - rw-r--r-- 9,099 cpp_bmm_template.py
- - rw-r--r-- 41,391 cpp_flex_attention_template.py
- - rw-r--r-- 61,423 cpp_gemm_template.py
- - rw-r--r-- 31,438 cpp_micro_gemm.py
- - rw-r--r-- 31,284 cpp_prefix.h
- - rw-r--r-- 4,419 cpp_template.py
- - rw-r--r-- 16,320 cpp_template_kernel.py
- - rw-r--r-- 28,094 cpp_utils.py
- - rw-r--r-- 99,437 cpp_wrapper_cpu.py
- - rw-r--r-- 46,979 cpp_wrapper_cpu_array_ref.py
- - rw-r--r-- 23,030 cpp_wrapper_gpu.py
- - rw-r--r-- 580 cpu_device_op_overrides.py
- - rw-r--r-- 3,936 cuda_combined_scheduling.py
- - rw-r--r-- 11,048 debug_utils.py
- - rw-r--r-- 61,778 halide.py
- - rw-r--r-- 24,934 memory_planning.py
- - rw-r--r-- 16,189 multi_kernel.py
- - rw-r--r-- 66,647 simd.py
- - rw-r--r-- 6,355 simd_kernel_features.py
- - rw-r--r-- 149,085 triton.py
- - rw-r--r-- 46,988 triton_combo_kernel.py
- - rw-r--r-- 7,118 triton_split_scan.py
- - rw-r--r-- 6,087 triton_utils.py
- - rw-r--r-- 98,912 wrapper.py