File: fast-math.ll

package info (click to toggle)

llvm-toolchain-3.8 1%3A3.8.1-24

links: PTS, VCS
area: main
in suites: stretch
size: 379,280 kB
ctags: 388,501
sloc: cpp: 2,309,705; ansic: 477,070; objc: 100,918; asm: 97,974; python: 95,911; sh: 18,634; makefile: 7,294; perl: 5,584; ml: 5,460; pascal: 4,661; lisp: 2,548; xml: 686; cs: 350; php: 212; csh: 117

file content (43 lines) | stat: -rw-r--r-- 866 bytes

parent folder | download | duplicates (9)

; RUN: llc < %s -march=nvptx -mcpu=sm_20 | FileCheck %s


declare float @llvm.nvvm.sqrt.f(float)


; CHECK: sqrt_div
; CHECK: sqrt.rn.f32
; CHECK: div.rn.f32
define float @sqrt_div(float %a, float %b) {
  %t1 = tail call float @llvm.nvvm.sqrt.f(float %a)
  %t2 = fdiv float %t1, %b
  ret float %t2
}

; CHECK: sqrt_div_fast
; CHECK: sqrt.approx.f32
; CHECK: div.approx.f32
define float @sqrt_div_fast(float %a, float %b) #0 {
  %t1 = tail call float @llvm.nvvm.sqrt.f(float %a)
  %t2 = fdiv float %t1, %b
  ret float %t2
}


; CHECK: fadd
; CHECK: add.f32
define float @fadd(float %a, float %b) {
  %t1 = fadd float %a, %b
  ret float %t1
}

; CHECK: fadd_ftz
; CHECK: add.ftz.f32
define float @fadd_ftz(float %a, float %b) #1 {
  %t1 = fadd float %a, %b
  ret float %t1
}



attributes #0 = { "unsafe-fp-math" = "true" }
attributes #1 = { "nvptx-f32ftz" = "true" }