File: select.ll

package info (click to toggle)
intel-graphics-compiler 1.0.17791.18-1
links: PTS, VCS
area: main
in suites: sid
size: 102,312 kB
sloc: cpp: 935,343; lisp: 286,143; ansic: 16,196; python: 3,279; yacc: 2,487; lex: 1,642; pascal: 300; sh: 174; makefile: 27
file content (146 lines) | stat: -rw-r--r-- 9,218 bytes
parent folder | download | duplicates (2)
;=========================== begin_copyright_notice ============================
;
; Copyright (C) 2024 Intel Corporation
;
; SPDX-License-Identifier: MIT
;
;============================ end_copyright_notice =============================
;
; REQUIRES: regkeys, llvm-14-plus
;
; RUN: igc_opt --opaque-pointers %s -S -o - --igc-bfloat-funcs-resolution | FileCheck %s

; This test verifies if bfloat OCL validation functions are lowered correctly.

target datalayout = "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v16:16:16-v24:32:32-v32:32:32-v48:64:64-v64:64:64-v96:128:128-v128:128:128-v192:256:256-v256:256:256-v512:512:512-v1024:1024:1024-n8:16:32"
target triple = "spir64-unknown-unknown"

; Function Attrs: nounwind
declare spir_func zeroext i16 @_Z21__builtin_bf16_selectstt(i16 signext, i16 zeroext, i16 zeroext) #0

; Function Attrs: nounwind
declare spir_func <2 x i16> @_Z21__builtin_bf16_selectDv2_sDv2_tS0_(<2 x i16>, <2 x i16>, <2 x i16>) #0

; Function Attrs: nounwind
declare spir_func <4 x i16> @_Z21__builtin_bf16_selectDv4_sDv4_tS0_(<4 x i16>, <4 x i16>, <4 x i16>) #0

; Function Attrs: nounwind
declare spir_func <8 x i16> @_Z21__builtin_bf16_selectDv8_sDv8_tS0_(<8 x i16>, <8 x i16>, <8 x i16>) #0

; Function Attrs: nounwind
declare spir_func <16 x i16> @_Z21__builtin_bf16_selectDv16_sDv16_tS0_(<16 x i16>, <16 x i16>, <16 x i16>) #0

; Function Attrs: nounwind
declare spir_func zeroext i16 @_Z21__builtin_bf16_selectitt(i32, i16 zeroext, i16 zeroext) #0

; Function Attrs: nounwind
declare spir_func <2 x i16> @_Z21__builtin_bf16_selectDv2_iDv2_tS0_(<2 x i32>, <2 x i16>, <2 x i16>) #0

; Function Attrs: nounwind
declare spir_func <4 x i16> @_Z21__builtin_bf16_selectDv4_iDv4_tS0_(<4 x i32>, <4 x i16>, <4 x i16>) #0

; Function Attrs: nounwind
declare spir_func <8 x i16> @_Z21__builtin_bf16_selectDv8_iDv8_tS0_(<8 x i32>, <8 x i16>, <8 x i16>) #0

; Function Attrs: nounwind
declare spir_func <16 x i16> @_Z21__builtin_bf16_selectDv16_iDv16_tS0_(<16 x i32>, <16 x i16>, <16 x i16>) #0

; Function Attrs: convergent nounwind
; CHECK: define spir_kernel void @test_select
define spir_kernel void @test_select(i16 addrspace(1)* %out1, i16 zeroext %v1_1, i16 zeroext %v2_1, <2 x i16> addrspace(1)* %out2, <2 x i16> %v1_2, <2 x i16> %v2_2, <4 x i16> addrspace(1)* %out4, <4 x i16> %v1_4, <4 x i16> %v2_4, <8 x i16> addrspace(1)* %out8, <8 x i16> %v1_8, <8 x i16> %v2_8, <16 x i16> addrspace(1)* %out16, <16 x i16> %c16, <16 x i16> %v1_16, <16 x i16> %v2_16, i16 signext %c1s, <2 x i16> %c2s, <4 x i16> %c4s, <8 x i16> %c8s, <16 x i16> %c16s, i32 %c1i, <2 x i32> %c2i, <4 x i32> %c4i, <8 x i32> %c8i, <16 x i32> %c16i) #1 {
entry:
; CHECK: %[[COND:.*]] = trunc i16 %c1s to i1
; CHECK: %[[SRC0BF:.*]] = bitcast i16 %v1_1 to bfloat
; CHECK: %[[SRC1BF:.*]] = bitcast i16 %v2_1 to bfloat
; CHECK: %[[SELECTRES:.*]] = select i1 %[[COND]], bfloat %[[SRC0BF]], bfloat %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast bfloat %[[SELECTRES]] to i16
  %call = call spir_func zeroext i16 @_Z21__builtin_bf16_selectstt(i16 signext %c1s, i16 zeroext %v1_1, i16 zeroext %v2_1) #2
  %arrayidx = getelementptr inbounds i16, i16 addrspace(1)* %out1, i64 0
  store i16 %call, i16 addrspace(1)* %arrayidx, align 2

; CHECK: %[[COND:.*]] = trunc <2 x i16> %c2s to <2 x i1>
; CHECK: %[[SRC0BF:.*]] = bitcast <2 x i16> %v1_2 to <2 x bfloat>
; CHECK: %[[SRC1BF:.*]] = bitcast <2 x i16> %v2_2 to <2 x bfloat>
; CHECK: %[[SELECTRES:.*]] = select <2 x i1> %[[COND]], <2 x bfloat> %[[SRC0BF]], <2 x bfloat> %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast <2 x bfloat> %[[SELECTRES]] to <2 x i16>
  %call1 = call spir_func <2 x i16> @_Z21__builtin_bf16_selectDv2_sDv2_tS0_(<2 x i16> %c2s, <2 x i16> %v1_2, <2 x i16> %v2_2) #2
  %arrayidx2 = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %out2, i64 1
  store <2 x i16> %call1, <2 x i16> addrspace(1)* %arrayidx2, align 4

; CHECK: %[[COND:.*]] = trunc <4 x i16> %c4s to <4 x i1>
; CHECK: %[[SRC0BF:.*]] = bitcast <4 x i16> %v1_4 to <4 x bfloat>
; CHECK: %[[SRC1BF:.*]] = bitcast <4 x i16> %v2_4 to <4 x bfloat>
; CHECK: %[[SELECTRES:.*]] = select <4 x i1> %[[COND]], <4 x bfloat> %[[SRC0BF]], <4 x bfloat> %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast <4 x bfloat> %[[SELECTRES]] to <4 x i16>
  %call3 = call spir_func <4 x i16> @_Z21__builtin_bf16_selectDv4_sDv4_tS0_(<4 x i16> %c4s, <4 x i16> %v1_4, <4 x i16> %v2_4) #2
  %arrayidx4 = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %out4, i64 2
  store <4 x i16> %call3, <4 x i16> addrspace(1)* %arrayidx4, align 8

; CHECK: %[[COND:.*]] = trunc <8 x i16> %c8s to <8 x i1>
; CHECK: %[[SRC0BF:.*]] = bitcast <8 x i16> %v1_8 to <8 x bfloat>
; CHECK: %[[SRC1BF:.*]] = bitcast <8 x i16> %v2_8 to <8 x bfloat>
; CHECK: %[[SELECTRES:.*]] = select <8 x i1> %[[COND]], <8 x bfloat> %[[SRC0BF]], <8 x bfloat> %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast <8 x bfloat> %[[SELECTRES]] to <8 x i16>
  %call5 = call spir_func <8 x i16> @_Z21__builtin_bf16_selectDv8_sDv8_tS0_(<8 x i16> %c8s, <8 x i16> %v1_8, <8 x i16> %v2_8) #2
  %arrayidx6 = getelementptr inbounds <8 x i16>, <8 x i16> addrspace(1)* %out8, i64 3
  store <8 x i16> %call5, <8 x i16> addrspace(1)* %arrayidx6, align 16

; CHECK: %[[COND:.*]] = trunc <16 x i16> %c16s to <16 x i1>
; CHECK: %[[SRC0BF:.*]] = bitcast <16 x i16> %v1_16 to <16 x bfloat>
; CHECK: %[[SRC1BF:.*]] = bitcast <16 x i16> %v2_16 to <16 x bfloat>
; CHECK: %[[SELECTRES:.*]] = select <16 x i1> %[[COND]], <16 x bfloat> %[[SRC0BF]], <16 x bfloat> %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast <16 x bfloat> %[[SELECTRES]] to <16 x i16>
  %call7 = call spir_func <16 x i16> @_Z21__builtin_bf16_selectDv16_sDv16_tS0_(<16 x i16> %c16s, <16 x i16> %v1_16, <16 x i16> %v2_16) #2
  %arrayidx8 = getelementptr inbounds <16 x i16>, <16 x i16> addrspace(1)* %out16, i64 4
  store <16 x i16> %call7, <16 x i16> addrspace(1)* %arrayidx8, align 32

; CHECK: %[[COND:.*]] = trunc i32 %c1i to i1
; CHECK: %[[SRC0BF:.*]] = bitcast i16 %v1_1 to bfloat
; CHECK: %[[SRC1BF:.*]] = bitcast i16 %v2_1 to bfloat
; CHECK: %[[SELECTRES:.*]] = select i1 %[[COND]], bfloat %[[SRC0BF]], bfloat %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast bfloat %[[SELECTRES]] to i16
  %call9 = call spir_func zeroext i16 @_Z21__builtin_bf16_selectitt(i32 %c1i, i16 zeroext %v1_1, i16 zeroext %v2_1) #2
  %arrayidx10 = getelementptr inbounds i16, i16 addrspace(1)* %out1, i64 5
  store i16 %call9, i16 addrspace(1)* %arrayidx10, align 2

; CHECK: %[[COND:.*]] = trunc <2 x i32> %c2i to <2 x i1>
; CHECK: %[[SRC0BF:.*]] = bitcast <2 x i16> %v1_2 to <2 x bfloat>
; CHECK: %[[SRC1BF:.*]] = bitcast <2 x i16> %v2_2 to <2 x bfloat>
; CHECK: %[[SELECTRES:.*]] = select <2 x i1> %[[COND]], <2 x bfloat> %[[SRC0BF]], <2 x bfloat> %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast <2 x bfloat> %[[SELECTRES]] to <2 x i16>
  %call11 = call spir_func <2 x i16> @_Z21__builtin_bf16_selectDv2_iDv2_tS0_(<2 x i32> %c2i, <2 x i16> %v1_2, <2 x i16> %v2_2) #2
  %arrayidx12 = getelementptr inbounds <2 x i16>, <2 x i16> addrspace(1)* %out2, i64 6
  store <2 x i16> %call11, <2 x i16> addrspace(1)* %arrayidx12, align 4

; CHECK: %[[COND:.*]] = trunc <4 x i32> %c4i to <4 x i1>
; CHECK: %[[SRC0BF:.*]] = bitcast <4 x i16> %v1_4 to <4 x bfloat>
; CHECK: %[[SRC1BF:.*]] = bitcast <4 x i16> %v2_4 to <4 x bfloat>
; CHECK: %[[SELECTRES:.*]] = select <4 x i1> %[[COND]], <4 x bfloat> %[[SRC0BF]], <4 x bfloat> %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast <4 x bfloat> %[[SELECTRES]] to <4 x i16>
  %call13 = call spir_func <4 x i16> @_Z21__builtin_bf16_selectDv4_iDv4_tS0_(<4 x i32> %c4i, <4 x i16> %v1_4, <4 x i16> %v2_4) #2
  %arrayidx14 = getelementptr inbounds <4 x i16>, <4 x i16> addrspace(1)* %out4, i64 7
  store <4 x i16> %call13, <4 x i16> addrspace(1)* %arrayidx14, align 8

; CHECK: %[[COND:.*]] = trunc <8 x i32> %c8i to <8 x i1>
; CHECK: %[[SRC0BF:.*]] = bitcast <8 x i16> %v1_8 to <8 x bfloat>
; CHECK: %[[SRC1BF:.*]] = bitcast <8 x i16> %v2_8 to <8 x bfloat>
; CHECK: %[[SELECTRES:.*]] = select <8 x i1> %[[COND]], <8 x bfloat> %[[SRC0BF]], <8 x bfloat> %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast <8 x bfloat> %[[SELECTRES]] to <8 x i16>
  %call15 = call spir_func <8 x i16> @_Z21__builtin_bf16_selectDv8_iDv8_tS0_(<8 x i32> %c8i, <8 x i16> %v1_8, <8 x i16> %v2_8) #2
  %arrayidx16 = getelementptr inbounds <8 x i16>, <8 x i16> addrspace(1)* %out8, i64 8
  store <8 x i16> %call15, <8 x i16> addrspace(1)* %arrayidx16, align 16

; CHECK: %[[COND:.*]] = trunc <16 x i32> %c16i to <16 x i1>
; CHECK: %[[SRC0BF:.*]] = bitcast <16 x i16> %v1_16 to <16 x bfloat>
; CHECK: %[[SRC1BF:.*]] = bitcast <16 x i16> %v2_16 to <16 x bfloat>
; CHECK: %[[SELECTRES:.*]] = select <16 x i1> %[[COND]], <16 x bfloat> %[[SRC0BF]], <16 x bfloat> %[[SRC1BF]]
; CHECK: %{{.*}} = bitcast <16 x bfloat> %[[SELECTRES]] to <16 x i16>
  %call17 = call spir_func <16 x i16> @_Z21__builtin_bf16_selectDv16_iDv16_tS0_(<16 x i32> %c16i, <16 x i16> %v1_16, <16 x i16> %v2_16) #2
  %arrayidx18 = getelementptr inbounds <16 x i16>, <16 x i16> addrspace(1)* %out16, i64 9
  store <16 x i16> %call17, <16 x i16> addrspace(1)* %arrayidx18, align 32
  ret void
}

attributes #0 = { nounwind "referenced-indirectly" "visaStackCall" }
attributes #1 = { convergent nounwind }
attributes #2 = { nounwind }