1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77
|
; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
; RUN: llc < %s -mtriple=i686-apple-darwin -mattr=+avx512f | FileCheck %s --check-prefix=DARWIN
; RUN: llc < %s -mtriple=i686-pc-linux -mattr=+avx512f | FileCheck %s --check-prefix=LINUX
define <4 x i32> @test_sse(<4 x i32> %a, <4 x i32> %b, <4 x i32> %c, <4 x i32> %d) nounwind {
; DARWIN-LABEL: test_sse:
; DARWIN: ## %bb.0:
; DARWIN-NEXT: vpaddd %xmm1, %xmm0, %xmm0
; DARWIN-NEXT: vpaddd %xmm3, %xmm2, %xmm1
; DARWIN-NEXT: vpaddd %xmm1, %xmm0, %xmm0
; DARWIN-NEXT: retl
;
; LINUX-LABEL: test_sse:
; LINUX: # %bb.0:
; LINUX-NEXT: subl $12, %esp
; LINUX-NEXT: vpaddd %xmm1, %xmm0, %xmm0
; LINUX-NEXT: vpaddd {{[0-9]+}}(%esp), %xmm2, %xmm1
; LINUX-NEXT: vpaddd %xmm1, %xmm0, %xmm0
; LINUX-NEXT: addl $12, %esp
; LINUX-NEXT: retl
%r0 = add <4 x i32> %a, %b
%r1 = add <4 x i32> %c, %d
%ret = add <4 x i32> %r0, %r1
ret <4 x i32> %ret
}
define <8 x i32> @test_avx(<8 x i32> %a, <8 x i32> %b, <8 x i32> %c, <8 x i32> %d) nounwind {
; DARWIN-LABEL: test_avx:
; DARWIN: ## %bb.0:
; DARWIN-NEXT: vpaddd %ymm1, %ymm0, %ymm0
; DARWIN-NEXT: vpaddd %ymm3, %ymm2, %ymm1
; DARWIN-NEXT: vpaddd %ymm1, %ymm0, %ymm0
; DARWIN-NEXT: retl
;
; LINUX-LABEL: test_avx:
; LINUX: # %bb.0:
; LINUX-NEXT: pushl %ebp
; LINUX-NEXT: movl %esp, %ebp
; LINUX-NEXT: andl $-32, %esp
; LINUX-NEXT: subl $32, %esp
; LINUX-NEXT: vpaddd %ymm1, %ymm0, %ymm0
; LINUX-NEXT: vpaddd 8(%ebp), %ymm2, %ymm1
; LINUX-NEXT: vpaddd %ymm1, %ymm0, %ymm0
; LINUX-NEXT: movl %ebp, %esp
; LINUX-NEXT: popl %ebp
; LINUX-NEXT: retl
%r0 = add <8 x i32> %a, %b
%r1 = add <8 x i32> %c, %d
%ret = add <8 x i32> %r0, %r1
ret <8 x i32> %ret
}
define <16 x i32> @test_avx512(<16 x i32> %a, <16 x i32> %b, <16 x i32> %c, <16 x i32> %d) nounwind {
; DARWIN-LABEL: test_avx512:
; DARWIN: ## %bb.0:
; DARWIN-NEXT: vpaddd %zmm1, %zmm0, %zmm0
; DARWIN-NEXT: vpaddd %zmm3, %zmm2, %zmm1
; DARWIN-NEXT: vpaddd %zmm1, %zmm0, %zmm0
; DARWIN-NEXT: retl
;
; LINUX-LABEL: test_avx512:
; LINUX: # %bb.0:
; LINUX-NEXT: pushl %ebp
; LINUX-NEXT: movl %esp, %ebp
; LINUX-NEXT: andl $-64, %esp
; LINUX-NEXT: subl $64, %esp
; LINUX-NEXT: vpaddd %zmm1, %zmm0, %zmm0
; LINUX-NEXT: vpaddd 8(%ebp), %zmm2, %zmm1
; LINUX-NEXT: vpaddd %zmm1, %zmm0, %zmm0
; LINUX-NEXT: movl %ebp, %esp
; LINUX-NEXT: popl %ebp
; LINUX-NEXT: retl
%r0 = add <16 x i32> %a, %b
%r1 = add <16 x i32> %c, %d
%ret = add <16 x i32> %r0, %r1
ret <16 x i32> %ret
}
|