File: float64_neon.s

package info (click to toggle)

golang-github-apache-arrow-go 18.2.0-1

links: PTS, VCS
area: main
in suites: forky, sid, trixie
size: 32,200 kB
sloc: asm: 477,547; ansic: 5,369; cpp: 759; sh: 585; makefile: 319; python: 190; sed: 5

file content (60 lines) | stat: -rw-r--r-- 1,504 bytes

	.text
	.file	"float64.c"
	.globl	sum_float64_neon        // -- Begin function sum_float64_neon
	.p2align	2
	.type	sum_float64_neon,@function
sum_float64_neon:                       // @sum_float64_neon
// %bb.0:
	stp	x29, x30, [sp, #-16]!   // 16-byte Folded Spill
	mov	x29, sp
	cbz	x1, .LBB0_3
// %bb.1:
	cmp	x1, #3                  // =3
	b.hi	.LBB0_4
// %bb.2:
	mov	x8, xzr
	fmov	d0, xzr
	b	.LBB0_7
.LBB0_3:
	fmov	d0, xzr
	str	d0, [x2]
	ldp	x29, x30, [sp], #16     // 16-byte Folded Reload
	ret
.LBB0_4:
	and	x8, x1, #0xfffffffffffffffc
	add	x9, x0, #16             // =16
	movi	v0.2d, #0000000000000000
	mov	x10, x8
	movi	v1.2d, #0000000000000000
.LBB0_5:                                // =>This Inner Loop Header: Depth=1
	ldp	q2, q3, [x9, #-16]
	subs	x10, x10, #4            // =4
	add	x9, x9, #32             // =32
	fadd	v0.2d, v2.2d, v0.2d
	fadd	v1.2d, v3.2d, v1.2d
	b.ne	.LBB0_5
// %bb.6:
	fadd	v0.2d, v1.2d, v0.2d
	dup	v1.2d, v0.d[1]
	cmp	x8, x1
	fadd	v0.2d, v0.2d, v1.2d
	b.eq	.LBB0_9
.LBB0_7:
	add	x9, x0, x8, lsl #3
	sub	x8, x1, x8
.LBB0_8:                                // =>This Inner Loop Header: Depth=1
	ldr	d1, [x9], #8
	subs	x8, x8, #1              // =1
	fadd	d0, d1, d0
	b.ne	.LBB0_8
.LBB0_9:
	str	d0, [x2]
	ldp	x29, x30, [sp], #16     // 16-byte Folded Reload
	ret
.Lfunc_end0:
	.size	sum_float64_neon, .Lfunc_end0-sum_float64_neon
                                        // -- End function

	.ident	"clang version 9.0.1-12 "
	.section	".note.GNU-stack","",@progbits
	.addrsig