File: sincos.cl

package info (click to toggle)
intel-graphics-compiler 1.0.12504.6-1%2Bdeb12u1
links: PTS, VCS
area: main
in suites: bookworm
size: 83,912 kB
sloc: cpp: 910,147; lisp: 202,655; ansic: 15,197; python: 4,025; yacc: 2,241; lex: 1,570; pascal: 244; sh: 104; makefile: 25
file content (202 lines) | stat: -rw-r--r-- 6,970 bytes
/*========================== begin_copyright_notice ============================

Copyright (C) 2017-2021 Intel Corporation

SPDX-License-Identifier: MIT

============================= end_copyright_notice ===========================*/

#include "../include/BiF_Definitions.cl"
#include "../../Headers/spirv.h"
#include "../IMF/FP32/sincos_s_la.cl"
#include "../IMF/FP32/sincos_s_noLUT.cl"
#include "../ExternalLibraries/libclc/trig.cl"

#if defined(cl_khr_fp64)
    #include "../IMF/FP64/sincos_d_la.cl"
    #include "../IMF/FP64/sincos_d_la_noLUT.cl"
#endif

static INLINE float __intel_sincos_f32_p0f32( float x, __private float* cosval, bool doFast )
{
    float   sin_x, cos_x;
    if(__FastRelaxedMath && (!__APIRS) && doFast)
    {
        sin_x = SPIRV_OCL_BUILTIN(native_sin, _f32, )(x);
        cos_x = SPIRV_OCL_BUILTIN(native_cos, _f32, )(x);
    }
    else  if(__UseHighAccuracyMath)
    {
        sin_x = __ocl_svml_sincosf_noLUT(x, &cos_x);
    }
    else  if(__UseMathWithLUT)
    {
        __ocl_svml_sincosf(x, &sin_x, &cos_x);
    }
    else
    {
        float abs_float = SPIRV_OCL_BUILTIN(fabs, _f32, )(x);
        if( abs_float > 10000.0f )
        {
            sin_x = libclc_sin_f32(x);
            cos_x = libclc_cos_f32(x);
        }
        else
        {
            sin_x = __ocl_svml_sincosf_noLUT(x, &cos_x);
        }
    }
    *cosval = cos_x;
    return sin_x;
}

INLINE float SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f32_p0f32, )( float x, __private float* cosval )
{
    return __intel_sincos_f32_p0f32(x, cosval, true);
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VAL_1PTRARG_LOOP( sincos, float, float, float, f32, f32 )

float SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f32_p1f32, )( float           x,
                                        __global float* cosval )
{
    float   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f32_p0f32, )( x, &cos_x );
    cosval[0] = cos_x;
    return sin_x;
}

INLINE float SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f32_p3f32, )( float          x,
                                        __local float* cosval )
{
    float   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f32_p0f32, )( x, &cos_x );
    cosval[0] = cos_x;
    return sin_x;
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, float, __global, float, f32, p1 )
GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, float, __local, float, f32, p3 )

#if (__OPENCL_C_VERSION__ >= CL_VERSION_2_0)

INLINE float SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f32_p4f32, )( float            x,
                                        __generic float* cosval )
{
    float   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f32_p0f32, )( x, &cos_x );
    cosval[0] = cos_x;
    return sin_x;
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, float, __generic, float, f32, p4 )

#endif //#if (__OPENCL_C_VERSION__ >= CL_VERSION_2_0)

#if defined(cl_khr_fp16)

INLINE half SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f16_p0f16, )( half            x,
                                       __private half* cosval )
{
    float   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f32_p0f32, )( SPIRV_BUILTIN(FConvert, _f32_f16, _Rfloat)(x), &cos_x );
    cosval[0] = SPIRV_BUILTIN(FConvert, _f16_f32, _Rhalf)(cos_x);
    return SPIRV_BUILTIN(FConvert, _f16_f32, _Rhalf)(sin_x);
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VAL_1PTRARG_LOOP( sincos, half, half, half, f16, f16 )

INLINE half SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f16_p1f16, )( half           x,
                                       __global half* cosval )
{
    float   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f32_p0f32, )( SPIRV_BUILTIN(FConvert, _f32_f16, _Rfloat)(x), &cos_x );
    cosval[0] = SPIRV_BUILTIN(FConvert, _f16_f32, _Rhalf)(cos_x);
    return SPIRV_BUILTIN(FConvert, _f16_f32, _Rhalf)(sin_x);
}

INLINE half SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f16_p3f16, )( half          x,
                                       __local half* cosval )
{
    float   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f32_p0f32, )( SPIRV_BUILTIN(FConvert, _f32_f16, _Rfloat)(x), &cos_x );
    cosval[0] = SPIRV_BUILTIN(FConvert, _f16_f32, _Rhalf)(cos_x);
    return SPIRV_BUILTIN(FConvert, _f16_f32, _Rhalf)(sin_x);
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, half, __global, half, f16, p1 )
GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, half, __local, half, f16, p3 )

#if (__OPENCL_C_VERSION__ >= CL_VERSION_2_0)

INLINE half SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f16_p4f16, )( half            x,
                                       __generic half* cosval )
{
    float   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f32_p0f32, )( SPIRV_BUILTIN(FConvert, _f32_f16, _Rfloat)(x), &cos_x );
    cosval[0] = SPIRV_BUILTIN(FConvert, _f16_f32, _Rhalf)(cos_x);
    return SPIRV_BUILTIN(FConvert, _f16_f32, _Rhalf)(sin_x);
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, half, __generic, half, f16, p4 )

#endif //#if (__OPENCL_C_VERSION__ >= CL_VERSION_2_0)

#endif // defined(cl_khr_fp16)

#if defined(cl_khr_fp64)

INLINE double SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f64_p0f64, )( double            x,
                                         __private double* cosval )
{
    double sin_x, cos_x;

    if (__UseHighAccuracyMath) {
        __ocl_svml_sincos_noLUT(x, &sin_x, &cos_x);
    } else {
        __ocl_svml_sincos(x, &sin_x, &cos_x);
    }

    *cosval = cos_x;
    return sin_x;
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VAL_1PTRARG_LOOP( sincos, double, double, double, f64, f64 )

double SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f64_p3f64, )( double          x,
                                         __local double* cosval )
{
    double   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f64_p0f64, )( x, &cos_x );
    cosval[0] = cos_x;
    return sin_x;
}

INLINE double SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f64_p1f64, )( double           x,
                                         __global double* cosval )
{
    double   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f64_p0f64, )( x, &cos_x );
    cosval[0] = cos_x;
    return sin_x;
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, double, __global, double, f64, p1 )
GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, double, __local, double, f64, p3 )

#if (__OPENCL_C_VERSION__ >= CL_VERSION_2_0)

INLINE double SPIRV_OVERLOADABLE SPIRV_OCL_BUILTIN(sincos, _f64_p4f64, )( double          x,
                                         __generic double* cosval )
{
    double   sin_x, cos_x;
    sin_x = SPIRV_OCL_BUILTIN(sincos, _f64_p0f64, )( x, &cos_x );
    cosval[0] = cos_x;
    return sin_x;
}

GENERATE_SPIRV_OCL_VECTOR_FUNCTIONS_1VALARG_1PTRARG( sincos, double, __generic, double, f64, p4 )

#endif // (__OPENCL_C_VERSION__ >= CL_VERSION_2_0)

#endif // defined(cl_khr_fp64)