#pragma once
#include "../sys/alloc.h"
#include "emath.h"
#if defined(EMBREE_SYCL_SUPPORT) && defined(__SYCL_DEVICE_ONLY__)
# include "vec3ia_sycl.h"
#else
#include "../simd/sse.h"
namespace embree
{
struct __aligned(16) Vec3ia
{ … };
__forceinline Vec3ia operator +( const Vec3ia& a ) { … }
__forceinline Vec3ia operator -( const Vec3ia& a ) { … }
#if (defined(__aarch64__))
__forceinline Vec3ia abs ( const Vec3ia& a ) { return vabsq_s32(a.m128); }
#elif defined(__SSSE3__)
__forceinline Vec3ia abs ( const Vec3ia& a ) { return _mm_abs_epi32(a.m128); }
#endif
__forceinline Vec3ia operator +( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator +( const Vec3ia& a, const int b ) { … }
__forceinline Vec3ia operator +( const int a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator -( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator -( const Vec3ia& a, const int b ) { … }
__forceinline Vec3ia operator -( const int a, const Vec3ia& b ) { … }
#if defined(__aarch64__) || defined(__SSE4_1__)
__forceinline Vec3ia operator *( const Vec3ia& a, const Vec3ia& b ) { return _mm_mullo_epi32(a.m128, b.m128); }
__forceinline Vec3ia operator *( const Vec3ia& a, const int b ) { return a * Vec3ia(b); }
__forceinline Vec3ia operator *( const int a, const Vec3ia& b ) { return Vec3ia(a) * b; }
#endif
__forceinline Vec3ia operator &( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator &( const Vec3ia& a, const int b ) { … }
__forceinline Vec3ia operator &( const int a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator |( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator |( const Vec3ia& a, const int b ) { … }
__forceinline Vec3ia operator |( const int a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator ^( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator ^( const Vec3ia& a, const int b ) { … }
__forceinline Vec3ia operator ^( const int a, const Vec3ia& b ) { … }
__forceinline Vec3ia operator <<( const Vec3ia& a, const int n ) { … }
__forceinline Vec3ia operator >>( const Vec3ia& a, const int n ) { … }
__forceinline Vec3ia sll ( const Vec3ia& a, const int b ) { … }
__forceinline Vec3ia sra ( const Vec3ia& a, const int b ) { … }
__forceinline Vec3ia srl ( const Vec3ia& a, const int b ) { … }
__forceinline Vec3ia& operator +=( Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia& operator +=( Vec3ia& a, const int& b ) { … }
__forceinline Vec3ia& operator -=( Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia& operator -=( Vec3ia& a, const int& b ) { … }
#if defined(__aarch64__) || defined(__SSE4_1__)
__forceinline Vec3ia& operator *=( Vec3ia& a, const Vec3ia& b ) { return a = a * b; }
__forceinline Vec3ia& operator *=( Vec3ia& a, const int& b ) { return a = a * b; }
#endif
__forceinline Vec3ia& operator &=( Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia& operator &=( Vec3ia& a, const int& b ) { … }
__forceinline Vec3ia& operator |=( Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia& operator |=( Vec3ia& a, const int& b ) { … }
#if !defined(__ARM_NEON)
__forceinline Vec3ia& operator <<=( Vec3ia& a, const int& b ) { … }
__forceinline Vec3ia& operator >>=( Vec3ia& a, const int& b ) { … }
#endif
__forceinline Vec3ia select( const Vec3ba& m, const Vec3ia& t, const Vec3ia& f ) { … }
#if defined(__aarch64__)
__forceinline int reduce_add(const Vec3ia& v) { return vaddvq_s32(select(Vec3ba(1,1,1),v,Vec3ia(0))); }
__forceinline int reduce_mul(const Vec3ia& v) { return v.x*v.y*v.z; }
__forceinline int reduce_min(const Vec3ia& v) { return vminvq_s32(select(Vec3ba(1,1,1),v,Vec3ia(0x7FFFFFFF))); }
__forceinline int reduce_max(const Vec3ia& v) { return vmaxvq_s32(select(Vec3ba(1,1,1),v,Vec3ia(0x80000000))); }
#else
__forceinline int reduce_add(const Vec3ia& v) { … }
__forceinline int reduce_mul(const Vec3ia& v) { … }
__forceinline int reduce_min(const Vec3ia& v) { … }
__forceinline int reduce_max(const Vec3ia& v) { … }
#endif
__forceinline bool operator ==( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline bool operator !=( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline bool operator < ( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ba eq_mask( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ba lt_mask( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ba gt_mask( const Vec3ia& a, const Vec3ia& b ) { … }
#if defined(__aarch64__) || defined(__SSE4_1__)
__forceinline Vec3ia min( const Vec3ia& a, const Vec3ia& b ) { return _mm_min_epi32(a.m128,b.m128); }
__forceinline Vec3ia max( const Vec3ia& a, const Vec3ia& b ) { return _mm_max_epi32(a.m128,b.m128); }
#else
__forceinline Vec3ia min( const Vec3ia& a, const Vec3ia& b ) { … }
__forceinline Vec3ia max( const Vec3ia& a, const Vec3ia& b ) { … }
#endif
__forceinline embree_ostream operator<<(embree_ostream cout, const Vec3ia& a) { … }
}
#endif