llvm/clang/test/CodeGen/X86/avx10_2satcvtds-builtins-x64.c

// RUN: %clang_cc1 -flax-vector-conversions=none -ffreestanding %s -triple=x86_64-unknown-unknown -target-feature +avx10.2-256 -emit-llvm -o - | FileCheck %s

#include <immintrin.h>
#include <stddef.h>

// scalar

int test_mm_cvttssd_i32(__m128d __A) {
  // CHECK-LABEL: @test_mm_cvttssd_i32
  // CHECK: @llvm.x86.avx10.vcvttsd2sis
  return _mm_cvtts_roundsd_i32(__A, _MM_FROUND_NO_EXC);
}

int test_mm_cvttssd_si32(__m128d __A) {
  // CHECK-LABEL: @test_mm_cvttssd_si32(
  // CHECK: @llvm.x86.avx10.vcvttsd2sis(<2 x double>
  return _mm_cvtts_roundsd_si32(__A, _MM_FROUND_NO_EXC);
}

unsigned test_mm_cvttssd_u32(__m128d __A) {
  // CHECK-LABEL: @test_mm_cvttssd_u32(
  // CHECK: @llvm.x86.avx10.vcvttsd2usis(<2 x double>
  return _mm_cvtts_roundsd_u32(__A, _MM_FROUND_NO_EXC);
}

int test_mm_cvttsss_i32(__m128 __A) {
  // CHECK-LABEL: @test_mm_cvttsss_i32(
  // CHECK: @llvm.x86.avx10.vcvttss2sis(<4 x float>
  return _mm_cvtts_roundss_i32(__A, _MM_FROUND_NO_EXC);
}

int test_mm_cvttsss_si32(__m128 __A) {
  // CHECK-LABEL: @test_mm_cvttsss_si32(
  // CHECK: @llvm.x86.avx10.vcvttss2sis(<4 x float>
  return _mm_cvtts_roundss_si32(__A, _MM_FROUND_NO_EXC);
}

unsigned test_mm_cvttsss_u32(__m128 __A) {
  // CHECK-LABEL: @test_mm_cvttsss_u32(
  // CHECK: @llvm.x86.avx10.vcvttss2usis(<4 x float>
  return _mm_cvtts_roundss_u32(__A, _MM_FROUND_NO_EXC);
}

// vector
// 128 bit
__m128i test_mm_cvttspd_epi64(__m128d A){
    // CHECK-LABEL: @test_mm_cvttspd_epi64
    // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.128(<2 x double>
    return _mm_cvttspd_epi64(A);
}

__m128i test_mm_mask_cvttspd_epi64(__m128i W, __mmask8 U, __m128d A){
    // CHECK-LABEL: @test_mm_mask_cvttspd_epi64
    // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.128(<2 x double>
    return _mm_mask_cvttspd_epi64(W, U,  A);
}

__m128i test_mm_maskz_cvttspd_epi64(__mmask8 U,__m128d A){
    // CHECK-LABEL: @test_mm_maskz_cvttspd_epi64
    // CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.128(<2 x double>
    return _mm_maskz_cvttspd_epi64(U, A);
}

__m128i test_mm_cvttspd_epu64(__m128d A){
    // CHECK-LABEL: @test_mm_cvttspd_epu64
    // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.128(<2 x double>
    return _mm_cvttspd_epu64(A);
}

__m128i test_mm_mask_cvttspd_epu64(__m128i W, __mmask8 U, __m128d A){
    // CHECK-LABEL: @test_mm_mask_cvttspd_epu64
    // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.128(<2 x double>
    return _mm_mask_cvttspd_epu64(W, U,  A);
}

__m128i test_mm_maskz_cvttspd_epu64(__mmask8 U,__m128d A){
    // CHECK-LABEL: @test_mm_maskz_cvttspd_epu64
    // CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.128(<2 x double>
    return _mm_maskz_cvttspd_epu64(U, A);
}

// 256 bit
__m256i test_mm256_cvttspd_epi64(__m256d A){
// CHECK-LABEL: @test_mm256_cvttspd_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.round.256(<4 x double>
    return _mm256_cvttspd_epi64(A);
}

__m256i test_mm256_mask_cvttspd_epi64(__m256i W,__mmask8 U, __m256d A){
// CHECK-LABEL: @test_mm256_mask_cvttspd_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.round.256(<4 x double>
    return _mm256_mask_cvttspd_epi64(W,U, A);
}

__m256i test_mm256_maskz_cvttspd_epi64(__mmask8 U, __m256d A){
// CHECK-LABEL: @test_mm256_maskz_cvttspd_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.round.256(<4 x double>
    return _mm256_maskz_cvttspd_epi64(U, A);
}

__m256i test_mm256_cvtts_roundpd_epi64(__m256d A){
// CHECK-LABEL: @test_mm256_cvtts_roundpd_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.round.256(<4 x double>
    return _mm256_cvtts_roundpd_epi64(A,_MM_FROUND_NEARBYINT );
}

__m256i test_mm256_mask_cvtts_roundpd_epi64(__m256i W,__mmask8 U, __m256d A){
// CHECK-LABEL: @test_mm256_mask_cvtts_roundpd_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.round.256(<4 x double>
    return _mm256_mask_cvtts_roundpd_epi64(W,U,A,_MM_FROUND_NEARBYINT );
}

__m256i test_mm256_maskz_cvtts_roundpd_epi64(__mmask8 U, __m256d A){
// CHECK-LABEL: @test_mm256_maskz_cvtts_roundpd_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2qqs.round.256(<4 x double>
    return _mm256_maskz_cvtts_roundpd_epi64(U,A,_MM_FROUND_NEARBYINT );
}

__m256i test_mm256_cvttspd_epu64(__m256d A){
// CHECK-LABEL: @test_mm256_cvttspd_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.round.256(<4 x double>
    return _mm256_cvttspd_epu64(A);
}

__m256i test_mm256_mask_cvttspd_epu64(__m256i W,__mmask8 U, __m256d A){
// CHECK-LABEL: @test_mm256_mask_cvttspd_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.round.256(<4 x double>
    return _mm256_mask_cvttspd_epu64(W,U, A);
}

__m256i test_mm256_maskz_cvttspd_epu64(__mmask8 U, __m256d A){
// CHECK-LABEL: @test_mm256_maskz_cvttspd_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.round.256(<4 x double>
    return _mm256_maskz_cvttspd_epu64(U, A);
}

__m256i test_mm256_cvtts_roundpd_epu64(__m256d A){
// CHECK-LABEL: @test_mm256_cvtts_roundpd_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.round.256(<4 x double>
    return _mm256_cvtts_roundpd_epu64(A,_MM_FROUND_NEARBYINT );
}

__m256i test_mm256_mask_cvtts_roundpd_epu64(__m256i W,__mmask8 U, __m256d A){
// CHECK-LABEL: @test_mm256_mask_cvtts_roundpd_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.round.256(<4 x double>
    return _mm256_mask_cvtts_roundpd_epu64(W,U,A,_MM_FROUND_NEARBYINT );
}

__m256i test_mm256_maskz_cvtts_roundpd_epu64(__mmask8 U, __m256d A){
// CHECK-LABEL: @test_mm256_maskz_cvtts_roundpd_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttpd2uqqs.round.256(<4 x double>
    return _mm256_maskz_cvtts_roundpd_epu64(U,A,_MM_FROUND_NEARBYINT );
}

// 128 bit
__m128i test_mm_cvttsps_epi64(__m128 A){
    // CHECK-LABEL: @test_mm_cvttsps_epi64
    // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.128(<4 x float>
    return _mm_cvttsps_epi64(A);
}

__m128i test_mm_mask_cvttsps_epi64(__m128i W, __mmask8 U, __m128 A){
    // CHECK-LABEL: @test_mm_mask_cvttsps_epi64
    // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.128(<4 x float>
    return _mm_mask_cvttsps_epi64(W, U,  A);
}

__m128i test_mm_maskz_cvttsps_epi64(__mmask8 U,__m128 A){
    // CHECK-LABEL: @test_mm_maskz_cvttsps_epi64
    // CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.128(<4 x float>
    return _mm_maskz_cvttsps_epi64(U, A);
}

__m128i test_mm_cvttsps_epu64(__m128 A){
    // CHECK-LABEL: @test_mm_cvttsps_epu64
    // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.128(<4 x float>
    return _mm_cvttsps_epu64(A);
}

__m128i test_mm_mask_cvttsps_epu64(__m128i W, __mmask8 U, __m128 A){
    // CHECK-LABEL: @test_mm_mask_cvttsps_epu64
    // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.128(<4 x float>
    return _mm_mask_cvttsps_epu64(W, U,  A);
}

__m128i test_mm_maskz_cvttsps_epu64(__mmask8 U,__m128 A){
    // CHECK-LABEL: @test_mm_maskz_cvttsps_epu64
    // CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.128(<4 x float>
    return _mm_maskz_cvttsps_epu64(U, A);
}

__m256i test_mm256_cvttsps_epi64(__m128 A){
// CHECK-LABEL: @test_mm256_cvttsps_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.round.256(<4 x float>
  return _mm256_cvttsps_epi64(A);
}

__m256i test_mm256_mask_cvttsps_epi64(__m256i W,__mmask8 U, __m128 A){
// CHECK-LABEL: @test_mm256_mask_cvttsps_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.round.256(<4 x float>
    return _mm256_mask_cvttsps_epi64(W,U, A);
}

__m256i test_mm256_maskz_cvttsps_epi64(__mmask8 U, __m128 A){
// CHECK-LABEL: @test_mm256_maskz_cvttsps_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.round.256(<4 x float>
    return _mm256_maskz_cvttsps_epi64(U, A);
}

__m256i test_mm256_cvtts_roundps_epi64(__m128 A){
// CHECK-LABEL: @test_mm256_cvtts_roundps_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.round.256(<4 x float>
    return _mm256_cvtts_roundps_epi64(A, _MM_FROUND_NEARBYINT );
}

__m256i test_mm256_mask_cvtts_roundps_epi64(__m256i W,__mmask8 U, __m128 A){
// CHECK-LABEL: @test_mm256_mask_cvtts_roundps_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.round.256(<4 x float>
    return _mm256_mask_cvtts_roundps_epi64(W,U,A,_MM_FROUND_NEARBYINT );
}

__m256i test_mm256_maskz_cvtts_roundps_epi64(__mmask8 U, __m128 A){
// CHECK-LABEL: @test_mm256_maskz_cvtts_roundps_epi64
// CHECK: @llvm.x86.avx10.mask.vcvttps2qqs.round.256(<4 x float>
    return _mm256_maskz_cvtts_roundps_epi64(U,A,_MM_FROUND_NEARBYINT );
}

__m256i test_mm256_cvttsps_epu64(__m128 A){
// CHECK-LABEL: @test_mm256_cvttsps_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.round.256(<4 x float>
  return _mm256_cvttsps_epu64(A);
}

__m256i test_mm256_mask_cvttsps_epu64(__m256i W,__mmask8 U, __m128 A){
// CHECK-LABEL: @test_mm256_mask_cvttsps_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.round.256(<4 x float>
    return _mm256_mask_cvttsps_epu64(W,U, A);
}

__m256i test_mm256_maskz_cvttsps_epu64(__mmask8 U, __m128 A){
// CHECK-LABEL: @test_mm256_maskz_cvttsps_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.round.256(<4 x float>
    return _mm256_maskz_cvttsps_epu64(U, A);
}

__m256i test_mm256_cvtts_roundps_epu64(__m128 A){
// CHECK-LABEL: @test_mm256_cvtts_roundps_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.round.256(<4 x float>
    return _mm256_cvtts_roundps_epu64(A, _MM_FROUND_NEARBYINT );
}

__m256i test_mm256_mask_cvtts_roundps_epu64(__m256i W,__mmask8 U, __m128 A){
// CHECK-LABEL: @test_mm256_mask_cvtts_roundps_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.round.256(<4 x float>
    return _mm256_mask_cvtts_roundps_epu64(W,U,A,_MM_FROUND_NEARBYINT );
}

__m256i test_mm256_maskz_cvtts_roundps_epu64(__mmask8 U, __m128 A){
// CHECK-LABEL: @test_mm256_maskz_cvtts_roundps_epu64
// CHECK: @llvm.x86.avx10.mask.vcvttps2uqqs.round.256(<4 x float>
    return _mm256_maskz_cvtts_roundps_epu64(U,A,_MM_FROUND_NEARBYINT );
}