#include <xmmintrin.h>
#include "config/aom_dsp_rtcd.h"
#include "aom_dsp/aom_dsp_common.h"
#include "aom_dsp/fft_common.h"
static inline void transpose4x4(const float *A, float *B, const int lda,
const int ldb) { … }
void aom_transpose_float_sse2(const float *A, float *B, int n);
void aom_transpose_float_sse2(const float *A, float *B, int n) { … }
void aom_fft_unpack_2d_output_sse2(const float *packed, float *output, int n);
void aom_fft_unpack_2d_output_sse2(const float *packed, float *output, int n) { … }
GEN_FFT_4(…)
GEN_FFT_8(…)
GEN_FFT_16(…)
GEN_FFT_32(…)
void aom_fft4x4_float_sse2(const float *input, float *temp, float *output) { … }
void aom_fft8x8_float_sse2(const float *input, float *temp, float *output) { … }
void aom_fft16x16_float_sse2(const float *input, float *temp, float *output) { … }
void aom_fft32x32_float_sse2(const float *input, float *temp, float *output) { … }
GEN_IFFT_4(…)
GEN_IFFT_8(…)
GEN_IFFT_16(…)
GEN_IFFT_32(…)
void aom_ifft4x4_float_sse2(const float *input, float *temp, float *output) { … }
void aom_ifft8x8_float_sse2(const float *input, float *temp, float *output) { … }
void aom_ifft16x16_float_sse2(const float *input, float *temp, float *output) { … }
void aom_ifft32x32_float_sse2(const float *input, float *temp, float *output) { … }