// GENERATED FILE - DO NOT EDIT. // Generated by gen_vk_internal_shaders.py. // // Copyright 2018 The ANGLE Project Authors. All rights reserved. // Use of this source code is governed by a BSD-style license that can be // found in the LICENSE file. // // shaders/gen/GenerateMipmap.comp.00000008.inc: // Pre-generated shader for the ANGLE Vulkan back-end. #pragma once constexpr uint8_t kGenerateMipmap_comp_00000008[] = …; // Generated from: // // #version 450 core // // #extension GL_GOOGLE_include_directive : require // #extension GL_EXT_samplerless_texture_functions : require // // layout(local_size_x = 256, local_size_y = 1, local_size_z = 1)in; // // layout(set = 0, binding = 0, rgba32f)uniform coherent image2D dst[4]; // layout(set = 0, binding = 1)uniform sampler2D src; // // layout(push_constant)uniform PushConstants { // // vec2 invSrcExtent; // // uint levelCount; // } params; // // #line 1 "shaders/src/third_party/ffx_spd/ffx_a.h" // // float AF1_x(float a){ return float(a);} // vec2 AF2_x(float a){ return vec2(a, a);} // vec3 AF3_x(float a){ return vec3(a, a, a);} // vec4 AF4_x(float a){ return vec4(a, a, a, a);} // // uint AU1_x(uint a){ return uint(a);} // uvec2 AU2_x(uint a){ return uvec2(a, a);} // uvec3 AU3_x(uint a){ return uvec3(a, a, a);} // uvec4 AU4_x(uint a){ return uvec4(a, a, a, a);} // // uint AAbsSU1(uint a){ return uint(abs(int(a)));} // uvec2 AAbsSU2(uvec2 a){ return uvec2(abs(ivec2(a)));} // uvec3 AAbsSU3(uvec3 a){ return uvec3(abs(ivec3(a)));} // uvec4 AAbsSU4(uvec4 a){ return uvec4(abs(ivec4(a)));} // // uint ABfe(uint src, uint off, uint bits){ return bitfieldExtract(src, int(off), int(bits));} // uint ABfi(uint src, uint ins, uint mask){ return(ins & mask)|(src &(~ mask));} // // uint ABfiM(uint src, uint ins, uint bits){ return bitfieldInsert(src, ins, 0, int(bits));} // // float AFractF1(float x){ return fract(x);} // vec2 AFractF2(vec2 x){ return fract(x);} // vec3 AFractF3(vec3 x){ return fract(x);} // vec4 AFractF4(vec4 x){ return fract(x);} // // float ALerpF1(float x, float y, float a){ return mix(x, y, a);} // vec2 ALerpF2(vec2 x, vec2 y, vec2 a){ return mix(x, y, a);} // vec3 ALerpF3(vec3 x, vec3 y, vec3 a){ return mix(x, y, a);} // vec4 ALerpF4(vec4 x, vec4 y, vec4 a){ return mix(x, y, a);} // // float AMax3F1(float x, float y, float z){ return max(x, max(y, z));} // vec2 AMax3F2(vec2 x, vec2 y, vec2 z){ return max(x, max(y, z));} // vec3 AMax3F3(vec3 x, vec3 y, vec3 z){ return max(x, max(y, z));} // vec4 AMax3F4(vec4 x, vec4 y, vec4 z){ return max(x, max(y, z));} // // uint AMax3SU1(uint x, uint y, uint z){ return uint(max(int(x), max(int(y), int(z))));} // uvec2 AMax3SU2(uvec2 x, uvec2 y, uvec2 z){ return uvec2(max(ivec2(x), max(ivec2(y), ivec2(z))));} // uvec3 AMax3SU3(uvec3 x, uvec3 y, uvec3 z){ return uvec3(max(ivec3(x), max(ivec3(y), ivec3(z))));} // uvec4 AMax3SU4(uvec4 x, uvec4 y, uvec4 z){ return uvec4(max(ivec4(x), max(ivec4(y), ivec4(z))));} // // uint AMax3U1(uint x, uint y, uint z){ return max(x, max(y, z));} // uvec2 AMax3U2(uvec2 x, uvec2 y, uvec2 z){ return max(x, max(y, z));} // uvec3 AMax3U3(uvec3 x, uvec3 y, uvec3 z){ return max(x, max(y, z));} // uvec4 AMax3U4(uvec4 x, uvec4 y, uvec4 z){ return max(x, max(y, z));} // // uint AMaxSU1(uint a, uint b){ return uint(max(int(a), int(b)));} // uvec2 AMaxSU2(uvec2 a, uvec2 b){ return uvec2(max(ivec2(a), ivec2(b)));} // uvec3 AMaxSU3(uvec3 a, uvec3 b){ return uvec3(max(ivec3(a), ivec3(b)));} // uvec4 AMaxSU4(uvec4 a, uvec4 b){ return uvec4(max(ivec4(a), ivec4(b)));} // // float AMed3F1(float x, float y, float z){ return max(min(x, y), min(max(x, y), z));} // vec2 AMed3F2(vec2 x, vec2 y, vec2 z){ return max(min(x, y), min(max(x, y), z));} // vec3 AMed3F3(vec3 x, vec3 y, vec3 z){ return max(min(x, y), min(max(x, y), z));} // vec4 AMed3F4(vec4 x, vec4 y, vec4 z){ return max(min(x, y), min(max(x, y), z));} // // float AMin3F1(float x, float y, float z){ return min(x, min(y, z));} // vec2 AMin3F2(vec2 x, vec2 y, vec2 z){ return min(x, min(y, z));} // vec3 AMin3F3(vec3 x, vec3 y, vec3 z){ return min(x, min(y, z));} // vec4 AMin3F4(vec4 x, vec4 y, vec4 z){ return min(x, min(y, z));} // // uint AMin3SU1(uint x, uint y, uint z){ return uint(min(int(x), min(int(y), int(z))));} // uvec2 AMin3SU2(uvec2 x, uvec2 y, uvec2 z){ return uvec2(min(ivec2(x), min(ivec2(y), ivec2(z))));} // uvec3 AMin3SU3(uvec3 x, uvec3 y, uvec3 z){ return uvec3(min(ivec3(x), min(ivec3(y), ivec3(z))));} // uvec4 AMin3SU4(uvec4 x, uvec4 y, uvec4 z){ return uvec4(min(ivec4(x), min(ivec4(y), ivec4(z))));} // // uint AMin3U1(uint x, uint y, uint z){ return min(x, min(y, z));} // uvec2 AMin3U2(uvec2 x, uvec2 y, uvec2 z){ return min(x, min(y, z));} // uvec3 AMin3U3(uvec3 x, uvec3 y, uvec3 z){ return min(x, min(y, z));} // uvec4 AMin3U4(uvec4 x, uvec4 y, uvec4 z){ return min(x, min(y, z));} // // uint AMinSU1(uint a, uint b){ return uint(min(int(a), int(b)));} // uvec2 AMinSU2(uvec2 a, uvec2 b){ return uvec2(min(ivec2(a), ivec2(b)));} // uvec3 AMinSU3(uvec3 a, uvec3 b){ return uvec3(min(ivec3(a), ivec3(b)));} // uvec4 AMinSU4(uvec4 a, uvec4 b){ return uvec4(min(ivec4(a), ivec4(b)));} // // float ANCosF1(float x){ return cos(x * AF1_x(float(6.28318530718)));} // vec2 ANCosF2(vec2 x){ return cos(x * AF2_x(float(6.28318530718)));} // vec3 ANCosF3(vec3 x){ return cos(x * AF3_x(float(6.28318530718)));} // vec4 ANCosF4(vec4 x){ return cos(x * AF4_x(float(6.28318530718)));} // // float ANSinF1(float x){ return sin(x * AF1_x(float(6.28318530718)));} // vec2 ANSinF2(vec2 x){ return sin(x * AF2_x(float(6.28318530718)));} // vec3 ANSinF3(vec3 x){ return sin(x * AF3_x(float(6.28318530718)));} // vec4 ANSinF4(vec4 x){ return sin(x * AF4_x(float(6.28318530718)));} // // float ARcpF1(float x){ return AF1_x(float(1.0))/ x;} // vec2 ARcpF2(vec2 x){ return AF2_x(float(1.0))/ x;} // vec3 ARcpF3(vec3 x){ return AF3_x(float(1.0))/ x;} // vec4 ARcpF4(vec4 x){ return AF4_x(float(1.0))/ x;} // // float ARsqF1(float x){ return AF1_x(float(1.0))/ sqrt(x);} // vec2 ARsqF2(vec2 x){ return AF2_x(float(1.0))/ sqrt(x);} // vec3 ARsqF3(vec3 x){ return AF3_x(float(1.0))/ sqrt(x);} // vec4 ARsqF4(vec4 x){ return AF4_x(float(1.0))/ sqrt(x);} // // float ASatF1(float x){ return clamp(x, AF1_x(float(0.0)), AF1_x(float(1.0)));} // vec2 ASatF2(vec2 x){ return clamp(x, AF2_x(float(0.0)), AF2_x(float(1.0)));} // vec3 ASatF3(vec3 x){ return clamp(x, AF3_x(float(0.0)), AF3_x(float(1.0)));} // vec4 ASatF4(vec4 x){ return clamp(x, AF4_x(float(0.0)), AF4_x(float(1.0)));} // // uint AShrSU1(uint a, uint b){ return uint(int(a)>> int(b));} // uvec2 AShrSU2(uvec2 a, uvec2 b){ return uvec2(ivec2(a)>> ivec2(b));} // uvec3 AShrSU3(uvec3 a, uvec3 b){ return uvec3(ivec3(a)>> ivec3(b));} // uvec4 AShrSU4(uvec4 a, uvec4 b){ return uvec4(ivec4(a)>> ivec4(b));} // // float ACpySgnF1(float d, float s){ return uintBitsToFloat(uint(floatBitsToUint(float(d))|(floatBitsToUint(float(s))& AU1_x(uint(0x80000000u)))));} // vec2 ACpySgnF2(vec2 d, vec2 s){ return uintBitsToFloat(uvec2(floatBitsToUint(vec2(d))|(floatBitsToUint(vec2(s))& AU2_x(uint(0x80000000u)))));} // vec3 ACpySgnF3(vec3 d, vec3 s){ return uintBitsToFloat(uvec3(floatBitsToUint(vec3(d))|(floatBitsToUint(vec3(s))& AU3_x(uint(0x80000000u)))));} // vec4 ACpySgnF4(vec4 d, vec4 s){ return uintBitsToFloat(uvec4(floatBitsToUint(vec4(d))|(floatBitsToUint(vec4(s))& AU4_x(uint(0x80000000u)))));} // // float ASignedF1(float m){ return ASatF1(m * AF1_x(float(uintBitsToFloat(uint(0x7f800000u)))));} // vec2 ASignedF2(vec2 m){ return ASatF2(m * AF2_x(float(uintBitsToFloat(uint(0x7f800000u)))));} // vec3 ASignedF3(vec3 m){ return ASatF3(m * AF3_x(float(uintBitsToFloat(uint(0x7f800000u)))));} // vec4 ASignedF4(vec4 m){ return ASatF4(m * AF4_x(float(uintBitsToFloat(uint(0x7f800000u)))));} // // float APrxLoSqrtF1(float a){ return uintBitsToFloat(uint((floatBitsToUint(float(a))>> AU1_x(uint(1)))+ AU1_x(uint(0x1fbc4639))));} // float APrxLoRcpF1(float a){ return uintBitsToFloat(uint(AU1_x(uint(0x7ef07ebb))- floatBitsToUint(float(a))));} // float APrxMedRcpF1(float a){ float b = uintBitsToFloat(uint(AU1_x(uint(0x7ef19fff))- floatBitsToUint(float(a))));return b *(- b * a + AF1_x(float(2.0)));} // float APrxLoRsqF1(float a){ return uintBitsToFloat(uint(AU1_x(uint(0x5f347d74))-(floatBitsToUint(float(a))>> AU1_x(uint(1)))));} // // float APSinF1(float x){ return x * abs(x)- x;} // float APCosF1(float x){ x = AFractF1(x * AF1_x(float(0.5))+ AF1_x(float(0.75)));x = x * AF1_x(float(2.0))- AF1_x(float(1.0));return APSinF1(x);} // // float ATo709F1(float c){ return max(min(c * AF1_x(float(4.5)), AF1_x(float(0.018))), AF1_x(float(1.099))* pow(c, AF1_x(float(0.45)))- AF1_x(float(0.099)));} // // float AToGammaF1(float c, float rcpX){ return pow(c, rcpX);} // // float AToPqF1(float x){ float p = pow(x, AF1_x(float(0.159302))); // return pow((AF1_x(float(0.835938))+ AF1_x(float(18.8516))* p)/(AF1_x(float(1.0))+ AF1_x(float(18.6875))* p), AF1_x(float(78.8438)));} // // float AToSrgbF1(float c){ return max(min(c * AF1_x(float(12.92)), AF1_x(float(0.0031308))), AF1_x(float(1.055))* pow(c, AF1_x(float(0.41666)))- AF1_x(float(0.055)));} // // float AToTwoF1(float c){ return sqrt(c);} // // float AFrom709F1(float c){ return max(min(c * AF1_x(float(1.0 / 4.5)), AF1_x(float(0.081))), // pow((c + AF1_x(float(0.099)))*(AF1_x(float(1.0))/(AF1_x(float(1.099)))), AF1_x(float(1.0 / 0.45))));} // // float AFromGammaF1(float c, float x){ return pow(c, x);} // // float AFromPqF1(float x){ float p = pow(x, AF1_x(float(0.0126833))); // return pow(ASatF1(p - AF1_x(float(0.835938)))/(AF1_x(float(18.8516))- AF1_x(float(18.6875))* p), AF1_x(float(6.27739)));} // // float AFromSrgbF1(float c){ return max(min(c * AF1_x(float(1.0 / 12.92)), AF1_x(float(0.04045))), // pow((c + AF1_x(float(0.055)))*(AF1_x(float(1.0))/ AF1_x(float(1.055))), AF1_x(float(2.4))));} // // float AFromTwoF1(float c){ return c * c;} // // uvec2 ARmp8x8(uint a){ return uvec2(ABfe(a, 1u, 3u), ABfiM(ABfe(a, 3u, 3u), a, 1u));} // // uvec2 ARmpRed8x8(uint a){ return uvec2(ABfiM(ABfe(a, 2u, 3u), a, 1u), ABfiM(ABfe(a, 3u, 3u), ABfe(a, 1u, 2u), 2u));} // // vec2 opAAbsF2(out vec2 d, in vec2 a){ d = abs(a);return d;} // vec3 opAAbsF3(out vec3 d, in vec3 a){ d = abs(a);return d;} // vec4 opAAbsF4(out vec4 d, in vec4 a){ d = abs(a);return d;} // // vec2 opAAddF2(out vec2 d, in vec2 a, in vec2 b){ d = a + b;return d;} // vec3 opAAddF3(out vec3 d, in vec3 a, in vec3 b){ d = a + b;return d;} // vec4 opAAddF4(out vec4 d, in vec4 a, in vec4 b){ d = a + b;return d;} // // vec2 opACpyF2(out vec2 d, in vec2 a){ d = a;return d;} // vec3 opACpyF3(out vec3 d, in vec3 a){ d = a;return d;} // vec4 opACpyF4(out vec4 d, in vec4 a){ d = a;return d;} // // vec2 opALerpF2(out vec2 d, in vec2 a, in vec2 b, in vec2 c){ d = ALerpF2(a, b, c);return d;} // vec3 opALerpF3(out vec3 d, in vec3 a, in vec3 b, in vec3 c){ d = ALerpF3(a, b, c);return d;} // vec4 opALerpF4(out vec4 d, in vec4 a, in vec4 b, in vec4 c){ d = ALerpF4(a, b, c);return d;} // // vec2 opALerpOneF2(out vec2 d, in vec2 a, in vec2 b, float c){ d = ALerpF2(a, b, AF2_x(float(c)));return d;} // vec3 opALerpOneF3(out vec3 d, in vec3 a, in vec3 b, float c){ d = ALerpF3(a, b, AF3_x(float(c)));return d;} // vec4 opALerpOneF4(out vec4 d, in vec4 a, in vec4 b, float c){ d = ALerpF4(a, b, AF4_x(float(c)));return d;} // // vec2 opAMaxF2(out vec2 d, in vec2 a, in vec2 b){ d = max(a, b);return d;} // vec3 opAMaxF3(out vec3 d, in vec3 a, in vec3 b){ d = max(a, b);return d;} // vec4 opAMaxF4(out vec4 d, in vec4 a, in vec4 b){ d = max(a, b);return d;} // // vec2 opAMinF2(out vec2 d, in vec2 a, in vec2 b){ d = min(a, b);return d;} // vec3 opAMinF3(out vec3 d, in vec3 a, in vec3 b){ d = min(a, b);return d;} // vec4 opAMinF4(out vec4 d, in vec4 a, in vec4 b){ d = min(a, b);return d;} // // vec2 opAMulF2(out vec2 d, in vec2 a, in vec2 b){ d = a * b;return d;} // vec3 opAMulF3(out vec3 d, in vec3 a, in vec3 b){ d = a * b;return d;} // vec4 opAMulF4(out vec4 d, in vec4 a, in vec4 b){ d = a * b;return d;} // // vec2 opAMulOneF2(out vec2 d, in vec2 a, float b){ d = a * AF2_x(float(b));return d;} // vec3 opAMulOneF3(out vec3 d, in vec3 a, float b){ d = a * AF3_x(float(b));return d;} // vec4 opAMulOneF4(out vec4 d, in vec4 a, float b){ d = a * AF4_x(float(b));return d;} // // vec2 opANegF2(out vec2 d, in vec2 a){ d = - a;return d;} // vec3 opANegF3(out vec3 d, in vec3 a){ d = - a;return d;} // vec4 opANegF4(out vec4 d, in vec4 a){ d = - a;return d;} // // vec2 opARcpF2(out vec2 d, in vec2 a){ d = ARcpF2(a);return d;} // vec3 opARcpF3(out vec3 d, in vec3 a){ d = ARcpF3(a);return d;} // vec4 opARcpF4(out vec4 d, in vec4 a){ d = ARcpF4(a);return d;} // // #line 70 "shaders/src/GenerateMipmap.comp" // // shared vec4 spd_intermediate[16][16]; // // shared uint spd_counter; // // vec4 SpdLoadSourceImage(ivec2 p) // { // vec2 textureCoord = p * params . invSrcExtent + params . invSrcExtent; // return texture(src, textureCoord); // } // // vec4 SpdLoad(ivec2 p) // { // return vec4(0); // } // // void SpdStore(ivec2 p, vec4 value, uint mip) // { // imageStore(dst[mip], p, value); // } // // vec4 SpdLoadIntermediate(uint x, uint y) // { // return spd_intermediate[x][y]; // } // void SpdStoreIntermediate(uint x, uint y, vec4 value) // { // spd_intermediate[x][y]= value; // } // // vec4 SpdReduce4(vec4 v0, vec4 v1, vec4 v2, vec4 v3) // { // return(v0 + v1 + v2 + v3)* 0.25; // } // // #line 1 "shaders/src/third_party/ffx_spd/ffx_spd.h" // // #extension GL_KHR_shader_subgroup_quad : require // // void SpdWorkgroupShuffleBarrier(){ // // barrier(); // // } // // bool SpdExitWorkgroup(uint numWorkGroups, uint localInvocationIndex) // { // // if(localInvocationIndex == 0) // { // ; // } // SpdWorkgroupShuffleBarrier(); // return(0 !=(numWorkGroups - 1)); // } // // vec4 SpdReduceQuad(vec4 v) // { // // vec4 v0 = v; // vec4 v1 = subgroupQuadSwapHorizontal(v); // vec4 v2 = subgroupQuadSwapVertical(v); // vec4 v3 = subgroupQuadSwapDiagonal(v); // return SpdReduce4(v0, v1, v2, v3); // // return AF4_x(0.0); // } // // vec4 SpdReduceIntermediate(uvec2 i0, uvec2 i1, uvec2 i2, uvec2 i3) // { // vec4 v0 = SpdLoadIntermediate(i0 . x, i0 . y); // vec4 v1 = SpdLoadIntermediate(i1 . x, i1 . y); // vec4 v2 = SpdLoadIntermediate(i2 . x, i2 . y); // vec4 v3 = SpdLoadIntermediate(i3 . x, i3 . y); // return SpdReduce4(v0, v1, v2, v3); // } // // vec4 SpdReduceLoad4(uvec2 i0, uvec2 i1, uvec2 i2, uvec2 i3) // { // vec4 v0 = SpdLoad(ivec2(i0)); // vec4 v1 = SpdLoad(ivec2(i1)); // vec4 v2 = SpdLoad(ivec2(i2)); // vec4 v3 = SpdLoad(ivec2(i3)); // return SpdReduce4(v0, v1, v2, v3); // } // // vec4 SpdReduceLoad4(uvec2 base) // { // return SpdReduceLoad4( // uvec2(base + uvec2(0, 0)), // uvec2(base + uvec2(0, 1)), // uvec2(base + uvec2(1, 0)), // uvec2(base + uvec2(1, 1))); // } // // vec4 SpdReduceLoadSourceImage4(uvec2 i0, uvec2 i1, uvec2 i2, uvec2 i3) // { // vec4 v0 = SpdLoadSourceImage(ivec2(i0)); // vec4 v1 = SpdLoadSourceImage(ivec2(i1)); // vec4 v2 = SpdLoadSourceImage(ivec2(i2)); // vec4 v3 = SpdLoadSourceImage(ivec2(i3)); // return SpdReduce4(v0, v1, v2, v3); // } // // vec4 SpdReduceLoadSourceImage4(uvec2 base) // { // // return SpdLoadSourceImage(ivec2(base)); // // } // // void SpdDownsampleMips_0_1_Intrinsics(uint x, uint y, uvec2 workGroupID, uint localInvocationIndex, uint mip) // { // vec4 v[4]; // // ivec2 tex = ivec2(workGroupID . xy * 64)+ ivec2(x * 2, y * 2); // ivec2 pix = ivec2(workGroupID . xy * 32)+ ivec2(x, y); // v[0]= SpdReduceLoadSourceImage4(tex); // SpdStore(pix, v[0], 0); // // tex = ivec2(workGroupID . xy * 64)+ ivec2(x * 2 + 32, y * 2); // pix = ivec2(workGroupID . xy * 32)+ ivec2(x + 16, y); // v[1]= SpdReduceLoadSourceImage4(tex); // SpdStore(pix, v[1], 0); // // tex = ivec2(workGroupID . xy * 64)+ ivec2(x * 2, y * 2 + 32); // pix = ivec2(workGroupID . xy * 32)+ ivec2(x, y + 16); // v[2]= SpdReduceLoadSourceImage4(tex); // SpdStore(pix, v[2], 0); // // tex = ivec2(workGroupID . xy * 64)+ ivec2(x * 2 + 32, y * 2 + 32); // pix = ivec2(workGroupID . xy * 32)+ ivec2(x + 16, y + 16); // v[3]= SpdReduceLoadSourceImage4(tex); // SpdStore(pix, v[3], 0); // // if(mip <= 1) // return; // // v[0]= SpdReduceQuad(v[0]); // v[1]= SpdReduceQuad(v[1]); // v[2]= SpdReduceQuad(v[2]); // v[3]= SpdReduceQuad(v[3]); // // if((localInvocationIndex % 4)== 0) // { // SpdStore(ivec2(workGroupID . xy * 16)+ // ivec2(x / 2, y / 2), v[0], 1); // SpdStoreIntermediate( // x / 2, y / 2, v[0]); // // SpdStore(ivec2(workGroupID . xy * 16)+ // ivec2(x / 2 + 8, y / 2), v[1], 1); // SpdStoreIntermediate( // x / 2 + 8, y / 2, v[1]); // // SpdStore(ivec2(workGroupID . xy * 16)+ // ivec2(x / 2, y / 2 + 8), v[2], 1); // SpdStoreIntermediate( // x / 2, y / 2 + 8, v[2]); // // SpdStore(ivec2(workGroupID . xy * 16)+ // ivec2(x / 2 + 8, y / 2 + 8), v[3], 1); // SpdStoreIntermediate( // x / 2 + 8, y / 2 + 8, v[3]); // } // } // // void SpdDownsampleMips_0_1_LDS(uint x, uint y, uvec2 workGroupID, uint localInvocationIndex, uint mip) // { // vec4 v[4]; // // ivec2 tex = ivec2(workGroupID . xy * 64)+ ivec2(x * 2, y * 2); // ivec2 pix = ivec2(workGroupID . xy * 32)+ ivec2(x, y); // v[0]= SpdReduceLoadSourceImage4(tex); // SpdStore(pix, v[0], 0); // // tex = ivec2(workGroupID . xy * 64)+ ivec2(x * 2 + 32, y * 2); // pix = ivec2(workGroupID . xy * 32)+ ivec2(x + 16, y); // v[1]= SpdReduceLoadSourceImage4(tex); // SpdStore(pix, v[1], 0); // // tex = ivec2(workGroupID . xy * 64)+ ivec2(x * 2, y * 2 + 32); // pix = ivec2(workGroupID . xy * 32)+ ivec2(x, y + 16); // v[2]= SpdReduceLoadSourceImage4(tex); // SpdStore(pix, v[2], 0); // // tex = ivec2(workGroupID . xy * 64)+ ivec2(x * 2 + 32, y * 2 + 32); // pix = ivec2(workGroupID . xy * 32)+ ivec2(x + 16, y + 16); // v[3]= SpdReduceLoadSourceImage4(tex); // SpdStore(pix, v[3], 0); // // if(mip <= 1) // return; // // for(int i = 0;i < 4;i ++) // { // SpdStoreIntermediate(x, y, v[i]); // SpdWorkgroupShuffleBarrier(); // if(localInvocationIndex < 64) // { // v[i]= SpdReduceIntermediate( // uvec2(x * 2 + 0, y * 2 + 0), // uvec2(x * 2 + 1, y * 2 + 0), // uvec2(x * 2 + 0, y * 2 + 1), // uvec2(x * 2 + 1, y * 2 + 1) // ); // SpdStore(ivec2(workGroupID . xy * 16)+ ivec2(x +(i % 2)* 8, y +(i / 2)* 8), v[i], 1); // } // SpdWorkgroupShuffleBarrier(); // } // // if(localInvocationIndex < 64) // { // SpdStoreIntermediate(x + 0, y + 0, v[0]); // SpdStoreIntermediate(x + 8, y + 0, v[1]); // SpdStoreIntermediate(x + 0, y + 8, v[2]); // SpdStoreIntermediate(x + 8, y + 8, v[3]); // } // } // // void SpdDownsampleMips_0_1(uint x, uint y, uvec2 workGroupID, uint localInvocationIndex, uint mip) // { // // SpdDownsampleMips_0_1_Intrinsics(x, y, workGroupID, localInvocationIndex, mip); // // } // // void SpdDownsampleMip_2(uint x, uint y, uvec2 workGroupID, uint localInvocationIndex, uint mip) // { // // vec4 v = SpdLoadIntermediate(x, y); // v = SpdReduceQuad(v); // // if(localInvocationIndex % 4 == 0) // { // SpdStore(ivec2(workGroupID . xy * 8)+ ivec2(x / 2, y / 2), v, mip); // SpdStoreIntermediate(x +(y / 2)% 2, y, v); // } // // } // // void SpdDownsampleMip_3(uint x, uint y, uvec2 workGroupID, uint localInvocationIndex, uint mip) // { // // if(localInvocationIndex < 64) // { // vec4 v = SpdLoadIntermediate(x * 2 + y % 2, y * 2); // v = SpdReduceQuad(v); // // if(localInvocationIndex % 4 == 0) // { // SpdStore(ivec2(workGroupID . xy * 4)+ ivec2(x / 2, y / 2), v, mip); // SpdStoreIntermediate(x * 2 + y / 2, y * 2, v); // } // } // // } // // void SpdDownsampleMip_4(uint x, uint y, uvec2 workGroupID, uint localInvocationIndex, uint mip) // { // // if(localInvocationIndex < 16) // { // vec4 v = SpdLoadIntermediate(x * 4 + y, y * 4); // v = SpdReduceQuad(v); // // if(localInvocationIndex % 4 == 0) // { // SpdStore(ivec2(workGroupID . xy * 2)+ ivec2(x / 2, y / 2), v, mip); // SpdStoreIntermediate(x / 2 + y, 0, v); // } // } // // } // // void SpdDownsampleMip_5(uint x, uint y, uvec2 workGroupID, uint localInvocationIndex, uint mip) // { // // if(localInvocationIndex < 4) // { // vec4 v = SpdLoadIntermediate(localInvocationIndex, 0); // v = SpdReduceQuad(v); // // if(localInvocationIndex % 4 == 0) // { // SpdStore(ivec2(workGroupID . xy), v, mip); // } // } // // } // // void SpdDownsampleMips_6_7(uint x, uint y, uint mips) // { // ivec2 tex = ivec2(x * 4 + 0, y * 4 + 0); // ivec2 pix = ivec2(x * 2 + 0, y * 2 + 0); // vec4 v0 = SpdReduceLoad4(tex); // SpdStore(pix, v0, 6); // // tex = ivec2(x * 4 + 2, y * 4 + 0); // pix = ivec2(x * 2 + 1, y * 2 + 0); // vec4 v1 = SpdReduceLoad4(tex); // SpdStore(pix, v1, 6); // // tex = ivec2(x * 4 + 0, y * 4 + 2); // pix = ivec2(x * 2 + 0, y * 2 + 1); // vec4 v2 = SpdReduceLoad4(tex); // SpdStore(pix, v2, 6); // // tex = ivec2(x * 4 + 2, y * 4 + 2); // pix = ivec2(x * 2 + 1, y * 2 + 1); // vec4 v3 = SpdReduceLoad4(tex); // SpdStore(pix, v3, 6); // // if(mips <= 7)return; // // vec4 v = SpdReduce4(v0, v1, v2, v3); // SpdStore(ivec2(x, y), v, 7); // SpdStoreIntermediate(x, y, v); // } // // void SpdDownsampleNextFour(uint x, uint y, uvec2 workGroupID, uint localInvocationIndex, uint baseMip, uint mips) // { // if(mips <= baseMip)return; // SpdWorkgroupShuffleBarrier(); // SpdDownsampleMip_2(x, y, workGroupID, localInvocationIndex, baseMip); // // if(mips <= baseMip + 1)return; // SpdWorkgroupShuffleBarrier(); // SpdDownsampleMip_3(x, y, workGroupID, localInvocationIndex, baseMip + 1); // // if(mips <= baseMip + 2)return; // SpdWorkgroupShuffleBarrier(); // SpdDownsampleMip_4(x, y, workGroupID, localInvocationIndex, baseMip + 2); // // if(mips <= baseMip + 3)return; // SpdWorkgroupShuffleBarrier(); // SpdDownsampleMip_5(x, y, workGroupID, localInvocationIndex, baseMip + 3); // } // // void SpdDownsample( // uvec2 workGroupID, // uint localInvocationIndex, // uint mips, // uint numWorkGroups // ){ // uvec2 sub_xy = ARmpRed8x8(localInvocationIndex % 64); // uint x = sub_xy . x + 8 *((localInvocationIndex >> 6)% 2); // uint y = sub_xy . y + 8 *((localInvocationIndex >> 7)); // SpdDownsampleMips_0_1(x, y, workGroupID, localInvocationIndex, mips); // // SpdDownsampleNextFour(x, y, workGroupID, localInvocationIndex, 2, mips); // // if(mips <= 6)return; // // if(SpdExitWorkgroup(numWorkGroups, localInvocationIndex))return; // // SpdDownsampleMips_6_7(x, y, mips); // // SpdDownsampleNextFour(x, y, uvec2(0, 0), localInvocationIndex, 8, mips); // } // // #line 175 "shaders/src/GenerateMipmap.comp" // // void main() // { // // SpdDownsample(gl_WorkGroupID . xy, gl_LocalInvocationIndex, params . levelCount, 0); // // }