25 #error "Never use <avx512bwintrin.h> directly; include <immintrin.h> instead." 28 #ifndef __AVX512BWINTRIN_H 29 #define __AVX512BWINTRIN_H 35 #define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bw"), __min_vector_width__(512))) 39 #define _mm512_cmp_epi8_mask(a, b, p) \ 40 (__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \ 41 (__v64qi)(__m512i)(b), (int)(p), \ 44 #define _mm512_mask_cmp_epi8_mask(m, a, b, p) \ 45 (__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \ 46 (__v64qi)(__m512i)(b), (int)(p), \ 49 #define _mm512_cmp_epu8_mask(a, b, p) \ 50 (__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \ 51 (__v64qi)(__m512i)(b), (int)(p), \ 54 #define _mm512_mask_cmp_epu8_mask(m, a, b, p) \ 55 (__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \ 56 (__v64qi)(__m512i)(b), (int)(p), \ 59 #define _mm512_cmp_epi16_mask(a, b, p) \ 60 (__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \ 61 (__v32hi)(__m512i)(b), (int)(p), \ 64 #define _mm512_mask_cmp_epi16_mask(m, a, b, p) \ 65 (__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \ 66 (__v32hi)(__m512i)(b), (int)(p), \ 69 #define _mm512_cmp_epu16_mask(a, b, p) \ 70 (__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \ 71 (__v32hi)(__m512i)(b), (int)(p), \ 74 #define _mm512_mask_cmp_epu16_mask(m, a, b, p) \ 75 (__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \ 76 (__v32hi)(__m512i)(b), (int)(p), \ 79 #define _mm512_cmpeq_epi8_mask(A, B) \ 80 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_EQ) 81 #define _mm512_mask_cmpeq_epi8_mask(k, A, B) \ 82 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_EQ) 83 #define _mm512_cmpge_epi8_mask(A, B) \ 84 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_GE) 85 #define _mm512_mask_cmpge_epi8_mask(k, A, B) \ 86 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_GE) 87 #define _mm512_cmpgt_epi8_mask(A, B) \ 88 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_GT) 89 #define _mm512_mask_cmpgt_epi8_mask(k, A, B) \ 90 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_GT) 91 #define _mm512_cmple_epi8_mask(A, B) \ 92 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_LE) 93 #define _mm512_mask_cmple_epi8_mask(k, A, B) \ 94 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_LE) 95 #define _mm512_cmplt_epi8_mask(A, B) \ 96 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_LT) 97 #define _mm512_mask_cmplt_epi8_mask(k, A, B) \ 98 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_LT) 99 #define _mm512_cmpneq_epi8_mask(A, B) \ 100 _mm512_cmp_epi8_mask((A), (B), _MM_CMPINT_NE) 101 #define _mm512_mask_cmpneq_epi8_mask(k, A, B) \ 102 _mm512_mask_cmp_epi8_mask((k), (A), (B), _MM_CMPINT_NE) 104 #define _mm512_cmpeq_epu8_mask(A, B) \ 105 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_EQ) 106 #define _mm512_mask_cmpeq_epu8_mask(k, A, B) \ 107 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_EQ) 108 #define _mm512_cmpge_epu8_mask(A, B) \ 109 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_GE) 110 #define _mm512_mask_cmpge_epu8_mask(k, A, B) \ 111 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_GE) 112 #define _mm512_cmpgt_epu8_mask(A, B) \ 113 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_GT) 114 #define _mm512_mask_cmpgt_epu8_mask(k, A, B) \ 115 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_GT) 116 #define _mm512_cmple_epu8_mask(A, B) \ 117 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_LE) 118 #define _mm512_mask_cmple_epu8_mask(k, A, B) \ 119 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_LE) 120 #define _mm512_cmplt_epu8_mask(A, B) \ 121 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_LT) 122 #define _mm512_mask_cmplt_epu8_mask(k, A, B) \ 123 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_LT) 124 #define _mm512_cmpneq_epu8_mask(A, B) \ 125 _mm512_cmp_epu8_mask((A), (B), _MM_CMPINT_NE) 126 #define _mm512_mask_cmpneq_epu8_mask(k, A, B) \ 127 _mm512_mask_cmp_epu8_mask((k), (A), (B), _MM_CMPINT_NE) 129 #define _mm512_cmpeq_epi16_mask(A, B) \ 130 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_EQ) 131 #define _mm512_mask_cmpeq_epi16_mask(k, A, B) \ 132 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_EQ) 133 #define _mm512_cmpge_epi16_mask(A, B) \ 134 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_GE) 135 #define _mm512_mask_cmpge_epi16_mask(k, A, B) \ 136 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_GE) 137 #define _mm512_cmpgt_epi16_mask(A, B) \ 138 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_GT) 139 #define _mm512_mask_cmpgt_epi16_mask(k, A, B) \ 140 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_GT) 141 #define _mm512_cmple_epi16_mask(A, B) \ 142 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_LE) 143 #define _mm512_mask_cmple_epi16_mask(k, A, B) \ 144 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_LE) 145 #define _mm512_cmplt_epi16_mask(A, B) \ 146 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_LT) 147 #define _mm512_mask_cmplt_epi16_mask(k, A, B) \ 148 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_LT) 149 #define _mm512_cmpneq_epi16_mask(A, B) \ 150 _mm512_cmp_epi16_mask((A), (B), _MM_CMPINT_NE) 151 #define _mm512_mask_cmpneq_epi16_mask(k, A, B) \ 152 _mm512_mask_cmp_epi16_mask((k), (A), (B), _MM_CMPINT_NE) 154 #define _mm512_cmpeq_epu16_mask(A, B) \ 155 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_EQ) 156 #define _mm512_mask_cmpeq_epu16_mask(k, A, B) \ 157 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_EQ) 158 #define _mm512_cmpge_epu16_mask(A, B) \ 159 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_GE) 160 #define _mm512_mask_cmpge_epu16_mask(k, A, B) \ 161 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_GE) 162 #define _mm512_cmpgt_epu16_mask(A, B) \ 163 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_GT) 164 #define _mm512_mask_cmpgt_epu16_mask(k, A, B) \ 165 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_GT) 166 #define _mm512_cmple_epu16_mask(A, B) \ 167 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_LE) 168 #define _mm512_mask_cmple_epu16_mask(k, A, B) \ 169 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LE) 170 #define _mm512_cmplt_epu16_mask(A, B) \ 171 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_LT) 172 #define _mm512_mask_cmplt_epu16_mask(k, A, B) \ 173 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_LT) 174 #define _mm512_cmpneq_epu16_mask(A, B) \ 175 _mm512_cmp_epu16_mask((A), (B), _MM_CMPINT_NE) 176 #define _mm512_mask_cmpneq_epu16_mask(k, A, B) \ 177 _mm512_mask_cmp_epu16_mask((k), (A), (B), _MM_CMPINT_NE) 181 return (__m512i) ((__v64qu) __A + (__v64qu) __B);
186 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
193 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
200 return (__m512i) ((__v64qu) __A - (__v64qu) __B);
205 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
212 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
219 return (__m512i) ((__v32hu) __A + (__v32hu) __B);
224 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
231 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
238 return (__m512i) ((__v32hu) __A - (__v32hu) __B);
243 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
250 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
257 return (__m512i) ((__v32hu) __A * (__v32hu) __B);
262 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
269 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
277 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
285 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
293 return (__m512i)__builtin_ia32_pabsb512((__v64qi)__A);
299 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
307 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
315 return (__m512i)__builtin_ia32_pabsw512((__v32hi)__A);
321 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
329 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
337 return (__m512i)__builtin_ia32_packssdw512((__v16si)__A, (__v16si)__B);
343 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
351 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
359 return (__m512i)__builtin_ia32_packsswb512((__v32hi)__A, (__v32hi) __B);
365 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
373 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
381 return (__m512i)__builtin_ia32_packusdw512((__v16si) __A, (__v16si) __B);
387 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
395 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
403 return (__m512i)__builtin_ia32_packuswb512((__v32hi) __A, (__v32hi) __B);
409 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
417 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
425 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
435 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
444 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
453 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
463 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
472 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
481 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
491 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
500 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
509 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
519 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
528 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
537 typedef unsigned short __v64hu
__attribute__((__vector_size__(128)));
538 return (__m512i)__builtin_convertvector(
539 ((__builtin_convertvector((__v64qu) __A, __v64hu) +
540 __builtin_convertvector((__v64qu) __B, __v64hu)) + 1)
548 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
556 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
564 typedef unsigned int __v32su
__attribute__((__vector_size__(128)));
565 return (__m512i)__builtin_convertvector(
566 ((__builtin_convertvector((__v32hu) __A, __v32su) +
567 __builtin_convertvector((__v32hu) __B, __v32su)) + 1)
575 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
583 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
591 return (__m512i)__builtin_ia32_pmaxsb512((__v64qi) __A, (__v64qi) __B);
597 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
605 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
613 return (__m512i)__builtin_ia32_pmaxsw512((__v32hi) __A, (__v32hi) __B);
619 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
628 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
636 return (__m512i)__builtin_ia32_pmaxub512((__v64qi)__A, (__v64qi)__B);
642 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
650 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
658 return (__m512i)__builtin_ia32_pmaxuw512((__v32hi)__A, (__v32hi)__B);
664 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
672 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
680 return (__m512i)__builtin_ia32_pminsb512((__v64qi) __A, (__v64qi) __B);
686 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
694 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
702 return (__m512i)__builtin_ia32_pminsw512((__v32hi) __A, (__v32hi) __B);
708 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
716 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
724 return (__m512i)__builtin_ia32_pminub512((__v64qi)__A, (__v64qi)__B);
730 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
738 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
746 return (__m512i)__builtin_ia32_pminuw512((__v32hi)__A, (__v32hi)__B);
752 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
760 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
768 return (__m512i)__builtin_ia32_pshufb512((__v64qi)__A,(__v64qi)__B);
774 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
782 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
790 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
800 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
809 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
818 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
828 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
837 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
846 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
856 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
865 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
874 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
884 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
893 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
902 return (__m512i)__builtin_ia32_vpermi2varhi512((__v32hi)__A, (__v32hi)__I,
910 return (__m512i)__builtin_ia32_selectw_512(__U,
919 return (__m512i)__builtin_ia32_selectw_512(__U,
928 return (__m512i)__builtin_ia32_selectw_512(__U,
936 return (__m512i)__builtin_ia32_pmulhrsw512((__v32hi)__A, (__v32hi)__B);
942 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
950 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
958 return (__m512i)__builtin_ia32_pmulhw512((__v32hi) __A, (__v32hi) __B);
965 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
973 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
981 return (__m512i)__builtin_ia32_pmulhuw512((__v32hi) __A, (__v32hi) __B);
987 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
995 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1002 return (__m512i)__builtin_ia32_pmaddubsw512((__v64qi)__X, (__v64qi)__Y);
1008 return (__m512i)__builtin_ia32_selectw_512((
__mmask32) __U,
1015 return (__m512i)__builtin_ia32_selectw_512((
__mmask32) __U,
1022 return (__m512i)__builtin_ia32_pmaddwd512((__v32hi)__A, (__v32hi)__B);
1027 return (__m512i)__builtin_ia32_selectd_512((
__mmask16)__U,
1034 return (__m512i)__builtin_ia32_selectd_512((
__mmask16)__U,
1041 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1048 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1055 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1062 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1069 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1076 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1083 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1090 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1097 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1105 __builtin_ia32_pmovwb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1111 __builtin_ia32_pmovswb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1117 __builtin_ia32_pmovuswb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1122 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1124 10, 64+10, 11, 64+11,
1125 12, 64+12, 13, 64+13,
1126 14, 64+14, 15, 64+15,
1127 24, 64+24, 25, 64+25,
1128 26, 64+26, 27, 64+27,
1129 28, 64+28, 29, 64+29,
1130 30, 64+30, 31, 64+31,
1131 40, 64+40, 41, 64+41,
1132 42, 64+42, 43, 64+43,
1133 44, 64+44, 45, 64+45,
1134 46, 64+46, 47, 64+47,
1135 56, 64+56, 57, 64+57,
1136 58, 64+58, 59, 64+59,
1137 60, 64+60, 61, 64+61,
1138 62, 64+62, 63, 64+63);
1143 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1150 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1157 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1160 12, 32+12, 13, 32+13,
1161 14, 32+14, 15, 32+15,
1162 20, 32+20, 21, 32+21,
1163 22, 32+22, 23, 32+23,
1164 28, 32+28, 29, 32+29,
1165 30, 32+30, 31, 32+31);
1170 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1177 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1184 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1189 16, 64+16, 17, 64+17,
1190 18, 64+18, 19, 64+19,
1191 20, 64+20, 21, 64+21,
1192 22, 64+22, 23, 64+23,
1193 32, 64+32, 33, 64+33,
1194 34, 64+34, 35, 64+35,
1195 36, 64+36, 37, 64+37,
1196 38, 64+38, 39, 64+39,
1197 48, 64+48, 49, 64+49,
1198 50, 64+50, 51, 64+51,
1199 52, 64+52, 53, 64+53,
1200 54, 64+54, 55, 64+55);
1205 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1212 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1219 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1223 10, 32+10, 11, 32+11,
1224 16, 32+16, 17, 32+17,
1225 18, 32+18, 19, 32+19,
1226 24, 32+24, 25, 32+25,
1227 26, 32+26, 27, 32+27);
1232 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1239 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1249 return (__m512i)__builtin_convertvector((__v32qs)__A, __v32hi);
1255 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1263 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1271 return (__m512i)__builtin_convertvector((__v32qu)__A, __v32hi);
1277 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1285 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1291 #define _mm512_shufflehi_epi16(A, imm) \ 1292 (__m512i)__builtin_ia32_pshufhw512((__v32hi)(__m512i)(A), (int)(imm)) 1294 #define _mm512_mask_shufflehi_epi16(W, U, A, imm) \ 1295 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1296 (__v32hi)_mm512_shufflehi_epi16((A), \ 1298 (__v32hi)(__m512i)(W)) 1300 #define _mm512_maskz_shufflehi_epi16(U, A, imm) \ 1301 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1302 (__v32hi)_mm512_shufflehi_epi16((A), \ 1304 (__v32hi)_mm512_setzero_si512()) 1306 #define _mm512_shufflelo_epi16(A, imm) \ 1307 (__m512i)__builtin_ia32_pshuflw512((__v32hi)(__m512i)(A), (int)(imm)) 1310 #define _mm512_mask_shufflelo_epi16(W, U, A, imm) \ 1311 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1312 (__v32hi)_mm512_shufflelo_epi16((A), \ 1314 (__v32hi)(__m512i)(W)) 1317 #define _mm512_maskz_shufflelo_epi16(U, A, imm) \ 1318 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1319 (__v32hi)_mm512_shufflelo_epi16((A), \ 1321 (__v32hi)_mm512_setzero_si512()) 1326 return (__m512i)__builtin_ia32_psllv32hi((__v32hi) __A, (__v32hi) __B);
1332 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1340 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1348 return (__m512i)__builtin_ia32_psllw512((__v32hi) __A, (__v8hi) __B);
1354 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1362 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1370 return (__m512i)__builtin_ia32_psllwi512((__v32hi)__A, __B);
1376 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1384 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1389 #define _mm512_bslli_epi128(a, imm) \ 1390 (__m512i)__builtin_ia32_pslldqi512_byteshift((__v8di)(__m512i)(a), (int)(imm)) 1395 return (__m512i)__builtin_ia32_psrlv32hi((__v32hi)__A, (__v32hi)__B);
1401 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1409 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1417 return (__m512i)__builtin_ia32_psrav32hi((__v32hi)__A, (__v32hi)__B);
1423 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1431 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1439 return (__m512i)__builtin_ia32_psraw512((__v32hi) __A, (__v8hi) __B);
1445 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1453 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1461 return (__m512i)__builtin_ia32_psrawi512((__v32hi)__A, __B);
1467 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1475 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1483 return (__m512i)__builtin_ia32_psrlw512((__v32hi) __A, (__v8hi) __B);
1489 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1497 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1505 return (__m512i)__builtin_ia32_psrlwi512((__v32hi)__A, __B);
1511 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1519 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1524 #define _mm512_bsrli_epi128(a, imm) \ 1525 (__m512i)__builtin_ia32_psrldqi512_byteshift((__v8di)(__m512i)(a), (int)(imm)) 1530 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
1538 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
1546 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
1554 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
1562 return (__m512i) __builtin_ia32_selectb_512(__M,
1570 return (__m512i) __builtin_ia32_selectb_512(__M,
1592 return (__m512i) __builtin_ia32_loaddquhi512_mask ((__v32hi *) __P,
1600 return (__m512i) __builtin_ia32_loaddquhi512_mask ((__v32hi *) __P,
1609 return (__m512i) __builtin_ia32_loaddquqi512_mask ((__v64qi *) __P,
1617 return (__m512i) __builtin_ia32_loaddquqi512_mask ((__v64qi *) __P,
1625 __builtin_ia32_storedquhi512_mask ((__v32hi *) __P,
1633 __builtin_ia32_storedquqi512_mask ((__v64qi *) __P,
1696 return (
__mmask64) __builtin_ia32_cvtb2mask512 ((__v64qi) __A);
1702 return (
__mmask32) __builtin_ia32_cvtw2mask512 ((__v32hi) __A);
1708 return (__m512i) __builtin_ia32_cvtmask2b512 (__A);
1714 return (__m512i) __builtin_ia32_cvtmask2w512 (__A);
1720 return (__m512i)__builtin_shufflevector((__v16qi) __A, (__v16qi) __A,
1721 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1722 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1723 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1724 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
1730 return (__m512i)__builtin_ia32_selectb_512(__M,
1738 return (__m512i)__builtin_ia32_selectb_512(__M,
1746 return (__m512i) __builtin_ia32_selectw_512(__M,
1754 return (__m512i) __builtin_ia32_selectw_512(__M,
1762 return (__m512i)__builtin_shufflevector((__v8hi) __A, (__v8hi) __A,
1763 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
1764 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
1770 return (__m512i)__builtin_ia32_selectw_512(__M,
1778 return (__m512i)__builtin_ia32_selectw_512(__M,
1786 return (__m512i)__builtin_ia32_permvarhi512((__v32hi)__B, (__v32hi)__A);
1793 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
1802 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
1807 #define _mm512_alignr_epi8(A, B, N) \ 1808 (__m512i)__builtin_ia32_palignr512((__v64qi)(__m512i)(A), \ 1809 (__v64qi)(__m512i)(B), (int)(N)) 1811 #define _mm512_mask_alignr_epi8(W, U, A, B, N) \ 1812 (__m512i)__builtin_ia32_selectb_512((__mmask64)(U), \ 1813 (__v64qi)_mm512_alignr_epi8((A), (B), (int)(N)), \ 1814 (__v64qi)(__m512i)(W)) 1816 #define _mm512_maskz_alignr_epi8(U, A, B, N) \ 1817 (__m512i)__builtin_ia32_selectb_512((__mmask64)(U), \ 1818 (__v64qi)_mm512_alignr_epi8((A), (B), (int)(N)), \ 1819 (__v64qi)(__m512i)_mm512_setzero_si512()) 1821 #define _mm512_dbsad_epu8(A, B, imm) \ 1822 (__m512i)__builtin_ia32_dbpsadbw512((__v64qi)(__m512i)(A), \ 1823 (__v64qi)(__m512i)(B), (int)(imm)) 1825 #define _mm512_mask_dbsad_epu8(W, U, A, B, imm) \ 1826 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1827 (__v32hi)_mm512_dbsad_epu8((A), (B), (imm)), \ 1828 (__v32hi)(__m512i)(W)) 1830 #define _mm512_maskz_dbsad_epu8(U, A, B, imm) \ 1831 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \ 1832 (__v32hi)_mm512_dbsad_epu8((A), (B), (imm)), \ 1833 (__v32hi)_mm512_setzero_si512()) 1838 return (__m512i) __builtin_ia32_psadbw512 ((__v64qi) __A,
1844 #undef __DEFAULT_FN_ATTRS #define _mm512_cmpeq_epi16_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpacklo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srli_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi8(__mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_loadu_epi16(__m512i __W, __mmask32 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sll_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_movepi16_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srli_epi16(__m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epi16(__m512i __A, __m512i __B)
#define _mm512_mask_cmpneq_epi8_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srl_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
#define _mm512_mask_cmpneq_epi16_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_shuffle_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_movm_epi8(__mmask64 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sub_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mullo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packs_epi32(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_madd_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS512 _mm512_and_epi32(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_slli_epi16(__m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_movm_epi16(__mmask32 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srav_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_loadu_epi8(__m512i __W, __mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_cvtepu8_epi16(__m256i __A)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtsepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srai_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpackhi_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_add_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_broadcastb_epi8(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packus_epi32(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_movepi8_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epi8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtusepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhi_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm256_undefined_si256(void)
Create a 256-bit integer vector with undefined values.
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_cvtepi8_epi16(__m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srlv_epi16(__m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS512 _mm512_setzero_si512(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_avg_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtsepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_maddubs_epi16(__m512i __W, __mmask32 __U, __m512i __X, __m512i __Y)
#define _mm512_cmpneq_epi16_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sllv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_broadcastw_epi16(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_avg_epu16(__m512i __A, __m512i __B)
#define _mm512_cmpeq_epi8_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epu16(__m512i __A, __m512i __B)
char __v64qi __attribute__((__vector_size__(64)))
Zeroes the upper 128 bits (bits 255:128) of all YMM registers.
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
#define __DEFAULT_FN_ATTRS
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_loadu_epi16(__mmask32 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_abs_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srai_epi16(__m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
unsigned long long __mmask64
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
#define _mm512_cmpneq_epi8_mask(A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epu16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maddubs_epi16(__m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sra_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sad_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packus_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_kunpackw(__mmask32 __A, __mmask32 __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_testn_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_kunpackd(__mmask64 __A, __mmask64 __B)
static __inline __m512i __DEFAULT_FN_ATTRS512 _mm512_set1_epi8(char __w)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi16(__mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sub_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_maddubs_epi16(__mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_test_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtusepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_test_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_testn_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_loadu_epi8(__mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_slli_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_permutexvar_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srai_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpackhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epu16(__m512i __A, __m512i __B)
static __inline __m256i __DEFAULT_FN_ATTRS _mm256_setzero_si256(void)
Constructs a 256-bit integer vector initialized to zero.
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_add_epi8(__m512i __A, __m512i __B)
#define _mm512_mask_cmpeq_epi8_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpacklo_epi8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS512 _mm512_set1_epi16(short __w)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
#define _mm512_mask_cmpeq_epi16_mask(k, A, B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_slli_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_abs_epi16(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srli_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhrs_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A)