25 #error "Never use <avx512bwintrin.h> directly; include <immintrin.h> instead."
28 #ifndef __AVX512BWINTRIN_H
29 #define __AVX512BWINTRIN_H
35 #define __DEFAULT_FN_ATTRS __attribute__((__always_inline__, __nodebug__, __target__("avx512bw")))
39 return (__m512i)(__v64qi){ 0, 0, 0, 0, 0, 0, 0, 0,
40 0, 0, 0, 0, 0, 0, 0, 0,
41 0, 0, 0, 0, 0, 0, 0, 0,
42 0, 0, 0, 0, 0, 0, 0, 0,
43 0, 0, 0, 0, 0, 0, 0, 0,
44 0, 0, 0, 0, 0, 0, 0, 0,
45 0, 0, 0, 0, 0, 0, 0, 0,
46 0, 0, 0, 0, 0, 0, 0, 0 };
51 return (__m512i)(__v32hi){ 0, 0, 0, 0, 0, 0, 0, 0,
52 0, 0, 0, 0, 0, 0, 0, 0,
53 0, 0, 0, 0, 0, 0, 0, 0,
54 0, 0, 0, 0, 0, 0, 0, 0 };
61 return (
__mmask64)__builtin_ia32_pcmpeqb512_mask((__v64qi)__a, (__v64qi)__b,
67 return (
__mmask64)__builtin_ia32_pcmpeqb512_mask((__v64qi)__a, (__v64qi)__b,
73 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 0,
79 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 0,
85 return (
__mmask32)__builtin_ia32_pcmpeqw512_mask((__v32hi)__a, (__v32hi)__b,
91 return (
__mmask32)__builtin_ia32_pcmpeqw512_mask((__v32hi)__a, (__v32hi)__b,
97 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 0,
103 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 0,
109 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 5,
115 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 5,
121 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 5,
127 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 5,
133 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 5,
139 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 5,
145 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 5,
151 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 5,
157 return (
__mmask64)__builtin_ia32_pcmpgtb512_mask((__v64qi)__a, (__v64qi)__b,
163 return (
__mmask64)__builtin_ia32_pcmpgtb512_mask((__v64qi)__a, (__v64qi)__b,
169 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 6,
175 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 6,
181 return (
__mmask32)__builtin_ia32_pcmpgtw512_mask((__v32hi)__a, (__v32hi)__b,
187 return (
__mmask32)__builtin_ia32_pcmpgtw512_mask((__v32hi)__a, (__v32hi)__b,
193 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 6,
199 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 6,
205 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 2,
211 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 2,
217 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 2,
223 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 2,
229 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 2,
235 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 2,
241 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 2,
247 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 2,
253 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 1,
259 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 1,
265 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 1,
271 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 1,
277 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 1,
283 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 1,
289 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 1,
295 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 1,
301 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 4,
307 return (
__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)__a, (__v64qi)__b, 4,
313 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 4,
319 return (
__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)__a, (__v64qi)__b, 4,
325 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 4,
331 return (
__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)__a, (__v32hi)__b, 4,
337 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 4,
343 return (
__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)__a, (__v32hi)__b, 4,
349 return (__m512i) ((__v64qu) __A + (__v64qu) __B);
354 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
361 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
368 return (__m512i) ((__v64qu) __A - (__v64qu) __B);
373 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
380 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
387 return (__m512i) ((__v32hu) __A + (__v32hu) __B);
392 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
399 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
406 return (__m512i) ((__v32hu) __A - (__v32hu) __B);
411 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
418 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
425 return (__m512i) ((__v32hu) __A * (__v32hu) __B);
430 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
437 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
445 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
453 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
461 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
469 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
477 return (__m512i) __builtin_ia32_pabsb512_mask ((__v64qi) __A,
485 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
493 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
501 return (__m512i) __builtin_ia32_pabsw512_mask ((__v32hi) __A,
509 return (__m512i)__builtin_ia32_packssdw512((__v16si)__A, (__v16si)__B);
515 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
523 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
531 return (__m512i)__builtin_ia32_packsswb512((__v32hi)__A, (__v32hi) __B);
537 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
545 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
553 return (__m512i)__builtin_ia32_packusdw512((__v16si) __A, (__v16si) __B);
559 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
567 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__M,
575 return (__m512i)__builtin_ia32_packuswb512((__v32hi) __A, (__v32hi) __B);
581 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
589 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__M,
597 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
607 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
616 return (__m512i) __builtin_ia32_paddsb512_mask ((__v64qi) __A,
625 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
635 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
644 return (__m512i) __builtin_ia32_paddsw512_mask ((__v32hi) __A,
653 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
663 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
672 return (__m512i) __builtin_ia32_paddusb512_mask ((__v64qi) __A,
681 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
691 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
700 return (__m512i) __builtin_ia32_paddusw512_mask ((__v32hi) __A,
709 return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
719 return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
728 return (__m512i) __builtin_ia32_pavgb512_mask ((__v64qi) __A,
737 return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
747 return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
756 return (__m512i) __builtin_ia32_pavgw512_mask ((__v32hi) __A,
765 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
774 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
784 return (__m512i) __builtin_ia32_pmaxsb512_mask ((__v64qi) __A,
793 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
802 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
812 return (__m512i) __builtin_ia32_pmaxsw512_mask ((__v32hi) __A,
821 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
830 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
840 return (__m512i) __builtin_ia32_pmaxub512_mask ((__v64qi) __A,
849 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
858 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
868 return (__m512i) __builtin_ia32_pmaxuw512_mask ((__v32hi) __A,
877 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
886 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
896 return (__m512i) __builtin_ia32_pminsb512_mask ((__v64qi) __A,
905 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
914 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
924 return (__m512i) __builtin_ia32_pminsw512_mask ((__v32hi) __A,
933 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
942 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
952 return (__m512i) __builtin_ia32_pminub512_mask ((__v64qi) __A,
961 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
970 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
980 return (__m512i) __builtin_ia32_pminuw512_mask ((__v32hi) __A,
989 return (__m512i)__builtin_ia32_pshufb512((__v64qi)__A,(__v64qi)__B);
995 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1003 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1011 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
1021 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
1030 return (__m512i) __builtin_ia32_psubsb512_mask ((__v64qi) __A,
1039 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
1049 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
1058 return (__m512i) __builtin_ia32_psubsw512_mask ((__v32hi) __A,
1067 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
1077 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
1086 return (__m512i) __builtin_ia32_psubusb512_mask ((__v64qi) __A,
1095 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
1105 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
1114 return (__m512i) __builtin_ia32_psubusw512_mask ((__v32hi) __A,
1124 return (__m512i) __builtin_ia32_vpermi2varhi512_mask ((__v32hi) __A,
1133 return (__m512i) __builtin_ia32_vpermt2varhi512_mask ((__v32hi) __I ,
1141 __m512i __I, __m512i __B)
1143 return (__m512i) __builtin_ia32_vpermt2varhi512_mask ((__v32hi) __I ,
1151 __m512i __I, __m512i __B)
1153 return (__m512i) __builtin_ia32_vpermt2varhi512_maskz ((__v32hi) __I
1163 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1173 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1182 return (__m512i) __builtin_ia32_pmulhrsw512_mask ((__v32hi) __A,
1191 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1201 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1210 return (__m512i) __builtin_ia32_pmulhw512_mask ((__v32hi) __A,
1219 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1229 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1238 return (__m512i) __builtin_ia32_pmulhuw512_mask ((__v32hi) __A,
1246 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1255 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1263 return (__m512i) __builtin_ia32_pmaddubsw512_mask ((__v64qi) __X,
1271 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1280 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1288 return (__m512i) __builtin_ia32_pmaddwd512_mask ((__v32hi) __A,
1296 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1303 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1310 return (__m256i) __builtin_ia32_pmovswb512_mask ((__v32hi) __A,
1317 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1324 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1331 return (__m256i) __builtin_ia32_pmovuswb512_mask ((__v32hi) __A,
1338 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1345 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1352 return (__m256i) __builtin_ia32_pmovwb512_mask ((__v32hi) __A,
1360 __builtin_ia32_pmovwb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1366 __builtin_ia32_pmovswb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1372 __builtin_ia32_pmovuswb512mem_mask ((__v32qi *) __P, (__v32hi) __A, __M);
1377 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1379 10, 64+10, 11, 64+11,
1380 12, 64+12, 13, 64+13,
1381 14, 64+14, 15, 64+15,
1382 24, 64+24, 25, 64+25,
1383 26, 64+26, 27, 64+27,
1384 28, 64+28, 29, 64+29,
1385 30, 64+30, 31, 64+31,
1386 40, 64+40, 41, 64+41,
1387 42, 64+42, 43, 64+43,
1388 44, 64+44, 45, 64+45,
1389 46, 64+46, 47, 64+47,
1390 56, 64+56, 57, 64+57,
1391 58, 64+58, 59, 64+59,
1392 60, 64+60, 61, 64+61,
1393 62, 64+62, 63, 64+63);
1398 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1405 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1412 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1415 12, 32+12, 13, 32+13,
1416 14, 32+14, 15, 32+15,
1417 20, 32+20, 21, 32+21,
1418 22, 32+22, 23, 32+23,
1419 28, 32+28, 29, 32+29,
1420 30, 32+30, 31, 32+31);
1425 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1432 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1439 return (__m512i)__builtin_shufflevector((__v64qi)__A, (__v64qi)__B,
1444 16, 64+16, 17, 64+17,
1445 18, 64+18, 19, 64+19,
1446 20, 64+20, 21, 64+21,
1447 22, 64+22, 23, 64+23,
1448 32, 64+32, 33, 64+33,
1449 34, 64+34, 35, 64+35,
1450 36, 64+36, 37, 64+37,
1451 38, 64+38, 39, 64+39,
1452 48, 64+48, 49, 64+49,
1453 50, 64+50, 51, 64+51,
1454 52, 64+52, 53, 64+53,
1455 54, 64+54, 55, 64+55);
1460 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1467 return (__m512i)__builtin_ia32_selectb_512((
__mmask64)__U,
1474 return (__m512i)__builtin_shufflevector((__v32hi)__A, (__v32hi)__B,
1478 10, 32+10, 11, 32+11,
1479 16, 32+16, 17, 32+17,
1480 18, 32+18, 19, 32+19,
1481 24, 32+24, 25, 32+25,
1482 26, 32+26, 27, 32+27);
1487 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1494 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1504 return (__m512i)__builtin_convertvector((__v32qs)__A, __v32hi);
1510 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1518 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1526 return (__m512i)__builtin_convertvector((__v32qu)__A, __v32hi);
1532 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1540 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1546 #define _mm512_cmp_epi8_mask(a, b, p) __extension__ ({ \
1547 (__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
1548 (__v64qi)(__m512i)(b), (int)(p), \
1551 #define _mm512_mask_cmp_epi8_mask(m, a, b, p) __extension__ ({ \
1552 (__mmask64)__builtin_ia32_cmpb512_mask((__v64qi)(__m512i)(a), \
1553 (__v64qi)(__m512i)(b), (int)(p), \
1556 #define _mm512_cmp_epu8_mask(a, b, p) __extension__ ({ \
1557 (__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \
1558 (__v64qi)(__m512i)(b), (int)(p), \
1561 #define _mm512_mask_cmp_epu8_mask(m, a, b, p) __extension__ ({ \
1562 (__mmask64)__builtin_ia32_ucmpb512_mask((__v64qi)(__m512i)(a), \
1563 (__v64qi)(__m512i)(b), (int)(p), \
1566 #define _mm512_cmp_epi16_mask(a, b, p) __extension__ ({ \
1567 (__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \
1568 (__v32hi)(__m512i)(b), (int)(p), \
1571 #define _mm512_mask_cmp_epi16_mask(m, a, b, p) __extension__ ({ \
1572 (__mmask32)__builtin_ia32_cmpw512_mask((__v32hi)(__m512i)(a), \
1573 (__v32hi)(__m512i)(b), (int)(p), \
1576 #define _mm512_cmp_epu16_mask(a, b, p) __extension__ ({ \
1577 (__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \
1578 (__v32hi)(__m512i)(b), (int)(p), \
1581 #define _mm512_mask_cmp_epu16_mask(m, a, b, p) __extension__ ({ \
1582 (__mmask32)__builtin_ia32_ucmpw512_mask((__v32hi)(__m512i)(a), \
1583 (__v32hi)(__m512i)(b), (int)(p), \
1586 #define _mm512_shufflehi_epi16(A, imm) __extension__ ({ \
1587 (__m512i)__builtin_shufflevector((__v32hi)(__m512i)(A), \
1588 (__v32hi)_mm512_undefined_epi32(), \
1590 4 + (((imm) >> 0) & 0x3), \
1591 4 + (((imm) >> 2) & 0x3), \
1592 4 + (((imm) >> 4) & 0x3), \
1593 4 + (((imm) >> 6) & 0x3), \
1595 12 + (((imm) >> 0) & 0x3), \
1596 12 + (((imm) >> 2) & 0x3), \
1597 12 + (((imm) >> 4) & 0x3), \
1598 12 + (((imm) >> 6) & 0x3), \
1600 20 + (((imm) >> 0) & 0x3), \
1601 20 + (((imm) >> 2) & 0x3), \
1602 20 + (((imm) >> 4) & 0x3), \
1603 20 + (((imm) >> 6) & 0x3), \
1605 28 + (((imm) >> 0) & 0x3), \
1606 28 + (((imm) >> 2) & 0x3), \
1607 28 + (((imm) >> 4) & 0x3), \
1608 28 + (((imm) >> 6) & 0x3)); })
1610 #define _mm512_mask_shufflehi_epi16(W, U, A, imm) __extension__ ({ \
1611 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1612 (__v32hi)_mm512_shufflehi_epi16((A), \
1614 (__v32hi)(__m512i)(W)); })
1616 #define _mm512_maskz_shufflehi_epi16(U, A, imm) __extension__ ({ \
1617 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1618 (__v32hi)_mm512_shufflehi_epi16((A), \
1620 (__v32hi)_mm512_setzero_hi()); })
1622 #define _mm512_shufflelo_epi16(A, imm) __extension__ ({ \
1623 (__m512i)__builtin_shufflevector((__v32hi)(__m512i)(A), \
1624 (__v32hi)_mm512_undefined_epi32(), \
1625 0 + (((imm) >> 0) & 0x3), \
1626 0 + (((imm) >> 2) & 0x3), \
1627 0 + (((imm) >> 4) & 0x3), \
1628 0 + (((imm) >> 6) & 0x3), \
1630 8 + (((imm) >> 0) & 0x3), \
1631 8 + (((imm) >> 2) & 0x3), \
1632 8 + (((imm) >> 4) & 0x3), \
1633 8 + (((imm) >> 6) & 0x3), \
1635 16 + (((imm) >> 0) & 0x3), \
1636 16 + (((imm) >> 2) & 0x3), \
1637 16 + (((imm) >> 4) & 0x3), \
1638 16 + (((imm) >> 6) & 0x3), \
1640 24 + (((imm) >> 0) & 0x3), \
1641 24 + (((imm) >> 2) & 0x3), \
1642 24 + (((imm) >> 4) & 0x3), \
1643 24 + (((imm) >> 6) & 0x3), \
1647 #define _mm512_mask_shufflelo_epi16(W, U, A, imm) __extension__ ({ \
1648 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1649 (__v32hi)_mm512_shufflelo_epi16((A), \
1651 (__v32hi)(__m512i)(W)); })
1654 #define _mm512_maskz_shufflelo_epi16(U, A, imm) __extension__ ({ \
1655 (__m512i)__builtin_ia32_selectw_512((__mmask32)(U), \
1656 (__v32hi)_mm512_shufflelo_epi16((A), \
1658 (__v32hi)_mm512_setzero_hi()); })
1663 return (__m512i)__builtin_ia32_psllv32hi((__v32hi) __A, (__v32hi) __B);
1669 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1677 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1685 return (__m512i)__builtin_ia32_psllw512((__v32hi) __A, (__v8hi) __B);
1691 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1699 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1707 return (__m512i)__builtin_ia32_psllwi512((__v32hi)__A, __B);
1713 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1721 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1726 #define _mm512_bslli_epi128(a, imm) __extension__ ({ \
1727 (__m512i)__builtin_shufflevector( \
1728 (__v64qi)_mm512_setzero_si512(), \
1729 (__v64qi)(__m512i)(a), \
1730 ((char)(imm)&0xF0) ? 0 : ((char)(imm)>0x0 ? 16 : 64) - (char)(imm), \
1731 ((char)(imm)&0xF0) ? 1 : ((char)(imm)>0x1 ? 17 : 65) - (char)(imm), \
1732 ((char)(imm)&0xF0) ? 2 : ((char)(imm)>0x2 ? 18 : 66) - (char)(imm), \
1733 ((char)(imm)&0xF0) ? 3 : ((char)(imm)>0x3 ? 19 : 67) - (char)(imm), \
1734 ((char)(imm)&0xF0) ? 4 : ((char)(imm)>0x4 ? 20 : 68) - (char)(imm), \
1735 ((char)(imm)&0xF0) ? 5 : ((char)(imm)>0x5 ? 21 : 69) - (char)(imm), \
1736 ((char)(imm)&0xF0) ? 6 : ((char)(imm)>0x6 ? 22 : 70) - (char)(imm), \
1737 ((char)(imm)&0xF0) ? 7 : ((char)(imm)>0x7 ? 23 : 71) - (char)(imm), \
1738 ((char)(imm)&0xF0) ? 8 : ((char)(imm)>0x8 ? 24 : 72) - (char)(imm), \
1739 ((char)(imm)&0xF0) ? 9 : ((char)(imm)>0x9 ? 25 : 73) - (char)(imm), \
1740 ((char)(imm)&0xF0) ? 10 : ((char)(imm)>0xA ? 26 : 74) - (char)(imm), \
1741 ((char)(imm)&0xF0) ? 11 : ((char)(imm)>0xB ? 27 : 75) - (char)(imm), \
1742 ((char)(imm)&0xF0) ? 12 : ((char)(imm)>0xC ? 28 : 76) - (char)(imm), \
1743 ((char)(imm)&0xF0) ? 13 : ((char)(imm)>0xD ? 29 : 77) - (char)(imm), \
1744 ((char)(imm)&0xF0) ? 14 : ((char)(imm)>0xE ? 30 : 78) - (char)(imm), \
1745 ((char)(imm)&0xF0) ? 15 : ((char)(imm)>0xF ? 31 : 79) - (char)(imm), \
1746 ((char)(imm)&0xF0) ? 16 : ((char)(imm)>0x0 ? 32 : 80) - (char)(imm), \
1747 ((char)(imm)&0xF0) ? 17 : ((char)(imm)>0x1 ? 33 : 81) - (char)(imm), \
1748 ((char)(imm)&0xF0) ? 18 : ((char)(imm)>0x2 ? 34 : 82) - (char)(imm), \
1749 ((char)(imm)&0xF0) ? 19 : ((char)(imm)>0x3 ? 35 : 83) - (char)(imm), \
1750 ((char)(imm)&0xF0) ? 20 : ((char)(imm)>0x4 ? 36 : 84) - (char)(imm), \
1751 ((char)(imm)&0xF0) ? 21 : ((char)(imm)>0x5 ? 37 : 85) - (char)(imm), \
1752 ((char)(imm)&0xF0) ? 22 : ((char)(imm)>0x6 ? 38 : 86) - (char)(imm), \
1753 ((char)(imm)&0xF0) ? 23 : ((char)(imm)>0x7 ? 39 : 87) - (char)(imm), \
1754 ((char)(imm)&0xF0) ? 24 : ((char)(imm)>0x8 ? 40 : 88) - (char)(imm), \
1755 ((char)(imm)&0xF0) ? 25 : ((char)(imm)>0x9 ? 41 : 89) - (char)(imm), \
1756 ((char)(imm)&0xF0) ? 26 : ((char)(imm)>0xA ? 42 : 90) - (char)(imm), \
1757 ((char)(imm)&0xF0) ? 27 : ((char)(imm)>0xB ? 43 : 91) - (char)(imm), \
1758 ((char)(imm)&0xF0) ? 28 : ((char)(imm)>0xC ? 44 : 92) - (char)(imm), \
1759 ((char)(imm)&0xF0) ? 29 : ((char)(imm)>0xD ? 45 : 93) - (char)(imm), \
1760 ((char)(imm)&0xF0) ? 30 : ((char)(imm)>0xE ? 46 : 94) - (char)(imm), \
1761 ((char)(imm)&0xF0) ? 31 : ((char)(imm)>0xF ? 47 : 95) - (char)(imm), \
1762 ((char)(imm)&0xF0) ? 32 : ((char)(imm)>0x0 ? 48 : 96) - (char)(imm), \
1763 ((char)(imm)&0xF0) ? 33 : ((char)(imm)>0x1 ? 49 : 97) - (char)(imm), \
1764 ((char)(imm)&0xF0) ? 34 : ((char)(imm)>0x2 ? 50 : 98) - (char)(imm), \
1765 ((char)(imm)&0xF0) ? 35 : ((char)(imm)>0x3 ? 51 : 99) - (char)(imm), \
1766 ((char)(imm)&0xF0) ? 36 : ((char)(imm)>0x4 ? 52 : 100) - (char)(imm), \
1767 ((char)(imm)&0xF0) ? 37 : ((char)(imm)>0x5 ? 53 : 101) - (char)(imm), \
1768 ((char)(imm)&0xF0) ? 38 : ((char)(imm)>0x6 ? 54 : 102) - (char)(imm), \
1769 ((char)(imm)&0xF0) ? 39 : ((char)(imm)>0x7 ? 55 : 103) - (char)(imm), \
1770 ((char)(imm)&0xF0) ? 40 : ((char)(imm)>0x8 ? 56 : 104) - (char)(imm), \
1771 ((char)(imm)&0xF0) ? 41 : ((char)(imm)>0x9 ? 57 : 105) - (char)(imm), \
1772 ((char)(imm)&0xF0) ? 42 : ((char)(imm)>0xA ? 58 : 106) - (char)(imm), \
1773 ((char)(imm)&0xF0) ? 43 : ((char)(imm)>0xB ? 59 : 107) - (char)(imm), \
1774 ((char)(imm)&0xF0) ? 44 : ((char)(imm)>0xC ? 60 : 108) - (char)(imm), \
1775 ((char)(imm)&0xF0) ? 45 : ((char)(imm)>0xD ? 61 : 109) - (char)(imm), \
1776 ((char)(imm)&0xF0) ? 46 : ((char)(imm)>0xE ? 62 : 110) - (char)(imm), \
1777 ((char)(imm)&0xF0) ? 47 : ((char)(imm)>0xF ? 63 : 111) - (char)(imm), \
1778 ((char)(imm)&0xF0) ? 48 : ((char)(imm)>0x0 ? 64 : 112) - (char)(imm), \
1779 ((char)(imm)&0xF0) ? 49 : ((char)(imm)>0x1 ? 65 : 113) - (char)(imm), \
1780 ((char)(imm)&0xF0) ? 50 : ((char)(imm)>0x2 ? 66 : 114) - (char)(imm), \
1781 ((char)(imm)&0xF0) ? 51 : ((char)(imm)>0x3 ? 67 : 115) - (char)(imm), \
1782 ((char)(imm)&0xF0) ? 52 : ((char)(imm)>0x4 ? 68 : 116) - (char)(imm), \
1783 ((char)(imm)&0xF0) ? 53 : ((char)(imm)>0x5 ? 69 : 117) - (char)(imm), \
1784 ((char)(imm)&0xF0) ? 54 : ((char)(imm)>0x6 ? 70 : 118) - (char)(imm), \
1785 ((char)(imm)&0xF0) ? 55 : ((char)(imm)>0x7 ? 71 : 119) - (char)(imm), \
1786 ((char)(imm)&0xF0) ? 56 : ((char)(imm)>0x8 ? 72 : 120) - (char)(imm), \
1787 ((char)(imm)&0xF0) ? 57 : ((char)(imm)>0x9 ? 73 : 121) - (char)(imm), \
1788 ((char)(imm)&0xF0) ? 58 : ((char)(imm)>0xA ? 74 : 122) - (char)(imm), \
1789 ((char)(imm)&0xF0) ? 59 : ((char)(imm)>0xB ? 75 : 123) - (char)(imm), \
1790 ((char)(imm)&0xF0) ? 60 : ((char)(imm)>0xC ? 76 : 124) - (char)(imm), \
1791 ((char)(imm)&0xF0) ? 61 : ((char)(imm)>0xD ? 77 : 125) - (char)(imm), \
1792 ((char)(imm)&0xF0) ? 62 : ((char)(imm)>0xE ? 78 : 126) - (char)(imm), \
1793 ((char)(imm)&0xF0) ? 63 : ((char)(imm)>0xF ? 79 : 127) - (char)(imm)); })
1798 return (__m512i)__builtin_ia32_psrlv32hi((__v32hi)__A, (__v32hi)__B);
1804 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1812 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1820 return (__m512i)__builtin_ia32_psrav32hi((__v32hi)__A, (__v32hi)__B);
1826 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1834 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1842 return (__m512i)__builtin_ia32_psraw512((__v32hi) __A, (__v8hi) __B);
1848 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1856 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1864 return (__m512i)__builtin_ia32_psrawi512((__v32hi)__A, __B);
1870 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1878 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1886 return (__m512i)__builtin_ia32_psrlw512((__v32hi) __A, (__v8hi) __B);
1892 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1900 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1908 return (__m512i)__builtin_ia32_psrlwi512((__v32hi)__A, __B);
1914 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1922 return (__m512i)__builtin_ia32_selectw_512((
__mmask32)__U,
1927 #define _mm512_bsrli_epi128(a, imm) __extension__ ({ \
1928 (__m512i)__builtin_shufflevector( \
1929 (__v64qi)(__m512i)(a), \
1930 (__v64qi)_mm512_setzero_si512(), \
1931 ((char)(imm)&0xF0) ? 64 : (char)(imm) + ((char)(imm)>0xF ? 48 : 0), \
1932 ((char)(imm)&0xF0) ? 65 : (char)(imm) + ((char)(imm)>0xE ? 49 : 1), \
1933 ((char)(imm)&0xF0) ? 66 : (char)(imm) + ((char)(imm)>0xD ? 50 : 2), \
1934 ((char)(imm)&0xF0) ? 67 : (char)(imm) + ((char)(imm)>0xC ? 51 : 3), \
1935 ((char)(imm)&0xF0) ? 68 : (char)(imm) + ((char)(imm)>0xB ? 52 : 4), \
1936 ((char)(imm)&0xF0) ? 69 : (char)(imm) + ((char)(imm)>0xA ? 53 : 5), \
1937 ((char)(imm)&0xF0) ? 70 : (char)(imm) + ((char)(imm)>0x9 ? 54 : 6), \
1938 ((char)(imm)&0xF0) ? 71 : (char)(imm) + ((char)(imm)>0x8 ? 55 : 7), \
1939 ((char)(imm)&0xF0) ? 72 : (char)(imm) + ((char)(imm)>0x7 ? 56 : 8), \
1940 ((char)(imm)&0xF0) ? 73 : (char)(imm) + ((char)(imm)>0x6 ? 57 : 9), \
1941 ((char)(imm)&0xF0) ? 74 : (char)(imm) + ((char)(imm)>0x5 ? 58 : 10), \
1942 ((char)(imm)&0xF0) ? 75 : (char)(imm) + ((char)(imm)>0x4 ? 59 : 11), \
1943 ((char)(imm)&0xF0) ? 76 : (char)(imm) + ((char)(imm)>0x3 ? 60 : 12), \
1944 ((char)(imm)&0xF0) ? 77 : (char)(imm) + ((char)(imm)>0x2 ? 61 : 13), \
1945 ((char)(imm)&0xF0) ? 78 : (char)(imm) + ((char)(imm)>0x1 ? 62 : 14), \
1946 ((char)(imm)&0xF0) ? 79 : (char)(imm) + ((char)(imm)>0x0 ? 63 : 15), \
1947 ((char)(imm)&0xF0) ? 80 : (char)(imm) + ((char)(imm)>0xF ? 64 : 16), \
1948 ((char)(imm)&0xF0) ? 81 : (char)(imm) + ((char)(imm)>0xE ? 65 : 17), \
1949 ((char)(imm)&0xF0) ? 82 : (char)(imm) + ((char)(imm)>0xD ? 66 : 18), \
1950 ((char)(imm)&0xF0) ? 83 : (char)(imm) + ((char)(imm)>0xC ? 67 : 19), \
1951 ((char)(imm)&0xF0) ? 84 : (char)(imm) + ((char)(imm)>0xB ? 68 : 20), \
1952 ((char)(imm)&0xF0) ? 85 : (char)(imm) + ((char)(imm)>0xA ? 69 : 21), \
1953 ((char)(imm)&0xF0) ? 86 : (char)(imm) + ((char)(imm)>0x9 ? 70 : 22), \
1954 ((char)(imm)&0xF0) ? 87 : (char)(imm) + ((char)(imm)>0x8 ? 71 : 23), \
1955 ((char)(imm)&0xF0) ? 88 : (char)(imm) + ((char)(imm)>0x7 ? 72 : 24), \
1956 ((char)(imm)&0xF0) ? 89 : (char)(imm) + ((char)(imm)>0x6 ? 73 : 25), \
1957 ((char)(imm)&0xF0) ? 90 : (char)(imm) + ((char)(imm)>0x5 ? 74 : 26), \
1958 ((char)(imm)&0xF0) ? 91 : (char)(imm) + ((char)(imm)>0x4 ? 75 : 27), \
1959 ((char)(imm)&0xF0) ? 92 : (char)(imm) + ((char)(imm)>0x3 ? 76 : 28), \
1960 ((char)(imm)&0xF0) ? 93 : (char)(imm) + ((char)(imm)>0x2 ? 77 : 29), \
1961 ((char)(imm)&0xF0) ? 94 : (char)(imm) + ((char)(imm)>0x1 ? 78 : 30), \
1962 ((char)(imm)&0xF0) ? 95 : (char)(imm) + ((char)(imm)>0x0 ? 79 : 31), \
1963 ((char)(imm)&0xF0) ? 96 : (char)(imm) + ((char)(imm)>0xF ? 80 : 32), \
1964 ((char)(imm)&0xF0) ? 97 : (char)(imm) + ((char)(imm)>0xE ? 81 : 33), \
1965 ((char)(imm)&0xF0) ? 98 : (char)(imm) + ((char)(imm)>0xD ? 82 : 34), \
1966 ((char)(imm)&0xF0) ? 99 : (char)(imm) + ((char)(imm)>0xC ? 83 : 35), \
1967 ((char)(imm)&0xF0) ? 100 : (char)(imm) + ((char)(imm)>0xB ? 84 : 36), \
1968 ((char)(imm)&0xF0) ? 101 : (char)(imm) + ((char)(imm)>0xA ? 85 : 37), \
1969 ((char)(imm)&0xF0) ? 102 : (char)(imm) + ((char)(imm)>0x9 ? 86 : 38), \
1970 ((char)(imm)&0xF0) ? 103 : (char)(imm) + ((char)(imm)>0x8 ? 87 : 39), \
1971 ((char)(imm)&0xF0) ? 104 : (char)(imm) + ((char)(imm)>0x7 ? 88 : 40), \
1972 ((char)(imm)&0xF0) ? 105 : (char)(imm) + ((char)(imm)>0x6 ? 89 : 41), \
1973 ((char)(imm)&0xF0) ? 106 : (char)(imm) + ((char)(imm)>0x5 ? 90 : 42), \
1974 ((char)(imm)&0xF0) ? 107 : (char)(imm) + ((char)(imm)>0x4 ? 91 : 43), \
1975 ((char)(imm)&0xF0) ? 108 : (char)(imm) + ((char)(imm)>0x3 ? 92 : 44), \
1976 ((char)(imm)&0xF0) ? 109 : (char)(imm) + ((char)(imm)>0x2 ? 93 : 45), \
1977 ((char)(imm)&0xF0) ? 110 : (char)(imm) + ((char)(imm)>0x1 ? 94 : 46), \
1978 ((char)(imm)&0xF0) ? 111 : (char)(imm) + ((char)(imm)>0x0 ? 95 : 47), \
1979 ((char)(imm)&0xF0) ? 112 : (char)(imm) + ((char)(imm)>0xF ? 96 : 48), \
1980 ((char)(imm)&0xF0) ? 113 : (char)(imm) + ((char)(imm)>0xE ? 97 : 49), \
1981 ((char)(imm)&0xF0) ? 114 : (char)(imm) + ((char)(imm)>0xD ? 98 : 50), \
1982 ((char)(imm)&0xF0) ? 115 : (char)(imm) + ((char)(imm)>0xC ? 99 : 51), \
1983 ((char)(imm)&0xF0) ? 116 : (char)(imm) + ((char)(imm)>0xB ? 100 : 52), \
1984 ((char)(imm)&0xF0) ? 117 : (char)(imm) + ((char)(imm)>0xA ? 101 : 53), \
1985 ((char)(imm)&0xF0) ? 118 : (char)(imm) + ((char)(imm)>0x9 ? 102 : 54), \
1986 ((char)(imm)&0xF0) ? 119 : (char)(imm) + ((char)(imm)>0x8 ? 103 : 55), \
1987 ((char)(imm)&0xF0) ? 120 : (char)(imm) + ((char)(imm)>0x7 ? 104 : 56), \
1988 ((char)(imm)&0xF0) ? 121 : (char)(imm) + ((char)(imm)>0x6 ? 105 : 57), \
1989 ((char)(imm)&0xF0) ? 122 : (char)(imm) + ((char)(imm)>0x5 ? 106 : 58), \
1990 ((char)(imm)&0xF0) ? 123 : (char)(imm) + ((char)(imm)>0x4 ? 107 : 59), \
1991 ((char)(imm)&0xF0) ? 124 : (char)(imm) + ((char)(imm)>0x3 ? 108 : 60), \
1992 ((char)(imm)&0xF0) ? 125 : (char)(imm) + ((char)(imm)>0x2 ? 109 : 61), \
1993 ((char)(imm)&0xF0) ? 126 : (char)(imm) + ((char)(imm)>0x1 ? 110 : 62), \
1994 ((char)(imm)&0xF0) ? 127 : (char)(imm) + ((char)(imm)>0x0 ? 111 : 63)); })
1999 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
2007 return (__m512i) __builtin_ia32_selectw_512 ((
__mmask32) __U,
2015 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
2023 return (__m512i) __builtin_ia32_selectb_512 ((
__mmask64) __U,
2031 return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A,
2039 return (__m512i) __builtin_ia32_pbroadcastb512_gpr_mask (__A,
2062 return (__m512i) __builtin_ia32_loaddquhi512_mask ((__v32hi *) __P,
2070 return (__m512i) __builtin_ia32_loaddquhi512_mask ((__v32hi *) __P,
2079 return (__m512i) __builtin_ia32_loaddquqi512_mask ((__v64qi *) __P,
2087 return (__m512i) __builtin_ia32_loaddquqi512_mask ((__v64qi *) __P,
2095 __builtin_ia32_storedquhi512_mask ((__v32hi *) __P,
2103 __builtin_ia32_storedquqi512_mask ((__v64qi *) __P,
2111 return (
__mmask64) __builtin_ia32_ptestmb512 ((__v64qi) __A,
2119 return (
__mmask64) __builtin_ia32_ptestmb512 ((__v64qi) __A,
2120 (__v64qi) __B, __U);
2126 return (
__mmask32) __builtin_ia32_ptestmw512 ((__v32hi) __A,
2134 return (
__mmask32) __builtin_ia32_ptestmw512 ((__v32hi) __A,
2135 (__v32hi) __B, __U);
2141 return (
__mmask64) __builtin_ia32_ptestnmb512 ((__v64qi) __A,
2149 return (
__mmask64) __builtin_ia32_ptestnmb512 ((__v64qi) __A,
2150 (__v64qi) __B, __U);
2156 return (
__mmask32) __builtin_ia32_ptestnmw512 ((__v32hi) __A,
2164 return (
__mmask32) __builtin_ia32_ptestnmw512 ((__v32hi) __A,
2165 (__v32hi) __B, __U);
2171 return (
__mmask64) __builtin_ia32_cvtb2mask512 ((__v64qi) __A);
2177 return (
__mmask32) __builtin_ia32_cvtw2mask512 ((__v32hi) __A);
2183 return (__m512i) __builtin_ia32_cvtmask2b512 (__A);
2189 return (__m512i) __builtin_ia32_cvtmask2w512 (__A);
2195 return (__m512i)__builtin_shufflevector((__v16qi) __A,
2197 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2198 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2199 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2200 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
2206 return (__m512i)__builtin_ia32_selectb_512(__M,
2214 return (__m512i)__builtin_ia32_selectb_512(__M,
2222 return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A,
2230 return (__m512i) __builtin_ia32_pbroadcastw512_gpr_mask (__A,
2238 return (__m512i)__builtin_shufflevector((__v8hi) __A,
2240 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
2241 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0);
2247 return (__m512i)__builtin_ia32_selectw_512(__M,
2255 return (__m512i)__builtin_ia32_selectw_512(__M,
2263 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2273 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2283 return (__m512i) __builtin_ia32_permvarhi512_mask ((__v32hi) __B,
2289 #define _mm512_alignr_epi8(A, B, N) __extension__ ({\
2290 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \
2291 (__v64qi)(__m512i)(B), (int)(N), \
2292 (__v64qi)_mm512_undefined_pd(), \
2295 #define _mm512_mask_alignr_epi8(W, U, A, B, N) __extension__({\
2296 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \
2297 (__v64qi)(__m512i)(B), (int)(N), \
2298 (__v64qi)(__m512i)(W), \
2301 #define _mm512_maskz_alignr_epi8(U, A, B, N) __extension__({\
2302 (__m512i)__builtin_ia32_palignr512_mask((__v64qi)(__m512i)(A), \
2303 (__v64qi)(__m512i)(B), (int)(N), \
2304 (__v64qi)_mm512_setzero_si512(), \
2307 #define _mm512_dbsad_epu8(A, B, imm) __extension__ ({\
2308 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \
2309 (__v64qi)(__m512i)(B), (int)(imm), \
2310 (__v32hi)_mm512_undefined_epi32(), \
2313 #define _mm512_mask_dbsad_epu8(W, U, A, B, imm) ({\
2314 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \
2315 (__v64qi)(__m512i)(B), (int)(imm), \
2316 (__v32hi)(__m512i)(W), \
2319 #define _mm512_maskz_dbsad_epu8(U, A, B, imm) ({\
2320 (__m512i)__builtin_ia32_dbpsadbw512_mask((__v64qi)(__m512i)(A), \
2321 (__v64qi)(__m512i)(B), (int)(imm), \
2322 (__v32hi)_mm512_setzero_hi(), \
2328 return (__m512i) __builtin_ia32_psadbw512 ((__v64qi) __A,
2334 #undef __DEFAULT_FN_ATTRS
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask2_permutex2var_epi16(__m512i __A, __m512i __I, __mmask32 __U, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpacklo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mov_epi16(__mmask32 __U, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmplt_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srli_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_permutexvar_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_qi(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sll_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi8(__mmask64 __M, char __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_loadu_epi16(__m512i __W, __mmask32 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_add_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtusepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhi_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srl_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sll_epi16(__m512i __A, __m128i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpneq_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packs_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_movepi16_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srli_epi16(__m512i __A, int __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpgt_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srl_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packus_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_shuffle_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_avg_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_movm_epi8(__mmask64 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sub_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_shuffle_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmple_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpacklo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mullo_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpacklo_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_abs_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packs_epi32(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmple_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mullo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sra_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpeq_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_madd_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_slli_epi16(__m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_movm_epi16(__mmask32 __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srav_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpneq_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpgt_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpackhi_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_loadu_epi8(__m512i __W, __mmask64 __U, void const *__P)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_cvtepu8_epi16(__m256i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmplt_epi8_mask(__m512i __a, __m512i __b)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtsepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srai_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_madd_epi16(__m512i __W, __mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_add_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhrs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpackhi_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_add_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_broadcastb_epi8(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepi8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpgt_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_hi(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mulhi_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packus_epi32(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_testn_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srlv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_movepi8_mask(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epi8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtusepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhi_epu16(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpneq_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_shuffle_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_cvtepi8_epi16(__m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sllv_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmple_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srlv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_avg_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpge_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtsepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_maddubs_epi16(__m512i __W, __mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sllv_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_broadcastw_epi16(__m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epu8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpge_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_avg_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmplt_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_cvtepu8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_avg_epu16(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpeq_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epu8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpackhi_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtsepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mov_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epu16(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_cvtepi16_storeu_epi8(void *__P, __mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_undefined_epi32(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpge_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_unpacklo_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_mask_cvtepi16_epi8(__m256i __O, __mmask32 __M, __m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_test_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
#define __DEFAULT_FN_ATTRS
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_loadu_epi16(__mmask32 __U, void const *__P)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmple_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_abs_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_broadcastw_epi16(__m512i __O, __mmask32 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_srai_epi16(__m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_abs_epi16(__m512i __W, __mmask32 __U, __m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpgt_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epi8(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epu16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sub_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
unsigned long long __mmask64
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epu16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_avg_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epu16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_test_epi16_mask(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpeq_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maddubs_epi16(__m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sra_epi16(__m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sad_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_madd_epi16(__mmask16 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epu8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packs_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_broadcastw_epi16(__mmask32 __M, __m128i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packus_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_add_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpeq_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_packs_epi16(__m512i __A, __m512i __B)
static __inline__ vector float vector float __b
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packus_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_storeu_epi8(void *__P, __mmask64 __U, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_kunpackw(__mmask32 __A, __mmask32 __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_testn_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_kunpackd(__mmask64 __A, __mmask64 __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpge_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_set1_epi16(__mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_permutex2var_epi16(__m512i __A, __m512i __I, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmplt_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtusepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtepi16_epi8(__m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_add_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_avg_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_sub_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sra_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_maddubs_epi16(__mmask32 __U, __m512i __X, __m512i __Y)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpacklo_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_test_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_subs_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpgt_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sub_epi8(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_cvtusepi16_epi8(__m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpeq_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mov_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpneq_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epu8(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpneq_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_min_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_test_epi16_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epu8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m256i __DEFAULT_FN_ATTRS _mm512_maskz_cvtsepi16_epi8(__mmask32 __M, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi16(__m512i __O, __mmask32 __M, short __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_abs_epi16(__mmask32 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sub_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmple_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_testn_epi8_mask(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_mov_epi8(__mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_adds_epu16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_loadu_epi8(__mmask64 __U, void const *__P)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmplt_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_blend_epi8(__mmask64 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_min_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mullo_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srl_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m128i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sub_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpgt_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_cvtepi8_epi16(__m512i __W, __mmask32 __U, __m256i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmple_epu16_mask(__m512i __a, __m512i __b)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpneq_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_mulhrs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_permutex2var_epi16(__m512i __A, __mmask32 __U, __m512i __I, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_slli_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epu16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epi16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_broadcastb_epi8(__mmask64 __M, __m128i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpgt_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_permutex2var_epi16(__mmask32 __U, __m512i __A, __m512i __I, __m512i __B)
static __inline__ __m128i __DEFAULT_FN_ATTRS _mm_undefined_si128(void)
Generates a 128-bit vector of [4 x i32] with unspecified content.
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_set1_epi8(__m512i __O, __mmask64 __M, char __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmplt_epu8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_permutexvar_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmple_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_sll_epi16(__mmask32 __U, __m512i __A, __m128i __B)
static __inline __m512i __DEFAULT_FN_ATTRS _mm512_setzero_si512(void)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srai_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_min_epi8(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpneq_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpackhi_epi16(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_max_epu8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srlv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_sllv_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_adds_epu16(__m512i __A, __m512i __B)
static __inline __m256i __DEFAULT_FN_ATTRS _mm256_setzero_si256(void)
Constructs a 256-bit integer vector initialized to zero.
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_testn_epi8_mask(__mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpgt_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_adds_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_max_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_add_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_cvtepu8_epi16(__mmask32 __U, __m256i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_unpacklo_epi8(__m512i __A, __m512i __B)
static __inline__ void __DEFAULT_FN_ATTRS _mm512_mask_storeu_epi16(void *__P, __mmask32 __U, __m512i __A)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpeq_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmplt_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_abs_epi8(__m512i __W, __mmask64 __U, __m512i __A)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_permutexvar_epi16(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmplt_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpge_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packus_epi32(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpge_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srav_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_slli_epi16(__mmask32 __U, __m512i __A, int __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_cmpneq_epi8_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packus_epi16(__mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_packs_epi16(__m512i __W, __mmask64 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_unpackhi_epi16(__m512i __W, __mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_abs_epi16(__m512i __A)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpge_epu16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmpge_epu8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_srav_epi16(__mmask32 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_maskz_packs_epi32(__mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_blend_epi16(__mmask32 __U, __m512i __A, __m512i __W)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_max_epu16(__m512i __W, __mmask32 __M, __m512i __A, __m512i __B)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_mask_cmpeq_epi16_mask(__mmask32 __u, __m512i __a, __m512i __b)
static __inline__ __mmask32 __DEFAULT_FN_ATTRS _mm512_cmpeq_epi16_mask(__m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_srli_epi16(__m512i __W, __mmask32 __U, __m512i __A, int __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mulhrs_epi16(__m512i __A, __m512i __B)
static __inline__ __mmask64 __DEFAULT_FN_ATTRS _mm512_mask_cmple_epi8_mask(__mmask64 __u, __m512i __a, __m512i __b)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_subs_epi8(__m512i __W, __mmask64 __U, __m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_subs_epi8(__m512i __A, __m512i __B)
static __inline__ __m512i __DEFAULT_FN_ATTRS _mm512_mask_broadcastb_epi8(__m512i __O, __mmask64 __M, __m128i __A)