-
Notifications
You must be signed in to change notification settings - Fork 264
/
Copy pathshuffle.c
4544 lines (4359 loc) · 371 KB
/
shuffle.c
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
/* SPDX-License-Identifier: MIT
*
* Permission is hereby granted, free of charge, to any person
* obtaining a copy of this software and associated documentation
* files (the "Software"), to deal in the Software without
* restriction, including without limitation the rights to use, copy,
* modify, merge, publish, distribute, sublicense, and/or sell copies
* of the Software, and to permit persons to whom the Software is
* furnished to do so, subject to the following conditions:
*
* The above copyright notice and this permission notice shall be
* included in all copies or substantial portions of the Software.
*
* THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
* EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
* MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
* NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
* BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
* ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
* CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
* SOFTWARE.
*
* Copyright:
* 2020 Evan Nemerson <evan@nemerson.com>
* 2020 Christopher Moore <moore@free.fr>
*/
#define SIMDE_TEST_X86_AVX512_INSN shuffle
#include <test/x86/avx512/test-avx512.h>
#include <simde/x86/avx512/set.h>
#include <simde/x86/avx512/setzero.h>
#include <simde/x86/avx512/shuffle.h>
static int
test_simde_mm512_shuffle_epi8(SIMDE_MUNIT_TEST_ARGS) {
const struct {
simde__m512i a;
simde__m512i b;
simde__m512i r;
} test_vec[8] = {
{ simde_mm512_set_epi8(INT8_C( 56), INT8_C( -94), INT8_C( -41), INT8_C( -59),
INT8_C( 40), INT8_C( 78), INT8_C( 93), INT8_C( 107),
INT8_C( -47), INT8_C( 66), INT8_C( -8), INT8_C( -52),
INT8_C( 50), INT8_C( 78), INT8_C( 13), INT8_C( 26),
INT8_C( -33), INT8_C( 120), INT8_C( 67), INT8_C( -12),
INT8_C( 80), INT8_C( 88), INT8_C( -65), INT8_C( 49),
INT8_C( 28), INT8_C( 96), INT8_C( -99), INT8_C(-119),
INT8_C( 126), INT8_C( 24), INT8_C( 35), INT8_C( 11),
INT8_C( -43), INT8_C( -24), INT8_C( 1), INT8_C( -61),
INT8_C( 101), INT8_C( 5), INT8_C( 67), INT8_C( -42),
INT8_C( -46), INT8_C(-115), INT8_C(-105), INT8_C( -92),
INT8_C( -3), INT8_C( -44), INT8_C( 13), INT8_C( -36),
INT8_C( 110), INT8_C( -38), INT8_C( -48), INT8_C( 36),
INT8_C( 117), INT8_C( -59), INT8_C( 109), INT8_C( -27),
INT8_C( -62), INT8_C( 98), INT8_C(-121), INT8_C(-108),
INT8_C( -7), INT8_C(-112), INT8_C( -52), INT8_C( -84)),
simde_mm512_set_epi8(INT8_C( 34), INT8_C( 34), INT8_C( -71), INT8_C( -63),
INT8_C( -34), INT8_C(-128), INT8_C( 113), INT8_C( -72),
INT8_C( 86), INT8_C( -73), INT8_C( -43), INT8_C( 95),
INT8_C( 3), INT8_C( 13), INT8_C( 19), INT8_C( -1),
INT8_C( -54), INT8_C( 114), INT8_C( 27), INT8_C( -30),
INT8_C( 52), INT8_C( -54), INT8_C( 78), INT8_C( 23),
INT8_C( 71), INT8_C( 87), INT8_C( 107), INT8_C( -27),
INT8_C( -35), INT8_C(-122), INT8_C( 40), INT8_C( 55),
INT8_C( -2), INT8_C( 40), INT8_C( -63), INT8_C( 85),
INT8_C( -25), INT8_C( -93), INT8_C( 25), INT8_C( 70),
INT8_C( 117), INT8_C( 66), INT8_C( -79), INT8_C( 57),
INT8_C(-115), INT8_C( -27), INT8_C( 59), INT8_C( 25),
INT8_C( -6), INT8_C( 42), INT8_C( -27), INT8_C( -34),
INT8_C( -16), INT8_C( 5), INT8_C( -55), INT8_C( 74),
INT8_C( -29), INT8_C( 77), INT8_C( -17), INT8_C( 16),
INT8_C( -98), INT8_C( -38), INT8_C( 116), INT8_C( -56)),
simde_mm512_set_epi8(INT8_C( 78), INT8_C( 78), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 13), INT8_C( 0),
INT8_C( 66), INT8_C( 0), INT8_C( 0), INT8_C( 56),
INT8_C( 50), INT8_C( -41), INT8_C( 50), INT8_C( 0),
INT8_C( 0), INT8_C( 24), INT8_C( 80), INT8_C( 0),
INT8_C(-119), INT8_C( 0), INT8_C( 120), INT8_C( 28),
INT8_C( 28), INT8_C( 28), INT8_C( 80), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 49), INT8_C( 28),
INT8_C( 0), INT8_C( -42), INT8_C( 0), INT8_C(-105),
INT8_C( 0), INT8_C( 0), INT8_C( 67), INT8_C(-115),
INT8_C(-105), INT8_C( -44), INT8_C( 0), INT8_C( 67),
INT8_C( 0), INT8_C( 0), INT8_C( 101), INT8_C( 67),
INT8_C( 0), INT8_C( -59), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C(-121), INT8_C( 0), INT8_C( -59),
INT8_C( 0), INT8_C( -48), INT8_C( 0), INT8_C( -84),
INT8_C( 0), INT8_C( 0), INT8_C(-108), INT8_C( 0)) },
{ simde_mm512_set_epi8(INT8_C( -75), INT8_C(-123), INT8_C( -44), INT8_C( -97),
INT8_C( 61), INT8_C(-112), INT8_C( 109), INT8_C( 27),
INT8_C( -9), INT8_C( -31), INT8_C(-111), INT8_C( -59),
INT8_C( 94), INT8_C( 110), INT8_C( 31), INT8_C( 50),
INT8_C( -86), INT8_C( 24), INT8_C( 91), INT8_C(-105),
INT8_C( 39), INT8_C( 25), INT8_C( -65), INT8_C( 69),
INT8_C( -59), INT8_C( -57), INT8_C( -98), INT8_C( 26),
INT8_C( -35), INT8_C( -2), INT8_C( 114), INT8_C( -51),
INT8_C( -16), INT8_C( 101), INT8_C( -92), INT8_C( 65),
INT8_C( -88), INT8_C( 19), INT8_C(-102), INT8_C( -51),
INT8_C( -94), INT8_C( -30), INT8_C( 60), INT8_C( -9),
INT8_C( 4), INT8_C( -93), INT8_C( 110), INT8_C(-102),
INT8_C( 109), INT8_C( 1), INT8_C( 113), INT8_C( 114),
INT8_C( 100), INT8_C( 80), INT8_C( 18), INT8_C( -7),
INT8_C( -87), INT8_C( 0), INT8_C( -55), INT8_C( 37),
INT8_C( 13), INT8_C( 86), INT8_C(-114), INT8_C(-125)),
simde_mm512_set_epi8(INT8_C( 18), INT8_C( 11), INT8_C( 73), INT8_C( 57),
INT8_C( -54), INT8_C( 9), INT8_C( 69), INT8_C( -45),
INT8_C( 71), INT8_C( -6), INT8_C( -68), INT8_C( -8),
INT8_C( 14), INT8_C( -27), INT8_C( 84), INT8_C( -90),
INT8_C( -10), INT8_C( -81), INT8_C( 77), INT8_C(-113),
INT8_C( 32), INT8_C( 17), INT8_C( 62), INT8_C( -18),
INT8_C( 124), INT8_C( -42), INT8_C( -52), INT8_C(-109),
INT8_C( -19), INT8_C( 30), INT8_C( -51), INT8_C(-111),
INT8_C( 100), INT8_C( 63), INT8_C( -80), INT8_C(-126),
INT8_C( 3), INT8_C( 119), INT8_C( 38), INT8_C( -44),
INT8_C( -48), INT8_C( -43), INT8_C( 6), INT8_C(-113),
INT8_C( -5), INT8_C( -18), INT8_C( 58), INT8_C( 77),
INT8_C( -49), INT8_C(-107), INT8_C( -77), INT8_C( 119),
INT8_C( -6), INT8_C( 92), INT8_C(-122), INT8_C( 43),
INT8_C( 85), INT8_C(-111), INT8_C( -15), INT8_C( 90),
INT8_C(-104), INT8_C( 31), INT8_C( -4), INT8_C( 57)),
simde_mm512_set_epi8(INT8_C( 110), INT8_C( 61), INT8_C( 109), INT8_C( 109),
INT8_C( 0), INT8_C( 109), INT8_C(-111), INT8_C( 0),
INT8_C( -9), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C(-123), INT8_C( 0), INT8_C( -59), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 91), INT8_C( 0),
INT8_C( -51), INT8_C( 114), INT8_C( 24), INT8_C( 0),
INT8_C(-105), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 24), INT8_C( 0), INT8_C( 0),
INT8_C( -9), INT8_C( -16), INT8_C( 0), INT8_C( 0),
INT8_C( 4), INT8_C( -94), INT8_C( -30), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( -30), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 19), INT8_C( -92),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -87),
INT8_C( 0), INT8_C( 114), INT8_C( 0), INT8_C( 100),
INT8_C( -55), INT8_C( 0), INT8_C( 0), INT8_C( 80),
INT8_C( 0), INT8_C( 109), INT8_C( 0), INT8_C( 18)) },
{ simde_mm512_set_epi8(INT8_C( -54), INT8_C( 53), INT8_C( 35), INT8_C( 51),
INT8_C( 24), INT8_C( 100), INT8_C( 80), INT8_C( 7),
INT8_C( 54), INT8_C( 114), INT8_C( -42), INT8_C( -2),
INT8_C( 18), INT8_C( 100), INT8_C( 26), INT8_C( -68),
INT8_C( 82), INT8_C( -30), INT8_C( -4), INT8_C( 110),
INT8_C( 24), INT8_C( 88), INT8_C(-100), INT8_C(-120),
INT8_C( -17), INT8_C(-109), INT8_C( 92), INT8_C(-105),
INT8_C( -20), INT8_C( 34), INT8_C( 98), INT8_C( -17),
INT8_C( 2), INT8_C( 6), INT8_C( 37), INT8_C( -85),
INT8_C( 118), INT8_C( 28), INT8_C( 34), INT8_C( 117),
INT8_C( 77), INT8_C( -32), INT8_C( 25), INT8_C( -74),
INT8_C( 93), INT8_C(-108), INT8_C( 3), INT8_C( -90),
INT8_C( 13), INT8_C( -29), INT8_C( -88), INT8_C( 116),
INT8_C( 14), INT8_C( -29), INT8_C( 30), INT8_C( -26),
INT8_C(-115), INT8_C( -36), INT8_C( 94), INT8_C(-125),
INT8_C( 118), INT8_C( 125), INT8_C( -91), INT8_C( 31)),
simde_mm512_set_epi8(INT8_C( -74), INT8_C( -13), INT8_C( -87), INT8_C( -10),
INT8_C( 21), INT8_C( 49), INT8_C( -64), INT8_C( 52),
INT8_C( -97), INT8_C(-103), INT8_C(-127), INT8_C( 53),
INT8_C( 99), INT8_C( 80), INT8_C( 55), INT8_C( 111),
INT8_C( 61), INT8_C( -93), INT8_C( -87), INT8_C( 81),
INT8_C( 108), INT8_C( 89), INT8_C( 63), INT8_C(-109),
INT8_C( -47), INT8_C( -32), INT8_C( 105), INT8_C( 91),
INT8_C( 88), INT8_C( 85), INT8_C( -96), INT8_C( 88),
INT8_C( -85), INT8_C( 3), INT8_C( 124), INT8_C( -33),
INT8_C( -21), INT8_C( -7), INT8_C( -31), INT8_C(-126),
INT8_C( 3), INT8_C( -17), INT8_C( 40), INT8_C( 5),
INT8_C( 126), INT8_C( -60), INT8_C( -91), INT8_C(-112),
INT8_C( 88), INT8_C( 11), INT8_C( 100), INT8_C( 114),
INT8_C( 112), INT8_C( -53), INT8_C( 89), INT8_C( 78),
INT8_C( 115), INT8_C( 117), INT8_C( -33), INT8_C( 14),
INT8_C( -42), INT8_C( -15), INT8_C( 80), INT8_C( -46)),
simde_mm512_set_epi8(INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( -42), INT8_C( 26), INT8_C( 0), INT8_C( -2),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -42),
INT8_C( 18), INT8_C( -68), INT8_C( 54), INT8_C( -54),
INT8_C( -4), INT8_C( 0), INT8_C( 0), INT8_C( 98),
INT8_C( 110), INT8_C(-100), INT8_C( 82), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C(-100), INT8_C( 24),
INT8_C(-120), INT8_C( 92), INT8_C( 0), INT8_C(-120),
INT8_C( 0), INT8_C( 93), INT8_C( -85), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 93), INT8_C( 0), INT8_C( 117), INT8_C( 25),
INT8_C( 6), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( -26), INT8_C( 14), INT8_C(-125), INT8_C( 125),
INT8_C( 31), INT8_C( 0), INT8_C( 30), INT8_C( -29),
INT8_C( 118), INT8_C( 94), INT8_C( 0), INT8_C( -29),
INT8_C( 0), INT8_C( 0), INT8_C( 31), INT8_C( 0)) },
{ simde_mm512_set_epi8(INT8_C(-109), INT8_C( 14), INT8_C( -91), INT8_C( -44),
INT8_C( 79), INT8_C( -4), INT8_C( 88), INT8_C( 49),
INT8_C( -95), INT8_C( -92), INT8_C(-116), INT8_C( 8),
INT8_C( 25), INT8_C( 30), INT8_C( -55), INT8_C(-120),
INT8_C( -58), INT8_C( -84), INT8_C( 99), INT8_C( -92),
INT8_C( -29), INT8_C( -47), INT8_C( 42), INT8_C( -56),
INT8_C( 109), INT8_C( -71), INT8_C( -73), INT8_C( -30),
INT8_C( -15), INT8_C(-106), INT8_C( -91), INT8_C( -57),
INT8_C( 51), INT8_C( -8), INT8_C( 55), INT8_C( 36),
INT8_C( -55), INT8_C(-103), INT8_C( 51), INT8_C( -28),
INT8_C( 70), INT8_C( 114), INT8_C( -3), INT8_C( 49),
INT8_C( 23), INT8_C( -28), INT8_C( -87), INT8_C( 57),
INT8_C( 28), INT8_C( -12), INT8_C( -51), INT8_C( 37),
INT8_C( 29), INT8_C( -58), INT8_C( -69), INT8_C( 30),
INT8_C( 43), INT8_C( -65), INT8_C( -2), INT8_C( -83),
INT8_C( -27), INT8_C(-122), INT8_C( 77), INT8_C( 47)),
simde_mm512_set_epi8(INT8_C(-116), INT8_C(-127), INT8_C( -95), INT8_C( -97),
INT8_C( -78), INT8_C( -53), INT8_C( -36), INT8_C( 62),
INT8_C( 63), INT8_C( 28), INT8_C( -37), INT8_C( 40),
INT8_C( -14), INT8_C( 2), INT8_C( -65), INT8_C( -67),
INT8_C( 79), INT8_C( 51), INT8_C( -51), INT8_C( -64),
INT8_C( -40), INT8_C(-102), INT8_C(-107), INT8_C( 82),
INT8_C( 20), INT8_C( 54), INT8_C( 66), INT8_C( 7),
INT8_C( 33), INT8_C( 108), INT8_C( -88), INT8_C( 69),
INT8_C( 98), INT8_C( 43), INT8_C( 25), INT8_C( 58),
INT8_C( 117), INT8_C( -34), INT8_C( -70), INT8_C( 3),
INT8_C( 1), INT8_C( 100), INT8_C( 3), INT8_C( 14),
INT8_C( 117), INT8_C( -91), INT8_C( -89), INT8_C( 66),
INT8_C( 32), INT8_C( -35), INT8_C( 104), INT8_C( 65),
INT8_C(-100), INT8_C( 27), INT8_C( 42), INT8_C( 91),
INT8_C( -47), INT8_C( 39), INT8_C( -65), INT8_C(-124),
INT8_C( -84), INT8_C( -95), INT8_C( -46), INT8_C(-113)),
simde_mm512_set_epi8(INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 14),
INT8_C(-109), INT8_C( -44), INT8_C( 0), INT8_C( 49),
INT8_C( 0), INT8_C( 30), INT8_C( 0), INT8_C( 0),
INT8_C( -58), INT8_C( -15), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C(-106),
INT8_C( -30), INT8_C( -71), INT8_C(-106), INT8_C( 109),
INT8_C( -91), INT8_C( -92), INT8_C( 0), INT8_C( -73),
INT8_C( -28), INT8_C( -55), INT8_C( 51), INT8_C(-103),
INT8_C( -3), INT8_C( 0), INT8_C( 0), INT8_C( 23),
INT8_C( -87), INT8_C( 49), INT8_C( 23), INT8_C( -8),
INT8_C( -3), INT8_C( 0), INT8_C( 0), INT8_C( -28),
INT8_C( 47), INT8_C( 0), INT8_C( 30), INT8_C( 77),
INT8_C( 0), INT8_C( 29), INT8_C( -58), INT8_C( 29),
INT8_C( 0), INT8_C( 43), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0)) },
{ simde_mm512_set_epi8(INT8_C(-119), INT8_C( 55), INT8_C( -13), INT8_C(-118),
INT8_C( 5), INT8_C( 14), INT8_C(-103), INT8_C( 58),
INT8_C( 109), INT8_C(-113), INT8_C( -44), INT8_C( 126),
INT8_C( 70), INT8_C(-126), INT8_C( 24), INT8_C(-117),
INT8_C( 80), INT8_C( 25), INT8_C( 64), INT8_C( -89),
INT8_C( 60), INT8_C( 5), INT8_C(-119), INT8_C( -29),
INT8_C( -95), INT8_C( -26), INT8_C( 25), INT8_C( -65),
INT8_C( -81), INT8_C( -84), INT8_C( 46), INT8_C( 62),
INT8_C( -25), INT8_C(-116), INT8_C(-126), INT8_C(-103),
INT8_C( 126), INT8_C( -39), INT8_C( 111), INT8_C( -10),
INT8_C( -48), INT8_C( 122), INT8_C( -86), INT8_C( -25),
INT8_C( 35), INT8_C( -4), INT8_C( -7), INT8_C( 76),
INT8_C(-116), INT8_C( 1), INT8_C( 126), INT8_C( -30),
INT8_C( -11), INT8_C( 82), INT8_C( 81), INT8_C( 27),
INT8_C( -15), INT8_C( -14), INT8_C( 56), INT8_C( 60),
INT8_C( -29), INT8_C( -65), INT8_C( -35), INT8_C( 21)),
simde_mm512_set_epi8(INT8_C( 125), INT8_C( -43), INT8_C( -42), INT8_C( -51),
INT8_C( -36), INT8_C( 38), INT8_C( 42), INT8_C( 18),
INT8_C( 24), INT8_C( -25), INT8_C( 19), INT8_C( 15),
INT8_C(-119), INT8_C(-124), INT8_C( 104), INT8_C( -93),
INT8_C( 22), INT8_C( -16), INT8_C( 31), INT8_C( 116),
INT8_C( -99), INT8_C( 45), INT8_C( -54), INT8_C( 50),
INT8_C( -72), INT8_C(-107), INT8_C( 48), INT8_C( 118),
INT8_C( -68), INT8_C( -15), INT8_C(-108), INT8_C( -29),
INT8_C( 118), INT8_C( 96), INT8_C( -51), INT8_C( 107),
INT8_C( -23), INT8_C( -97), INT8_C( -6), INT8_C( 91),
INT8_C( -57), INT8_C( -67), INT8_C(-105), INT8_C( 68),
INT8_C( -50), INT8_C( 16), INT8_C( -86), INT8_C( 6),
INT8_C( 55), INT8_C(-118), INT8_C( 112), INT8_C( 125),
INT8_C( 92), INT8_C( 91), INT8_C( -27), INT8_C( 53),
INT8_C( 28), INT8_C( -66), INT8_C( -69), INT8_C(-117),
INT8_C( -30), INT8_C(-106), INT8_C( 1), INT8_C( 95)),
simde_mm512_set_epi8(INT8_C( -13), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C(-113), INT8_C( 14), INT8_C(-126),
INT8_C( 58), INT8_C( 0), INT8_C( 70), INT8_C(-119),
INT8_C( 0), INT8_C( 0), INT8_C( 58), INT8_C( 0),
INT8_C( -26), INT8_C( 0), INT8_C( 80), INT8_C( -65),
INT8_C( 0), INT8_C( 64), INT8_C( 0), INT8_C( -84),
INT8_C( 0), INT8_C( 0), INT8_C( 62), INT8_C( -26),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 122), INT8_C( 76), INT8_C( 0), INT8_C( 126),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 126),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -25),
INT8_C( 0), INT8_C( 76), INT8_C( 0), INT8_C( 122),
INT8_C( -15), INT8_C( 0), INT8_C( 21), INT8_C( 126),
INT8_C( -30), INT8_C( -11), INT8_C( 0), INT8_C( 56),
INT8_C( -30), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( -35), INT8_C(-116)) },
{ simde_mm512_set_epi8(INT8_C( 18), INT8_C(-124), INT8_C( -6), INT8_C( -41),
INT8_C(-109), INT8_C( 19), INT8_C( 47), INT8_C( 73),
INT8_C( -58), INT8_C( -50), INT8_C( 73), INT8_C( 110),
INT8_C( 56), INT8_C( -30), INT8_C( -79), INT8_C( 123),
INT8_C( 77), INT8_C( 62), INT8_C( -28), INT8_C( 45),
INT8_C( -95), INT8_C( 12), INT8_C( 53), INT8_C( 75),
INT8_C( 66), INT8_C( -89), INT8_C( 46), INT8_C( -47),
INT8_C( 6), INT8_C( 4), INT8_C( 112), INT8_C( -34),
INT8_C( 121), INT8_C( -3), INT8_C(-102), INT8_C(-115),
INT8_C( -12), INT8_C( 80), INT8_C( 3), INT8_C( 56),
INT8_C( 85), INT8_C( -43), INT8_C( -93), INT8_C( 34),
INT8_C( -58), INT8_C(-101), INT8_C( 51), INT8_C( 1),
INT8_C( -18), INT8_C( -90), INT8_C( -71), INT8_C( 74),
INT8_C( -5), INT8_C(-113), INT8_C( 71), INT8_C( 61),
INT8_C( 92), INT8_C( 73), INT8_C( 116), INT8_C( 110),
INT8_C(-117), INT8_C( 96), INT8_C( -77), INT8_C( 45)),
simde_mm512_set_epi8(INT8_C( 52), INT8_C( -84), INT8_C( 103), INT8_C(-105),
INT8_C( -57), INT8_C( 17), INT8_C(-110), INT8_C(-113),
INT8_C( 56), INT8_C( 125), INT8_C( 56), INT8_C( -88),
INT8_C( -31), INT8_C( 119), INT8_C( -86), INT8_C( 114),
INT8_C( -85), INT8_C( 14), INT8_C( 60), INT8_C( 84),
INT8_C( -61), INT8_C(-111), INT8_C( 74), INT8_C( 113),
INT8_C( 13), INT8_C( -89), INT8_C(-114), INT8_C( -79),
INT8_C( -34), INT8_C( -73), INT8_C( -9), INT8_C(-108),
INT8_C( 93), INT8_C( -78), INT8_C( -1), INT8_C(-102),
INT8_C( 12), INT8_C( 117), INT8_C( 80), INT8_C( 44),
INT8_C( 29), INT8_C( 18), INT8_C( 91), INT8_C( -23),
INT8_C( 110), INT8_C(-126), INT8_C( -71), INT8_C( 65),
INT8_C( -76), INT8_C( 85), INT8_C( 93), INT8_C( -86),
INT8_C(-123), INT8_C(-115), INT8_C(-105), INT8_C( 75),
INT8_C( 45), INT8_C( 22), INT8_C( 73), INT8_C( 74),
INT8_C( 107), INT8_C( -60), INT8_C( -28), INT8_C( -57)),
simde_mm512_set_epi8(INT8_C( 110), INT8_C( 0), INT8_C( -58), INT8_C( 0),
INT8_C( 0), INT8_C( -79), INT8_C( 0), INT8_C( 0),
INT8_C( 73), INT8_C( -6), INT8_C( 73), INT8_C( 0),
INT8_C( 0), INT8_C( -58), INT8_C( 0), INT8_C( -30),
INT8_C( 0), INT8_C( 62), INT8_C( 45), INT8_C( -47),
INT8_C( 0), INT8_C( 0), INT8_C( 12), INT8_C( 112),
INT8_C( -28), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C(-102), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C(-115), INT8_C( -93), INT8_C( 1), INT8_C(-115),
INT8_C(-102), INT8_C(-101), INT8_C( -12), INT8_C( 0),
INT8_C( -3), INT8_C( 0), INT8_C( 0), INT8_C( 51),
INT8_C( 0), INT8_C( 116), INT8_C( -71), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -5),
INT8_C( -71), INT8_C( 73), INT8_C( 71), INT8_C(-113),
INT8_C( -5), INT8_C( 0), INT8_C( 0), INT8_C( 0)) },
{ simde_mm512_set_epi8(INT8_C( 4), INT8_C( -30), INT8_C( -68), INT8_C( 57),
INT8_C( 73), INT8_C( 25), INT8_C( -45), INT8_C( 112),
INT8_C( 41), INT8_C( 41), INT8_C( -56), INT8_C( -93),
INT8_C( 29), INT8_C( 99), INT8_C( 15), INT8_C( 122),
INT8_C( 74), INT8_C( 0), INT8_C( 89), INT8_C( 61),
INT8_C( 124), INT8_C( 36), INT8_C( -87), INT8_C( -25),
INT8_C( 42), INT8_C(-125), INT8_C( -87), INT8_C( 69),
INT8_C( 81), INT8_C( 4), INT8_C( 55), INT8_C( 107),
INT8_C( 0), INT8_C( -7), INT8_C( 37), INT8_C( -15),
INT8_C( 117), INT8_C( 9), INT8_C( -27), INT8_C( 11),
INT8_C( 16), INT8_C( 87), INT8_C( 119), INT8_C(-107),
INT8_C( -22), INT8_C( 27), INT8_C( -86), INT8_C( -63),
INT8_C( 90), INT8_C( -44), INT8_C(-113), INT8_C(-126),
INT8_C( -75), INT8_C( 67), INT8_C( 88), INT8_C( 105),
INT8_C( 80), INT8_C( 7), INT8_C( 66), INT8_C( 126),
INT8_C( 17), INT8_C( -20), INT8_C( -91), INT8_C( -99)),
simde_mm512_set_epi8(INT8_C( 123), INT8_C( 117), INT8_C( 18), INT8_C( 2),
INT8_C(-105), INT8_C( -51), INT8_C( -9), INT8_C( 72),
INT8_C( 69), INT8_C(-116), INT8_C( 95), INT8_C(-110),
INT8_C( -32), INT8_C( 110), INT8_C( -8), INT8_C( 85),
INT8_C( -41), INT8_C( 80), INT8_C( -44), INT8_C( 110),
INT8_C( -28), INT8_C( 116), INT8_C( 41), INT8_C( -31),
INT8_C( 12), INT8_C( 40), INT8_C( 5), INT8_C( 1),
INT8_C( -14), INT8_C( 66), INT8_C( -95), INT8_C( 106),
INT8_C( 66), INT8_C( -91), INT8_C( -20), INT8_C(-109),
INT8_C( -46), INT8_C( 41), INT8_C( 82), INT8_C( -61),
INT8_C( 2), INT8_C( 3), INT8_C( 62), INT8_C( -90),
INT8_C( 99), INT8_C( -54), INT8_C( -28), INT8_C( -21),
INT8_C( 126), INT8_C( 115), INT8_C( -46), INT8_C( 76),
INT8_C( -43), INT8_C( 46), INT8_C( 107), INT8_C( 75),
INT8_C( -93), INT8_C( 67), INT8_C( -37), INT8_C( 4),
INT8_C(-127), INT8_C( -50), INT8_C( -26), INT8_C( 99)),
simde_mm512_set_epi8(INT8_C( 73), INT8_C( -56), INT8_C( 99), INT8_C( 99),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 112),
INT8_C( -56), INT8_C( 0), INT8_C( 4), INT8_C( 0),
INT8_C( 0), INT8_C( -30), INT8_C( 0), INT8_C( -56),
INT8_C( 0), INT8_C( 107), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 69), INT8_C( -87), INT8_C( 0),
INT8_C( 61), INT8_C( -25), INT8_C( -87), INT8_C( 55),
INT8_C( 0), INT8_C( 4), INT8_C( 0), INT8_C( 36),
INT8_C( 27), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( -27), INT8_C( 27), INT8_C( 0),
INT8_C( 27), INT8_C( -22), INT8_C( -7), INT8_C( 0),
INT8_C( -22), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( -44), INT8_C( 17), INT8_C( 0), INT8_C(-126),
INT8_C( 0), INT8_C( -44), INT8_C( -75), INT8_C( -75),
INT8_C( 0), INT8_C( 17), INT8_C( 0), INT8_C( 126),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 17)) },
{ simde_mm512_set_epi8(INT8_C( 56), INT8_C( 24), INT8_C( -33), INT8_C( 82),
INT8_C( 72), INT8_C( 63), INT8_C(-114), INT8_C( 14),
INT8_C( 2), INT8_C( 71), INT8_C( -31), INT8_C( -46),
INT8_C( 64), INT8_C( -11), INT8_C( 35), INT8_C( -7),
INT8_C( -78), INT8_C( 125), INT8_C( -28), INT8_C( -59),
INT8_C( 6), INT8_C(-127), INT8_C( 34), INT8_C( 64),
INT8_C( 88), INT8_C( -88), INT8_C( 70), INT8_C( -90),
INT8_C( 47), INT8_C( -21), INT8_C(-104), INT8_C( -27),
INT8_C( -16), INT8_C( -29), INT8_C( 51), INT8_C(-116),
INT8_C( -87), INT8_C( 91), INT8_C(-106), INT8_C( -3),
INT8_C( -55), INT8_C( -15), INT8_C(-109), INT8_C(-108),
INT8_C( -41), INT8_C( 79), INT8_C( 54), INT8_C( 68),
INT8_C( -51), INT8_C(-108), INT8_C( -83), INT8_C( 104),
INT8_C( 18), INT8_C(-128), INT8_C( -75), INT8_C( -12),
INT8_C( 56), INT8_C(-104), INT8_C( 56), INT8_C( 47),
INT8_C( -30), INT8_C( -15), INT8_C(-115), INT8_C( 88)),
simde_mm512_set_epi8(INT8_C( 107), INT8_C( 125), INT8_C(-111), INT8_C( -89),
INT8_C( -9), INT8_C( 122), INT8_C( -2), INT8_C( -26),
INT8_C(-100), INT8_C( 80), INT8_C( 89), INT8_C( 38),
INT8_C( 95), INT8_C( -82), INT8_C( -66), INT8_C( 108),
INT8_C( 104), INT8_C( -20), INT8_C( 72), INT8_C( -82),
INT8_C( 23), INT8_C( -45), INT8_C( -20), INT8_C( 8),
INT8_C( -2), INT8_C( -77), INT8_C(-112), INT8_C( 102),
INT8_C( 83), INT8_C( 80), INT8_C( 56), INT8_C( -53),
INT8_C( -83), INT8_C( -86), INT8_C( 15), INT8_C( 30),
INT8_C( -92), INT8_C( -2), INT8_C( 42), INT8_C( -79),
INT8_C( 108), INT8_C( 44), INT8_C( 17), INT8_C( 83),
INT8_C( -49), INT8_C( -44), INT8_C( -42), INT8_C( -54),
INT8_C(-127), INT8_C( 12), INT8_C( 88), INT8_C(-118),
INT8_C( -23), INT8_C( -69), INT8_C( -23), INT8_C( -36),
INT8_C( -23), INT8_C( -80), INT8_C( 33), INT8_C( 82),
INT8_C( -43), INT8_C( -91), INT8_C( -36), INT8_C( -56)),
simde_mm512_set_epi8(INT8_C( 72), INT8_C( -33), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 63), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( -7), INT8_C(-114), INT8_C( 71),
INT8_C( 56), INT8_C( 0), INT8_C( 0), INT8_C( 82),
INT8_C( 64), INT8_C( 0), INT8_C( 64), INT8_C( 0),
INT8_C( 88), INT8_C( 0), INT8_C( 0), INT8_C( 64),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( -88),
INT8_C( 47), INT8_C( -27), INT8_C( 64), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( -16), INT8_C( -29),
INT8_C( 0), INT8_C( 0), INT8_C( 91), INT8_C( 0),
INT8_C(-116), INT8_C(-116), INT8_C( 54), INT8_C( -41),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 104), INT8_C( -12), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C(-115), INT8_C( -15),
INT8_C( 0), INT8_C( 0), INT8_C( 0), INT8_C( 0)) },
};
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
simde__m512i r = simde_mm512_shuffle_epi8(test_vec[i].a, test_vec[i].b);
simde_assert_m512i_i8(r, ==, test_vec[i].r);
}
return 0;
}
static int
test_simde_mm512_shuffle_epi32(SIMDE_MUNIT_TEST_ARGS) {
#if 1
const struct {
int32_t a[16];
int32_t imm8;
int32_t r[16];
} test_vec[8] = {
{ { INT32_C( 971206559), -INT32_C( 584109496), -INT32_C( 1230684222), INT32_C( 318067129), -INT32_C( 2121378619), INT32_C( 476178527), -INT32_C( 1026677291), -INT32_C( 1808955404),
INT32_C( 1070404086), INT32_C( 102562883), -INT32_C( 172179141), -INT32_C( 670584302), INT32_C( 1700369670), INT32_C( 1384299133), -INT32_C( 736800545), -INT32_C( 832027945) },
INT32_C( 3),
{ INT32_C( 318067129), INT32_C( 971206559), INT32_C( 971206559), INT32_C( 971206559), -INT32_C( 1808955404), -INT32_C( 2121378619), -INT32_C( 2121378619), -INT32_C( 2121378619),
-INT32_C( 670584302), INT32_C( 1070404086), INT32_C( 1070404086), INT32_C( 1070404086), -INT32_C( 832027945), INT32_C( 1700369670), INT32_C( 1700369670), INT32_C( 1700369670) } },
{ { INT32_C( 831982901), -INT32_C( 361915095), INT32_C( 201155161), -INT32_C( 15542935), -INT32_C( 394496210), INT32_C( 1237831673), INT32_C( 639736804), INT32_C( 947580675),
INT32_C( 627708412), INT32_C( 118478766), -INT32_C( 1575809991), INT32_C( 262219233), -INT32_C( 1762189668), -INT32_C( 773865491), INT32_C( 1593245786), -INT32_C( 342461969) },
INT32_C( 2),
{ INT32_C( 201155161), INT32_C( 831982901), INT32_C( 831982901), INT32_C( 831982901), INT32_C( 639736804), -INT32_C( 394496210), -INT32_C( 394496210), -INT32_C( 394496210),
-INT32_C( 1575809991), INT32_C( 627708412), INT32_C( 627708412), INT32_C( 627708412), INT32_C( 1593245786), -INT32_C( 1762189668), -INT32_C( 1762189668), -INT32_C( 1762189668) } },
{ { -INT32_C( 684716032), INT32_C( 739260448), INT32_C( 1880011595), INT32_C( 1913396564), -INT32_C( 731930091), -INT32_C( 2110902142), -INT32_C( 1720546264), INT32_C( 589061411),
-INT32_C( 1896133522), -INT32_C( 809890940), INT32_C( 322947262), -INT32_C( 75150106), INT32_C( 1892673006), INT32_C( 1039400213), -INT32_C( 1378392694), INT32_C( 819000258) },
INT32_C( 3),
{ INT32_C( 1913396564), -INT32_C( 684716032), -INT32_C( 684716032), -INT32_C( 684716032), INT32_C( 589061411), -INT32_C( 731930091), -INT32_C( 731930091), -INT32_C( 731930091),
-INT32_C( 75150106), -INT32_C( 1896133522), -INT32_C( 1896133522), -INT32_C( 1896133522), INT32_C( 819000258), INT32_C( 1892673006), INT32_C( 1892673006), INT32_C( 1892673006) } },
{ { -INT32_C( 674971957), INT32_C( 1100321657), INT32_C( 522692819), INT32_C( 319627822), -INT32_C( 282558735), -INT32_C( 696686991), INT32_C( 815277629), -INT32_C( 1032861194),
INT32_C( 10040199), -INT32_C( 1706938681), INT32_C( 96037335), INT32_C( 2098775692), -INT32_C( 1251196860), -INT32_C( 477370970), INT32_C( 34808843), INT32_C( 1959035885) },
INT32_C( 2),
{ INT32_C( 522692819), -INT32_C( 674971957), -INT32_C( 674971957), -INT32_C( 674971957), INT32_C( 815277629), -INT32_C( 282558735), -INT32_C( 282558735), -INT32_C( 282558735),
INT32_C( 96037335), INT32_C( 10040199), INT32_C( 10040199), INT32_C( 10040199), INT32_C( 34808843), -INT32_C( 1251196860), -INT32_C( 1251196860), -INT32_C( 1251196860) } },
{ { -INT32_C( 1954712227), INT32_C( 543299511), -INT32_C( 1750308912), -INT32_C( 1059378561), INT32_C( 2087096726), INT32_C( 1082608156), -INT32_C( 533886627), -INT32_C( 1432903091),
-INT32_C( 835316713), -INT32_C( 51472340), INT32_C( 2140379904), INT32_C( 1530884037), INT32_C( 483894784), INT32_C( 1297965040), INT32_C( 909019880), INT32_C( 1138804012) },
INT32_C( 1),
{ INT32_C( 543299511), -INT32_C( 1954712227), -INT32_C( 1954712227), -INT32_C( 1954712227), INT32_C( 1082608156), INT32_C( 2087096726), INT32_C( 2087096726), INT32_C( 2087096726),
-INT32_C( 51472340), -INT32_C( 835316713), -INT32_C( 835316713), -INT32_C( 835316713), INT32_C( 1297965040), INT32_C( 483894784), INT32_C( 483894784), INT32_C( 483894784) } },
{ { -INT32_C( 1358622442), -INT32_C( 1683029504), INT32_C( 73412245), INT32_C( 335854446), -INT32_C( 234610285), INT32_C( 148525438), INT32_C( 1144328319), INT32_C( 119437553),
-INT32_C( 1967774838), -INT32_C( 1155177179), INT32_C( 46106004), -INT32_C( 753482688), INT32_C( 1673861861), -INT32_C( 345268117), -INT32_C( 1590714192), -INT32_C( 1549185767) },
INT32_C( 1),
{ -INT32_C( 1683029504), -INT32_C( 1358622442), -INT32_C( 1358622442), -INT32_C( 1358622442), INT32_C( 148525438), -INT32_C( 234610285), -INT32_C( 234610285), -INT32_C( 234610285),
-INT32_C( 1155177179), -INT32_C( 1967774838), -INT32_C( 1967774838), -INT32_C( 1967774838), -INT32_C( 345268117), INT32_C( 1673861861), INT32_C( 1673861861), INT32_C( 1673861861) } },
{ { -INT32_C( 980013729), -INT32_C( 682012334), -INT32_C( 719889647), -INT32_C( 1950684303), INT32_C( 1358306736), INT32_C( 687989128), INT32_C( 1581425169), -INT32_C( 1412438709),
INT32_C( 1685087762), -INT32_C( 935605833), -INT32_C( 1784851932), -INT32_C( 299870403), -INT32_C( 46262668), INT32_C( 153501688), INT32_C( 761751778), INT32_C( 1608005453) },
INT32_C( 1),
{ -INT32_C( 682012334), -INT32_C( 980013729), -INT32_C( 980013729), -INT32_C( 980013729), INT32_C( 687989128), INT32_C( 1358306736), INT32_C( 1358306736), INT32_C( 1358306736),
-INT32_C( 935605833), INT32_C( 1685087762), INT32_C( 1685087762), INT32_C( 1685087762), INT32_C( 153501688), -INT32_C( 46262668), -INT32_C( 46262668), -INT32_C( 46262668) } },
{ { INT32_C( 290767688), INT32_C( 1345658366), INT32_C( 311347898), INT32_C( 25591018), -INT32_C( 84311110), INT32_C( 299631273), -INT32_C( 1604449943), INT32_C( 708689378),
INT32_C( 2117898880), INT32_C( 1775202735), INT32_C( 645619004), -INT32_C( 1826159911), INT32_C( 797778053), -INT32_C( 1941935838), INT32_C( 1428987763), -INT32_C( 578852260) },
INT32_C( 0),
{ INT32_C( 290767688), INT32_C( 290767688), INT32_C( 290767688), INT32_C( 290767688), -INT32_C( 84311110), -INT32_C( 84311110), -INT32_C( 84311110), -INT32_C( 84311110),
INT32_C( 2117898880), INT32_C( 2117898880), INT32_C( 2117898880), INT32_C( 2117898880), INT32_C( 797778053), INT32_C( 797778053), INT32_C( 797778053), INT32_C( 797778053) } },
};
for (size_t i = 0 ; i < (sizeof(test_vec) / sizeof(test_vec[0])); i++) {
simde__m512i r, a = simde_mm512_loadu_epi32(test_vec[i].a);
SIMDE_CONSTIFY_4_(simde_mm512_shuffle_epi32, r, (HEDLEY_UNREACHABLE(), a), test_vec[i].imm8, a);
simde_test_x86_assert_equal_i32x16(r, simde_mm512_loadu_epi32(test_vec[i].r));
}
return 0;
#else
fputc('\n', stdout);
for (int i = 0; i < 8; i++) {
simde__m512i r, a = simde_test_x86_random_i32x16();
int32_t imm8 = simde_test_codegen_random_i8() & 3;
SIMDE_CONSTIFY_4_(simde_mm512_shuffle_epi32, r, (HEDLEY_UNREACHABLE(), a), imm8, a);
simde_test_x86_write_i32x16(2, a, SIMDE_TEST_VEC_POS_FIRST);
simde_test_codegen_write_i32(2, imm8, SIMDE_TEST_VEC_POS_MIDDLE);
simde_test_x86_write_i32x16(2, r, SIMDE_TEST_VEC_POS_LAST);
}
return 1;
#endif
}
static int
test_simde_mm512_mask_shuffle_epi8(SIMDE_MUNIT_TEST_ARGS) {
const struct {
simde__m512i src;
simde__mmask64 k;
simde__m512i a;
simde__m512i b;
simde__m512i r;
} test_vec[8] = {
{ simde_mm512_set_epi8(INT8_C( 92), INT8_C( 116), INT8_C( -78), INT8_C( -19),
INT8_C( -73), INT8_C( 22), INT8_C( -66), INT8_C( -29),
INT8_C( 55), INT8_C( 78), INT8_C( -45), INT8_C(-119),
INT8_C( 30), INT8_C( -29), INT8_C( -23), INT8_C( 89),
INT8_C( 15), INT8_C( 119), INT8_C( -88), INT8_C( 109),
INT8_C( -16), INT8_C( -10), INT8_C( 0), INT8_C( -18),
INT8_C( 1), INT8_C( 116), INT8_C( 62), INT8_C( -73),
INT8_C(-122), INT8_C( 0), INT8_C( 111), INT8_C( 95),
INT8_C( -20), INT8_C( 3), INT8_C( 122), INT8_C(-121),
INT8_C( 13), INT8_C( 25), INT8_C( -35), INT8_C(-127),
INT8_C( 82), INT8_C( 90), INT8_C( 53), INT8_C( 123),
INT8_C( 73), INT8_C( 108), INT8_C( -18), INT8_C( 15),
INT8_C( 81), INT8_C( -27), INT8_C( 102), INT8_C( 118),
INT8_C( 39), INT8_C( -77), INT8_C( 45), INT8_C( 81),
INT8_C( -17), INT8_C( -28), INT8_C( 67), INT8_C(-118),
INT8_C( 79), INT8_C(-113), INT8_C(-122), INT8_C( 124)),
UINT64_C(10224647434006242820),
simde_mm512_set_epi8(INT8_C( 68), INT8_C(-108), INT8_C(-121), INT8_C(-115),
INT8_C( -59), INT8_C( -78), INT8_C(-111), INT8_C( 56),
INT8_C( 9), INT8_C(-121), INT8_C( 120), INT8_C( -36),
INT8_C( 36), INT8_C(-103), INT8_C(-104), INT8_C( 25),
INT8_C(-111), INT8_C( -63), INT8_C( -35), INT8_C(-120),
INT8_C( 28), INT8_C( -44), INT8_C( -26), INT8_C( -86),
INT8_C( -13), INT8_C( 53), INT8_C( -88), INT8_C(-107),
INT8_C( 68), INT8_C( 42), INT8_C(-118), INT8_C( 111),
INT8_C( 54), INT8_C( -58), INT8_C( -13), INT8_C( 27),
INT8_C( 23), INT8_C( 41), INT8_C(-119), INT8_C( 44),
INT8_C( 7), INT8_C(-120), INT8_C( 32), INT8_C( -43),
INT8_C( 114), INT8_C( -72), INT8_C( 73), INT8_C( -96),
INT8_C( 96), INT8_C( 110), INT8_C( -81), INT8_C( -76),
INT8_C( 103), INT8_C(-100), INT8_C( -22), INT8_C( 18),
INT8_C( 115), INT8_C( 54), INT8_C( -40), INT8_C( 125),
INT8_C( 110), INT8_C( 31), INT8_C( 51), INT8_C(-104)),
simde_mm512_set_epi8(INT8_C( -14), INT8_C( 85), INT8_C( -80), INT8_C( 80),
INT8_C( 48), INT8_C( 93), INT8_C( 79), INT8_C( 127),
INT8_C( 16), INT8_C( 41), INT8_C( 54), INT8_C(-116),
INT8_C( 17), INT8_C( 42), INT8_C( -86), INT8_C( 38),
INT8_C(-118), INT8_C( -56), INT8_C( 60), INT8_C( 19),
INT8_C(-100), INT8_C(-107), INT8_C( 105), INT8_C( -76),
INT8_C( 10), INT8_C( -9), INT8_C( -12), INT8_C( -56),
INT8_C( -71), INT8_C( 96), INT8_C( 6), INT8_C( 24),
INT8_C( 69), INT8_C( 73), INT8_C( -27), INT8_C( 3),
INT8_C( -95), INT8_C( 50), INT8_C( -67), INT8_C( -39),
INT8_C( 97), INT8_C( 62), INT8_C( 101), INT8_C( 56),
INT8_C( -79), INT8_C( 83), INT8_C( -99), INT8_C( -56),
INT8_C( -17), INT8_C( -56), INT8_C( -8), INT8_C( -16),
INT8_C( 84), INT8_C( -95), INT8_C( -73), INT8_C( 54),
INT8_C( 125), INT8_C( 85), INT8_C( 78), INT8_C( -65),
INT8_C( 4), INT8_C( 113), INT8_C( -16), INT8_C( -53)),
simde_mm512_set_epi8(INT8_C( 0), INT8_C( 116), INT8_C( -78), INT8_C( -19),
INT8_C( 25), INT8_C(-121), INT8_C( -66), INT8_C( 68),
INT8_C( 25), INT8_C(-111), INT8_C(-121), INT8_C(-119),
INT8_C( 30), INT8_C( -78), INT8_C( -23), INT8_C(-121),
INT8_C( 15), INT8_C( 119), INT8_C(-120), INT8_C( 68),
INT8_C( 0), INT8_C( 0), INT8_C( -26), INT8_C( -18),
INT8_C( -44), INT8_C( 116), INT8_C( 0), INT8_C( -73),
INT8_C( 0), INT8_C( 0), INT8_C( 53), INT8_C( -86),
INT8_C( -20), INT8_C( 3), INT8_C( 0), INT8_C( 114),
INT8_C( 13), INT8_C( 25), INT8_C( -35), INT8_C( 0),
INT8_C( 73), INT8_C( 90), INT8_C( 53), INT8_C( 123),
INT8_C( 0), INT8_C( 114), INT8_C( -18), INT8_C( 0),
INT8_C( 81), INT8_C( -27), INT8_C( 0), INT8_C( 118),
INT8_C( 39), INT8_C( 0), INT8_C( 0), INT8_C( 81),
INT8_C( -17), INT8_C( -28), INT8_C( 67), INT8_C(-118),
INT8_C( 79), INT8_C( 51), INT8_C(-122), INT8_C( 124)) },
{ simde_mm512_set_epi8(INT8_C(-123), INT8_C(-100), INT8_C( -39), INT8_C( -44),
INT8_C( 22), INT8_C( 112), INT8_C( 16), INT8_C( 15),
INT8_C(-104), INT8_C(-102), INT8_C( 102), INT8_C( -95),
INT8_C( 69), INT8_C( 13), INT8_C( -21), INT8_C( 45),
INT8_C( 62), INT8_C(-120), INT8_C(-111), INT8_C( 32),
INT8_C(-107), INT8_C( -30), INT8_C( 99), INT8_C( -64),
INT8_C( 8), INT8_C( -42), INT8_C( 81), INT8_C( -34),
INT8_C( -46), INT8_C( 26), INT8_C( 31), INT8_C( -2),
INT8_C( 68), INT8_C( -7), INT8_C( -71), INT8_C( 46),
INT8_C( -21), INT8_C( -73), INT8_C( 21), INT8_C( 83),
INT8_C(-108), INT8_C( -97), INT8_C( -69), INT8_C( 73),
INT8_C( 57), INT8_C( -37), INT8_C( 21), INT8_C( 82),
INT8_C(-119), INT8_C(-126), INT8_C( 126), INT8_C( 91),
INT8_C( 115), INT8_C( 31), INT8_C( -79), INT8_C( 28),
INT8_C(-106), INT8_C( -18), INT8_C( 65), INT8_C(-104),
INT8_C( 81), INT8_C( 38), INT8_C( -84), INT8_C( -2)),
UINT64_C( 4597426592773770833),
simde_mm512_set_epi8(INT8_C( 74), INT8_C( 72), INT8_C( -4), INT8_C( 28),
INT8_C(-115), INT8_C( 93), INT8_C( 102), INT8_C( 44),
INT8_C(-103), INT8_C( -29), INT8_C( -50), INT8_C( 48),
INT8_C( -96), INT8_C( -50), INT8_C( 46), INT8_C( -65),
INT8_C( 4), INT8_C( 43), INT8_C( -75), INT8_C( 97),
INT8_C( -26), INT8_C(-103), INT8_C( 71), INT8_C(-107),
INT8_C( 91), INT8_C( 45), INT8_C( -11), INT8_C( 47),
INT8_C( 29), INT8_C( 25), INT8_C( 26), INT8_C( -9),
INT8_C( 10), INT8_C( 36), INT8_C( -79), INT8_C( -53),
INT8_C( 41), INT8_C( 1), INT8_C( -23), INT8_C( -63),
INT8_C(-127), INT8_C( 68), INT8_C( 48), INT8_C( 36),
INT8_C( 89), INT8_C(-112), INT8_C( -31), INT8_C( 120),
INT8_C( 35), INT8_C( 62), INT8_C( -21), INT8_C(-114),
INT8_C(-104), INT8_C( 57), INT8_C( 42), INT8_C(-111),
INT8_C( 94), INT8_C( -63), INT8_C( -9), INT8_C( 64),
INT8_C( -65), INT8_C( -2), INT8_C( 110), INT8_C( -8)),
simde_mm512_set_epi8(INT8_C( 44), INT8_C( -92), INT8_C( -31), INT8_C( 26),
INT8_C( -99), INT8_C( -53), INT8_C( 117), INT8_C( 18),
INT8_C( -63), INT8_C( 45), INT8_C( 12), INT8_C( 24),
INT8_C(-108), INT8_C( 18), INT8_C( -60), INT8_C( 28),
INT8_C( 50), INT8_C( -11), INT8_C( -68), INT8_C( -31),
INT8_C( 105), INT8_C(-106), INT8_C( 98), INT8_C( 51),
INT8_C( 58), INT8_C( 103), INT8_C( 111), INT8_C(-127),
INT8_C( 68), INT8_C( -56), INT8_C( 124), INT8_C(-119),
INT8_C( 74), INT8_C( -62), INT8_C(-116), INT8_C( 37),
INT8_C( -12), INT8_C( 114), INT8_C( 0), INT8_C( 61),
INT8_C( 103), INT8_C( -4), INT8_C(-105), INT8_C( -68),
INT8_C( 39), INT8_C(-100), INT8_C( -93), INT8_C( 11),
INT8_C( -80), INT8_C( -19), INT8_C( -22), INT8_C( -39),
INT8_C( 127), INT8_C( -38), INT8_C(-125), INT8_C(-111),
INT8_C( 84), INT8_C( -96), INT8_C( 87), INT8_C( -22),
INT8_C( -5), INT8_C( -3), INT8_C(-127), INT8_C( 41)),
simde_mm512_set_epi8(INT8_C(-123), INT8_C(-100), INT8_C( 0), INT8_C( 93),
INT8_C( 0), INT8_C( 0), INT8_C( -50), INT8_C( -50),
INT8_C( 0), INT8_C( -4), INT8_C( 102), INT8_C( -95),
INT8_C( 0), INT8_C( -50), INT8_C( -21), INT8_C( 28),
INT8_C( 62), INT8_C( 0), INT8_C(-111), INT8_C( 0),
INT8_C(-107), INT8_C( 0), INT8_C( 25), INT8_C( 29),
INT8_C( 8), INT8_C( -42), INT8_C( 4), INT8_C( -34),
INT8_C( -46), INT8_C( 26), INT8_C( 31), INT8_C( -2),
INT8_C( 1), INT8_C( -7), INT8_C( 0), INT8_C( 48),
INT8_C( 0), INT8_C(-112), INT8_C( 120), INT8_C( -79),
INT8_C(-108), INT8_C( -97), INT8_C( 0), INT8_C( 0),
INT8_C( 57), INT8_C( 0), INT8_C( 0), INT8_C( 41),
INT8_C(-119), INT8_C(-126), INT8_C( 126), INT8_C( 91),
INT8_C( 35), INT8_C( 0), INT8_C( 0), INT8_C( 28),
INT8_C(-106), INT8_C( 0), INT8_C( 65), INT8_C( 0),
INT8_C( 81), INT8_C( 38), INT8_C( -84), INT8_C( 42)) },
{ simde_mm512_set_epi8(INT8_C( -30), INT8_C( -37), INT8_C( 51), INT8_C( -36),
INT8_C( 8), INT8_C( 52), INT8_C( 97), INT8_C( 123),
INT8_C( -49), INT8_C(-124), INT8_C( 95), INT8_C( -83),
INT8_C( 70), INT8_C( -50), INT8_C( -61), INT8_C( 25),
INT8_C( -97), INT8_C( 28), INT8_C( -58), INT8_C( 11),
INT8_C( -14), INT8_C( 126), INT8_C( 81), INT8_C( 45),
INT8_C( -23), INT8_C( 120), INT8_C( -83), INT8_C( -16),
INT8_C( 7), INT8_C( 51), INT8_C( -57), INT8_C( -50),
INT8_C( -21), INT8_C( 98), INT8_C( 88), INT8_C( 0),
INT8_C( -66), INT8_C( 3), INT8_C( 124), INT8_C(-113),
INT8_C( 50), INT8_C( 88), INT8_C( -85), INT8_C( -93),
INT8_C( -44), INT8_C( -13), INT8_C( -94), INT8_C( 17),
INT8_C( -2), INT8_C( 79), INT8_C(-116), INT8_C( 43),
INT8_C( -77), INT8_C(-125), INT8_C( -23), INT8_C(-120),
INT8_C( 96), INT8_C( -64), INT8_C( -23), INT8_C( -46),
INT8_C( -29), INT8_C( -71), INT8_C( 71), INT8_C( 90)),
UINT64_C(12627002542648829104),
simde_mm512_set_epi8(INT8_C( 56), INT8_C( -45), INT8_C(-108), INT8_C( -19),
INT8_C(-124), INT8_C( -27), INT8_C( 22), INT8_C( 126),
INT8_C(-106), INT8_C( -68), INT8_C( -60), INT8_C( 8),
INT8_C( 60), INT8_C( 93), INT8_C( -33), INT8_C( -27),
INT8_C( -7), INT8_C( 27), INT8_C(-122), INT8_C( -38),
INT8_C( 23), INT8_C( 6), INT8_C( 45), INT8_C( -21),
INT8_C( -23), INT8_C(-101), INT8_C( 116), INT8_C( 127),
INT8_C( 96), INT8_C( 40), INT8_C( -97), INT8_C( 40),
INT8_C( 86), INT8_C( -44), INT8_C( 70), INT8_C( -71),
INT8_C( 62), INT8_C( -21), INT8_C( 66), INT8_C( 68),
INT8_C( -87), INT8_C( -61), INT8_C( 48), INT8_C( -70),
INT8_C( 18), INT8_C( -78), INT8_C( -98), INT8_C( 117),
INT8_C( 74), INT8_C( 32), INT8_C( 93), INT8_C( 125),
INT8_C( -47), INT8_C( -60), INT8_C( -86), INT8_C( 117),
INT8_C( 122), INT8_C( -54), INT8_C( 50), INT8_C( 123),
INT8_C( -31), INT8_C( -74), INT8_C( -64), INT8_C( 54)),
simde_mm512_set_epi8(INT8_C( 115), INT8_C( 51), INT8_C( -91), INT8_C( 56),
INT8_C( 64), INT8_C( -39), INT8_C(-119), INT8_C( -28),
INT8_C( -54), INT8_C( 28), INT8_C( 54), INT8_C( -8),
INT8_C( -54), INT8_C(-128), INT8_C( -28), INT8_C( -71),
INT8_C( 107), INT8_C( -66), INT8_C(-114), INT8_C( -88),
INT8_C( 34), INT8_C( -83), INT8_C( -21), INT8_C( -64),
INT8_C( 121), INT8_C( -20), INT8_C( -89), INT8_C( -94),
INT8_C( 112), INT8_C( -27), INT8_C( 81), INT8_C( -54),
INT8_C( -64), INT8_C(-114), INT8_C( 48), INT8_C( -89),
INT8_C( -61), INT8_C( 26), INT8_C( 43), INT8_C( 29),
INT8_C( 0), INT8_C( 64), INT8_C( 123), INT8_C( -67),
INT8_C( 15), INT8_C( 120), INT8_C( 36), INT8_C( 40),
INT8_C( 106), INT8_C(-118), INT8_C(-108), INT8_C( -58),
INT8_C( 26), INT8_C(-111), INT8_C( 63), INT8_C( -98),
INT8_C( -13), INT8_C( -12), INT8_C(-124), INT8_C( 96),
INT8_C( -13), INT8_C( -98), INT8_C( 99), INT8_C( -13)),
simde_mm512_set_epi8(INT8_C( 60), INT8_C( -37), INT8_C( 0), INT8_C( -36),
INT8_C( -27), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( -49), INT8_C(-124), INT8_C( -68), INT8_C( 0),
INT8_C( 0), INT8_C( 0), INT8_C( -61), INT8_C( 25),
INT8_C( -97), INT8_C( 28), INT8_C( -58), INT8_C( 0),
INT8_C( 40), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 45), INT8_C( 0), INT8_C( 0), INT8_C( -16),
INT8_C( 40), INT8_C( 51), INT8_C( -57), INT8_C( 0),
INT8_C( -21), INT8_C( 0), INT8_C( 117), INT8_C( 0),
INT8_C( 0), INT8_C( -21), INT8_C( 124), INT8_C(-113),
INT8_C( 117), INT8_C( 88), INT8_C( -85), INT8_C( -93),
INT8_C( 86), INT8_C( -13), INT8_C( -94), INT8_C( 68),
INT8_C( -60), INT8_C( 79), INT8_C( 0), INT8_C( 43),
INT8_C( -77), INT8_C( 0), INT8_C( -23), INT8_C(-120),
INT8_C( 0), INT8_C( -64), INT8_C( 0), INT8_C( 54),
INT8_C( -29), INT8_C( -71), INT8_C( 71), INT8_C( 90)) },
{ simde_mm512_set_epi8(INT8_C( 72), INT8_C( 45), INT8_C( 120), INT8_C( -5),
INT8_C(-109), INT8_C( 62), INT8_C( 17), INT8_C( 31),
INT8_C( -30), INT8_C( -58), INT8_C( 56), INT8_C( 21),
INT8_C( 72), INT8_C( -74), INT8_C( -40), INT8_C( 120),
INT8_C( 95), INT8_C( 108), INT8_C( 32), INT8_C( 64),
INT8_C(-128), INT8_C( 102), INT8_C( -21), INT8_C( 28),
INT8_C( 105), INT8_C( 52), INT8_C( 85), INT8_C(-104),
INT8_C( 57), INT8_C( -31), INT8_C( -38), INT8_C(-124),
INT8_C(-107), INT8_C( -2), INT8_C( 55), INT8_C( 46),
INT8_C( -71), INT8_C( 77), INT8_C( 18), INT8_C( 70),
INT8_C( 89), INT8_C( 125), INT8_C( -42), INT8_C(-125),
INT8_C( 121), INT8_C( -11), INT8_C( -69), INT8_C( -59),
INT8_C( -53), INT8_C( 34), INT8_C( 9), INT8_C( 64),
INT8_C( -61), INT8_C( -25), INT8_C(-115), INT8_C( 100),
INT8_C( 65), INT8_C( 8), INT8_C( 69), INT8_C( -8),
INT8_C( -15), INT8_C( -51), INT8_C( 1), INT8_C( 90)),
UINT64_C(14515151237088493607),
simde_mm512_set_epi8(INT8_C( -26), INT8_C( -9), INT8_C( 66), INT8_C( 1),
INT8_C( -13), INT8_C( 60), INT8_C(-119), INT8_C( -83),
INT8_C(-122), INT8_C( -64), INT8_C( -83), INT8_C( -74),
INT8_C( 119), INT8_C( -8), INT8_C( 12), INT8_C( 113),
INT8_C( -12), INT8_C( -84), INT8_C( 6), INT8_C( 69),
INT8_C( 2), INT8_C( -75), INT8_C( -34), INT8_C(-126),
INT8_C( 3), INT8_C(-128), INT8_C( -9), INT8_C( 24),
INT8_C( 11), INT8_C( -94), INT8_C( -32), INT8_C( 110),
INT8_C( 33), INT8_C( -24), INT8_C( 125), INT8_C( 35),
INT8_C(-103), INT8_C( -48), INT8_C( -22), INT8_C( 38),
INT8_C( -81), INT8_C( 9), INT8_C( -11), INT8_C(-124),
INT8_C( 71), INT8_C( 31), INT8_C( -42), INT8_C( 93),
INT8_C( 67), INT8_C( 45), INT8_C( 51), INT8_C( -92),
INT8_C( 126), INT8_C( 108), INT8_C(-123), INT8_C( -71),
INT8_C( 113), INT8_C( 32), INT8_C( 71), INT8_C( 55),
INT8_C( -26), INT8_C( 82), INT8_C( -81), INT8_C( -20)),
simde_mm512_set_epi8(INT8_C(-125), INT8_C( 121), INT8_C(-128), INT8_C( 103),
INT8_C( 0), INT8_C( 101), INT8_C( -41), INT8_C( 89),
INT8_C( -83), INT8_C( -65), INT8_C( 9), INT8_C( -7),
INT8_C( -63), INT8_C( 13), INT8_C( 105), INT8_C( 92),
INT8_C( -18), INT8_C( -21), INT8_C(-102), INT8_C(-114),
INT8_C( 74), INT8_C( 121), INT8_C( -45), INT8_C( 52),
INT8_C( -63), INT8_C( -93), INT8_C( 98), INT8_C( 106),
INT8_C(-109), INT8_C( -47), INT8_C( 37), INT8_C( 70),
INT8_C( 100), INT8_C( 121), INT8_C( 18), INT8_C( 28),
INT8_C(-117), INT8_C( 107), INT8_C( 3), INT8_C( -62),
INT8_C( 42), INT8_C( 72), INT8_C( 91), INT8_C( 86),
INT8_C( -72), INT8_C( 9), INT8_C( -80), INT8_C( 118),
INT8_C( 122), INT8_C(-108), INT8_C( -70), INT8_C( -63),
INT8_C( 56), INT8_C( 71), INT8_C( -14), INT8_C( 49),
INT8_C( -73), INT8_C( 53), INT8_C( -29), INT8_C( 3),
INT8_C( -73), INT8_C( 43), INT8_C( -22), INT8_C( 85)),
simde_mm512_set_epi8(INT8_C( 0), INT8_C(-119), INT8_C( 120), INT8_C( -5),
INT8_C( 113), INT8_C( 62), INT8_C( 17), INT8_C(-119),
INT8_C( -30), INT8_C( 0), INT8_C(-119), INT8_C( 0),
INT8_C( 72), INT8_C( -74), INT8_C( -40), INT8_C( 120),
INT8_C( 95), INT8_C( 108), INT8_C( 0), INT8_C( 64),
INT8_C( -75), INT8_C( -34), INT8_C( -21), INT8_C( 24),
INT8_C( 105), INT8_C( 52), INT8_C( -94), INT8_C(-104),
INT8_C( 57), INT8_C( 0), INT8_C( -38), INT8_C(-128),
INT8_C(-107), INT8_C( -22), INT8_C( 55), INT8_C( 46),
INT8_C( -71), INT8_C( 77), INT8_C( 71), INT8_C( 0),
INT8_C( -48), INT8_C( 125), INT8_C(-103), INT8_C( 9),
INT8_C( 0), INT8_C( -11), INT8_C( 0), INT8_C( 9),
INT8_C( -53), INT8_C( 0), INT8_C( 9), INT8_C( 64),
INT8_C( -61), INT8_C( -25), INT8_C(-115), INT8_C( 100),
INT8_C( 65), INT8_C( 8), INT8_C( 0), INT8_C( -8),
INT8_C( -15), INT8_C( 126), INT8_C( 0), INT8_C( 71)) },
{ simde_mm512_set_epi8(INT8_C( -47), INT8_C( 84), INT8_C(-126), INT8_C( -64),
INT8_C( 14), INT8_C( 11), INT8_C( 37), INT8_C( -23),
INT8_C( 67), INT8_C( 124), INT8_C( 58), INT8_C( -94),
INT8_C( 30), INT8_C( -33), INT8_C( 70), INT8_C( -24),
INT8_C( 38), INT8_C( -97), INT8_C( -56), INT8_C( -60),
INT8_C( -59), INT8_C( 65), INT8_C( -74), INT8_C( 45),
INT8_C( -11), INT8_C( 55), INT8_C( -82), INT8_C( 12),
INT8_C( 106), INT8_C( 22), INT8_C(-124), INT8_C( -4),
INT8_C( 2), INT8_C( -81), INT8_C( 14), INT8_C( 90),
INT8_C(-100), INT8_C(-122), INT8_C( -35), INT8_C( 81),
INT8_C( -14), INT8_C( -42), INT8_C( 125), INT8_C(-125),
INT8_C( -57), INT8_C( 90), INT8_C( -9), INT8_C( 63),
INT8_C( 53), INT8_C( 77), INT8_C( 63), INT8_C( -84),
INT8_C( 27), INT8_C( 22), INT8_C( 3), INT8_C( -37),
INT8_C( 65), INT8_C( 118), INT8_C(-126), INT8_C( 97),
INT8_C( 109), INT8_C( 7), INT8_C(-114), INT8_C( -75)),
UINT64_C( 8707623543556880126),
simde_mm512_set_epi8(INT8_C( 84), INT8_C( -71), INT8_C( 8), INT8_C( 12),
INT8_C( -11), INT8_C( -76), INT8_C( 62), INT8_C( 93),
INT8_C( -75), INT8_C( -77), INT8_C( -84), INT8_C(-108),
INT8_C( -35), INT8_C( 14), INT8_C( -60), INT8_C( 18),
INT8_C( 23), INT8_C( -60), INT8_C( -63), INT8_C(-114),
INT8_C( -55), INT8_C( 75), INT8_C( -99), INT8_C( -55),
INT8_C( 58), INT8_C( 76), INT8_C(-102), INT8_C(-118),
INT8_C( -30), INT8_C( 39), INT8_C( 119), INT8_C( 85),
INT8_C( -8), INT8_C( -72), INT8_C( -60), INT8_C( -94),
INT8_C(-112), INT8_C( 119), INT8_C( 124), INT8_C( 76),
INT8_C( -42), INT8_C(-124), INT8_C( 54), INT8_C( 74),
INT8_C( -92), INT8_C( 99), INT8_C( 79), INT8_C( -3),
INT8_C( 61), INT8_C( -89), INT8_C( 84), INT8_C( -94),
INT8_C( 31), INT8_C(-116), INT8_C( -67), INT8_C(-102),
INT8_C( -72), INT8_C( -91), INT8_C(-105), INT8_C(-108),
INT8_C( -44), INT8_C( 74), INT8_C( -28), INT8_C( 124)),
simde_mm512_set_epi8(INT8_C( 1), INT8_C( 75), INT8_C( 21), INT8_C( -36),
INT8_C(-126), INT8_C( 122), INT8_C( 71), INT8_C( 76),
INT8_C( 28), INT8_C( -56), INT8_C( 32), INT8_C( 101),
INT8_C(-107), INT8_C(-111), INT8_C( -88), INT8_C( -19),
INT8_C( -77), INT8_C( 19), INT8_C( -21), INT8_C(-111),
INT8_C( -68), INT8_C( 82), INT8_C(-118), INT8_C( -76),
INT8_C( 47), INT8_C( 127), INT8_C( 62), INT8_C( -16),
INT8_C( 10), INT8_C( -14), INT8_C(-100), INT8_C( 86),
INT8_C( 29), INT8_C( 107), INT8_C( 56), INT8_C( 21),
INT8_C( 24), INT8_C( 68), INT8_C( -96), INT8_C( 64),
INT8_C( 48), INT8_C( 13), INT8_C( -83), INT8_C( 4),
INT8_C( -3), INT8_C( -64), INT8_C( 17), INT8_C(-115),
INT8_C( 21), INT8_C( 108), INT8_C( 125), INT8_C( -60),
INT8_C( -72), INT8_C( 74), INT8_C( -5), INT8_C( -58),
INT8_C( -41), INT8_C( 22), INT8_C(-115), INT8_C( 102),
INT8_C( 59), INT8_C( -80), INT8_C( -15), INT8_C( -63)),
simde_mm512_set_epi8(INT8_C( -47), INT8_C( -11), INT8_C( -84), INT8_C( 0),
INT8_C( 0), INT8_C( 11), INT8_C( 37), INT8_C( -23),
INT8_C( 12), INT8_C( 0), INT8_C( 58), INT8_C( -84),
INT8_C( 30), INT8_C( 0), INT8_C( 0), INT8_C( 0),
INT8_C( 0), INT8_C( -97), INT8_C( 0), INT8_C( 0),
INT8_C( -59), INT8_C( 65), INT8_C( -74), INT8_C( 0),
INT8_C( -11), INT8_C( 23), INT8_C( -60), INT8_C( 0),
INT8_C( 75), INT8_C( 22), INT8_C( 0), INT8_C( -4),
INT8_C( 2), INT8_C(-112), INT8_C( 14), INT8_C( 54),
INT8_C(-100), INT8_C( 74), INT8_C( 0), INT8_C( -3),
INT8_C( -3), INT8_C( -42), INT8_C( 125), INT8_C(-125),
INT8_C( 0), INT8_C( 90), INT8_C( -9), INT8_C( 0),
INT8_C( 53), INT8_C( 77), INT8_C( 84), INT8_C( 0),
INT8_C( 27), INT8_C(-116), INT8_C( 0), INT8_C( -37),
INT8_C( 0), INT8_C( -91), INT8_C( 0), INT8_C( -91),
INT8_C( 31), INT8_C( 0), INT8_C( 0), INT8_C( -75)) },
{ simde_mm512_set_epi8(INT8_C( -64), INT8_C( -53), INT8_C( -42), INT8_C( 126),
INT8_C( 67), INT8_C( 50), INT8_C( -18), INT8_C( 76),
INT8_C( -19), INT8_C( 123), INT8_C( -87), INT8_C( 106),
INT8_C( -74), INT8_C( 44), INT8_C( 117), INT8_C( 103),
INT8_C( 81), INT8_C( 122), INT8_C( 56), INT8_C( -10),
INT8_C( 67), INT8_C( 79), INT8_C( 83), INT8_C( -38),
INT8_C( -13), INT8_C( 43), INT8_C( 27), INT8_C( -97),
INT8_C( 102), INT8_C( 126), INT8_C( 38), INT8_C( -62),
INT8_C( -24), INT8_C( 117), INT8_C( -38), INT8_C( -93),
INT8_C( -58), INT8_C(-124), INT8_C( -75), INT8_C( 10),
INT8_C( 18), INT8_C( -74), INT8_C( 14), INT8_C( 36),
INT8_C( -7), INT8_C( 113), INT8_C( 40), INT8_C( 48),
INT8_C(-107), INT8_C( -34), INT8_C( -75), INT8_C( 85),
INT8_C( -35), INT8_C(-116), INT8_C( 65), INT8_C( -21),
INT8_C( 15), INT8_C( 3), INT8_C( 45), INT8_C( 21),
INT8_C( 72), INT8_C( 93), INT8_C( 108), INT8_C( 125)),
UINT64_C(12576710173448868104),
simde_mm512_set_epi8(INT8_C( 90), INT8_C( -38), INT8_C( -98), INT8_C( -70),
INT8_C(-108), INT8_C( 20), INT8_C( 43), INT8_C(-128),
INT8_C( 77), INT8_C( 108), INT8_C( 53), INT8_C( 82),
INT8_C( -50), INT8_C( 52), INT8_C( 56), INT8_C( 58),
INT8_C(-120), INT8_C( -43), INT8_C( 114), INT8_C( 93),
INT8_C( -44), INT8_C( -15), INT8_C( 38), INT8_C( -17),
INT8_C(-110), INT8_C(-123), INT8_C( -39), INT8_C( 114),
INT8_C( 51), INT8_C(-115), INT8_C( -74), INT8_C( 43),
INT8_C( 41), INT8_C( -36), INT8_C( 19), INT8_C( 69),
INT8_C( 60), INT8_C( -53), INT8_C( 112), INT8_C( 108),
INT8_C( 8), INT8_C( 46), INT8_C( -35), INT8_C( 26),
INT8_C( 11), INT8_C( 42), INT8_C( 47), INT8_C( 59),
INT8_C( -57), INT8_C( 94), INT8_C(-125), INT8_C(-124),
INT8_C( 36), INT8_C( 57), INT8_C( 68), INT8_C( -52),
INT8_C( 39), INT8_C( 50), INT8_C( -48), INT8_C( 94),
INT8_C( 53), INT8_C( 11), INT8_C( 29), INT8_C( 65)),
simde_mm512_set_epi8(INT8_C(-107), INT8_C( 120), INT8_C( -58), INT8_C( 107),
INT8_C( -32), INT8_C( -32), INT8_C( 88), INT8_C( -43),
INT8_C( 31), INT8_C( -32), INT8_C( -64), INT8_C( 27),
INT8_C( 82), INT8_C( -90), INT8_C( -54), INT8_C( -84),
INT8_C( -30), INT8_C( 63), INT8_C( 24), INT8_C( 81),
INT8_C( -8), INT8_C( 9), INT8_C( -35), INT8_C(-101),
INT8_C( 83), INT8_C( 107), INT8_C( -47), INT8_C( -56),
INT8_C( 57), INT8_C( -88), INT8_C(-115), INT8_C( -20),
INT8_C( 58), INT8_C( 75), INT8_C( 56), INT8_C( 93),
INT8_C( 49), INT8_C( 43), INT8_C( 108), INT8_C( 118),
INT8_C( -79), INT8_C( 112), INT8_C( 44), INT8_C(-112),
INT8_C( -52), INT8_C( 10), INT8_C( 28), INT8_C( -86),
INT8_C( 65), INT8_C( 62), INT8_C( 86), INT8_C(-107),
INT8_C( 24), INT8_C( -55), INT8_C( 54), INT8_C(-110),
INT8_C( -33), INT8_C( 110), INT8_C(-116), INT8_C( -39),
INT8_C( 39), INT8_C(-112), INT8_C( 64), INT8_C( 43)),
simde_mm512_set_epi8(INT8_C( 0), INT8_C( -53), INT8_C( 0), INT8_C( 126),
INT8_C( 0), INT8_C( 0), INT8_C(-128), INT8_C( 76),
INT8_C( 90), INT8_C( 123), INT8_C( -87), INT8_C( 106),
INT8_C( 52), INT8_C( 44), INT8_C( 117), INT8_C( 0),
INT8_C( 81), INT8_C(-120), INT8_C( -17), INT8_C( -74),
INT8_C( 67), INT8_C( 79), INT8_C( 0), INT8_C( 0),
INT8_C( -13), INT8_C( -44), INT8_C( 27), INT8_C( -97),
INT8_C( 102), INT8_C( 0), INT8_C( 38), INT8_C( -62),
INT8_C( -53), INT8_C( 117), INT8_C( 108), INT8_C( 19),
INT8_C( 47), INT8_C(-124), INT8_C( 69), INT8_C( 46),
INT8_C( 18), INT8_C( 59), INT8_C( 69), INT8_C( 0),
INT8_C( -7), INT8_C( -53), INT8_C( 69), INT8_C( 48),
INT8_C(-107), INT8_C( -34), INT8_C( -75), INT8_C( 0),
INT8_C( -35), INT8_C(-116), INT8_C( 65), INT8_C( 0),
INT8_C( 15), INT8_C( 3), INT8_C( 45), INT8_C( 21),
INT8_C( 39), INT8_C( 93), INT8_C( 108), INT8_C( 125)) },
{ simde_mm512_set_epi8(INT8_C(-103), INT8_C(-124), INT8_C( 13), INT8_C( -80),
INT8_C( -32), INT8_C( 123), INT8_C( 115), INT8_C( -49),
INT8_C( 113), INT8_C( -51), INT8_C( 119), INT8_C( -67),
INT8_C( -21), INT8_C( 19), INT8_C( -12), INT8_C( 29),
INT8_C( 91), INT8_C( -64), INT8_C( 88), INT8_C(-105),
INT8_C( 24), INT8_C( 31), INT8_C( 77), INT8_C( 92),
INT8_C( -85), INT8_C( 48), INT8_C(-113), INT8_C(-114),
INT8_C( 16), INT8_C( 18), INT8_C( -44), INT8_C( -66),
INT8_C( 25), INT8_C(-105), INT8_C(-100), INT8_C( -91),
INT8_C( 26), INT8_C(-123), INT8_C( -33), INT8_C( -37),
INT8_C( 63), INT8_C( 13), INT8_C(-124), INT8_C( 41),
INT8_C(-104), INT8_C( -59), INT8_C( -2), INT8_C( -54),
INT8_C( 73), INT8_C( 3), INT8_C( -18), INT8_C( 10),
INT8_C( 19), INT8_C( 58), INT8_C( -12), INT8_C( -75),
INT8_C( -88), INT8_C( 59), INT8_C( 104), INT8_C( -40),
INT8_C( -82), INT8_C( 42), INT8_C( -73), INT8_C( -94)),
UINT64_C( 2633789449456316803),
simde_mm512_set_epi8(INT8_C( 118), INT8_C( 44), INT8_C( -14), INT8_C( 84),
INT8_C( -69), INT8_C( -48), INT8_C( 40), INT8_C( 86),
INT8_C( -1), INT8_C( 121), INT8_C( -40), INT8_C( 44),
INT8_C( -1), INT8_C( 38), INT8_C( -44), INT8_C( 38),
INT8_C( 93), INT8_C(-107), INT8_C( -4), INT8_C( -61),
INT8_C( -52), INT8_C( 22), INT8_C( -54), INT8_C(-125),
INT8_C( -29), INT8_C( 25), INT8_C( -77), INT8_C( -68),
INT8_C( 9), INT8_C( -35), INT8_C( -11), INT8_C( 53),
INT8_C( 28), INT8_C( 61), INT8_C( -35), INT8_C(-106),
INT8_C( -46), INT8_C( 121), INT8_C(-102), INT8_C( 121),
INT8_C( -54), INT8_C( -60), INT8_C( 7), INT8_C( 2),
INT8_C(-119), INT8_C( 111), INT8_C( -20), INT8_C( -58),
INT8_C( -98), INT8_C( 83), INT8_C( 32), INT8_C( -49),
INT8_C( -11), INT8_C( 48), INT8_C( 92), INT8_C( 47),
INT8_C( -38), INT8_C( 11), INT8_C( 26), INT8_C( 90),
INT8_C( -5), INT8_C( 73), INT8_C( 45), INT8_C( -2)),
simde_mm512_set_epi8(INT8_C( -31), INT8_C( 126), INT8_C(-118), INT8_C( -57),
INT8_C(-126), INT8_C( 29), INT8_C( 101), INT8_C( -15),
INT8_C( -61), INT8_C( 118), INT8_C( 102), INT8_C( 12),
INT8_C( -59), INT8_C( -41), INT8_C( -60), INT8_C( 46),
INT8_C( 63), INT8_C( 78), INT8_C( 87), INT8_C( 18),
INT8_C( 18), INT8_C( 32), INT8_C( -26), INT8_C( -6),
INT8_C( -20), INT8_C(-123), INT8_C( 99), INT8_C( 65),
INT8_C( 13), INT8_C( 25), INT8_C( 108), INT8_C(-121),
INT8_C( 42), INT8_C( 0), INT8_C( 104), INT8_C( -17),
INT8_C( 111), INT8_C(-110), INT8_C( -39), INT8_C( 125),
INT8_C( -50), INT8_C( -47), INT8_C( 30), INT8_C( 92),
INT8_C( 19), INT8_C( -8), INT8_C(-120), INT8_C( 127),
INT8_C( -49), INT8_C( 23), INT8_C( 16), INT8_C( -64),
INT8_C( -79), INT8_C( 116), INT8_C( -5), INT8_C( -50),
INT8_C( 32), INT8_C( 22), INT8_C( -42), INT8_C( -3),
INT8_C( 30), INT8_C( 64), INT8_C( 96), INT8_C( -66)),
simde_mm512_set_epi8(INT8_C(-103), INT8_C(-124), INT8_C( 0), INT8_C( -80),
INT8_C( -32), INT8_C( -14), INT8_C( 115), INT8_C( -49),
INT8_C( 0), INT8_C( -51), INT8_C( 119), INT8_C( -67),
INT8_C( 0), INT8_C( 0), INT8_C( -12), INT8_C( 44),
INT8_C( 91), INT8_C( -64), INT8_C( 88), INT8_C( -35),
INT8_C( -35), INT8_C( 31), INT8_C( 77), INT8_C( 0),
INT8_C( 0), INT8_C( 48), INT8_C(-113), INT8_C(-114),
INT8_C( -4), INT8_C( -54), INT8_C( -44), INT8_C( -66),
INT8_C( 121), INT8_C( -58), INT8_C(-100), INT8_C( -91),
INT8_C( 26), INT8_C( 0), INT8_C( -33), INT8_C( -37),
INT8_C( 63), INT8_C( 13), INT8_C(-124), INT8_C( 41),
INT8_C(-104), INT8_C( -59), INT8_C( 0), INT8_C( 28),
INT8_C( 0), INT8_C( -38), INT8_C( -2), INT8_C( 0),
INT8_C( 19), INT8_C( 58), INT8_C( -12), INT8_C( 0),
INT8_C( -2), INT8_C( 59), INT8_C( 104), INT8_C( -40),
INT8_C( -82), INT8_C( 42), INT8_C( -2), INT8_C( 0)) },
{ simde_mm512_set_epi8(INT8_C( 117), INT8_C( 69), INT8_C( 121), INT8_C( -45),
INT8_C( 30), INT8_C( -73), INT8_C( 2), INT8_C( -40),
INT8_C( 95), INT8_C( -3), INT8_C( 16), INT8_C( -78),
INT8_C(-128), INT8_C( -41), INT8_C( -66), INT8_C( 66),
INT8_C( 93), INT8_C( -32), INT8_C( -50), INT8_C( -2),
INT8_C( -61), INT8_C( 29), INT8_C( -88), INT8_C(-118),
INT8_C( -27), INT8_C( 42), INT8_C( 78), INT8_C( -46),
INT8_C( -79), INT8_C( 38), INT8_C( -75), INT8_C( 14),
INT8_C(-118), INT8_C(-114), INT8_C(-120), INT8_C( 42),
INT8_C( 4), INT8_C( 79), INT8_C( -84), INT8_C(-110),
INT8_C( 0), INT8_C( 85), INT8_C( -20), INT8_C( 61),
INT8_C( 40), INT8_C( -75), INT8_C( 69), INT8_C( -99),
INT8_C( 73), INT8_C( -34), INT8_C( -14), INT8_C( 72),
INT8_C( 101), INT8_C( 96), INT8_C(-114), INT8_C(-124),
INT8_C( -87), INT8_C( 43), INT8_C(-118), INT8_C( 114),
INT8_C( -88), INT8_C( 8), INT8_C( -52), INT8_C( 75)),
UINT64_C(14890918166471265655),
simde_mm512_set_epi8(INT8_C( -56), INT8_C( -70), INT8_C( 66), INT8_C(-111),
INT8_C( -69), INT8_C( 15), INT8_C( -82), INT8_C( -12),
INT8_C( -89), INT8_C( 37), INT8_C( 80), INT8_C( 120),
INT8_C( -83), INT8_C(-120), INT8_C( 95), INT8_C( 21),
INT8_C( 91), INT8_C( -97), INT8_C( -72), INT8_C( 42),
INT8_C( 22), INT8_C( -70), INT8_C( 71), INT8_C( -78),
INT8_C( -5), INT8_C( 52), INT8_C( -22), INT8_C( -34),
INT8_C( 16), INT8_C( 92), INT8_C( 91), INT8_C( -72),
INT8_C( 3), INT8_C( -31), INT8_C( -95), INT8_C( -56),
INT8_C( -50), INT8_C( 68), INT8_C( -24), INT8_C( -50),