/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp

Bug Summary

File:	llvm/lib/Target/X86/X86InstrInfo.cpp
Warning:	line 3904, column 19 Value stored to 'NewMI' during its initialization is never read

Annotated Source Code

Press '?' to see keyboard shortcuts

Show analyzer invocation

clang -cc1 -cc1 -triple x86_64-pc-linux-gnu -analyze -disable-free -disable-llvm-verifier -discard-value-names -main-file-name X86InstrInfo.cpp -analyzer-store=region -analyzer-opt-analyze-nested-blocks -analyzer-checker=core -analyzer-checker=apiModeling -analyzer-checker=unix -analyzer-checker=deadcode -analyzer-checker=cplusplus -analyzer-checker=security.insecureAPI.UncheckedReturn -analyzer-checker=security.insecureAPI.getpw -analyzer-checker=security.insecureAPI.gets -analyzer-checker=security.insecureAPI.mktemp -analyzer-checker=security.insecureAPI.mkstemp -analyzer-checker=security.insecureAPI.vfork -analyzer-checker=nullability.NullPassedToNonnull -analyzer-checker=nullability.NullReturnedFromNonnull -analyzer-output plist -w -setup-static-analyzer -analyzer-config-compatibility-mode=true -mrelocation-model pic -pic-level 2 -mframe-pointer=none -fmath-errno -fno-rounding-math -mconstructor-aliases -munwind-tables -target-cpu x86-64 -tune-cpu generic -debugger-tuning=gdb -ffunction-sections -fdata-sections -fcoverage-compilation-dir=/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/build-llvm/lib/Target/X86 -resource-dir /usr/lib/llvm-14/lib/clang/14.0.0 -D _DEBUG -D _GNU_SOURCE -D __STDC_CONSTANT_MACROS -D __STDC_FORMAT_MACROS -D __STDC_LIMIT_MACROS -I /build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/build-llvm/lib/Target/X86 -I /build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86 -I /build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/build-llvm/include -I /build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/include -D NDEBUG -U NDEBUG -internal-isystem /usr/lib/gcc/x86_64-linux-gnu/10/../../../../include/c++/10 -internal-isystem /usr/lib/gcc/x86_64-linux-gnu/10/../../../../include/x86_64-linux-gnu/c++/10 -internal-isystem /usr/lib/gcc/x86_64-linux-gnu/10/../../../../include/c++/10/backward -internal-isystem /usr/lib/llvm-14/lib/clang/14.0.0/include -internal-isystem /usr/local/include -internal-isystem /usr/lib/gcc/x86_64-linux-gnu/10/../../../../x86_64-linux-gnu/include -internal-externc-isystem /usr/include/x86_64-linux-gnu -internal-externc-isystem /include -internal-externc-isystem /usr/include -O2 -Wno-unused-parameter -Wwrite-strings -Wno-missing-field-initializers -Wno-long-long -Wno-maybe-uninitialized -Wno-class-memaccess -Wno-redundant-move -Wno-pessimizing-move -Wno-noexcept-type -Wno-comment -std=c++14 -fdeprecated-macro -fdebug-compilation-dir=/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/build-llvm/lib/Target/X86 -fdebug-prefix-map=/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0=. -ferror-limit 19 -fvisibility hidden -fvisibility-inlines-hidden -stack-protector 2 -fgnuc-version=4.2.1 -vectorize-loops -vectorize-slp -analyzer-output=html -analyzer-config stable-report-filename=true -faddrsig -D__GCC_HAVE_DWARF2_CFI_ASM=1 -o /tmp/scan-build-2021-08-28-193554-24367-1 -x c++ /build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp

1	//===-- X86InstrInfo.cpp - X86 Instruction Information --------------------===//
2	//
3	// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.
4	// See https://llvm.org/LICENSE.txt for license information.
5	// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception
6	//
7	//===----------------------------------------------------------------------===//
8	//
9	// This file contains the X86 implementation of the TargetInstrInfo class.
10	//
11	//===----------------------------------------------------------------------===//
12
13	#include "X86InstrInfo.h"
14	#include "X86.h"
15	#include "X86InstrBuilder.h"
16	#include "X86InstrFoldTables.h"
17	#include "X86MachineFunctionInfo.h"
18	#include "X86Subtarget.h"
19	#include "X86TargetMachine.h"
20	#include "llvm/ADT/STLExtras.h"
21	#include "llvm/ADT/Sequence.h"
22	#include "llvm/CodeGen/LivePhysRegs.h"
23	#include "llvm/CodeGen/LiveVariables.h"
24	#include "llvm/CodeGen/MachineConstantPool.h"
25	#include "llvm/CodeGen/MachineDominators.h"
26	#include "llvm/CodeGen/MachineFrameInfo.h"
27	#include "llvm/CodeGen/MachineInstrBuilder.h"
28	#include "llvm/CodeGen/MachineModuleInfo.h"
29	#include "llvm/CodeGen/MachineRegisterInfo.h"
30	#include "llvm/CodeGen/StackMaps.h"
31	#include "llvm/IR/DebugInfoMetadata.h"
32	#include "llvm/IR/DerivedTypes.h"
33	#include "llvm/IR/Function.h"
34	#include "llvm/MC/MCAsmInfo.h"
35	#include "llvm/MC/MCExpr.h"
36	#include "llvm/MC/MCInst.h"
37	#include "llvm/Support/CommandLine.h"
38	#include "llvm/Support/Debug.h"
39	#include "llvm/Support/ErrorHandling.h"
40	#include "llvm/Support/raw_ostream.h"
41	#include "llvm/Target/TargetOptions.h"
42
43	using namespace llvm;
44
45	#define DEBUG_TYPE"x86-instr-info" "x86-instr-info"
46
47	#define GET_INSTRINFO_CTOR_DTOR
48	#include "X86GenInstrInfo.inc"
49
50	static cl::opt<bool>
51	NoFusing("disable-spill-fusing",
52	cl::desc("Disable fusing of spill code into instructions"),
53	cl::Hidden);
54	static cl::opt<bool>
55	PrintFailedFusing("print-failed-fuse-candidates",
56	cl::desc("Print instructions that the allocator wants to"
57	" fuse, but the X86 backend currently can't"),
58	cl::Hidden);
59	static cl::opt<bool>
60	ReMatPICStubLoad("remat-pic-stub-load",
61	cl::desc("Re-materialize load from stub in PIC mode"),
62	cl::init(false), cl::Hidden);
63	static cl::opt<unsigned>
64	PartialRegUpdateClearance("partial-reg-update-clearance",
65	cl::desc("Clearance between two register writes "
66	"for inserting XOR to avoid partial "
67	"register update"),
68	cl::init(64), cl::Hidden);
69	static cl::opt<unsigned>
70	UndefRegClearance("undef-reg-clearance",
71	cl::desc("How many idle instructions we would like before "
72	"certain undef register reads"),
73	cl::init(128), cl::Hidden);
74
75
76	// Pin the vtable to this file.
77	void X86InstrInfo::anchor() {}
78
79	X86InstrInfo::X86InstrInfo(X86Subtarget &STI)
80	: X86GenInstrInfo((STI.isTarget64BitLP64() ? X86::ADJCALLSTACKDOWN64
81	: X86::ADJCALLSTACKDOWN32),
82	(STI.isTarget64BitLP64() ? X86::ADJCALLSTACKUP64
83	: X86::ADJCALLSTACKUP32),
84	X86::CATCHRET,
85	(STI.is64Bit() ? X86::RETQ : X86::RETL)),
86	Subtarget(STI), RI(STI.getTargetTriple()) {
87	}
88
89	bool
90	X86InstrInfo::isCoalescableExtInstr(const MachineInstr &MI,
91	Register &SrcReg, Register &DstReg,
92	unsigned &SubIdx) const {
93	switch (MI.getOpcode()) {
94	default: break;
95	case X86::MOVSX16rr8:
96	case X86::MOVZX16rr8:
97	case X86::MOVSX32rr8:
98	case X86::MOVZX32rr8:
99	case X86::MOVSX64rr8:
100	if (!Subtarget.is64Bit())
101	// It's not always legal to reference the low 8-bit of the larger
102	// register in 32-bit mode.
103	return false;
104	LLVM_FALLTHROUGH[[gnu::fallthrough]];
105	case X86::MOVSX32rr16:
106	case X86::MOVZX32rr16:
107	case X86::MOVSX64rr16:
108	case X86::MOVSX64rr32: {
109	if (MI.getOperand(0).getSubReg() \|\| MI.getOperand(1).getSubReg())
110	// Be conservative.
111	return false;
112	SrcReg = MI.getOperand(1).getReg();
113	DstReg = MI.getOperand(0).getReg();
114	switch (MI.getOpcode()) {
115	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 115);
116	case X86::MOVSX16rr8:
117	case X86::MOVZX16rr8:
118	case X86::MOVSX32rr8:
119	case X86::MOVZX32rr8:
120	case X86::MOVSX64rr8:
121	SubIdx = X86::sub_8bit;
122	break;
123	case X86::MOVSX32rr16:
124	case X86::MOVZX32rr16:
125	case X86::MOVSX64rr16:
126	SubIdx = X86::sub_16bit;
127	break;
128	case X86::MOVSX64rr32:
129	SubIdx = X86::sub_32bit;
130	break;
131	}
132	return true;
133	}
134	}
135	return false;
136	}
137
138	bool X86InstrInfo::isDataInvariant(MachineInstr &MI) {
139	switch (MI.getOpcode()) {
140	default:
141	// By default, assume that the instruction is not data invariant.
142	return false;
143
144	// Some target-independent operations that trivially lower to data-invariant
145	// instructions.
146	case TargetOpcode::COPY:
147	case TargetOpcode::INSERT_SUBREG:
148	case TargetOpcode::SUBREG_TO_REG:
149	return true;
150
151	// On x86 it is believed that imul is constant time w.r.t. the loaded data.
152	// However, they set flags and are perhaps the most surprisingly constant
153	// time operations so we call them out here separately.
154	case X86::IMUL16rr:
155	case X86::IMUL16rri8:
156	case X86::IMUL16rri:
157	case X86::IMUL32rr:
158	case X86::IMUL32rri8:
159	case X86::IMUL32rri:
160	case X86::IMUL64rr:
161	case X86::IMUL64rri32:
162	case X86::IMUL64rri8:
163
164	// Bit scanning and counting instructions that are somewhat surprisingly
165	// constant time as they scan across bits and do other fairly complex
166	// operations like popcnt, but are believed to be constant time on x86.
167	// However, these set flags.
168	case X86::BSF16rr:
169	case X86::BSF32rr:
170	case X86::BSF64rr:
171	case X86::BSR16rr:
172	case X86::BSR32rr:
173	case X86::BSR64rr:
174	case X86::LZCNT16rr:
175	case X86::LZCNT32rr:
176	case X86::LZCNT64rr:
177	case X86::POPCNT16rr:
178	case X86::POPCNT32rr:
179	case X86::POPCNT64rr:
180	case X86::TZCNT16rr:
181	case X86::TZCNT32rr:
182	case X86::TZCNT64rr:
183
184	// Bit manipulation instructions are effectively combinations of basic
185	// arithmetic ops, and should still execute in constant time. These also
186	// set flags.
187	case X86::BLCFILL32rr:
188	case X86::BLCFILL64rr:
189	case X86::BLCI32rr:
190	case X86::BLCI64rr:
191	case X86::BLCIC32rr:
192	case X86::BLCIC64rr:
193	case X86::BLCMSK32rr:
194	case X86::BLCMSK64rr:
195	case X86::BLCS32rr:
196	case X86::BLCS64rr:
197	case X86::BLSFILL32rr:
198	case X86::BLSFILL64rr:
199	case X86::BLSI32rr:
200	case X86::BLSI64rr:
201	case X86::BLSIC32rr:
202	case X86::BLSIC64rr:
203	case X86::BLSMSK32rr:
204	case X86::BLSMSK64rr:
205	case X86::BLSR32rr:
206	case X86::BLSR64rr:
207	case X86::TZMSK32rr:
208	case X86::TZMSK64rr:
209
210	// Bit extracting and clearing instructions should execute in constant time,
211	// and set flags.
212	case X86::BEXTR32rr:
213	case X86::BEXTR64rr:
214	case X86::BEXTRI32ri:
215	case X86::BEXTRI64ri:
216	case X86::BZHI32rr:
217	case X86::BZHI64rr:
218
219	// Shift and rotate.
220	case X86::ROL8r1:
221	case X86::ROL16r1:
222	case X86::ROL32r1:
223	case X86::ROL64r1:
224	case X86::ROL8rCL:
225	case X86::ROL16rCL:
226	case X86::ROL32rCL:
227	case X86::ROL64rCL:
228	case X86::ROL8ri:
229	case X86::ROL16ri:
230	case X86::ROL32ri:
231	case X86::ROL64ri:
232	case X86::ROR8r1:
233	case X86::ROR16r1:
234	case X86::ROR32r1:
235	case X86::ROR64r1:
236	case X86::ROR8rCL:
237	case X86::ROR16rCL:
238	case X86::ROR32rCL:
239	case X86::ROR64rCL:
240	case X86::ROR8ri:
241	case X86::ROR16ri:
242	case X86::ROR32ri:
243	case X86::ROR64ri:
244	case X86::SAR8r1:
245	case X86::SAR16r1:
246	case X86::SAR32r1:
247	case X86::SAR64r1:
248	case X86::SAR8rCL:
249	case X86::SAR16rCL:
250	case X86::SAR32rCL:
251	case X86::SAR64rCL:
252	case X86::SAR8ri:
253	case X86::SAR16ri:
254	case X86::SAR32ri:
255	case X86::SAR64ri:
256	case X86::SHL8r1:
257	case X86::SHL16r1:
258	case X86::SHL32r1:
259	case X86::SHL64r1:
260	case X86::SHL8rCL:
261	case X86::SHL16rCL:
262	case X86::SHL32rCL:
263	case X86::SHL64rCL:
264	case X86::SHL8ri:
265	case X86::SHL16ri:
266	case X86::SHL32ri:
267	case X86::SHL64ri:
268	case X86::SHR8r1:
269	case X86::SHR16r1:
270	case X86::SHR32r1:
271	case X86::SHR64r1:
272	case X86::SHR8rCL:
273	case X86::SHR16rCL:
274	case X86::SHR32rCL:
275	case X86::SHR64rCL:
276	case X86::SHR8ri:
277	case X86::SHR16ri:
278	case X86::SHR32ri:
279	case X86::SHR64ri:
280	case X86::SHLD16rrCL:
281	case X86::SHLD32rrCL:
282	case X86::SHLD64rrCL:
283	case X86::SHLD16rri8:
284	case X86::SHLD32rri8:
285	case X86::SHLD64rri8:
286	case X86::SHRD16rrCL:
287	case X86::SHRD32rrCL:
288	case X86::SHRD64rrCL:
289	case X86::SHRD16rri8:
290	case X86::SHRD32rri8:
291	case X86::SHRD64rri8:
292
293	// Basic arithmetic is constant time on the input but does set flags.
294	case X86::ADC8rr:
295	case X86::ADC8ri:
296	case X86::ADC16rr:
297	case X86::ADC16ri:
298	case X86::ADC16ri8:
299	case X86::ADC32rr:
300	case X86::ADC32ri:
301	case X86::ADC32ri8:
302	case X86::ADC64rr:
303	case X86::ADC64ri8:
304	case X86::ADC64ri32:
305	case X86::ADD8rr:
306	case X86::ADD8ri:
307	case X86::ADD16rr:
308	case X86::ADD16ri:
309	case X86::ADD16ri8:
310	case X86::ADD32rr:
311	case X86::ADD32ri:
312	case X86::ADD32ri8:
313	case X86::ADD64rr:
314	case X86::ADD64ri8:
315	case X86::ADD64ri32:
316	case X86::AND8rr:
317	case X86::AND8ri:
318	case X86::AND16rr:
319	case X86::AND16ri:
320	case X86::AND16ri8:
321	case X86::AND32rr:
322	case X86::AND32ri:
323	case X86::AND32ri8:
324	case X86::AND64rr:
325	case X86::AND64ri8:
326	case X86::AND64ri32:
327	case X86::OR8rr:
328	case X86::OR8ri:
329	case X86::OR16rr:
330	case X86::OR16ri:
331	case X86::OR16ri8:
332	case X86::OR32rr:
333	case X86::OR32ri:
334	case X86::OR32ri8:
335	case X86::OR64rr:
336	case X86::OR64ri8:
337	case X86::OR64ri32:
338	case X86::SBB8rr:
339	case X86::SBB8ri:
340	case X86::SBB16rr:
341	case X86::SBB16ri:
342	case X86::SBB16ri8:
343	case X86::SBB32rr:
344	case X86::SBB32ri:
345	case X86::SBB32ri8:
346	case X86::SBB64rr:
347	case X86::SBB64ri8:
348	case X86::SBB64ri32:
349	case X86::SUB8rr:
350	case X86::SUB8ri:
351	case X86::SUB16rr:
352	case X86::SUB16ri:
353	case X86::SUB16ri8:
354	case X86::SUB32rr:
355	case X86::SUB32ri:
356	case X86::SUB32ri8:
357	case X86::SUB64rr:
358	case X86::SUB64ri8:
359	case X86::SUB64ri32:
360	case X86::XOR8rr:
361	case X86::XOR8ri:
362	case X86::XOR16rr:
363	case X86::XOR16ri:
364	case X86::XOR16ri8:
365	case X86::XOR32rr:
366	case X86::XOR32ri:
367	case X86::XOR32ri8:
368	case X86::XOR64rr:
369	case X86::XOR64ri8:
370	case X86::XOR64ri32:
371	// Arithmetic with just 32-bit and 64-bit variants and no immediates.
372	case X86::ADCX32rr:
373	case X86::ADCX64rr:
374	case X86::ADOX32rr:
375	case X86::ADOX64rr:
376	case X86::ANDN32rr:
377	case X86::ANDN64rr:
378	// Unary arithmetic operations.
379	case X86::DEC8r:
380	case X86::DEC16r:
381	case X86::DEC32r:
382	case X86::DEC64r:
383	case X86::INC8r:
384	case X86::INC16r:
385	case X86::INC32r:
386	case X86::INC64r:
387	case X86::NEG8r:
388	case X86::NEG16r:
389	case X86::NEG32r:
390	case X86::NEG64r:
391
392	// Unlike other arithmetic, NOT doesn't set EFLAGS.
393	case X86::NOT8r:
394	case X86::NOT16r:
395	case X86::NOT32r:
396	case X86::NOT64r:
397
398	// Various move instructions used to zero or sign extend things. Note that we
399	// intentionally don't support the _NOREX variants as we can't handle that
400	// register constraint anyways.
401	case X86::MOVSX16rr8:
402	case X86::MOVSX32rr8:
403	case X86::MOVSX32rr16:
404	case X86::MOVSX64rr8:
405	case X86::MOVSX64rr16:
406	case X86::MOVSX64rr32:
407	case X86::MOVZX16rr8:
408	case X86::MOVZX32rr8:
409	case X86::MOVZX32rr16:
410	case X86::MOVZX64rr8:
411	case X86::MOVZX64rr16:
412	case X86::MOV32rr:
413
414	// Arithmetic instructions that are both constant time and don't set flags.
415	case X86::RORX32ri:
416	case X86::RORX64ri:
417	case X86::SARX32rr:
418	case X86::SARX64rr:
419	case X86::SHLX32rr:
420	case X86::SHLX64rr:
421	case X86::SHRX32rr:
422	case X86::SHRX64rr:
423
424	// LEA doesn't actually access memory, and its arithmetic is constant time.
425	case X86::LEA16r:
426	case X86::LEA32r:
427	case X86::LEA64_32r:
428	case X86::LEA64r:
429	return true;
430	}
431	}
432
433	bool X86InstrInfo::isDataInvariantLoad(MachineInstr &MI) {
434	switch (MI.getOpcode()) {
435	default:
436	// By default, assume that the load will immediately leak.
437	return false;
438
439	// On x86 it is believed that imul is constant time w.r.t. the loaded data.
440	// However, they set flags and are perhaps the most surprisingly constant
441	// time operations so we call them out here separately.
442	case X86::IMUL16rm:
443	case X86::IMUL16rmi8:
444	case X86::IMUL16rmi:
445	case X86::IMUL32rm:
446	case X86::IMUL32rmi8:
447	case X86::IMUL32rmi:
448	case X86::IMUL64rm:
449	case X86::IMUL64rmi32:
450	case X86::IMUL64rmi8:
451
452	// Bit scanning and counting instructions that are somewhat surprisingly
453	// constant time as they scan across bits and do other fairly complex
454	// operations like popcnt, but are believed to be constant time on x86.
455	// However, these set flags.
456	case X86::BSF16rm:
457	case X86::BSF32rm:
458	case X86::BSF64rm:
459	case X86::BSR16rm:
460	case X86::BSR32rm:
461	case X86::BSR64rm:
462	case X86::LZCNT16rm:
463	case X86::LZCNT32rm:
464	case X86::LZCNT64rm:
465	case X86::POPCNT16rm:
466	case X86::POPCNT32rm:
467	case X86::POPCNT64rm:
468	case X86::TZCNT16rm:
469	case X86::TZCNT32rm:
470	case X86::TZCNT64rm:
471
472	// Bit manipulation instructions are effectively combinations of basic
473	// arithmetic ops, and should still execute in constant time. These also
474	// set flags.
475	case X86::BLCFILL32rm:
476	case X86::BLCFILL64rm:
477	case X86::BLCI32rm:
478	case X86::BLCI64rm:
479	case X86::BLCIC32rm:
480	case X86::BLCIC64rm:
481	case X86::BLCMSK32rm:
482	case X86::BLCMSK64rm:
483	case X86::BLCS32rm:
484	case X86::BLCS64rm:
485	case X86::BLSFILL32rm:
486	case X86::BLSFILL64rm:
487	case X86::BLSI32rm:
488	case X86::BLSI64rm:
489	case X86::BLSIC32rm:
490	case X86::BLSIC64rm:
491	case X86::BLSMSK32rm:
492	case X86::BLSMSK64rm:
493	case X86::BLSR32rm:
494	case X86::BLSR64rm:
495	case X86::TZMSK32rm:
496	case X86::TZMSK64rm:
497
498	// Bit extracting and clearing instructions should execute in constant time,
499	// and set flags.
500	case X86::BEXTR32rm:
501	case X86::BEXTR64rm:
502	case X86::BEXTRI32mi:
503	case X86::BEXTRI64mi:
504	case X86::BZHI32rm:
505	case X86::BZHI64rm:
506
507	// Basic arithmetic is constant time on the input but does set flags.
508	case X86::ADC8rm:
509	case X86::ADC16rm:
510	case X86::ADC32rm:
511	case X86::ADC64rm:
512	case X86::ADCX32rm:
513	case X86::ADCX64rm:
514	case X86::ADD8rm:
515	case X86::ADD16rm:
516	case X86::ADD32rm:
517	case X86::ADD64rm:
518	case X86::ADOX32rm:
519	case X86::ADOX64rm:
520	case X86::AND8rm:
521	case X86::AND16rm:
522	case X86::AND32rm:
523	case X86::AND64rm:
524	case X86::ANDN32rm:
525	case X86::ANDN64rm:
526	case X86::OR8rm:
527	case X86::OR16rm:
528	case X86::OR32rm:
529	case X86::OR64rm:
530	case X86::SBB8rm:
531	case X86::SBB16rm:
532	case X86::SBB32rm:
533	case X86::SBB64rm:
534	case X86::SUB8rm:
535	case X86::SUB16rm:
536	case X86::SUB32rm:
537	case X86::SUB64rm:
538	case X86::XOR8rm:
539	case X86::XOR16rm:
540	case X86::XOR32rm:
541	case X86::XOR64rm:
542
543	// Integer multiply w/o affecting flags is still believed to be constant
544	// time on x86. Called out separately as this is among the most surprising
545	// instructions to exhibit that behavior.
546	case X86::MULX32rm:
547	case X86::MULX64rm:
548
549	// Arithmetic instructions that are both constant time and don't set flags.
550	case X86::RORX32mi:
551	case X86::RORX64mi:
552	case X86::SARX32rm:
553	case X86::SARX64rm:
554	case X86::SHLX32rm:
555	case X86::SHLX64rm:
556	case X86::SHRX32rm:
557	case X86::SHRX64rm:
558
559	// Conversions are believed to be constant time and don't set flags.
560	case X86::CVTTSD2SI64rm:
561	case X86::VCVTTSD2SI64rm:
562	case X86::VCVTTSD2SI64Zrm:
563	case X86::CVTTSD2SIrm:
564	case X86::VCVTTSD2SIrm:
565	case X86::VCVTTSD2SIZrm:
566	case X86::CVTTSS2SI64rm:
567	case X86::VCVTTSS2SI64rm:
568	case X86::VCVTTSS2SI64Zrm:
569	case X86::CVTTSS2SIrm:
570	case X86::VCVTTSS2SIrm:
571	case X86::VCVTTSS2SIZrm:
572	case X86::CVTSI2SDrm:
573	case X86::VCVTSI2SDrm:
574	case X86::VCVTSI2SDZrm:
575	case X86::CVTSI2SSrm:
576	case X86::VCVTSI2SSrm:
577	case X86::VCVTSI2SSZrm:
578	case X86::CVTSI642SDrm:
579	case X86::VCVTSI642SDrm:
580	case X86::VCVTSI642SDZrm:
581	case X86::CVTSI642SSrm:
582	case X86::VCVTSI642SSrm:
583	case X86::VCVTSI642SSZrm:
584	case X86::CVTSS2SDrm:
585	case X86::VCVTSS2SDrm:
586	case X86::VCVTSS2SDZrm:
587	case X86::CVTSD2SSrm:
588	case X86::VCVTSD2SSrm:
589	case X86::VCVTSD2SSZrm:
590	// AVX512 added unsigned integer conversions.
591	case X86::VCVTTSD2USI64Zrm:
592	case X86::VCVTTSD2USIZrm:
593	case X86::VCVTTSS2USI64Zrm:
594	case X86::VCVTTSS2USIZrm:
595	case X86::VCVTUSI2SDZrm:
596	case X86::VCVTUSI642SDZrm:
597	case X86::VCVTUSI2SSZrm:
598	case X86::VCVTUSI642SSZrm:
599
600	// Loads to register don't set flags.
601	case X86::MOV8rm:
602	case X86::MOV8rm_NOREX:
603	case X86::MOV16rm:
604	case X86::MOV32rm:
605	case X86::MOV64rm:
606	case X86::MOVSX16rm8:
607	case X86::MOVSX32rm16:
608	case X86::MOVSX32rm8:
609	case X86::MOVSX32rm8_NOREX:
610	case X86::MOVSX64rm16:
611	case X86::MOVSX64rm32:
612	case X86::MOVSX64rm8:
613	case X86::MOVZX16rm8:
614	case X86::MOVZX32rm16:
615	case X86::MOVZX32rm8:
616	case X86::MOVZX32rm8_NOREX:
617	case X86::MOVZX64rm16:
618	case X86::MOVZX64rm8:
619	return true;
620	}
621	}
622
623	int X86InstrInfo::getSPAdjust(const MachineInstr &MI) const {
624	const MachineFunction *MF = MI.getParent()->getParent();
625	const TargetFrameLowering *TFI = MF->getSubtarget().getFrameLowering();
626
627	if (isFrameInstr(MI)) {
628	int SPAdj = alignTo(getFrameSize(MI), TFI->getStackAlign());
629	SPAdj -= getFrameAdjustment(MI);
630	if (!isFrameSetup(MI))
631	SPAdj = -SPAdj;
632	return SPAdj;
633	}
634
635	// To know whether a call adjusts the stack, we need information
636	// that is bound to the following ADJCALLSTACKUP pseudo.
637	// Look for the next ADJCALLSTACKUP that follows the call.
638	if (MI.isCall()) {
639	const MachineBasicBlock *MBB = MI.getParent();
640	auto I = ++MachineBasicBlock::const_iterator(MI);
641	for (auto E = MBB->end(); I != E; ++I) {
642	if (I->getOpcode() == getCallFrameDestroyOpcode() \|\|
643	I->isCall())
644	break;
645	}
646
647	// If we could not find a frame destroy opcode, then it has already
648	// been simplified, so we don't care.
649	if (I->getOpcode() != getCallFrameDestroyOpcode())
650	return 0;
651
652	return -(I->getOperand(1).getImm());
653	}
654
655	// Currently handle only PUSHes we can reasonably expect to see
656	// in call sequences
657	switch (MI.getOpcode()) {
658	default:
659	return 0;
660	case X86::PUSH32i8:
661	case X86::PUSH32r:
662	case X86::PUSH32rmm:
663	case X86::PUSH32rmr:
664	case X86::PUSHi32:
665	return 4;
666	case X86::PUSH64i8:
667	case X86::PUSH64r:
668	case X86::PUSH64rmm:
669	case X86::PUSH64rmr:
670	case X86::PUSH64i32:
671	return 8;
672	}
673	}
674
675	/// Return true and the FrameIndex if the specified
676	/// operand and follow operands form a reference to the stack frame.
677	bool X86InstrInfo::isFrameOperand(const MachineInstr &MI, unsigned int Op,
678	int &FrameIndex) const {
679	if (MI.getOperand(Op + X86::AddrBaseReg).isFI() &&
680	MI.getOperand(Op + X86::AddrScaleAmt).isImm() &&
681	MI.getOperand(Op + X86::AddrIndexReg).isReg() &&
682	MI.getOperand(Op + X86::AddrDisp).isImm() &&
683	MI.getOperand(Op + X86::AddrScaleAmt).getImm() == 1 &&
684	MI.getOperand(Op + X86::AddrIndexReg).getReg() == 0 &&
685	MI.getOperand(Op + X86::AddrDisp).getImm() == 0) {
686	FrameIndex = MI.getOperand(Op + X86::AddrBaseReg).getIndex();
687	return true;
688	}
689	return false;
690	}
691
692	static bool isFrameLoadOpcode(int Opcode, unsigned &MemBytes) {
693	switch (Opcode) {
694	default:
695	return false;
696	case X86::MOV8rm:
697	case X86::KMOVBkm:
698	MemBytes = 1;
699	return true;
700	case X86::MOV16rm:
701	case X86::KMOVWkm:
702	case X86::VMOVSHZrm:
703	case X86::VMOVSHZrm_alt:
704	MemBytes = 2;
705	return true;
706	case X86::MOV32rm:
707	case X86::MOVSSrm:
708	case X86::MOVSSrm_alt:
709	case X86::VMOVSSrm:
710	case X86::VMOVSSrm_alt:
711	case X86::VMOVSSZrm:
712	case X86::VMOVSSZrm_alt:
713	case X86::KMOVDkm:
714	MemBytes = 4;
715	return true;
716	case X86::MOV64rm:
717	case X86::LD_Fp64m:
718	case X86::MOVSDrm:
719	case X86::MOVSDrm_alt:
720	case X86::VMOVSDrm:
721	case X86::VMOVSDrm_alt:
722	case X86::VMOVSDZrm:
723	case X86::VMOVSDZrm_alt:
724	case X86::MMX_MOVD64rm:
725	case X86::MMX_MOVQ64rm:
726	case X86::KMOVQkm:
727	MemBytes = 8;
728	return true;
729	case X86::MOVAPSrm:
730	case X86::MOVUPSrm:
731	case X86::MOVAPDrm:
732	case X86::MOVUPDrm:
733	case X86::MOVDQArm:
734	case X86::MOVDQUrm:
735	case X86::VMOVAPSrm:
736	case X86::VMOVUPSrm:
737	case X86::VMOVAPDrm:
738	case X86::VMOVUPDrm:
739	case X86::VMOVDQArm:
740	case X86::VMOVDQUrm:
741	case X86::VMOVAPSZ128rm:
742	case X86::VMOVUPSZ128rm:
743	case X86::VMOVAPSZ128rm_NOVLX:
744	case X86::VMOVUPSZ128rm_NOVLX:
745	case X86::VMOVAPDZ128rm:
746	case X86::VMOVUPDZ128rm:
747	case X86::VMOVDQU8Z128rm:
748	case X86::VMOVDQU16Z128rm:
749	case X86::VMOVDQA32Z128rm:
750	case X86::VMOVDQU32Z128rm:
751	case X86::VMOVDQA64Z128rm:
752	case X86::VMOVDQU64Z128rm:
753	MemBytes = 16;
754	return true;
755	case X86::VMOVAPSYrm:
756	case X86::VMOVUPSYrm:
757	case X86::VMOVAPDYrm:
758	case X86::VMOVUPDYrm:
759	case X86::VMOVDQAYrm:
760	case X86::VMOVDQUYrm:
761	case X86::VMOVAPSZ256rm:
762	case X86::VMOVUPSZ256rm:
763	case X86::VMOVAPSZ256rm_NOVLX:
764	case X86::VMOVUPSZ256rm_NOVLX:
765	case X86::VMOVAPDZ256rm:
766	case X86::VMOVUPDZ256rm:
767	case X86::VMOVDQU8Z256rm:
768	case X86::VMOVDQU16Z256rm:
769	case X86::VMOVDQA32Z256rm:
770	case X86::VMOVDQU32Z256rm:
771	case X86::VMOVDQA64Z256rm:
772	case X86::VMOVDQU64Z256rm:
773	MemBytes = 32;
774	return true;
775	case X86::VMOVAPSZrm:
776	case X86::VMOVUPSZrm:
777	case X86::VMOVAPDZrm:
778	case X86::VMOVUPDZrm:
779	case X86::VMOVDQU8Zrm:
780	case X86::VMOVDQU16Zrm:
781	case X86::VMOVDQA32Zrm:
782	case X86::VMOVDQU32Zrm:
783	case X86::VMOVDQA64Zrm:
784	case X86::VMOVDQU64Zrm:
785	MemBytes = 64;
786	return true;
787	}
788	}
789
790	static bool isFrameStoreOpcode(int Opcode, unsigned &MemBytes) {
791	switch (Opcode) {
792	default:
793	return false;
794	case X86::MOV8mr:
795	case X86::KMOVBmk:
796	MemBytes = 1;
797	return true;
798	case X86::MOV16mr:
799	case X86::KMOVWmk:
800	case X86::VMOVSHZmr:
801	MemBytes = 2;
802	return true;
803	case X86::MOV32mr:
804	case X86::MOVSSmr:
805	case X86::VMOVSSmr:
806	case X86::VMOVSSZmr:
807	case X86::KMOVDmk:
808	MemBytes = 4;
809	return true;
810	case X86::MOV64mr:
811	case X86::ST_FpP64m:
812	case X86::MOVSDmr:
813	case X86::VMOVSDmr:
814	case X86::VMOVSDZmr:
815	case X86::MMX_MOVD64mr:
816	case X86::MMX_MOVQ64mr:
817	case X86::MMX_MOVNTQmr:
818	case X86::KMOVQmk:
819	MemBytes = 8;
820	return true;
821	case X86::MOVAPSmr:
822	case X86::MOVUPSmr:
823	case X86::MOVAPDmr:
824	case X86::MOVUPDmr:
825	case X86::MOVDQAmr:
826	case X86::MOVDQUmr:
827	case X86::VMOVAPSmr:
828	case X86::VMOVUPSmr:
829	case X86::VMOVAPDmr:
830	case X86::VMOVUPDmr:
831	case X86::VMOVDQAmr:
832	case X86::VMOVDQUmr:
833	case X86::VMOVUPSZ128mr:
834	case X86::VMOVAPSZ128mr:
835	case X86::VMOVUPSZ128mr_NOVLX:
836	case X86::VMOVAPSZ128mr_NOVLX:
837	case X86::VMOVUPDZ128mr:
838	case X86::VMOVAPDZ128mr:
839	case X86::VMOVDQA32Z128mr:
840	case X86::VMOVDQU32Z128mr:
841	case X86::VMOVDQA64Z128mr:
842	case X86::VMOVDQU64Z128mr:
843	case X86::VMOVDQU8Z128mr:
844	case X86::VMOVDQU16Z128mr:
845	MemBytes = 16;
846	return true;
847	case X86::VMOVUPSYmr:
848	case X86::VMOVAPSYmr:
849	case X86::VMOVUPDYmr:
850	case X86::VMOVAPDYmr:
851	case X86::VMOVDQUYmr:
852	case X86::VMOVDQAYmr:
853	case X86::VMOVUPSZ256mr:
854	case X86::VMOVAPSZ256mr:
855	case X86::VMOVUPSZ256mr_NOVLX:
856	case X86::VMOVAPSZ256mr_NOVLX:
857	case X86::VMOVUPDZ256mr:
858	case X86::VMOVAPDZ256mr:
859	case X86::VMOVDQU8Z256mr:
860	case X86::VMOVDQU16Z256mr:
861	case X86::VMOVDQA32Z256mr:
862	case X86::VMOVDQU32Z256mr:
863	case X86::VMOVDQA64Z256mr:
864	case X86::VMOVDQU64Z256mr:
865	MemBytes = 32;
866	return true;
867	case X86::VMOVUPSZmr:
868	case X86::VMOVAPSZmr:
869	case X86::VMOVUPDZmr:
870	case X86::VMOVAPDZmr:
871	case X86::VMOVDQU8Zmr:
872	case X86::VMOVDQU16Zmr:
873	case X86::VMOVDQA32Zmr:
874	case X86::VMOVDQU32Zmr:
875	case X86::VMOVDQA64Zmr:
876	case X86::VMOVDQU64Zmr:
877	MemBytes = 64;
878	return true;
879	}
880	return false;
881	}
882
883	unsigned X86InstrInfo::isLoadFromStackSlot(const MachineInstr &MI,
884	int &FrameIndex) const {
885	unsigned Dummy;
886	return X86InstrInfo::isLoadFromStackSlot(MI, FrameIndex, Dummy);
887	}
888
889	unsigned X86InstrInfo::isLoadFromStackSlot(const MachineInstr &MI,
890	int &FrameIndex,
891	unsigned &MemBytes) const {
892	if (isFrameLoadOpcode(MI.getOpcode(), MemBytes))
893	if (MI.getOperand(0).getSubReg() == 0 && isFrameOperand(MI, 1, FrameIndex))
894	return MI.getOperand(0).getReg();
895	return 0;
896	}
897
898	unsigned X86InstrInfo::isLoadFromStackSlotPostFE(const MachineInstr &MI,
899	int &FrameIndex) const {
900	unsigned Dummy;
901	if (isFrameLoadOpcode(MI.getOpcode(), Dummy)) {
902	unsigned Reg;
903	if ((Reg = isLoadFromStackSlot(MI, FrameIndex)))
904	return Reg;
905	// Check for post-frame index elimination operations
906	SmallVector<const MachineMemOperand *, 1> Accesses;
907	if (hasLoadFromStackSlot(MI, Accesses)) {
908	FrameIndex =
909	cast<FixedStackPseudoSourceValue>(Accesses.front()->getPseudoValue())
910	->getFrameIndex();
911	return MI.getOperand(0).getReg();
912	}
913	}
914	return 0;
915	}
916
917	unsigned X86InstrInfo::isStoreToStackSlot(const MachineInstr &MI,
918	int &FrameIndex) const {
919	unsigned Dummy;
920	return X86InstrInfo::isStoreToStackSlot(MI, FrameIndex, Dummy);
921	}
922
923	unsigned X86InstrInfo::isStoreToStackSlot(const MachineInstr &MI,
924	int &FrameIndex,
925	unsigned &MemBytes) const {
926	if (isFrameStoreOpcode(MI.getOpcode(), MemBytes))
927	if (MI.getOperand(X86::AddrNumOperands).getSubReg() == 0 &&
928	isFrameOperand(MI, 0, FrameIndex))
929	return MI.getOperand(X86::AddrNumOperands).getReg();
930	return 0;
931	}
932
933	unsigned X86InstrInfo::isStoreToStackSlotPostFE(const MachineInstr &MI,
934	int &FrameIndex) const {
935	unsigned Dummy;
936	if (isFrameStoreOpcode(MI.getOpcode(), Dummy)) {
937	unsigned Reg;
938	if ((Reg = isStoreToStackSlot(MI, FrameIndex)))
939	return Reg;
940	// Check for post-frame index elimination operations
941	SmallVector<const MachineMemOperand *, 1> Accesses;
942	if (hasStoreToStackSlot(MI, Accesses)) {
943	FrameIndex =
944	cast<FixedStackPseudoSourceValue>(Accesses.front()->getPseudoValue())
945	->getFrameIndex();
946	return MI.getOperand(X86::AddrNumOperands).getReg();
947	}
948	}
949	return 0;
950	}
951
952	/// Return true if register is PIC base; i.e.g defined by X86::MOVPC32r.
953	static bool regIsPICBase(Register BaseReg, const MachineRegisterInfo &MRI) {
954	// Don't waste compile time scanning use-def chains of physregs.
955	if (!BaseReg.isVirtual())
956	return false;
957	bool isPICBase = false;
958	for (MachineRegisterInfo::def_instr_iterator I = MRI.def_instr_begin(BaseReg),
959	E = MRI.def_instr_end(); I != E; ++I) {
960	MachineInstr DefMI = &I;
961	if (DefMI->getOpcode() != X86::MOVPC32r)
962	return false;
963	assert(!isPICBase && "More than one PIC base?")(static_cast <bool> (!isPICBase && "More than one PIC base?" ) ? void (0) : __assert_fail ("!isPICBase && \"More than one PIC base?\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 963, __extension__ __PRETTY_FUNCTION__));
964	isPICBase = true;
965	}
966	return isPICBase;
967	}
968
969	bool X86InstrInfo::isReallyTriviallyReMaterializable(const MachineInstr &MI,
970	AAResults *AA) const {
971	switch (MI.getOpcode()) {
972	default:
973	// This function should only be called for opcodes with the ReMaterializable
974	// flag set.
975	llvm_unreachable("Unknown rematerializable operation!")::llvm::llvm_unreachable_internal("Unknown rematerializable operation!" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 975);
976	break;
977
978	case X86::LOAD_STACK_GUARD:
979	case X86::AVX1_SETALLONES:
980	case X86::AVX2_SETALLONES:
981	case X86::AVX512_128_SET0:
982	case X86::AVX512_256_SET0:
983	case X86::AVX512_512_SET0:
984	case X86::AVX512_512_SETALLONES:
985	case X86::AVX512_FsFLD0SD:
986	case X86::AVX512_FsFLD0SH:
987	case X86::AVX512_FsFLD0SS:
988	case X86::AVX512_FsFLD0F128:
989	case X86::AVX_SET0:
990	case X86::FsFLD0SD:
991	case X86::FsFLD0SS:
992	case X86::FsFLD0F128:
993	case X86::KSET0D:
994	case X86::KSET0Q:
995	case X86::KSET0W:
996	case X86::KSET1D:
997	case X86::KSET1Q:
998	case X86::KSET1W:
999	case X86::MMX_SET0:
1000	case X86::MOV32ImmSExti8:
1001	case X86::MOV32r0:
1002	case X86::MOV32r1:
1003	case X86::MOV32r_1:
1004	case X86::MOV32ri64:
1005	case X86::MOV64ImmSExti8:
1006	case X86::V_SET0:
1007	case X86::V_SETALLONES:
1008	case X86::MOV16ri:
1009	case X86::MOV32ri:
1010	case X86::MOV64ri:
1011	case X86::MOV64ri32:
1012	case X86::MOV8ri:
1013	case X86::PTILEZEROV:
1014	return true;
1015
1016	case X86::MOV8rm:
1017	case X86::MOV8rm_NOREX:
1018	case X86::MOV16rm:
1019	case X86::MOV32rm:
1020	case X86::MOV64rm:
1021	case X86::MOVSSrm:
1022	case X86::MOVSSrm_alt:
1023	case X86::MOVSDrm:
1024	case X86::MOVSDrm_alt:
1025	case X86::MOVAPSrm:
1026	case X86::MOVUPSrm:
1027	case X86::MOVAPDrm:
1028	case X86::MOVUPDrm:
1029	case X86::MOVDQArm:
1030	case X86::MOVDQUrm:
1031	case X86::VMOVSSrm:
1032	case X86::VMOVSSrm_alt:
1033	case X86::VMOVSDrm:
1034	case X86::VMOVSDrm_alt:
1035	case X86::VMOVAPSrm:
1036	case X86::VMOVUPSrm:
1037	case X86::VMOVAPDrm:
1038	case X86::VMOVUPDrm:
1039	case X86::VMOVDQArm:
1040	case X86::VMOVDQUrm:
1041	case X86::VMOVAPSYrm:
1042	case X86::VMOVUPSYrm:
1043	case X86::VMOVAPDYrm:
1044	case X86::VMOVUPDYrm:
1045	case X86::VMOVDQAYrm:
1046	case X86::VMOVDQUYrm:
1047	case X86::MMX_MOVD64rm:
1048	case X86::MMX_MOVQ64rm:
1049	// AVX-512
1050	case X86::VMOVSSZrm:
1051	case X86::VMOVSSZrm_alt:
1052	case X86::VMOVSDZrm:
1053	case X86::VMOVSDZrm_alt:
1054	case X86::VMOVSHZrm:
1055	case X86::VMOVSHZrm_alt:
1056	case X86::VMOVAPDZ128rm:
1057	case X86::VMOVAPDZ256rm:
1058	case X86::VMOVAPDZrm:
1059	case X86::VMOVAPSZ128rm:
1060	case X86::VMOVAPSZ256rm:
1061	case X86::VMOVAPSZ128rm_NOVLX:
1062	case X86::VMOVAPSZ256rm_NOVLX:
1063	case X86::VMOVAPSZrm:
1064	case X86::VMOVDQA32Z128rm:
1065	case X86::VMOVDQA32Z256rm:
1066	case X86::VMOVDQA32Zrm:
1067	case X86::VMOVDQA64Z128rm:
1068	case X86::VMOVDQA64Z256rm:
1069	case X86::VMOVDQA64Zrm:
1070	case X86::VMOVDQU16Z128rm:
1071	case X86::VMOVDQU16Z256rm:
1072	case X86::VMOVDQU16Zrm:
1073	case X86::VMOVDQU32Z128rm:
1074	case X86::VMOVDQU32Z256rm:
1075	case X86::VMOVDQU32Zrm:
1076	case X86::VMOVDQU64Z128rm:
1077	case X86::VMOVDQU64Z256rm:
1078	case X86::VMOVDQU64Zrm:
1079	case X86::VMOVDQU8Z128rm:
1080	case X86::VMOVDQU8Z256rm:
1081	case X86::VMOVDQU8Zrm:
1082	case X86::VMOVUPDZ128rm:
1083	case X86::VMOVUPDZ256rm:
1084	case X86::VMOVUPDZrm:
1085	case X86::VMOVUPSZ128rm:
1086	case X86::VMOVUPSZ256rm:
1087	case X86::VMOVUPSZ128rm_NOVLX:
1088	case X86::VMOVUPSZ256rm_NOVLX:
1089	case X86::VMOVUPSZrm: {
1090	// Loads from constant pools are trivially rematerializable.
1091	if (MI.getOperand(1 + X86::AddrBaseReg).isReg() &&
1092	MI.getOperand(1 + X86::AddrScaleAmt).isImm() &&
1093	MI.getOperand(1 + X86::AddrIndexReg).isReg() &&
1094	MI.getOperand(1 + X86::AddrIndexReg).getReg() == 0 &&
1095	MI.isDereferenceableInvariantLoad(AA)) {
1096	Register BaseReg = MI.getOperand(1 + X86::AddrBaseReg).getReg();
1097	if (BaseReg == 0 \|\| BaseReg == X86::RIP)
1098	return true;
1099	// Allow re-materialization of PIC load.
1100	if (!ReMatPICStubLoad && MI.getOperand(1 + X86::AddrDisp).isGlobal())
1101	return false;
1102	const MachineFunction &MF = *MI.getParent()->getParent();
1103	const MachineRegisterInfo &MRI = MF.getRegInfo();
1104	return regIsPICBase(BaseReg, MRI);
1105	}
1106	return false;
1107	}
1108
1109	case X86::LEA32r:
1110	case X86::LEA64r: {
1111	if (MI.getOperand(1 + X86::AddrScaleAmt).isImm() &&
1112	MI.getOperand(1 + X86::AddrIndexReg).isReg() &&
1113	MI.getOperand(1 + X86::AddrIndexReg).getReg() == 0 &&
1114	!MI.getOperand(1 + X86::AddrDisp).isReg()) {
1115	// lea fi#, lea GV, etc. are all rematerializable.
1116	if (!MI.getOperand(1 + X86::AddrBaseReg).isReg())
1117	return true;
1118	Register BaseReg = MI.getOperand(1 + X86::AddrBaseReg).getReg();
1119	if (BaseReg == 0)
1120	return true;
1121	// Allow re-materialization of lea PICBase + x.
1122	const MachineFunction &MF = *MI.getParent()->getParent();
1123	const MachineRegisterInfo &MRI = MF.getRegInfo();
1124	return regIsPICBase(BaseReg, MRI);
1125	}
1126	return false;
1127	}
1128	}
1129	}
1130
1131	void X86InstrInfo::reMaterialize(MachineBasicBlock &MBB,
1132	MachineBasicBlock::iterator I,
1133	Register DestReg, unsigned SubIdx,
1134	const MachineInstr &Orig,
1135	const TargetRegisterInfo &TRI) const {
1136	bool ClobbersEFLAGS = Orig.modifiesRegister(X86::EFLAGS, &TRI);
1137	if (ClobbersEFLAGS && MBB.computeRegisterLiveness(&TRI, X86::EFLAGS, I) !=
1138	MachineBasicBlock::LQR_Dead) {
1139	// The instruction clobbers EFLAGS. Re-materialize as MOV32ri to avoid side
1140	// effects.
1141	int Value;
1142	switch (Orig.getOpcode()) {
1143	case X86::MOV32r0: Value = 0; break;
1144	case X86::MOV32r1: Value = 1; break;
1145	case X86::MOV32r_1: Value = -1; break;
1146	default:
1147	llvm_unreachable("Unexpected instruction!")::llvm::llvm_unreachable_internal("Unexpected instruction!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1147);
1148	}
1149
1150	const DebugLoc &DL = Orig.getDebugLoc();
1151	BuildMI(MBB, I, DL, get(X86::MOV32ri))
1152	.add(Orig.getOperand(0))
1153	.addImm(Value);
1154	} else {
1155	MachineInstr *MI = MBB.getParent()->CloneMachineInstr(&Orig);
1156	MBB.insert(I, MI);
1157	}
1158
1159	MachineInstr &NewMI = *std::prev(I);
1160	NewMI.substituteRegister(Orig.getOperand(0).getReg(), DestReg, SubIdx, TRI);
1161	}
1162
1163	/// True if MI has a condition code def, e.g. EFLAGS, that is not marked dead.
1164	bool X86InstrInfo::hasLiveCondCodeDef(MachineInstr &MI) const {
1165	for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
1166	MachineOperand &MO = MI.getOperand(i);
1167	if (MO.isReg() && MO.isDef() &&
1168	MO.getReg() == X86::EFLAGS && !MO.isDead()) {
1169	return true;
1170	}
1171	}
1172	return false;
1173	}
1174
1175	/// Check whether the shift count for a machine operand is non-zero.
1176	inline static unsigned getTruncatedShiftCount(const MachineInstr &MI,
1177	unsigned ShiftAmtOperandIdx) {
1178	// The shift count is six bits with the REX.W prefix and five bits without.
1179	unsigned ShiftCountMask = (MI.getDesc().TSFlags & X86II::REX_W) ? 63 : 31;
1180	unsigned Imm = MI.getOperand(ShiftAmtOperandIdx).getImm();
1181	return Imm & ShiftCountMask;
1182	}
1183
1184	/// Check whether the given shift count is appropriate
1185	/// can be represented by a LEA instruction.
1186	inline static bool isTruncatedShiftCountForLEA(unsigned ShAmt) {
1187	// Left shift instructions can be transformed into load-effective-address
1188	// instructions if we can encode them appropriately.
1189	// A LEA instruction utilizes a SIB byte to encode its scale factor.
1190	// The SIB.scale field is two bits wide which means that we can encode any
1191	// shift amount less than 4.
1192	return ShAmt < 4 && ShAmt > 0;
1193	}
1194
1195	bool X86InstrInfo::classifyLEAReg(MachineInstr &MI, const MachineOperand &Src,
1196	unsigned Opc, bool AllowSP, Register &NewSrc,
1197	bool &isKill, MachineOperand &ImplicitOp,
1198	LiveVariables *LV) const {
1199	MachineFunction &MF = *MI.getParent()->getParent();
1200	const TargetRegisterClass *RC;
1201	if (AllowSP) {
1202	RC = Opc != X86::LEA32r ? &X86::GR64RegClass : &X86::GR32RegClass;
1203	} else {
1204	RC = Opc != X86::LEA32r ?
1205	&X86::GR64_NOSPRegClass : &X86::GR32_NOSPRegClass;
1206	}
1207	Register SrcReg = Src.getReg();
1208
1209	// For both LEA64 and LEA32 the register already has essentially the right
1210	// type (32-bit or 64-bit) we may just need to forbid SP.
1211	if (Opc != X86::LEA64_32r) {
1212	NewSrc = SrcReg;
1213	isKill = Src.isKill();
1214	assert(!Src.isUndef() && "Undef op doesn't need optimization")(static_cast <bool> (!Src.isUndef() && "Undef op doesn't need optimization" ) ? void (0) : __assert_fail ("!Src.isUndef() && \"Undef op doesn't need optimization\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1214, __extension__ __PRETTY_FUNCTION__));
1215
1216	if (NewSrc.isVirtual() && !MF.getRegInfo().constrainRegClass(NewSrc, RC))
1217	return false;
1218
1219	return true;
1220	}
1221
1222	// This is for an LEA64_32r and incoming registers are 32-bit. One way or
1223	// another we need to add 64-bit registers to the final MI.
1224	if (SrcReg.isPhysical()) {
1225	ImplicitOp = Src;
1226	ImplicitOp.setImplicit();
1227
1228	NewSrc = getX86SubSuperRegister(Src.getReg(), 64);
1229	isKill = Src.isKill();
1230	assert(!Src.isUndef() && "Undef op doesn't need optimization")(static_cast <bool> (!Src.isUndef() && "Undef op doesn't need optimization" ) ? void (0) : __assert_fail ("!Src.isUndef() && \"Undef op doesn't need optimization\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1230, __extension__ __PRETTY_FUNCTION__));
1231	} else {
1232	// Virtual register of the wrong class, we have to create a temporary 64-bit
1233	// vreg to feed into the LEA.
1234	NewSrc = MF.getRegInfo().createVirtualRegister(RC);
1235	MachineInstr *Copy =
1236	BuildMI(*MI.getParent(), MI, MI.getDebugLoc(), get(TargetOpcode::COPY))
1237	.addReg(NewSrc, RegState::Define \| RegState::Undef, X86::sub_32bit)
1238	.add(Src);
1239
1240	// Which is obviously going to be dead after we're done with it.
1241	isKill = true;
1242
1243	if (LV)
1244	LV->replaceKillInstruction(SrcReg, MI, *Copy);
1245	}
1246
1247	// We've set all the parameters without issue.
1248	return true;
1249	}
1250
1251	MachineInstr *X86InstrInfo::convertToThreeAddressWithLEA(
1252	unsigned MIOpc, MachineFunction::iterator &MFI, MachineInstr &MI,
1253	LiveVariables *LV, bool Is8BitOp) const {
1254	// We handle 8-bit adds and various 16-bit opcodes in the switch below.
1255	MachineRegisterInfo &RegInfo = MFI->getParent()->getRegInfo();
1256	assert((Is8BitOp \|\| RegInfo.getTargetRegisterInfo()->getRegSizeInBits((static_cast <bool> ((Is8BitOp \|\| RegInfo.getTargetRegisterInfo ()->getRegSizeInBits( RegInfo.getRegClass(MI.getOperand(0 ).getReg())) == 16) && "Unexpected type for LEA transform" ) ? void (0) : __assert_fail ("(Is8BitOp \|\| RegInfo.getTargetRegisterInfo()->getRegSizeInBits( RegInfo.getRegClass(MI.getOperand(0).getReg())) == 16) && \"Unexpected type for LEA transform\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1258, __extension__ __PRETTY_FUNCTION__))
1257	RegInfo.getRegClass(MI.getOperand(0).getReg())) == 16) &&(static_cast <bool> ((Is8BitOp \|\| RegInfo.getTargetRegisterInfo ()->getRegSizeInBits( RegInfo.getRegClass(MI.getOperand(0 ).getReg())) == 16) && "Unexpected type for LEA transform" ) ? void (0) : __assert_fail ("(Is8BitOp \|\| RegInfo.getTargetRegisterInfo()->getRegSizeInBits( *RegInfo.getRegClass(MI.getOperand(0).getReg())) == 16) && \"Unexpected type for LEA transform\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1258, __extension__ __PRETTY_FUNCTION__))
1258	"Unexpected type for LEA transform")(static_cast <bool> ((Is8BitOp \|\| RegInfo.getTargetRegisterInfo ()->getRegSizeInBits( RegInfo.getRegClass(MI.getOperand(0 ).getReg())) == 16) && "Unexpected type for LEA transform" ) ? void (0) : __assert_fail ("(Is8BitOp \|\| RegInfo.getTargetRegisterInfo()->getRegSizeInBits( RegInfo.getRegClass(MI.getOperand(0).getReg())) == 16) && \"Unexpected type for LEA transform\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1258, __extension__ __PRETTY_FUNCTION__));
1259
1260	// TODO: For a 32-bit target, we need to adjust the LEA variables with
1261	// something like this:
1262	// Opcode = X86::LEA32r;
1263	// InRegLEA = RegInfo.createVirtualRegister(&X86::GR32_NOSPRegClass);
1264	// OutRegLEA =
1265	// Is8BitOp ? RegInfo.createVirtualRegister(&X86::GR32ABCD_RegClass)
1266	// : RegInfo.createVirtualRegister(&X86::GR32RegClass);
1267	if (!Subtarget.is64Bit())
1268	return nullptr;
1269
1270	unsigned Opcode = X86::LEA64_32r;
1271	Register InRegLEA = RegInfo.createVirtualRegister(&X86::GR64_NOSPRegClass);
1272	Register OutRegLEA = RegInfo.createVirtualRegister(&X86::GR32RegClass);
1273
1274	// Build and insert into an implicit UNDEF value. This is OK because
1275	// we will be shifting and then extracting the lower 8/16-bits.
1276	// This has the potential to cause partial register stall. e.g.
1277	// movw (%rbp,%rcx,2), %dx
1278	// leal -65(%rdx), %esi
1279	// But testing has shown this does help performance in 64-bit mode (at
1280	// least on modern x86 machines).
1281	MachineBasicBlock::iterator MBBI = MI.getIterator();
1282	Register Dest = MI.getOperand(0).getReg();
1283	Register Src = MI.getOperand(1).getReg();
1284	bool IsDead = MI.getOperand(0).isDead();
1285	bool IsKill = MI.getOperand(1).isKill();
1286	unsigned SubReg = Is8BitOp ? X86::sub_8bit : X86::sub_16bit;
1287	assert(!MI.getOperand(1).isUndef() && "Undef op doesn't need optimization")(static_cast <bool> (!MI.getOperand(1).isUndef() && "Undef op doesn't need optimization") ? void (0) : __assert_fail ("!MI.getOperand(1).isUndef() && \"Undef op doesn't need optimization\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1287, __extension__ __PRETTY_FUNCTION__));
1288	BuildMI(*MFI, MBBI, MI.getDebugLoc(), get(X86::IMPLICIT_DEF), InRegLEA);
1289	MachineInstr *InsMI =
1290	BuildMI(*MFI, MBBI, MI.getDebugLoc(), get(TargetOpcode::COPY))
1291	.addReg(InRegLEA, RegState::Define, SubReg)
1292	.addReg(Src, getKillRegState(IsKill));
1293
1294	MachineInstrBuilder MIB =
1295	BuildMI(*MFI, MBBI, MI.getDebugLoc(), get(Opcode), OutRegLEA);
1296	switch (MIOpc) {
1297	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1297);
1298	case X86::SHL8ri:
1299	case X86::SHL16ri: {
1300	unsigned ShAmt = MI.getOperand(2).getImm();
1301	MIB.addReg(0).addImm(1ULL << ShAmt)
1302	.addReg(InRegLEA, RegState::Kill).addImm(0).addReg(0);
1303	break;
1304	}
1305	case X86::INC8r:
1306	case X86::INC16r:
1307	addRegOffset(MIB, InRegLEA, true, 1);
1308	break;
1309	case X86::DEC8r:
1310	case X86::DEC16r:
1311	addRegOffset(MIB, InRegLEA, true, -1);
1312	break;
1313	case X86::ADD8ri:
1314	case X86::ADD8ri_DB:
1315	case X86::ADD16ri:
1316	case X86::ADD16ri8:
1317	case X86::ADD16ri_DB:
1318	case X86::ADD16ri8_DB:
1319	addRegOffset(MIB, InRegLEA, true, MI.getOperand(2).getImm());
1320	break;
1321	case X86::ADD8rr:
1322	case X86::ADD8rr_DB:
1323	case X86::ADD16rr:
1324	case X86::ADD16rr_DB: {
1325	Register Src2 = MI.getOperand(2).getReg();
1326	bool IsKill2 = MI.getOperand(2).isKill();
1327	assert(!MI.getOperand(2).isUndef() && "Undef op doesn't need optimization")(static_cast <bool> (!MI.getOperand(2).isUndef() && "Undef op doesn't need optimization") ? void (0) : __assert_fail ("!MI.getOperand(2).isUndef() && \"Undef op doesn't need optimization\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1327, __extension__ __PRETTY_FUNCTION__));
1328	unsigned InRegLEA2 = 0;
1329	MachineInstr *InsMI2 = nullptr;
1330	if (Src == Src2) {
1331	// ADD8rr/ADD16rr killed %reg1028, %reg1028
1332	// just a single insert_subreg.
1333	addRegReg(MIB, InRegLEA, true, InRegLEA, false);
1334	} else {
1335	if (Subtarget.is64Bit())
1336	InRegLEA2 = RegInfo.createVirtualRegister(&X86::GR64_NOSPRegClass);
1337	else
1338	InRegLEA2 = RegInfo.createVirtualRegister(&X86::GR32_NOSPRegClass);
1339	// Build and insert into an implicit UNDEF value. This is OK because
1340	// we will be shifting and then extracting the lower 8/16-bits.
1341	BuildMI(MFI, &MIB, MI.getDebugLoc(), get(X86::IMPLICIT_DEF), InRegLEA2);
1342	InsMI2 = BuildMI(MFI, &MIB, MI.getDebugLoc(), get(TargetOpcode::COPY))
1343	.addReg(InRegLEA2, RegState::Define, SubReg)
1344	.addReg(Src2, getKillRegState(IsKill2));
1345	addRegReg(MIB, InRegLEA, true, InRegLEA2, true);
1346	}
1347	if (LV && IsKill2 && InsMI2)
1348	LV->replaceKillInstruction(Src2, MI, *InsMI2);
1349	break;
1350	}
1351	}
1352
1353	MachineInstr *NewMI = MIB;
1354	MachineInstr *ExtMI =
1355	BuildMI(*MFI, MBBI, MI.getDebugLoc(), get(TargetOpcode::COPY))
1356	.addReg(Dest, RegState::Define \| getDeadRegState(IsDead))
1357	.addReg(OutRegLEA, RegState::Kill, SubReg);
1358
1359	if (LV) {
1360	// Update live variables.
1361	LV->getVarInfo(InRegLEA).Kills.push_back(NewMI);
1362	LV->getVarInfo(OutRegLEA).Kills.push_back(ExtMI);
1363	if (IsKill)
1364	LV->replaceKillInstruction(Src, MI, *InsMI);
1365	if (IsDead)
1366	LV->replaceKillInstruction(Dest, MI, *ExtMI);
1367	}
1368
1369	return ExtMI;
1370	}
1371
1372	/// This method must be implemented by targets that
1373	/// set the M_CONVERTIBLE_TO_3_ADDR flag. When this flag is set, the target
1374	/// may be able to convert a two-address instruction into a true
1375	/// three-address instruction on demand. This allows the X86 target (for
1376	/// example) to convert ADD and SHL instructions into LEA instructions if they
1377	/// would require register copies due to two-addressness.
1378	///
1379	/// This method returns a null pointer if the transformation cannot be
1380	/// performed, otherwise it returns the new instruction.
1381	///
1382	MachineInstr *
1383	X86InstrInfo::convertToThreeAddress(MachineFunction::iterator &MFI,
1384	MachineInstr &MI, LiveVariables *LV) const {
1385	// The following opcodes also sets the condition code register(s). Only
1386	// convert them to equivalent lea if the condition code register def's
1387	// are dead!
1388	if (hasLiveCondCodeDef(MI))
1389	return nullptr;
1390
1391	MachineFunction &MF = *MI.getParent()->getParent();
1392	// All instructions input are two-addr instructions. Get the known operands.
1393	const MachineOperand &Dest = MI.getOperand(0);
1394	const MachineOperand &Src = MI.getOperand(1);
1395
1396	// Ideally, operations with undef should be folded before we get here, but we
1397	// can't guarantee it. Bail out because optimizing undefs is a waste of time.
1398	// Without this, we have to forward undef state to new register operands to
1399	// avoid machine verifier errors.
1400	if (Src.isUndef())
1401	return nullptr;
1402	if (MI.getNumOperands() > 2)
1403	if (MI.getOperand(2).isReg() && MI.getOperand(2).isUndef())
1404	return nullptr;
1405
1406	MachineInstr *NewMI = nullptr;
1407	bool Is64Bit = Subtarget.is64Bit();
1408
1409	bool Is8BitOp = false;
1410	unsigned MIOpc = MI.getOpcode();
1411	switch (MIOpc) {
1412	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1412);
1413	case X86::SHL64ri: {
1414	assert(MI.getNumOperands() >= 3 && "Unknown shift instruction!")(static_cast <bool> (MI.getNumOperands() >= 3 && "Unknown shift instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 3 && \"Unknown shift instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1414, __extension__ __PRETTY_FUNCTION__));
1415	unsigned ShAmt = getTruncatedShiftCount(MI, 2);
1416	if (!isTruncatedShiftCountForLEA(ShAmt)) return nullptr;
1417
1418	// LEA can't handle RSP.
1419	if (Src.getReg().isVirtual() && !MF.getRegInfo().constrainRegClass(
1420	Src.getReg(), &X86::GR64_NOSPRegClass))
1421	return nullptr;
1422
1423	NewMI = BuildMI(MF, MI.getDebugLoc(), get(X86::LEA64r))
1424	.add(Dest)
1425	.addReg(0)
1426	.addImm(1ULL << ShAmt)
1427	.add(Src)
1428	.addImm(0)
1429	.addReg(0);
1430	break;
1431	}
1432	case X86::SHL32ri: {
1433	assert(MI.getNumOperands() >= 3 && "Unknown shift instruction!")(static_cast <bool> (MI.getNumOperands() >= 3 && "Unknown shift instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 3 && \"Unknown shift instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1433, __extension__ __PRETTY_FUNCTION__));
1434	unsigned ShAmt = getTruncatedShiftCount(MI, 2);
1435	if (!isTruncatedShiftCountForLEA(ShAmt)) return nullptr;
1436
1437	unsigned Opc = Is64Bit ? X86::LEA64_32r : X86::LEA32r;
1438
1439	// LEA can't handle ESP.
1440	bool isKill;
1441	Register SrcReg;
1442	MachineOperand ImplicitOp = MachineOperand::CreateReg(0, false);
1443	if (!classifyLEAReg(MI, Src, Opc, /AllowSP=/ false,
1444	SrcReg, isKill, ImplicitOp, LV))
1445	return nullptr;
1446
1447	MachineInstrBuilder MIB =
1448	BuildMI(MF, MI.getDebugLoc(), get(Opc))
1449	.add(Dest)
1450	.addReg(0)
1451	.addImm(1ULL << ShAmt)
1452	.addReg(SrcReg, getKillRegState(isKill))
1453	.addImm(0)
1454	.addReg(0);
1455	if (ImplicitOp.getReg() != 0)
1456	MIB.add(ImplicitOp);
1457	NewMI = MIB;
1458
1459	break;
1460	}
1461	case X86::SHL8ri:
1462	Is8BitOp = true;
1463	LLVM_FALLTHROUGH[[gnu::fallthrough]];
1464	case X86::SHL16ri: {
1465	assert(MI.getNumOperands() >= 3 && "Unknown shift instruction!")(static_cast <bool> (MI.getNumOperands() >= 3 && "Unknown shift instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 3 && \"Unknown shift instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1465, __extension__ __PRETTY_FUNCTION__));
1466	unsigned ShAmt = getTruncatedShiftCount(MI, 2);
1467	if (!isTruncatedShiftCountForLEA(ShAmt))
1468	return nullptr;
1469	return convertToThreeAddressWithLEA(MIOpc, MFI, MI, LV, Is8BitOp);
1470	}
1471	case X86::INC64r:
1472	case X86::INC32r: {
1473	assert(MI.getNumOperands() >= 2 && "Unknown inc instruction!")(static_cast <bool> (MI.getNumOperands() >= 2 && "Unknown inc instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 2 && \"Unknown inc instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1473, __extension__ __PRETTY_FUNCTION__));
1474	unsigned Opc = MIOpc == X86::INC64r ? X86::LEA64r :
1475	(Is64Bit ? X86::LEA64_32r : X86::LEA32r);
1476	bool isKill;
1477	Register SrcReg;
1478	MachineOperand ImplicitOp = MachineOperand::CreateReg(0, false);
1479	if (!classifyLEAReg(MI, Src, Opc, /AllowSP=/ false, SrcReg, isKill,
1480	ImplicitOp, LV))
1481	return nullptr;
1482
1483	MachineInstrBuilder MIB =
1484	BuildMI(MF, MI.getDebugLoc(), get(Opc))
1485	.add(Dest)
1486	.addReg(SrcReg, getKillRegState(isKill));
1487	if (ImplicitOp.getReg() != 0)
1488	MIB.add(ImplicitOp);
1489
1490	NewMI = addOffset(MIB, 1);
1491	break;
1492	}
1493	case X86::DEC64r:
1494	case X86::DEC32r: {
1495	assert(MI.getNumOperands() >= 2 && "Unknown dec instruction!")(static_cast <bool> (MI.getNumOperands() >= 2 && "Unknown dec instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 2 && \"Unknown dec instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1495, __extension__ __PRETTY_FUNCTION__));
1496	unsigned Opc = MIOpc == X86::DEC64r ? X86::LEA64r
1497	: (Is64Bit ? X86::LEA64_32r : X86::LEA32r);
1498
1499	bool isKill;
1500	Register SrcReg;
1501	MachineOperand ImplicitOp = MachineOperand::CreateReg(0, false);
1502	if (!classifyLEAReg(MI, Src, Opc, /AllowSP=/ false, SrcReg, isKill,
1503	ImplicitOp, LV))
1504	return nullptr;
1505
1506	MachineInstrBuilder MIB = BuildMI(MF, MI.getDebugLoc(), get(Opc))
1507	.add(Dest)
1508	.addReg(SrcReg, getKillRegState(isKill));
1509	if (ImplicitOp.getReg() != 0)
1510	MIB.add(ImplicitOp);
1511
1512	NewMI = addOffset(MIB, -1);
1513
1514	break;
1515	}
1516	case X86::DEC8r:
1517	case X86::INC8r:
1518	Is8BitOp = true;
1519	LLVM_FALLTHROUGH[[gnu::fallthrough]];
1520	case X86::DEC16r:
1521	case X86::INC16r:
1522	return convertToThreeAddressWithLEA(MIOpc, MFI, MI, LV, Is8BitOp);
1523	case X86::ADD64rr:
1524	case X86::ADD64rr_DB:
1525	case X86::ADD32rr:
1526	case X86::ADD32rr_DB: {
1527	assert(MI.getNumOperands() >= 3 && "Unknown add instruction!")(static_cast <bool> (MI.getNumOperands() >= 3 && "Unknown add instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 3 && \"Unknown add instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1527, __extension__ __PRETTY_FUNCTION__));
1528	unsigned Opc;
1529	if (MIOpc == X86::ADD64rr \|\| MIOpc == X86::ADD64rr_DB)
1530	Opc = X86::LEA64r;
1531	else
1532	Opc = Is64Bit ? X86::LEA64_32r : X86::LEA32r;
1533
1534	bool isKill;
1535	Register SrcReg;
1536	MachineOperand ImplicitOp = MachineOperand::CreateReg(0, false);
1537	if (!classifyLEAReg(MI, Src, Opc, /AllowSP=/ true,
1538	SrcReg, isKill, ImplicitOp, LV))
1539	return nullptr;
1540
1541	const MachineOperand &Src2 = MI.getOperand(2);
1542	bool isKill2;
1543	Register SrcReg2;
1544	MachineOperand ImplicitOp2 = MachineOperand::CreateReg(0, false);
1545	if (!classifyLEAReg(MI, Src2, Opc, /AllowSP=/ false,
1546	SrcReg2, isKill2, ImplicitOp2, LV))
1547	return nullptr;
1548
1549	MachineInstrBuilder MIB = BuildMI(MF, MI.getDebugLoc(), get(Opc)).add(Dest);
1550	if (ImplicitOp.getReg() != 0)
1551	MIB.add(ImplicitOp);
1552	if (ImplicitOp2.getReg() != 0)
1553	MIB.add(ImplicitOp2);
1554
1555	NewMI = addRegReg(MIB, SrcReg, isKill, SrcReg2, isKill2);
1556	if (LV && Src2.isKill())
1557	LV->replaceKillInstruction(SrcReg2, MI, *NewMI);
1558	break;
1559	}
1560	case X86::ADD8rr:
1561	case X86::ADD8rr_DB:
1562	Is8BitOp = true;
1563	LLVM_FALLTHROUGH[[gnu::fallthrough]];
1564	case X86::ADD16rr:
1565	case X86::ADD16rr_DB:
1566	return convertToThreeAddressWithLEA(MIOpc, MFI, MI, LV, Is8BitOp);
1567	case X86::ADD64ri32:
1568	case X86::ADD64ri8:
1569	case X86::ADD64ri32_DB:
1570	case X86::ADD64ri8_DB:
1571	assert(MI.getNumOperands() >= 3 && "Unknown add instruction!")(static_cast <bool> (MI.getNumOperands() >= 3 && "Unknown add instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 3 && \"Unknown add instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1571, __extension__ __PRETTY_FUNCTION__));
1572	NewMI = addOffset(
1573	BuildMI(MF, MI.getDebugLoc(), get(X86::LEA64r)).add(Dest).add(Src),
1574	MI.getOperand(2));
1575	break;
1576	case X86::ADD32ri:
1577	case X86::ADD32ri8:
1578	case X86::ADD32ri_DB:
1579	case X86::ADD32ri8_DB: {
1580	assert(MI.getNumOperands() >= 3 && "Unknown add instruction!")(static_cast <bool> (MI.getNumOperands() >= 3 && "Unknown add instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 3 && \"Unknown add instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1580, __extension__ __PRETTY_FUNCTION__));
1581	unsigned Opc = Is64Bit ? X86::LEA64_32r : X86::LEA32r;
1582
1583	bool isKill;
1584	Register SrcReg;
1585	MachineOperand ImplicitOp = MachineOperand::CreateReg(0, false);
1586	if (!classifyLEAReg(MI, Src, Opc, /AllowSP=/ true,
1587	SrcReg, isKill, ImplicitOp, LV))
1588	return nullptr;
1589
1590	MachineInstrBuilder MIB = BuildMI(MF, MI.getDebugLoc(), get(Opc))
1591	.add(Dest)
1592	.addReg(SrcReg, getKillRegState(isKill));
1593	if (ImplicitOp.getReg() != 0)
1594	MIB.add(ImplicitOp);
1595
1596	NewMI = addOffset(MIB, MI.getOperand(2));
1597	break;
1598	}
1599	case X86::ADD8ri:
1600	case X86::ADD8ri_DB:
1601	Is8BitOp = true;
1602	LLVM_FALLTHROUGH[[gnu::fallthrough]];
1603	case X86::ADD16ri:
1604	case X86::ADD16ri8:
1605	case X86::ADD16ri_DB:
1606	case X86::ADD16ri8_DB:
1607	return convertToThreeAddressWithLEA(MIOpc, MFI, MI, LV, Is8BitOp);
1608	case X86::SUB8ri:
1609	case X86::SUB16ri8:
1610	case X86::SUB16ri:
1611	/// FIXME: Support these similar to ADD8ri/ADD16ri*.
1612	return nullptr;
1613	case X86::SUB32ri8:
1614	case X86::SUB32ri: {
1615	if (!MI.getOperand(2).isImm())
1616	return nullptr;
1617	int64_t Imm = MI.getOperand(2).getImm();
1618	if (!isInt<32>(-Imm))
1619	return nullptr;
1620
1621	assert(MI.getNumOperands() >= 3 && "Unknown add instruction!")(static_cast <bool> (MI.getNumOperands() >= 3 && "Unknown add instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 3 && \"Unknown add instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1621, __extension__ __PRETTY_FUNCTION__));
1622	unsigned Opc = Is64Bit ? X86::LEA64_32r : X86::LEA32r;
1623
1624	bool isKill;
1625	Register SrcReg;
1626	MachineOperand ImplicitOp = MachineOperand::CreateReg(0, false);
1627	if (!classifyLEAReg(MI, Src, Opc, /AllowSP=/ true,
1628	SrcReg, isKill, ImplicitOp, LV))
1629	return nullptr;
1630
1631	MachineInstrBuilder MIB = BuildMI(MF, MI.getDebugLoc(), get(Opc))
1632	.add(Dest)
1633	.addReg(SrcReg, getKillRegState(isKill));
1634	if (ImplicitOp.getReg() != 0)
1635	MIB.add(ImplicitOp);
1636
1637	NewMI = addOffset(MIB, -Imm);
1638	break;
1639	}
1640
1641	case X86::SUB64ri8:
1642	case X86::SUB64ri32: {
1643	if (!MI.getOperand(2).isImm())
1644	return nullptr;
1645	int64_t Imm = MI.getOperand(2).getImm();
1646	if (!isInt<32>(-Imm))
1647	return nullptr;
1648
1649	assert(MI.getNumOperands() >= 3 && "Unknown sub instruction!")(static_cast <bool> (MI.getNumOperands() >= 3 && "Unknown sub instruction!") ? void (0) : __assert_fail ("MI.getNumOperands() >= 3 && \"Unknown sub instruction!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1649, __extension__ __PRETTY_FUNCTION__));
1650
1651	MachineInstrBuilder MIB = BuildMI(MF, MI.getDebugLoc(),
1652	get(X86::LEA64r)).add(Dest).add(Src);
1653	NewMI = addOffset(MIB, -Imm);
1654	break;
1655	}
1656
1657	case X86::VMOVDQU8Z128rmk:
1658	case X86::VMOVDQU8Z256rmk:
1659	case X86::VMOVDQU8Zrmk:
1660	case X86::VMOVDQU16Z128rmk:
1661	case X86::VMOVDQU16Z256rmk:
1662	case X86::VMOVDQU16Zrmk:
1663	case X86::VMOVDQU32Z128rmk: case X86::VMOVDQA32Z128rmk:
1664	case X86::VMOVDQU32Z256rmk: case X86::VMOVDQA32Z256rmk:
1665	case X86::VMOVDQU32Zrmk: case X86::VMOVDQA32Zrmk:
1666	case X86::VMOVDQU64Z128rmk: case X86::VMOVDQA64Z128rmk:
1667	case X86::VMOVDQU64Z256rmk: case X86::VMOVDQA64Z256rmk:
1668	case X86::VMOVDQU64Zrmk: case X86::VMOVDQA64Zrmk:
1669	case X86::VMOVUPDZ128rmk: case X86::VMOVAPDZ128rmk:
1670	case X86::VMOVUPDZ256rmk: case X86::VMOVAPDZ256rmk:
1671	case X86::VMOVUPDZrmk: case X86::VMOVAPDZrmk:
1672	case X86::VMOVUPSZ128rmk: case X86::VMOVAPSZ128rmk:
1673	case X86::VMOVUPSZ256rmk: case X86::VMOVAPSZ256rmk:
1674	case X86::VMOVUPSZrmk: case X86::VMOVAPSZrmk:
1675	case X86::VBROADCASTSDZ256rmk:
1676	case X86::VBROADCASTSDZrmk:
1677	case X86::VBROADCASTSSZ128rmk:
1678	case X86::VBROADCASTSSZ256rmk:
1679	case X86::VBROADCASTSSZrmk:
1680	case X86::VPBROADCASTDZ128rmk:
1681	case X86::VPBROADCASTDZ256rmk:
1682	case X86::VPBROADCASTDZrmk:
1683	case X86::VPBROADCASTQZ128rmk:
1684	case X86::VPBROADCASTQZ256rmk:
1685	case X86::VPBROADCASTQZrmk: {
1686	unsigned Opc;
1687	switch (MIOpc) {
1688	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1688);
1689	case X86::VMOVDQU8Z128rmk: Opc = X86::VPBLENDMBZ128rmk; break;
1690	case X86::VMOVDQU8Z256rmk: Opc = X86::VPBLENDMBZ256rmk; break;
1691	case X86::VMOVDQU8Zrmk: Opc = X86::VPBLENDMBZrmk; break;
1692	case X86::VMOVDQU16Z128rmk: Opc = X86::VPBLENDMWZ128rmk; break;
1693	case X86::VMOVDQU16Z256rmk: Opc = X86::VPBLENDMWZ256rmk; break;
1694	case X86::VMOVDQU16Zrmk: Opc = X86::VPBLENDMWZrmk; break;
1695	case X86::VMOVDQU32Z128rmk: Opc = X86::VPBLENDMDZ128rmk; break;
1696	case X86::VMOVDQU32Z256rmk: Opc = X86::VPBLENDMDZ256rmk; break;
1697	case X86::VMOVDQU32Zrmk: Opc = X86::VPBLENDMDZrmk; break;
1698	case X86::VMOVDQU64Z128rmk: Opc = X86::VPBLENDMQZ128rmk; break;
1699	case X86::VMOVDQU64Z256rmk: Opc = X86::VPBLENDMQZ256rmk; break;
1700	case X86::VMOVDQU64Zrmk: Opc = X86::VPBLENDMQZrmk; break;
1701	case X86::VMOVUPDZ128rmk: Opc = X86::VBLENDMPDZ128rmk; break;
1702	case X86::VMOVUPDZ256rmk: Opc = X86::VBLENDMPDZ256rmk; break;
1703	case X86::VMOVUPDZrmk: Opc = X86::VBLENDMPDZrmk; break;
1704	case X86::VMOVUPSZ128rmk: Opc = X86::VBLENDMPSZ128rmk; break;
1705	case X86::VMOVUPSZ256rmk: Opc = X86::VBLENDMPSZ256rmk; break;
1706	case X86::VMOVUPSZrmk: Opc = X86::VBLENDMPSZrmk; break;
1707	case X86::VMOVDQA32Z128rmk: Opc = X86::VPBLENDMDZ128rmk; break;
1708	case X86::VMOVDQA32Z256rmk: Opc = X86::VPBLENDMDZ256rmk; break;
1709	case X86::VMOVDQA32Zrmk: Opc = X86::VPBLENDMDZrmk; break;
1710	case X86::VMOVDQA64Z128rmk: Opc = X86::VPBLENDMQZ128rmk; break;
1711	case X86::VMOVDQA64Z256rmk: Opc = X86::VPBLENDMQZ256rmk; break;
1712	case X86::VMOVDQA64Zrmk: Opc = X86::VPBLENDMQZrmk; break;
1713	case X86::VMOVAPDZ128rmk: Opc = X86::VBLENDMPDZ128rmk; break;
1714	case X86::VMOVAPDZ256rmk: Opc = X86::VBLENDMPDZ256rmk; break;
1715	case X86::VMOVAPDZrmk: Opc = X86::VBLENDMPDZrmk; break;
1716	case X86::VMOVAPSZ128rmk: Opc = X86::VBLENDMPSZ128rmk; break;
1717	case X86::VMOVAPSZ256rmk: Opc = X86::VBLENDMPSZ256rmk; break;
1718	case X86::VMOVAPSZrmk: Opc = X86::VBLENDMPSZrmk; break;
1719	case X86::VBROADCASTSDZ256rmk: Opc = X86::VBLENDMPDZ256rmbk; break;
1720	case X86::VBROADCASTSDZrmk: Opc = X86::VBLENDMPDZrmbk; break;
1721	case X86::VBROADCASTSSZ128rmk: Opc = X86::VBLENDMPSZ128rmbk; break;
1722	case X86::VBROADCASTSSZ256rmk: Opc = X86::VBLENDMPSZ256rmbk; break;
1723	case X86::VBROADCASTSSZrmk: Opc = X86::VBLENDMPSZrmbk; break;
1724	case X86::VPBROADCASTDZ128rmk: Opc = X86::VPBLENDMDZ128rmbk; break;
1725	case X86::VPBROADCASTDZ256rmk: Opc = X86::VPBLENDMDZ256rmbk; break;
1726	case X86::VPBROADCASTDZrmk: Opc = X86::VPBLENDMDZrmbk; break;
1727	case X86::VPBROADCASTQZ128rmk: Opc = X86::VPBLENDMQZ128rmbk; break;
1728	case X86::VPBROADCASTQZ256rmk: Opc = X86::VPBLENDMQZ256rmbk; break;
1729	case X86::VPBROADCASTQZrmk: Opc = X86::VPBLENDMQZrmbk; break;
1730	}
1731
1732	NewMI = BuildMI(MF, MI.getDebugLoc(), get(Opc))
1733	.add(Dest)
1734	.add(MI.getOperand(2))
1735	.add(Src)
1736	.add(MI.getOperand(3))
1737	.add(MI.getOperand(4))
1738	.add(MI.getOperand(5))
1739	.add(MI.getOperand(6))
1740	.add(MI.getOperand(7));
1741	break;
1742	}
1743
1744	case X86::VMOVDQU8Z128rrk:
1745	case X86::VMOVDQU8Z256rrk:
1746	case X86::VMOVDQU8Zrrk:
1747	case X86::VMOVDQU16Z128rrk:
1748	case X86::VMOVDQU16Z256rrk:
1749	case X86::VMOVDQU16Zrrk:
1750	case X86::VMOVDQU32Z128rrk: case X86::VMOVDQA32Z128rrk:
1751	case X86::VMOVDQU32Z256rrk: case X86::VMOVDQA32Z256rrk:
1752	case X86::VMOVDQU32Zrrk: case X86::VMOVDQA32Zrrk:
1753	case X86::VMOVDQU64Z128rrk: case X86::VMOVDQA64Z128rrk:
1754	case X86::VMOVDQU64Z256rrk: case X86::VMOVDQA64Z256rrk:
1755	case X86::VMOVDQU64Zrrk: case X86::VMOVDQA64Zrrk:
1756	case X86::VMOVUPDZ128rrk: case X86::VMOVAPDZ128rrk:
1757	case X86::VMOVUPDZ256rrk: case X86::VMOVAPDZ256rrk:
1758	case X86::VMOVUPDZrrk: case X86::VMOVAPDZrrk:
1759	case X86::VMOVUPSZ128rrk: case X86::VMOVAPSZ128rrk:
1760	case X86::VMOVUPSZ256rrk: case X86::VMOVAPSZ256rrk:
1761	case X86::VMOVUPSZrrk: case X86::VMOVAPSZrrk: {
1762	unsigned Opc;
1763	switch (MIOpc) {
1764	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1764);
1765	case X86::VMOVDQU8Z128rrk: Opc = X86::VPBLENDMBZ128rrk; break;
1766	case X86::VMOVDQU8Z256rrk: Opc = X86::VPBLENDMBZ256rrk; break;
1767	case X86::VMOVDQU8Zrrk: Opc = X86::VPBLENDMBZrrk; break;
1768	case X86::VMOVDQU16Z128rrk: Opc = X86::VPBLENDMWZ128rrk; break;
1769	case X86::VMOVDQU16Z256rrk: Opc = X86::VPBLENDMWZ256rrk; break;
1770	case X86::VMOVDQU16Zrrk: Opc = X86::VPBLENDMWZrrk; break;
1771	case X86::VMOVDQU32Z128rrk: Opc = X86::VPBLENDMDZ128rrk; break;
1772	case X86::VMOVDQU32Z256rrk: Opc = X86::VPBLENDMDZ256rrk; break;
1773	case X86::VMOVDQU32Zrrk: Opc = X86::VPBLENDMDZrrk; break;
1774	case X86::VMOVDQU64Z128rrk: Opc = X86::VPBLENDMQZ128rrk; break;
1775	case X86::VMOVDQU64Z256rrk: Opc = X86::VPBLENDMQZ256rrk; break;
1776	case X86::VMOVDQU64Zrrk: Opc = X86::VPBLENDMQZrrk; break;
1777	case X86::VMOVUPDZ128rrk: Opc = X86::VBLENDMPDZ128rrk; break;
1778	case X86::VMOVUPDZ256rrk: Opc = X86::VBLENDMPDZ256rrk; break;
1779	case X86::VMOVUPDZrrk: Opc = X86::VBLENDMPDZrrk; break;
1780	case X86::VMOVUPSZ128rrk: Opc = X86::VBLENDMPSZ128rrk; break;
1781	case X86::VMOVUPSZ256rrk: Opc = X86::VBLENDMPSZ256rrk; break;
1782	case X86::VMOVUPSZrrk: Opc = X86::VBLENDMPSZrrk; break;
1783	case X86::VMOVDQA32Z128rrk: Opc = X86::VPBLENDMDZ128rrk; break;
1784	case X86::VMOVDQA32Z256rrk: Opc = X86::VPBLENDMDZ256rrk; break;
1785	case X86::VMOVDQA32Zrrk: Opc = X86::VPBLENDMDZrrk; break;
1786	case X86::VMOVDQA64Z128rrk: Opc = X86::VPBLENDMQZ128rrk; break;
1787	case X86::VMOVDQA64Z256rrk: Opc = X86::VPBLENDMQZ256rrk; break;
1788	case X86::VMOVDQA64Zrrk: Opc = X86::VPBLENDMQZrrk; break;
1789	case X86::VMOVAPDZ128rrk: Opc = X86::VBLENDMPDZ128rrk; break;
1790	case X86::VMOVAPDZ256rrk: Opc = X86::VBLENDMPDZ256rrk; break;
1791	case X86::VMOVAPDZrrk: Opc = X86::VBLENDMPDZrrk; break;
1792	case X86::VMOVAPSZ128rrk: Opc = X86::VBLENDMPSZ128rrk; break;
1793	case X86::VMOVAPSZ256rrk: Opc = X86::VBLENDMPSZ256rrk; break;
1794	case X86::VMOVAPSZrrk: Opc = X86::VBLENDMPSZrrk; break;
1795	}
1796
1797	NewMI = BuildMI(MF, MI.getDebugLoc(), get(Opc))
1798	.add(Dest)
1799	.add(MI.getOperand(2))
1800	.add(Src)
1801	.add(MI.getOperand(3));
1802	break;
1803	}
1804	}
1805
1806	if (!NewMI) return nullptr;
1807
1808	if (LV) { // Update live variables
1809	if (Src.isKill())
1810	LV->replaceKillInstruction(Src.getReg(), MI, *NewMI);
1811	if (Dest.isDead())
1812	LV->replaceKillInstruction(Dest.getReg(), MI, *NewMI);
1813	}
1814
1815	MFI->insert(MI.getIterator(), NewMI); // Insert the new inst
1816	return NewMI;
1817	}
1818
1819	/// This determines which of three possible cases of a three source commute
1820	/// the source indexes correspond to taking into account any mask operands.
1821	/// All prevents commuting a passthru operand. Returns -1 if the commute isn't
1822	/// possible.
1823	/// Case 0 - Possible to commute the first and second operands.
1824	/// Case 1 - Possible to commute the first and third operands.
1825	/// Case 2 - Possible to commute the second and third operands.
1826	static unsigned getThreeSrcCommuteCase(uint64_t TSFlags, unsigned SrcOpIdx1,
1827	unsigned SrcOpIdx2) {
1828	// Put the lowest index to SrcOpIdx1 to simplify the checks below.
1829	if (SrcOpIdx1 > SrcOpIdx2)
1830	std::swap(SrcOpIdx1, SrcOpIdx2);
1831
1832	unsigned Op1 = 1, Op2 = 2, Op3 = 3;
1833	if (X86II::isKMasked(TSFlags)) {
1834	Op2++;
1835	Op3++;
1836	}
1837
1838	if (SrcOpIdx1 == Op1 && SrcOpIdx2 == Op2)
1839	return 0;
1840	if (SrcOpIdx1 == Op1 && SrcOpIdx2 == Op3)
1841	return 1;
1842	if (SrcOpIdx1 == Op2 && SrcOpIdx2 == Op3)
1843	return 2;
1844	llvm_unreachable("Unknown three src commute case.")::llvm::llvm_unreachable_internal("Unknown three src commute case." , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1844);
1845	}
1846
1847	unsigned X86InstrInfo::getFMA3OpcodeToCommuteOperands(
1848	const MachineInstr &MI, unsigned SrcOpIdx1, unsigned SrcOpIdx2,
1849	const X86InstrFMA3Group &FMA3Group) const {
1850
1851	unsigned Opc = MI.getOpcode();
1852
1853	// TODO: Commuting the 1st operand of FMA*_Int requires some additional
1854	// analysis. The commute optimization is legal only if all users of FMA*_Int
1855	// use only the lowest element of the FMA*_Int instruction. Such analysis are
1856	// not implemented yet. So, just return 0 in that case.
1857	// When such analysis are available this place will be the right place for
1858	// calling it.
1859	assert(!(FMA3Group.isIntrinsic() && (SrcOpIdx1 == 1 \|\| SrcOpIdx2 == 1)) &&(static_cast <bool> (!(FMA3Group.isIntrinsic() && (SrcOpIdx1 == 1 \|\| SrcOpIdx2 == 1)) && "Intrinsic instructions can't commute operand 1" ) ? void (0) : __assert_fail ("!(FMA3Group.isIntrinsic() && (SrcOpIdx1 == 1 \|\| SrcOpIdx2 == 1)) && \"Intrinsic instructions can't commute operand 1\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1860, __extension__ __PRETTY_FUNCTION__))
1860	"Intrinsic instructions can't commute operand 1")(static_cast <bool> (!(FMA3Group.isIntrinsic() && (SrcOpIdx1 == 1 \|\| SrcOpIdx2 == 1)) && "Intrinsic instructions can't commute operand 1" ) ? void (0) : __assert_fail ("!(FMA3Group.isIntrinsic() && (SrcOpIdx1 == 1 \|\| SrcOpIdx2 == 1)) && \"Intrinsic instructions can't commute operand 1\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1860, __extension__ __PRETTY_FUNCTION__));
1861
1862	// Determine which case this commute is or if it can't be done.
1863	unsigned Case = getThreeSrcCommuteCase(MI.getDesc().TSFlags, SrcOpIdx1,
1864	SrcOpIdx2);
1865	assert(Case < 3 && "Unexpected case number!")(static_cast <bool> (Case < 3 && "Unexpected case number!" ) ? void (0) : __assert_fail ("Case < 3 && \"Unexpected case number!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1865, __extension__ __PRETTY_FUNCTION__));
1866
1867	// Define the FMA forms mapping array that helps to map input FMA form
1868	// to output FMA form to preserve the operation semantics after
1869	// commuting the operands.
1870	const unsigned Form132Index = 0;
1871	const unsigned Form213Index = 1;
1872	const unsigned Form231Index = 2;
1873	static const unsigned FormMapping[][3] = {
1874	// 0: SrcOpIdx1 == 1 && SrcOpIdx2 == 2;
1875	// FMA132 A, C, b; ==> FMA231 C, A, b;
1876	// FMA213 B, A, c; ==> FMA213 A, B, c;
1877	// FMA231 C, A, b; ==> FMA132 A, C, b;
1878	{ Form231Index, Form213Index, Form132Index },
1879	// 1: SrcOpIdx1 == 1 && SrcOpIdx2 == 3;
1880	// FMA132 A, c, B; ==> FMA132 B, c, A;
1881	// FMA213 B, a, C; ==> FMA231 C, a, B;
1882	// FMA231 C, a, B; ==> FMA213 B, a, C;
1883	{ Form132Index, Form231Index, Form213Index },
1884	// 2: SrcOpIdx1 == 2 && SrcOpIdx2 == 3;
1885	// FMA132 a, C, B; ==> FMA213 a, B, C;
1886	// FMA213 b, A, C; ==> FMA132 b, C, A;
1887	// FMA231 c, A, B; ==> FMA231 c, B, A;
1888	{ Form213Index, Form132Index, Form231Index }
1889	};
1890
1891	unsigned FMAForms[3];
1892	FMAForms[0] = FMA3Group.get132Opcode();
1893	FMAForms[1] = FMA3Group.get213Opcode();
1894	FMAForms[2] = FMA3Group.get231Opcode();
1895	unsigned FormIndex;
1896	for (FormIndex = 0; FormIndex < 3; FormIndex++)
1897	if (Opc == FMAForms[FormIndex])
1898	break;
1899
1900	// Everything is ready, just adjust the FMA opcode and return it.
1901	FormIndex = FormMapping[Case][FormIndex];
1902	return FMAForms[FormIndex];
1903	}
1904
1905	static void commuteVPTERNLOG(MachineInstr &MI, unsigned SrcOpIdx1,
1906	unsigned SrcOpIdx2) {
1907	// Determine which case this commute is or if it can't be done.
1908	unsigned Case = getThreeSrcCommuteCase(MI.getDesc().TSFlags, SrcOpIdx1,
1909	SrcOpIdx2);
1910	assert(Case < 3 && "Unexpected case value!")(static_cast <bool> (Case < 3 && "Unexpected case value!" ) ? void (0) : __assert_fail ("Case < 3 && \"Unexpected case value!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 1910, __extension__ __PRETTY_FUNCTION__));
1911
1912	// For each case we need to swap two pairs of bits in the final immediate.
1913	static const uint8_t SwapMasks[3][4] = {
1914	{ 0x04, 0x10, 0x08, 0x20 }, // Swap bits 2/4 and 3/5.
1915	{ 0x02, 0x10, 0x08, 0x40 }, // Swap bits 1/4 and 3/6.
1916	{ 0x02, 0x04, 0x20, 0x40 }, // Swap bits 1/2 and 5/6.
1917	};
1918
1919	uint8_t Imm = MI.getOperand(MI.getNumOperands()-1).getImm();
1920	// Clear out the bits we are swapping.
1921	uint8_t NewImm = Imm & ~(SwapMasks[Case][0] \| SwapMasks[Case][1] \|
1922	SwapMasks[Case][2] \| SwapMasks[Case][3]);
1923	// If the immediate had a bit of the pair set, then set the opposite bit.
1924	if (Imm & SwapMasks[Case][0]) NewImm \|= SwapMasks[Case][1];
1925	if (Imm & SwapMasks[Case][1]) NewImm \|= SwapMasks[Case][0];
1926	if (Imm & SwapMasks[Case][2]) NewImm \|= SwapMasks[Case][3];
1927	if (Imm & SwapMasks[Case][3]) NewImm \|= SwapMasks[Case][2];
1928	MI.getOperand(MI.getNumOperands()-1).setImm(NewImm);
1929	}
1930
1931	// Returns true if this is a VPERMI2 or VPERMT2 instruction that can be
1932	// commuted.
1933	static bool isCommutableVPERMV3Instruction(unsigned Opcode) {
1934	#define VPERM_CASES(Suffix) \
1935	case X86::VPERMI2##Suffix##128rr: case X86::VPERMT2##Suffix##128rr: \
1936	case X86::VPERMI2##Suffix##256rr: case X86::VPERMT2##Suffix##256rr: \
1937	case X86::VPERMI2##Suffix##rr: case X86::VPERMT2##Suffix##rr: \
1938	case X86::VPERMI2##Suffix##128rm: case X86::VPERMT2##Suffix##128rm: \
1939	case X86::VPERMI2##Suffix##256rm: case X86::VPERMT2##Suffix##256rm: \
1940	case X86::VPERMI2##Suffix##rm: case X86::VPERMT2##Suffix##rm: \
1941	case X86::VPERMI2##Suffix##128rrkz: case X86::VPERMT2##Suffix##128rrkz: \
1942	case X86::VPERMI2##Suffix##256rrkz: case X86::VPERMT2##Suffix##256rrkz: \
1943	case X86::VPERMI2##Suffix##rrkz: case X86::VPERMT2##Suffix##rrkz: \
1944	case X86::VPERMI2##Suffix##128rmkz: case X86::VPERMT2##Suffix##128rmkz: \
1945	case X86::VPERMI2##Suffix##256rmkz: case X86::VPERMT2##Suffix##256rmkz: \
1946	case X86::VPERMI2##Suffix##rmkz: case X86::VPERMT2##Suffix##rmkz:
1947
1948	#define VPERM_CASES_BROADCAST(Suffix) \
1949	VPERM_CASES(Suffix) \
1950	case X86::VPERMI2##Suffix##128rmb: case X86::VPERMT2##Suffix##128rmb: \
1951	case X86::VPERMI2##Suffix##256rmb: case X86::VPERMT2##Suffix##256rmb: \
1952	case X86::VPERMI2##Suffix##rmb: case X86::VPERMT2##Suffix##rmb: \
1953	case X86::VPERMI2##Suffix##128rmbkz: case X86::VPERMT2##Suffix##128rmbkz: \
1954	case X86::VPERMI2##Suffix##256rmbkz: case X86::VPERMT2##Suffix##256rmbkz: \
1955	case X86::VPERMI2##Suffix##rmbkz: case X86::VPERMT2##Suffix##rmbkz:
1956
1957	switch (Opcode) {
1958	default: return false;
1959	VPERM_CASES(B)
1960	VPERM_CASES_BROADCAST(D)
1961	VPERM_CASES_BROADCAST(PD)
1962	VPERM_CASES_BROADCAST(PS)
1963	VPERM_CASES_BROADCAST(Q)
1964	VPERM_CASES(W)
1965	return true;
1966	}
1967	#undef VPERM_CASES_BROADCAST
1968	#undef VPERM_CASES
1969	}
1970
1971	// Returns commuted opcode for VPERMI2 and VPERMT2 instructions by switching
1972	// from the I opcode to the T opcode and vice versa.
1973	static unsigned getCommutedVPERMV3Opcode(unsigned Opcode) {
1974	#define VPERM_CASES(Orig, New) \
1975	case X86::Orig##128rr: return X86::New##128rr; \
1976	case X86::Orig##128rrkz: return X86::New##128rrkz; \
1977	case X86::Orig##128rm: return X86::New##128rm; \
1978	case X86::Orig##128rmkz: return X86::New##128rmkz; \
1979	case X86::Orig##256rr: return X86::New##256rr; \
1980	case X86::Orig##256rrkz: return X86::New##256rrkz; \
1981	case X86::Orig##256rm: return X86::New##256rm; \
1982	case X86::Orig##256rmkz: return X86::New##256rmkz; \
1983	case X86::Orig##rr: return X86::New##rr; \
1984	case X86::Orig##rrkz: return X86::New##rrkz; \
1985	case X86::Orig##rm: return X86::New##rm; \
1986	case X86::Orig##rmkz: return X86::New##rmkz;
1987
1988	#define VPERM_CASES_BROADCAST(Orig, New) \
1989	VPERM_CASES(Orig, New) \
1990	case X86::Orig##128rmb: return X86::New##128rmb; \
1991	case X86::Orig##128rmbkz: return X86::New##128rmbkz; \
1992	case X86::Orig##256rmb: return X86::New##256rmb; \
1993	case X86::Orig##256rmbkz: return X86::New##256rmbkz; \
1994	case X86::Orig##rmb: return X86::New##rmb; \
1995	case X86::Orig##rmbkz: return X86::New##rmbkz;
1996
1997	switch (Opcode) {
1998	VPERM_CASES(VPERMI2B, VPERMT2B)
1999	VPERM_CASES_BROADCAST(VPERMI2D, VPERMT2D)
2000	VPERM_CASES_BROADCAST(VPERMI2PD, VPERMT2PD)
2001	VPERM_CASES_BROADCAST(VPERMI2PS, VPERMT2PS)
2002	VPERM_CASES_BROADCAST(VPERMI2Q, VPERMT2Q)
2003	VPERM_CASES(VPERMI2W, VPERMT2W)
2004	VPERM_CASES(VPERMT2B, VPERMI2B)
2005	VPERM_CASES_BROADCAST(VPERMT2D, VPERMI2D)
2006	VPERM_CASES_BROADCAST(VPERMT2PD, VPERMI2PD)
2007	VPERM_CASES_BROADCAST(VPERMT2PS, VPERMI2PS)
2008	VPERM_CASES_BROADCAST(VPERMT2Q, VPERMI2Q)
2009	VPERM_CASES(VPERMT2W, VPERMI2W)
2010	}
2011
2012	llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2012);
2013	#undef VPERM_CASES_BROADCAST
2014	#undef VPERM_CASES
2015	}
2016
2017	MachineInstr *X86InstrInfo::commuteInstructionImpl(MachineInstr &MI, bool NewMI,
2018	unsigned OpIdx1,
2019	unsigned OpIdx2) const {
2020	auto cloneIfNew = [NewMI](MachineInstr &MI) -> MachineInstr & {
2021	if (NewMI)
2022	return *MI.getParent()->getParent()->CloneMachineInstr(&MI);
2023	return MI;
2024	};
2025
2026	switch (MI.getOpcode()) {
2027	case X86::SHRD16rri8: // A = SHRD16rri8 B, C, I -> A = SHLD16rri8 C, B, (16-I)
2028	case X86::SHLD16rri8: // A = SHLD16rri8 B, C, I -> A = SHRD16rri8 C, B, (16-I)
2029	case X86::SHRD32rri8: // A = SHRD32rri8 B, C, I -> A = SHLD32rri8 C, B, (32-I)
2030	case X86::SHLD32rri8: // A = SHLD32rri8 B, C, I -> A = SHRD32rri8 C, B, (32-I)
2031	case X86::SHRD64rri8: // A = SHRD64rri8 B, C, I -> A = SHLD64rri8 C, B, (64-I)
2032	case X86::SHLD64rri8:{// A = SHLD64rri8 B, C, I -> A = SHRD64rri8 C, B, (64-I)
2033	unsigned Opc;
2034	unsigned Size;
2035	switch (MI.getOpcode()) {
2036	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2036);
2037	case X86::SHRD16rri8: Size = 16; Opc = X86::SHLD16rri8; break;
2038	case X86::SHLD16rri8: Size = 16; Opc = X86::SHRD16rri8; break;
2039	case X86::SHRD32rri8: Size = 32; Opc = X86::SHLD32rri8; break;
2040	case X86::SHLD32rri8: Size = 32; Opc = X86::SHRD32rri8; break;
2041	case X86::SHRD64rri8: Size = 64; Opc = X86::SHLD64rri8; break;
2042	case X86::SHLD64rri8: Size = 64; Opc = X86::SHRD64rri8; break;
2043	}
2044	unsigned Amt = MI.getOperand(3).getImm();
2045	auto &WorkingMI = cloneIfNew(MI);
2046	WorkingMI.setDesc(get(Opc));
2047	WorkingMI.getOperand(3).setImm(Size - Amt);
2048	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2049	OpIdx1, OpIdx2);
2050	}
2051	case X86::PFSUBrr:
2052	case X86::PFSUBRrr: {
2053	// PFSUB x, y: x = x - y
2054	// PFSUBR x, y: x = y - x
2055	unsigned Opc =
2056	(X86::PFSUBRrr == MI.getOpcode() ? X86::PFSUBrr : X86::PFSUBRrr);
2057	auto &WorkingMI = cloneIfNew(MI);
2058	WorkingMI.setDesc(get(Opc));
2059	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2060	OpIdx1, OpIdx2);
2061	}
2062	case X86::BLENDPDrri:
2063	case X86::BLENDPSrri:
2064	case X86::VBLENDPDrri:
2065	case X86::VBLENDPSrri:
2066	// If we're optimizing for size, try to use MOVSD/MOVSS.
2067	if (MI.getParent()->getParent()->getFunction().hasOptSize()) {
2068	unsigned Mask, Opc;
2069	switch (MI.getOpcode()) {
2070	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2070);
2071	case X86::BLENDPDrri: Opc = X86::MOVSDrr; Mask = 0x03; break;
2072	case X86::BLENDPSrri: Opc = X86::MOVSSrr; Mask = 0x0F; break;
2073	case X86::VBLENDPDrri: Opc = X86::VMOVSDrr; Mask = 0x03; break;
2074	case X86::VBLENDPSrri: Opc = X86::VMOVSSrr; Mask = 0x0F; break;
2075	}
2076	if ((MI.getOperand(3).getImm() ^ Mask) == 1) {
2077	auto &WorkingMI = cloneIfNew(MI);
2078	WorkingMI.setDesc(get(Opc));
2079	WorkingMI.RemoveOperand(3);
2080	return TargetInstrInfo::commuteInstructionImpl(WorkingMI,
2081	/NewMI=/false,
2082	OpIdx1, OpIdx2);
2083	}
2084	}
2085	LLVM_FALLTHROUGH[[gnu::fallthrough]];
2086	case X86::PBLENDWrri:
2087	case X86::VBLENDPDYrri:
2088	case X86::VBLENDPSYrri:
2089	case X86::VPBLENDDrri:
2090	case X86::VPBLENDWrri:
2091	case X86::VPBLENDDYrri:
2092	case X86::VPBLENDWYrri:{
2093	int8_t Mask;
2094	switch (MI.getOpcode()) {
2095	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2095);
2096	case X86::BLENDPDrri: Mask = (int8_t)0x03; break;
2097	case X86::BLENDPSrri: Mask = (int8_t)0x0F; break;
2098	case X86::PBLENDWrri: Mask = (int8_t)0xFF; break;
2099	case X86::VBLENDPDrri: Mask = (int8_t)0x03; break;
2100	case X86::VBLENDPSrri: Mask = (int8_t)0x0F; break;
2101	case X86::VBLENDPDYrri: Mask = (int8_t)0x0F; break;
2102	case X86::VBLENDPSYrri: Mask = (int8_t)0xFF; break;
2103	case X86::VPBLENDDrri: Mask = (int8_t)0x0F; break;
2104	case X86::VPBLENDWrri: Mask = (int8_t)0xFF; break;
2105	case X86::VPBLENDDYrri: Mask = (int8_t)0xFF; break;
2106	case X86::VPBLENDWYrri: Mask = (int8_t)0xFF; break;
2107	}
2108	// Only the least significant bits of Imm are used.
2109	// Using int8_t to ensure it will be sign extended to the int64_t that
2110	// setImm takes in order to match isel behavior.
2111	int8_t Imm = MI.getOperand(3).getImm() & Mask;
2112	auto &WorkingMI = cloneIfNew(MI);
2113	WorkingMI.getOperand(3).setImm(Mask ^ Imm);
2114	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2115	OpIdx1, OpIdx2);
2116	}
2117	case X86::INSERTPSrr:
2118	case X86::VINSERTPSrr:
2119	case X86::VINSERTPSZrr: {
2120	unsigned Imm = MI.getOperand(MI.getNumOperands() - 1).getImm();
2121	unsigned ZMask = Imm & 15;
2122	unsigned DstIdx = (Imm >> 4) & 3;
2123	unsigned SrcIdx = (Imm >> 6) & 3;
2124
2125	// We can commute insertps if we zero 2 of the elements, the insertion is
2126	// "inline" and we don't override the insertion with a zero.
2127	if (DstIdx == SrcIdx && (ZMask & (1 << DstIdx)) == 0 &&
2128	countPopulation(ZMask) == 2) {
2129	unsigned AltIdx = findFirstSet((ZMask \| (1 << DstIdx)) ^ 15);
2130	assert(AltIdx < 4 && "Illegal insertion index")(static_cast <bool> (AltIdx < 4 && "Illegal insertion index" ) ? void (0) : __assert_fail ("AltIdx < 4 && \"Illegal insertion index\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2130, __extension__ __PRETTY_FUNCTION__));
2131	unsigned AltImm = (AltIdx << 6) \| (AltIdx << 4) \| ZMask;
2132	auto &WorkingMI = cloneIfNew(MI);
2133	WorkingMI.getOperand(MI.getNumOperands() - 1).setImm(AltImm);
2134	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2135	OpIdx1, OpIdx2);
2136	}
2137	return nullptr;
2138	}
2139	case X86::MOVSDrr:
2140	case X86::MOVSSrr:
2141	case X86::VMOVSDrr:
2142	case X86::VMOVSSrr:{
2143	// On SSE41 or later we can commute a MOVSS/MOVSD to a BLENDPS/BLENDPD.
2144	if (Subtarget.hasSSE41()) {
2145	unsigned Mask, Opc;
2146	switch (MI.getOpcode()) {
2147	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2147);
2148	case X86::MOVSDrr: Opc = X86::BLENDPDrri; Mask = 0x02; break;
2149	case X86::MOVSSrr: Opc = X86::BLENDPSrri; Mask = 0x0E; break;
2150	case X86::VMOVSDrr: Opc = X86::VBLENDPDrri; Mask = 0x02; break;
2151	case X86::VMOVSSrr: Opc = X86::VBLENDPSrri; Mask = 0x0E; break;
2152	}
2153
2154	auto &WorkingMI = cloneIfNew(MI);
2155	WorkingMI.setDesc(get(Opc));
2156	WorkingMI.addOperand(MachineOperand::CreateImm(Mask));
2157	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2158	OpIdx1, OpIdx2);
2159	}
2160
2161	// Convert to SHUFPD.
2162	assert(MI.getOpcode() == X86::MOVSDrr &&(static_cast <bool> (MI.getOpcode() == X86::MOVSDrr && "Can only commute MOVSDrr without SSE4.1") ? void (0) : __assert_fail ("MI.getOpcode() == X86::MOVSDrr && \"Can only commute MOVSDrr without SSE4.1\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2163, __extension__ __PRETTY_FUNCTION__))
2163	"Can only commute MOVSDrr without SSE4.1")(static_cast <bool> (MI.getOpcode() == X86::MOVSDrr && "Can only commute MOVSDrr without SSE4.1") ? void (0) : __assert_fail ("MI.getOpcode() == X86::MOVSDrr && \"Can only commute MOVSDrr without SSE4.1\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2163, __extension__ __PRETTY_FUNCTION__));
2164
2165	auto &WorkingMI = cloneIfNew(MI);
2166	WorkingMI.setDesc(get(X86::SHUFPDrri));
2167	WorkingMI.addOperand(MachineOperand::CreateImm(0x02));
2168	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2169	OpIdx1, OpIdx2);
2170	}
2171	case X86::SHUFPDrri: {
2172	// Commute to MOVSD.
2173	assert(MI.getOperand(3).getImm() == 0x02 && "Unexpected immediate!")(static_cast <bool> (MI.getOperand(3).getImm() == 0x02 && "Unexpected immediate!") ? void (0) : __assert_fail ("MI.getOperand(3).getImm() == 0x02 && \"Unexpected immediate!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2173, __extension__ __PRETTY_FUNCTION__));
2174	auto &WorkingMI = cloneIfNew(MI);
2175	WorkingMI.setDesc(get(X86::MOVSDrr));
2176	WorkingMI.RemoveOperand(3);
2177	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2178	OpIdx1, OpIdx2);
2179	}
2180	case X86::PCLMULQDQrr:
2181	case X86::VPCLMULQDQrr:
2182	case X86::VPCLMULQDQYrr:
2183	case X86::VPCLMULQDQZrr:
2184	case X86::VPCLMULQDQZ128rr:
2185	case X86::VPCLMULQDQZ256rr: {
2186	// SRC1 64bits = Imm[0] ? SRC1[127:64] : SRC1[63:0]
2187	// SRC2 64bits = Imm[4] ? SRC2[127:64] : SRC2[63:0]
2188	unsigned Imm = MI.getOperand(3).getImm();
2189	unsigned Src1Hi = Imm & 0x01;
2190	unsigned Src2Hi = Imm & 0x10;
2191	auto &WorkingMI = cloneIfNew(MI);
2192	WorkingMI.getOperand(3).setImm((Src1Hi << 4) \| (Src2Hi >> 4));
2193	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2194	OpIdx1, OpIdx2);
2195	}
2196	case X86::VPCMPBZ128rri: case X86::VPCMPUBZ128rri:
2197	case X86::VPCMPBZ256rri: case X86::VPCMPUBZ256rri:
2198	case X86::VPCMPBZrri: case X86::VPCMPUBZrri:
2199	case X86::VPCMPDZ128rri: case X86::VPCMPUDZ128rri:
2200	case X86::VPCMPDZ256rri: case X86::VPCMPUDZ256rri:
2201	case X86::VPCMPDZrri: case X86::VPCMPUDZrri:
2202	case X86::VPCMPQZ128rri: case X86::VPCMPUQZ128rri:
2203	case X86::VPCMPQZ256rri: case X86::VPCMPUQZ256rri:
2204	case X86::VPCMPQZrri: case X86::VPCMPUQZrri:
2205	case X86::VPCMPWZ128rri: case X86::VPCMPUWZ128rri:
2206	case X86::VPCMPWZ256rri: case X86::VPCMPUWZ256rri:
2207	case X86::VPCMPWZrri: case X86::VPCMPUWZrri:
2208	case X86::VPCMPBZ128rrik: case X86::VPCMPUBZ128rrik:
2209	case X86::VPCMPBZ256rrik: case X86::VPCMPUBZ256rrik:
2210	case X86::VPCMPBZrrik: case X86::VPCMPUBZrrik:
2211	case X86::VPCMPDZ128rrik: case X86::VPCMPUDZ128rrik:
2212	case X86::VPCMPDZ256rrik: case X86::VPCMPUDZ256rrik:
2213	case X86::VPCMPDZrrik: case X86::VPCMPUDZrrik:
2214	case X86::VPCMPQZ128rrik: case X86::VPCMPUQZ128rrik:
2215	case X86::VPCMPQZ256rrik: case X86::VPCMPUQZ256rrik:
2216	case X86::VPCMPQZrrik: case X86::VPCMPUQZrrik:
2217	case X86::VPCMPWZ128rrik: case X86::VPCMPUWZ128rrik:
2218	case X86::VPCMPWZ256rrik: case X86::VPCMPUWZ256rrik:
2219	case X86::VPCMPWZrrik: case X86::VPCMPUWZrrik: {
2220	// Flip comparison mode immediate (if necessary).
2221	unsigned Imm = MI.getOperand(MI.getNumOperands() - 1).getImm() & 0x7;
2222	Imm = X86::getSwappedVPCMPImm(Imm);
2223	auto &WorkingMI = cloneIfNew(MI);
2224	WorkingMI.getOperand(MI.getNumOperands() - 1).setImm(Imm);
2225	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2226	OpIdx1, OpIdx2);
2227	}
2228	case X86::VPCOMBri: case X86::VPCOMUBri:
2229	case X86::VPCOMDri: case X86::VPCOMUDri:
2230	case X86::VPCOMQri: case X86::VPCOMUQri:
2231	case X86::VPCOMWri: case X86::VPCOMUWri: {
2232	// Flip comparison mode immediate (if necessary).
2233	unsigned Imm = MI.getOperand(3).getImm() & 0x7;
2234	Imm = X86::getSwappedVPCOMImm(Imm);
2235	auto &WorkingMI = cloneIfNew(MI);
2236	WorkingMI.getOperand(3).setImm(Imm);
2237	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2238	OpIdx1, OpIdx2);
2239	}
2240	case X86::VCMPSDZrr:
2241	case X86::VCMPSSZrr:
2242	case X86::VCMPPDZrri:
2243	case X86::VCMPPSZrri:
2244	case X86::VCMPSHZrr:
2245	case X86::VCMPPHZrri:
2246	case X86::VCMPPHZ128rri:
2247	case X86::VCMPPHZ256rri:
2248	case X86::VCMPPDZ128rri:
2249	case X86::VCMPPSZ128rri:
2250	case X86::VCMPPDZ256rri:
2251	case X86::VCMPPSZ256rri:
2252	case X86::VCMPPDZrrik:
2253	case X86::VCMPPSZrrik:
2254	case X86::VCMPPDZ128rrik:
2255	case X86::VCMPPSZ128rrik:
2256	case X86::VCMPPDZ256rrik:
2257	case X86::VCMPPSZ256rrik: {
2258	unsigned Imm =
2259	MI.getOperand(MI.getNumExplicitOperands() - 1).getImm() & 0x1f;
2260	Imm = X86::getSwappedVCMPImm(Imm);
2261	auto &WorkingMI = cloneIfNew(MI);
2262	WorkingMI.getOperand(MI.getNumExplicitOperands() - 1).setImm(Imm);
2263	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2264	OpIdx1, OpIdx2);
2265	}
2266	case X86::VPERM2F128rr:
2267	case X86::VPERM2I128rr: {
2268	// Flip permute source immediate.
2269	// Imm & 0x02: lo = if set, select Op1.lo/hi else Op0.lo/hi.
2270	// Imm & 0x20: hi = if set, select Op1.lo/hi else Op0.lo/hi.
2271	int8_t Imm = MI.getOperand(3).getImm() & 0xFF;
2272	auto &WorkingMI = cloneIfNew(MI);
2273	WorkingMI.getOperand(3).setImm(Imm ^ 0x22);
2274	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2275	OpIdx1, OpIdx2);
2276	}
2277	case X86::MOVHLPSrr:
2278	case X86::UNPCKHPDrr:
2279	case X86::VMOVHLPSrr:
2280	case X86::VUNPCKHPDrr:
2281	case X86::VMOVHLPSZrr:
2282	case X86::VUNPCKHPDZ128rr: {
2283	assert(Subtarget.hasSSE2() && "Commuting MOVHLP/UNPCKHPD requires SSE2!")(static_cast <bool> (Subtarget.hasSSE2() && "Commuting MOVHLP/UNPCKHPD requires SSE2!" ) ? void (0) : __assert_fail ("Subtarget.hasSSE2() && \"Commuting MOVHLP/UNPCKHPD requires SSE2!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2283, __extension__ __PRETTY_FUNCTION__));
2284
2285	unsigned Opc = MI.getOpcode();
2286	switch (Opc) {
2287	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2287);
2288	case X86::MOVHLPSrr: Opc = X86::UNPCKHPDrr; break;
2289	case X86::UNPCKHPDrr: Opc = X86::MOVHLPSrr; break;
2290	case X86::VMOVHLPSrr: Opc = X86::VUNPCKHPDrr; break;
2291	case X86::VUNPCKHPDrr: Opc = X86::VMOVHLPSrr; break;
2292	case X86::VMOVHLPSZrr: Opc = X86::VUNPCKHPDZ128rr; break;
2293	case X86::VUNPCKHPDZ128rr: Opc = X86::VMOVHLPSZrr; break;
2294	}
2295	auto &WorkingMI = cloneIfNew(MI);
2296	WorkingMI.setDesc(get(Opc));
2297	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2298	OpIdx1, OpIdx2);
2299	}
2300	case X86::CMOV16rr: case X86::CMOV32rr: case X86::CMOV64rr: {
2301	auto &WorkingMI = cloneIfNew(MI);
2302	unsigned OpNo = MI.getDesc().getNumOperands() - 1;
2303	X86::CondCode CC = static_cast<X86::CondCode>(MI.getOperand(OpNo).getImm());
2304	WorkingMI.getOperand(OpNo).setImm(X86::GetOppositeBranchCondition(CC));
2305	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2306	OpIdx1, OpIdx2);
2307	}
2308	case X86::VPTERNLOGDZrri: case X86::VPTERNLOGDZrmi:
2309	case X86::VPTERNLOGDZ128rri: case X86::VPTERNLOGDZ128rmi:
2310	case X86::VPTERNLOGDZ256rri: case X86::VPTERNLOGDZ256rmi:
2311	case X86::VPTERNLOGQZrri: case X86::VPTERNLOGQZrmi:
2312	case X86::VPTERNLOGQZ128rri: case X86::VPTERNLOGQZ128rmi:
2313	case X86::VPTERNLOGQZ256rri: case X86::VPTERNLOGQZ256rmi:
2314	case X86::VPTERNLOGDZrrik:
2315	case X86::VPTERNLOGDZ128rrik:
2316	case X86::VPTERNLOGDZ256rrik:
2317	case X86::VPTERNLOGQZrrik:
2318	case X86::VPTERNLOGQZ128rrik:
2319	case X86::VPTERNLOGQZ256rrik:
2320	case X86::VPTERNLOGDZrrikz: case X86::VPTERNLOGDZrmikz:
2321	case X86::VPTERNLOGDZ128rrikz: case X86::VPTERNLOGDZ128rmikz:
2322	case X86::VPTERNLOGDZ256rrikz: case X86::VPTERNLOGDZ256rmikz:
2323	case X86::VPTERNLOGQZrrikz: case X86::VPTERNLOGQZrmikz:
2324	case X86::VPTERNLOGQZ128rrikz: case X86::VPTERNLOGQZ128rmikz:
2325	case X86::VPTERNLOGQZ256rrikz: case X86::VPTERNLOGQZ256rmikz:
2326	case X86::VPTERNLOGDZ128rmbi:
2327	case X86::VPTERNLOGDZ256rmbi:
2328	case X86::VPTERNLOGDZrmbi:
2329	case X86::VPTERNLOGQZ128rmbi:
2330	case X86::VPTERNLOGQZ256rmbi:
2331	case X86::VPTERNLOGQZrmbi:
2332	case X86::VPTERNLOGDZ128rmbikz:
2333	case X86::VPTERNLOGDZ256rmbikz:
2334	case X86::VPTERNLOGDZrmbikz:
2335	case X86::VPTERNLOGQZ128rmbikz:
2336	case X86::VPTERNLOGQZ256rmbikz:
2337	case X86::VPTERNLOGQZrmbikz: {
2338	auto &WorkingMI = cloneIfNew(MI);
2339	commuteVPTERNLOG(WorkingMI, OpIdx1, OpIdx2);
2340	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2341	OpIdx1, OpIdx2);
2342	}
2343	default: {
2344	if (isCommutableVPERMV3Instruction(MI.getOpcode())) {
2345	unsigned Opc = getCommutedVPERMV3Opcode(MI.getOpcode());
2346	auto &WorkingMI = cloneIfNew(MI);
2347	WorkingMI.setDesc(get(Opc));
2348	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2349	OpIdx1, OpIdx2);
2350	}
2351
2352	const X86InstrFMA3Group *FMA3Group = getFMA3Group(MI.getOpcode(),
2353	MI.getDesc().TSFlags);
2354	if (FMA3Group) {
2355	unsigned Opc =
2356	getFMA3OpcodeToCommuteOperands(MI, OpIdx1, OpIdx2, *FMA3Group);
2357	auto &WorkingMI = cloneIfNew(MI);
2358	WorkingMI.setDesc(get(Opc));
2359	return TargetInstrInfo::commuteInstructionImpl(WorkingMI, /NewMI=/false,
2360	OpIdx1, OpIdx2);
2361	}
2362
2363	return TargetInstrInfo::commuteInstructionImpl(MI, NewMI, OpIdx1, OpIdx2);
2364	}
2365	}
2366	}
2367
2368	bool
2369	X86InstrInfo::findThreeSrcCommutedOpIndices(const MachineInstr &MI,
2370	unsigned &SrcOpIdx1,
2371	unsigned &SrcOpIdx2,
2372	bool IsIntrinsic) const {
2373	uint64_t TSFlags = MI.getDesc().TSFlags;
2374
2375	unsigned FirstCommutableVecOp = 1;
2376	unsigned LastCommutableVecOp = 3;
2377	unsigned KMaskOp = -1U;
2378	if (X86II::isKMasked(TSFlags)) {
2379	// For k-zero-masked operations it is Ok to commute the first vector
2380	// operand. Unless this is an intrinsic instruction.
2381	// For regular k-masked operations a conservative choice is done as the
2382	// elements of the first vector operand, for which the corresponding bit
2383	// in the k-mask operand is set to 0, are copied to the result of the
2384	// instruction.
2385	// TODO/FIXME: The commute still may be legal if it is known that the
2386	// k-mask operand is set to either all ones or all zeroes.
2387	// It is also Ok to commute the 1st operand if all users of MI use only
2388	// the elements enabled by the k-mask operand. For example,
2389	// v4 = VFMADD213PSZrk v1, k, v2, v3; // v1[i] = k[i] ? v2[i]*v1[i]+v3[i]
2390	// : v1[i];
2391	// VMOVAPSZmrk <mem_addr>, k, v4; // this is the ONLY user of v4 ->
2392	// // Ok, to commute v1 in FMADD213PSZrk.
2393
2394	// The k-mask operand has index = 2 for masked and zero-masked operations.
2395	KMaskOp = 2;
2396
2397	// The operand with index = 1 is used as a source for those elements for
2398	// which the corresponding bit in the k-mask is set to 0.
2399	if (X86II::isKMergeMasked(TSFlags) \|\| IsIntrinsic)
2400	FirstCommutableVecOp = 3;
2401
2402	LastCommutableVecOp++;
2403	} else if (IsIntrinsic) {
2404	// Commuting the first operand of an intrinsic instruction isn't possible
2405	// unless we can prove that only the lowest element of the result is used.
2406	FirstCommutableVecOp = 2;
2407	}
2408
2409	if (isMem(MI, LastCommutableVecOp))
2410	LastCommutableVecOp--;
2411
2412	// Only the first RegOpsNum operands are commutable.
2413	// Also, the value 'CommuteAnyOperandIndex' is valid here as it means
2414	// that the operand is not specified/fixed.
2415	if (SrcOpIdx1 != CommuteAnyOperandIndex &&
2416	(SrcOpIdx1 < FirstCommutableVecOp \|\| SrcOpIdx1 > LastCommutableVecOp \|\|
2417	SrcOpIdx1 == KMaskOp))
2418	return false;
2419	if (SrcOpIdx2 != CommuteAnyOperandIndex &&
2420	(SrcOpIdx2 < FirstCommutableVecOp \|\| SrcOpIdx2 > LastCommutableVecOp \|\|
2421	SrcOpIdx2 == KMaskOp))
2422	return false;
2423
2424	// Look for two different register operands assumed to be commutable
2425	// regardless of the FMA opcode. The FMA opcode is adjusted later.
2426	if (SrcOpIdx1 == CommuteAnyOperandIndex \|\|
2427	SrcOpIdx2 == CommuteAnyOperandIndex) {
2428	unsigned CommutableOpIdx2 = SrcOpIdx2;
2429
2430	// At least one of operands to be commuted is not specified and
2431	// this method is free to choose appropriate commutable operands.
2432	if (SrcOpIdx1 == SrcOpIdx2)
2433	// Both of operands are not fixed. By default set one of commutable
2434	// operands to the last register operand of the instruction.
2435	CommutableOpIdx2 = LastCommutableVecOp;
2436	else if (SrcOpIdx2 == CommuteAnyOperandIndex)
2437	// Only one of operands is not fixed.
2438	CommutableOpIdx2 = SrcOpIdx1;
2439
2440	// CommutableOpIdx2 is well defined now. Let's choose another commutable
2441	// operand and assign its index to CommutableOpIdx1.
2442	Register Op2Reg = MI.getOperand(CommutableOpIdx2).getReg();
2443
2444	unsigned CommutableOpIdx1;
2445	for (CommutableOpIdx1 = LastCommutableVecOp;
2446	CommutableOpIdx1 >= FirstCommutableVecOp; CommutableOpIdx1--) {
2447	// Just ignore and skip the k-mask operand.
2448	if (CommutableOpIdx1 == KMaskOp)
2449	continue;
2450
2451	// The commuted operands must have different registers.
2452	// Otherwise, the commute transformation does not change anything and
2453	// is useless then.
2454	if (Op2Reg != MI.getOperand(CommutableOpIdx1).getReg())
2455	break;
2456	}
2457
2458	// No appropriate commutable operands were found.
2459	if (CommutableOpIdx1 < FirstCommutableVecOp)
2460	return false;
2461
2462	// Assign the found pair of commutable indices to SrcOpIdx1 and SrcOpidx2
2463	// to return those values.
2464	if (!fixCommutedOpIndices(SrcOpIdx1, SrcOpIdx2,
2465	CommutableOpIdx1, CommutableOpIdx2))
2466	return false;
2467	}
2468
2469	return true;
2470	}
2471
2472	bool X86InstrInfo::findCommutedOpIndices(const MachineInstr &MI,
2473	unsigned &SrcOpIdx1,
2474	unsigned &SrcOpIdx2) const {
2475	const MCInstrDesc &Desc = MI.getDesc();
2476	if (!Desc.isCommutable())
2477	return false;
2478
2479	switch (MI.getOpcode()) {
2480	case X86::CMPSDrr:
2481	case X86::CMPSSrr:
2482	case X86::CMPPDrri:
2483	case X86::CMPPSrri:
2484	case X86::VCMPSDrr:
2485	case X86::VCMPSSrr:
2486	case X86::VCMPPDrri:
2487	case X86::VCMPPSrri:
2488	case X86::VCMPPDYrri:
2489	case X86::VCMPPSYrri:
2490	case X86::VCMPSDZrr:
2491	case X86::VCMPSSZrr:
2492	case X86::VCMPPDZrri:
2493	case X86::VCMPPSZrri:
2494	case X86::VCMPSHZrr:
2495	case X86::VCMPPHZrri:
2496	case X86::VCMPPHZ128rri:
2497	case X86::VCMPPHZ256rri:
2498	case X86::VCMPPDZ128rri:
2499	case X86::VCMPPSZ128rri:
2500	case X86::VCMPPDZ256rri:
2501	case X86::VCMPPSZ256rri:
2502	case X86::VCMPPDZrrik:
2503	case X86::VCMPPSZrrik:
2504	case X86::VCMPPDZ128rrik:
2505	case X86::VCMPPSZ128rrik:
2506	case X86::VCMPPDZ256rrik:
2507	case X86::VCMPPSZ256rrik: {
2508	unsigned OpOffset = X86II::isKMasked(Desc.TSFlags) ? 1 : 0;
2509
2510	// Float comparison can be safely commuted for
2511	// Ordered/Unordered/Equal/NotEqual tests
2512	unsigned Imm = MI.getOperand(3 + OpOffset).getImm() & 0x7;
2513	switch (Imm) {
2514	default:
2515	// EVEX versions can be commuted.
2516	if ((Desc.TSFlags & X86II::EncodingMask) == X86II::EVEX)
2517	break;
2518	return false;
2519	case 0x00: // EQUAL
2520	case 0x03: // UNORDERED
2521	case 0x04: // NOT EQUAL
2522	case 0x07: // ORDERED
2523	break;
2524	}
2525
2526	// The indices of the commutable operands are 1 and 2 (or 2 and 3
2527	// when masked).
2528	// Assign them to the returned operand indices here.
2529	return fixCommutedOpIndices(SrcOpIdx1, SrcOpIdx2, 1 + OpOffset,
2530	2 + OpOffset);
2531	}
2532	case X86::MOVSSrr:
2533	// X86::MOVSDrr is always commutable. MOVSS is only commutable if we can
2534	// form sse4.1 blend. We assume VMOVSSrr/VMOVSDrr is always commutable since
2535	// AVX implies sse4.1.
2536	if (Subtarget.hasSSE41())
2537	return TargetInstrInfo::findCommutedOpIndices(MI, SrcOpIdx1, SrcOpIdx2);
2538	return false;
2539	case X86::SHUFPDrri:
2540	// We can commute this to MOVSD.
2541	if (MI.getOperand(3).getImm() == 0x02)
2542	return TargetInstrInfo::findCommutedOpIndices(MI, SrcOpIdx1, SrcOpIdx2);
2543	return false;
2544	case X86::MOVHLPSrr:
2545	case X86::UNPCKHPDrr:
2546	case X86::VMOVHLPSrr:
2547	case X86::VUNPCKHPDrr:
2548	case X86::VMOVHLPSZrr:
2549	case X86::VUNPCKHPDZ128rr:
2550	if (Subtarget.hasSSE2())
2551	return TargetInstrInfo::findCommutedOpIndices(MI, SrcOpIdx1, SrcOpIdx2);
2552	return false;
2553	case X86::VPTERNLOGDZrri: case X86::VPTERNLOGDZrmi:
2554	case X86::VPTERNLOGDZ128rri: case X86::VPTERNLOGDZ128rmi:
2555	case X86::VPTERNLOGDZ256rri: case X86::VPTERNLOGDZ256rmi:
2556	case X86::VPTERNLOGQZrri: case X86::VPTERNLOGQZrmi:
2557	case X86::VPTERNLOGQZ128rri: case X86::VPTERNLOGQZ128rmi:
2558	case X86::VPTERNLOGQZ256rri: case X86::VPTERNLOGQZ256rmi:
2559	case X86::VPTERNLOGDZrrik:
2560	case X86::VPTERNLOGDZ128rrik:
2561	case X86::VPTERNLOGDZ256rrik:
2562	case X86::VPTERNLOGQZrrik:
2563	case X86::VPTERNLOGQZ128rrik:
2564	case X86::VPTERNLOGQZ256rrik:
2565	case X86::VPTERNLOGDZrrikz: case X86::VPTERNLOGDZrmikz:
2566	case X86::VPTERNLOGDZ128rrikz: case X86::VPTERNLOGDZ128rmikz:
2567	case X86::VPTERNLOGDZ256rrikz: case X86::VPTERNLOGDZ256rmikz:
2568	case X86::VPTERNLOGQZrrikz: case X86::VPTERNLOGQZrmikz:
2569	case X86::VPTERNLOGQZ128rrikz: case X86::VPTERNLOGQZ128rmikz:
2570	case X86::VPTERNLOGQZ256rrikz: case X86::VPTERNLOGQZ256rmikz:
2571	case X86::VPTERNLOGDZ128rmbi:
2572	case X86::VPTERNLOGDZ256rmbi:
2573	case X86::VPTERNLOGDZrmbi:
2574	case X86::VPTERNLOGQZ128rmbi:
2575	case X86::VPTERNLOGQZ256rmbi:
2576	case X86::VPTERNLOGQZrmbi:
2577	case X86::VPTERNLOGDZ128rmbikz:
2578	case X86::VPTERNLOGDZ256rmbikz:
2579	case X86::VPTERNLOGDZrmbikz:
2580	case X86::VPTERNLOGQZ128rmbikz:
2581	case X86::VPTERNLOGQZ256rmbikz:
2582	case X86::VPTERNLOGQZrmbikz:
2583	return findThreeSrcCommutedOpIndices(MI, SrcOpIdx1, SrcOpIdx2);
2584	case X86::VPDPWSSDYrr:
2585	case X86::VPDPWSSDrr:
2586	case X86::VPDPWSSDSYrr:
2587	case X86::VPDPWSSDSrr:
2588	case X86::VPDPWSSDZ128r:
2589	case X86::VPDPWSSDZ128rk:
2590	case X86::VPDPWSSDZ128rkz:
2591	case X86::VPDPWSSDZ256r:
2592	case X86::VPDPWSSDZ256rk:
2593	case X86::VPDPWSSDZ256rkz:
2594	case X86::VPDPWSSDZr:
2595	case X86::VPDPWSSDZrk:
2596	case X86::VPDPWSSDZrkz:
2597	case X86::VPDPWSSDSZ128r:
2598	case X86::VPDPWSSDSZ128rk:
2599	case X86::VPDPWSSDSZ128rkz:
2600	case X86::VPDPWSSDSZ256r:
2601	case X86::VPDPWSSDSZ256rk:
2602	case X86::VPDPWSSDSZ256rkz:
2603	case X86::VPDPWSSDSZr:
2604	case X86::VPDPWSSDSZrk:
2605	case X86::VPDPWSSDSZrkz:
2606	case X86::VPMADD52HUQZ128r:
2607	case X86::VPMADD52HUQZ128rk:
2608	case X86::VPMADD52HUQZ128rkz:
2609	case X86::VPMADD52HUQZ256r:
2610	case X86::VPMADD52HUQZ256rk:
2611	case X86::VPMADD52HUQZ256rkz:
2612	case X86::VPMADD52HUQZr:
2613	case X86::VPMADD52HUQZrk:
2614	case X86::VPMADD52HUQZrkz:
2615	case X86::VPMADD52LUQZ128r:
2616	case X86::VPMADD52LUQZ128rk:
2617	case X86::VPMADD52LUQZ128rkz:
2618	case X86::VPMADD52LUQZ256r:
2619	case X86::VPMADD52LUQZ256rk:
2620	case X86::VPMADD52LUQZ256rkz:
2621	case X86::VPMADD52LUQZr:
2622	case X86::VPMADD52LUQZrk:
2623	case X86::VPMADD52LUQZrkz: {
2624	unsigned CommutableOpIdx1 = 2;
2625	unsigned CommutableOpIdx2 = 3;
2626	if (X86II::isKMasked(Desc.TSFlags)) {
2627	// Skip the mask register.
2628	++CommutableOpIdx1;
2629	++CommutableOpIdx2;
2630	}
2631	if (!fixCommutedOpIndices(SrcOpIdx1, SrcOpIdx2,
2632	CommutableOpIdx1, CommutableOpIdx2))
2633	return false;
2634	if (!MI.getOperand(SrcOpIdx1).isReg() \|\|
2635	!MI.getOperand(SrcOpIdx2).isReg())
2636	// No idea.
2637	return false;
2638	return true;
2639	}
2640
2641	default:
2642	const X86InstrFMA3Group *FMA3Group = getFMA3Group(MI.getOpcode(),
2643	MI.getDesc().TSFlags);
2644	if (FMA3Group)
2645	return findThreeSrcCommutedOpIndices(MI, SrcOpIdx1, SrcOpIdx2,
2646	FMA3Group->isIntrinsic());
2647
2648	// Handled masked instructions since we need to skip over the mask input
2649	// and the preserved input.
2650	if (X86II::isKMasked(Desc.TSFlags)) {
2651	// First assume that the first input is the mask operand and skip past it.
2652	unsigned CommutableOpIdx1 = Desc.getNumDefs() + 1;
2653	unsigned CommutableOpIdx2 = Desc.getNumDefs() + 2;
2654	// Check if the first input is tied. If there isn't one then we only
2655	// need to skip the mask operand which we did above.
2656	if ((MI.getDesc().getOperandConstraint(Desc.getNumDefs(),
2657	MCOI::TIED_TO) != -1)) {
2658	// If this is zero masking instruction with a tied operand, we need to
2659	// move the first index back to the first input since this must
2660	// be a 3 input instruction and we want the first two non-mask inputs.
2661	// Otherwise this is a 2 input instruction with a preserved input and
2662	// mask, so we need to move the indices to skip one more input.
2663	if (X86II::isKMergeMasked(Desc.TSFlags)) {
2664	++CommutableOpIdx1;
2665	++CommutableOpIdx2;
2666	} else {
2667	--CommutableOpIdx1;
2668	}
2669	}
2670
2671	if (!fixCommutedOpIndices(SrcOpIdx1, SrcOpIdx2,
2672	CommutableOpIdx1, CommutableOpIdx2))
2673	return false;
2674
2675	if (!MI.getOperand(SrcOpIdx1).isReg() \|\|
2676	!MI.getOperand(SrcOpIdx2).isReg())
2677	// No idea.
2678	return false;
2679	return true;
2680	}
2681
2682	return TargetInstrInfo::findCommutedOpIndices(MI, SrcOpIdx1, SrcOpIdx2);
2683	}
2684	return false;
2685	}
2686
2687	static bool isConvertibleLEA(MachineInstr *MI) {
2688	unsigned Opcode = MI->getOpcode();
2689	if (Opcode != X86::LEA32r && Opcode != X86::LEA64r &&
2690	Opcode != X86::LEA64_32r)
2691	return false;
2692
2693	const MachineOperand &Scale = MI->getOperand(1 + X86::AddrScaleAmt);
2694	const MachineOperand &Disp = MI->getOperand(1 + X86::AddrDisp);
2695	const MachineOperand &Segment = MI->getOperand(1 + X86::AddrSegmentReg);
2696
2697	if (Segment.getReg() != 0 \|\| !Disp.isImm() \|\| Disp.getImm() != 0 \|\|
2698	Scale.getImm() > 1)
2699	return false;
2700
2701	return true;
2702	}
2703
2704	bool X86InstrInfo::hasCommutePreference(MachineInstr &MI, bool &Commute) const {
2705	// Currently we're interested in following sequence only.
2706	// r3 = lea r1, r2
2707	// r5 = add r3, r4
2708	// Both r3 and r4 are killed in add, we hope the add instruction has the
2709	// operand order
2710	// r5 = add r4, r3
2711	// So later in X86FixupLEAs the lea instruction can be rewritten as add.
2712	unsigned Opcode = MI.getOpcode();
2713	if (Opcode != X86::ADD32rr && Opcode != X86::ADD64rr)
2714	return false;
2715
2716	const MachineRegisterInfo &MRI = MI.getParent()->getParent()->getRegInfo();
2717	Register Reg1 = MI.getOperand(1).getReg();
2718	Register Reg2 = MI.getOperand(2).getReg();
2719
2720	// Check if Reg1 comes from LEA in the same MBB.
2721	if (MachineInstr *Inst = MRI.getUniqueVRegDef(Reg1)) {
2722	if (isConvertibleLEA(Inst) && Inst->getParent() == MI.getParent()) {
2723	Commute = true;
2724	return true;
2725	}
2726	}
2727
2728	// Check if Reg2 comes from LEA in the same MBB.
2729	if (MachineInstr *Inst = MRI.getUniqueVRegDef(Reg2)) {
2730	if (isConvertibleLEA(Inst) && Inst->getParent() == MI.getParent()) {
2731	Commute = false;
2732	return true;
2733	}
2734	}
2735
2736	return false;
2737	}
2738
2739	X86::CondCode X86::getCondFromBranch(const MachineInstr &MI) {
2740	switch (MI.getOpcode()) {
2741	default: return X86::COND_INVALID;
2742	case X86::JCC_1:
2743	return static_cast<X86::CondCode>(
2744	MI.getOperand(MI.getDesc().getNumOperands() - 1).getImm());
2745	}
2746	}
2747
2748	/// Return condition code of a SETCC opcode.
2749	X86::CondCode X86::getCondFromSETCC(const MachineInstr &MI) {
2750	switch (MI.getOpcode()) {
2751	default: return X86::COND_INVALID;
2752	case X86::SETCCr: case X86::SETCCm:
2753	return static_cast<X86::CondCode>(
2754	MI.getOperand(MI.getDesc().getNumOperands() - 1).getImm());
2755	}
2756	}
2757
2758	/// Return condition code of a CMov opcode.
2759	X86::CondCode X86::getCondFromCMov(const MachineInstr &MI) {
2760	switch (MI.getOpcode()) {
2761	default: return X86::COND_INVALID;
2762	case X86::CMOV16rr: case X86::CMOV32rr: case X86::CMOV64rr:
2763	case X86::CMOV16rm: case X86::CMOV32rm: case X86::CMOV64rm:
2764	return static_cast<X86::CondCode>(
2765	MI.getOperand(MI.getDesc().getNumOperands() - 1).getImm());
2766	}
2767	}
2768
2769	/// Return the inverse of the specified condition,
2770	/// e.g. turning COND_E to COND_NE.
2771	X86::CondCode X86::GetOppositeBranchCondition(X86::CondCode CC) {
2772	switch (CC) {
2773	default: llvm_unreachable("Illegal condition code!")::llvm::llvm_unreachable_internal("Illegal condition code!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2773);
2774	case X86::COND_E: return X86::COND_NE;
2775	case X86::COND_NE: return X86::COND_E;
2776	case X86::COND_L: return X86::COND_GE;
2777	case X86::COND_LE: return X86::COND_G;
2778	case X86::COND_G: return X86::COND_LE;
2779	case X86::COND_GE: return X86::COND_L;
2780	case X86::COND_B: return X86::COND_AE;
2781	case X86::COND_BE: return X86::COND_A;
2782	case X86::COND_A: return X86::COND_BE;
2783	case X86::COND_AE: return X86::COND_B;
2784	case X86::COND_S: return X86::COND_NS;
2785	case X86::COND_NS: return X86::COND_S;
2786	case X86::COND_P: return X86::COND_NP;
2787	case X86::COND_NP: return X86::COND_P;
2788	case X86::COND_O: return X86::COND_NO;
2789	case X86::COND_NO: return X86::COND_O;
2790	case X86::COND_NE_OR_P: return X86::COND_E_AND_NP;
2791	case X86::COND_E_AND_NP: return X86::COND_NE_OR_P;
2792	}
2793	}
2794
2795	/// Assuming the flags are set by MI(a,b), return the condition code if we
2796	/// modify the instructions such that flags are set by MI(b,a).
2797	static X86::CondCode getSwappedCondition(X86::CondCode CC) {
2798	switch (CC) {
2799	default: return X86::COND_INVALID;
2800	case X86::COND_E: return X86::COND_E;
2801	case X86::COND_NE: return X86::COND_NE;
2802	case X86::COND_L: return X86::COND_G;
2803	case X86::COND_LE: return X86::COND_GE;
2804	case X86::COND_G: return X86::COND_L;
2805	case X86::COND_GE: return X86::COND_LE;
2806	case X86::COND_B: return X86::COND_A;
2807	case X86::COND_BE: return X86::COND_AE;
2808	case X86::COND_A: return X86::COND_B;
2809	case X86::COND_AE: return X86::COND_BE;
2810	}
2811	}
2812
2813	std::pair<X86::CondCode, bool>
2814	X86::getX86ConditionCode(CmpInst::Predicate Predicate) {
2815	X86::CondCode CC = X86::COND_INVALID;
2816	bool NeedSwap = false;
2817	switch (Predicate) {
2818	default: break;
2819	// Floating-point Predicates
2820	case CmpInst::FCMP_UEQ: CC = X86::COND_E; break;
2821	case CmpInst::FCMP_OLT: NeedSwap = true; LLVM_FALLTHROUGH[[gnu::fallthrough]];
2822	case CmpInst::FCMP_OGT: CC = X86::COND_A; break;
2823	case CmpInst::FCMP_OLE: NeedSwap = true; LLVM_FALLTHROUGH[[gnu::fallthrough]];
2824	case CmpInst::FCMP_OGE: CC = X86::COND_AE; break;
2825	case CmpInst::FCMP_UGT: NeedSwap = true; LLVM_FALLTHROUGH[[gnu::fallthrough]];
2826	case CmpInst::FCMP_ULT: CC = X86::COND_B; break;
2827	case CmpInst::FCMP_UGE: NeedSwap = true; LLVM_FALLTHROUGH[[gnu::fallthrough]];
2828	case CmpInst::FCMP_ULE: CC = X86::COND_BE; break;
2829	case CmpInst::FCMP_ONE: CC = X86::COND_NE; break;
2830	case CmpInst::FCMP_UNO: CC = X86::COND_P; break;
2831	case CmpInst::FCMP_ORD: CC = X86::COND_NP; break;
2832	case CmpInst::FCMP_OEQ: LLVM_FALLTHROUGH[[gnu::fallthrough]];
2833	case CmpInst::FCMP_UNE: CC = X86::COND_INVALID; break;
2834
2835	// Integer Predicates
2836	case CmpInst::ICMP_EQ: CC = X86::COND_E; break;
2837	case CmpInst::ICMP_NE: CC = X86::COND_NE; break;
2838	case CmpInst::ICMP_UGT: CC = X86::COND_A; break;
2839	case CmpInst::ICMP_UGE: CC = X86::COND_AE; break;
2840	case CmpInst::ICMP_ULT: CC = X86::COND_B; break;
2841	case CmpInst::ICMP_ULE: CC = X86::COND_BE; break;
2842	case CmpInst::ICMP_SGT: CC = X86::COND_G; break;
2843	case CmpInst::ICMP_SGE: CC = X86::COND_GE; break;
2844	case CmpInst::ICMP_SLT: CC = X86::COND_L; break;
2845	case CmpInst::ICMP_SLE: CC = X86::COND_LE; break;
2846	}
2847
2848	return std::make_pair(CC, NeedSwap);
2849	}
2850
2851	/// Return a setcc opcode based on whether it has memory operand.
2852	unsigned X86::getSETOpc(bool HasMemoryOperand) {
2853	return HasMemoryOperand ? X86::SETCCr : X86::SETCCm;
2854	}
2855
2856	/// Return a cmov opcode for the given register size in bytes, and operand type.
2857	unsigned X86::getCMovOpcode(unsigned RegBytes, bool HasMemoryOperand) {
2858	switch(RegBytes) {
2859	default: llvm_unreachable("Illegal register size!")::llvm::llvm_unreachable_internal("Illegal register size!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2859);
2860	case 2: return HasMemoryOperand ? X86::CMOV16rm : X86::CMOV16rr;
2861	case 4: return HasMemoryOperand ? X86::CMOV32rm : X86::CMOV32rr;
2862	case 8: return HasMemoryOperand ? X86::CMOV64rm : X86::CMOV64rr;
2863	}
2864	}
2865
2866	/// Get the VPCMP immediate for the given condition.
2867	unsigned X86::getVPCMPImmForCond(ISD::CondCode CC) {
2868	switch (CC) {
2869	default: llvm_unreachable("Unexpected SETCC condition")::llvm::llvm_unreachable_internal("Unexpected SETCC condition" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2869);
2870	case ISD::SETNE: return 4;
2871	case ISD::SETEQ: return 0;
2872	case ISD::SETULT:
2873	case ISD::SETLT: return 1;
2874	case ISD::SETUGT:
2875	case ISD::SETGT: return 6;
2876	case ISD::SETUGE:
2877	case ISD::SETGE: return 5;
2878	case ISD::SETULE:
2879	case ISD::SETLE: return 2;
2880	}
2881	}
2882
2883	/// Get the VPCMP immediate if the operands are swapped.
2884	unsigned X86::getSwappedVPCMPImm(unsigned Imm) {
2885	switch (Imm) {
2886	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2886);
2887	case 0x01: Imm = 0x06; break; // LT -> NLE
2888	case 0x02: Imm = 0x05; break; // LE -> NLT
2889	case 0x05: Imm = 0x02; break; // NLT -> LE
2890	case 0x06: Imm = 0x01; break; // NLE -> LT
2891	case 0x00: // EQ
2892	case 0x03: // FALSE
2893	case 0x04: // NE
2894	case 0x07: // TRUE
2895	break;
2896	}
2897
2898	return Imm;
2899	}
2900
2901	/// Get the VPCOM immediate if the operands are swapped.
2902	unsigned X86::getSwappedVPCOMImm(unsigned Imm) {
2903	switch (Imm) {
2904	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2904);
2905	case 0x00: Imm = 0x02; break; // LT -> GT
2906	case 0x01: Imm = 0x03; break; // LE -> GE
2907	case 0x02: Imm = 0x00; break; // GT -> LT
2908	case 0x03: Imm = 0x01; break; // GE -> LE
2909	case 0x04: // EQ
2910	case 0x05: // NE
2911	case 0x06: // FALSE
2912	case 0x07: // TRUE
2913	break;
2914	}
2915
2916	return Imm;
2917	}
2918
2919	/// Get the VCMP immediate if the operands are swapped.
2920	unsigned X86::getSwappedVCMPImm(unsigned Imm) {
2921	// Only need the lower 2 bits to distinquish.
2922	switch (Imm & 0x3) {
2923	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2923);
2924	case 0x00: case 0x03:
2925	// EQ/NE/TRUE/FALSE/ORD/UNORD don't change immediate when commuted.
2926	break;
2927	case 0x01: case 0x02:
2928	// Need to toggle bits 3:0. Bit 4 stays the same.
2929	Imm ^= 0xf;
2930	break;
2931	}
2932
2933	return Imm;
2934	}
2935
2936	bool X86InstrInfo::isUnconditionalTailCall(const MachineInstr &MI) const {
2937	switch (MI.getOpcode()) {
2938	case X86::TCRETURNdi:
2939	case X86::TCRETURNri:
2940	case X86::TCRETURNmi:
2941	case X86::TCRETURNdi64:
2942	case X86::TCRETURNri64:
2943	case X86::TCRETURNmi64:
2944	return true;
2945	default:
2946	return false;
2947	}
2948	}
2949
2950	bool X86InstrInfo::canMakeTailCallConditional(
2951	SmallVectorImpl<MachineOperand> &BranchCond,
2952	const MachineInstr &TailCall) const {
2953	if (TailCall.getOpcode() != X86::TCRETURNdi &&
2954	TailCall.getOpcode() != X86::TCRETURNdi64) {
2955	// Only direct calls can be done with a conditional branch.
2956	return false;
2957	}
2958
2959	const MachineFunction *MF = TailCall.getParent()->getParent();
2960	if (Subtarget.isTargetWin64() && MF->hasWinCFI()) {
2961	// Conditional tail calls confuse the Win64 unwinder.
2962	return false;
2963	}
2964
2965	assert(BranchCond.size() == 1)(static_cast <bool> (BranchCond.size() == 1) ? void (0) : __assert_fail ("BranchCond.size() == 1", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2965, __extension__ __PRETTY_FUNCTION__));
2966	if (BranchCond[0].getImm() > X86::LAST_VALID_COND) {
2967	// Can't make a conditional tail call with this condition.
2968	return false;
2969	}
2970
2971	const X86MachineFunctionInfo *X86FI = MF->getInfo<X86MachineFunctionInfo>();
2972	if (X86FI->getTCReturnAddrDelta() != 0 \|\|
2973	TailCall.getOperand(1).getImm() != 0) {
2974	// A conditional tail call cannot do any stack adjustment.
2975	return false;
2976	}
2977
2978	return true;
2979	}
2980
2981	void X86InstrInfo::replaceBranchWithTailCall(
2982	MachineBasicBlock &MBB, SmallVectorImpl<MachineOperand> &BranchCond,
2983	const MachineInstr &TailCall) const {
2984	assert(canMakeTailCallConditional(BranchCond, TailCall))(static_cast <bool> (canMakeTailCallConditional(BranchCond , TailCall)) ? void (0) : __assert_fail ("canMakeTailCallConditional(BranchCond, TailCall)" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2984, __extension__ __PRETTY_FUNCTION__));
2985
2986	MachineBasicBlock::iterator I = MBB.end();
2987	while (I != MBB.begin()) {
2988	--I;
2989	if (I->isDebugInstr())
2990	continue;
2991	if (!I->isBranch())
2992	assert(0 && "Can't find the branch to replace!")(static_cast <bool> (0 && "Can't find the branch to replace!" ) ? void (0) : __assert_fail ("0 && \"Can't find the branch to replace!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2992, __extension__ __PRETTY_FUNCTION__));
2993
2994	X86::CondCode CC = X86::getCondFromBranch(*I);
2995	assert(BranchCond.size() == 1)(static_cast <bool> (BranchCond.size() == 1) ? void (0) : __assert_fail ("BranchCond.size() == 1", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 2995, __extension__ __PRETTY_FUNCTION__));
2996	if (CC != BranchCond[0].getImm())
2997	continue;
2998
2999	break;
3000	}
3001
3002	unsigned Opc = TailCall.getOpcode() == X86::TCRETURNdi ? X86::TCRETURNdicc
3003	: X86::TCRETURNdi64cc;
3004
3005	auto MIB = BuildMI(MBB, I, MBB.findDebugLoc(I), get(Opc));
3006	MIB->addOperand(TailCall.getOperand(0)); // Destination.
3007	MIB.addImm(0); // Stack offset (not used).
3008	MIB->addOperand(BranchCond[0]); // Condition.
3009	MIB.copyImplicitOps(TailCall); // Regmask and (imp-used) parameters.
3010
3011	// Add implicit uses and defs of all live regs potentially clobbered by the
3012	// call. This way they still appear live across the call.
3013	LivePhysRegs LiveRegs(getRegisterInfo());
3014	LiveRegs.addLiveOuts(MBB);
3015	SmallVector<std::pair<MCPhysReg, const MachineOperand *>, 8> Clobbers;
3016	LiveRegs.stepForward(*MIB, Clobbers);
3017	for (const auto &C : Clobbers) {
3018	MIB.addReg(C.first, RegState::Implicit);
3019	MIB.addReg(C.first, RegState::Implicit \| RegState::Define);
3020	}
3021
3022	I->eraseFromParent();
3023	}
3024
3025	// Given a MBB and its TBB, find the FBB which was a fallthrough MBB (it may
3026	// not be a fallthrough MBB now due to layout changes). Return nullptr if the
3027	// fallthrough MBB cannot be identified.
3028	static MachineBasicBlock getFallThroughMBB(MachineBasicBlock MBB,
3029	MachineBasicBlock *TBB) {
3030	// Look for non-EHPad successors other than TBB. If we find exactly one, it
3031	// is the fallthrough MBB. If we find zero, then TBB is both the target MBB
3032	// and fallthrough MBB. If we find more than one, we cannot identify the
3033	// fallthrough MBB and should return nullptr.
3034	MachineBasicBlock *FallthroughBB = nullptr;
3035	for (auto SI = MBB->succ_begin(), SE = MBB->succ_end(); SI != SE; ++SI) {
3036	if ((SI)->isEHPad() \|\| (SI == TBB && FallthroughBB))
3037	continue;
3038	// Return a nullptr if we found more than one fallthrough successor.
3039	if (FallthroughBB && FallthroughBB != TBB)
3040	return nullptr;
3041	FallthroughBB = *SI;
3042	}
3043	return FallthroughBB;
3044	}
3045
3046	bool X86InstrInfo::AnalyzeBranchImpl(
3047	MachineBasicBlock &MBB, MachineBasicBlock &TBB, MachineBasicBlock &FBB,
3048	SmallVectorImpl<MachineOperand> &Cond,
3049	SmallVectorImpl<MachineInstr *> &CondBranches, bool AllowModify) const {
3050
3051	// Start from the bottom of the block and work up, examining the
3052	// terminator instructions.
3053	MachineBasicBlock::iterator I = MBB.end();
3054	MachineBasicBlock::iterator UnCondBrIter = MBB.end();
3055	while (I != MBB.begin()) {
3056	--I;
3057	if (I->isDebugInstr())
3058	continue;
3059
3060	// Working from the bottom, when we see a non-terminator instruction, we're
3061	// done.
3062	if (!isUnpredicatedTerminator(*I))
3063	break;
3064
3065	// A terminator that isn't a branch can't easily be handled by this
3066	// analysis.
3067	if (!I->isBranch())
3068	return true;
3069
3070	// Handle unconditional branches.
3071	if (I->getOpcode() == X86::JMP_1) {
3072	UnCondBrIter = I;
3073
3074	if (!AllowModify) {
3075	TBB = I->getOperand(0).getMBB();
3076	continue;
3077	}
3078
3079	// If the block has any instructions after a JMP, delete them.
3080	while (std::next(I) != MBB.end())
3081	std::next(I)->eraseFromParent();
3082
3083	Cond.clear();
3084	FBB = nullptr;
3085
3086	// Delete the JMP if it's equivalent to a fall-through.
3087	if (MBB.isLayoutSuccessor(I->getOperand(0).getMBB())) {
3088	TBB = nullptr;
3089	I->eraseFromParent();
3090	I = MBB.end();
3091	UnCondBrIter = MBB.end();
3092	continue;
3093	}
3094
3095	// TBB is used to indicate the unconditional destination.
3096	TBB = I->getOperand(0).getMBB();
3097	continue;
3098	}
3099
3100	// Handle conditional branches.
3101	X86::CondCode BranchCode = X86::getCondFromBranch(*I);
3102	if (BranchCode == X86::COND_INVALID)
3103	return true; // Can't handle indirect branch.
3104
3105	// In practice we should never have an undef eflags operand, if we do
3106	// abort here as we are not prepared to preserve the flag.
3107	if (I->findRegisterUseOperand(X86::EFLAGS)->isUndef())
3108	return true;
3109
3110	// Working from the bottom, handle the first conditional branch.
3111	if (Cond.empty()) {
3112	MachineBasicBlock *TargetBB = I->getOperand(0).getMBB();
3113	if (AllowModify && UnCondBrIter != MBB.end() &&
3114	MBB.isLayoutSuccessor(TargetBB)) {
3115	// If we can modify the code and it ends in something like:
3116	//
3117	// jCC L1
3118	// jmp L2
3119	// L1:
3120	// ...
3121	// L2:
3122	//
3123	// Then we can change this to:
3124	//
3125	// jnCC L2
3126	// L1:
3127	// ...
3128	// L2:
3129	//
3130	// Which is a bit more efficient.
3131	// We conditionally jump to the fall-through block.
3132	BranchCode = GetOppositeBranchCondition(BranchCode);
3133	MachineBasicBlock::iterator OldInst = I;
3134
3135	BuildMI(MBB, UnCondBrIter, MBB.findDebugLoc(I), get(X86::JCC_1))
3136	.addMBB(UnCondBrIter->getOperand(0).getMBB())
3137	.addImm(BranchCode);
3138	BuildMI(MBB, UnCondBrIter, MBB.findDebugLoc(I), get(X86::JMP_1))
3139	.addMBB(TargetBB);
3140
3141	OldInst->eraseFromParent();
3142	UnCondBrIter->eraseFromParent();
3143
3144	// Restart the analysis.
3145	UnCondBrIter = MBB.end();
3146	I = MBB.end();
3147	continue;
3148	}
3149
3150	FBB = TBB;
3151	TBB = I->getOperand(0).getMBB();
3152	Cond.push_back(MachineOperand::CreateImm(BranchCode));
3153	CondBranches.push_back(&*I);
3154	continue;
3155	}
3156
3157	// Handle subsequent conditional branches. Only handle the case where all
3158	// conditional branches branch to the same destination and their condition
3159	// opcodes fit one of the special multi-branch idioms.
3160	assert(Cond.size() == 1)(static_cast <bool> (Cond.size() == 1) ? void (0) : __assert_fail ("Cond.size() == 1", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3160, __extension__ __PRETTY_FUNCTION__));
3161	assert(TBB)(static_cast <bool> (TBB) ? void (0) : __assert_fail ("TBB" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3161, __extension__ __PRETTY_FUNCTION__));
3162
3163	// If the conditions are the same, we can leave them alone.
3164	X86::CondCode OldBranchCode = (X86::CondCode)Cond[0].getImm();
3165	auto NewTBB = I->getOperand(0).getMBB();
3166	if (OldBranchCode == BranchCode && TBB == NewTBB)
3167	continue;
3168
3169	// If they differ, see if they fit one of the known patterns. Theoretically,
3170	// we could handle more patterns here, but we shouldn't expect to see them
3171	// if instruction selection has done a reasonable job.
3172	if (TBB == NewTBB &&
3173	((OldBranchCode == X86::COND_P && BranchCode == X86::COND_NE) \|\|
3174	(OldBranchCode == X86::COND_NE && BranchCode == X86::COND_P))) {
3175	BranchCode = X86::COND_NE_OR_P;
3176	} else if ((OldBranchCode == X86::COND_NP && BranchCode == X86::COND_NE) \|\|
3177	(OldBranchCode == X86::COND_E && BranchCode == X86::COND_P)) {
3178	if (NewTBB != (FBB ? FBB : getFallThroughMBB(&MBB, TBB)))
3179	return true;
3180
3181	// X86::COND_E_AND_NP usually has two different branch destinations.
3182	//
3183	// JP B1
3184	// JE B2
3185	// JMP B1
3186	// B1:
3187	// B2:
3188	//
3189	// Here this condition branches to B2 only if NP && E. It has another
3190	// equivalent form:
3191	//
3192	// JNE B1
3193	// JNP B2
3194	// JMP B1
3195	// B1:
3196	// B2:
3197	//
3198	// Similarly it branches to B2 only if E && NP. That is why this condition
3199	// is named with COND_E_AND_NP.
3200	BranchCode = X86::COND_E_AND_NP;
3201	} else
3202	return true;
3203
3204	// Update the MachineOperand.
3205	Cond[0].setImm(BranchCode);
3206	CondBranches.push_back(&*I);
3207	}
3208
3209	return false;
3210	}
3211
3212	bool X86InstrInfo::analyzeBranch(MachineBasicBlock &MBB,
3213	MachineBasicBlock *&TBB,
3214	MachineBasicBlock *&FBB,
3215	SmallVectorImpl<MachineOperand> &Cond,
3216	bool AllowModify) const {
3217	SmallVector<MachineInstr *, 4> CondBranches;
3218	return AnalyzeBranchImpl(MBB, TBB, FBB, Cond, CondBranches, AllowModify);
3219	}
3220
3221	bool X86InstrInfo::analyzeBranchPredicate(MachineBasicBlock &MBB,
3222	MachineBranchPredicate &MBP,
3223	bool AllowModify) const {
3224	using namespace std::placeholders;
3225
3226	SmallVector<MachineOperand, 4> Cond;
3227	SmallVector<MachineInstr *, 4> CondBranches;
3228	if (AnalyzeBranchImpl(MBB, MBP.TrueDest, MBP.FalseDest, Cond, CondBranches,
3229	AllowModify))
3230	return true;
3231
3232	if (Cond.size() != 1)
3233	return true;
3234
3235	assert(MBP.TrueDest && "expected!")(static_cast <bool> (MBP.TrueDest && "expected!" ) ? void (0) : __assert_fail ("MBP.TrueDest && \"expected!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3235, __extension__ __PRETTY_FUNCTION__));
3236
3237	if (!MBP.FalseDest)
3238	MBP.FalseDest = MBB.getNextNode();
3239
3240	const TargetRegisterInfo *TRI = &getRegisterInfo();
3241
3242	MachineInstr *ConditionDef = nullptr;
3243	bool SingleUseCondition = true;
3244
3245	for (auto I = std::next(MBB.rbegin()), E = MBB.rend(); I != E; ++I) {
3246	if (I->modifiesRegister(X86::EFLAGS, TRI)) {
3247	ConditionDef = &*I;
3248	break;
3249	}
3250
3251	if (I->readsRegister(X86::EFLAGS, TRI))
3252	SingleUseCondition = false;
3253	}
3254
3255	if (!ConditionDef)
3256	return true;
3257
3258	if (SingleUseCondition) {
3259	for (auto *Succ : MBB.successors())
3260	if (Succ->isLiveIn(X86::EFLAGS))
3261	SingleUseCondition = false;
3262	}
3263
3264	MBP.ConditionDef = ConditionDef;
3265	MBP.SingleUseCondition = SingleUseCondition;
3266
3267	// Currently we only recognize the simple pattern:
3268	//
3269	// test %reg, %reg
3270	// je %label
3271	//
3272	const unsigned TestOpcode =
3273	Subtarget.is64Bit() ? X86::TEST64rr : X86::TEST32rr;
3274
3275	if (ConditionDef->getOpcode() == TestOpcode &&
3276	ConditionDef->getNumOperands() == 3 &&
3277	ConditionDef->getOperand(0).isIdenticalTo(ConditionDef->getOperand(1)) &&
3278	(Cond[0].getImm() == X86::COND_NE \|\| Cond[0].getImm() == X86::COND_E)) {
3279	MBP.LHS = ConditionDef->getOperand(0);
3280	MBP.RHS = MachineOperand::CreateImm(0);
3281	MBP.Predicate = Cond[0].getImm() == X86::COND_NE
3282	? MachineBranchPredicate::PRED_NE
3283	: MachineBranchPredicate::PRED_EQ;
3284	return false;
3285	}
3286
3287	return true;
3288	}
3289
3290	unsigned X86InstrInfo::removeBranch(MachineBasicBlock &MBB,
3291	int *BytesRemoved) const {
3292	assert(!BytesRemoved && "code size not handled")(static_cast <bool> (!BytesRemoved && "code size not handled" ) ? void (0) : __assert_fail ("!BytesRemoved && \"code size not handled\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3292, __extension__ __PRETTY_FUNCTION__));
3293
3294	MachineBasicBlock::iterator I = MBB.end();
3295	unsigned Count = 0;
3296
3297	while (I != MBB.begin()) {
3298	--I;
3299	if (I->isDebugInstr())
3300	continue;
3301	if (I->getOpcode() != X86::JMP_1 &&
3302	X86::getCondFromBranch(*I) == X86::COND_INVALID)
3303	break;
3304	// Remove the branch.
3305	I->eraseFromParent();
3306	I = MBB.end();
3307	++Count;
3308	}
3309
3310	return Count;
3311	}
3312
3313	unsigned X86InstrInfo::insertBranch(MachineBasicBlock &MBB,
3314	MachineBasicBlock *TBB,
3315	MachineBasicBlock *FBB,
3316	ArrayRef<MachineOperand> Cond,
3317	const DebugLoc &DL,
3318	int *BytesAdded) const {
3319	// Shouldn't be a fall through.
3320	assert(TBB && "insertBranch must not be told to insert a fallthrough")(static_cast <bool> (TBB && "insertBranch must not be told to insert a fallthrough" ) ? void (0) : __assert_fail ("TBB && \"insertBranch must not be told to insert a fallthrough\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3320, __extension__ __PRETTY_FUNCTION__));
3321	assert((Cond.size() == 1 \|\| Cond.size() == 0) &&(static_cast <bool> ((Cond.size() == 1 \|\| Cond.size() == 0) && "X86 branch conditions have one component!") ? void (0) : __assert_fail ("(Cond.size() == 1 \|\| Cond.size() == 0) && \"X86 branch conditions have one component!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3322, __extension__ __PRETTY_FUNCTION__))
3322	"X86 branch conditions have one component!")(static_cast <bool> ((Cond.size() == 1 \|\| Cond.size() == 0) && "X86 branch conditions have one component!") ? void (0) : __assert_fail ("(Cond.size() == 1 \|\| Cond.size() == 0) && \"X86 branch conditions have one component!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3322, __extension__ __PRETTY_FUNCTION__));
3323	assert(!BytesAdded && "code size not handled")(static_cast <bool> (!BytesAdded && "code size not handled" ) ? void (0) : __assert_fail ("!BytesAdded && \"code size not handled\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3323, __extension__ __PRETTY_FUNCTION__));
3324
3325	if (Cond.empty()) {
3326	// Unconditional branch?
3327	assert(!FBB && "Unconditional branch with multiple successors!")(static_cast <bool> (!FBB && "Unconditional branch with multiple successors!" ) ? void (0) : __assert_fail ("!FBB && \"Unconditional branch with multiple successors!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3327, __extension__ __PRETTY_FUNCTION__));
3328	BuildMI(&MBB, DL, get(X86::JMP_1)).addMBB(TBB);
3329	return 1;
3330	}
3331
3332	// If FBB is null, it is implied to be a fall-through block.
3333	bool FallThru = FBB == nullptr;
3334
3335	// Conditional branch.
3336	unsigned Count = 0;
3337	X86::CondCode CC = (X86::CondCode)Cond[0].getImm();
3338	switch (CC) {
3339	case X86::COND_NE_OR_P:
3340	// Synthesize NE_OR_P with two branches.
3341	BuildMI(&MBB, DL, get(X86::JCC_1)).addMBB(TBB).addImm(X86::COND_NE);
3342	++Count;
3343	BuildMI(&MBB, DL, get(X86::JCC_1)).addMBB(TBB).addImm(X86::COND_P);
3344	++Count;
3345	break;
3346	case X86::COND_E_AND_NP:
3347	// Use the next block of MBB as FBB if it is null.
3348	if (FBB == nullptr) {
3349	FBB = getFallThroughMBB(&MBB, TBB);
3350	assert(FBB && "MBB cannot be the last block in function when the false "(static_cast <bool> (FBB && "MBB cannot be the last block in function when the false " "body is a fall-through.") ? void (0) : __assert_fail ("FBB && \"MBB cannot be the last block in function when the false \" \"body is a fall-through.\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3351, __extension__ __PRETTY_FUNCTION__))
3351	"body is a fall-through.")(static_cast <bool> (FBB && "MBB cannot be the last block in function when the false " "body is a fall-through.") ? void (0) : __assert_fail ("FBB && \"MBB cannot be the last block in function when the false \" \"body is a fall-through.\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3351, __extension__ __PRETTY_FUNCTION__));
3352	}
3353	// Synthesize COND_E_AND_NP with two branches.
3354	BuildMI(&MBB, DL, get(X86::JCC_1)).addMBB(FBB).addImm(X86::COND_NE);
3355	++Count;
3356	BuildMI(&MBB, DL, get(X86::JCC_1)).addMBB(TBB).addImm(X86::COND_NP);
3357	++Count;
3358	break;
3359	default: {
3360	BuildMI(&MBB, DL, get(X86::JCC_1)).addMBB(TBB).addImm(CC);
3361	++Count;
3362	}
3363	}
3364	if (!FallThru) {
3365	// Two-way Conditional branch. Insert the second branch.
3366	BuildMI(&MBB, DL, get(X86::JMP_1)).addMBB(FBB);
3367	++Count;
3368	}
3369	return Count;
3370	}
3371
3372	bool X86InstrInfo::canInsertSelect(const MachineBasicBlock &MBB,
3373	ArrayRef<MachineOperand> Cond,
3374	Register DstReg, Register TrueReg,
3375	Register FalseReg, int &CondCycles,
3376	int &TrueCycles, int &FalseCycles) const {
3377	// Not all subtargets have cmov instructions.
3378	if (!Subtarget.hasCMov())
3379	return false;
3380	if (Cond.size() != 1)
3381	return false;
3382	// We cannot do the composite conditions, at least not in SSA form.
3383	if ((X86::CondCode)Cond[0].getImm() > X86::LAST_VALID_COND)
3384	return false;
3385
3386	// Check register classes.
3387	const MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
3388	const TargetRegisterClass *RC =
3389	RI.getCommonSubClass(MRI.getRegClass(TrueReg), MRI.getRegClass(FalseReg));
3390	if (!RC)
3391	return false;
3392
3393	// We have cmov instructions for 16, 32, and 64 bit general purpose registers.
3394	if (X86::GR16RegClass.hasSubClassEq(RC) \|\|
3395	X86::GR32RegClass.hasSubClassEq(RC) \|\|
3396	X86::GR64RegClass.hasSubClassEq(RC)) {
3397	// This latency applies to Pentium M, Merom, Wolfdale, Nehalem, and Sandy
3398	// Bridge. Probably Ivy Bridge as well.
3399	CondCycles = 2;
3400	TrueCycles = 2;
3401	FalseCycles = 2;
3402	return true;
3403	}
3404
3405	// Can't do vectors.
3406	return false;
3407	}
3408
3409	void X86InstrInfo::insertSelect(MachineBasicBlock &MBB,
3410	MachineBasicBlock::iterator I,
3411	const DebugLoc &DL, Register DstReg,
3412	ArrayRef<MachineOperand> Cond, Register TrueReg,
3413	Register FalseReg) const {
3414	MachineRegisterInfo &MRI = MBB.getParent()->getRegInfo();
3415	const TargetRegisterInfo &TRI = *MRI.getTargetRegisterInfo();
3416	const TargetRegisterClass &RC = *MRI.getRegClass(DstReg);
3417	assert(Cond.size() == 1 && "Invalid Cond array")(static_cast <bool> (Cond.size() == 1 && "Invalid Cond array" ) ? void (0) : __assert_fail ("Cond.size() == 1 && \"Invalid Cond array\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3417, __extension__ __PRETTY_FUNCTION__));
3418	unsigned Opc = X86::getCMovOpcode(TRI.getRegSizeInBits(RC) / 8,
3419	false /HasMemoryOperand/);
3420	BuildMI(MBB, I, DL, get(Opc), DstReg)
3421	.addReg(FalseReg)
3422	.addReg(TrueReg)
3423	.addImm(Cond[0].getImm());
3424	}
3425
3426	/// Test if the given register is a physical h register.
3427	static bool isHReg(unsigned Reg) {
3428	return X86::GR8_ABCD_HRegClass.contains(Reg);
3429	}
3430
3431	// Try and copy between VR128/VR64 and GR64 registers.
3432	static unsigned CopyToFromAsymmetricReg(unsigned DestReg, unsigned SrcReg,
3433	const X86Subtarget &Subtarget) {
3434	bool HasAVX = Subtarget.hasAVX();
3435	bool HasAVX512 = Subtarget.hasAVX512();
3436
3437	// SrcReg(MaskReg) -> DestReg(GR64)
3438	// SrcReg(MaskReg) -> DestReg(GR32)
3439
3440	// All KMASK RegClasses hold the same k registers, can be tested against anyone.
3441	if (X86::VK16RegClass.contains(SrcReg)) {
3442	if (X86::GR64RegClass.contains(DestReg)) {
3443	assert(Subtarget.hasBWI())(static_cast <bool> (Subtarget.hasBWI()) ? void (0) : __assert_fail ("Subtarget.hasBWI()", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3443, __extension__ __PRETTY_FUNCTION__));
3444	return X86::KMOVQrk;
3445	}
3446	if (X86::GR32RegClass.contains(DestReg))
3447	return Subtarget.hasBWI() ? X86::KMOVDrk : X86::KMOVWrk;
3448	}
3449
3450	// SrcReg(GR64) -> DestReg(MaskReg)
3451	// SrcReg(GR32) -> DestReg(MaskReg)
3452
3453	// All KMASK RegClasses hold the same k registers, can be tested against anyone.
3454	if (X86::VK16RegClass.contains(DestReg)) {
3455	if (X86::GR64RegClass.contains(SrcReg)) {
3456	assert(Subtarget.hasBWI())(static_cast <bool> (Subtarget.hasBWI()) ? void (0) : __assert_fail ("Subtarget.hasBWI()", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3456, __extension__ __PRETTY_FUNCTION__));
3457	return X86::KMOVQkr;
3458	}
3459	if (X86::GR32RegClass.contains(SrcReg))
3460	return Subtarget.hasBWI() ? X86::KMOVDkr : X86::KMOVWkr;
3461	}
3462
3463
3464	// SrcReg(VR128) -> DestReg(GR64)
3465	// SrcReg(VR64) -> DestReg(GR64)
3466	// SrcReg(GR64) -> DestReg(VR128)
3467	// SrcReg(GR64) -> DestReg(VR64)
3468
3469	if (X86::GR64RegClass.contains(DestReg)) {
3470	if (X86::VR128XRegClass.contains(SrcReg))
3471	// Copy from a VR128 register to a GR64 register.
3472	return HasAVX512 ? X86::VMOVPQIto64Zrr :
3473	HasAVX ? X86::VMOVPQIto64rr :
3474	X86::MOVPQIto64rr;
3475	if (X86::VR64RegClass.contains(SrcReg))
3476	// Copy from a VR64 register to a GR64 register.
3477	return X86::MMX_MOVD64from64rr;
3478	} else if (X86::GR64RegClass.contains(SrcReg)) {
3479	// Copy from a GR64 register to a VR128 register.
3480	if (X86::VR128XRegClass.contains(DestReg))
3481	return HasAVX512 ? X86::VMOV64toPQIZrr :
3482	HasAVX ? X86::VMOV64toPQIrr :
3483	X86::MOV64toPQIrr;
3484	// Copy from a GR64 register to a VR64 register.
3485	if (X86::VR64RegClass.contains(DestReg))
3486	return X86::MMX_MOVD64to64rr;
3487	}
3488
3489	// SrcReg(VR128) -> DestReg(GR32)
3490	// SrcReg(GR32) -> DestReg(VR128)
3491
3492	if (X86::GR32RegClass.contains(DestReg) &&
3493	X86::VR128XRegClass.contains(SrcReg))
3494	// Copy from a VR128 register to a GR32 register.
3495	return HasAVX512 ? X86::VMOVPDI2DIZrr :
3496	HasAVX ? X86::VMOVPDI2DIrr :
3497	X86::MOVPDI2DIrr;
3498
3499	if (X86::VR128XRegClass.contains(DestReg) &&
3500	X86::GR32RegClass.contains(SrcReg))
3501	// Copy from a VR128 register to a VR128 register.
3502	return HasAVX512 ? X86::VMOVDI2PDIZrr :
3503	HasAVX ? X86::VMOVDI2PDIrr :
3504	X86::MOVDI2PDIrr;
3505	return 0;
3506	}
3507
3508	void X86InstrInfo::copyPhysReg(MachineBasicBlock &MBB,
3509	MachineBasicBlock::iterator MI,
3510	const DebugLoc &DL, MCRegister DestReg,
3511	MCRegister SrcReg, bool KillSrc) const {
3512	// First deal with the normal symmetric copies.
3513	bool HasAVX = Subtarget.hasAVX();
3514	bool HasVLX = Subtarget.hasVLX();
3515	unsigned Opc = 0;
3516	if (X86::GR64RegClass.contains(DestReg, SrcReg))
3517	Opc = X86::MOV64rr;
3518	else if (X86::GR32RegClass.contains(DestReg, SrcReg))
3519	Opc = X86::MOV32rr;
3520	else if (X86::GR16RegClass.contains(DestReg, SrcReg))
3521	Opc = X86::MOV16rr;
3522	else if (X86::GR8RegClass.contains(DestReg, SrcReg)) {
3523	// Copying to or from a physical H register on x86-64 requires a NOREX
3524	// move. Otherwise use a normal move.
3525	if ((isHReg(DestReg) \|\| isHReg(SrcReg)) &&
3526	Subtarget.is64Bit()) {
3527	Opc = X86::MOV8rr_NOREX;
3528	// Both operands must be encodable without an REX prefix.
3529	assert(X86::GR8_NOREXRegClass.contains(SrcReg, DestReg) &&(static_cast <bool> (X86::GR8_NOREXRegClass.contains(SrcReg , DestReg) && "8-bit H register can not be copied outside GR8_NOREX" ) ? void (0) : __assert_fail ("X86::GR8_NOREXRegClass.contains(SrcReg, DestReg) && \"8-bit H register can not be copied outside GR8_NOREX\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3530, __extension__ __PRETTY_FUNCTION__))
3530	"8-bit H register can not be copied outside GR8_NOREX")(static_cast <bool> (X86::GR8_NOREXRegClass.contains(SrcReg , DestReg) && "8-bit H register can not be copied outside GR8_NOREX" ) ? void (0) : __assert_fail ("X86::GR8_NOREXRegClass.contains(SrcReg, DestReg) && \"8-bit H register can not be copied outside GR8_NOREX\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3530, __extension__ __PRETTY_FUNCTION__));
3531	} else
3532	Opc = X86::MOV8rr;
3533	}
3534	else if (X86::VR64RegClass.contains(DestReg, SrcReg))
3535	Opc = X86::MMX_MOVQ64rr;
3536	else if (X86::VR128XRegClass.contains(DestReg, SrcReg)) {
3537	if (HasVLX)
3538	Opc = X86::VMOVAPSZ128rr;
3539	else if (X86::VR128RegClass.contains(DestReg, SrcReg))
3540	Opc = HasAVX ? X86::VMOVAPSrr : X86::MOVAPSrr;
3541	else {
3542	// If this an extended register and we don't have VLX we need to use a
3543	// 512-bit move.
3544	Opc = X86::VMOVAPSZrr;
3545	const TargetRegisterInfo *TRI = &getRegisterInfo();
3546	DestReg = TRI->getMatchingSuperReg(DestReg, X86::sub_xmm,
3547	&X86::VR512RegClass);
3548	SrcReg = TRI->getMatchingSuperReg(SrcReg, X86::sub_xmm,
3549	&X86::VR512RegClass);
3550	}
3551	} else if (X86::VR256XRegClass.contains(DestReg, SrcReg)) {
3552	if (HasVLX)
3553	Opc = X86::VMOVAPSZ256rr;
3554	else if (X86::VR256RegClass.contains(DestReg, SrcReg))
3555	Opc = X86::VMOVAPSYrr;
3556	else {
3557	// If this an extended register and we don't have VLX we need to use a
3558	// 512-bit move.
3559	Opc = X86::VMOVAPSZrr;
3560	const TargetRegisterInfo *TRI = &getRegisterInfo();
3561	DestReg = TRI->getMatchingSuperReg(DestReg, X86::sub_ymm,
3562	&X86::VR512RegClass);
3563	SrcReg = TRI->getMatchingSuperReg(SrcReg, X86::sub_ymm,
3564	&X86::VR512RegClass);
3565	}
3566	} else if (X86::VR512RegClass.contains(DestReg, SrcReg))
3567	Opc = X86::VMOVAPSZrr;
3568	// All KMASK RegClasses hold the same k registers, can be tested against anyone.
3569	else if (X86::VK16RegClass.contains(DestReg, SrcReg))
3570	Opc = Subtarget.hasBWI() ? X86::KMOVQkk : X86::KMOVWkk;
3571	if (!Opc)
3572	Opc = CopyToFromAsymmetricReg(DestReg, SrcReg, Subtarget);
3573
3574	if (Opc) {
3575	BuildMI(MBB, MI, DL, get(Opc), DestReg)
3576	.addReg(SrcReg, getKillRegState(KillSrc));
3577	return;
3578	}
3579
3580	if (SrcReg == X86::EFLAGS \|\| DestReg == X86::EFLAGS) {
3581	// FIXME: We use a fatal error here because historically LLVM has tried
3582	// lower some of these physreg copies and we want to ensure we get
3583	// reasonable bug reports if someone encounters a case no other testing
3584	// found. This path should be removed after the LLVM 7 release.
3585	report_fatal_error("Unable to copy EFLAGS physical register!");
3586	}
3587
3588	LLVM_DEBUG(dbgs() << "Cannot copy " << RI.getName(SrcReg) << " to "do { if (::llvm::DebugFlag && ::llvm::isCurrentDebugType ("x86-instr-info")) { dbgs() << "Cannot copy " << RI.getName(SrcReg) << " to " << RI.getName(DestReg ) << '\n'; } } while (false)
3589	<< RI.getName(DestReg) << '\n')do { if (::llvm::DebugFlag && ::llvm::isCurrentDebugType ("x86-instr-info")) { dbgs() << "Cannot copy " << RI.getName(SrcReg) << " to " << RI.getName(DestReg ) << '\n'; } } while (false);
3590	report_fatal_error("Cannot emit physreg copy instruction");
3591	}
3592
3593	Optional<DestSourcePair>
3594	X86InstrInfo::isCopyInstrImpl(const MachineInstr &MI) const {
3595	if (MI.isMoveReg())
3596	return DestSourcePair{MI.getOperand(0), MI.getOperand(1)};
3597	return None;
3598	}
3599
3600	static unsigned getLoadStoreRegOpcode(Register Reg,
3601	const TargetRegisterClass *RC,
3602	bool IsStackAligned,
3603	const X86Subtarget &STI, bool load) {
3604	bool HasAVX = STI.hasAVX();
3605	bool HasAVX512 = STI.hasAVX512();
3606	bool HasVLX = STI.hasVLX();
3607
3608	switch (STI.getRegisterInfo()->getSpillSize(*RC)) {
3609	default:
3610	llvm_unreachable("Unknown spill size")::llvm::llvm_unreachable_internal("Unknown spill size", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3610);
3611	case 1:
3612	assert(X86::GR8RegClass.hasSubClassEq(RC) && "Unknown 1-byte regclass")(static_cast <bool> (X86::GR8RegClass.hasSubClassEq(RC) && "Unknown 1-byte regclass") ? void (0) : __assert_fail ("X86::GR8RegClass.hasSubClassEq(RC) && \"Unknown 1-byte regclass\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3612, __extension__ __PRETTY_FUNCTION__));
3613	if (STI.is64Bit())
3614	// Copying to or from a physical H register on x86-64 requires a NOREX
3615	// move. Otherwise use a normal move.
3616	if (isHReg(Reg) \|\| X86::GR8_ABCD_HRegClass.hasSubClassEq(RC))
3617	return load ? X86::MOV8rm_NOREX : X86::MOV8mr_NOREX;
3618	return load ? X86::MOV8rm : X86::MOV8mr;
3619	case 2:
3620	if (X86::VK16RegClass.hasSubClassEq(RC))
3621	return load ? X86::KMOVWkm : X86::KMOVWmk;
3622	if (X86::FR16XRegClass.hasSubClassEq(RC)) {
3623	assert(STI.hasFP16())(static_cast <bool> (STI.hasFP16()) ? void (0) : __assert_fail ("STI.hasFP16()", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3623, __extension__ __PRETTY_FUNCTION__));
3624	return load ? X86::VMOVSHZrm_alt : X86::VMOVSHZmr;
3625	}
3626	assert(X86::GR16RegClass.hasSubClassEq(RC) && "Unknown 2-byte regclass")(static_cast <bool> (X86::GR16RegClass.hasSubClassEq(RC ) && "Unknown 2-byte regclass") ? void (0) : __assert_fail ("X86::GR16RegClass.hasSubClassEq(RC) && \"Unknown 2-byte regclass\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3626, __extension__ __PRETTY_FUNCTION__));
3627	return load ? X86::MOV16rm : X86::MOV16mr;
3628	case 4:
3629	if (X86::GR32RegClass.hasSubClassEq(RC))
3630	return load ? X86::MOV32rm : X86::MOV32mr;
3631	if (X86::FR32XRegClass.hasSubClassEq(RC))
3632	return load ?
3633	(HasAVX512 ? X86::VMOVSSZrm_alt :
3634	HasAVX ? X86::VMOVSSrm_alt :
3635	X86::MOVSSrm_alt) :
3636	(HasAVX512 ? X86::VMOVSSZmr :
3637	HasAVX ? X86::VMOVSSmr :
3638	X86::MOVSSmr);
3639	if (X86::RFP32RegClass.hasSubClassEq(RC))
3640	return load ? X86::LD_Fp32m : X86::ST_Fp32m;
3641	if (X86::VK32RegClass.hasSubClassEq(RC)) {
3642	assert(STI.hasBWI() && "KMOVD requires BWI")(static_cast <bool> (STI.hasBWI() && "KMOVD requires BWI" ) ? void (0) : __assert_fail ("STI.hasBWI() && \"KMOVD requires BWI\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3642, __extension__ __PRETTY_FUNCTION__));
3643	return load ? X86::KMOVDkm : X86::KMOVDmk;
3644	}
3645	// All of these mask pair classes have the same spill size, the same kind
3646	// of kmov instructions can be used with all of them.
3647	if (X86::VK1PAIRRegClass.hasSubClassEq(RC) \|\|
3648	X86::VK2PAIRRegClass.hasSubClassEq(RC) \|\|
3649	X86::VK4PAIRRegClass.hasSubClassEq(RC) \|\|
3650	X86::VK8PAIRRegClass.hasSubClassEq(RC) \|\|
3651	X86::VK16PAIRRegClass.hasSubClassEq(RC))
3652	return load ? X86::MASKPAIR16LOAD : X86::MASKPAIR16STORE;
3653	llvm_unreachable("Unknown 4-byte regclass")::llvm::llvm_unreachable_internal("Unknown 4-byte regclass", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3653);
3654	case 8:
3655	if (X86::GR64RegClass.hasSubClassEq(RC))
3656	return load ? X86::MOV64rm : X86::MOV64mr;
3657	if (X86::FR64XRegClass.hasSubClassEq(RC))
3658	return load ?
3659	(HasAVX512 ? X86::VMOVSDZrm_alt :
3660	HasAVX ? X86::VMOVSDrm_alt :
3661	X86::MOVSDrm_alt) :
3662	(HasAVX512 ? X86::VMOVSDZmr :
3663	HasAVX ? X86::VMOVSDmr :
3664	X86::MOVSDmr);
3665	if (X86::VR64RegClass.hasSubClassEq(RC))
3666	return load ? X86::MMX_MOVQ64rm : X86::MMX_MOVQ64mr;
3667	if (X86::RFP64RegClass.hasSubClassEq(RC))
3668	return load ? X86::LD_Fp64m : X86::ST_Fp64m;
3669	if (X86::VK64RegClass.hasSubClassEq(RC)) {
3670	assert(STI.hasBWI() && "KMOVQ requires BWI")(static_cast <bool> (STI.hasBWI() && "KMOVQ requires BWI" ) ? void (0) : __assert_fail ("STI.hasBWI() && \"KMOVQ requires BWI\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3670, __extension__ __PRETTY_FUNCTION__));
3671	return load ? X86::KMOVQkm : X86::KMOVQmk;
3672	}
3673	llvm_unreachable("Unknown 8-byte regclass")::llvm::llvm_unreachable_internal("Unknown 8-byte regclass", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3673);
3674	case 10:
3675	assert(X86::RFP80RegClass.hasSubClassEq(RC) && "Unknown 10-byte regclass")(static_cast <bool> (X86::RFP80RegClass.hasSubClassEq(RC ) && "Unknown 10-byte regclass") ? void (0) : __assert_fail ("X86::RFP80RegClass.hasSubClassEq(RC) && \"Unknown 10-byte regclass\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3675, __extension__ __PRETTY_FUNCTION__));
3676	return load ? X86::LD_Fp80m : X86::ST_FpP80m;
3677	case 16: {
3678	if (X86::VR128XRegClass.hasSubClassEq(RC)) {
3679	// If stack is realigned we can use aligned stores.
3680	if (IsStackAligned)
3681	return load ?
3682	(HasVLX ? X86::VMOVAPSZ128rm :
3683	HasAVX512 ? X86::VMOVAPSZ128rm_NOVLX :
3684	HasAVX ? X86::VMOVAPSrm :
3685	X86::MOVAPSrm):
3686	(HasVLX ? X86::VMOVAPSZ128mr :
3687	HasAVX512 ? X86::VMOVAPSZ128mr_NOVLX :
3688	HasAVX ? X86::VMOVAPSmr :
3689	X86::MOVAPSmr);
3690	else
3691	return load ?
3692	(HasVLX ? X86::VMOVUPSZ128rm :
3693	HasAVX512 ? X86::VMOVUPSZ128rm_NOVLX :
3694	HasAVX ? X86::VMOVUPSrm :
3695	X86::MOVUPSrm):
3696	(HasVLX ? X86::VMOVUPSZ128mr :
3697	HasAVX512 ? X86::VMOVUPSZ128mr_NOVLX :
3698	HasAVX ? X86::VMOVUPSmr :
3699	X86::MOVUPSmr);
3700	}
3701	if (X86::BNDRRegClass.hasSubClassEq(RC)) {
3702	if (STI.is64Bit())
3703	return load ? X86::BNDMOV64rm : X86::BNDMOV64mr;
3704	else
3705	return load ? X86::BNDMOV32rm : X86::BNDMOV32mr;
3706	}
3707	llvm_unreachable("Unknown 16-byte regclass")::llvm::llvm_unreachable_internal("Unknown 16-byte regclass", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3707);
3708	}
3709	case 32:
3710	assert(X86::VR256XRegClass.hasSubClassEq(RC) && "Unknown 32-byte regclass")(static_cast <bool> (X86::VR256XRegClass.hasSubClassEq( RC) && "Unknown 32-byte regclass") ? void (0) : __assert_fail ("X86::VR256XRegClass.hasSubClassEq(RC) && \"Unknown 32-byte regclass\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3710, __extension__ __PRETTY_FUNCTION__));
3711	// If stack is realigned we can use aligned stores.
3712	if (IsStackAligned)
3713	return load ?
3714	(HasVLX ? X86::VMOVAPSZ256rm :
3715	HasAVX512 ? X86::VMOVAPSZ256rm_NOVLX :
3716	X86::VMOVAPSYrm) :
3717	(HasVLX ? X86::VMOVAPSZ256mr :
3718	HasAVX512 ? X86::VMOVAPSZ256mr_NOVLX :
3719	X86::VMOVAPSYmr);
3720	else
3721	return load ?
3722	(HasVLX ? X86::VMOVUPSZ256rm :
3723	HasAVX512 ? X86::VMOVUPSZ256rm_NOVLX :
3724	X86::VMOVUPSYrm) :
3725	(HasVLX ? X86::VMOVUPSZ256mr :
3726	HasAVX512 ? X86::VMOVUPSZ256mr_NOVLX :
3727	X86::VMOVUPSYmr);
3728	case 64:
3729	assert(X86::VR512RegClass.hasSubClassEq(RC) && "Unknown 64-byte regclass")(static_cast <bool> (X86::VR512RegClass.hasSubClassEq(RC ) && "Unknown 64-byte regclass") ? void (0) : __assert_fail ("X86::VR512RegClass.hasSubClassEq(RC) && \"Unknown 64-byte regclass\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3729, __extension__ __PRETTY_FUNCTION__));
3730	assert(STI.hasAVX512() && "Using 512-bit register requires AVX512")(static_cast <bool> (STI.hasAVX512() && "Using 512-bit register requires AVX512" ) ? void (0) : __assert_fail ("STI.hasAVX512() && \"Using 512-bit register requires AVX512\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3730, __extension__ __PRETTY_FUNCTION__));
3731	if (IsStackAligned)
3732	return load ? X86::VMOVAPSZrm : X86::VMOVAPSZmr;
3733	else
3734	return load ? X86::VMOVUPSZrm : X86::VMOVUPSZmr;
3735	}
3736	}
3737
3738	Optional<ExtAddrMode>
3739	X86InstrInfo::getAddrModeFromMemoryOp(const MachineInstr &MemI,
3740	const TargetRegisterInfo *TRI) const {
3741	const MCInstrDesc &Desc = MemI.getDesc();
3742	int MemRefBegin = X86II::getMemoryOperandNo(Desc.TSFlags);
3743	if (MemRefBegin < 0)
3744	return None;
3745
3746	MemRefBegin += X86II::getOperandBias(Desc);
3747
3748	auto &BaseOp = MemI.getOperand(MemRefBegin + X86::AddrBaseReg);
3749	if (!BaseOp.isReg()) // Can be an MO_FrameIndex
3750	return None;
3751
3752	const MachineOperand &DispMO = MemI.getOperand(MemRefBegin + X86::AddrDisp);
3753	// Displacement can be symbolic
3754	if (!DispMO.isImm())
3755	return None;
3756
3757	ExtAddrMode AM;
3758	AM.BaseReg = BaseOp.getReg();
3759	AM.ScaledReg = MemI.getOperand(MemRefBegin + X86::AddrIndexReg).getReg();
3760	AM.Scale = MemI.getOperand(MemRefBegin + X86::AddrScaleAmt).getImm();
3761	AM.Displacement = DispMO.getImm();
3762	return AM;
3763	}
3764
3765	bool X86InstrInfo::getConstValDefinedInReg(const MachineInstr &MI,
3766	const Register Reg,
3767	int64_t &ImmVal) const {
3768	if (MI.getOpcode() != X86::MOV32ri && MI.getOpcode() != X86::MOV64ri)
3769	return false;
3770	// Mov Src can be a global address.
3771	if (!MI.getOperand(1).isImm() \|\| MI.getOperand(0).getReg() != Reg)
3772	return false;
3773	ImmVal = MI.getOperand(1).getImm();
3774	return true;
3775	}
3776
3777	bool X86InstrInfo::preservesZeroValueInReg(
3778	const MachineInstr *MI, const Register NullValueReg,
3779	const TargetRegisterInfo *TRI) const {
3780	if (!MI->modifiesRegister(NullValueReg, TRI))
3781	return true;
3782	switch (MI->getOpcode()) {
3783	// Shift right/left of a null unto itself is still a null, i.e. rax = shl rax
3784	// X.
3785	case X86::SHR64ri:
3786	case X86::SHR32ri:
3787	case X86::SHL64ri:
3788	case X86::SHL32ri:
3789	assert(MI->getOperand(0).isDef() && MI->getOperand(1).isUse() &&(static_cast <bool> (MI->getOperand(0).isDef() && MI->getOperand(1).isUse() && "expected for shift opcode!" ) ? void (0) : __assert_fail ("MI->getOperand(0).isDef() && MI->getOperand(1).isUse() && \"expected for shift opcode!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3790, __extension__ __PRETTY_FUNCTION__))
3790	"expected for shift opcode!")(static_cast <bool> (MI->getOperand(0).isDef() && MI->getOperand(1).isUse() && "expected for shift opcode!" ) ? void (0) : __assert_fail ("MI->getOperand(0).isDef() && MI->getOperand(1).isUse() && \"expected for shift opcode!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3790, __extension__ __PRETTY_FUNCTION__));
3791	return MI->getOperand(0).getReg() == NullValueReg &&
3792	MI->getOperand(1).getReg() == NullValueReg;
3793	// Zero extend of a sub-reg of NullValueReg into itself does not change the
3794	// null value.
3795	case X86::MOV32rr:
3796	return llvm::all_of(MI->operands(), [&](const MachineOperand &MO) {
3797	return TRI->isSubRegisterEq(NullValueReg, MO.getReg());
3798	});
3799	default:
3800	return false;
3801	}
3802	llvm_unreachable("Should be handled above!")::llvm::llvm_unreachable_internal("Should be handled above!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3802);
3803	}
3804
3805	bool X86InstrInfo::getMemOperandsWithOffsetWidth(
3806	const MachineInstr &MemOp, SmallVectorImpl<const MachineOperand *> &BaseOps,
3807	int64_t &Offset, bool &OffsetIsScalable, unsigned &Width,
3808	const TargetRegisterInfo *TRI) const {
3809	const MCInstrDesc &Desc = MemOp.getDesc();
3810	int MemRefBegin = X86II::getMemoryOperandNo(Desc.TSFlags);
3811	if (MemRefBegin < 0)
3812	return false;
3813
3814	MemRefBegin += X86II::getOperandBias(Desc);
3815
3816	const MachineOperand *BaseOp =
3817	&MemOp.getOperand(MemRefBegin + X86::AddrBaseReg);
3818	if (!BaseOp->isReg()) // Can be an MO_FrameIndex
3819	return false;
3820
3821	if (MemOp.getOperand(MemRefBegin + X86::AddrScaleAmt).getImm() != 1)
3822	return false;
3823
3824	if (MemOp.getOperand(MemRefBegin + X86::AddrIndexReg).getReg() !=
3825	X86::NoRegister)
3826	return false;
3827
3828	const MachineOperand &DispMO = MemOp.getOperand(MemRefBegin + X86::AddrDisp);
3829
3830	// Displacement can be symbolic
3831	if (!DispMO.isImm())
3832	return false;
3833
3834	Offset = DispMO.getImm();
3835
3836	if (!BaseOp->isReg())
3837	return false;
3838
3839	OffsetIsScalable = false;
3840	// FIXME: Relying on memoperands() may not be right thing to do here. Check
3841	// with X86 maintainers, and fix it accordingly. For now, it is ok, since
3842	// there is no use of `Width` for X86 back-end at the moment.
3843	Width =
3844	!MemOp.memoperands_empty() ? MemOp.memoperands().front()->getSize() : 0;
3845	BaseOps.push_back(BaseOp);
3846	return true;
3847	}
3848
3849	static unsigned getStoreRegOpcode(Register SrcReg,
3850	const TargetRegisterClass *RC,
3851	bool IsStackAligned,
3852	const X86Subtarget &STI) {
3853	return getLoadStoreRegOpcode(SrcReg, RC, IsStackAligned, STI, false);
3854	}
3855
3856	static unsigned getLoadRegOpcode(Register DestReg,
3857	const TargetRegisterClass *RC,
3858	bool IsStackAligned, const X86Subtarget &STI) {
3859	return getLoadStoreRegOpcode(DestReg, RC, IsStackAligned, STI, true);
3860	}
3861
3862	void X86InstrInfo::storeRegToStackSlot(MachineBasicBlock &MBB,
3863	MachineBasicBlock::iterator MI,
3864	Register SrcReg, bool isKill, int FrameIdx,
3865	const TargetRegisterClass *RC,
3866	const TargetRegisterInfo *TRI) const {
3867	const MachineFunction &MF = *MBB.getParent();
3868	const MachineFrameInfo &MFI = MF.getFrameInfo();
3869	assert(MFI.getObjectSize(FrameIdx) >= TRI->getSpillSize(RC) &&(static_cast <bool> (MFI.getObjectSize(FrameIdx) >= TRI ->getSpillSize(RC) && "Stack slot too small for store" ) ? void (0) : __assert_fail ("MFI.getObjectSize(FrameIdx) >= TRI->getSpillSize(*RC) && \"Stack slot too small for store\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3870, __extension__ __PRETTY_FUNCTION__))
3870	"Stack slot too small for store")(static_cast <bool> (MFI.getObjectSize(FrameIdx) >= TRI ->getSpillSize(RC) && "Stack slot too small for store" ) ? void (0) : __assert_fail ("MFI.getObjectSize(FrameIdx) >= TRI->getSpillSize(RC) && \"Stack slot too small for store\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 3870, __extension__ __PRETTY_FUNCTION__));
3871	if (RC->getID() == X86::TILERegClassID) {
3872	unsigned Opc = X86::TILESTORED;
3873	// tilestored %tmm, (%sp, %idx)
3874	MachineRegisterInfo &RegInfo = MBB.getParent()->getRegInfo();
3875	Register VirtReg = RegInfo.createVirtualRegister(&X86::GR64_NOSPRegClass);
3876	BuildMI(MBB, MI, DebugLoc(), get(X86::MOV64ri), VirtReg).addImm(64);
3877	MachineInstr *NewMI =
3878	addFrameReference(BuildMI(MBB, MI, DebugLoc(), get(Opc)), FrameIdx)
3879	.addReg(SrcReg, getKillRegState(isKill));
3880	MachineOperand &MO = NewMI->getOperand(2);
3881	MO.setReg(VirtReg);
3882	MO.setIsKill(true);
3883	} else {
3884	unsigned Alignment = std::max<uint32_t>(TRI->getSpillSize(*RC), 16);
3885	bool isAligned =
3886	(Subtarget.getFrameLowering()->getStackAlign() >= Alignment) \|\|
3887	(RI.canRealignStack(MF) && !MFI.isFixedObjectIndex(FrameIdx));
3888	unsigned Opc = getStoreRegOpcode(SrcReg, RC, isAligned, Subtarget);
3889	addFrameReference(BuildMI(MBB, MI, DebugLoc(), get(Opc)), FrameIdx)
3890	.addReg(SrcReg, getKillRegState(isKill));
3891	}
3892	}
3893
3894	void X86InstrInfo::loadRegFromStackSlot(MachineBasicBlock &MBB,
3895	MachineBasicBlock::iterator MI,
3896	Register DestReg, int FrameIdx,
3897	const TargetRegisterClass *RC,
3898	const TargetRegisterInfo *TRI) const {
3899	if (RC->getID() == X86::TILERegClassID) {
3900	unsigned Opc = X86::TILELOADD;
3901	// tileloadd (%sp, %idx), %tmm
3902	MachineRegisterInfo &RegInfo = MBB.getParent()->getRegInfo();
3903	Register VirtReg = RegInfo.createVirtualRegister(&X86::GR64_NOSPRegClass);
3904	MachineInstr *NewMI =
	Value stored to 'NewMI' during its initialization is never read
3905	BuildMI(MBB, MI, DebugLoc(), get(X86::MOV64ri), VirtReg).addImm(64);
3906	NewMI = addFrameReference(BuildMI(MBB, MI, DebugLoc(), get(Opc), DestReg),
3907	FrameIdx);
3908	MachineOperand &MO = NewMI->getOperand(3);
3909	MO.setReg(VirtReg);
3910	MO.setIsKill(true);
3911	} else {
3912	const MachineFunction &MF = *MBB.getParent();
3913	const MachineFrameInfo &MFI = MF.getFrameInfo();
3914	unsigned Alignment = std::max<uint32_t>(TRI->getSpillSize(*RC), 16);
3915	bool isAligned =
3916	(Subtarget.getFrameLowering()->getStackAlign() >= Alignment) \|\|
3917	(RI.canRealignStack(MF) && !MFI.isFixedObjectIndex(FrameIdx));
3918	unsigned Opc = getLoadRegOpcode(DestReg, RC, isAligned, Subtarget);
3919	addFrameReference(BuildMI(MBB, MI, DebugLoc(), get(Opc), DestReg),
3920	FrameIdx);
3921	}
3922	}
3923
3924	bool X86InstrInfo::analyzeCompare(const MachineInstr &MI, Register &SrcReg,
3925	Register &SrcReg2, int &CmpMask,
3926	int &CmpValue) const {
3927	switch (MI.getOpcode()) {
3928	default: break;
3929	case X86::CMP64ri32:
3930	case X86::CMP64ri8:
3931	case X86::CMP32ri:
3932	case X86::CMP32ri8:
3933	case X86::CMP16ri:
3934	case X86::CMP16ri8:
3935	case X86::CMP8ri:
3936	SrcReg = MI.getOperand(0).getReg();
3937	SrcReg2 = 0;
3938	if (MI.getOperand(1).isImm()) {
3939	CmpMask = ~0;
3940	CmpValue = MI.getOperand(1).getImm();
3941	} else {
3942	CmpMask = CmpValue = 0;
3943	}
3944	return true;
3945	// A SUB can be used to perform comparison.
3946	case X86::SUB64rm:
3947	case X86::SUB32rm:
3948	case X86::SUB16rm:
3949	case X86::SUB8rm:
3950	SrcReg = MI.getOperand(1).getReg();
3951	SrcReg2 = 0;
3952	CmpMask = 0;
3953	CmpValue = 0;
3954	return true;
3955	case X86::SUB64rr:
3956	case X86::SUB32rr:
3957	case X86::SUB16rr:
3958	case X86::SUB8rr:
3959	SrcReg = MI.getOperand(1).getReg();
3960	SrcReg2 = MI.getOperand(2).getReg();
3961	CmpMask = 0;
3962	CmpValue = 0;
3963	return true;
3964	case X86::SUB64ri32:
3965	case X86::SUB64ri8:
3966	case X86::SUB32ri:
3967	case X86::SUB32ri8:
3968	case X86::SUB16ri:
3969	case X86::SUB16ri8:
3970	case X86::SUB8ri:
3971	SrcReg = MI.getOperand(1).getReg();
3972	SrcReg2 = 0;
3973	if (MI.getOperand(2).isImm()) {
3974	CmpMask = ~0;
3975	CmpValue = MI.getOperand(2).getImm();
3976	} else {
3977	CmpMask = CmpValue = 0;
3978	}
3979	return true;
3980	case X86::CMP64rr:
3981	case X86::CMP32rr:
3982	case X86::CMP16rr:
3983	case X86::CMP8rr:
3984	SrcReg = MI.getOperand(0).getReg();
3985	SrcReg2 = MI.getOperand(1).getReg();
3986	CmpMask = 0;
3987	CmpValue = 0;
3988	return true;
3989	case X86::TEST8rr:
3990	case X86::TEST16rr:
3991	case X86::TEST32rr:
3992	case X86::TEST64rr:
3993	SrcReg = MI.getOperand(0).getReg();
3994	if (MI.getOperand(1).getReg() != SrcReg)
3995	return false;
3996	// Compare against zero.
3997	SrcReg2 = 0;
3998	CmpMask = ~0;
3999	CmpValue = 0;
4000	return true;
4001	}
4002	return false;
4003	}
4004
4005	/// Check whether the first instruction, whose only
4006	/// purpose is to update flags, can be made redundant.
4007	/// CMPrr can be made redundant by SUBrr if the operands are the same.
4008	/// This function can be extended later on.
4009	/// SrcReg, SrcRegs: register operands for FlagI.
4010	/// ImmValue: immediate for FlagI if it takes an immediate.
4011	inline static bool isRedundantFlagInstr(const MachineInstr &FlagI,
4012	Register SrcReg, Register SrcReg2,
4013	int ImmMask, int ImmValue,
4014	const MachineInstr &OI) {
4015	if (((FlagI.getOpcode() == X86::CMP64rr && OI.getOpcode() == X86::SUB64rr) \|\|
4016	(FlagI.getOpcode() == X86::CMP32rr && OI.getOpcode() == X86::SUB32rr) \|\|
4017	(FlagI.getOpcode() == X86::CMP16rr && OI.getOpcode() == X86::SUB16rr) \|\|
4018	(FlagI.getOpcode() == X86::CMP8rr && OI.getOpcode() == X86::SUB8rr)) &&
4019	((OI.getOperand(1).getReg() == SrcReg &&
4020	OI.getOperand(2).getReg() == SrcReg2) \|\|
4021	(OI.getOperand(1).getReg() == SrcReg2 &&
4022	OI.getOperand(2).getReg() == SrcReg)))
4023	return true;
4024
4025	if (ImmMask != 0 &&
4026	((FlagI.getOpcode() == X86::CMP64ri32 &&
4027	OI.getOpcode() == X86::SUB64ri32) \|\|
4028	(FlagI.getOpcode() == X86::CMP64ri8 &&
4029	OI.getOpcode() == X86::SUB64ri8) \|\|
4030	(FlagI.getOpcode() == X86::CMP32ri && OI.getOpcode() == X86::SUB32ri) \|\|
4031	(FlagI.getOpcode() == X86::CMP32ri8 &&
4032	OI.getOpcode() == X86::SUB32ri8) \|\|
4033	(FlagI.getOpcode() == X86::CMP16ri && OI.getOpcode() == X86::SUB16ri) \|\|
4034	(FlagI.getOpcode() == X86::CMP16ri8 &&
4035	OI.getOpcode() == X86::SUB16ri8) \|\|
4036	(FlagI.getOpcode() == X86::CMP8ri && OI.getOpcode() == X86::SUB8ri)) &&
4037	OI.getOperand(1).getReg() == SrcReg &&
4038	OI.getOperand(2).getImm() == ImmValue)
4039	return true;
4040	return false;
4041	}
4042
4043	/// Check whether the definition can be converted
4044	/// to remove a comparison against zero.
4045	inline static bool isDefConvertible(const MachineInstr &MI, bool &NoSignFlag,
4046	bool &ClearsOverflowFlag) {
4047	NoSignFlag = false;
4048	ClearsOverflowFlag = false;
4049
4050	switch (MI.getOpcode()) {
4051	default: return false;
4052
4053	// The shift instructions only modify ZF if their shift count is non-zero.
4054	// N.B.: The processor truncates the shift count depending on the encoding.
4055	case X86::SAR8ri: case X86::SAR16ri: case X86::SAR32ri:case X86::SAR64ri:
4056	case X86::SHR8ri: case X86::SHR16ri: case X86::SHR32ri:case X86::SHR64ri:
4057	return getTruncatedShiftCount(MI, 2) != 0;
4058
4059	// Some left shift instructions can be turned into LEA instructions but only
4060	// if their flags aren't used. Avoid transforming such instructions.
4061	case X86::SHL8ri: case X86::SHL16ri: case X86::SHL32ri:case X86::SHL64ri:{
4062	unsigned ShAmt = getTruncatedShiftCount(MI, 2);
4063	if (isTruncatedShiftCountForLEA(ShAmt)) return false;
4064	return ShAmt != 0;
4065	}
4066
4067	case X86::SHRD16rri8:case X86::SHRD32rri8:case X86::SHRD64rri8:
4068	case X86::SHLD16rri8:case X86::SHLD32rri8:case X86::SHLD64rri8:
4069	return getTruncatedShiftCount(MI, 3) != 0;
4070
4071	case X86::SUB64ri32: case X86::SUB64ri8: case X86::SUB32ri:
4072	case X86::SUB32ri8: case X86::SUB16ri: case X86::SUB16ri8:
4073	case X86::SUB8ri: case X86::SUB64rr: case X86::SUB32rr:
4074	case X86::SUB16rr: case X86::SUB8rr: case X86::SUB64rm:
4075	case X86::SUB32rm: case X86::SUB16rm: case X86::SUB8rm:
4076	case X86::DEC64r: case X86::DEC32r: case X86::DEC16r: case X86::DEC8r:
4077	case X86::ADD64ri32: case X86::ADD64ri8: case X86::ADD32ri:
4078	case X86::ADD32ri8: case X86::ADD16ri: case X86::ADD16ri8:
4079	case X86::ADD8ri: case X86::ADD64rr: case X86::ADD32rr:
4080	case X86::ADD16rr: case X86::ADD8rr: case X86::ADD64rm:
4081	case X86::ADD32rm: case X86::ADD16rm: case X86::ADD8rm:
4082	case X86::INC64r: case X86::INC32r: case X86::INC16r: case X86::INC8r:
4083	case X86::ADC64ri32: case X86::ADC64ri8: case X86::ADC32ri:
4084	case X86::ADC32ri8: case X86::ADC16ri: case X86::ADC16ri8:
4085	case X86::ADC8ri: case X86::ADC64rr: case X86::ADC32rr:
4086	case X86::ADC16rr: case X86::ADC8rr: case X86::ADC64rm:
4087	case X86::ADC32rm: case X86::ADC16rm: case X86::ADC8rm:
4088	case X86::SBB64ri32: case X86::SBB64ri8: case X86::SBB32ri:
4089	case X86::SBB32ri8: case X86::SBB16ri: case X86::SBB16ri8:
4090	case X86::SBB8ri: case X86::SBB64rr: case X86::SBB32rr:
4091	case X86::SBB16rr: case X86::SBB8rr: case X86::SBB64rm:
4092	case X86::SBB32rm: case X86::SBB16rm: case X86::SBB8rm:
4093	case X86::NEG8r: case X86::NEG16r: case X86::NEG32r: case X86::NEG64r:
4094	case X86::SAR8r1: case X86::SAR16r1: case X86::SAR32r1:case X86::SAR64r1:
4095	case X86::SHR8r1: case X86::SHR16r1: case X86::SHR32r1:case X86::SHR64r1:
4096	case X86::SHL8r1: case X86::SHL16r1: case X86::SHL32r1:case X86::SHL64r1:
4097	case X86::LZCNT16rr: case X86::LZCNT16rm:
4098	case X86::LZCNT32rr: case X86::LZCNT32rm:
4099	case X86::LZCNT64rr: case X86::LZCNT64rm:
4100	case X86::POPCNT16rr:case X86::POPCNT16rm:
4101	case X86::POPCNT32rr:case X86::POPCNT32rm:
4102	case X86::POPCNT64rr:case X86::POPCNT64rm:
4103	case X86::TZCNT16rr: case X86::TZCNT16rm:
4104	case X86::TZCNT32rr: case X86::TZCNT32rm:
4105	case X86::TZCNT64rr: case X86::TZCNT64rm:
4106	return true;
4107	case X86::AND64ri32: case X86::AND64ri8: case X86::AND32ri:
4108	case X86::AND32ri8: case X86::AND16ri: case X86::AND16ri8:
4109	case X86::AND8ri: case X86::AND64rr: case X86::AND32rr:
4110	case X86::AND16rr: case X86::AND8rr: case X86::AND64rm:
4111	case X86::AND32rm: case X86::AND16rm: case X86::AND8rm:
4112	case X86::XOR64ri32: case X86::XOR64ri8: case X86::XOR32ri:
4113	case X86::XOR32ri8: case X86::XOR16ri: case X86::XOR16ri8:
4114	case X86::XOR8ri: case X86::XOR64rr: case X86::XOR32rr:
4115	case X86::XOR16rr: case X86::XOR8rr: case X86::XOR64rm:
4116	case X86::XOR32rm: case X86::XOR16rm: case X86::XOR8rm:
4117	case X86::OR64ri32: case X86::OR64ri8: case X86::OR32ri:
4118	case X86::OR32ri8: case X86::OR16ri: case X86::OR16ri8:
4119	case X86::OR8ri: case X86::OR64rr: case X86::OR32rr:
4120	case X86::OR16rr: case X86::OR8rr: case X86::OR64rm:
4121	case X86::OR32rm: case X86::OR16rm: case X86::OR8rm:
4122	case X86::ANDN32rr: case X86::ANDN32rm:
4123	case X86::ANDN64rr: case X86::ANDN64rm:
4124	case X86::BLSI32rr: case X86::BLSI32rm:
4125	case X86::BLSI64rr: case X86::BLSI64rm:
4126	case X86::BLSMSK32rr: case X86::BLSMSK32rm:
4127	case X86::BLSMSK64rr: case X86::BLSMSK64rm:
4128	case X86::BLSR32rr: case X86::BLSR32rm:
4129	case X86::BLSR64rr: case X86::BLSR64rm:
4130	case X86::BLCFILL32rr: case X86::BLCFILL32rm:
4131	case X86::BLCFILL64rr: case X86::BLCFILL64rm:
4132	case X86::BLCI32rr: case X86::BLCI32rm:
4133	case X86::BLCI64rr: case X86::BLCI64rm:
4134	case X86::BLCIC32rr: case X86::BLCIC32rm:
4135	case X86::BLCIC64rr: case X86::BLCIC64rm:
4136	case X86::BLCMSK32rr: case X86::BLCMSK32rm:
4137	case X86::BLCMSK64rr: case X86::BLCMSK64rm:
4138	case X86::BLCS32rr: case X86::BLCS32rm:
4139	case X86::BLCS64rr: case X86::BLCS64rm:
4140	case X86::BLSFILL32rr: case X86::BLSFILL32rm:
4141	case X86::BLSFILL64rr: case X86::BLSFILL64rm:
4142	case X86::BLSIC32rr: case X86::BLSIC32rm:
4143	case X86::BLSIC64rr: case X86::BLSIC64rm:
4144	case X86::BZHI32rr: case X86::BZHI32rm:
4145	case X86::BZHI64rr: case X86::BZHI64rm:
4146	case X86::T1MSKC32rr: case X86::T1MSKC32rm:
4147	case X86::T1MSKC64rr: case X86::T1MSKC64rm:
4148	case X86::TZMSK32rr: case X86::TZMSK32rm:
4149	case X86::TZMSK64rr: case X86::TZMSK64rm:
4150	// These instructions clear the overflow flag just like TEST.
4151	// FIXME: These are not the only instructions in this switch that clear the
4152	// overflow flag.
4153	ClearsOverflowFlag = true;
4154	return true;
4155	case X86::BEXTR32rr: case X86::BEXTR64rr:
4156	case X86::BEXTR32rm: case X86::BEXTR64rm:
4157	case X86::BEXTRI32ri: case X86::BEXTRI32mi:
4158	case X86::BEXTRI64ri: case X86::BEXTRI64mi:
4159	// BEXTR doesn't update the sign flag so we can't use it. It does clear
4160	// the overflow flag, but that's not useful without the sign flag.
4161	NoSignFlag = true;
4162	return true;
4163	}
4164	}
4165
4166	/// Check whether the use can be converted to remove a comparison against zero.
4167	static X86::CondCode isUseDefConvertible(const MachineInstr &MI) {
4168	switch (MI.getOpcode()) {
4169	default: return X86::COND_INVALID;
4170	case X86::NEG8r:
4171	case X86::NEG16r:
4172	case X86::NEG32r:
4173	case X86::NEG64r:
4174	return X86::COND_AE;
4175	case X86::LZCNT16rr:
4176	case X86::LZCNT32rr:
4177	case X86::LZCNT64rr:
4178	return X86::COND_B;
4179	case X86::POPCNT16rr:
4180	case X86::POPCNT32rr:
4181	case X86::POPCNT64rr:
4182	return X86::COND_E;
4183	case X86::TZCNT16rr:
4184	case X86::TZCNT32rr:
4185	case X86::TZCNT64rr:
4186	return X86::COND_B;
4187	case X86::BSF16rr:
4188	case X86::BSF32rr:
4189	case X86::BSF64rr:
4190	case X86::BSR16rr:
4191	case X86::BSR32rr:
4192	case X86::BSR64rr:
4193	return X86::COND_E;
4194	case X86::BLSI32rr:
4195	case X86::BLSI64rr:
4196	return X86::COND_AE;
4197	case X86::BLSR32rr:
4198	case X86::BLSR64rr:
4199	case X86::BLSMSK32rr:
4200	case X86::BLSMSK64rr:
4201	return X86::COND_B;
4202	// TODO: TBM instructions.
4203	}
4204	}
4205
4206	/// Check if there exists an earlier instruction that
4207	/// operates on the same source operands and sets flags in the same way as
4208	/// Compare; remove Compare if possible.
4209	bool X86InstrInfo::optimizeCompareInstr(MachineInstr &CmpInstr, Register SrcReg,
4210	Register SrcReg2, int CmpMask,
4211	int CmpValue,
4212	const MachineRegisterInfo *MRI) const {
4213	// Check whether we can replace SUB with CMP.
4214	switch (CmpInstr.getOpcode()) {
4215	default: break;
4216	case X86::SUB64ri32:
4217	case X86::SUB64ri8:
4218	case X86::SUB32ri:
4219	case X86::SUB32ri8:
4220	case X86::SUB16ri:
4221	case X86::SUB16ri8:
4222	case X86::SUB8ri:
4223	case X86::SUB64rm:
4224	case X86::SUB32rm:
4225	case X86::SUB16rm:
4226	case X86::SUB8rm:
4227	case X86::SUB64rr:
4228	case X86::SUB32rr:
4229	case X86::SUB16rr:
4230	case X86::SUB8rr: {
4231	if (!MRI->use_nodbg_empty(CmpInstr.getOperand(0).getReg()))
4232	return false;
4233	// There is no use of the destination register, we can replace SUB with CMP.
4234	unsigned NewOpcode = 0;
4235	switch (CmpInstr.getOpcode()) {
4236	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4236);
4237	case X86::SUB64rm: NewOpcode = X86::CMP64rm; break;
4238	case X86::SUB32rm: NewOpcode = X86::CMP32rm; break;
4239	case X86::SUB16rm: NewOpcode = X86::CMP16rm; break;
4240	case X86::SUB8rm: NewOpcode = X86::CMP8rm; break;
4241	case X86::SUB64rr: NewOpcode = X86::CMP64rr; break;
4242	case X86::SUB32rr: NewOpcode = X86::CMP32rr; break;
4243	case X86::SUB16rr: NewOpcode = X86::CMP16rr; break;
4244	case X86::SUB8rr: NewOpcode = X86::CMP8rr; break;
4245	case X86::SUB64ri32: NewOpcode = X86::CMP64ri32; break;
4246	case X86::SUB64ri8: NewOpcode = X86::CMP64ri8; break;
4247	case X86::SUB32ri: NewOpcode = X86::CMP32ri; break;
4248	case X86::SUB32ri8: NewOpcode = X86::CMP32ri8; break;
4249	case X86::SUB16ri: NewOpcode = X86::CMP16ri; break;
4250	case X86::SUB16ri8: NewOpcode = X86::CMP16ri8; break;
4251	case X86::SUB8ri: NewOpcode = X86::CMP8ri; break;
4252	}
4253	CmpInstr.setDesc(get(NewOpcode));
4254	CmpInstr.RemoveOperand(0);
4255	// Mutating this instruction invalidates any debug data associated with it.
4256	CmpInstr.dropDebugNumber();
4257	// Fall through to optimize Cmp if Cmp is CMPrr or CMPri.
4258	if (NewOpcode == X86::CMP64rm \|\| NewOpcode == X86::CMP32rm \|\|
4259	NewOpcode == X86::CMP16rm \|\| NewOpcode == X86::CMP8rm)
4260	return false;
4261	}
4262	}
4263
4264	// Get the unique definition of SrcReg.
4265	MachineInstr *MI = MRI->getUniqueVRegDef(SrcReg);
4266	if (!MI) return false;
4267
4268	// CmpInstr is the first instruction of the BB.
4269	MachineBasicBlock::iterator I = CmpInstr, Def = MI;
4270
4271	// If we are comparing against zero, check whether we can use MI to update
4272	// EFLAGS. If MI is not in the same BB as CmpInstr, do not optimize.
4273	bool IsCmpZero = (CmpMask != 0 && CmpValue == 0);
4274	if (IsCmpZero && MI->getParent() != CmpInstr.getParent())
4275	return false;
4276
4277	// If we have a use of the source register between the def and our compare
4278	// instruction we can eliminate the compare iff the use sets EFLAGS in the
4279	// right way.
4280	bool ShouldUpdateCC = false;
4281	bool NoSignFlag = false;
4282	bool ClearsOverflowFlag = false;
4283	X86::CondCode NewCC = X86::COND_INVALID;
4284	if (IsCmpZero && !isDefConvertible(*MI, NoSignFlag, ClearsOverflowFlag)) {
4285	// Scan forward from the use until we hit the use we're looking for or the
4286	// compare instruction.
4287	for (MachineBasicBlock::iterator J = MI;; ++J) {
4288	// Do we have a convertible instruction?
4289	NewCC = isUseDefConvertible(*J);
4290	if (NewCC != X86::COND_INVALID && J->getOperand(1).isReg() &&
4291	J->getOperand(1).getReg() == SrcReg) {
4292	assert(J->definesRegister(X86::EFLAGS) && "Must be an EFLAGS def!")(static_cast <bool> (J->definesRegister(X86::EFLAGS) && "Must be an EFLAGS def!") ? void (0) : __assert_fail ("J->definesRegister(X86::EFLAGS) && \"Must be an EFLAGS def!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4292, __extension__ __PRETTY_FUNCTION__));
4293	ShouldUpdateCC = true; // Update CC later on.
4294	// This is not a def of SrcReg, but still a def of EFLAGS. Keep going
4295	// with the new def.
4296	Def = J;
4297	MI = &*Def;
4298	break;
4299	}
4300
4301	if (J == I)
4302	return false;
4303	}
4304	}
4305
4306	// We are searching for an earlier instruction that can make CmpInstr
4307	// redundant and that instruction will be saved in Sub.
4308	MachineInstr *Sub = nullptr;
4309	const TargetRegisterInfo *TRI = &getRegisterInfo();
4310
4311	// We iterate backward, starting from the instruction before CmpInstr and
4312	// stop when reaching the definition of a source register or done with the BB.
4313	// RI points to the instruction before CmpInstr.
4314	// If the definition is in this basic block, RE points to the definition;
4315	// otherwise, RE is the rend of the basic block.
4316	MachineBasicBlock::reverse_iterator
4317	RI = ++I.getReverse(),
4318	RE = CmpInstr.getParent() == MI->getParent()
4319	? Def.getReverse() /* points to MI */
4320	: CmpInstr.getParent()->rend();
4321	MachineInstr *Movr0Inst = nullptr;
4322	for (; RI != RE; ++RI) {
4323	MachineInstr &Instr = *RI;
4324	// Check whether CmpInstr can be made redundant by the current instruction.
4325	if (!IsCmpZero && isRedundantFlagInstr(CmpInstr, SrcReg, SrcReg2, CmpMask,
4326	CmpValue, Instr)) {
4327	Sub = &Instr;
4328	break;
4329	}
4330
4331	if (Instr.modifiesRegister(X86::EFLAGS, TRI) \|\|
4332	Instr.readsRegister(X86::EFLAGS, TRI)) {
4333	// This instruction modifies or uses EFLAGS.
4334
4335	// MOV32r0 etc. are implemented with xor which clobbers condition code.
4336	// They are safe to move up, if the definition to EFLAGS is dead and
4337	// earlier instructions do not read or write EFLAGS.
4338	if (!Movr0Inst && Instr.getOpcode() == X86::MOV32r0 &&
4339	Instr.registerDefIsDead(X86::EFLAGS, TRI)) {
4340	Movr0Inst = &Instr;
4341	continue;
4342	}
4343
4344	// We can't remove CmpInstr.
4345	return false;
4346	}
4347	}
4348
4349	// Return false if no candidates exist.
4350	if (!IsCmpZero && !Sub)
4351	return false;
4352
4353	bool IsSwapped =
4354	(SrcReg2 != 0 && Sub && Sub->getOperand(1).getReg() == SrcReg2 &&
4355	Sub->getOperand(2).getReg() == SrcReg);
4356
4357	// Scan forward from the instruction after CmpInstr for uses of EFLAGS.
4358	// It is safe to remove CmpInstr if EFLAGS is redefined or killed.
4359	// If we are done with the basic block, we need to check whether EFLAGS is
4360	// live-out.
4361	bool IsSafe = false;
4362	SmallVector<std::pair<MachineInstr*, X86::CondCode>, 4> OpsToUpdate;
4363	MachineBasicBlock::iterator E = CmpInstr.getParent()->end();
4364	for (++I; I != E; ++I) {
4365	const MachineInstr &Instr = *I;
4366	bool ModifyEFLAGS = Instr.modifiesRegister(X86::EFLAGS, TRI);
4367	bool UseEFLAGS = Instr.readsRegister(X86::EFLAGS, TRI);
4368	// We should check the usage if this instruction uses and updates EFLAGS.
4369	if (!UseEFLAGS && ModifyEFLAGS) {
4370	// It is safe to remove CmpInstr if EFLAGS is updated again.
4371	IsSafe = true;
4372	break;
4373	}
4374	if (!UseEFLAGS && !ModifyEFLAGS)
4375	continue;
4376
4377	// EFLAGS is used by this instruction.
4378	X86::CondCode OldCC = X86::COND_INVALID;
4379	if (IsCmpZero \|\| IsSwapped) {
4380	// We decode the condition code from opcode.
4381	if (Instr.isBranch())
4382	OldCC = X86::getCondFromBranch(Instr);
4383	else {
4384	OldCC = X86::getCondFromSETCC(Instr);
4385	if (OldCC == X86::COND_INVALID)
4386	OldCC = X86::getCondFromCMov(Instr);
4387	}
4388	if (OldCC == X86::COND_INVALID) return false;
4389	}
4390	X86::CondCode ReplacementCC = X86::COND_INVALID;
4391	if (IsCmpZero) {
4392	switch (OldCC) {
4393	default: break;
4394	case X86::COND_A: case X86::COND_AE:
4395	case X86::COND_B: case X86::COND_BE:
4396	// CF is used, we can't perform this optimization.
4397	return false;
4398	case X86::COND_G: case X86::COND_GE:
4399	case X86::COND_L: case X86::COND_LE:
4400	case X86::COND_O: case X86::COND_NO:
4401	// If OF is used, the instruction needs to clear it like CmpZero does.
4402	if (!ClearsOverflowFlag)
4403	return false;
4404	break;
4405	case X86::COND_S: case X86::COND_NS:
4406	// If SF is used, but the instruction doesn't update the SF, then we
4407	// can't do the optimization.
4408	if (NoSignFlag)
4409	return false;
4410	break;
4411	}
4412
4413	// If we're updating the condition code check if we have to reverse the
4414	// condition.
4415	if (ShouldUpdateCC)
4416	switch (OldCC) {
4417	default:
4418	return false;
4419	case X86::COND_E:
4420	ReplacementCC = NewCC;
4421	break;
4422	case X86::COND_NE:
4423	ReplacementCC = GetOppositeBranchCondition(NewCC);
4424	break;
4425	}
4426	} else if (IsSwapped) {
4427	// If we have SUB(r1, r2) and CMP(r2, r1), the condition code needs
4428	// to be changed from r2 > r1 to r1 < r2, from r2 < r1 to r1 > r2, etc.
4429	// We swap the condition code and synthesize the new opcode.
4430	ReplacementCC = getSwappedCondition(OldCC);
4431	if (ReplacementCC == X86::COND_INVALID) return false;
4432	}
4433
4434	if ((ShouldUpdateCC \|\| IsSwapped) && ReplacementCC != OldCC) {
4435	// Push the MachineInstr to OpsToUpdate.
4436	// If it is safe to remove CmpInstr, the condition code of these
4437	// instructions will be modified.
4438	OpsToUpdate.push_back(std::make_pair(&*I, ReplacementCC));
4439	}
4440	if (ModifyEFLAGS \|\| Instr.killsRegister(X86::EFLAGS, TRI)) {
4441	// It is safe to remove CmpInstr if EFLAGS is updated again or killed.
4442	IsSafe = true;
4443	break;
4444	}
4445	}
4446
4447	// If EFLAGS is not killed nor re-defined, we should check whether it is
4448	// live-out. If it is live-out, do not optimize.
4449	if ((IsCmpZero \|\| IsSwapped) && !IsSafe) {
4450	MachineBasicBlock *MBB = CmpInstr.getParent();
4451	for (MachineBasicBlock *Successor : MBB->successors())
4452	if (Successor->isLiveIn(X86::EFLAGS))
4453	return false;
4454	}
4455
4456	// The instruction to be updated is either Sub or MI.
4457	Sub = IsCmpZero ? MI : Sub;
4458	// Move Movr0Inst to the appropriate place before Sub.
4459	if (Movr0Inst) {
4460	// Look backwards until we find a def that doesn't use the current EFLAGS.
4461	Def = Sub;
4462	MachineBasicBlock::reverse_iterator InsertI = Def.getReverse(),
4463	InsertE = Sub->getParent()->rend();
4464	for (; InsertI != InsertE; ++InsertI) {
4465	MachineInstr Instr = &InsertI;
4466	if (!Instr->readsRegister(X86::EFLAGS, TRI) &&
4467	Instr->modifiesRegister(X86::EFLAGS, TRI)) {
4468	Sub->getParent()->remove(Movr0Inst);
4469	Instr->getParent()->insert(MachineBasicBlock::iterator(Instr),
4470	Movr0Inst);
4471	break;
4472	}
4473	}
4474	if (InsertI == InsertE)
4475	return false;
4476	}
4477
4478	// Make sure Sub instruction defines EFLAGS and mark the def live.
4479	MachineOperand *FlagDef = Sub->findRegisterDefOperand(X86::EFLAGS);
4480	assert(FlagDef && "Unable to locate a def EFLAGS operand")(static_cast <bool> (FlagDef && "Unable to locate a def EFLAGS operand" ) ? void (0) : __assert_fail ("FlagDef && \"Unable to locate a def EFLAGS operand\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4480, __extension__ __PRETTY_FUNCTION__));
4481	FlagDef->setIsDead(false);
4482
4483	CmpInstr.eraseFromParent();
4484
4485	// Modify the condition code of instructions in OpsToUpdate.
4486	for (auto &Op : OpsToUpdate) {
4487	Op.first->getOperand(Op.first->getDesc().getNumOperands() - 1)
4488	.setImm(Op.second);
4489	}
4490	return true;
4491	}
4492
4493	/// Try to remove the load by folding it to a register
4494	/// operand at the use. We fold the load instructions if load defines a virtual
4495	/// register, the virtual register is used once in the same BB, and the
4496	/// instructions in-between do not load or store, and have no side effects.
4497	MachineInstr *X86InstrInfo::optimizeLoadInstr(MachineInstr &MI,
4498	const MachineRegisterInfo *MRI,
4499	Register &FoldAsLoadDefReg,
4500	MachineInstr *&DefMI) const {
4501	// Check whether we can move DefMI here.
4502	DefMI = MRI->getVRegDef(FoldAsLoadDefReg);
4503	assert(DefMI)(static_cast <bool> (DefMI) ? void (0) : __assert_fail ( "DefMI", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4503, __extension__ __PRETTY_FUNCTION__));
4504	bool SawStore = false;
4505	if (!DefMI->isSafeToMove(nullptr, SawStore))
4506	return nullptr;
4507
4508	// Collect information about virtual register operands of MI.
4509	SmallVector<unsigned, 1> SrcOperandIds;
4510	for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
4511	MachineOperand &MO = MI.getOperand(i);
4512	if (!MO.isReg())
4513	continue;
4514	Register Reg = MO.getReg();
4515	if (Reg != FoldAsLoadDefReg)
4516	continue;
4517	// Do not fold if we have a subreg use or a def.
4518	if (MO.getSubReg() \|\| MO.isDef())
4519	return nullptr;
4520	SrcOperandIds.push_back(i);
4521	}
4522	if (SrcOperandIds.empty())
4523	return nullptr;
4524
4525	// Check whether we can fold the def into SrcOperandId.
4526	if (MachineInstr FoldMI = foldMemoryOperand(MI, SrcOperandIds, DefMI)) {
4527	FoldAsLoadDefReg = 0;
4528	return FoldMI;
4529	}
4530
4531	return nullptr;
4532	}
4533
4534	/// Expand a single-def pseudo instruction to a two-addr
4535	/// instruction with two undef reads of the register being defined.
4536	/// This is used for mapping:
4537	/// %xmm4 = V_SET0
4538	/// to:
4539	/// %xmm4 = PXORrr undef %xmm4, undef %xmm4
4540	///
4541	static bool Expand2AddrUndef(MachineInstrBuilder &MIB,
4542	const MCInstrDesc &Desc) {
4543	assert(Desc.getNumOperands() == 3 && "Expected two-addr instruction.")(static_cast <bool> (Desc.getNumOperands() == 3 && "Expected two-addr instruction.") ? void (0) : __assert_fail ("Desc.getNumOperands() == 3 && \"Expected two-addr instruction.\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4543, __extension__ __PRETTY_FUNCTION__));
4544	Register Reg = MIB.getReg(0);
4545	MIB->setDesc(Desc);
4546
4547	// MachineInstr::addOperand() will insert explicit operands before any
4548	// implicit operands.
4549	MIB.addReg(Reg, RegState::Undef).addReg(Reg, RegState::Undef);
4550	// But we don't trust that.
4551	assert(MIB.getReg(1) == Reg &&(static_cast <bool> (MIB.getReg(1) == Reg && MIB .getReg(2) == Reg && "Misplaced operand") ? void (0) : __assert_fail ("MIB.getReg(1) == Reg && MIB.getReg(2) == Reg && \"Misplaced operand\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4552, __extension__ __PRETTY_FUNCTION__))
4552	MIB.getReg(2) == Reg && "Misplaced operand")(static_cast <bool> (MIB.getReg(1) == Reg && MIB .getReg(2) == Reg && "Misplaced operand") ? void (0) : __assert_fail ("MIB.getReg(1) == Reg && MIB.getReg(2) == Reg && \"Misplaced operand\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4552, __extension__ __PRETTY_FUNCTION__));
4553	return true;
4554	}
4555
4556	/// Expand a single-def pseudo instruction to a two-addr
4557	/// instruction with two %k0 reads.
4558	/// This is used for mapping:
4559	/// %k4 = K_SET1
4560	/// to:
4561	/// %k4 = KXNORrr %k0, %k0
4562	static bool Expand2AddrKreg(MachineInstrBuilder &MIB, const MCInstrDesc &Desc,
4563	Register Reg) {
4564	assert(Desc.getNumOperands() == 3 && "Expected two-addr instruction.")(static_cast <bool> (Desc.getNumOperands() == 3 && "Expected two-addr instruction.") ? void (0) : __assert_fail ("Desc.getNumOperands() == 3 && \"Expected two-addr instruction.\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4564, __extension__ __PRETTY_FUNCTION__));
4565	MIB->setDesc(Desc);
4566	MIB.addReg(Reg, RegState::Undef).addReg(Reg, RegState::Undef);
4567	return true;
4568	}
4569
4570	static bool expandMOV32r1(MachineInstrBuilder &MIB, const TargetInstrInfo &TII,
4571	bool MinusOne) {
4572	MachineBasicBlock &MBB = *MIB->getParent();
4573	const DebugLoc &DL = MIB->getDebugLoc();
4574	Register Reg = MIB.getReg(0);
4575
4576	// Insert the XOR.
4577	BuildMI(MBB, MIB.getInstr(), DL, TII.get(X86::XOR32rr), Reg)
4578	.addReg(Reg, RegState::Undef)
4579	.addReg(Reg, RegState::Undef);
4580
4581	// Turn the pseudo into an INC or DEC.
4582	MIB->setDesc(TII.get(MinusOne ? X86::DEC32r : X86::INC32r));
4583	MIB.addReg(Reg);
4584
4585	return true;
4586	}
4587
4588	static bool ExpandMOVImmSExti8(MachineInstrBuilder &MIB,
4589	const TargetInstrInfo &TII,
4590	const X86Subtarget &Subtarget) {
4591	MachineBasicBlock &MBB = *MIB->getParent();
4592	const DebugLoc &DL = MIB->getDebugLoc();
4593	int64_t Imm = MIB->getOperand(1).getImm();
4594	assert(Imm != 0 && "Using push/pop for 0 is not efficient.")(static_cast <bool> (Imm != 0 && "Using push/pop for 0 is not efficient." ) ? void (0) : __assert_fail ("Imm != 0 && \"Using push/pop for 0 is not efficient.\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4594, __extension__ __PRETTY_FUNCTION__));
4595	MachineBasicBlock::iterator I = MIB.getInstr();
4596
4597	int StackAdjustment;
4598
4599	if (Subtarget.is64Bit()) {
4600	assert(MIB->getOpcode() == X86::MOV64ImmSExti8 \|\|(static_cast <bool> (MIB->getOpcode() == X86::MOV64ImmSExti8 \|\| MIB->getOpcode() == X86::MOV32ImmSExti8) ? void (0) : __assert_fail ("MIB->getOpcode() == X86::MOV64ImmSExti8 \|\| MIB->getOpcode() == X86::MOV32ImmSExti8" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4601, __extension__ __PRETTY_FUNCTION__))
4601	MIB->getOpcode() == X86::MOV32ImmSExti8)(static_cast <bool> (MIB->getOpcode() == X86::MOV64ImmSExti8 \|\| MIB->getOpcode() == X86::MOV32ImmSExti8) ? void (0) : __assert_fail ("MIB->getOpcode() == X86::MOV64ImmSExti8 \|\| MIB->getOpcode() == X86::MOV32ImmSExti8" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4601, __extension__ __PRETTY_FUNCTION__));
4602
4603	// Can't use push/pop lowering if the function might write to the red zone.
4604	X86MachineFunctionInfo *X86FI =
4605	MBB.getParent()->getInfo<X86MachineFunctionInfo>();
4606	if (X86FI->getUsesRedZone()) {
4607	MIB->setDesc(TII.get(MIB->getOpcode() ==
4608	X86::MOV32ImmSExti8 ? X86::MOV32ri : X86::MOV64ri));
4609	return true;
4610	}
4611
4612	// 64-bit mode doesn't have 32-bit push/pop, so use 64-bit operations and
4613	// widen the register if necessary.
4614	StackAdjustment = 8;
4615	BuildMI(MBB, I, DL, TII.get(X86::PUSH64i8)).addImm(Imm);
4616	MIB->setDesc(TII.get(X86::POP64r));
4617	MIB->getOperand(0)
4618	.setReg(getX86SubSuperRegister(MIB.getReg(0), 64));
4619	} else {
4620	assert(MIB->getOpcode() == X86::MOV32ImmSExti8)(static_cast <bool> (MIB->getOpcode() == X86::MOV32ImmSExti8 ) ? void (0) : __assert_fail ("MIB->getOpcode() == X86::MOV32ImmSExti8" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4620, __extension__ __PRETTY_FUNCTION__));
4621	StackAdjustment = 4;
4622	BuildMI(MBB, I, DL, TII.get(X86::PUSH32i8)).addImm(Imm);
4623	MIB->setDesc(TII.get(X86::POP32r));
4624	}
4625	MIB->RemoveOperand(1);
4626	MIB->addImplicitDefUseOperands(*MBB.getParent());
4627
4628	// Build CFI if necessary.
4629	MachineFunction &MF = *MBB.getParent();
4630	const X86FrameLowering *TFL = Subtarget.getFrameLowering();
4631	bool IsWin64Prologue = MF.getTarget().getMCAsmInfo()->usesWindowsCFI();
4632	bool NeedsDwarfCFI = !IsWin64Prologue && MF.needsFrameMoves();
4633	bool EmitCFI = !TFL->hasFP(MF) && NeedsDwarfCFI;
4634	if (EmitCFI) {
4635	TFL->BuildCFI(MBB, I, DL,
4636	MCCFIInstruction::createAdjustCfaOffset(nullptr, StackAdjustment));
4637	TFL->BuildCFI(MBB, std::next(I), DL,
4638	MCCFIInstruction::createAdjustCfaOffset(nullptr, -StackAdjustment));
4639	}
4640
4641	return true;
4642	}
4643
4644	// LoadStackGuard has so far only been implemented for 64-bit MachO. Different
4645	// code sequence is needed for other targets.
4646	static void expandLoadStackGuard(MachineInstrBuilder &MIB,
4647	const TargetInstrInfo &TII) {
4648	MachineBasicBlock &MBB = *MIB->getParent();
4649	const DebugLoc &DL = MIB->getDebugLoc();
4650	Register Reg = MIB.getReg(0);
4651	const GlobalValue *GV =
4652	cast<GlobalValue>((*MIB->memoperands_begin())->getValue());
4653	auto Flags = MachineMemOperand::MOLoad \|
4654	MachineMemOperand::MODereferenceable \|
4655	MachineMemOperand::MOInvariant;
4656	MachineMemOperand *MMO = MBB.getParent()->getMachineMemOperand(
4657	MachinePointerInfo::getGOT(*MBB.getParent()), Flags, 8, Align(8));
4658	MachineBasicBlock::iterator I = MIB.getInstr();
4659
4660	BuildMI(MBB, I, DL, TII.get(X86::MOV64rm), Reg).addReg(X86::RIP).addImm(1)
4661	.addReg(0).addGlobalAddress(GV, 0, X86II::MO_GOTPCREL).addReg(0)
4662	.addMemOperand(MMO);
4663	MIB->setDebugLoc(DL);
4664	MIB->setDesc(TII.get(X86::MOV64rm));
4665	MIB.addReg(Reg, RegState::Kill).addImm(1).addReg(0).addImm(0).addReg(0);
4666	}
4667
4668	static bool expandXorFP(MachineInstrBuilder &MIB, const TargetInstrInfo &TII) {
4669	MachineBasicBlock &MBB = *MIB->getParent();
4670	MachineFunction &MF = *MBB.getParent();
4671	const X86Subtarget &Subtarget = MF.getSubtarget<X86Subtarget>();
4672	const X86RegisterInfo *TRI = Subtarget.getRegisterInfo();
4673	unsigned XorOp =
4674	MIB->getOpcode() == X86::XOR64_FP ? X86::XOR64rr : X86::XOR32rr;
4675	MIB->setDesc(TII.get(XorOp));
4676	MIB.addReg(TRI->getFrameRegister(MF), RegState::Undef);
4677	return true;
4678	}
4679
4680	// This is used to handle spills for 128/256-bit registers when we have AVX512,
4681	// but not VLX. If it uses an extended register we need to use an instruction
4682	// that loads the lower 128/256-bit, but is available with only AVX512F.
4683	static bool expandNOVLXLoad(MachineInstrBuilder &MIB,
4684	const TargetRegisterInfo *TRI,
4685	const MCInstrDesc &LoadDesc,
4686	const MCInstrDesc &BroadcastDesc,
4687	unsigned SubIdx) {
4688	Register DestReg = MIB.getReg(0);
4689	// Check if DestReg is XMM16-31 or YMM16-31.
4690	if (TRI->getEncodingValue(DestReg) < 16) {
4691	// We can use a normal VEX encoded load.
4692	MIB->setDesc(LoadDesc);
4693	} else {
4694	// Use a 128/256-bit VBROADCAST instruction.
4695	MIB->setDesc(BroadcastDesc);
4696	// Change the destination to a 512-bit register.
4697	DestReg = TRI->getMatchingSuperReg(DestReg, SubIdx, &X86::VR512RegClass);
4698	MIB->getOperand(0).setReg(DestReg);
4699	}
4700	return true;
4701	}
4702
4703	// This is used to handle spills for 128/256-bit registers when we have AVX512,
4704	// but not VLX. If it uses an extended register we need to use an instruction
4705	// that stores the lower 128/256-bit, but is available with only AVX512F.
4706	static bool expandNOVLXStore(MachineInstrBuilder &MIB,
4707	const TargetRegisterInfo *TRI,
4708	const MCInstrDesc &StoreDesc,
4709	const MCInstrDesc &ExtractDesc,
4710	unsigned SubIdx) {
4711	Register SrcReg = MIB.getReg(X86::AddrNumOperands);
4712	// Check if DestReg is XMM16-31 or YMM16-31.
4713	if (TRI->getEncodingValue(SrcReg) < 16) {
4714	// We can use a normal VEX encoded store.
4715	MIB->setDesc(StoreDesc);
4716	} else {
4717	// Use a VEXTRACTF instruction.
4718	MIB->setDesc(ExtractDesc);
4719	// Change the destination to a 512-bit register.
4720	SrcReg = TRI->getMatchingSuperReg(SrcReg, SubIdx, &X86::VR512RegClass);
4721	MIB->getOperand(X86::AddrNumOperands).setReg(SrcReg);
4722	MIB.addImm(0x0); // Append immediate to extract from the lower bits.
4723	}
4724
4725	return true;
4726	}
4727
4728	static bool expandSHXDROT(MachineInstrBuilder &MIB, const MCInstrDesc &Desc) {
4729	MIB->setDesc(Desc);
4730	int64_t ShiftAmt = MIB->getOperand(2).getImm();
4731	// Temporarily remove the immediate so we can add another source register.
4732	MIB->RemoveOperand(2);
4733	// Add the register. Don't copy the kill flag if there is one.
4734	MIB.addReg(MIB.getReg(1),
4735	getUndefRegState(MIB->getOperand(1).isUndef()));
4736	// Add back the immediate.
4737	MIB.addImm(ShiftAmt);
4738	return true;
4739	}
4740
4741	bool X86InstrInfo::expandPostRAPseudo(MachineInstr &MI) const {
4742	bool HasAVX = Subtarget.hasAVX();
4743	MachineInstrBuilder MIB(*MI.getParent()->getParent(), MI);
4744	switch (MI.getOpcode()) {
4745	case X86::MOV32r0:
4746	return Expand2AddrUndef(MIB, get(X86::XOR32rr));
4747	case X86::MOV32r1:
4748	return expandMOV32r1(MIB, this, /MinusOne=*/ false);
4749	case X86::MOV32r_1:
4750	return expandMOV32r1(MIB, this, /MinusOne=*/ true);
4751	case X86::MOV32ImmSExti8:
4752	case X86::MOV64ImmSExti8:
4753	return ExpandMOVImmSExti8(MIB, *this, Subtarget);
4754	case X86::SETB_C32r:
4755	return Expand2AddrUndef(MIB, get(X86::SBB32rr));
4756	case X86::SETB_C64r:
4757	return Expand2AddrUndef(MIB, get(X86::SBB64rr));
4758	case X86::MMX_SET0:
4759	return Expand2AddrUndef(MIB, get(X86::MMX_PXORirr));
4760	case X86::V_SET0:
4761	case X86::FsFLD0SS:
4762	case X86::FsFLD0SD:
4763	case X86::FsFLD0F128:
4764	return Expand2AddrUndef(MIB, get(HasAVX ? X86::VXORPSrr : X86::XORPSrr));
4765	case X86::AVX_SET0: {
4766	assert(HasAVX && "AVX not supported")(static_cast <bool> (HasAVX && "AVX not supported" ) ? void (0) : __assert_fail ("HasAVX && \"AVX not supported\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 4766, __extension__ __PRETTY_FUNCTION__));
4767	const TargetRegisterInfo *TRI = &getRegisterInfo();
4768	Register SrcReg = MIB.getReg(0);
4769	Register XReg = TRI->getSubReg(SrcReg, X86::sub_xmm);
4770	MIB->getOperand(0).setReg(XReg);
4771	Expand2AddrUndef(MIB, get(X86::VXORPSrr));
4772	MIB.addReg(SrcReg, RegState::ImplicitDefine);
4773	return true;
4774	}
4775	case X86::AVX512_128_SET0:
4776	case X86::AVX512_FsFLD0SH:
4777	case X86::AVX512_FsFLD0SS:
4778	case X86::AVX512_FsFLD0SD:
4779	case X86::AVX512_FsFLD0F128: {
4780	bool HasVLX = Subtarget.hasVLX();
4781	Register SrcReg = MIB.getReg(0);
4782	const TargetRegisterInfo *TRI = &getRegisterInfo();
4783	if (HasVLX \|\| TRI->getEncodingValue(SrcReg) < 16)
4784	return Expand2AddrUndef(MIB,
4785	get(HasVLX ? X86::VPXORDZ128rr : X86::VXORPSrr));
4786	// Extended register without VLX. Use a larger XOR.
4787	SrcReg =
4788	TRI->getMatchingSuperReg(SrcReg, X86::sub_xmm, &X86::VR512RegClass);
4789	MIB->getOperand(0).setReg(SrcReg);
4790	return Expand2AddrUndef(MIB, get(X86::VPXORDZrr));
4791	}
4792	case X86::AVX512_256_SET0:
4793	case X86::AVX512_512_SET0: {
4794	bool HasVLX = Subtarget.hasVLX();
4795	Register SrcReg = MIB.getReg(0);
4796	const TargetRegisterInfo *TRI = &getRegisterInfo();
4797	if (HasVLX \|\| TRI->getEncodingValue(SrcReg) < 16) {
4798	Register XReg = TRI->getSubReg(SrcReg, X86::sub_xmm);
4799	MIB->getOperand(0).setReg(XReg);
4800	Expand2AddrUndef(MIB,
4801	get(HasVLX ? X86::VPXORDZ128rr : X86::VXORPSrr));
4802	MIB.addReg(SrcReg, RegState::ImplicitDefine);
4803	return true;
4804	}
4805	if (MI.getOpcode() == X86::AVX512_256_SET0) {
4806	// No VLX so we must reference a zmm.
4807	unsigned ZReg =
4808	TRI->getMatchingSuperReg(SrcReg, X86::sub_ymm, &X86::VR512RegClass);
4809	MIB->getOperand(0).setReg(ZReg);
4810	}
4811	return Expand2AddrUndef(MIB, get(X86::VPXORDZrr));
4812	}
4813	case X86::V_SETALLONES:
4814	return Expand2AddrUndef(MIB, get(HasAVX ? X86::VPCMPEQDrr : X86::PCMPEQDrr));
4815	case X86::AVX2_SETALLONES:
4816	return Expand2AddrUndef(MIB, get(X86::VPCMPEQDYrr));
4817	case X86::AVX1_SETALLONES: {
4818	Register Reg = MIB.getReg(0);
4819	// VCMPPSYrri with an immediate 0xf should produce VCMPTRUEPS.
4820	MIB->setDesc(get(X86::VCMPPSYrri));
4821	MIB.addReg(Reg, RegState::Undef).addReg(Reg, RegState::Undef).addImm(0xf);
4822	return true;
4823	}
4824	case X86::AVX512_512_SETALLONES: {
4825	Register Reg = MIB.getReg(0);
4826	MIB->setDesc(get(X86::VPTERNLOGDZrri));
4827	// VPTERNLOGD needs 3 register inputs and an immediate.
4828	// 0xff will return 1s for any input.
4829	MIB.addReg(Reg, RegState::Undef).addReg(Reg, RegState::Undef)
4830	.addReg(Reg, RegState::Undef).addImm(0xff);
4831	return true;
4832	}
4833	case X86::AVX512_512_SEXT_MASK_32:
4834	case X86::AVX512_512_SEXT_MASK_64: {
4835	Register Reg = MIB.getReg(0);
4836	Register MaskReg = MIB.getReg(1);
4837	unsigned MaskState = getRegState(MIB->getOperand(1));
4838	unsigned Opc = (MI.getOpcode() == X86::AVX512_512_SEXT_MASK_64) ?
4839	X86::VPTERNLOGQZrrikz : X86::VPTERNLOGDZrrikz;
4840	MI.RemoveOperand(1);
4841	MIB->setDesc(get(Opc));
4842	// VPTERNLOG needs 3 register inputs and an immediate.
4843	// 0xff will return 1s for any input.
4844	MIB.addReg(Reg, RegState::Undef).addReg(MaskReg, MaskState)
4845	.addReg(Reg, RegState::Undef).addReg(Reg, RegState::Undef).addImm(0xff);
4846	return true;
4847	}
4848	case X86::VMOVAPSZ128rm_NOVLX:
4849	return expandNOVLXLoad(MIB, &getRegisterInfo(), get(X86::VMOVAPSrm),
4850	get(X86::VBROADCASTF32X4rm), X86::sub_xmm);
4851	case X86::VMOVUPSZ128rm_NOVLX:
4852	return expandNOVLXLoad(MIB, &getRegisterInfo(), get(X86::VMOVUPSrm),
4853	get(X86::VBROADCASTF32X4rm), X86::sub_xmm);
4854	case X86::VMOVAPSZ256rm_NOVLX:
4855	return expandNOVLXLoad(MIB, &getRegisterInfo(), get(X86::VMOVAPSYrm),
4856	get(X86::VBROADCASTF64X4rm), X86::sub_ymm);
4857	case X86::VMOVUPSZ256rm_NOVLX:
4858	return expandNOVLXLoad(MIB, &getRegisterInfo(), get(X86::VMOVUPSYrm),
4859	get(X86::VBROADCASTF64X4rm), X86::sub_ymm);
4860	case X86::VMOVAPSZ128mr_NOVLX:
4861	return expandNOVLXStore(MIB, &getRegisterInfo(), get(X86::VMOVAPSmr),
4862	get(X86::VEXTRACTF32x4Zmr), X86::sub_xmm);
4863	case X86::VMOVUPSZ128mr_NOVLX:
4864	return expandNOVLXStore(MIB, &getRegisterInfo(), get(X86::VMOVUPSmr),
4865	get(X86::VEXTRACTF32x4Zmr), X86::sub_xmm);
4866	case X86::VMOVAPSZ256mr_NOVLX:
4867	return expandNOVLXStore(MIB, &getRegisterInfo(), get(X86::VMOVAPSYmr),
4868	get(X86::VEXTRACTF64x4Zmr), X86::sub_ymm);
4869	case X86::VMOVUPSZ256mr_NOVLX:
4870	return expandNOVLXStore(MIB, &getRegisterInfo(), get(X86::VMOVUPSYmr),
4871	get(X86::VEXTRACTF64x4Zmr), X86::sub_ymm);
4872	case X86::MOV32ri64: {
4873	Register Reg = MIB.getReg(0);
4874	Register Reg32 = RI.getSubReg(Reg, X86::sub_32bit);
4875	MI.setDesc(get(X86::MOV32ri));
4876	MIB->getOperand(0).setReg(Reg32);
4877	MIB.addReg(Reg, RegState::ImplicitDefine);
4878	return true;
4879	}
4880
4881	// KNL does not recognize dependency-breaking idioms for mask registers,
4882	// so kxnor %k1, %k1, %k2 has a RAW dependence on %k1.
4883	// Using %k0 as the undef input register is a performance heuristic based
4884	// on the assumption that %k0 is used less frequently than the other mask
4885	// registers, since it is not usable as a write mask.
4886	// FIXME: A more advanced approach would be to choose the best input mask
4887	// register based on context.
4888	case X86::KSET0W: return Expand2AddrKreg(MIB, get(X86::KXORWrr), X86::K0);
4889	case X86::KSET0D: return Expand2AddrKreg(MIB, get(X86::KXORDrr), X86::K0);
4890	case X86::KSET0Q: return Expand2AddrKreg(MIB, get(X86::KXORQrr), X86::K0);
4891	case X86::KSET1W: return Expand2AddrKreg(MIB, get(X86::KXNORWrr), X86::K0);
4892	case X86::KSET1D: return Expand2AddrKreg(MIB, get(X86::KXNORDrr), X86::K0);
4893	case X86::KSET1Q: return Expand2AddrKreg(MIB, get(X86::KXNORQrr), X86::K0);
4894	case TargetOpcode::LOAD_STACK_GUARD:
4895	expandLoadStackGuard(MIB, *this);
4896	return true;
4897	case X86::XOR64_FP:
4898	case X86::XOR32_FP:
4899	return expandXorFP(MIB, *this);
4900	case X86::SHLDROT32ri: return expandSHXDROT(MIB, get(X86::SHLD32rri8));
4901	case X86::SHLDROT64ri: return expandSHXDROT(MIB, get(X86::SHLD64rri8));
4902	case X86::SHRDROT32ri: return expandSHXDROT(MIB, get(X86::SHRD32rri8));
4903	case X86::SHRDROT64ri: return expandSHXDROT(MIB, get(X86::SHRD64rri8));
4904	case X86::ADD8rr_DB: MIB->setDesc(get(X86::OR8rr)); break;
4905	case X86::ADD16rr_DB: MIB->setDesc(get(X86::OR16rr)); break;
4906	case X86::ADD32rr_DB: MIB->setDesc(get(X86::OR32rr)); break;
4907	case X86::ADD64rr_DB: MIB->setDesc(get(X86::OR64rr)); break;
4908	case X86::ADD8ri_DB: MIB->setDesc(get(X86::OR8ri)); break;
4909	case X86::ADD16ri_DB: MIB->setDesc(get(X86::OR16ri)); break;
4910	case X86::ADD32ri_DB: MIB->setDesc(get(X86::OR32ri)); break;
4911	case X86::ADD64ri32_DB: MIB->setDesc(get(X86::OR64ri32)); break;
4912	case X86::ADD16ri8_DB: MIB->setDesc(get(X86::OR16ri8)); break;
4913	case X86::ADD32ri8_DB: MIB->setDesc(get(X86::OR32ri8)); break;
4914	case X86::ADD64ri8_DB: MIB->setDesc(get(X86::OR64ri8)); break;
4915	}
4916	return false;
4917	}
4918
4919	/// Return true for all instructions that only update
4920	/// the first 32 or 64-bits of the destination register and leave the rest
4921	/// unmodified. This can be used to avoid folding loads if the instructions
4922	/// only update part of the destination register, and the non-updated part is
4923	/// not needed. e.g. cvtss2sd, sqrtss. Unfolding the load from these
4924	/// instructions breaks the partial register dependency and it can improve
4925	/// performance. e.g.:
4926	///
4927	/// movss (%rdi), %xmm0
4928	/// cvtss2sd %xmm0, %xmm0
4929	///
4930	/// Instead of
4931	/// cvtss2sd (%rdi), %xmm0
4932	///
4933	/// FIXME: This should be turned into a TSFlags.
4934	///
4935	static bool hasPartialRegUpdate(unsigned Opcode,
4936	const X86Subtarget &Subtarget,
4937	bool ForLoadFold = false) {
4938	switch (Opcode) {
4939	case X86::CVTSI2SSrr:
4940	case X86::CVTSI2SSrm:
4941	case X86::CVTSI642SSrr:
4942	case X86::CVTSI642SSrm:
4943	case X86::CVTSI2SDrr:
4944	case X86::CVTSI2SDrm:
4945	case X86::CVTSI642SDrr:
4946	case X86::CVTSI642SDrm:
4947	// Load folding won't effect the undef register update since the input is
4948	// a GPR.
4949	return !ForLoadFold;
4950	case X86::CVTSD2SSrr:
4951	case X86::CVTSD2SSrm:
4952	case X86::CVTSS2SDrr:
4953	case X86::CVTSS2SDrm:
4954	case X86::MOVHPDrm:
4955	case X86::MOVHPSrm:
4956	case X86::MOVLPDrm:
4957	case X86::MOVLPSrm:
4958	case X86::RCPSSr:
4959	case X86::RCPSSm:
4960	case X86::RCPSSr_Int:
4961	case X86::RCPSSm_Int:
4962	case X86::ROUNDSDr:
4963	case X86::ROUNDSDm:
4964	case X86::ROUNDSSr:
4965	case X86::ROUNDSSm:
4966	case X86::RSQRTSSr:
4967	case X86::RSQRTSSm:
4968	case X86::RSQRTSSr_Int:
4969	case X86::RSQRTSSm_Int:
4970	case X86::SQRTSSr:
4971	case X86::SQRTSSm:
4972	case X86::SQRTSSr_Int:
4973	case X86::SQRTSSm_Int:
4974	case X86::SQRTSDr:
4975	case X86::SQRTSDm:
4976	case X86::SQRTSDr_Int:
4977	case X86::SQRTSDm_Int:
4978	return true;
4979	// GPR
4980	case X86::POPCNT32rm:
4981	case X86::POPCNT32rr:
4982	case X86::POPCNT64rm:
4983	case X86::POPCNT64rr:
4984	return Subtarget.hasPOPCNTFalseDeps();
4985	case X86::LZCNT32rm:
4986	case X86::LZCNT32rr:
4987	case X86::LZCNT64rm:
4988	case X86::LZCNT64rr:
4989	case X86::TZCNT32rm:
4990	case X86::TZCNT32rr:
4991	case X86::TZCNT64rm:
4992	case X86::TZCNT64rr:
4993	return Subtarget.hasLZCNTFalseDeps();
4994	}
4995
4996	return false;
4997	}
4998
4999	/// Inform the BreakFalseDeps pass how many idle
5000	/// instructions we would like before a partial register update.
5001	unsigned X86InstrInfo::getPartialRegUpdateClearance(
5002	const MachineInstr &MI, unsigned OpNum,
5003	const TargetRegisterInfo *TRI) const {
5004	if (OpNum != 0 \|\| !hasPartialRegUpdate(MI.getOpcode(), Subtarget))
5005	return 0;
5006
5007	// If MI is marked as reading Reg, the partial register update is wanted.
5008	const MachineOperand &MO = MI.getOperand(0);
5009	Register Reg = MO.getReg();
5010	if (Reg.isVirtual()) {
5011	if (MO.readsReg() \|\| MI.readsVirtualRegister(Reg))
5012	return 0;
5013	} else {
5014	if (MI.readsRegister(Reg, TRI))
5015	return 0;
5016	}
5017
5018	// If any instructions in the clearance range are reading Reg, insert a
5019	// dependency breaking instruction, which is inexpensive and is likely to
5020	// be hidden in other instruction's cycles.
5021	return PartialRegUpdateClearance;
5022	}
5023
5024	// Return true for any instruction the copies the high bits of the first source
5025	// operand into the unused high bits of the destination operand.
5026	// Also returns true for instructions that have two inputs where one may
5027	// be undef and we want it to use the same register as the other input.
5028	static bool hasUndefRegUpdate(unsigned Opcode, unsigned OpNum,
5029	bool ForLoadFold = false) {
5030	// Set the OpNum parameter to the first source operand.
5031	switch (Opcode) {
5032	case X86::MMX_PUNPCKHBWirr:
5033	case X86::MMX_PUNPCKHWDirr:
5034	case X86::MMX_PUNPCKHDQirr:
5035	case X86::MMX_PUNPCKLBWirr:
5036	case X86::MMX_PUNPCKLWDirr:
5037	case X86::MMX_PUNPCKLDQirr:
5038	case X86::MOVHLPSrr:
5039	case X86::PACKSSWBrr:
5040	case X86::PACKUSWBrr:
5041	case X86::PACKSSDWrr:
5042	case X86::PACKUSDWrr:
5043	case X86::PUNPCKHBWrr:
5044	case X86::PUNPCKLBWrr:
5045	case X86::PUNPCKHWDrr:
5046	case X86::PUNPCKLWDrr:
5047	case X86::PUNPCKHDQrr:
5048	case X86::PUNPCKLDQrr:
5049	case X86::PUNPCKHQDQrr:
5050	case X86::PUNPCKLQDQrr:
5051	case X86::SHUFPDrri:
5052	case X86::SHUFPSrri:
5053	// These instructions are sometimes used with an undef first or second
5054	// source. Return true here so BreakFalseDeps will assign this source to the
5055	// same register as the first source to avoid a false dependency.
5056	// Operand 1 of these instructions is tied so they're separate from their
5057	// VEX counterparts.
5058	return OpNum == 2 && !ForLoadFold;
5059
5060	case X86::VMOVLHPSrr:
5061	case X86::VMOVLHPSZrr:
5062	case X86::VPACKSSWBrr:
5063	case X86::VPACKUSWBrr:
5064	case X86::VPACKSSDWrr:
5065	case X86::VPACKUSDWrr:
5066	case X86::VPACKSSWBZ128rr:
5067	case X86::VPACKUSWBZ128rr:
5068	case X86::VPACKSSDWZ128rr:
5069	case X86::VPACKUSDWZ128rr:
5070	case X86::VPERM2F128rr:
5071	case X86::VPERM2I128rr:
5072	case X86::VSHUFF32X4Z256rri:
5073	case X86::VSHUFF32X4Zrri:
5074	case X86::VSHUFF64X2Z256rri:
5075	case X86::VSHUFF64X2Zrri:
5076	case X86::VSHUFI32X4Z256rri:
5077	case X86::VSHUFI32X4Zrri:
5078	case X86::VSHUFI64X2Z256rri:
5079	case X86::VSHUFI64X2Zrri:
5080	case X86::VPUNPCKHBWrr:
5081	case X86::VPUNPCKLBWrr:
5082	case X86::VPUNPCKHBWYrr:
5083	case X86::VPUNPCKLBWYrr:
5084	case X86::VPUNPCKHBWZ128rr:
5085	case X86::VPUNPCKLBWZ128rr:
5086	case X86::VPUNPCKHBWZ256rr:
5087	case X86::VPUNPCKLBWZ256rr:
5088	case X86::VPUNPCKHBWZrr:
5089	case X86::VPUNPCKLBWZrr:
5090	case X86::VPUNPCKHWDrr:
5091	case X86::VPUNPCKLWDrr:
5092	case X86::VPUNPCKHWDYrr:
5093	case X86::VPUNPCKLWDYrr:
5094	case X86::VPUNPCKHWDZ128rr:
5095	case X86::VPUNPCKLWDZ128rr:
5096	case X86::VPUNPCKHWDZ256rr:
5097	case X86::VPUNPCKLWDZ256rr:
5098	case X86::VPUNPCKHWDZrr:
5099	case X86::VPUNPCKLWDZrr:
5100	case X86::VPUNPCKHDQrr:
5101	case X86::VPUNPCKLDQrr:
5102	case X86::VPUNPCKHDQYrr:
5103	case X86::VPUNPCKLDQYrr:
5104	case X86::VPUNPCKHDQZ128rr:
5105	case X86::VPUNPCKLDQZ128rr:
5106	case X86::VPUNPCKHDQZ256rr:
5107	case X86::VPUNPCKLDQZ256rr:
5108	case X86::VPUNPCKHDQZrr:
5109	case X86::VPUNPCKLDQZrr:
5110	case X86::VPUNPCKHQDQrr:
5111	case X86::VPUNPCKLQDQrr:
5112	case X86::VPUNPCKHQDQYrr:
5113	case X86::VPUNPCKLQDQYrr:
5114	case X86::VPUNPCKHQDQZ128rr:
5115	case X86::VPUNPCKLQDQZ128rr:
5116	case X86::VPUNPCKHQDQZ256rr:
5117	case X86::VPUNPCKLQDQZ256rr:
5118	case X86::VPUNPCKHQDQZrr:
5119	case X86::VPUNPCKLQDQZrr:
5120	// These instructions are sometimes used with an undef first or second
5121	// source. Return true here so BreakFalseDeps will assign this source to the
5122	// same register as the first source to avoid a false dependency.
5123	return (OpNum == 1 \|\| OpNum == 2) && !ForLoadFold;
5124
5125	case X86::VCVTSI2SSrr:
5126	case X86::VCVTSI2SSrm:
5127	case X86::VCVTSI2SSrr_Int:
5128	case X86::VCVTSI2SSrm_Int:
5129	case X86::VCVTSI642SSrr:
5130	case X86::VCVTSI642SSrm:
5131	case X86::VCVTSI642SSrr_Int:
5132	case X86::VCVTSI642SSrm_Int:
5133	case X86::VCVTSI2SDrr:
5134	case X86::VCVTSI2SDrm:
5135	case X86::VCVTSI2SDrr_Int:
5136	case X86::VCVTSI2SDrm_Int:
5137	case X86::VCVTSI642SDrr:
5138	case X86::VCVTSI642SDrm:
5139	case X86::VCVTSI642SDrr_Int:
5140	case X86::VCVTSI642SDrm_Int:
5141	// AVX-512
5142	case X86::VCVTSI2SSZrr:
5143	case X86::VCVTSI2SSZrm:
5144	case X86::VCVTSI2SSZrr_Int:
5145	case X86::VCVTSI2SSZrrb_Int:
5146	case X86::VCVTSI2SSZrm_Int:
5147	case X86::VCVTSI642SSZrr:
5148	case X86::VCVTSI642SSZrm:
5149	case X86::VCVTSI642SSZrr_Int:
5150	case X86::VCVTSI642SSZrrb_Int:
5151	case X86::VCVTSI642SSZrm_Int:
5152	case X86::VCVTSI2SDZrr:
5153	case X86::VCVTSI2SDZrm:
5154	case X86::VCVTSI2SDZrr_Int:
5155	case X86::VCVTSI2SDZrm_Int:
5156	case X86::VCVTSI642SDZrr:
5157	case X86::VCVTSI642SDZrm:
5158	case X86::VCVTSI642SDZrr_Int:
5159	case X86::VCVTSI642SDZrrb_Int:
5160	case X86::VCVTSI642SDZrm_Int:
5161	case X86::VCVTUSI2SSZrr:
5162	case X86::VCVTUSI2SSZrm:
5163	case X86::VCVTUSI2SSZrr_Int:
5164	case X86::VCVTUSI2SSZrrb_Int:
5165	case X86::VCVTUSI2SSZrm_Int:
5166	case X86::VCVTUSI642SSZrr:
5167	case X86::VCVTUSI642SSZrm:
5168	case X86::VCVTUSI642SSZrr_Int:
5169	case X86::VCVTUSI642SSZrrb_Int:
5170	case X86::VCVTUSI642SSZrm_Int:
5171	case X86::VCVTUSI2SDZrr:
5172	case X86::VCVTUSI2SDZrm:
5173	case X86::VCVTUSI2SDZrr_Int:
5174	case X86::VCVTUSI2SDZrm_Int:
5175	case X86::VCVTUSI642SDZrr:
5176	case X86::VCVTUSI642SDZrm:
5177	case X86::VCVTUSI642SDZrr_Int:
5178	case X86::VCVTUSI642SDZrrb_Int:
5179	case X86::VCVTUSI642SDZrm_Int:
5180	case X86::VCVTSI2SHZrr:
5181	case X86::VCVTSI2SHZrm:
5182	case X86::VCVTSI2SHZrr_Int:
5183	case X86::VCVTSI2SHZrrb_Int:
5184	case X86::VCVTSI2SHZrm_Int:
5185	case X86::VCVTSI642SHZrr:
5186	case X86::VCVTSI642SHZrm:
5187	case X86::VCVTSI642SHZrr_Int:
5188	case X86::VCVTSI642SHZrrb_Int:
5189	case X86::VCVTSI642SHZrm_Int:
5190	case X86::VCVTUSI2SHZrr:
5191	case X86::VCVTUSI2SHZrm:
5192	case X86::VCVTUSI2SHZrr_Int:
5193	case X86::VCVTUSI2SHZrrb_Int:
5194	case X86::VCVTUSI2SHZrm_Int:
5195	case X86::VCVTUSI642SHZrr:
5196	case X86::VCVTUSI642SHZrm:
5197	case X86::VCVTUSI642SHZrr_Int:
5198	case X86::VCVTUSI642SHZrrb_Int:
5199	case X86::VCVTUSI642SHZrm_Int:
5200	// Load folding won't effect the undef register update since the input is
5201	// a GPR.
5202	return OpNum == 1 && !ForLoadFold;
5203	case X86::VCVTSD2SSrr:
5204	case X86::VCVTSD2SSrm:
5205	case X86::VCVTSD2SSrr_Int:
5206	case X86::VCVTSD2SSrm_Int:
5207	case X86::VCVTSS2SDrr:
5208	case X86::VCVTSS2SDrm:
5209	case X86::VCVTSS2SDrr_Int:
5210	case X86::VCVTSS2SDrm_Int:
5211	case X86::VRCPSSr:
5212	case X86::VRCPSSr_Int:
5213	case X86::VRCPSSm:
5214	case X86::VRCPSSm_Int:
5215	case X86::VROUNDSDr:
5216	case X86::VROUNDSDm:
5217	case X86::VROUNDSDr_Int:
5218	case X86::VROUNDSDm_Int:
5219	case X86::VROUNDSSr:
5220	case X86::VROUNDSSm:
5221	case X86::VROUNDSSr_Int:
5222	case X86::VROUNDSSm_Int:
5223	case X86::VRSQRTSSr:
5224	case X86::VRSQRTSSr_Int:
5225	case X86::VRSQRTSSm:
5226	case X86::VRSQRTSSm_Int:
5227	case X86::VSQRTSSr:
5228	case X86::VSQRTSSr_Int:
5229	case X86::VSQRTSSm:
5230	case X86::VSQRTSSm_Int:
5231	case X86::VSQRTSDr:
5232	case X86::VSQRTSDr_Int:
5233	case X86::VSQRTSDm:
5234	case X86::VSQRTSDm_Int:
5235	// AVX-512
5236	case X86::VCVTSD2SSZrr:
5237	case X86::VCVTSD2SSZrr_Int:
5238	case X86::VCVTSD2SSZrrb_Int:
5239	case X86::VCVTSD2SSZrm:
5240	case X86::VCVTSD2SSZrm_Int:
5241	case X86::VCVTSS2SDZrr:
5242	case X86::VCVTSS2SDZrr_Int:
5243	case X86::VCVTSS2SDZrrb_Int:
5244	case X86::VCVTSS2SDZrm:
5245	case X86::VCVTSS2SDZrm_Int:
5246	case X86::VGETEXPSDZr:
5247	case X86::VGETEXPSDZrb:
5248	case X86::VGETEXPSDZm:
5249	case X86::VGETEXPSSZr:
5250	case X86::VGETEXPSSZrb:
5251	case X86::VGETEXPSSZm:
5252	case X86::VGETMANTSDZrri:
5253	case X86::VGETMANTSDZrrib:
5254	case X86::VGETMANTSDZrmi:
5255	case X86::VGETMANTSSZrri:
5256	case X86::VGETMANTSSZrrib:
5257	case X86::VGETMANTSSZrmi:
5258	case X86::VRNDSCALESDZr:
5259	case X86::VRNDSCALESDZr_Int:
5260	case X86::VRNDSCALESDZrb_Int:
5261	case X86::VRNDSCALESDZm:
5262	case X86::VRNDSCALESDZm_Int:
5263	case X86::VRNDSCALESSZr:
5264	case X86::VRNDSCALESSZr_Int:
5265	case X86::VRNDSCALESSZrb_Int:
5266	case X86::VRNDSCALESSZm:
5267	case X86::VRNDSCALESSZm_Int:
5268	case X86::VRCP14SDZrr:
5269	case X86::VRCP14SDZrm:
5270	case X86::VRCP14SSZrr:
5271	case X86::VRCP14SSZrm:
5272	case X86::VRCPSHZrr:
5273	case X86::VRCPSHZrm:
5274	case X86::VRSQRTSHZrr:
5275	case X86::VRSQRTSHZrm:
5276	case X86::VREDUCESHZrmi:
5277	case X86::VREDUCESHZrri:
5278	case X86::VREDUCESHZrrib:
5279	case X86::VGETEXPSHZr:
5280	case X86::VGETEXPSHZrb:
5281	case X86::VGETEXPSHZm:
5282	case X86::VGETMANTSHZrri:
5283	case X86::VGETMANTSHZrrib:
5284	case X86::VGETMANTSHZrmi:
5285	case X86::VRNDSCALESHZr:
5286	case X86::VRNDSCALESHZr_Int:
5287	case X86::VRNDSCALESHZrb_Int:
5288	case X86::VRNDSCALESHZm:
5289	case X86::VRNDSCALESHZm_Int:
5290	case X86::VSQRTSHZr:
5291	case X86::VSQRTSHZr_Int:
5292	case X86::VSQRTSHZrb_Int:
5293	case X86::VSQRTSHZm:
5294	case X86::VSQRTSHZm_Int:
5295	case X86::VRCP28SDZr:
5296	case X86::VRCP28SDZrb:
5297	case X86::VRCP28SDZm:
5298	case X86::VRCP28SSZr:
5299	case X86::VRCP28SSZrb:
5300	case X86::VRCP28SSZm:
5301	case X86::VREDUCESSZrmi:
5302	case X86::VREDUCESSZrri:
5303	case X86::VREDUCESSZrrib:
5304	case X86::VRSQRT14SDZrr:
5305	case X86::VRSQRT14SDZrm:
5306	case X86::VRSQRT14SSZrr:
5307	case X86::VRSQRT14SSZrm:
5308	case X86::VRSQRT28SDZr:
5309	case X86::VRSQRT28SDZrb:
5310	case X86::VRSQRT28SDZm:
5311	case X86::VRSQRT28SSZr:
5312	case X86::VRSQRT28SSZrb:
5313	case X86::VRSQRT28SSZm:
5314	case X86::VSQRTSSZr:
5315	case X86::VSQRTSSZr_Int:
5316	case X86::VSQRTSSZrb_Int:
5317	case X86::VSQRTSSZm:
5318	case X86::VSQRTSSZm_Int:
5319	case X86::VSQRTSDZr:
5320	case X86::VSQRTSDZr_Int:
5321	case X86::VSQRTSDZrb_Int:
5322	case X86::VSQRTSDZm:
5323	case X86::VSQRTSDZm_Int:
5324	case X86::VCVTSD2SHZrr:
5325	case X86::VCVTSD2SHZrr_Int:
5326	case X86::VCVTSD2SHZrrb_Int:
5327	case X86::VCVTSD2SHZrm:
5328	case X86::VCVTSD2SHZrm_Int:
5329	case X86::VCVTSS2SHZrr:
5330	case X86::VCVTSS2SHZrr_Int:
5331	case X86::VCVTSS2SHZrrb_Int:
5332	case X86::VCVTSS2SHZrm:
5333	case X86::VCVTSS2SHZrm_Int:
5334	case X86::VCVTSH2SDZrr:
5335	case X86::VCVTSH2SDZrr_Int:
5336	case X86::VCVTSH2SDZrrb_Int:
5337	case X86::VCVTSH2SDZrm:
5338	case X86::VCVTSH2SDZrm_Int:
5339	case X86::VCVTSH2SSZrr:
5340	case X86::VCVTSH2SSZrr_Int:
5341	case X86::VCVTSH2SSZrrb_Int:
5342	case X86::VCVTSH2SSZrm:
5343	case X86::VCVTSH2SSZrm_Int:
5344	return OpNum == 1;
5345	case X86::VMOVSSZrrk:
5346	case X86::VMOVSDZrrk:
5347	return OpNum == 3 && !ForLoadFold;
5348	case X86::VMOVSSZrrkz:
5349	case X86::VMOVSDZrrkz:
5350	return OpNum == 2 && !ForLoadFold;
5351	}
5352
5353	return false;
5354	}
5355
5356	/// Inform the BreakFalseDeps pass how many idle instructions we would like
5357	/// before certain undef register reads.
5358	///
5359	/// This catches the VCVTSI2SD family of instructions:
5360	///
5361	/// vcvtsi2sdq %rax, undef %xmm0, %xmm14
5362	///
5363	/// We should to be careful not to catch VXOR idioms which are presumably
5364	/// handled specially in the pipeline:
5365	///
5366	/// vxorps undef %xmm1, undef %xmm1, %xmm1
5367	///
5368	/// Like getPartialRegUpdateClearance, this makes a strong assumption that the
5369	/// high bits that are passed-through are not live.
5370	unsigned
5371	X86InstrInfo::getUndefRegClearance(const MachineInstr &MI, unsigned OpNum,
5372	const TargetRegisterInfo *TRI) const {
5373	const MachineOperand &MO = MI.getOperand(OpNum);
5374	if (Register::isPhysicalRegister(MO.getReg()) &&
5375	hasUndefRegUpdate(MI.getOpcode(), OpNum))
5376	return UndefRegClearance;
5377
5378	return 0;
5379	}
5380
5381	void X86InstrInfo::breakPartialRegDependency(
5382	MachineInstr &MI, unsigned OpNum, const TargetRegisterInfo *TRI) const {
5383	Register Reg = MI.getOperand(OpNum).getReg();
5384	// If MI kills this register, the false dependence is already broken.
5385	if (MI.killsRegister(Reg, TRI))
5386	return;
5387
5388	if (X86::VR128RegClass.contains(Reg)) {
5389	// These instructions are all floating point domain, so xorps is the best
5390	// choice.
5391	unsigned Opc = Subtarget.hasAVX() ? X86::VXORPSrr : X86::XORPSrr;
5392	BuildMI(*MI.getParent(), MI, MI.getDebugLoc(), get(Opc), Reg)
5393	.addReg(Reg, RegState::Undef)
5394	.addReg(Reg, RegState::Undef);
5395	MI.addRegisterKilled(Reg, TRI, true);
5396	} else if (X86::VR256RegClass.contains(Reg)) {
5397	// Use vxorps to clear the full ymm register.
5398	// It wants to read and write the xmm sub-register.
5399	Register XReg = TRI->getSubReg(Reg, X86::sub_xmm);
5400	BuildMI(*MI.getParent(), MI, MI.getDebugLoc(), get(X86::VXORPSrr), XReg)
5401	.addReg(XReg, RegState::Undef)
5402	.addReg(XReg, RegState::Undef)
5403	.addReg(Reg, RegState::ImplicitDefine);
5404	MI.addRegisterKilled(Reg, TRI, true);
5405	} else if (X86::GR64RegClass.contains(Reg)) {
5406	// Using XOR32rr because it has shorter encoding and zeros up the upper bits
5407	// as well.
5408	Register XReg = TRI->getSubReg(Reg, X86::sub_32bit);
5409	BuildMI(*MI.getParent(), MI, MI.getDebugLoc(), get(X86::XOR32rr), XReg)
5410	.addReg(XReg, RegState::Undef)
5411	.addReg(XReg, RegState::Undef)
5412	.addReg(Reg, RegState::ImplicitDefine);
5413	MI.addRegisterKilled(Reg, TRI, true);
5414	} else if (X86::GR32RegClass.contains(Reg)) {
5415	BuildMI(*MI.getParent(), MI, MI.getDebugLoc(), get(X86::XOR32rr), Reg)
5416	.addReg(Reg, RegState::Undef)
5417	.addReg(Reg, RegState::Undef);
5418	MI.addRegisterKilled(Reg, TRI, true);
5419	}
5420	}
5421
5422	static void addOperands(MachineInstrBuilder &MIB, ArrayRef<MachineOperand> MOs,
5423	int PtrOffset = 0) {
5424	unsigned NumAddrOps = MOs.size();
5425
5426	if (NumAddrOps < 4) {
5427	// FrameIndex only - add an immediate offset (whether its zero or not).
5428	for (unsigned i = 0; i != NumAddrOps; ++i)
5429	MIB.add(MOs[i]);
5430	addOffset(MIB, PtrOffset);
5431	} else {
5432	// General Memory Addressing - we need to add any offset to an existing
5433	// offset.
5434	assert(MOs.size() == 5 && "Unexpected memory operand list length")(static_cast <bool> (MOs.size() == 5 && "Unexpected memory operand list length" ) ? void (0) : __assert_fail ("MOs.size() == 5 && \"Unexpected memory operand list length\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 5434, __extension__ __PRETTY_FUNCTION__));
5435	for (unsigned i = 0; i != NumAddrOps; ++i) {
5436	const MachineOperand &MO = MOs[i];
5437	if (i == 3 && PtrOffset != 0) {
5438	MIB.addDisp(MO, PtrOffset);
5439	} else {
5440	MIB.add(MO);
5441	}
5442	}
5443	}
5444	}
5445
5446	static void updateOperandRegConstraints(MachineFunction &MF,
5447	MachineInstr &NewMI,
5448	const TargetInstrInfo &TII) {
5449	MachineRegisterInfo &MRI = MF.getRegInfo();
5450	const TargetRegisterInfo &TRI = *MRI.getTargetRegisterInfo();
5451
5452	for (int Idx : llvm::seq<int>(0, NewMI.getNumOperands())) {
5453	MachineOperand &MO = NewMI.getOperand(Idx);
5454	// We only need to update constraints on virtual register operands.
5455	if (!MO.isReg())
5456	continue;
5457	Register Reg = MO.getReg();
5458	if (!Reg.isVirtual())
5459	continue;
5460
5461	auto *NewRC = MRI.constrainRegClass(
5462	Reg, TII.getRegClass(NewMI.getDesc(), Idx, &TRI, MF));
5463	if (!NewRC) {
5464	LLVM_DEBUG(do { if (::llvm::DebugFlag && ::llvm::isCurrentDebugType ("x86-instr-info")) { dbgs() << "WARNING: Unable to update register constraint for operand " << Idx << " of instruction:\n"; NewMI.dump(); dbgs () << "\n"; } } while (false)
5465	dbgs() << "WARNING: Unable to update register constraint for operand "do { if (::llvm::DebugFlag && ::llvm::isCurrentDebugType ("x86-instr-info")) { dbgs() << "WARNING: Unable to update register constraint for operand " << Idx << " of instruction:\n"; NewMI.dump(); dbgs () << "\n"; } } while (false)
5466	<< Idx << " of instruction:\n";do { if (::llvm::DebugFlag && ::llvm::isCurrentDebugType ("x86-instr-info")) { dbgs() << "WARNING: Unable to update register constraint for operand " << Idx << " of instruction:\n"; NewMI.dump(); dbgs () << "\n"; } } while (false)
5467	NewMI.dump(); dbgs() << "\n")do { if (::llvm::DebugFlag && ::llvm::isCurrentDebugType ("x86-instr-info")) { dbgs() << "WARNING: Unable to update register constraint for operand " << Idx << " of instruction:\n"; NewMI.dump(); dbgs () << "\n"; } } while (false);
5468	}
5469	}
5470	}
5471
5472	static MachineInstr *FuseTwoAddrInst(MachineFunction &MF, unsigned Opcode,
5473	ArrayRef<MachineOperand> MOs,
5474	MachineBasicBlock::iterator InsertPt,
5475	MachineInstr &MI,
5476	const TargetInstrInfo &TII) {
5477	// Create the base instruction with the memory operand as the first part.
5478	// Omit the implicit operands, something BuildMI can't do.
5479	MachineInstr *NewMI =
5480	MF.CreateMachineInstr(TII.get(Opcode), MI.getDebugLoc(), true);
5481	MachineInstrBuilder MIB(MF, NewMI);
5482	addOperands(MIB, MOs);
5483
5484	// Loop over the rest of the ri operands, converting them over.
5485	unsigned NumOps = MI.getDesc().getNumOperands() - 2;
5486	for (unsigned i = 0; i != NumOps; ++i) {
5487	MachineOperand &MO = MI.getOperand(i + 2);
5488	MIB.add(MO);
5489	}
5490	for (unsigned i = NumOps + 2, e = MI.getNumOperands(); i != e; ++i) {
5491	MachineOperand &MO = MI.getOperand(i);
5492	MIB.add(MO);
5493	}
5494
5495	updateOperandRegConstraints(MF, *NewMI, TII);
5496
5497	MachineBasicBlock *MBB = InsertPt->getParent();
5498	MBB->insert(InsertPt, NewMI);
5499
5500	return MIB;
5501	}
5502
5503	static MachineInstr *FuseInst(MachineFunction &MF, unsigned Opcode,
5504	unsigned OpNo, ArrayRef<MachineOperand> MOs,
5505	MachineBasicBlock::iterator InsertPt,
5506	MachineInstr &MI, const TargetInstrInfo &TII,
5507	int PtrOffset = 0) {
5508	// Omit the implicit operands, something BuildMI can't do.
5509	MachineInstr *NewMI =
5510	MF.CreateMachineInstr(TII.get(Opcode), MI.getDebugLoc(), true);
5511	MachineInstrBuilder MIB(MF, NewMI);
5512
5513	for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
5514	MachineOperand &MO = MI.getOperand(i);
5515	if (i == OpNo) {
5516	assert(MO.isReg() && "Expected to fold into reg operand!")(static_cast <bool> (MO.isReg() && "Expected to fold into reg operand!" ) ? void (0) : __assert_fail ("MO.isReg() && \"Expected to fold into reg operand!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 5516, __extension__ __PRETTY_FUNCTION__));
5517	addOperands(MIB, MOs, PtrOffset);
5518	} else {
5519	MIB.add(MO);
5520	}
5521	}
5522
5523	updateOperandRegConstraints(MF, *NewMI, TII);
5524
5525	// Copy the NoFPExcept flag from the instruction we're fusing.
5526	if (MI.getFlag(MachineInstr::MIFlag::NoFPExcept))
5527	NewMI->setFlag(MachineInstr::MIFlag::NoFPExcept);
5528
5529	MachineBasicBlock *MBB = InsertPt->getParent();
5530	MBB->insert(InsertPt, NewMI);
5531
5532	return MIB;
5533	}
5534
5535	static MachineInstr *MakeM0Inst(const TargetInstrInfo &TII, unsigned Opcode,
5536	ArrayRef<MachineOperand> MOs,
5537	MachineBasicBlock::iterator InsertPt,
5538	MachineInstr &MI) {
5539	MachineInstrBuilder MIB = BuildMI(*InsertPt->getParent(), InsertPt,
5540	MI.getDebugLoc(), TII.get(Opcode));
5541	addOperands(MIB, MOs);
5542	return MIB.addImm(0);
5543	}
5544
5545	MachineInstr *X86InstrInfo::foldMemoryOperandCustom(
5546	MachineFunction &MF, MachineInstr &MI, unsigned OpNum,
5547	ArrayRef<MachineOperand> MOs, MachineBasicBlock::iterator InsertPt,
5548	unsigned Size, Align Alignment) const {
5549	switch (MI.getOpcode()) {
5550	case X86::INSERTPSrr:
5551	case X86::VINSERTPSrr:
5552	case X86::VINSERTPSZrr:
5553	// Attempt to convert the load of inserted vector into a fold load
5554	// of a single float.
5555	if (OpNum == 2) {
5556	unsigned Imm = MI.getOperand(MI.getNumOperands() - 1).getImm();
5557	unsigned ZMask = Imm & 15;
5558	unsigned DstIdx = (Imm >> 4) & 3;
5559	unsigned SrcIdx = (Imm >> 6) & 3;
5560
5561	const TargetRegisterInfo &TRI = *MF.getSubtarget().getRegisterInfo();
5562	const TargetRegisterClass *RC = getRegClass(MI.getDesc(), OpNum, &RI, MF);
5563	unsigned RCSize = TRI.getRegSizeInBits(*RC) / 8;
5564	if ((Size == 0 \|\| Size >= 16) && RCSize >= 16 && Alignment >= Align(4)) {
5565	int PtrOffset = SrcIdx * 4;
5566	unsigned NewImm = (DstIdx << 4) \| ZMask;
5567	unsigned NewOpCode =
5568	(MI.getOpcode() == X86::VINSERTPSZrr) ? X86::VINSERTPSZrm :
5569	(MI.getOpcode() == X86::VINSERTPSrr) ? X86::VINSERTPSrm :
5570	X86::INSERTPSrm;
5571	MachineInstr *NewMI =
5572	FuseInst(MF, NewOpCode, OpNum, MOs, InsertPt, MI, *this, PtrOffset);
5573	NewMI->getOperand(NewMI->getNumOperands() - 1).setImm(NewImm);
5574	return NewMI;
5575	}
5576	}
5577	break;
5578	case X86::MOVHLPSrr:
5579	case X86::VMOVHLPSrr:
5580	case X86::VMOVHLPSZrr:
5581	// Move the upper 64-bits of the second operand to the lower 64-bits.
5582	// To fold the load, adjust the pointer to the upper and use (V)MOVLPS.
5583	// TODO: In most cases AVX doesn't have a 8-byte alignment requirement.
5584	if (OpNum == 2) {
5585	const TargetRegisterInfo &TRI = *MF.getSubtarget().getRegisterInfo();
5586	const TargetRegisterClass *RC = getRegClass(MI.getDesc(), OpNum, &RI, MF);
5587	unsigned RCSize = TRI.getRegSizeInBits(*RC) / 8;
5588	if ((Size == 0 \|\| Size >= 16) && RCSize >= 16 && Alignment >= Align(8)) {
5589	unsigned NewOpCode =
5590	(MI.getOpcode() == X86::VMOVHLPSZrr) ? X86::VMOVLPSZ128rm :
5591	(MI.getOpcode() == X86::VMOVHLPSrr) ? X86::VMOVLPSrm :
5592	X86::MOVLPSrm;
5593	MachineInstr *NewMI =
5594	FuseInst(MF, NewOpCode, OpNum, MOs, InsertPt, MI, *this, 8);
5595	return NewMI;
5596	}
5597	}
5598	break;
5599	case X86::UNPCKLPDrr:
5600	// If we won't be able to fold this to the memory form of UNPCKL, use
5601	// MOVHPD instead. Done as custom because we can't have this in the load
5602	// table twice.
5603	if (OpNum == 2) {
5604	const TargetRegisterInfo &TRI = *MF.getSubtarget().getRegisterInfo();
5605	const TargetRegisterClass *RC = getRegClass(MI.getDesc(), OpNum, &RI, MF);
5606	unsigned RCSize = TRI.getRegSizeInBits(*RC) / 8;
5607	if ((Size == 0 \|\| Size >= 16) && RCSize >= 16 && Alignment < Align(16)) {
5608	MachineInstr *NewMI =
5609	FuseInst(MF, X86::MOVHPDrm, OpNum, MOs, InsertPt, MI, *this);
5610	return NewMI;
5611	}
5612	}
5613	break;
5614	}
5615
5616	return nullptr;
5617	}
5618
5619	static bool shouldPreventUndefRegUpdateMemFold(MachineFunction &MF,
5620	MachineInstr &MI) {
5621	if (!hasUndefRegUpdate(MI.getOpcode(), 1, /ForLoadFold/true) \|\|
5622	!MI.getOperand(1).isReg())
5623	return false;
5624
5625	// The are two cases we need to handle depending on where in the pipeline
5626	// the folding attempt is being made.
5627	// -Register has the undef flag set.
5628	// -Register is produced by the IMPLICIT_DEF instruction.
5629
5630	if (MI.getOperand(1).isUndef())
5631	return true;
5632
5633	MachineRegisterInfo &RegInfo = MF.getRegInfo();
5634	MachineInstr *VRegDef = RegInfo.getUniqueVRegDef(MI.getOperand(1).getReg());
5635	return VRegDef && VRegDef->isImplicitDef();
5636	}
5637
5638	MachineInstr *X86InstrInfo::foldMemoryOperandImpl(
5639	MachineFunction &MF, MachineInstr &MI, unsigned OpNum,
5640	ArrayRef<MachineOperand> MOs, MachineBasicBlock::iterator InsertPt,
5641	unsigned Size, Align Alignment, bool AllowCommute) const {
5642	bool isSlowTwoMemOps = Subtarget.slowTwoMemOps();
5643	bool isTwoAddrFold = false;
5644
5645	// For CPUs that favor the register form of a call or push,
5646	// do not fold loads into calls or pushes, unless optimizing for size
5647	// aggressively.
5648	if (isSlowTwoMemOps && !MF.getFunction().hasMinSize() &&
5649	(MI.getOpcode() == X86::CALL32r \|\| MI.getOpcode() == X86::CALL64r \|\|
5650	MI.getOpcode() == X86::PUSH16r \|\| MI.getOpcode() == X86::PUSH32r \|\|
5651	MI.getOpcode() == X86::PUSH64r))
5652	return nullptr;
5653
5654	// Avoid partial and undef register update stalls unless optimizing for size.
5655	if (!MF.getFunction().hasOptSize() &&
5656	(hasPartialRegUpdate(MI.getOpcode(), Subtarget, /ForLoadFold/true) \|\|
5657	shouldPreventUndefRegUpdateMemFold(MF, MI)))
5658	return nullptr;
5659
5660	unsigned NumOps = MI.getDesc().getNumOperands();
5661	bool isTwoAddr =
5662	NumOps > 1 && MI.getDesc().getOperandConstraint(1, MCOI::TIED_TO) != -1;
5663
5664	// FIXME: AsmPrinter doesn't know how to handle
5665	// X86II::MO_GOT_ABSOLUTE_ADDRESS after folding.
5666	if (MI.getOpcode() == X86::ADD32ri &&
5667	MI.getOperand(2).getTargetFlags() == X86II::MO_GOT_ABSOLUTE_ADDRESS)
5668	return nullptr;
5669
5670	// GOTTPOFF relocation loads can only be folded into add instructions.
5671	// FIXME: Need to exclude other relocations that only support specific
5672	// instructions.
5673	if (MOs.size() == X86::AddrNumOperands &&
5674	MOs[X86::AddrDisp].getTargetFlags() == X86II::MO_GOTTPOFF &&
5675	MI.getOpcode() != X86::ADD64rr)
5676	return nullptr;
5677
5678	MachineInstr *NewMI = nullptr;
5679
5680	// Attempt to fold any custom cases we have.
5681	if (MachineInstr *CustomMI = foldMemoryOperandCustom(
5682	MF, MI, OpNum, MOs, InsertPt, Size, Alignment))
5683	return CustomMI;
5684
5685	const X86MemoryFoldTableEntry *I = nullptr;
5686
5687	// Folding a memory location into the two-address part of a two-address
5688	// instruction is different than folding it other places. It requires
5689	// replacing the two registers with the memory location.
5690	if (isTwoAddr && NumOps >= 2 && OpNum < 2 && MI.getOperand(0).isReg() &&
5691	MI.getOperand(1).isReg() &&
5692	MI.getOperand(0).getReg() == MI.getOperand(1).getReg()) {
5693	I = lookupTwoAddrFoldTable(MI.getOpcode());
5694	isTwoAddrFold = true;
5695	} else {
5696	if (OpNum == 0) {
5697	if (MI.getOpcode() == X86::MOV32r0) {
5698	NewMI = MakeM0Inst(*this, X86::MOV32mi, MOs, InsertPt, MI);
5699	if (NewMI)
5700	return NewMI;
5701	}
5702	}
5703
5704	I = lookupFoldTable(MI.getOpcode(), OpNum);
5705	}
5706
5707	if (I != nullptr) {
5708	unsigned Opcode = I->DstOp;
5709	bool FoldedLoad =
5710	isTwoAddrFold \|\| (OpNum == 0 && I->Flags & TB_FOLDED_LOAD) \|\| OpNum > 0;
5711	bool FoldedStore =
5712	isTwoAddrFold \|\| (OpNum == 0 && I->Flags & TB_FOLDED_STORE);
5713	MaybeAlign MinAlign =
5714	decodeMaybeAlign((I->Flags & TB_ALIGN_MASK) >> TB_ALIGN_SHIFT);
5715	if (MinAlign && Alignment < *MinAlign)
5716	return nullptr;
5717	bool NarrowToMOV32rm = false;
5718	if (Size) {
5719	const TargetRegisterInfo &TRI = *MF.getSubtarget().getRegisterInfo();
5720	const TargetRegisterClass *RC = getRegClass(MI.getDesc(), OpNum,
5721	&RI, MF);
5722	unsigned RCSize = TRI.getRegSizeInBits(*RC) / 8;
5723	// Check if it's safe to fold the load. If the size of the object is
5724	// narrower than the load width, then it's not.
5725	// FIXME: Allow scalar intrinsic instructions like ADDSSrm_Int.
5726	if (FoldedLoad && Size < RCSize) {
5727	// If this is a 64-bit load, but the spill slot is 32, then we can do
5728	// a 32-bit load which is implicitly zero-extended. This likely is
5729	// due to live interval analysis remat'ing a load from stack slot.
5730	if (Opcode != X86::MOV64rm \|\| RCSize != 8 \|\| Size != 4)
5731	return nullptr;
5732	if (MI.getOperand(0).getSubReg() \|\| MI.getOperand(1).getSubReg())
5733	return nullptr;
5734	Opcode = X86::MOV32rm;
5735	NarrowToMOV32rm = true;
5736	}
5737	// For stores, make sure the size of the object is equal to the size of
5738	// the store. If the object is larger, the extra bits would be garbage. If
5739	// the object is smaller we might overwrite another object or fault.
5740	if (FoldedStore && Size != RCSize)
5741	return nullptr;
5742	}
5743
5744	if (isTwoAddrFold)
5745	NewMI = FuseTwoAddrInst(MF, Opcode, MOs, InsertPt, MI, *this);
5746	else
5747	NewMI = FuseInst(MF, Opcode, OpNum, MOs, InsertPt, MI, *this);
5748
5749	if (NarrowToMOV32rm) {
5750	// If this is the special case where we use a MOV32rm to load a 32-bit
5751	// value and zero-extend the top bits. Change the destination register
5752	// to a 32-bit one.
5753	Register DstReg = NewMI->getOperand(0).getReg();
5754	if (DstReg.isPhysical())
5755	NewMI->getOperand(0).setReg(RI.getSubReg(DstReg, X86::sub_32bit));
5756	else
5757	NewMI->getOperand(0).setSubReg(X86::sub_32bit);
5758	}
5759	return NewMI;
5760	}
5761
5762	// If the instruction and target operand are commutable, commute the
5763	// instruction and try again.
5764	if (AllowCommute) {
5765	unsigned CommuteOpIdx1 = OpNum, CommuteOpIdx2 = CommuteAnyOperandIndex;
5766	if (findCommutedOpIndices(MI, CommuteOpIdx1, CommuteOpIdx2)) {
5767	bool HasDef = MI.getDesc().getNumDefs();
5768	Register Reg0 = HasDef ? MI.getOperand(0).getReg() : Register();
5769	Register Reg1 = MI.getOperand(CommuteOpIdx1).getReg();
5770	Register Reg2 = MI.getOperand(CommuteOpIdx2).getReg();
5771	bool Tied1 =
5772	0 == MI.getDesc().getOperandConstraint(CommuteOpIdx1, MCOI::TIED_TO);
5773	bool Tied2 =
5774	0 == MI.getDesc().getOperandConstraint(CommuteOpIdx2, MCOI::TIED_TO);
5775
5776	// If either of the commutable operands are tied to the destination
5777	// then we can not commute + fold.
5778	if ((HasDef && Reg0 == Reg1 && Tied1) \|\|
5779	(HasDef && Reg0 == Reg2 && Tied2))
5780	return nullptr;
5781
5782	MachineInstr *CommutedMI =
5783	commuteInstruction(MI, false, CommuteOpIdx1, CommuteOpIdx2);
5784	if (!CommutedMI) {
5785	// Unable to commute.
5786	return nullptr;
5787	}
5788	if (CommutedMI != &MI) {
5789	// New instruction. We can't fold from this.
5790	CommutedMI->eraseFromParent();
5791	return nullptr;
5792	}
5793
5794	// Attempt to fold with the commuted version of the instruction.
5795	NewMI = foldMemoryOperandImpl(MF, MI, CommuteOpIdx2, MOs, InsertPt, Size,
5796	Alignment, /AllowCommute=/false);
5797	if (NewMI)
5798	return NewMI;
5799
5800	// Folding failed again - undo the commute before returning.
5801	MachineInstr *UncommutedMI =
5802	commuteInstruction(MI, false, CommuteOpIdx1, CommuteOpIdx2);
5803	if (!UncommutedMI) {
5804	// Unable to commute.
5805	return nullptr;
5806	}
5807	if (UncommutedMI != &MI) {
5808	// New instruction. It doesn't need to be kept.
5809	UncommutedMI->eraseFromParent();
5810	return nullptr;
5811	}
5812
5813	// Return here to prevent duplicate fuse failure report.
5814	return nullptr;
5815	}
5816	}
5817
5818	// No fusion
5819	if (PrintFailedFusing && !MI.isCopy())
5820	dbgs() << "We failed to fuse operand " << OpNum << " in " << MI;
5821	return nullptr;
5822	}
5823
5824	MachineInstr *
5825	X86InstrInfo::foldMemoryOperandImpl(MachineFunction &MF, MachineInstr &MI,
5826	ArrayRef<unsigned> Ops,
5827	MachineBasicBlock::iterator InsertPt,
5828	int FrameIndex, LiveIntervals *LIS,
5829	VirtRegMap *VRM) const {
5830	// Check switch flag
5831	if (NoFusing)
5832	return nullptr;
5833
5834	// Avoid partial and undef register update stalls unless optimizing for size.
5835	if (!MF.getFunction().hasOptSize() &&
5836	(hasPartialRegUpdate(MI.getOpcode(), Subtarget, /ForLoadFold/true) \|\|
5837	shouldPreventUndefRegUpdateMemFold(MF, MI)))
5838	return nullptr;
5839
5840	// Don't fold subreg spills, or reloads that use a high subreg.
5841	for (auto Op : Ops) {
5842	MachineOperand &MO = MI.getOperand(Op);
5843	auto SubReg = MO.getSubReg();
5844	if (SubReg && (MO.isDef() \|\| SubReg == X86::sub_8bit_hi))
5845	return nullptr;
5846	}
5847
5848	const MachineFrameInfo &MFI = MF.getFrameInfo();
5849	unsigned Size = MFI.getObjectSize(FrameIndex);
5850	Align Alignment = MFI.getObjectAlign(FrameIndex);
5851	// If the function stack isn't realigned we don't want to fold instructions
5852	// that need increased alignment.
5853	if (!RI.hasStackRealignment(MF))
5854	Alignment =
5855	std::min(Alignment, Subtarget.getFrameLowering()->getStackAlign());
5856	if (Ops.size() == 2 && Ops[0] == 0 && Ops[1] == 1) {
5857	unsigned NewOpc = 0;
5858	unsigned RCSize = 0;
5859	switch (MI.getOpcode()) {
5860	default: return nullptr;
5861	case X86::TEST8rr: NewOpc = X86::CMP8ri; RCSize = 1; break;
5862	case X86::TEST16rr: NewOpc = X86::CMP16ri8; RCSize = 2; break;
5863	case X86::TEST32rr: NewOpc = X86::CMP32ri8; RCSize = 4; break;
5864	case X86::TEST64rr: NewOpc = X86::CMP64ri8; RCSize = 8; break;
5865	}
5866	// Check if it's safe to fold the load. If the size of the object is
5867	// narrower than the load width, then it's not.
5868	if (Size < RCSize)
5869	return nullptr;
5870	// Change to CMPXXri r, 0 first.
5871	MI.setDesc(get(NewOpc));
5872	MI.getOperand(1).ChangeToImmediate(0);
5873	} else if (Ops.size() != 1)
5874	return nullptr;
5875
5876	return foldMemoryOperandImpl(MF, MI, Ops[0],
5877	MachineOperand::CreateFI(FrameIndex), InsertPt,
5878	Size, Alignment, /AllowCommute=/true);
5879	}
5880
5881	/// Check if \p LoadMI is a partial register load that we can't fold into \p MI
5882	/// because the latter uses contents that wouldn't be defined in the folded
5883	/// version. For instance, this transformation isn't legal:
5884	/// movss (%rdi), %xmm0
5885	/// addps %xmm0, %xmm0
5886	/// ->
5887	/// addps (%rdi), %xmm0
5888	///
5889	/// But this one is:
5890	/// movss (%rdi), %xmm0
5891	/// addss %xmm0, %xmm0
5892	/// ->
5893	/// addss (%rdi), %xmm0
5894	///
5895	static bool isNonFoldablePartialRegisterLoad(const MachineInstr &LoadMI,
5896	const MachineInstr &UserMI,
5897	const MachineFunction &MF) {
5898	unsigned Opc = LoadMI.getOpcode();
5899	unsigned UserOpc = UserMI.getOpcode();
5900	const TargetRegisterInfo &TRI = *MF.getSubtarget().getRegisterInfo();
5901	const TargetRegisterClass *RC =
5902	MF.getRegInfo().getRegClass(LoadMI.getOperand(0).getReg());
5903	unsigned RegSize = TRI.getRegSizeInBits(*RC);
5904
5905	if ((Opc == X86::MOVSSrm \|\| Opc == X86::VMOVSSrm \|\| Opc == X86::VMOVSSZrm \|\|
5906	Opc == X86::MOVSSrm_alt \|\| Opc == X86::VMOVSSrm_alt \|\|
5907	Opc == X86::VMOVSSZrm_alt) &&
5908	RegSize > 32) {
5909	// These instructions only load 32 bits, we can't fold them if the
5910	// destination register is wider than 32 bits (4 bytes), and its user
5911	// instruction isn't scalar (SS).
5912	switch (UserOpc) {
5913	case X86::CVTSS2SDrr_Int:
5914	case X86::VCVTSS2SDrr_Int:
5915	case X86::VCVTSS2SDZrr_Int:
5916	case X86::VCVTSS2SDZrr_Intk:
5917	case X86::VCVTSS2SDZrr_Intkz:
5918	case X86::CVTSS2SIrr_Int: case X86::CVTSS2SI64rr_Int:
5919	case X86::VCVTSS2SIrr_Int: case X86::VCVTSS2SI64rr_Int:
5920	case X86::VCVTSS2SIZrr_Int: case X86::VCVTSS2SI64Zrr_Int:
5921	case X86::CVTTSS2SIrr_Int: case X86::CVTTSS2SI64rr_Int:
5922	case X86::VCVTTSS2SIrr_Int: case X86::VCVTTSS2SI64rr_Int:
5923	case X86::VCVTTSS2SIZrr_Int: case X86::VCVTTSS2SI64Zrr_Int:
5924	case X86::VCVTSS2USIZrr_Int: case X86::VCVTSS2USI64Zrr_Int:
5925	case X86::VCVTTSS2USIZrr_Int: case X86::VCVTTSS2USI64Zrr_Int:
5926	case X86::RCPSSr_Int: case X86::VRCPSSr_Int:
5927	case X86::RSQRTSSr_Int: case X86::VRSQRTSSr_Int:
5928	case X86::ROUNDSSr_Int: case X86::VROUNDSSr_Int:
5929	case X86::COMISSrr_Int: case X86::VCOMISSrr_Int: case X86::VCOMISSZrr_Int:
5930	case X86::UCOMISSrr_Int:case X86::VUCOMISSrr_Int:case X86::VUCOMISSZrr_Int:
5931	case X86::ADDSSrr_Int: case X86::VADDSSrr_Int: case X86::VADDSSZrr_Int:
5932	case X86::CMPSSrr_Int: case X86::VCMPSSrr_Int: case X86::VCMPSSZrr_Int:
5933	case X86::DIVSSrr_Int: case X86::VDIVSSrr_Int: case X86::VDIVSSZrr_Int:
5934	case X86::MAXSSrr_Int: case X86::VMAXSSrr_Int: case X86::VMAXSSZrr_Int:
5935	case X86::MINSSrr_Int: case X86::VMINSSrr_Int: case X86::VMINSSZrr_Int:
5936	case X86::MULSSrr_Int: case X86::VMULSSrr_Int: case X86::VMULSSZrr_Int:
5937	case X86::SQRTSSr_Int: case X86::VSQRTSSr_Int: case X86::VSQRTSSZr_Int:
5938	case X86::SUBSSrr_Int: case X86::VSUBSSrr_Int: case X86::VSUBSSZrr_Int:
5939	case X86::VADDSSZrr_Intk: case X86::VADDSSZrr_Intkz:
5940	case X86::VCMPSSZrr_Intk:
5941	case X86::VDIVSSZrr_Intk: case X86::VDIVSSZrr_Intkz:
5942	case X86::VMAXSSZrr_Intk: case X86::VMAXSSZrr_Intkz:
5943	case X86::VMINSSZrr_Intk: case X86::VMINSSZrr_Intkz:
5944	case X86::VMULSSZrr_Intk: case X86::VMULSSZrr_Intkz:
5945	case X86::VSQRTSSZr_Intk: case X86::VSQRTSSZr_Intkz:
5946	case X86::VSUBSSZrr_Intk: case X86::VSUBSSZrr_Intkz:
5947	case X86::VFMADDSS4rr_Int: case X86::VFNMADDSS4rr_Int:
5948	case X86::VFMSUBSS4rr_Int: case X86::VFNMSUBSS4rr_Int:
5949	case X86::VFMADD132SSr_Int: case X86::VFNMADD132SSr_Int:
5950	case X86::VFMADD213SSr_Int: case X86::VFNMADD213SSr_Int:
5951	case X86::VFMADD231SSr_Int: case X86::VFNMADD231SSr_Int:
5952	case X86::VFMSUB132SSr_Int: case X86::VFNMSUB132SSr_Int:
5953	case X86::VFMSUB213SSr_Int: case X86::VFNMSUB213SSr_Int:
5954	case X86::VFMSUB231SSr_Int: case X86::VFNMSUB231SSr_Int:
5955	case X86::VFMADD132SSZr_Int: case X86::VFNMADD132SSZr_Int:
5956	case X86::VFMADD213SSZr_Int: case X86::VFNMADD213SSZr_Int:
5957	case X86::VFMADD231SSZr_Int: case X86::VFNMADD231SSZr_Int:
5958	case X86::VFMSUB132SSZr_Int: case X86::VFNMSUB132SSZr_Int:
5959	case X86::VFMSUB213SSZr_Int: case X86::VFNMSUB213SSZr_Int:
5960	case X86::VFMSUB231SSZr_Int: case X86::VFNMSUB231SSZr_Int:
5961	case X86::VFMADD132SSZr_Intk: case X86::VFNMADD132SSZr_Intk:
5962	case X86::VFMADD213SSZr_Intk: case X86::VFNMADD213SSZr_Intk:
5963	case X86::VFMADD231SSZr_Intk: case X86::VFNMADD231SSZr_Intk:
5964	case X86::VFMSUB132SSZr_Intk: case X86::VFNMSUB132SSZr_Intk:
5965	case X86::VFMSUB213SSZr_Intk: case X86::VFNMSUB213SSZr_Intk:
5966	case X86::VFMSUB231SSZr_Intk: case X86::VFNMSUB231SSZr_Intk:
5967	case X86::VFMADD132SSZr_Intkz: case X86::VFNMADD132SSZr_Intkz:
5968	case X86::VFMADD213SSZr_Intkz: case X86::VFNMADD213SSZr_Intkz:
5969	case X86::VFMADD231SSZr_Intkz: case X86::VFNMADD231SSZr_Intkz:
5970	case X86::VFMSUB132SSZr_Intkz: case X86::VFNMSUB132SSZr_Intkz:
5971	case X86::VFMSUB213SSZr_Intkz: case X86::VFNMSUB213SSZr_Intkz:
5972	case X86::VFMSUB231SSZr_Intkz: case X86::VFNMSUB231SSZr_Intkz:
5973	case X86::VFIXUPIMMSSZrri:
5974	case X86::VFIXUPIMMSSZrrik:
5975	case X86::VFIXUPIMMSSZrrikz:
5976	case X86::VFPCLASSSSZrr:
5977	case X86::VFPCLASSSSZrrk:
5978	case X86::VGETEXPSSZr:
5979	case X86::VGETEXPSSZrk:
5980	case X86::VGETEXPSSZrkz:
5981	case X86::VGETMANTSSZrri:
5982	case X86::VGETMANTSSZrrik:
5983	case X86::VGETMANTSSZrrikz:
5984	case X86::VRANGESSZrri:
5985	case X86::VRANGESSZrrik:
5986	case X86::VRANGESSZrrikz:
5987	case X86::VRCP14SSZrr:
5988	case X86::VRCP14SSZrrk:
5989	case X86::VRCP14SSZrrkz:
5990	case X86::VRCP28SSZr:
5991	case X86::VRCP28SSZrk:
5992	case X86::VRCP28SSZrkz:
5993	case X86::VREDUCESSZrri:
5994	case X86::VREDUCESSZrrik:
5995	case X86::VREDUCESSZrrikz:
5996	case X86::VRNDSCALESSZr_Int:
5997	case X86::VRNDSCALESSZr_Intk:
5998	case X86::VRNDSCALESSZr_Intkz:
5999	case X86::VRSQRT14SSZrr:
6000	case X86::VRSQRT14SSZrrk:
6001	case X86::VRSQRT14SSZrrkz:
6002	case X86::VRSQRT28SSZr:
6003	case X86::VRSQRT28SSZrk:
6004	case X86::VRSQRT28SSZrkz:
6005	case X86::VSCALEFSSZrr:
6006	case X86::VSCALEFSSZrrk:
6007	case X86::VSCALEFSSZrrkz:
6008	return false;
6009	default:
6010	return true;
6011	}
6012	}
6013
6014	if ((Opc == X86::MOVSDrm \|\| Opc == X86::VMOVSDrm \|\| Opc == X86::VMOVSDZrm \|\|
6015	Opc == X86::MOVSDrm_alt \|\| Opc == X86::VMOVSDrm_alt \|\|
6016	Opc == X86::VMOVSDZrm_alt) &&
6017	RegSize > 64) {
6018	// These instructions only load 64 bits, we can't fold them if the
6019	// destination register is wider than 64 bits (8 bytes), and its user
6020	// instruction isn't scalar (SD).
6021	switch (UserOpc) {
6022	case X86::CVTSD2SSrr_Int:
6023	case X86::VCVTSD2SSrr_Int:
6024	case X86::VCVTSD2SSZrr_Int:
6025	case X86::VCVTSD2SSZrr_Intk:
6026	case X86::VCVTSD2SSZrr_Intkz:
6027	case X86::CVTSD2SIrr_Int: case X86::CVTSD2SI64rr_Int:
6028	case X86::VCVTSD2SIrr_Int: case X86::VCVTSD2SI64rr_Int:
6029	case X86::VCVTSD2SIZrr_Int: case X86::VCVTSD2SI64Zrr_Int:
6030	case X86::CVTTSD2SIrr_Int: case X86::CVTTSD2SI64rr_Int:
6031	case X86::VCVTTSD2SIrr_Int: case X86::VCVTTSD2SI64rr_Int:
6032	case X86::VCVTTSD2SIZrr_Int: case X86::VCVTTSD2SI64Zrr_Int:
6033	case X86::VCVTSD2USIZrr_Int: case X86::VCVTSD2USI64Zrr_Int:
6034	case X86::VCVTTSD2USIZrr_Int: case X86::VCVTTSD2USI64Zrr_Int:
6035	case X86::ROUNDSDr_Int: case X86::VROUNDSDr_Int:
6036	case X86::COMISDrr_Int: case X86::VCOMISDrr_Int: case X86::VCOMISDZrr_Int:
6037	case X86::UCOMISDrr_Int:case X86::VUCOMISDrr_Int:case X86::VUCOMISDZrr_Int:
6038	case X86::ADDSDrr_Int: case X86::VADDSDrr_Int: case X86::VADDSDZrr_Int:
6039	case X86::CMPSDrr_Int: case X86::VCMPSDrr_Int: case X86::VCMPSDZrr_Int:
6040	case X86::DIVSDrr_Int: case X86::VDIVSDrr_Int: case X86::VDIVSDZrr_Int:
6041	case X86::MAXSDrr_Int: case X86::VMAXSDrr_Int: case X86::VMAXSDZrr_Int:
6042	case X86::MINSDrr_Int: case X86::VMINSDrr_Int: case X86::VMINSDZrr_Int:
6043	case X86::MULSDrr_Int: case X86::VMULSDrr_Int: case X86::VMULSDZrr_Int:
6044	case X86::SQRTSDr_Int: case X86::VSQRTSDr_Int: case X86::VSQRTSDZr_Int:
6045	case X86::SUBSDrr_Int: case X86::VSUBSDrr_Int: case X86::VSUBSDZrr_Int:
6046	case X86::VADDSDZrr_Intk: case X86::VADDSDZrr_Intkz:
6047	case X86::VCMPSDZrr_Intk:
6048	case X86::VDIVSDZrr_Intk: case X86::VDIVSDZrr_Intkz:
6049	case X86::VMAXSDZrr_Intk: case X86::VMAXSDZrr_Intkz:
6050	case X86::VMINSDZrr_Intk: case X86::VMINSDZrr_Intkz:
6051	case X86::VMULSDZrr_Intk: case X86::VMULSDZrr_Intkz:
6052	case X86::VSQRTSDZr_Intk: case X86::VSQRTSDZr_Intkz:
6053	case X86::VSUBSDZrr_Intk: case X86::VSUBSDZrr_Intkz:
6054	case X86::VFMADDSD4rr_Int: case X86::VFNMADDSD4rr_Int:
6055	case X86::VFMSUBSD4rr_Int: case X86::VFNMSUBSD4rr_Int:
6056	case X86::VFMADD132SDr_Int: case X86::VFNMADD132SDr_Int:
6057	case X86::VFMADD213SDr_Int: case X86::VFNMADD213SDr_Int:
6058	case X86::VFMADD231SDr_Int: case X86::VFNMADD231SDr_Int:
6059	case X86::VFMSUB132SDr_Int: case X86::VFNMSUB132SDr_Int:
6060	case X86::VFMSUB213SDr_Int: case X86::VFNMSUB213SDr_Int:
6061	case X86::VFMSUB231SDr_Int: case X86::VFNMSUB231SDr_Int:
6062	case X86::VFMADD132SDZr_Int: case X86::VFNMADD132SDZr_Int:
6063	case X86::VFMADD213SDZr_Int: case X86::VFNMADD213SDZr_Int:
6064	case X86::VFMADD231SDZr_Int: case X86::VFNMADD231SDZr_Int:
6065	case X86::VFMSUB132SDZr_Int: case X86::VFNMSUB132SDZr_Int:
6066	case X86::VFMSUB213SDZr_Int: case X86::VFNMSUB213SDZr_Int:
6067	case X86::VFMSUB231SDZr_Int: case X86::VFNMSUB231SDZr_Int:
6068	case X86::VFMADD132SDZr_Intk: case X86::VFNMADD132SDZr_Intk:
6069	case X86::VFMADD213SDZr_Intk: case X86::VFNMADD213SDZr_Intk:
6070	case X86::VFMADD231SDZr_Intk: case X86::VFNMADD231SDZr_Intk:
6071	case X86::VFMSUB132SDZr_Intk: case X86::VFNMSUB132SDZr_Intk:
6072	case X86::VFMSUB213SDZr_Intk: case X86::VFNMSUB213SDZr_Intk:
6073	case X86::VFMSUB231SDZr_Intk: case X86::VFNMSUB231SDZr_Intk:
6074	case X86::VFMADD132SDZr_Intkz: case X86::VFNMADD132SDZr_Intkz:
6075	case X86::VFMADD213SDZr_Intkz: case X86::VFNMADD213SDZr_Intkz:
6076	case X86::VFMADD231SDZr_Intkz: case X86::VFNMADD231SDZr_Intkz:
6077	case X86::VFMSUB132SDZr_Intkz: case X86::VFNMSUB132SDZr_Intkz:
6078	case X86::VFMSUB213SDZr_Intkz: case X86::VFNMSUB213SDZr_Intkz:
6079	case X86::VFMSUB231SDZr_Intkz: case X86::VFNMSUB231SDZr_Intkz:
6080	case X86::VFIXUPIMMSDZrri:
6081	case X86::VFIXUPIMMSDZrrik:
6082	case X86::VFIXUPIMMSDZrrikz:
6083	case X86::VFPCLASSSDZrr:
6084	case X86::VFPCLASSSDZrrk:
6085	case X86::VGETEXPSDZr:
6086	case X86::VGETEXPSDZrk:
6087	case X86::VGETEXPSDZrkz:
6088	case X86::VGETMANTSDZrri:
6089	case X86::VGETMANTSDZrrik:
6090	case X86::VGETMANTSDZrrikz:
6091	case X86::VRANGESDZrri:
6092	case X86::VRANGESDZrrik:
6093	case X86::VRANGESDZrrikz:
6094	case X86::VRCP14SDZrr:
6095	case X86::VRCP14SDZrrk:
6096	case X86::VRCP14SDZrrkz:
6097	case X86::VRCP28SDZr:
6098	case X86::VRCP28SDZrk:
6099	case X86::VRCP28SDZrkz:
6100	case X86::VREDUCESDZrri:
6101	case X86::VREDUCESDZrrik:
6102	case X86::VREDUCESDZrrikz:
6103	case X86::VRNDSCALESDZr_Int:
6104	case X86::VRNDSCALESDZr_Intk:
6105	case X86::VRNDSCALESDZr_Intkz:
6106	case X86::VRSQRT14SDZrr:
6107	case X86::VRSQRT14SDZrrk:
6108	case X86::VRSQRT14SDZrrkz:
6109	case X86::VRSQRT28SDZr:
6110	case X86::VRSQRT28SDZrk:
6111	case X86::VRSQRT28SDZrkz:
6112	case X86::VSCALEFSDZrr:
6113	case X86::VSCALEFSDZrrk:
6114	case X86::VSCALEFSDZrrkz:
6115	return false;
6116	default:
6117	return true;
6118	}
6119	}
6120
6121	if ((Opc == X86::VMOVSHZrm \|\| Opc == X86::VMOVSHZrm_alt) && RegSize > 16) {
6122	// These instructions only load 16 bits, we can't fold them if the
6123	// destination register is wider than 16 bits (2 bytes), and its user
6124	// instruction isn't scalar (SH).
6125	switch (UserOpc) {
6126	case X86::VADDSHZrr_Int:
6127	case X86::VCMPSHZrr_Int:
6128	case X86::VDIVSHZrr_Int:
6129	case X86::VMAXSHZrr_Int:
6130	case X86::VMINSHZrr_Int:
6131	case X86::VMULSHZrr_Int:
6132	case X86::VSUBSHZrr_Int:
6133	case X86::VADDSHZrr_Intk: case X86::VADDSHZrr_Intkz:
6134	case X86::VCMPSHZrr_Intk:
6135	case X86::VDIVSHZrr_Intk: case X86::VDIVSHZrr_Intkz:
6136	case X86::VMAXSHZrr_Intk: case X86::VMAXSHZrr_Intkz:
6137	case X86::VMINSHZrr_Intk: case X86::VMINSHZrr_Intkz:
6138	case X86::VMULSHZrr_Intk: case X86::VMULSHZrr_Intkz:
6139	case X86::VSUBSHZrr_Intk: case X86::VSUBSHZrr_Intkz:
6140	case X86::VFMADD132SHZr_Int: case X86::VFNMADD132SHZr_Int:
6141	case X86::VFMADD213SHZr_Int: case X86::VFNMADD213SHZr_Int:
6142	case X86::VFMADD231SHZr_Int: case X86::VFNMADD231SHZr_Int:
6143	case X86::VFMSUB132SHZr_Int: case X86::VFNMSUB132SHZr_Int:
6144	case X86::VFMSUB213SHZr_Int: case X86::VFNMSUB213SHZr_Int:
6145	case X86::VFMSUB231SHZr_Int: case X86::VFNMSUB231SHZr_Int:
6146	case X86::VFMADD132SHZr_Intk: case X86::VFNMADD132SHZr_Intk:
6147	case X86::VFMADD213SHZr_Intk: case X86::VFNMADD213SHZr_Intk:
6148	case X86::VFMADD231SHZr_Intk: case X86::VFNMADD231SHZr_Intk:
6149	case X86::VFMSUB132SHZr_Intk: case X86::VFNMSUB132SHZr_Intk:
6150	case X86::VFMSUB213SHZr_Intk: case X86::VFNMSUB213SHZr_Intk:
6151	case X86::VFMSUB231SHZr_Intk: case X86::VFNMSUB231SHZr_Intk:
6152	case X86::VFMADD132SHZr_Intkz: case X86::VFNMADD132SHZr_Intkz:
6153	case X86::VFMADD213SHZr_Intkz: case X86::VFNMADD213SHZr_Intkz:
6154	case X86::VFMADD231SHZr_Intkz: case X86::VFNMADD231SHZr_Intkz:
6155	case X86::VFMSUB132SHZr_Intkz: case X86::VFNMSUB132SHZr_Intkz:
6156	case X86::VFMSUB213SHZr_Intkz: case X86::VFNMSUB213SHZr_Intkz:
6157	case X86::VFMSUB231SHZr_Intkz: case X86::VFNMSUB231SHZr_Intkz:
6158	return false;
6159	default:
6160	return true;
6161	}
6162	}
6163
6164	return false;
6165	}
6166
6167	MachineInstr *X86InstrInfo::foldMemoryOperandImpl(
6168	MachineFunction &MF, MachineInstr &MI, ArrayRef<unsigned> Ops,
6169	MachineBasicBlock::iterator InsertPt, MachineInstr &LoadMI,
6170	LiveIntervals *LIS) const {
6171
6172	// TODO: Support the case where LoadMI loads a wide register, but MI
6173	// only uses a subreg.
6174	for (auto Op : Ops) {
6175	if (MI.getOperand(Op).getSubReg())
6176	return nullptr;
6177	}
6178
6179	// If loading from a FrameIndex, fold directly from the FrameIndex.
6180	unsigned NumOps = LoadMI.getDesc().getNumOperands();
6181	int FrameIndex;
6182	if (isLoadFromStackSlot(LoadMI, FrameIndex)) {
6183	if (isNonFoldablePartialRegisterLoad(LoadMI, MI, MF))
6184	return nullptr;
6185	return foldMemoryOperandImpl(MF, MI, Ops, InsertPt, FrameIndex, LIS);
6186	}
6187
6188	// Check switch flag
6189	if (NoFusing) return nullptr;
6190
6191	// Avoid partial and undef register update stalls unless optimizing for size.
6192	if (!MF.getFunction().hasOptSize() &&
6193	(hasPartialRegUpdate(MI.getOpcode(), Subtarget, /ForLoadFold/true) \|\|
6194	shouldPreventUndefRegUpdateMemFold(MF, MI)))
6195	return nullptr;
6196
6197	// Determine the alignment of the load.
6198	Align Alignment;
6199	if (LoadMI.hasOneMemOperand())
6200	Alignment = (*LoadMI.memoperands_begin())->getAlign();
6201	else
6202	switch (LoadMI.getOpcode()) {
6203	case X86::AVX512_512_SET0:
6204	case X86::AVX512_512_SETALLONES:
6205	Alignment = Align(64);
6206	break;
6207	case X86::AVX2_SETALLONES:
6208	case X86::AVX1_SETALLONES:
6209	case X86::AVX_SET0:
6210	case X86::AVX512_256_SET0:
6211	Alignment = Align(32);
6212	break;
6213	case X86::V_SET0:
6214	case X86::V_SETALLONES:
6215	case X86::AVX512_128_SET0:
6216	case X86::FsFLD0F128:
6217	case X86::AVX512_FsFLD0F128:
6218	Alignment = Align(16);
6219	break;
6220	case X86::MMX_SET0:
6221	case X86::FsFLD0SD:
6222	case X86::AVX512_FsFLD0SD:
6223	Alignment = Align(8);
6224	break;
6225	case X86::FsFLD0SS:
6226	case X86::AVX512_FsFLD0SS:
6227	Alignment = Align(4);
6228	break;
6229	case X86::AVX512_FsFLD0SH:
6230	Alignment = Align(2);
6231	break;
6232	default:
6233	return nullptr;
6234	}
6235	if (Ops.size() == 2 && Ops[0] == 0 && Ops[1] == 1) {
6236	unsigned NewOpc = 0;
6237	switch (MI.getOpcode()) {
6238	default: return nullptr;
6239	case X86::TEST8rr: NewOpc = X86::CMP8ri; break;
6240	case X86::TEST16rr: NewOpc = X86::CMP16ri8; break;
6241	case X86::TEST32rr: NewOpc = X86::CMP32ri8; break;
6242	case X86::TEST64rr: NewOpc = X86::CMP64ri8; break;
6243	}
6244	// Change to CMPXXri r, 0 first.
6245	MI.setDesc(get(NewOpc));
6246	MI.getOperand(1).ChangeToImmediate(0);
6247	} else if (Ops.size() != 1)
6248	return nullptr;
6249
6250	// Make sure the subregisters match.
6251	// Otherwise we risk changing the size of the load.
6252	if (LoadMI.getOperand(0).getSubReg() != MI.getOperand(Ops[0]).getSubReg())
6253	return nullptr;
6254
6255	SmallVector<MachineOperand,X86::AddrNumOperands> MOs;
6256	switch (LoadMI.getOpcode()) {
6257	case X86::MMX_SET0:
6258	case X86::V_SET0:
6259	case X86::V_SETALLONES:
6260	case X86::AVX2_SETALLONES:
6261	case X86::AVX1_SETALLONES:
6262	case X86::AVX_SET0:
6263	case X86::AVX512_128_SET0:
6264	case X86::AVX512_256_SET0:
6265	case X86::AVX512_512_SET0:
6266	case X86::AVX512_512_SETALLONES:
6267	case X86::AVX512_FsFLD0SH:
6268	case X86::FsFLD0SD:
6269	case X86::AVX512_FsFLD0SD:
6270	case X86::FsFLD0SS:
6271	case X86::AVX512_FsFLD0SS:
6272	case X86::FsFLD0F128:
6273	case X86::AVX512_FsFLD0F128: {
6274	// Folding a V_SET0 or V_SETALLONES as a load, to ease register pressure.
6275	// Create a constant-pool entry and operands to load from it.
6276
6277	// Medium and large mode can't fold loads this way.
6278	if (MF.getTarget().getCodeModel() != CodeModel::Small &&
6279	MF.getTarget().getCodeModel() != CodeModel::Kernel)
6280	return nullptr;
6281
6282	// x86-32 PIC requires a PIC base register for constant pools.
6283	unsigned PICBase = 0;
6284	// Since we're using Small or Kernel code model, we can always use
6285	// RIP-relative addressing for a smaller encoding.
6286	if (Subtarget.is64Bit()) {
6287	PICBase = X86::RIP;
6288	} else if (MF.getTarget().isPositionIndependent()) {
6289	// FIXME: PICBase = getGlobalBaseReg(&MF);
6290	// This doesn't work for several reasons.
6291	// 1. GlobalBaseReg may have been spilled.
6292	// 2. It may not be live at MI.
6293	return nullptr;
6294	}
6295
6296	// Create a constant-pool entry.
6297	MachineConstantPool &MCP = *MF.getConstantPool();
6298	Type *Ty;
6299	unsigned Opc = LoadMI.getOpcode();
6300	if (Opc == X86::FsFLD0SS \|\| Opc == X86::AVX512_FsFLD0SS)
6301	Ty = Type::getFloatTy(MF.getFunction().getContext());
6302	else if (Opc == X86::FsFLD0SD \|\| Opc == X86::AVX512_FsFLD0SD)
6303	Ty = Type::getDoubleTy(MF.getFunction().getContext());
6304	else if (Opc == X86::FsFLD0F128 \|\| Opc == X86::AVX512_FsFLD0F128)
6305	Ty = Type::getFP128Ty(MF.getFunction().getContext());
6306	else if (Opc == X86::AVX512_FsFLD0SH)
6307	Ty = Type::getHalfTy(MF.getFunction().getContext());
6308	else if (Opc == X86::AVX512_512_SET0 \|\| Opc == X86::AVX512_512_SETALLONES)
6309	Ty = FixedVectorType::get(Type::getInt32Ty(MF.getFunction().getContext()),
6310	16);
6311	else if (Opc == X86::AVX2_SETALLONES \|\| Opc == X86::AVX_SET0 \|\|
6312	Opc == X86::AVX512_256_SET0 \|\| Opc == X86::AVX1_SETALLONES)
6313	Ty = FixedVectorType::get(Type::getInt32Ty(MF.getFunction().getContext()),
6314	8);
6315	else if (Opc == X86::MMX_SET0)
6316	Ty = FixedVectorType::get(Type::getInt32Ty(MF.getFunction().getContext()),
6317	2);
6318	else
6319	Ty = FixedVectorType::get(Type::getInt32Ty(MF.getFunction().getContext()),
6320	4);
6321
6322	bool IsAllOnes = (Opc == X86::V_SETALLONES \|\| Opc == X86::AVX2_SETALLONES \|\|
6323	Opc == X86::AVX512_512_SETALLONES \|\|
6324	Opc == X86::AVX1_SETALLONES);
6325	const Constant *C = IsAllOnes ? Constant::getAllOnesValue(Ty) :
6326	Constant::getNullValue(Ty);
6327	unsigned CPI = MCP.getConstantPoolIndex(C, Alignment);
6328
6329	// Create operands to load from the constant pool entry.
6330	MOs.push_back(MachineOperand::CreateReg(PICBase, false));
6331	MOs.push_back(MachineOperand::CreateImm(1));
6332	MOs.push_back(MachineOperand::CreateReg(0, false));
6333	MOs.push_back(MachineOperand::CreateCPI(CPI, 0));
6334	MOs.push_back(MachineOperand::CreateReg(0, false));
6335	break;
6336	}
6337	default: {
6338	if (isNonFoldablePartialRegisterLoad(LoadMI, MI, MF))
6339	return nullptr;
6340
6341	// Folding a normal load. Just copy the load's address operands.
6342	MOs.append(LoadMI.operands_begin() + NumOps - X86::AddrNumOperands,
6343	LoadMI.operands_begin() + NumOps);
6344	break;
6345	}
6346	}
6347	return foldMemoryOperandImpl(MF, MI, Ops[0], MOs, InsertPt,
6348	/Size=/0, Alignment, /AllowCommute=/true);
6349	}
6350
6351	static SmallVector<MachineMemOperand *, 2>
6352	extractLoadMMOs(ArrayRef<MachineMemOperand *> MMOs, MachineFunction &MF) {
6353	SmallVector<MachineMemOperand *, 2> LoadMMOs;
6354
6355	for (MachineMemOperand *MMO : MMOs) {
6356	if (!MMO->isLoad())
6357	continue;
6358
6359	if (!MMO->isStore()) {
6360	// Reuse the MMO.
6361	LoadMMOs.push_back(MMO);
6362	} else {
6363	// Clone the MMO and unset the store flag.
6364	LoadMMOs.push_back(MF.getMachineMemOperand(
6365	MMO, MMO->getFlags() & ~MachineMemOperand::MOStore));
6366	}
6367	}
6368
6369	return LoadMMOs;
6370	}
6371
6372	static SmallVector<MachineMemOperand *, 2>
6373	extractStoreMMOs(ArrayRef<MachineMemOperand *> MMOs, MachineFunction &MF) {
6374	SmallVector<MachineMemOperand *, 2> StoreMMOs;
6375
6376	for (MachineMemOperand *MMO : MMOs) {
6377	if (!MMO->isStore())
6378	continue;
6379
6380	if (!MMO->isLoad()) {
6381	// Reuse the MMO.
6382	StoreMMOs.push_back(MMO);
6383	} else {
6384	// Clone the MMO and unset the load flag.
6385	StoreMMOs.push_back(MF.getMachineMemOperand(
6386	MMO, MMO->getFlags() & ~MachineMemOperand::MOLoad));
6387	}
6388	}
6389
6390	return StoreMMOs;
6391	}
6392
6393	static unsigned getBroadcastOpcode(const X86MemoryFoldTableEntry *I,
6394	const TargetRegisterClass *RC,
6395	const X86Subtarget &STI) {
6396	assert(STI.hasAVX512() && "Expected at least AVX512!")(static_cast <bool> (STI.hasAVX512() && "Expected at least AVX512!" ) ? void (0) : __assert_fail ("STI.hasAVX512() && \"Expected at least AVX512!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6396, __extension__ __PRETTY_FUNCTION__));
6397	unsigned SpillSize = STI.getRegisterInfo()->getSpillSize(*RC);
6398	assert((SpillSize == 64 \|\| STI.hasVLX()) &&(static_cast <bool> ((SpillSize == 64 \|\| STI.hasVLX()) && "Can't broadcast less than 64 bytes without AVX512VL!") ? void (0) : __assert_fail ("(SpillSize == 64 \|\| STI.hasVLX()) && \"Can't broadcast less than 64 bytes without AVX512VL!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6399, __extension__ __PRETTY_FUNCTION__))
6399	"Can't broadcast less than 64 bytes without AVX512VL!")(static_cast <bool> ((SpillSize == 64 \|\| STI.hasVLX()) && "Can't broadcast less than 64 bytes without AVX512VL!") ? void (0) : __assert_fail ("(SpillSize == 64 \|\| STI.hasVLX()) && \"Can't broadcast less than 64 bytes without AVX512VL!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6399, __extension__ __PRETTY_FUNCTION__));
6400
6401	switch (I->Flags & TB_BCAST_MASK) {
6402	default: llvm_unreachable("Unexpected broadcast type!")::llvm::llvm_unreachable_internal("Unexpected broadcast type!" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6402);
6403	case TB_BCAST_D:
6404	switch (SpillSize) {
6405	default: llvm_unreachable("Unknown spill size")::llvm::llvm_unreachable_internal("Unknown spill size", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6405);
6406	case 16: return X86::VPBROADCASTDZ128rm;
6407	case 32: return X86::VPBROADCASTDZ256rm;
6408	case 64: return X86::VPBROADCASTDZrm;
6409	}
6410	break;
6411	case TB_BCAST_Q:
6412	switch (SpillSize) {
6413	default: llvm_unreachable("Unknown spill size")::llvm::llvm_unreachable_internal("Unknown spill size", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6413);
6414	case 16: return X86::VPBROADCASTQZ128rm;
6415	case 32: return X86::VPBROADCASTQZ256rm;
6416	case 64: return X86::VPBROADCASTQZrm;
6417	}
6418	break;
6419	case TB_BCAST_SS:
6420	switch (SpillSize) {
6421	default: llvm_unreachable("Unknown spill size")::llvm::llvm_unreachable_internal("Unknown spill size", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6421);
6422	case 16: return X86::VBROADCASTSSZ128rm;
6423	case 32: return X86::VBROADCASTSSZ256rm;
6424	case 64: return X86::VBROADCASTSSZrm;
6425	}
6426	break;
6427	case TB_BCAST_SD:
6428	switch (SpillSize) {
6429	default: llvm_unreachable("Unknown spill size")::llvm::llvm_unreachable_internal("Unknown spill size", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6429);
6430	case 16: return X86::VMOVDDUPZ128rm;
6431	case 32: return X86::VBROADCASTSDZ256rm;
6432	case 64: return X86::VBROADCASTSDZrm;
6433	}
6434	break;
6435	}
6436	}
6437
6438	bool X86InstrInfo::unfoldMemoryOperand(
6439	MachineFunction &MF, MachineInstr &MI, unsigned Reg, bool UnfoldLoad,
6440	bool UnfoldStore, SmallVectorImpl<MachineInstr *> &NewMIs) const {
6441	const X86MemoryFoldTableEntry *I = lookupUnfoldTable(MI.getOpcode());
6442	if (I == nullptr)
6443	return false;
6444	unsigned Opc = I->DstOp;
6445	unsigned Index = I->Flags & TB_INDEX_MASK;
6446	bool FoldedLoad = I->Flags & TB_FOLDED_LOAD;
6447	bool FoldedStore = I->Flags & TB_FOLDED_STORE;
6448	bool FoldedBCast = I->Flags & TB_FOLDED_BCAST;
6449	if (UnfoldLoad && !FoldedLoad)
6450	return false;
6451	UnfoldLoad &= FoldedLoad;
6452	if (UnfoldStore && !FoldedStore)
6453	return false;
6454	UnfoldStore &= FoldedStore;
6455
6456	const MCInstrDesc &MCID = get(Opc);
6457
6458	const TargetRegisterClass *RC = getRegClass(MCID, Index, &RI, MF);
6459	const TargetRegisterInfo &TRI = *MF.getSubtarget().getRegisterInfo();
6460	// TODO: Check if 32-byte or greater accesses are slow too?
6461	if (!MI.hasOneMemOperand() && RC == &X86::VR128RegClass &&
6462	Subtarget.isUnalignedMem16Slow())
6463	// Without memoperands, loadRegFromAddr and storeRegToStackSlot will
6464	// conservatively assume the address is unaligned. That's bad for
6465	// performance.
6466	return false;
6467	SmallVector<MachineOperand, X86::AddrNumOperands> AddrOps;
6468	SmallVector<MachineOperand,2> BeforeOps;
6469	SmallVector<MachineOperand,2> AfterOps;
6470	SmallVector<MachineOperand,4> ImpOps;
6471	for (unsigned i = 0, e = MI.getNumOperands(); i != e; ++i) {
6472	MachineOperand &Op = MI.getOperand(i);
6473	if (i >= Index && i < Index + X86::AddrNumOperands)
6474	AddrOps.push_back(Op);
6475	else if (Op.isReg() && Op.isImplicit())
6476	ImpOps.push_back(Op);
6477	else if (i < Index)
6478	BeforeOps.push_back(Op);
6479	else if (i > Index)
6480	AfterOps.push_back(Op);
6481	}
6482
6483	// Emit the load or broadcast instruction.
6484	if (UnfoldLoad) {
6485	auto MMOs = extractLoadMMOs(MI.memoperands(), MF);
6486
6487	unsigned Opc;
6488	if (FoldedBCast) {
6489	Opc = getBroadcastOpcode(I, RC, Subtarget);
6490	} else {
6491	unsigned Alignment = std::max<uint32_t>(TRI.getSpillSize(*RC), 16);
6492	bool isAligned = !MMOs.empty() && MMOs.front()->getAlign() >= Alignment;
6493	Opc = getLoadRegOpcode(Reg, RC, isAligned, Subtarget);
6494	}
6495
6496	DebugLoc DL;
6497	MachineInstrBuilder MIB = BuildMI(MF, DL, get(Opc), Reg);
6498	for (unsigned i = 0, e = AddrOps.size(); i != e; ++i)
6499	MIB.add(AddrOps[i]);
6500	MIB.setMemRefs(MMOs);
6501	NewMIs.push_back(MIB);
6502
6503	if (UnfoldStore) {
6504	// Address operands cannot be marked isKill.
6505	for (unsigned i = 1; i != 1 + X86::AddrNumOperands; ++i) {
6506	MachineOperand &MO = NewMIs[0]->getOperand(i);
6507	if (MO.isReg())
6508	MO.setIsKill(false);
6509	}
6510	}
6511	}
6512
6513	// Emit the data processing instruction.
6514	MachineInstr *DataMI = MF.CreateMachineInstr(MCID, MI.getDebugLoc(), true);
6515	MachineInstrBuilder MIB(MF, DataMI);
6516
6517	if (FoldedStore)
6518	MIB.addReg(Reg, RegState::Define);
6519	for (MachineOperand &BeforeOp : BeforeOps)
6520	MIB.add(BeforeOp);
6521	if (FoldedLoad)
6522	MIB.addReg(Reg);
6523	for (MachineOperand &AfterOp : AfterOps)
6524	MIB.add(AfterOp);
6525	for (MachineOperand &ImpOp : ImpOps) {
6526	MIB.addReg(ImpOp.getReg(),
6527	getDefRegState(ImpOp.isDef()) \|
6528	RegState::Implicit \|
6529	getKillRegState(ImpOp.isKill()) \|
6530	getDeadRegState(ImpOp.isDead()) \|
6531	getUndefRegState(ImpOp.isUndef()));
6532	}
6533	// Change CMP32ri r, 0 back to TEST32rr r, r, etc.
6534	switch (DataMI->getOpcode()) {
6535	default: break;
6536	case X86::CMP64ri32:
6537	case X86::CMP64ri8:
6538	case X86::CMP32ri:
6539	case X86::CMP32ri8:
6540	case X86::CMP16ri:
6541	case X86::CMP16ri8:
6542	case X86::CMP8ri: {
6543	MachineOperand &MO0 = DataMI->getOperand(0);
6544	MachineOperand &MO1 = DataMI->getOperand(1);
6545	if (MO1.isImm() && MO1.getImm() == 0) {
6546	unsigned NewOpc;
6547	switch (DataMI->getOpcode()) {
6548	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6548);
6549	case X86::CMP64ri8:
6550	case X86::CMP64ri32: NewOpc = X86::TEST64rr; break;
6551	case X86::CMP32ri8:
6552	case X86::CMP32ri: NewOpc = X86::TEST32rr; break;
6553	case X86::CMP16ri8:
6554	case X86::CMP16ri: NewOpc = X86::TEST16rr; break;
6555	case X86::CMP8ri: NewOpc = X86::TEST8rr; break;
6556	}
6557	DataMI->setDesc(get(NewOpc));
6558	MO1.ChangeToRegister(MO0.getReg(), false);
6559	}
6560	}
6561	}
6562	NewMIs.push_back(DataMI);
6563
6564	// Emit the store instruction.
6565	if (UnfoldStore) {
6566	const TargetRegisterClass *DstRC = getRegClass(MCID, 0, &RI, MF);
6567	auto MMOs = extractStoreMMOs(MI.memoperands(), MF);
6568	unsigned Alignment = std::max<uint32_t>(TRI.getSpillSize(*DstRC), 16);
6569	bool isAligned = !MMOs.empty() && MMOs.front()->getAlign() >= Alignment;
6570	unsigned Opc = getStoreRegOpcode(Reg, DstRC, isAligned, Subtarget);
6571	DebugLoc DL;
6572	MachineInstrBuilder MIB = BuildMI(MF, DL, get(Opc));
6573	for (unsigned i = 0, e = AddrOps.size(); i != e; ++i)
6574	MIB.add(AddrOps[i]);
6575	MIB.addReg(Reg, RegState::Kill);
6576	MIB.setMemRefs(MMOs);
6577	NewMIs.push_back(MIB);
6578	}
6579
6580	return true;
6581	}
6582
6583	bool
6584	X86InstrInfo::unfoldMemoryOperand(SelectionDAG &DAG, SDNode *N,
6585	SmallVectorImpl<SDNode*> &NewNodes) const {
6586	if (!N->isMachineOpcode())
6587	return false;
6588
6589	const X86MemoryFoldTableEntry *I = lookupUnfoldTable(N->getMachineOpcode());
6590	if (I == nullptr)
6591	return false;
6592	unsigned Opc = I->DstOp;
6593	unsigned Index = I->Flags & TB_INDEX_MASK;
6594	bool FoldedLoad = I->Flags & TB_FOLDED_LOAD;
6595	bool FoldedStore = I->Flags & TB_FOLDED_STORE;
6596	bool FoldedBCast = I->Flags & TB_FOLDED_BCAST;
6597	const MCInstrDesc &MCID = get(Opc);
6598	MachineFunction &MF = DAG.getMachineFunction();
6599	const TargetRegisterInfo &TRI = *MF.getSubtarget().getRegisterInfo();
6600	const TargetRegisterClass *RC = getRegClass(MCID, Index, &RI, MF);
6601	unsigned NumDefs = MCID.NumDefs;
6602	std::vector<SDValue> AddrOps;
6603	std::vector<SDValue> BeforeOps;
6604	std::vector<SDValue> AfterOps;
6605	SDLoc dl(N);
6606	unsigned NumOps = N->getNumOperands();
6607	for (unsigned i = 0; i != NumOps-1; ++i) {
6608	SDValue Op = N->getOperand(i);
6609	if (i >= Index-NumDefs && i < Index-NumDefs + X86::AddrNumOperands)
6610	AddrOps.push_back(Op);
6611	else if (i < Index-NumDefs)
6612	BeforeOps.push_back(Op);
6613	else if (i > Index-NumDefs)
6614	AfterOps.push_back(Op);
6615	}
6616	SDValue Chain = N->getOperand(NumOps-1);
6617	AddrOps.push_back(Chain);
6618
6619	// Emit the load instruction.
6620	SDNode *Load = nullptr;
6621	if (FoldedLoad) {
6622	EVT VT = TRI.legalclasstypes_begin(RC);
6623	auto MMOs = extractLoadMMOs(cast<MachineSDNode>(N)->memoperands(), MF);
6624	if (MMOs.empty() && RC == &X86::VR128RegClass &&
6625	Subtarget.isUnalignedMem16Slow())
6626	// Do not introduce a slow unaligned load.
6627	return false;
6628	// FIXME: If a VR128 can have size 32, we should be checking if a 32-byte
6629	// memory access is slow above.
6630
6631	unsigned Opc;
6632	if (FoldedBCast) {
6633	Opc = getBroadcastOpcode(I, RC, Subtarget);
6634	} else {
6635	unsigned Alignment = std::max<uint32_t>(TRI.getSpillSize(*RC), 16);
6636	bool isAligned = !MMOs.empty() && MMOs.front()->getAlign() >= Alignment;
6637	Opc = getLoadRegOpcode(0, RC, isAligned, Subtarget);
6638	}
6639
6640	Load = DAG.getMachineNode(Opc, dl, VT, MVT::Other, AddrOps);
6641	NewNodes.push_back(Load);
6642
6643	// Preserve memory reference information.
6644	DAG.setNodeMemRefs(cast<MachineSDNode>(Load), MMOs);
6645	}
6646
6647	// Emit the data processing instruction.
6648	std::vector<EVT> VTs;
6649	const TargetRegisterClass *DstRC = nullptr;
6650	if (MCID.getNumDefs() > 0) {
6651	DstRC = getRegClass(MCID, 0, &RI, MF);
6652	VTs.push_back(TRI.legalclasstypes_begin(DstRC));
6653	}
6654	for (unsigned i = 0, e = N->getNumValues(); i != e; ++i) {
6655	EVT VT = N->getValueType(i);
6656	if (VT != MVT::Other && i >= (unsigned)MCID.getNumDefs())
6657	VTs.push_back(VT);
6658	}
6659	if (Load)
6660	BeforeOps.push_back(SDValue(Load, 0));
6661	llvm::append_range(BeforeOps, AfterOps);
6662	// Change CMP32ri r, 0 back to TEST32rr r, r, etc.
6663	switch (Opc) {
6664	default: break;
6665	case X86::CMP64ri32:
6666	case X86::CMP64ri8:
6667	case X86::CMP32ri:
6668	case X86::CMP32ri8:
6669	case X86::CMP16ri:
6670	case X86::CMP16ri8:
6671	case X86::CMP8ri:
6672	if (isNullConstant(BeforeOps[1])) {
6673	switch (Opc) {
6674	default: llvm_unreachable("Unreachable!")::llvm::llvm_unreachable_internal("Unreachable!", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6674);
6675	case X86::CMP64ri8:
6676	case X86::CMP64ri32: Opc = X86::TEST64rr; break;
6677	case X86::CMP32ri8:
6678	case X86::CMP32ri: Opc = X86::TEST32rr; break;
6679	case X86::CMP16ri8:
6680	case X86::CMP16ri: Opc = X86::TEST16rr; break;
6681	case X86::CMP8ri: Opc = X86::TEST8rr; break;
6682	}
6683	BeforeOps[1] = BeforeOps[0];
6684	}
6685	}
6686	SDNode *NewNode= DAG.getMachineNode(Opc, dl, VTs, BeforeOps);
6687	NewNodes.push_back(NewNode);
6688
6689	// Emit the store instruction.
6690	if (FoldedStore) {
6691	AddrOps.pop_back();
6692	AddrOps.push_back(SDValue(NewNode, 0));
6693	AddrOps.push_back(Chain);
6694	auto MMOs = extractStoreMMOs(cast<MachineSDNode>(N)->memoperands(), MF);
6695	if (MMOs.empty() && RC == &X86::VR128RegClass &&
6696	Subtarget.isUnalignedMem16Slow())
6697	// Do not introduce a slow unaligned store.
6698	return false;
6699	// FIXME: If a VR128 can have size 32, we should be checking if a 32-byte
6700	// memory access is slow above.
6701	unsigned Alignment = std::max<uint32_t>(TRI.getSpillSize(*RC), 16);
6702	bool isAligned = !MMOs.empty() && MMOs.front()->getAlign() >= Alignment;
6703	SDNode *Store =
6704	DAG.getMachineNode(getStoreRegOpcode(0, DstRC, isAligned, Subtarget),
6705	dl, MVT::Other, AddrOps);
6706	NewNodes.push_back(Store);
6707
6708	// Preserve memory reference information.
6709	DAG.setNodeMemRefs(cast<MachineSDNode>(Store), MMOs);
6710	}
6711
6712	return true;
6713	}
6714
6715	unsigned X86InstrInfo::getOpcodeAfterMemoryUnfold(unsigned Opc,
6716	bool UnfoldLoad, bool UnfoldStore,
6717	unsigned *LoadRegIndex) const {
6718	const X86MemoryFoldTableEntry *I = lookupUnfoldTable(Opc);
6719	if (I == nullptr)
6720	return 0;
6721	bool FoldedLoad = I->Flags & TB_FOLDED_LOAD;
6722	bool FoldedStore = I->Flags & TB_FOLDED_STORE;
6723	if (UnfoldLoad && !FoldedLoad)
6724	return 0;
6725	if (UnfoldStore && !FoldedStore)
6726	return 0;
6727	if (LoadRegIndex)
6728	*LoadRegIndex = I->Flags & TB_INDEX_MASK;
6729	return I->DstOp;
6730	}
6731
6732	bool
6733	X86InstrInfo::areLoadsFromSameBasePtr(SDNode Load1, SDNode Load2,
6734	int64_t &Offset1, int64_t &Offset2) const {
6735	if (!Load1->isMachineOpcode() \|\| !Load2->isMachineOpcode())
6736	return false;
6737	unsigned Opc1 = Load1->getMachineOpcode();
6738	unsigned Opc2 = Load2->getMachineOpcode();
6739	switch (Opc1) {
6740	default: return false;
6741	case X86::MOV8rm:
6742	case X86::MOV16rm:
6743	case X86::MOV32rm:
6744	case X86::MOV64rm:
6745	case X86::LD_Fp32m:
6746	case X86::LD_Fp64m:
6747	case X86::LD_Fp80m:
6748	case X86::MOVSSrm:
6749	case X86::MOVSSrm_alt:
6750	case X86::MOVSDrm:
6751	case X86::MOVSDrm_alt:
6752	case X86::MMX_MOVD64rm:
6753	case X86::MMX_MOVQ64rm:
6754	case X86::MOVAPSrm:
6755	case X86::MOVUPSrm:
6756	case X86::MOVAPDrm:
6757	case X86::MOVUPDrm:
6758	case X86::MOVDQArm:
6759	case X86::MOVDQUrm:
6760	// AVX load instructions
6761	case X86::VMOVSSrm:
6762	case X86::VMOVSSrm_alt:
6763	case X86::VMOVSDrm:
6764	case X86::VMOVSDrm_alt:
6765	case X86::VMOVAPSrm:
6766	case X86::VMOVUPSrm:
6767	case X86::VMOVAPDrm:
6768	case X86::VMOVUPDrm:
6769	case X86::VMOVDQArm:
6770	case X86::VMOVDQUrm:
6771	case X86::VMOVAPSYrm:
6772	case X86::VMOVUPSYrm:
6773	case X86::VMOVAPDYrm:
6774	case X86::VMOVUPDYrm:
6775	case X86::VMOVDQAYrm:
6776	case X86::VMOVDQUYrm:
6777	// AVX512 load instructions
6778	case X86::VMOVSSZrm:
6779	case X86::VMOVSSZrm_alt:
6780	case X86::VMOVSDZrm:
6781	case X86::VMOVSDZrm_alt:
6782	case X86::VMOVAPSZ128rm:
6783	case X86::VMOVUPSZ128rm:
6784	case X86::VMOVAPSZ128rm_NOVLX:
6785	case X86::VMOVUPSZ128rm_NOVLX:
6786	case X86::VMOVAPDZ128rm:
6787	case X86::VMOVUPDZ128rm:
6788	case X86::VMOVDQU8Z128rm:
6789	case X86::VMOVDQU16Z128rm:
6790	case X86::VMOVDQA32Z128rm:
6791	case X86::VMOVDQU32Z128rm:
6792	case X86::VMOVDQA64Z128rm:
6793	case X86::VMOVDQU64Z128rm:
6794	case X86::VMOVAPSZ256rm:
6795	case X86::VMOVUPSZ256rm:
6796	case X86::VMOVAPSZ256rm_NOVLX:
6797	case X86::VMOVUPSZ256rm_NOVLX:
6798	case X86::VMOVAPDZ256rm:
6799	case X86::VMOVUPDZ256rm:
6800	case X86::VMOVDQU8Z256rm:
6801	case X86::VMOVDQU16Z256rm:
6802	case X86::VMOVDQA32Z256rm:
6803	case X86::VMOVDQU32Z256rm:
6804	case X86::VMOVDQA64Z256rm:
6805	case X86::VMOVDQU64Z256rm:
6806	case X86::VMOVAPSZrm:
6807	case X86::VMOVUPSZrm:
6808	case X86::VMOVAPDZrm:
6809	case X86::VMOVUPDZrm:
6810	case X86::VMOVDQU8Zrm:
6811	case X86::VMOVDQU16Zrm:
6812	case X86::VMOVDQA32Zrm:
6813	case X86::VMOVDQU32Zrm:
6814	case X86::VMOVDQA64Zrm:
6815	case X86::VMOVDQU64Zrm:
6816	case X86::KMOVBkm:
6817	case X86::KMOVWkm:
6818	case X86::KMOVDkm:
6819	case X86::KMOVQkm:
6820	break;
6821	}
6822	switch (Opc2) {
6823	default: return false;
6824	case X86::MOV8rm:
6825	case X86::MOV16rm:
6826	case X86::MOV32rm:
6827	case X86::MOV64rm:
6828	case X86::LD_Fp32m:
6829	case X86::LD_Fp64m:
6830	case X86::LD_Fp80m:
6831	case X86::MOVSSrm:
6832	case X86::MOVSSrm_alt:
6833	case X86::MOVSDrm:
6834	case X86::MOVSDrm_alt:
6835	case X86::MMX_MOVD64rm:
6836	case X86::MMX_MOVQ64rm:
6837	case X86::MOVAPSrm:
6838	case X86::MOVUPSrm:
6839	case X86::MOVAPDrm:
6840	case X86::MOVUPDrm:
6841	case X86::MOVDQArm:
6842	case X86::MOVDQUrm:
6843	// AVX load instructions
6844	case X86::VMOVSSrm:
6845	case X86::VMOVSSrm_alt:
6846	case X86::VMOVSDrm:
6847	case X86::VMOVSDrm_alt:
6848	case X86::VMOVAPSrm:
6849	case X86::VMOVUPSrm:
6850	case X86::VMOVAPDrm:
6851	case X86::VMOVUPDrm:
6852	case X86::VMOVDQArm:
6853	case X86::VMOVDQUrm:
6854	case X86::VMOVAPSYrm:
6855	case X86::VMOVUPSYrm:
6856	case X86::VMOVAPDYrm:
6857	case X86::VMOVUPDYrm:
6858	case X86::VMOVDQAYrm:
6859	case X86::VMOVDQUYrm:
6860	// AVX512 load instructions
6861	case X86::VMOVSSZrm:
6862	case X86::VMOVSSZrm_alt:
6863	case X86::VMOVSDZrm:
6864	case X86::VMOVSDZrm_alt:
6865	case X86::VMOVAPSZ128rm:
6866	case X86::VMOVUPSZ128rm:
6867	case X86::VMOVAPSZ128rm_NOVLX:
6868	case X86::VMOVUPSZ128rm_NOVLX:
6869	case X86::VMOVAPDZ128rm:
6870	case X86::VMOVUPDZ128rm:
6871	case X86::VMOVDQU8Z128rm:
6872	case X86::VMOVDQU16Z128rm:
6873	case X86::VMOVDQA32Z128rm:
6874	case X86::VMOVDQU32Z128rm:
6875	case X86::VMOVDQA64Z128rm:
6876	case X86::VMOVDQU64Z128rm:
6877	case X86::VMOVAPSZ256rm:
6878	case X86::VMOVUPSZ256rm:
6879	case X86::VMOVAPSZ256rm_NOVLX:
6880	case X86::VMOVUPSZ256rm_NOVLX:
6881	case X86::VMOVAPDZ256rm:
6882	case X86::VMOVUPDZ256rm:
6883	case X86::VMOVDQU8Z256rm:
6884	case X86::VMOVDQU16Z256rm:
6885	case X86::VMOVDQA32Z256rm:
6886	case X86::VMOVDQU32Z256rm:
6887	case X86::VMOVDQA64Z256rm:
6888	case X86::VMOVDQU64Z256rm:
6889	case X86::VMOVAPSZrm:
6890	case X86::VMOVUPSZrm:
6891	case X86::VMOVAPDZrm:
6892	case X86::VMOVUPDZrm:
6893	case X86::VMOVDQU8Zrm:
6894	case X86::VMOVDQU16Zrm:
6895	case X86::VMOVDQA32Zrm:
6896	case X86::VMOVDQU32Zrm:
6897	case X86::VMOVDQA64Zrm:
6898	case X86::VMOVDQU64Zrm:
6899	case X86::KMOVBkm:
6900	case X86::KMOVWkm:
6901	case X86::KMOVDkm:
6902	case X86::KMOVQkm:
6903	break;
6904	}
6905
6906	// Lambda to check if both the loads have the same value for an operand index.
6907	auto HasSameOp = [&](int I) {
6908	return Load1->getOperand(I) == Load2->getOperand(I);
6909	};
6910
6911	// All operands except the displacement should match.
6912	if (!HasSameOp(X86::AddrBaseReg) \|\| !HasSameOp(X86::AddrScaleAmt) \|\|
6913	!HasSameOp(X86::AddrIndexReg) \|\| !HasSameOp(X86::AddrSegmentReg))
6914	return false;
6915
6916	// Chain Operand must be the same.
6917	if (!HasSameOp(5))
6918	return false;
6919
6920	// Now let's examine if the displacements are constants.
6921	auto Disp1 = dyn_cast<ConstantSDNode>(Load1->getOperand(X86::AddrDisp));
6922	auto Disp2 = dyn_cast<ConstantSDNode>(Load2->getOperand(X86::AddrDisp));
6923	if (!Disp1 \|\| !Disp2)
6924	return false;
6925
6926	Offset1 = Disp1->getSExtValue();
6927	Offset2 = Disp2->getSExtValue();
6928	return true;
6929	}
6930
6931	bool X86InstrInfo::shouldScheduleLoadsNear(SDNode Load1, SDNode Load2,
6932	int64_t Offset1, int64_t Offset2,
6933	unsigned NumLoads) const {
6934	assert(Offset2 > Offset1)(static_cast <bool> (Offset2 > Offset1) ? void (0) : __assert_fail ("Offset2 > Offset1", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6934, __extension__ __PRETTY_FUNCTION__));
6935	if ((Offset2 - Offset1) / 8 > 64)
6936	return false;
6937
6938	unsigned Opc1 = Load1->getMachineOpcode();
6939	unsigned Opc2 = Load2->getMachineOpcode();
6940	if (Opc1 != Opc2)
6941	return false; // FIXME: overly conservative?
6942
6943	switch (Opc1) {
6944	default: break;
6945	case X86::LD_Fp32m:
6946	case X86::LD_Fp64m:
6947	case X86::LD_Fp80m:
6948	case X86::MMX_MOVD64rm:
6949	case X86::MMX_MOVQ64rm:
6950	return false;
6951	}
6952
6953	EVT VT = Load1->getValueType(0);
6954	switch (VT.getSimpleVT().SimpleTy) {
6955	default:
6956	// XMM registers. In 64-bit mode we can be a bit more aggressive since we
6957	// have 16 of them to play with.
6958	if (Subtarget.is64Bit()) {
6959	if (NumLoads >= 3)
6960	return false;
6961	} else if (NumLoads) {
6962	return false;
6963	}
6964	break;
6965	case MVT::i8:
6966	case MVT::i16:
6967	case MVT::i32:
6968	case MVT::i64:
6969	case MVT::f32:
6970	case MVT::f64:
6971	if (NumLoads)
6972	return false;
6973	break;
6974	}
6975
6976	return true;
6977	}
6978
6979	bool X86InstrInfo::isSchedulingBoundary(const MachineInstr &MI,
6980	const MachineBasicBlock *MBB,
6981	const MachineFunction &MF) const {
6982
6983	// ENDBR instructions should not be scheduled around.
6984	unsigned Opcode = MI.getOpcode();
6985	if (Opcode == X86::ENDBR64 \|\| Opcode == X86::ENDBR32 \|\|
6986	Opcode == X86::LDTILECFG)
6987	return true;
6988
6989	return TargetInstrInfo::isSchedulingBoundary(MI, MBB, MF);
6990	}
6991
6992	bool X86InstrInfo::
6993	reverseBranchCondition(SmallVectorImpl<MachineOperand> &Cond) const {
6994	assert(Cond.size() == 1 && "Invalid X86 branch condition!")(static_cast <bool> (Cond.size() == 1 && "Invalid X86 branch condition!" ) ? void (0) : __assert_fail ("Cond.size() == 1 && \"Invalid X86 branch condition!\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 6994, __extension__ __PRETTY_FUNCTION__));
6995	X86::CondCode CC = static_cast<X86::CondCode>(Cond[0].getImm());
6996	Cond[0].setImm(GetOppositeBranchCondition(CC));
6997	return false;
6998	}
6999
7000	bool X86InstrInfo::
7001	isSafeToMoveRegClassDefs(const TargetRegisterClass *RC) const {
7002	// FIXME: Return false for x87 stack register classes for now. We can't
7003	// allow any loads of these registers before FpGet_ST0_80.
7004	return !(RC == &X86::CCRRegClass \|\| RC == &X86::DFCCRRegClass \|\|
7005	RC == &X86::RFP32RegClass \|\| RC == &X86::RFP64RegClass \|\|
7006	RC == &X86::RFP80RegClass);
7007	}
7008
7009	/// Return a virtual register initialized with the
7010	/// the global base register value. Output instructions required to
7011	/// initialize the register in the function entry block, if necessary.
7012	///
7013	/// TODO: Eliminate this and move the code to X86MachineFunctionInfo.
7014	///
7015	unsigned X86InstrInfo::getGlobalBaseReg(MachineFunction *MF) const {
7016	assert((!Subtarget.is64Bit() \|\|(static_cast <bool> ((!Subtarget.is64Bit() \|\| MF->getTarget ().getCodeModel() == CodeModel::Medium \|\| MF->getTarget(). getCodeModel() == CodeModel::Large) && "X86-64 PIC uses RIP relative addressing" ) ? void (0) : __assert_fail ("(!Subtarget.is64Bit() \|\| MF->getTarget().getCodeModel() == CodeModel::Medium \|\| MF->getTarget().getCodeModel() == CodeModel::Large) && \"X86-64 PIC uses RIP relative addressing\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7019, __extension__ __PRETTY_FUNCTION__))
7017	MF->getTarget().getCodeModel() == CodeModel::Medium \|\|(static_cast <bool> ((!Subtarget.is64Bit() \|\| MF->getTarget ().getCodeModel() == CodeModel::Medium \|\| MF->getTarget(). getCodeModel() == CodeModel::Large) && "X86-64 PIC uses RIP relative addressing" ) ? void (0) : __assert_fail ("(!Subtarget.is64Bit() \|\| MF->getTarget().getCodeModel() == CodeModel::Medium \|\| MF->getTarget().getCodeModel() == CodeModel::Large) && \"X86-64 PIC uses RIP relative addressing\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7019, __extension__ __PRETTY_FUNCTION__))
7018	MF->getTarget().getCodeModel() == CodeModel::Large) &&(static_cast <bool> ((!Subtarget.is64Bit() \|\| MF->getTarget ().getCodeModel() == CodeModel::Medium \|\| MF->getTarget(). getCodeModel() == CodeModel::Large) && "X86-64 PIC uses RIP relative addressing" ) ? void (0) : __assert_fail ("(!Subtarget.is64Bit() \|\| MF->getTarget().getCodeModel() == CodeModel::Medium \|\| MF->getTarget().getCodeModel() == CodeModel::Large) && \"X86-64 PIC uses RIP relative addressing\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7019, __extension__ __PRETTY_FUNCTION__))
7019	"X86-64 PIC uses RIP relative addressing")(static_cast <bool> ((!Subtarget.is64Bit() \|\| MF->getTarget ().getCodeModel() == CodeModel::Medium \|\| MF->getTarget(). getCodeModel() == CodeModel::Large) && "X86-64 PIC uses RIP relative addressing" ) ? void (0) : __assert_fail ("(!Subtarget.is64Bit() \|\| MF->getTarget().getCodeModel() == CodeModel::Medium \|\| MF->getTarget().getCodeModel() == CodeModel::Large) && \"X86-64 PIC uses RIP relative addressing\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7019, __extension__ __PRETTY_FUNCTION__));
7020
7021	X86MachineFunctionInfo *X86FI = MF->getInfo<X86MachineFunctionInfo>();
7022	Register GlobalBaseReg = X86FI->getGlobalBaseReg();
7023	if (GlobalBaseReg != 0)
7024	return GlobalBaseReg;
7025
7026	// Create the register. The code to initialize it is inserted
7027	// later, by the CGBR pass (below).
7028	MachineRegisterInfo &RegInfo = MF->getRegInfo();
7029	GlobalBaseReg = RegInfo.createVirtualRegister(
7030	Subtarget.is64Bit() ? &X86::GR64_NOSPRegClass : &X86::GR32_NOSPRegClass);
7031	X86FI->setGlobalBaseReg(GlobalBaseReg);
7032	return GlobalBaseReg;
7033	}
7034
7035	// These are the replaceable SSE instructions. Some of these have Int variants
7036	// that we don't include here. We don't want to replace instructions selected
7037	// by intrinsics.
7038	static const uint16_t ReplaceableInstrs[][3] = {
7039	//PackedSingle PackedDouble PackedInt
7040	{ X86::MOVAPSmr, X86::MOVAPDmr, X86::MOVDQAmr },
7041	{ X86::MOVAPSrm, X86::MOVAPDrm, X86::MOVDQArm },
7042	{ X86::MOVAPSrr, X86::MOVAPDrr, X86::MOVDQArr },
7043	{ X86::MOVUPSmr, X86::MOVUPDmr, X86::MOVDQUmr },
7044	{ X86::MOVUPSrm, X86::MOVUPDrm, X86::MOVDQUrm },
7045	{ X86::MOVLPSmr, X86::MOVLPDmr, X86::MOVPQI2QImr },
7046	{ X86::MOVSDmr, X86::MOVSDmr, X86::MOVPQI2QImr },
7047	{ X86::MOVSSmr, X86::MOVSSmr, X86::MOVPDI2DImr },
7048	{ X86::MOVSDrm, X86::MOVSDrm, X86::MOVQI2PQIrm },
7049	{ X86::MOVSDrm_alt,X86::MOVSDrm_alt,X86::MOVQI2PQIrm },
7050	{ X86::MOVSSrm, X86::MOVSSrm, X86::MOVDI2PDIrm },
7051	{ X86::MOVSSrm_alt,X86::MOVSSrm_alt,X86::MOVDI2PDIrm },
7052	{ X86::MOVNTPSmr, X86::MOVNTPDmr, X86::MOVNTDQmr },
7053	{ X86::ANDNPSrm, X86::ANDNPDrm, X86::PANDNrm },
7054	{ X86::ANDNPSrr, X86::ANDNPDrr, X86::PANDNrr },
7055	{ X86::ANDPSrm, X86::ANDPDrm, X86::PANDrm },
7056	{ X86::ANDPSrr, X86::ANDPDrr, X86::PANDrr },
7057	{ X86::ORPSrm, X86::ORPDrm, X86::PORrm },
7058	{ X86::ORPSrr, X86::ORPDrr, X86::PORrr },
7059	{ X86::XORPSrm, X86::XORPDrm, X86::PXORrm },
7060	{ X86::XORPSrr, X86::XORPDrr, X86::PXORrr },
7061	{ X86::UNPCKLPDrm, X86::UNPCKLPDrm, X86::PUNPCKLQDQrm },
7062	{ X86::MOVLHPSrr, X86::UNPCKLPDrr, X86::PUNPCKLQDQrr },
7063	{ X86::UNPCKHPDrm, X86::UNPCKHPDrm, X86::PUNPCKHQDQrm },
7064	{ X86::UNPCKHPDrr, X86::UNPCKHPDrr, X86::PUNPCKHQDQrr },
7065	{ X86::UNPCKLPSrm, X86::UNPCKLPSrm, X86::PUNPCKLDQrm },
7066	{ X86::UNPCKLPSrr, X86::UNPCKLPSrr, X86::PUNPCKLDQrr },
7067	{ X86::UNPCKHPSrm, X86::UNPCKHPSrm, X86::PUNPCKHDQrm },
7068	{ X86::UNPCKHPSrr, X86::UNPCKHPSrr, X86::PUNPCKHDQrr },
7069	{ X86::EXTRACTPSmr, X86::EXTRACTPSmr, X86::PEXTRDmr },
7070	{ X86::EXTRACTPSrr, X86::EXTRACTPSrr, X86::PEXTRDrr },
7071	// AVX 128-bit support
7072	{ X86::VMOVAPSmr, X86::VMOVAPDmr, X86::VMOVDQAmr },
7073	{ X86::VMOVAPSrm, X86::VMOVAPDrm, X86::VMOVDQArm },
7074	{ X86::VMOVAPSrr, X86::VMOVAPDrr, X86::VMOVDQArr },
7075	{ X86::VMOVUPSmr, X86::VMOVUPDmr, X86::VMOVDQUmr },
7076	{ X86::VMOVUPSrm, X86::VMOVUPDrm, X86::VMOVDQUrm },
7077	{ X86::VMOVLPSmr, X86::VMOVLPDmr, X86::VMOVPQI2QImr },
7078	{ X86::VMOVSDmr, X86::VMOVSDmr, X86::VMOVPQI2QImr },
7079	{ X86::VMOVSSmr, X86::VMOVSSmr, X86::VMOVPDI2DImr },
7080	{ X86::VMOVSDrm, X86::VMOVSDrm, X86::VMOVQI2PQIrm },
7081	{ X86::VMOVSDrm_alt,X86::VMOVSDrm_alt,X86::VMOVQI2PQIrm },
7082	{ X86::VMOVSSrm, X86::VMOVSSrm, X86::VMOVDI2PDIrm },
7083	{ X86::VMOVSSrm_alt,X86::VMOVSSrm_alt,X86::VMOVDI2PDIrm },
7084	{ X86::VMOVNTPSmr, X86::VMOVNTPDmr, X86::VMOVNTDQmr },
7085	{ X86::VANDNPSrm, X86::VANDNPDrm, X86::VPANDNrm },
7086	{ X86::VANDNPSrr, X86::VANDNPDrr, X86::VPANDNrr },
7087	{ X86::VANDPSrm, X86::VANDPDrm, X86::VPANDrm },
7088	{ X86::VANDPSrr, X86::VANDPDrr, X86::VPANDrr },
7089	{ X86::VORPSrm, X86::VORPDrm, X86::VPORrm },
7090	{ X86::VORPSrr, X86::VORPDrr, X86::VPORrr },
7091	{ X86::VXORPSrm, X86::VXORPDrm, X86::VPXORrm },
7092	{ X86::VXORPSrr, X86::VXORPDrr, X86::VPXORrr },
7093	{ X86::VUNPCKLPDrm, X86::VUNPCKLPDrm, X86::VPUNPCKLQDQrm },
7094	{ X86::VMOVLHPSrr, X86::VUNPCKLPDrr, X86::VPUNPCKLQDQrr },
7095	{ X86::VUNPCKHPDrm, X86::VUNPCKHPDrm, X86::VPUNPCKHQDQrm },
7096	{ X86::VUNPCKHPDrr, X86::VUNPCKHPDrr, X86::VPUNPCKHQDQrr },
7097	{ X86::VUNPCKLPSrm, X86::VUNPCKLPSrm, X86::VPUNPCKLDQrm },
7098	{ X86::VUNPCKLPSrr, X86::VUNPCKLPSrr, X86::VPUNPCKLDQrr },
7099	{ X86::VUNPCKHPSrm, X86::VUNPCKHPSrm, X86::VPUNPCKHDQrm },
7100	{ X86::VUNPCKHPSrr, X86::VUNPCKHPSrr, X86::VPUNPCKHDQrr },
7101	{ X86::VEXTRACTPSmr, X86::VEXTRACTPSmr, X86::VPEXTRDmr },
7102	{ X86::VEXTRACTPSrr, X86::VEXTRACTPSrr, X86::VPEXTRDrr },
7103	// AVX 256-bit support
7104	{ X86::VMOVAPSYmr, X86::VMOVAPDYmr, X86::VMOVDQAYmr },
7105	{ X86::VMOVAPSYrm, X86::VMOVAPDYrm, X86::VMOVDQAYrm },
7106	{ X86::VMOVAPSYrr, X86::VMOVAPDYrr, X86::VMOVDQAYrr },
7107	{ X86::VMOVUPSYmr, X86::VMOVUPDYmr, X86::VMOVDQUYmr },
7108	{ X86::VMOVUPSYrm, X86::VMOVUPDYrm, X86::VMOVDQUYrm },
7109	{ X86::VMOVNTPSYmr, X86::VMOVNTPDYmr, X86::VMOVNTDQYmr },
7110	{ X86::VPERMPSYrm, X86::VPERMPSYrm, X86::VPERMDYrm },
7111	{ X86::VPERMPSYrr, X86::VPERMPSYrr, X86::VPERMDYrr },
7112	{ X86::VPERMPDYmi, X86::VPERMPDYmi, X86::VPERMQYmi },
7113	{ X86::VPERMPDYri, X86::VPERMPDYri, X86::VPERMQYri },
7114	// AVX512 support
7115	{ X86::VMOVLPSZ128mr, X86::VMOVLPDZ128mr, X86::VMOVPQI2QIZmr },
7116	{ X86::VMOVNTPSZ128mr, X86::VMOVNTPDZ128mr, X86::VMOVNTDQZ128mr },
7117	{ X86::VMOVNTPSZ256mr, X86::VMOVNTPDZ256mr, X86::VMOVNTDQZ256mr },
7118	{ X86::VMOVNTPSZmr, X86::VMOVNTPDZmr, X86::VMOVNTDQZmr },
7119	{ X86::VMOVSDZmr, X86::VMOVSDZmr, X86::VMOVPQI2QIZmr },
7120	{ X86::VMOVSSZmr, X86::VMOVSSZmr, X86::VMOVPDI2DIZmr },
7121	{ X86::VMOVSDZrm, X86::VMOVSDZrm, X86::VMOVQI2PQIZrm },
7122	{ X86::VMOVSDZrm_alt, X86::VMOVSDZrm_alt, X86::VMOVQI2PQIZrm },
7123	{ X86::VMOVSSZrm, X86::VMOVSSZrm, X86::VMOVDI2PDIZrm },
7124	{ X86::VMOVSSZrm_alt, X86::VMOVSSZrm_alt, X86::VMOVDI2PDIZrm },
7125	{ X86::VBROADCASTSSZ128rr,X86::VBROADCASTSSZ128rr,X86::VPBROADCASTDZ128rr },
7126	{ X86::VBROADCASTSSZ128rm,X86::VBROADCASTSSZ128rm,X86::VPBROADCASTDZ128rm },
7127	{ X86::VBROADCASTSSZ256rr,X86::VBROADCASTSSZ256rr,X86::VPBROADCASTDZ256rr },
7128	{ X86::VBROADCASTSSZ256rm,X86::VBROADCASTSSZ256rm,X86::VPBROADCASTDZ256rm },
7129	{ X86::VBROADCASTSSZrr, X86::VBROADCASTSSZrr, X86::VPBROADCASTDZrr },
7130	{ X86::VBROADCASTSSZrm, X86::VBROADCASTSSZrm, X86::VPBROADCASTDZrm },
7131	{ X86::VMOVDDUPZ128rr, X86::VMOVDDUPZ128rr, X86::VPBROADCASTQZ128rr },
7132	{ X86::VMOVDDUPZ128rm, X86::VMOVDDUPZ128rm, X86::VPBROADCASTQZ128rm },
7133	{ X86::VBROADCASTSDZ256rr,X86::VBROADCASTSDZ256rr,X86::VPBROADCASTQZ256rr },
7134	{ X86::VBROADCASTSDZ256rm,X86::VBROADCASTSDZ256rm,X86::VPBROADCASTQZ256rm },
7135	{ X86::VBROADCASTSDZrr, X86::VBROADCASTSDZrr, X86::VPBROADCASTQZrr },
7136	{ X86::VBROADCASTSDZrm, X86::VBROADCASTSDZrm, X86::VPBROADCASTQZrm },
7137	{ X86::VINSERTF32x4Zrr, X86::VINSERTF32x4Zrr, X86::VINSERTI32x4Zrr },
7138	{ X86::VINSERTF32x4Zrm, X86::VINSERTF32x4Zrm, X86::VINSERTI32x4Zrm },
7139	{ X86::VINSERTF32x8Zrr, X86::VINSERTF32x8Zrr, X86::VINSERTI32x8Zrr },
7140	{ X86::VINSERTF32x8Zrm, X86::VINSERTF32x8Zrm, X86::VINSERTI32x8Zrm },
7141	{ X86::VINSERTF64x2Zrr, X86::VINSERTF64x2Zrr, X86::VINSERTI64x2Zrr },
7142	{ X86::VINSERTF64x2Zrm, X86::VINSERTF64x2Zrm, X86::VINSERTI64x2Zrm },
7143	{ X86::VINSERTF64x4Zrr, X86::VINSERTF64x4Zrr, X86::VINSERTI64x4Zrr },
7144	{ X86::VINSERTF64x4Zrm, X86::VINSERTF64x4Zrm, X86::VINSERTI64x4Zrm },
7145	{ X86::VINSERTF32x4Z256rr,X86::VINSERTF32x4Z256rr,X86::VINSERTI32x4Z256rr },
7146	{ X86::VINSERTF32x4Z256rm,X86::VINSERTF32x4Z256rm,X86::VINSERTI32x4Z256rm },
7147	{ X86::VINSERTF64x2Z256rr,X86::VINSERTF64x2Z256rr,X86::VINSERTI64x2Z256rr },
7148	{ X86::VINSERTF64x2Z256rm,X86::VINSERTF64x2Z256rm,X86::VINSERTI64x2Z256rm },
7149	{ X86::VEXTRACTF32x4Zrr, X86::VEXTRACTF32x4Zrr, X86::VEXTRACTI32x4Zrr },
7150	{ X86::VEXTRACTF32x4Zmr, X86::VEXTRACTF32x4Zmr, X86::VEXTRACTI32x4Zmr },
7151	{ X86::VEXTRACTF32x8Zrr, X86::VEXTRACTF32x8Zrr, X86::VEXTRACTI32x8Zrr },
7152	{ X86::VEXTRACTF32x8Zmr, X86::VEXTRACTF32x8Zmr, X86::VEXTRACTI32x8Zmr },
7153	{ X86::VEXTRACTF64x2Zrr, X86::VEXTRACTF64x2Zrr, X86::VEXTRACTI64x2Zrr },
7154	{ X86::VEXTRACTF64x2Zmr, X86::VEXTRACTF64x2Zmr, X86::VEXTRACTI64x2Zmr },
7155	{ X86::VEXTRACTF64x4Zrr, X86::VEXTRACTF64x4Zrr, X86::VEXTRACTI64x4Zrr },
7156	{ X86::VEXTRACTF64x4Zmr, X86::VEXTRACTF64x4Zmr, X86::VEXTRACTI64x4Zmr },
7157	{ X86::VEXTRACTF32x4Z256rr,X86::VEXTRACTF32x4Z256rr,X86::VEXTRACTI32x4Z256rr },
7158	{ X86::VEXTRACTF32x4Z256mr,X86::VEXTRACTF32x4Z256mr,X86::VEXTRACTI32x4Z256mr },
7159	{ X86::VEXTRACTF64x2Z256rr,X86::VEXTRACTF64x2Z256rr,X86::VEXTRACTI64x2Z256rr },
7160	{ X86::VEXTRACTF64x2Z256mr,X86::VEXTRACTF64x2Z256mr,X86::VEXTRACTI64x2Z256mr },
7161	{ X86::VPERMILPSmi, X86::VPERMILPSmi, X86::VPSHUFDmi },
7162	{ X86::VPERMILPSri, X86::VPERMILPSri, X86::VPSHUFDri },
7163	{ X86::VPERMILPSZ128mi, X86::VPERMILPSZ128mi, X86::VPSHUFDZ128mi },
7164	{ X86::VPERMILPSZ128ri, X86::VPERMILPSZ128ri, X86::VPSHUFDZ128ri },
7165	{ X86::VPERMILPSZ256mi, X86::VPERMILPSZ256mi, X86::VPSHUFDZ256mi },
7166	{ X86::VPERMILPSZ256ri, X86::VPERMILPSZ256ri, X86::VPSHUFDZ256ri },
7167	{ X86::VPERMILPSZmi, X86::VPERMILPSZmi, X86::VPSHUFDZmi },
7168	{ X86::VPERMILPSZri, X86::VPERMILPSZri, X86::VPSHUFDZri },
7169	{ X86::VPERMPSZ256rm, X86::VPERMPSZ256rm, X86::VPERMDZ256rm },
7170	{ X86::VPERMPSZ256rr, X86::VPERMPSZ256rr, X86::VPERMDZ256rr },
7171	{ X86::VPERMPDZ256mi, X86::VPERMPDZ256mi, X86::VPERMQZ256mi },
7172	{ X86::VPERMPDZ256ri, X86::VPERMPDZ256ri, X86::VPERMQZ256ri },
7173	{ X86::VPERMPDZ256rm, X86::VPERMPDZ256rm, X86::VPERMQZ256rm },
7174	{ X86::VPERMPDZ256rr, X86::VPERMPDZ256rr, X86::VPERMQZ256rr },
7175	{ X86::VPERMPSZrm, X86::VPERMPSZrm, X86::VPERMDZrm },
7176	{ X86::VPERMPSZrr, X86::VPERMPSZrr, X86::VPERMDZrr },
7177	{ X86::VPERMPDZmi, X86::VPERMPDZmi, X86::VPERMQZmi },
7178	{ X86::VPERMPDZri, X86::VPERMPDZri, X86::VPERMQZri },
7179	{ X86::VPERMPDZrm, X86::VPERMPDZrm, X86::VPERMQZrm },
7180	{ X86::VPERMPDZrr, X86::VPERMPDZrr, X86::VPERMQZrr },
7181	{ X86::VUNPCKLPDZ256rm, X86::VUNPCKLPDZ256rm, X86::VPUNPCKLQDQZ256rm },
7182	{ X86::VUNPCKLPDZ256rr, X86::VUNPCKLPDZ256rr, X86::VPUNPCKLQDQZ256rr },
7183	{ X86::VUNPCKHPDZ256rm, X86::VUNPCKHPDZ256rm, X86::VPUNPCKHQDQZ256rm },
7184	{ X86::VUNPCKHPDZ256rr, X86::VUNPCKHPDZ256rr, X86::VPUNPCKHQDQZ256rr },
7185	{ X86::VUNPCKLPSZ256rm, X86::VUNPCKLPSZ256rm, X86::VPUNPCKLDQZ256rm },
7186	{ X86::VUNPCKLPSZ256rr, X86::VUNPCKLPSZ256rr, X86::VPUNPCKLDQZ256rr },
7187	{ X86::VUNPCKHPSZ256rm, X86::VUNPCKHPSZ256rm, X86::VPUNPCKHDQZ256rm },
7188	{ X86::VUNPCKHPSZ256rr, X86::VUNPCKHPSZ256rr, X86::VPUNPCKHDQZ256rr },
7189	{ X86::VUNPCKLPDZ128rm, X86::VUNPCKLPDZ128rm, X86::VPUNPCKLQDQZ128rm },
7190	{ X86::VMOVLHPSZrr, X86::VUNPCKLPDZ128rr, X86::VPUNPCKLQDQZ128rr },
7191	{ X86::VUNPCKHPDZ128rm, X86::VUNPCKHPDZ128rm, X86::VPUNPCKHQDQZ128rm },
7192	{ X86::VUNPCKHPDZ128rr, X86::VUNPCKHPDZ128rr, X86::VPUNPCKHQDQZ128rr },
7193	{ X86::VUNPCKLPSZ128rm, X86::VUNPCKLPSZ128rm, X86::VPUNPCKLDQZ128rm },
7194	{ X86::VUNPCKLPSZ128rr, X86::VUNPCKLPSZ128rr, X86::VPUNPCKLDQZ128rr },
7195	{ X86::VUNPCKHPSZ128rm, X86::VUNPCKHPSZ128rm, X86::VPUNPCKHDQZ128rm },
7196	{ X86::VUNPCKHPSZ128rr, X86::VUNPCKHPSZ128rr, X86::VPUNPCKHDQZ128rr },
7197	{ X86::VUNPCKLPDZrm, X86::VUNPCKLPDZrm, X86::VPUNPCKLQDQZrm },
7198	{ X86::VUNPCKLPDZrr, X86::VUNPCKLPDZrr, X86::VPUNPCKLQDQZrr },
7199	{ X86::VUNPCKHPDZrm, X86::VUNPCKHPDZrm, X86::VPUNPCKHQDQZrm },
7200	{ X86::VUNPCKHPDZrr, X86::VUNPCKHPDZrr, X86::VPUNPCKHQDQZrr },
7201	{ X86::VUNPCKLPSZrm, X86::VUNPCKLPSZrm, X86::VPUNPCKLDQZrm },
7202	{ X86::VUNPCKLPSZrr, X86::VUNPCKLPSZrr, X86::VPUNPCKLDQZrr },
7203	{ X86::VUNPCKHPSZrm, X86::VUNPCKHPSZrm, X86::VPUNPCKHDQZrm },
7204	{ X86::VUNPCKHPSZrr, X86::VUNPCKHPSZrr, X86::VPUNPCKHDQZrr },
7205	{ X86::VEXTRACTPSZmr, X86::VEXTRACTPSZmr, X86::VPEXTRDZmr },
7206	{ X86::VEXTRACTPSZrr, X86::VEXTRACTPSZrr, X86::VPEXTRDZrr },
7207	};
7208
7209	static const uint16_t ReplaceableInstrsAVX2[][3] = {
7210	//PackedSingle PackedDouble PackedInt
7211	{ X86::VANDNPSYrm, X86::VANDNPDYrm, X86::VPANDNYrm },
7212	{ X86::VANDNPSYrr, X86::VANDNPDYrr, X86::VPANDNYrr },
7213	{ X86::VANDPSYrm, X86::VANDPDYrm, X86::VPANDYrm },
7214	{ X86::VANDPSYrr, X86::VANDPDYrr, X86::VPANDYrr },
7215	{ X86::VORPSYrm, X86::VORPDYrm, X86::VPORYrm },
7216	{ X86::VORPSYrr, X86::VORPDYrr, X86::VPORYrr },
7217	{ X86::VXORPSYrm, X86::VXORPDYrm, X86::VPXORYrm },
7218	{ X86::VXORPSYrr, X86::VXORPDYrr, X86::VPXORYrr },
7219	{ X86::VPERM2F128rm, X86::VPERM2F128rm, X86::VPERM2I128rm },
7220	{ X86::VPERM2F128rr, X86::VPERM2F128rr, X86::VPERM2I128rr },
7221	{ X86::VBROADCASTSSrm, X86::VBROADCASTSSrm, X86::VPBROADCASTDrm},
7222	{ X86::VBROADCASTSSrr, X86::VBROADCASTSSrr, X86::VPBROADCASTDrr},
7223	{ X86::VMOVDDUPrm, X86::VMOVDDUPrm, X86::VPBROADCASTQrm},
7224	{ X86::VMOVDDUPrr, X86::VMOVDDUPrr, X86::VPBROADCASTQrr},
7225	{ X86::VBROADCASTSSYrr, X86::VBROADCASTSSYrr, X86::VPBROADCASTDYrr},
7226	{ X86::VBROADCASTSSYrm, X86::VBROADCASTSSYrm, X86::VPBROADCASTDYrm},
7227	{ X86::VBROADCASTSDYrr, X86::VBROADCASTSDYrr, X86::VPBROADCASTQYrr},
7228	{ X86::VBROADCASTSDYrm, X86::VBROADCASTSDYrm, X86::VPBROADCASTQYrm},
7229	{ X86::VBROADCASTF128, X86::VBROADCASTF128, X86::VBROADCASTI128 },
7230	{ X86::VBLENDPSYrri, X86::VBLENDPSYrri, X86::VPBLENDDYrri },
7231	{ X86::VBLENDPSYrmi, X86::VBLENDPSYrmi, X86::VPBLENDDYrmi },
7232	{ X86::VPERMILPSYmi, X86::VPERMILPSYmi, X86::VPSHUFDYmi },
7233	{ X86::VPERMILPSYri, X86::VPERMILPSYri, X86::VPSHUFDYri },
7234	{ X86::VUNPCKLPDYrm, X86::VUNPCKLPDYrm, X86::VPUNPCKLQDQYrm },
7235	{ X86::VUNPCKLPDYrr, X86::VUNPCKLPDYrr, X86::VPUNPCKLQDQYrr },
7236	{ X86::VUNPCKHPDYrm, X86::VUNPCKHPDYrm, X86::VPUNPCKHQDQYrm },
7237	{ X86::VUNPCKHPDYrr, X86::VUNPCKHPDYrr, X86::VPUNPCKHQDQYrr },
7238	{ X86::VUNPCKLPSYrm, X86::VUNPCKLPSYrm, X86::VPUNPCKLDQYrm },
7239	{ X86::VUNPCKLPSYrr, X86::VUNPCKLPSYrr, X86::VPUNPCKLDQYrr },
7240	{ X86::VUNPCKHPSYrm, X86::VUNPCKHPSYrm, X86::VPUNPCKHDQYrm },
7241	{ X86::VUNPCKHPSYrr, X86::VUNPCKHPSYrr, X86::VPUNPCKHDQYrr },
7242	};
7243
7244	static const uint16_t ReplaceableInstrsFP[][3] = {
7245	//PackedSingle PackedDouble
7246	{ X86::MOVLPSrm, X86::MOVLPDrm, X86::INSTRUCTION_LIST_END },
7247	{ X86::MOVHPSrm, X86::MOVHPDrm, X86::INSTRUCTION_LIST_END },
7248	{ X86::MOVHPSmr, X86::MOVHPDmr, X86::INSTRUCTION_LIST_END },
7249	{ X86::VMOVLPSrm, X86::VMOVLPDrm, X86::INSTRUCTION_LIST_END },
7250	{ X86::VMOVHPSrm, X86::VMOVHPDrm, X86::INSTRUCTION_LIST_END },
7251	{ X86::VMOVHPSmr, X86::VMOVHPDmr, X86::INSTRUCTION_LIST_END },
7252	{ X86::VMOVLPSZ128rm, X86::VMOVLPDZ128rm, X86::INSTRUCTION_LIST_END },
7253	{ X86::VMOVHPSZ128rm, X86::VMOVHPDZ128rm, X86::INSTRUCTION_LIST_END },
7254	{ X86::VMOVHPSZ128mr, X86::VMOVHPDZ128mr, X86::INSTRUCTION_LIST_END },
7255	};
7256
7257	static const uint16_t ReplaceableInstrsAVX2InsertExtract[][3] = {
7258	//PackedSingle PackedDouble PackedInt
7259	{ X86::VEXTRACTF128mr, X86::VEXTRACTF128mr, X86::VEXTRACTI128mr },
7260	{ X86::VEXTRACTF128rr, X86::VEXTRACTF128rr, X86::VEXTRACTI128rr },
7261	{ X86::VINSERTF128rm, X86::VINSERTF128rm, X86::VINSERTI128rm },
7262	{ X86::VINSERTF128rr, X86::VINSERTF128rr, X86::VINSERTI128rr },
7263	};
7264
7265	static const uint16_t ReplaceableInstrsAVX512[][4] = {
7266	// Two integer columns for 64-bit and 32-bit elements.
7267	//PackedSingle PackedDouble PackedInt PackedInt
7268	{ X86::VMOVAPSZ128mr, X86::VMOVAPDZ128mr, X86::VMOVDQA64Z128mr, X86::VMOVDQA32Z128mr },
7269	{ X86::VMOVAPSZ128rm, X86::VMOVAPDZ128rm, X86::VMOVDQA64Z128rm, X86::VMOVDQA32Z128rm },
7270	{ X86::VMOVAPSZ128rr, X86::VMOVAPDZ128rr, X86::VMOVDQA64Z128rr, X86::VMOVDQA32Z128rr },
7271	{ X86::VMOVUPSZ128mr, X86::VMOVUPDZ128mr, X86::VMOVDQU64Z128mr, X86::VMOVDQU32Z128mr },
7272	{ X86::VMOVUPSZ128rm, X86::VMOVUPDZ128rm, X86::VMOVDQU64Z128rm, X86::VMOVDQU32Z128rm },
7273	{ X86::VMOVAPSZ256mr, X86::VMOVAPDZ256mr, X86::VMOVDQA64Z256mr, X86::VMOVDQA32Z256mr },
7274	{ X86::VMOVAPSZ256rm, X86::VMOVAPDZ256rm, X86::VMOVDQA64Z256rm, X86::VMOVDQA32Z256rm },
7275	{ X86::VMOVAPSZ256rr, X86::VMOVAPDZ256rr, X86::VMOVDQA64Z256rr, X86::VMOVDQA32Z256rr },
7276	{ X86::VMOVUPSZ256mr, X86::VMOVUPDZ256mr, X86::VMOVDQU64Z256mr, X86::VMOVDQU32Z256mr },
7277	{ X86::VMOVUPSZ256rm, X86::VMOVUPDZ256rm, X86::VMOVDQU64Z256rm, X86::VMOVDQU32Z256rm },
7278	{ X86::VMOVAPSZmr, X86::VMOVAPDZmr, X86::VMOVDQA64Zmr, X86::VMOVDQA32Zmr },
7279	{ X86::VMOVAPSZrm, X86::VMOVAPDZrm, X86::VMOVDQA64Zrm, X86::VMOVDQA32Zrm },
7280	{ X86::VMOVAPSZrr, X86::VMOVAPDZrr, X86::VMOVDQA64Zrr, X86::VMOVDQA32Zrr },
7281	{ X86::VMOVUPSZmr, X86::VMOVUPDZmr, X86::VMOVDQU64Zmr, X86::VMOVDQU32Zmr },
7282	{ X86::VMOVUPSZrm, X86::VMOVUPDZrm, X86::VMOVDQU64Zrm, X86::VMOVDQU32Zrm },
7283	};
7284
7285	static const uint16_t ReplaceableInstrsAVX512DQ[][4] = {
7286	// Two integer columns for 64-bit and 32-bit elements.
7287	//PackedSingle PackedDouble PackedInt PackedInt
7288	{ X86::VANDNPSZ128rm, X86::VANDNPDZ128rm, X86::VPANDNQZ128rm, X86::VPANDNDZ128rm },
7289	{ X86::VANDNPSZ128rr, X86::VANDNPDZ128rr, X86::VPANDNQZ128rr, X86::VPANDNDZ128rr },
7290	{ X86::VANDPSZ128rm, X86::VANDPDZ128rm, X86::VPANDQZ128rm, X86::VPANDDZ128rm },
7291	{ X86::VANDPSZ128rr, X86::VANDPDZ128rr, X86::VPANDQZ128rr, X86::VPANDDZ128rr },
7292	{ X86::VORPSZ128rm, X86::VORPDZ128rm, X86::VPORQZ128rm, X86::VPORDZ128rm },
7293	{ X86::VORPSZ128rr, X86::VORPDZ128rr, X86::VPORQZ128rr, X86::VPORDZ128rr },
7294	{ X86::VXORPSZ128rm, X86::VXORPDZ128rm, X86::VPXORQZ128rm, X86::VPXORDZ128rm },
7295	{ X86::VXORPSZ128rr, X86::VXORPDZ128rr, X86::VPXORQZ128rr, X86::VPXORDZ128rr },
7296	{ X86::VANDNPSZ256rm, X86::VANDNPDZ256rm, X86::VPANDNQZ256rm, X86::VPANDNDZ256rm },
7297	{ X86::VANDNPSZ256rr, X86::VANDNPDZ256rr, X86::VPANDNQZ256rr, X86::VPANDNDZ256rr },
7298	{ X86::VANDPSZ256rm, X86::VANDPDZ256rm, X86::VPANDQZ256rm, X86::VPANDDZ256rm },
7299	{ X86::VANDPSZ256rr, X86::VANDPDZ256rr, X86::VPANDQZ256rr, X86::VPANDDZ256rr },
7300	{ X86::VORPSZ256rm, X86::VORPDZ256rm, X86::VPORQZ256rm, X86::VPORDZ256rm },
7301	{ X86::VORPSZ256rr, X86::VORPDZ256rr, X86::VPORQZ256rr, X86::VPORDZ256rr },
7302	{ X86::VXORPSZ256rm, X86::VXORPDZ256rm, X86::VPXORQZ256rm, X86::VPXORDZ256rm },
7303	{ X86::VXORPSZ256rr, X86::VXORPDZ256rr, X86::VPXORQZ256rr, X86::VPXORDZ256rr },
7304	{ X86::VANDNPSZrm, X86::VANDNPDZrm, X86::VPANDNQZrm, X86::VPANDNDZrm },
7305	{ X86::VANDNPSZrr, X86::VANDNPDZrr, X86::VPANDNQZrr, X86::VPANDNDZrr },
7306	{ X86::VANDPSZrm, X86::VANDPDZrm, X86::VPANDQZrm, X86::VPANDDZrm },
7307	{ X86::VANDPSZrr, X86::VANDPDZrr, X86::VPANDQZrr, X86::VPANDDZrr },
7308	{ X86::VORPSZrm, X86::VORPDZrm, X86::VPORQZrm, X86::VPORDZrm },
7309	{ X86::VORPSZrr, X86::VORPDZrr, X86::VPORQZrr, X86::VPORDZrr },
7310	{ X86::VXORPSZrm, X86::VXORPDZrm, X86::VPXORQZrm, X86::VPXORDZrm },
7311	{ X86::VXORPSZrr, X86::VXORPDZrr, X86::VPXORQZrr, X86::VPXORDZrr },
7312	};
7313
7314	static const uint16_t ReplaceableInstrsAVX512DQMasked[][4] = {
7315	// Two integer columns for 64-bit and 32-bit elements.
7316	//PackedSingle PackedDouble
7317	//PackedInt PackedInt
7318	{ X86::VANDNPSZ128rmk, X86::VANDNPDZ128rmk,
7319	X86::VPANDNQZ128rmk, X86::VPANDNDZ128rmk },
7320	{ X86::VANDNPSZ128rmkz, X86::VANDNPDZ128rmkz,
7321	X86::VPANDNQZ128rmkz, X86::VPANDNDZ128rmkz },
7322	{ X86::VANDNPSZ128rrk, X86::VANDNPDZ128rrk,
7323	X86::VPANDNQZ128rrk, X86::VPANDNDZ128rrk },
7324	{ X86::VANDNPSZ128rrkz, X86::VANDNPDZ128rrkz,
7325	X86::VPANDNQZ128rrkz, X86::VPANDNDZ128rrkz },
7326	{ X86::VANDPSZ128rmk, X86::VANDPDZ128rmk,
7327	X86::VPANDQZ128rmk, X86::VPANDDZ128rmk },
7328	{ X86::VANDPSZ128rmkz, X86::VANDPDZ128rmkz,
7329	X86::VPANDQZ128rmkz, X86::VPANDDZ128rmkz },
7330	{ X86::VANDPSZ128rrk, X86::VANDPDZ128rrk,
7331	X86::VPANDQZ128rrk, X86::VPANDDZ128rrk },
7332	{ X86::VANDPSZ128rrkz, X86::VANDPDZ128rrkz,
7333	X86::VPANDQZ128rrkz, X86::VPANDDZ128rrkz },
7334	{ X86::VORPSZ128rmk, X86::VORPDZ128rmk,
7335	X86::VPORQZ128rmk, X86::VPORDZ128rmk },
7336	{ X86::VORPSZ128rmkz, X86::VORPDZ128rmkz,
7337	X86::VPORQZ128rmkz, X86::VPORDZ128rmkz },
7338	{ X86::VORPSZ128rrk, X86::VORPDZ128rrk,
7339	X86::VPORQZ128rrk, X86::VPORDZ128rrk },
7340	{ X86::VORPSZ128rrkz, X86::VORPDZ128rrkz,
7341	X86::VPORQZ128rrkz, X86::VPORDZ128rrkz },
7342	{ X86::VXORPSZ128rmk, X86::VXORPDZ128rmk,
7343	X86::VPXORQZ128rmk, X86::VPXORDZ128rmk },
7344	{ X86::VXORPSZ128rmkz, X86::VXORPDZ128rmkz,
7345	X86::VPXORQZ128rmkz, X86::VPXORDZ128rmkz },
7346	{ X86::VXORPSZ128rrk, X86::VXORPDZ128rrk,
7347	X86::VPXORQZ128rrk, X86::VPXORDZ128rrk },
7348	{ X86::VXORPSZ128rrkz, X86::VXORPDZ128rrkz,
7349	X86::VPXORQZ128rrkz, X86::VPXORDZ128rrkz },
7350	{ X86::VANDNPSZ256rmk, X86::VANDNPDZ256rmk,
7351	X86::VPANDNQZ256rmk, X86::VPANDNDZ256rmk },
7352	{ X86::VANDNPSZ256rmkz, X86::VANDNPDZ256rmkz,
7353	X86::VPANDNQZ256rmkz, X86::VPANDNDZ256rmkz },
7354	{ X86::VANDNPSZ256rrk, X86::VANDNPDZ256rrk,
7355	X86::VPANDNQZ256rrk, X86::VPANDNDZ256rrk },
7356	{ X86::VANDNPSZ256rrkz, X86::VANDNPDZ256rrkz,
7357	X86::VPANDNQZ256rrkz, X86::VPANDNDZ256rrkz },
7358	{ X86::VANDPSZ256rmk, X86::VANDPDZ256rmk,
7359	X86::VPANDQZ256rmk, X86::VPANDDZ256rmk },
7360	{ X86::VANDPSZ256rmkz, X86::VANDPDZ256rmkz,
7361	X86::VPANDQZ256rmkz, X86::VPANDDZ256rmkz },
7362	{ X86::VANDPSZ256rrk, X86::VANDPDZ256rrk,
7363	X86::VPANDQZ256rrk, X86::VPANDDZ256rrk },
7364	{ X86::VANDPSZ256rrkz, X86::VANDPDZ256rrkz,
7365	X86::VPANDQZ256rrkz, X86::VPANDDZ256rrkz },
7366	{ X86::VORPSZ256rmk, X86::VORPDZ256rmk,
7367	X86::VPORQZ256rmk, X86::VPORDZ256rmk },
7368	{ X86::VORPSZ256rmkz, X86::VORPDZ256rmkz,
7369	X86::VPORQZ256rmkz, X86::VPORDZ256rmkz },
7370	{ X86::VORPSZ256rrk, X86::VORPDZ256rrk,
7371	X86::VPORQZ256rrk, X86::VPORDZ256rrk },
7372	{ X86::VORPSZ256rrkz, X86::VORPDZ256rrkz,
7373	X86::VPORQZ256rrkz, X86::VPORDZ256rrkz },
7374	{ X86::VXORPSZ256rmk, X86::VXORPDZ256rmk,
7375	X86::VPXORQZ256rmk, X86::VPXORDZ256rmk },
7376	{ X86::VXORPSZ256rmkz, X86::VXORPDZ256rmkz,
7377	X86::VPXORQZ256rmkz, X86::VPXORDZ256rmkz },
7378	{ X86::VXORPSZ256rrk, X86::VXORPDZ256rrk,
7379	X86::VPXORQZ256rrk, X86::VPXORDZ256rrk },
7380	{ X86::VXORPSZ256rrkz, X86::VXORPDZ256rrkz,
7381	X86::VPXORQZ256rrkz, X86::VPXORDZ256rrkz },
7382	{ X86::VANDNPSZrmk, X86::VANDNPDZrmk,
7383	X86::VPANDNQZrmk, X86::VPANDNDZrmk },
7384	{ X86::VANDNPSZrmkz, X86::VANDNPDZrmkz,
7385	X86::VPANDNQZrmkz, X86::VPANDNDZrmkz },
7386	{ X86::VANDNPSZrrk, X86::VANDNPDZrrk,
7387	X86::VPANDNQZrrk, X86::VPANDNDZrrk },
7388	{ X86::VANDNPSZrrkz, X86::VANDNPDZrrkz,
7389	X86::VPANDNQZrrkz, X86::VPANDNDZrrkz },
7390	{ X86::VANDPSZrmk, X86::VANDPDZrmk,
7391	X86::VPANDQZrmk, X86::VPANDDZrmk },
7392	{ X86::VANDPSZrmkz, X86::VANDPDZrmkz,
7393	X86::VPANDQZrmkz, X86::VPANDDZrmkz },
7394	{ X86::VANDPSZrrk, X86::VANDPDZrrk,
7395	X86::VPANDQZrrk, X86::VPANDDZrrk },
7396	{ X86::VANDPSZrrkz, X86::VANDPDZrrkz,
7397	X86::VPANDQZrrkz, X86::VPANDDZrrkz },
7398	{ X86::VORPSZrmk, X86::VORPDZrmk,
7399	X86::VPORQZrmk, X86::VPORDZrmk },
7400	{ X86::VORPSZrmkz, X86::VORPDZrmkz,
7401	X86::VPORQZrmkz, X86::VPORDZrmkz },
7402	{ X86::VORPSZrrk, X86::VORPDZrrk,
7403	X86::VPORQZrrk, X86::VPORDZrrk },
7404	{ X86::VORPSZrrkz, X86::VORPDZrrkz,
7405	X86::VPORQZrrkz, X86::VPORDZrrkz },
7406	{ X86::VXORPSZrmk, X86::VXORPDZrmk,
7407	X86::VPXORQZrmk, X86::VPXORDZrmk },
7408	{ X86::VXORPSZrmkz, X86::VXORPDZrmkz,
7409	X86::VPXORQZrmkz, X86::VPXORDZrmkz },
7410	{ X86::VXORPSZrrk, X86::VXORPDZrrk,
7411	X86::VPXORQZrrk, X86::VPXORDZrrk },
7412	{ X86::VXORPSZrrkz, X86::VXORPDZrrkz,
7413	X86::VPXORQZrrkz, X86::VPXORDZrrkz },
7414	// Broadcast loads can be handled the same as masked operations to avoid
7415	// changing element size.
7416	{ X86::VANDNPSZ128rmb, X86::VANDNPDZ128rmb,
7417	X86::VPANDNQZ128rmb, X86::VPANDNDZ128rmb },
7418	{ X86::VANDPSZ128rmb, X86::VANDPDZ128rmb,
7419	X86::VPANDQZ128rmb, X86::VPANDDZ128rmb },
7420	{ X86::VORPSZ128rmb, X86::VORPDZ128rmb,
7421	X86::VPORQZ128rmb, X86::VPORDZ128rmb },
7422	{ X86::VXORPSZ128rmb, X86::VXORPDZ128rmb,
7423	X86::VPXORQZ128rmb, X86::VPXORDZ128rmb },
7424	{ X86::VANDNPSZ256rmb, X86::VANDNPDZ256rmb,
7425	X86::VPANDNQZ256rmb, X86::VPANDNDZ256rmb },
7426	{ X86::VANDPSZ256rmb, X86::VANDPDZ256rmb,
7427	X86::VPANDQZ256rmb, X86::VPANDDZ256rmb },
7428	{ X86::VORPSZ256rmb, X86::VORPDZ256rmb,
7429	X86::VPORQZ256rmb, X86::VPORDZ256rmb },
7430	{ X86::VXORPSZ256rmb, X86::VXORPDZ256rmb,
7431	X86::VPXORQZ256rmb, X86::VPXORDZ256rmb },
7432	{ X86::VANDNPSZrmb, X86::VANDNPDZrmb,
7433	X86::VPANDNQZrmb, X86::VPANDNDZrmb },
7434	{ X86::VANDPSZrmb, X86::VANDPDZrmb,
7435	X86::VPANDQZrmb, X86::VPANDDZrmb },
7436	{ X86::VANDPSZrmb, X86::VANDPDZrmb,
7437	X86::VPANDQZrmb, X86::VPANDDZrmb },
7438	{ X86::VORPSZrmb, X86::VORPDZrmb,
7439	X86::VPORQZrmb, X86::VPORDZrmb },
7440	{ X86::VXORPSZrmb, X86::VXORPDZrmb,
7441	X86::VPXORQZrmb, X86::VPXORDZrmb },
7442	{ X86::VANDNPSZ128rmbk, X86::VANDNPDZ128rmbk,
7443	X86::VPANDNQZ128rmbk, X86::VPANDNDZ128rmbk },
7444	{ X86::VANDPSZ128rmbk, X86::VANDPDZ128rmbk,
7445	X86::VPANDQZ128rmbk, X86::VPANDDZ128rmbk },
7446	{ X86::VORPSZ128rmbk, X86::VORPDZ128rmbk,
7447	X86::VPORQZ128rmbk, X86::VPORDZ128rmbk },
7448	{ X86::VXORPSZ128rmbk, X86::VXORPDZ128rmbk,
7449	X86::VPXORQZ128rmbk, X86::VPXORDZ128rmbk },
7450	{ X86::VANDNPSZ256rmbk, X86::VANDNPDZ256rmbk,
7451	X86::VPANDNQZ256rmbk, X86::VPANDNDZ256rmbk },
7452	{ X86::VANDPSZ256rmbk, X86::VANDPDZ256rmbk,
7453	X86::VPANDQZ256rmbk, X86::VPANDDZ256rmbk },
7454	{ X86::VORPSZ256rmbk, X86::VORPDZ256rmbk,
7455	X86::VPORQZ256rmbk, X86::VPORDZ256rmbk },
7456	{ X86::VXORPSZ256rmbk, X86::VXORPDZ256rmbk,
7457	X86::VPXORQZ256rmbk, X86::VPXORDZ256rmbk },
7458	{ X86::VANDNPSZrmbk, X86::VANDNPDZrmbk,
7459	X86::VPANDNQZrmbk, X86::VPANDNDZrmbk },
7460	{ X86::VANDPSZrmbk, X86::VANDPDZrmbk,
7461	X86::VPANDQZrmbk, X86::VPANDDZrmbk },
7462	{ X86::VANDPSZrmbk, X86::VANDPDZrmbk,
7463	X86::VPANDQZrmbk, X86::VPANDDZrmbk },
7464	{ X86::VORPSZrmbk, X86::VORPDZrmbk,
7465	X86::VPORQZrmbk, X86::VPORDZrmbk },
7466	{ X86::VXORPSZrmbk, X86::VXORPDZrmbk,
7467	X86::VPXORQZrmbk, X86::VPXORDZrmbk },
7468	{ X86::VANDNPSZ128rmbkz,X86::VANDNPDZ128rmbkz,
7469	X86::VPANDNQZ128rmbkz,X86::VPANDNDZ128rmbkz},
7470	{ X86::VANDPSZ128rmbkz, X86::VANDPDZ128rmbkz,
7471	X86::VPANDQZ128rmbkz, X86::VPANDDZ128rmbkz },
7472	{ X86::VORPSZ128rmbkz, X86::VORPDZ128rmbkz,
7473	X86::VPORQZ128rmbkz, X86::VPORDZ128rmbkz },
7474	{ X86::VXORPSZ128rmbkz, X86::VXORPDZ128rmbkz,
7475	X86::VPXORQZ128rmbkz, X86::VPXORDZ128rmbkz },
7476	{ X86::VANDNPSZ256rmbkz,X86::VANDNPDZ256rmbkz,
7477	X86::VPANDNQZ256rmbkz,X86::VPANDNDZ256rmbkz},
7478	{ X86::VANDPSZ256rmbkz, X86::VANDPDZ256rmbkz,
7479	X86::VPANDQZ256rmbkz, X86::VPANDDZ256rmbkz },
7480	{ X86::VORPSZ256rmbkz, X86::VORPDZ256rmbkz,
7481	X86::VPORQZ256rmbkz, X86::VPORDZ256rmbkz },
7482	{ X86::VXORPSZ256rmbkz, X86::VXORPDZ256rmbkz,
7483	X86::VPXORQZ256rmbkz, X86::VPXORDZ256rmbkz },
7484	{ X86::VANDNPSZrmbkz, X86::VANDNPDZrmbkz,
7485	X86::VPANDNQZrmbkz, X86::VPANDNDZrmbkz },
7486	{ X86::VANDPSZrmbkz, X86::VANDPDZrmbkz,
7487	X86::VPANDQZrmbkz, X86::VPANDDZrmbkz },
7488	{ X86::VANDPSZrmbkz, X86::VANDPDZrmbkz,
7489	X86::VPANDQZrmbkz, X86::VPANDDZrmbkz },
7490	{ X86::VORPSZrmbkz, X86::VORPDZrmbkz,
7491	X86::VPORQZrmbkz, X86::VPORDZrmbkz },
7492	{ X86::VXORPSZrmbkz, X86::VXORPDZrmbkz,
7493	X86::VPXORQZrmbkz, X86::VPXORDZrmbkz },
7494	};
7495
7496	// NOTE: These should only be used by the custom domain methods.
7497	static const uint16_t ReplaceableBlendInstrs[][3] = {
7498	//PackedSingle PackedDouble PackedInt
7499	{ X86::BLENDPSrmi, X86::BLENDPDrmi, X86::PBLENDWrmi },
7500	{ X86::BLENDPSrri, X86::BLENDPDrri, X86::PBLENDWrri },
7501	{ X86::VBLENDPSrmi, X86::VBLENDPDrmi, X86::VPBLENDWrmi },
7502	{ X86::VBLENDPSrri, X86::VBLENDPDrri, X86::VPBLENDWrri },
7503	{ X86::VBLENDPSYrmi, X86::VBLENDPDYrmi, X86::VPBLENDWYrmi },
7504	{ X86::VBLENDPSYrri, X86::VBLENDPDYrri, X86::VPBLENDWYrri },
7505	};
7506	static const uint16_t ReplaceableBlendAVX2Instrs[][3] = {
7507	//PackedSingle PackedDouble PackedInt
7508	{ X86::VBLENDPSrmi, X86::VBLENDPDrmi, X86::VPBLENDDrmi },
7509	{ X86::VBLENDPSrri, X86::VBLENDPDrri, X86::VPBLENDDrri },
7510	{ X86::VBLENDPSYrmi, X86::VBLENDPDYrmi, X86::VPBLENDDYrmi },
7511	{ X86::VBLENDPSYrri, X86::VBLENDPDYrri, X86::VPBLENDDYrri },
7512	};
7513
7514	// Special table for changing EVEX logic instructions to VEX.
7515	// TODO: Should we run EVEX->VEX earlier?
7516	static const uint16_t ReplaceableCustomAVX512LogicInstrs[][4] = {
7517	// Two integer columns for 64-bit and 32-bit elements.
7518	//PackedSingle PackedDouble PackedInt PackedInt
7519	{ X86::VANDNPSrm, X86::VANDNPDrm, X86::VPANDNQZ128rm, X86::VPANDNDZ128rm },
7520	{ X86::VANDNPSrr, X86::VANDNPDrr, X86::VPANDNQZ128rr, X86::VPANDNDZ128rr },
7521	{ X86::VANDPSrm, X86::VANDPDrm, X86::VPANDQZ128rm, X86::VPANDDZ128rm },
7522	{ X86::VANDPSrr, X86::VANDPDrr, X86::VPANDQZ128rr, X86::VPANDDZ128rr },
7523	{ X86::VORPSrm, X86::VORPDrm, X86::VPORQZ128rm, X86::VPORDZ128rm },
7524	{ X86::VORPSrr, X86::VORPDrr, X86::VPORQZ128rr, X86::VPORDZ128rr },
7525	{ X86::VXORPSrm, X86::VXORPDrm, X86::VPXORQZ128rm, X86::VPXORDZ128rm },
7526	{ X86::VXORPSrr, X86::VXORPDrr, X86::VPXORQZ128rr, X86::VPXORDZ128rr },
7527	{ X86::VANDNPSYrm, X86::VANDNPDYrm, X86::VPANDNQZ256rm, X86::VPANDNDZ256rm },
7528	{ X86::VANDNPSYrr, X86::VANDNPDYrr, X86::VPANDNQZ256rr, X86::VPANDNDZ256rr },
7529	{ X86::VANDPSYrm, X86::VANDPDYrm, X86::VPANDQZ256rm, X86::VPANDDZ256rm },
7530	{ X86::VANDPSYrr, X86::VANDPDYrr, X86::VPANDQZ256rr, X86::VPANDDZ256rr },
7531	{ X86::VORPSYrm, X86::VORPDYrm, X86::VPORQZ256rm, X86::VPORDZ256rm },
7532	{ X86::VORPSYrr, X86::VORPDYrr, X86::VPORQZ256rr, X86::VPORDZ256rr },
7533	{ X86::VXORPSYrm, X86::VXORPDYrm, X86::VPXORQZ256rm, X86::VPXORDZ256rm },
7534	{ X86::VXORPSYrr, X86::VXORPDYrr, X86::VPXORQZ256rr, X86::VPXORDZ256rr },
7535	};
7536
7537	// FIXME: Some shuffle and unpack instructions have equivalents in different
7538	// domains, but they require a bit more work than just switching opcodes.
7539
7540	static const uint16_t *lookup(unsigned opcode, unsigned domain,
7541	ArrayRef<uint16_t[3]> Table) {
7542	for (const uint16_t (&Row)[3] : Table)
7543	if (Row[domain-1] == opcode)
7544	return Row;
7545	return nullptr;
7546	}
7547
7548	static const uint16_t *lookupAVX512(unsigned opcode, unsigned domain,
7549	ArrayRef<uint16_t[4]> Table) {
7550	// If this is the integer domain make sure to check both integer columns.
7551	for (const uint16_t (&Row)[4] : Table)
7552	if (Row[domain-1] == opcode \|\| (domain == 3 && Row[3] == opcode))
7553	return Row;
7554	return nullptr;
7555	}
7556
7557	// Helper to attempt to widen/narrow blend masks.
7558	static bool AdjustBlendMask(unsigned OldMask, unsigned OldWidth,
7559	unsigned NewWidth, unsigned *pNewMask = nullptr) {
7560	assert(((OldWidth % NewWidth) == 0 \|\| (NewWidth % OldWidth) == 0) &&(static_cast <bool> (((OldWidth % NewWidth) == 0 \|\| (NewWidth % OldWidth) == 0) && "Illegal blend mask scale") ? void (0) : __assert_fail ("((OldWidth % NewWidth) == 0 \|\| (NewWidth % OldWidth) == 0) && \"Illegal blend mask scale\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7561, __extension__ __PRETTY_FUNCTION__))
7561	"Illegal blend mask scale")(static_cast <bool> (((OldWidth % NewWidth) == 0 \|\| (NewWidth % OldWidth) == 0) && "Illegal blend mask scale") ? void (0) : __assert_fail ("((OldWidth % NewWidth) == 0 \|\| (NewWidth % OldWidth) == 0) && \"Illegal blend mask scale\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7561, __extension__ __PRETTY_FUNCTION__));
7562	unsigned NewMask = 0;
7563
7564	if ((OldWidth % NewWidth) == 0) {
7565	unsigned Scale = OldWidth / NewWidth;
7566	unsigned SubMask = (1u << Scale) - 1;
7567	for (unsigned i = 0; i != NewWidth; ++i) {
7568	unsigned Sub = (OldMask >> (i * Scale)) & SubMask;
7569	if (Sub == SubMask)
7570	NewMask \|= (1u << i);
7571	else if (Sub != 0x0)
7572	return false;
7573	}
7574	} else {
7575	unsigned Scale = NewWidth / OldWidth;
7576	unsigned SubMask = (1u << Scale) - 1;
7577	for (unsigned i = 0; i != OldWidth; ++i) {
7578	if (OldMask & (1 << i)) {
7579	NewMask \|= (SubMask << (i * Scale));
7580	}
7581	}
7582	}
7583
7584	if (pNewMask)
7585	*pNewMask = NewMask;
7586	return true;
7587	}
7588
7589	uint16_t X86InstrInfo::getExecutionDomainCustom(const MachineInstr &MI) const {
7590	unsigned Opcode = MI.getOpcode();
7591	unsigned NumOperands = MI.getDesc().getNumOperands();
7592
7593	auto GetBlendDomains = [&](unsigned ImmWidth, bool Is256) {
7594	uint16_t validDomains = 0;
7595	if (MI.getOperand(NumOperands - 1).isImm()) {
7596	unsigned Imm = MI.getOperand(NumOperands - 1).getImm();
7597	if (AdjustBlendMask(Imm, ImmWidth, Is256 ? 8 : 4))
7598	validDomains \|= 0x2; // PackedSingle
7599	if (AdjustBlendMask(Imm, ImmWidth, Is256 ? 4 : 2))
7600	validDomains \|= 0x4; // PackedDouble
7601	if (!Is256 \|\| Subtarget.hasAVX2())
7602	validDomains \|= 0x8; // PackedInt
7603	}
7604	return validDomains;
7605	};
7606
7607	switch (Opcode) {
7608	case X86::BLENDPDrmi:
7609	case X86::BLENDPDrri:
7610	case X86::VBLENDPDrmi:
7611	case X86::VBLENDPDrri:
7612	return GetBlendDomains(2, false);
7613	case X86::VBLENDPDYrmi:
7614	case X86::VBLENDPDYrri:
7615	return GetBlendDomains(4, true);
7616	case X86::BLENDPSrmi:
7617	case X86::BLENDPSrri:
7618	case X86::VBLENDPSrmi:
7619	case X86::VBLENDPSrri:
7620	case X86::VPBLENDDrmi:
7621	case X86::VPBLENDDrri:
7622	return GetBlendDomains(4, false);
7623	case X86::VBLENDPSYrmi:
7624	case X86::VBLENDPSYrri:
7625	case X86::VPBLENDDYrmi:
7626	case X86::VPBLENDDYrri:
7627	return GetBlendDomains(8, true);
7628	case X86::PBLENDWrmi:
7629	case X86::PBLENDWrri:
7630	case X86::VPBLENDWrmi:
7631	case X86::VPBLENDWrri:
7632	// Treat VPBLENDWY as a 128-bit vector as it repeats the lo/hi masks.
7633	case X86::VPBLENDWYrmi:
7634	case X86::VPBLENDWYrri:
7635	return GetBlendDomains(8, false);
7636	case X86::VPANDDZ128rr: case X86::VPANDDZ128rm:
7637	case X86::VPANDDZ256rr: case X86::VPANDDZ256rm:
7638	case X86::VPANDQZ128rr: case X86::VPANDQZ128rm:
7639	case X86::VPANDQZ256rr: case X86::VPANDQZ256rm:
7640	case X86::VPANDNDZ128rr: case X86::VPANDNDZ128rm:
7641	case X86::VPANDNDZ256rr: case X86::VPANDNDZ256rm:
7642	case X86::VPANDNQZ128rr: case X86::VPANDNQZ128rm:
7643	case X86::VPANDNQZ256rr: case X86::VPANDNQZ256rm:
7644	case X86::VPORDZ128rr: case X86::VPORDZ128rm:
7645	case X86::VPORDZ256rr: case X86::VPORDZ256rm:
7646	case X86::VPORQZ128rr: case X86::VPORQZ128rm:
7647	case X86::VPORQZ256rr: case X86::VPORQZ256rm:
7648	case X86::VPXORDZ128rr: case X86::VPXORDZ128rm:
7649	case X86::VPXORDZ256rr: case X86::VPXORDZ256rm:
7650	case X86::VPXORQZ128rr: case X86::VPXORQZ128rm:
7651	case X86::VPXORQZ256rr: case X86::VPXORQZ256rm:
7652	// If we don't have DQI see if we can still switch from an EVEX integer
7653	// instruction to a VEX floating point instruction.
7654	if (Subtarget.hasDQI())
7655	return 0;
7656
7657	if (RI.getEncodingValue(MI.getOperand(0).getReg()) >= 16)
7658	return 0;
7659	if (RI.getEncodingValue(MI.getOperand(1).getReg()) >= 16)
7660	return 0;
7661	// Register forms will have 3 operands. Memory form will have more.
7662	if (NumOperands == 3 &&
7663	RI.getEncodingValue(MI.getOperand(2).getReg()) >= 16)
7664	return 0;
7665
7666	// All domains are valid.
7667	return 0xe;
7668	case X86::MOVHLPSrr:
7669	// We can swap domains when both inputs are the same register.
7670	// FIXME: This doesn't catch all the cases we would like. If the input
7671	// register isn't KILLed by the instruction, the two address instruction
7672	// pass puts a COPY on one input. The other input uses the original
7673	// register. This prevents the same physical register from being used by
7674	// both inputs.
7675	if (MI.getOperand(1).getReg() == MI.getOperand(2).getReg() &&
7676	MI.getOperand(0).getSubReg() == 0 &&
7677	MI.getOperand(1).getSubReg() == 0 &&
7678	MI.getOperand(2).getSubReg() == 0)
7679	return 0x6;
7680	return 0;
7681	case X86::SHUFPDrri:
7682	return 0x6;
7683	}
7684	return 0;
7685	}
7686
7687	bool X86InstrInfo::setExecutionDomainCustom(MachineInstr &MI,
7688	unsigned Domain) const {
7689	assert(Domain > 0 && Domain < 4 && "Invalid execution domain")(static_cast <bool> (Domain > 0 && Domain < 4 && "Invalid execution domain") ? void (0) : __assert_fail ("Domain > 0 && Domain < 4 && \"Invalid execution domain\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7689, __extension__ __PRETTY_FUNCTION__));
7690	uint16_t dom = (MI.getDesc().TSFlags >> X86II::SSEDomainShift) & 3;
7691	assert(dom && "Not an SSE instruction")(static_cast <bool> (dom && "Not an SSE instruction" ) ? void (0) : __assert_fail ("dom && \"Not an SSE instruction\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7691, __extension__ __PRETTY_FUNCTION__));
7692
7693	unsigned Opcode = MI.getOpcode();
7694	unsigned NumOperands = MI.getDesc().getNumOperands();
7695
7696	auto SetBlendDomain = [&](unsigned ImmWidth, bool Is256) {
7697	if (MI.getOperand(NumOperands - 1).isImm()) {
7698	unsigned Imm = MI.getOperand(NumOperands - 1).getImm() & 255;
7699	Imm = (ImmWidth == 16 ? ((Imm << 8) \| Imm) : Imm);
7700	unsigned NewImm = Imm;
7701
7702	const uint16_t *table = lookup(Opcode, dom, ReplaceableBlendInstrs);
7703	if (!table)
7704	table = lookup(Opcode, dom, ReplaceableBlendAVX2Instrs);
7705
7706	if (Domain == 1) { // PackedSingle
7707	AdjustBlendMask(Imm, ImmWidth, Is256 ? 8 : 4, &NewImm);
7708	} else if (Domain == 2) { // PackedDouble
7709	AdjustBlendMask(Imm, ImmWidth, Is256 ? 4 : 2, &NewImm);
7710	} else if (Domain == 3) { // PackedInt
7711	if (Subtarget.hasAVX2()) {
7712	// If we are already VPBLENDW use that, else use VPBLENDD.
7713	if ((ImmWidth / (Is256 ? 2 : 1)) != 8) {
7714	table = lookup(Opcode, dom, ReplaceableBlendAVX2Instrs);
7715	AdjustBlendMask(Imm, ImmWidth, Is256 ? 8 : 4, &NewImm);
7716	}
7717	} else {
7718	assert(!Is256 && "128-bit vector expected")(static_cast <bool> (!Is256 && "128-bit vector expected" ) ? void (0) : __assert_fail ("!Is256 && \"128-bit vector expected\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7718, __extension__ __PRETTY_FUNCTION__));
7719	AdjustBlendMask(Imm, ImmWidth, 8, &NewImm);
7720	}
7721	}
7722
7723	assert(table && table[Domain - 1] && "Unknown domain op")(static_cast <bool> (table && table[Domain - 1] && "Unknown domain op") ? void (0) : __assert_fail ( "table && table[Domain - 1] && \"Unknown domain op\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7723, __extension__ __PRETTY_FUNCTION__));
7724	MI.setDesc(get(table[Domain - 1]));
7725	MI.getOperand(NumOperands - 1).setImm(NewImm & 255);
7726	}
7727	return true;
7728	};
7729
7730	switch (Opcode) {
7731	case X86::BLENDPDrmi:
7732	case X86::BLENDPDrri:
7733	case X86::VBLENDPDrmi:
7734	case X86::VBLENDPDrri:
7735	return SetBlendDomain(2, false);
7736	case X86::VBLENDPDYrmi:
7737	case X86::VBLENDPDYrri:
7738	return SetBlendDomain(4, true);
7739	case X86::BLENDPSrmi:
7740	case X86::BLENDPSrri:
7741	case X86::VBLENDPSrmi:
7742	case X86::VBLENDPSrri:
7743	case X86::VPBLENDDrmi:
7744	case X86::VPBLENDDrri:
7745	return SetBlendDomain(4, false);
7746	case X86::VBLENDPSYrmi:
7747	case X86::VBLENDPSYrri:
7748	case X86::VPBLENDDYrmi:
7749	case X86::VPBLENDDYrri:
7750	return SetBlendDomain(8, true);
7751	case X86::PBLENDWrmi:
7752	case X86::PBLENDWrri:
7753	case X86::VPBLENDWrmi:
7754	case X86::VPBLENDWrri:
7755	return SetBlendDomain(8, false);
7756	case X86::VPBLENDWYrmi:
7757	case X86::VPBLENDWYrri:
7758	return SetBlendDomain(16, true);
7759	case X86::VPANDDZ128rr: case X86::VPANDDZ128rm:
7760	case X86::VPANDDZ256rr: case X86::VPANDDZ256rm:
7761	case X86::VPANDQZ128rr: case X86::VPANDQZ128rm:
7762	case X86::VPANDQZ256rr: case X86::VPANDQZ256rm:
7763	case X86::VPANDNDZ128rr: case X86::VPANDNDZ128rm:
7764	case X86::VPANDNDZ256rr: case X86::VPANDNDZ256rm:
7765	case X86::VPANDNQZ128rr: case X86::VPANDNQZ128rm:
7766	case X86::VPANDNQZ256rr: case X86::VPANDNQZ256rm:
7767	case X86::VPORDZ128rr: case X86::VPORDZ128rm:
7768	case X86::VPORDZ256rr: case X86::VPORDZ256rm:
7769	case X86::VPORQZ128rr: case X86::VPORQZ128rm:
7770	case X86::VPORQZ256rr: case X86::VPORQZ256rm:
7771	case X86::VPXORDZ128rr: case X86::VPXORDZ128rm:
7772	case X86::VPXORDZ256rr: case X86::VPXORDZ256rm:
7773	case X86::VPXORQZ128rr: case X86::VPXORQZ128rm:
7774	case X86::VPXORQZ256rr: case X86::VPXORQZ256rm: {
7775	// Without DQI, convert EVEX instructions to VEX instructions.
7776	if (Subtarget.hasDQI())
7777	return false;
7778
7779	const uint16_t *table = lookupAVX512(MI.getOpcode(), dom,
7780	ReplaceableCustomAVX512LogicInstrs);
7781	assert(table && "Instruction not found in table?")(static_cast <bool> (table && "Instruction not found in table?" ) ? void (0) : __assert_fail ("table && \"Instruction not found in table?\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7781, __extension__ __PRETTY_FUNCTION__));
7782	// Don't change integer Q instructions to D instructions and
7783	// use D intructions if we started with a PS instruction.
7784	if (Domain == 3 && (dom == 1 \|\| table[3] == MI.getOpcode()))
7785	Domain = 4;
7786	MI.setDesc(get(table[Domain - 1]));
7787	return true;
7788	}
7789	case X86::UNPCKHPDrr:
7790	case X86::MOVHLPSrr:
7791	// We just need to commute the instruction which will switch the domains.
7792	if (Domain != dom && Domain != 3 &&
7793	MI.getOperand(1).getReg() == MI.getOperand(2).getReg() &&
7794	MI.getOperand(0).getSubReg() == 0 &&
7795	MI.getOperand(1).getSubReg() == 0 &&
7796	MI.getOperand(2).getSubReg() == 0) {
7797	commuteInstruction(MI, false);
7798	return true;
7799	}
7800	// We must always return true for MOVHLPSrr.
7801	if (Opcode == X86::MOVHLPSrr)
7802	return true;
7803	break;
7804	case X86::SHUFPDrri: {
7805	if (Domain == 1) {
7806	unsigned Imm = MI.getOperand(3).getImm();
7807	unsigned NewImm = 0x44;
7808	if (Imm & 1) NewImm \|= 0x0a;
7809	if (Imm & 2) NewImm \|= 0xa0;
7810	MI.getOperand(3).setImm(NewImm);
7811	MI.setDesc(get(X86::SHUFPSrri));
7812	}
7813	return true;
7814	}
7815	}
7816	return false;
7817	}
7818
7819	std::pair<uint16_t, uint16_t>
7820	X86InstrInfo::getExecutionDomain(const MachineInstr &MI) const {
7821	uint16_t domain = (MI.getDesc().TSFlags >> X86II::SSEDomainShift) & 3;
7822	unsigned opcode = MI.getOpcode();
7823	uint16_t validDomains = 0;
7824	if (domain) {
7825	// Attempt to match for custom instructions.
7826	validDomains = getExecutionDomainCustom(MI);
7827	if (validDomains)
7828	return std::make_pair(domain, validDomains);
7829
7830	if (lookup(opcode, domain, ReplaceableInstrs)) {
7831	validDomains = 0xe;
7832	} else if (lookup(opcode, domain, ReplaceableInstrsAVX2)) {
7833	validDomains = Subtarget.hasAVX2() ? 0xe : 0x6;
7834	} else if (lookup(opcode, domain, ReplaceableInstrsFP)) {
7835	validDomains = 0x6;
7836	} else if (lookup(opcode, domain, ReplaceableInstrsAVX2InsertExtract)) {
7837	// Insert/extract instructions should only effect domain if AVX2
7838	// is enabled.
7839	if (!Subtarget.hasAVX2())
7840	return std::make_pair(0, 0);
7841	validDomains = 0xe;
7842	} else if (lookupAVX512(opcode, domain, ReplaceableInstrsAVX512)) {
7843	validDomains = 0xe;
7844	} else if (Subtarget.hasDQI() && lookupAVX512(opcode, domain,
7845	ReplaceableInstrsAVX512DQ)) {
7846	validDomains = 0xe;
7847	} else if (Subtarget.hasDQI()) {
7848	if (const uint16_t *table = lookupAVX512(opcode, domain,
7849	ReplaceableInstrsAVX512DQMasked)) {
7850	if (domain == 1 \|\| (domain == 3 && table[3] == opcode))
7851	validDomains = 0xa;
7852	else
7853	validDomains = 0xc;
7854	}
7855	}
7856	}
7857	return std::make_pair(domain, validDomains);
7858	}
7859
7860	void X86InstrInfo::setExecutionDomain(MachineInstr &MI, unsigned Domain) const {
7861	assert(Domain>0 && Domain<4 && "Invalid execution domain")(static_cast <bool> (Domain>0 && Domain<4 && "Invalid execution domain") ? void (0) : __assert_fail ("Domain>0 && Domain<4 && \"Invalid execution domain\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7861, __extension__ __PRETTY_FUNCTION__));
7862	uint16_t dom = (MI.getDesc().TSFlags >> X86II::SSEDomainShift) & 3;
7863	assert(dom && "Not an SSE instruction")(static_cast <bool> (dom && "Not an SSE instruction" ) ? void (0) : __assert_fail ("dom && \"Not an SSE instruction\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7863, __extension__ __PRETTY_FUNCTION__));
7864
7865	// Attempt to match for custom instructions.
7866	if (setExecutionDomainCustom(MI, Domain))
7867	return;
7868
7869	const uint16_t *table = lookup(MI.getOpcode(), dom, ReplaceableInstrs);
7870	if (!table) { // try the other table
7871	assert((Subtarget.hasAVX2() \|\| Domain < 3) &&(static_cast <bool> ((Subtarget.hasAVX2() \|\| Domain < 3) && "256-bit vector operations only available in AVX2" ) ? void (0) : __assert_fail ("(Subtarget.hasAVX2() \|\| Domain < 3) && \"256-bit vector operations only available in AVX2\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7872, __extension__ __PRETTY_FUNCTION__))
7872	"256-bit vector operations only available in AVX2")(static_cast <bool> ((Subtarget.hasAVX2() \|\| Domain < 3) && "256-bit vector operations only available in AVX2" ) ? void (0) : __assert_fail ("(Subtarget.hasAVX2() \|\| Domain < 3) && \"256-bit vector operations only available in AVX2\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7872, __extension__ __PRETTY_FUNCTION__));
7873	table = lookup(MI.getOpcode(), dom, ReplaceableInstrsAVX2);
7874	}
7875	if (!table) { // try the FP table
7876	table = lookup(MI.getOpcode(), dom, ReplaceableInstrsFP);
7877	assert((!table \|\| Domain < 3) &&(static_cast <bool> ((!table \|\| Domain < 3) && "Can only select PackedSingle or PackedDouble") ? void (0) : __assert_fail ("(!table \|\| Domain < 3) && \"Can only select PackedSingle or PackedDouble\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7878, __extension__ __PRETTY_FUNCTION__))
7878	"Can only select PackedSingle or PackedDouble")(static_cast <bool> ((!table \|\| Domain < 3) && "Can only select PackedSingle or PackedDouble") ? void (0) : __assert_fail ("(!table \|\| Domain < 3) && \"Can only select PackedSingle or PackedDouble\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7878, __extension__ __PRETTY_FUNCTION__));
7879	}
7880	if (!table) { // try the other table
7881	assert(Subtarget.hasAVX2() &&(static_cast <bool> (Subtarget.hasAVX2() && "256-bit insert/extract only available in AVX2" ) ? void (0) : __assert_fail ("Subtarget.hasAVX2() && \"256-bit insert/extract only available in AVX2\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7882, __extension__ __PRETTY_FUNCTION__))
7882	"256-bit insert/extract only available in AVX2")(static_cast <bool> (Subtarget.hasAVX2() && "256-bit insert/extract only available in AVX2" ) ? void (0) : __assert_fail ("Subtarget.hasAVX2() && \"256-bit insert/extract only available in AVX2\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7882, __extension__ __PRETTY_FUNCTION__));
7883	table = lookup(MI.getOpcode(), dom, ReplaceableInstrsAVX2InsertExtract);
7884	}
7885	if (!table) { // try the AVX512 table
7886	assert(Subtarget.hasAVX512() && "Requires AVX-512")(static_cast <bool> (Subtarget.hasAVX512() && "Requires AVX-512" ) ? void (0) : __assert_fail ("Subtarget.hasAVX512() && \"Requires AVX-512\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7886, __extension__ __PRETTY_FUNCTION__));
7887	table = lookupAVX512(MI.getOpcode(), dom, ReplaceableInstrsAVX512);
7888	// Don't change integer Q instructions to D instructions.
7889	if (table && Domain == 3 && table[3] == MI.getOpcode())
7890	Domain = 4;
7891	}
7892	if (!table) { // try the AVX512DQ table
7893	assert((Subtarget.hasDQI() \|\| Domain >= 3) && "Requires AVX-512DQ")(static_cast <bool> ((Subtarget.hasDQI() \|\| Domain >= 3) && "Requires AVX-512DQ") ? void (0) : __assert_fail ("(Subtarget.hasDQI() \|\| Domain >= 3) && \"Requires AVX-512DQ\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7893, __extension__ __PRETTY_FUNCTION__));
7894	table = lookupAVX512(MI.getOpcode(), dom, ReplaceableInstrsAVX512DQ);
7895	// Don't change integer Q instructions to D instructions and
7896	// use D instructions if we started with a PS instruction.
7897	if (table && Domain == 3 && (dom == 1 \|\| table[3] == MI.getOpcode()))
7898	Domain = 4;
7899	}
7900	if (!table) { // try the AVX512DQMasked table
7901	assert((Subtarget.hasDQI() \|\| Domain >= 3) && "Requires AVX-512DQ")(static_cast <bool> ((Subtarget.hasDQI() \|\| Domain >= 3) && "Requires AVX-512DQ") ? void (0) : __assert_fail ("(Subtarget.hasDQI() \|\| Domain >= 3) && \"Requires AVX-512DQ\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7901, __extension__ __PRETTY_FUNCTION__));
7902	table = lookupAVX512(MI.getOpcode(), dom, ReplaceableInstrsAVX512DQMasked);
7903	if (table && Domain == 3 && (dom == 1 \|\| table[3] == MI.getOpcode()))
7904	Domain = 4;
7905	}
7906	assert(table && "Cannot change domain")(static_cast <bool> (table && "Cannot change domain" ) ? void (0) : __assert_fail ("table && \"Cannot change domain\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 7906, __extension__ __PRETTY_FUNCTION__));
7907	MI.setDesc(get(table[Domain - 1]));
7908	}
7909
7910	/// Return the noop instruction to use for a noop.
7911	MCInst X86InstrInfo::getNop() const {
7912	MCInst Nop;
7913	Nop.setOpcode(X86::NOOP);
7914	return Nop;
7915	}
7916
7917	bool X86InstrInfo::isHighLatencyDef(int opc) const {
7918	switch (opc) {
7919	default: return false;
7920	case X86::DIVPDrm:
7921	case X86::DIVPDrr:
7922	case X86::DIVPSrm:
7923	case X86::DIVPSrr:
7924	case X86::DIVSDrm:
7925	case X86::DIVSDrm_Int:
7926	case X86::DIVSDrr:
7927	case X86::DIVSDrr_Int:
7928	case X86::DIVSSrm:
7929	case X86::DIVSSrm_Int:
7930	case X86::DIVSSrr:
7931	case X86::DIVSSrr_Int:
7932	case X86::SQRTPDm:
7933	case X86::SQRTPDr:
7934	case X86::SQRTPSm:
7935	case X86::SQRTPSr:
7936	case X86::SQRTSDm:
7937	case X86::SQRTSDm_Int:
7938	case X86::SQRTSDr:
7939	case X86::SQRTSDr_Int:
7940	case X86::SQRTSSm:
7941	case X86::SQRTSSm_Int:
7942	case X86::SQRTSSr:
7943	case X86::SQRTSSr_Int:
7944	// AVX instructions with high latency
7945	case X86::VDIVPDrm:
7946	case X86::VDIVPDrr:
7947	case X86::VDIVPDYrm:
7948	case X86::VDIVPDYrr:
7949	case X86::VDIVPSrm:
7950	case X86::VDIVPSrr:
7951	case X86::VDIVPSYrm:
7952	case X86::VDIVPSYrr:
7953	case X86::VDIVSDrm:
7954	case X86::VDIVSDrm_Int:
7955	case X86::VDIVSDrr:
7956	case X86::VDIVSDrr_Int:
7957	case X86::VDIVSSrm:
7958	case X86::VDIVSSrm_Int:
7959	case X86::VDIVSSrr:
7960	case X86::VDIVSSrr_Int:
7961	case X86::VSQRTPDm:
7962	case X86::VSQRTPDr:
7963	case X86::VSQRTPDYm:
7964	case X86::VSQRTPDYr:
7965	case X86::VSQRTPSm:
7966	case X86::VSQRTPSr:
7967	case X86::VSQRTPSYm:
7968	case X86::VSQRTPSYr:
7969	case X86::VSQRTSDm:
7970	case X86::VSQRTSDm_Int:
7971	case X86::VSQRTSDr:
7972	case X86::VSQRTSDr_Int:
7973	case X86::VSQRTSSm:
7974	case X86::VSQRTSSm_Int:
7975	case X86::VSQRTSSr:
7976	case X86::VSQRTSSr_Int:
7977	// AVX512 instructions with high latency
7978	case X86::VDIVPDZ128rm:
7979	case X86::VDIVPDZ128rmb:
7980	case X86::VDIVPDZ128rmbk:
7981	case X86::VDIVPDZ128rmbkz:
7982	case X86::VDIVPDZ128rmk:
7983	case X86::VDIVPDZ128rmkz:
7984	case X86::VDIVPDZ128rr:
7985	case X86::VDIVPDZ128rrk:
7986	case X86::VDIVPDZ128rrkz:
7987	case X86::VDIVPDZ256rm:
7988	case X86::VDIVPDZ256rmb:
7989	case X86::VDIVPDZ256rmbk:
7990	case X86::VDIVPDZ256rmbkz:
7991	case X86::VDIVPDZ256rmk:
7992	case X86::VDIVPDZ256rmkz:
7993	case X86::VDIVPDZ256rr:
7994	case X86::VDIVPDZ256rrk:
7995	case X86::VDIVPDZ256rrkz:
7996	case X86::VDIVPDZrrb:
7997	case X86::VDIVPDZrrbk:
7998	case X86::VDIVPDZrrbkz:
7999	case X86::VDIVPDZrm:
8000	case X86::VDIVPDZrmb:
8001	case X86::VDIVPDZrmbk:
8002	case X86::VDIVPDZrmbkz:
8003	case X86::VDIVPDZrmk:
8004	case X86::VDIVPDZrmkz:
8005	case X86::VDIVPDZrr:
8006	case X86::VDIVPDZrrk:
8007	case X86::VDIVPDZrrkz:
8008	case X86::VDIVPSZ128rm:
8009	case X86::VDIVPSZ128rmb:
8010	case X86::VDIVPSZ128rmbk:
8011	case X86::VDIVPSZ128rmbkz:
8012	case X86::VDIVPSZ128rmk:
8013	case X86::VDIVPSZ128rmkz:
8014	case X86::VDIVPSZ128rr:
8015	case X86::VDIVPSZ128rrk:
8016	case X86::VDIVPSZ128rrkz:
8017	case X86::VDIVPSZ256rm:
8018	case X86::VDIVPSZ256rmb:
8019	case X86::VDIVPSZ256rmbk:
8020	case X86::VDIVPSZ256rmbkz:
8021	case X86::VDIVPSZ256rmk:
8022	case X86::VDIVPSZ256rmkz:
8023	case X86::VDIVPSZ256rr:
8024	case X86::VDIVPSZ256rrk:
8025	case X86::VDIVPSZ256rrkz:
8026	case X86::VDIVPSZrrb:
8027	case X86::VDIVPSZrrbk:
8028	case X86::VDIVPSZrrbkz:
8029	case X86::VDIVPSZrm:
8030	case X86::VDIVPSZrmb:
8031	case X86::VDIVPSZrmbk:
8032	case X86::VDIVPSZrmbkz:
8033	case X86::VDIVPSZrmk:
8034	case X86::VDIVPSZrmkz:
8035	case X86::VDIVPSZrr:
8036	case X86::VDIVPSZrrk:
8037	case X86::VDIVPSZrrkz:
8038	case X86::VDIVSDZrm:
8039	case X86::VDIVSDZrr:
8040	case X86::VDIVSDZrm_Int:
8041	case X86::VDIVSDZrm_Intk:
8042	case X86::VDIVSDZrm_Intkz:
8043	case X86::VDIVSDZrr_Int:
8044	case X86::VDIVSDZrr_Intk:
8045	case X86::VDIVSDZrr_Intkz:
8046	case X86::VDIVSDZrrb_Int:
8047	case X86::VDIVSDZrrb_Intk:
8048	case X86::VDIVSDZrrb_Intkz:
8049	case X86::VDIVSSZrm:
8050	case X86::VDIVSSZrr:
8051	case X86::VDIVSSZrm_Int:
8052	case X86::VDIVSSZrm_Intk:
8053	case X86::VDIVSSZrm_Intkz:
8054	case X86::VDIVSSZrr_Int:
8055	case X86::VDIVSSZrr_Intk:
8056	case X86::VDIVSSZrr_Intkz:
8057	case X86::VDIVSSZrrb_Int:
8058	case X86::VDIVSSZrrb_Intk:
8059	case X86::VDIVSSZrrb_Intkz:
8060	case X86::VSQRTPDZ128m:
8061	case X86::VSQRTPDZ128mb:
8062	case X86::VSQRTPDZ128mbk:
8063	case X86::VSQRTPDZ128mbkz:
8064	case X86::VSQRTPDZ128mk:
8065	case X86::VSQRTPDZ128mkz:
8066	case X86::VSQRTPDZ128r:
8067	case X86::VSQRTPDZ128rk:
8068	case X86::VSQRTPDZ128rkz:
8069	case X86::VSQRTPDZ256m:
8070	case X86::VSQRTPDZ256mb:
8071	case X86::VSQRTPDZ256mbk:
8072	case X86::VSQRTPDZ256mbkz:
8073	case X86::VSQRTPDZ256mk:
8074	case X86::VSQRTPDZ256mkz:
8075	case X86::VSQRTPDZ256r:
8076	case X86::VSQRTPDZ256rk:
8077	case X86::VSQRTPDZ256rkz:
8078	case X86::VSQRTPDZm:
8079	case X86::VSQRTPDZmb:
8080	case X86::VSQRTPDZmbk:
8081	case X86::VSQRTPDZmbkz:
8082	case X86::VSQRTPDZmk:
8083	case X86::VSQRTPDZmkz:
8084	case X86::VSQRTPDZr:
8085	case X86::VSQRTPDZrb:
8086	case X86::VSQRTPDZrbk:
8087	case X86::VSQRTPDZrbkz:
8088	case X86::VSQRTPDZrk:
8089	case X86::VSQRTPDZrkz:
8090	case X86::VSQRTPSZ128m:
8091	case X86::VSQRTPSZ128mb:
8092	case X86::VSQRTPSZ128mbk:
8093	case X86::VSQRTPSZ128mbkz:
8094	case X86::VSQRTPSZ128mk:
8095	case X86::VSQRTPSZ128mkz:
8096	case X86::VSQRTPSZ128r:
8097	case X86::VSQRTPSZ128rk:
8098	case X86::VSQRTPSZ128rkz:
8099	case X86::VSQRTPSZ256m:
8100	case X86::VSQRTPSZ256mb:
8101	case X86::VSQRTPSZ256mbk:
8102	case X86::VSQRTPSZ256mbkz:
8103	case X86::VSQRTPSZ256mk:
8104	case X86::VSQRTPSZ256mkz:
8105	case X86::VSQRTPSZ256r:
8106	case X86::VSQRTPSZ256rk:
8107	case X86::VSQRTPSZ256rkz:
8108	case X86::VSQRTPSZm:
8109	case X86::VSQRTPSZmb:
8110	case X86::VSQRTPSZmbk:
8111	case X86::VSQRTPSZmbkz:
8112	case X86::VSQRTPSZmk:
8113	case X86::VSQRTPSZmkz:
8114	case X86::VSQRTPSZr:
8115	case X86::VSQRTPSZrb:
8116	case X86::VSQRTPSZrbk:
8117	case X86::VSQRTPSZrbkz:
8118	case X86::VSQRTPSZrk:
8119	case X86::VSQRTPSZrkz:
8120	case X86::VSQRTSDZm:
8121	case X86::VSQRTSDZm_Int:
8122	case X86::VSQRTSDZm_Intk:
8123	case X86::VSQRTSDZm_Intkz:
8124	case X86::VSQRTSDZr:
8125	case X86::VSQRTSDZr_Int:
8126	case X86::VSQRTSDZr_Intk:
8127	case X86::VSQRTSDZr_Intkz:
8128	case X86::VSQRTSDZrb_Int:
8129	case X86::VSQRTSDZrb_Intk:
8130	case X86::VSQRTSDZrb_Intkz:
8131	case X86::VSQRTSSZm:
8132	case X86::VSQRTSSZm_Int:
8133	case X86::VSQRTSSZm_Intk:
8134	case X86::VSQRTSSZm_Intkz:
8135	case X86::VSQRTSSZr:
8136	case X86::VSQRTSSZr_Int:
8137	case X86::VSQRTSSZr_Intk:
8138	case X86::VSQRTSSZr_Intkz:
8139	case X86::VSQRTSSZrb_Int:
8140	case X86::VSQRTSSZrb_Intk:
8141	case X86::VSQRTSSZrb_Intkz:
8142
8143	case X86::VGATHERDPDYrm:
8144	case X86::VGATHERDPDZ128rm:
8145	case X86::VGATHERDPDZ256rm:
8146	case X86::VGATHERDPDZrm:
8147	case X86::VGATHERDPDrm:
8148	case X86::VGATHERDPSYrm:
8149	case X86::VGATHERDPSZ128rm:
8150	case X86::VGATHERDPSZ256rm:
8151	case X86::VGATHERDPSZrm:
8152	case X86::VGATHERDPSrm:
8153	case X86::VGATHERPF0DPDm:
8154	case X86::VGATHERPF0DPSm:
8155	case X86::VGATHERPF0QPDm:
8156	case X86::VGATHERPF0QPSm:
8157	case X86::VGATHERPF1DPDm:
8158	case X86::VGATHERPF1DPSm:
8159	case X86::VGATHERPF1QPDm:
8160	case X86::VGATHERPF1QPSm:
8161	case X86::VGATHERQPDYrm:
8162	case X86::VGATHERQPDZ128rm:
8163	case X86::VGATHERQPDZ256rm:
8164	case X86::VGATHERQPDZrm:
8165	case X86::VGATHERQPDrm:
8166	case X86::VGATHERQPSYrm:
8167	case X86::VGATHERQPSZ128rm:
8168	case X86::VGATHERQPSZ256rm:
8169	case X86::VGATHERQPSZrm:
8170	case X86::VGATHERQPSrm:
8171	case X86::VPGATHERDDYrm:
8172	case X86::VPGATHERDDZ128rm:
8173	case X86::VPGATHERDDZ256rm:
8174	case X86::VPGATHERDDZrm:
8175	case X86::VPGATHERDDrm:
8176	case X86::VPGATHERDQYrm:
8177	case X86::VPGATHERDQZ128rm:
8178	case X86::VPGATHERDQZ256rm:
8179	case X86::VPGATHERDQZrm:
8180	case X86::VPGATHERDQrm:
8181	case X86::VPGATHERQDYrm:
8182	case X86::VPGATHERQDZ128rm:
8183	case X86::VPGATHERQDZ256rm:
8184	case X86::VPGATHERQDZrm:
8185	case X86::VPGATHERQDrm:
8186	case X86::VPGATHERQQYrm:
8187	case X86::VPGATHERQQZ128rm:
8188	case X86::VPGATHERQQZ256rm:
8189	case X86::VPGATHERQQZrm:
8190	case X86::VPGATHERQQrm:
8191	case X86::VSCATTERDPDZ128mr:
8192	case X86::VSCATTERDPDZ256mr:
8193	case X86::VSCATTERDPDZmr:
8194	case X86::VSCATTERDPSZ128mr:
8195	case X86::VSCATTERDPSZ256mr:
8196	case X86::VSCATTERDPSZmr:
8197	case X86::VSCATTERPF0DPDm:
8198	case X86::VSCATTERPF0DPSm:
8199	case X86::VSCATTERPF0QPDm:
8200	case X86::VSCATTERPF0QPSm:
8201	case X86::VSCATTERPF1DPDm:
8202	case X86::VSCATTERPF1DPSm:
8203	case X86::VSCATTERPF1QPDm:
8204	case X86::VSCATTERPF1QPSm:
8205	case X86::VSCATTERQPDZ128mr:
8206	case X86::VSCATTERQPDZ256mr:
8207	case X86::VSCATTERQPDZmr:
8208	case X86::VSCATTERQPSZ128mr:
8209	case X86::VSCATTERQPSZ256mr:
8210	case X86::VSCATTERQPSZmr:
8211	case X86::VPSCATTERDDZ128mr:
8212	case X86::VPSCATTERDDZ256mr:
8213	case X86::VPSCATTERDDZmr:
8214	case X86::VPSCATTERDQZ128mr:
8215	case X86::VPSCATTERDQZ256mr:
8216	case X86::VPSCATTERDQZmr:
8217	case X86::VPSCATTERQDZ128mr:
8218	case X86::VPSCATTERQDZ256mr:
8219	case X86::VPSCATTERQDZmr:
8220	case X86::VPSCATTERQQZ128mr:
8221	case X86::VPSCATTERQQZ256mr:
8222	case X86::VPSCATTERQQZmr:
8223	return true;
8224	}
8225	}
8226
8227	bool X86InstrInfo::hasHighOperandLatency(const TargetSchedModel &SchedModel,
8228	const MachineRegisterInfo *MRI,
8229	const MachineInstr &DefMI,
8230	unsigned DefIdx,
8231	const MachineInstr &UseMI,
8232	unsigned UseIdx) const {
8233	return isHighLatencyDef(DefMI.getOpcode());
8234	}
8235
8236	bool X86InstrInfo::hasReassociableOperands(const MachineInstr &Inst,
8237	const MachineBasicBlock *MBB) const {
8238	assert(Inst.getNumExplicitOperands() == 3 && Inst.getNumExplicitDefs() == 1 &&(static_cast <bool> (Inst.getNumExplicitOperands() == 3 && Inst.getNumExplicitDefs() == 1 && Inst.getNumDefs () <= 2 && "Reassociation needs binary operators") ? void (0) : __assert_fail ("Inst.getNumExplicitOperands() == 3 && Inst.getNumExplicitDefs() == 1 && Inst.getNumDefs() <= 2 && \"Reassociation needs binary operators\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8239, __extension__ __PRETTY_FUNCTION__))
8239	Inst.getNumDefs() <= 2 && "Reassociation needs binary operators")(static_cast <bool> (Inst.getNumExplicitOperands() == 3 && Inst.getNumExplicitDefs() == 1 && Inst.getNumDefs () <= 2 && "Reassociation needs binary operators") ? void (0) : __assert_fail ("Inst.getNumExplicitOperands() == 3 && Inst.getNumExplicitDefs() == 1 && Inst.getNumDefs() <= 2 && \"Reassociation needs binary operators\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8239, __extension__ __PRETTY_FUNCTION__));
8240
8241	// Integer binary math/logic instructions have a third source operand:
8242	// the EFLAGS register. That operand must be both defined here and never
8243	// used; ie, it must be dead. If the EFLAGS operand is live, then we can
8244	// not change anything because rearranging the operands could affect other
8245	// instructions that depend on the exact status flags (zero, sign, etc.)
8246	// that are set by using these particular operands with this operation.
8247	const MachineOperand *FlagDef = Inst.findRegisterDefOperand(X86::EFLAGS);
8248	assert((Inst.getNumDefs() == 1 \|\| FlagDef) &&(static_cast <bool> ((Inst.getNumDefs() == 1 \|\| FlagDef ) && "Implicit def isn't flags?") ? void (0) : __assert_fail ("(Inst.getNumDefs() == 1 \|\| FlagDef) && \"Implicit def isn't flags?\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8249, __extension__ __PRETTY_FUNCTION__))
8249	"Implicit def isn't flags?")(static_cast <bool> ((Inst.getNumDefs() == 1 \|\| FlagDef ) && "Implicit def isn't flags?") ? void (0) : __assert_fail ("(Inst.getNumDefs() == 1 \|\| FlagDef) && \"Implicit def isn't flags?\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8249, __extension__ __PRETTY_FUNCTION__));
8250	if (FlagDef && !FlagDef->isDead())
8251	return false;
8252
8253	return TargetInstrInfo::hasReassociableOperands(Inst, MBB);
8254	}
8255
8256	// TODO: There are many more machine instruction opcodes to match:
8257	// 1. Other data types (integer, vectors)
8258	// 2. Other math / logic operations (xor, or)
8259	// 3. Other forms of the same operation (intrinsics and other variants)
8260	bool X86InstrInfo::isAssociativeAndCommutative(const MachineInstr &Inst) const {
8261	switch (Inst.getOpcode()) {
8262	case X86::AND8rr:
8263	case X86::AND16rr:
8264	case X86::AND32rr:
8265	case X86::AND64rr:
8266	case X86::OR8rr:
8267	case X86::OR16rr:
8268	case X86::OR32rr:
8269	case X86::OR64rr:
8270	case X86::XOR8rr:
8271	case X86::XOR16rr:
8272	case X86::XOR32rr:
8273	case X86::XOR64rr:
8274	case X86::IMUL16rr:
8275	case X86::IMUL32rr:
8276	case X86::IMUL64rr:
8277	case X86::PANDrr:
8278	case X86::PORrr:
8279	case X86::PXORrr:
8280	case X86::ANDPDrr:
8281	case X86::ANDPSrr:
8282	case X86::ORPDrr:
8283	case X86::ORPSrr:
8284	case X86::XORPDrr:
8285	case X86::XORPSrr:
8286	case X86::PADDBrr:
8287	case X86::PADDWrr:
8288	case X86::PADDDrr:
8289	case X86::PADDQrr:
8290	case X86::PMULLWrr:
8291	case X86::PMULLDrr:
8292	case X86::PMAXSBrr:
8293	case X86::PMAXSDrr:
8294	case X86::PMAXSWrr:
8295	case X86::PMAXUBrr:
8296	case X86::PMAXUDrr:
8297	case X86::PMAXUWrr:
8298	case X86::PMINSBrr:
8299	case X86::PMINSDrr:
8300	case X86::PMINSWrr:
8301	case X86::PMINUBrr:
8302	case X86::PMINUDrr:
8303	case X86::PMINUWrr:
8304	case X86::VPANDrr:
8305	case X86::VPANDYrr:
8306	case X86::VPANDDZ128rr:
8307	case X86::VPANDDZ256rr:
8308	case X86::VPANDDZrr:
8309	case X86::VPANDQZ128rr:
8310	case X86::VPANDQZ256rr:
8311	case X86::VPANDQZrr:
8312	case X86::VPORrr:
8313	case X86::VPORYrr:
8314	case X86::VPORDZ128rr:
8315	case X86::VPORDZ256rr:
8316	case X86::VPORDZrr:
8317	case X86::VPORQZ128rr:
8318	case X86::VPORQZ256rr:
8319	case X86::VPORQZrr:
8320	case X86::VPXORrr:
8321	case X86::VPXORYrr:
8322	case X86::VPXORDZ128rr:
8323	case X86::VPXORDZ256rr:
8324	case X86::VPXORDZrr:
8325	case X86::VPXORQZ128rr:
8326	case X86::VPXORQZ256rr:
8327	case X86::VPXORQZrr:
8328	case X86::VANDPDrr:
8329	case X86::VANDPSrr:
8330	case X86::VANDPDYrr:
8331	case X86::VANDPSYrr:
8332	case X86::VANDPDZ128rr:
8333	case X86::VANDPSZ128rr:
8334	case X86::VANDPDZ256rr:
8335	case X86::VANDPSZ256rr:
8336	case X86::VANDPDZrr:
8337	case X86::VANDPSZrr:
8338	case X86::VORPDrr:
8339	case X86::VORPSrr:
8340	case X86::VORPDYrr:
8341	case X86::VORPSYrr:
8342	case X86::VORPDZ128rr:
8343	case X86::VORPSZ128rr:
8344	case X86::VORPDZ256rr:
8345	case X86::VORPSZ256rr:
8346	case X86::VORPDZrr:
8347	case X86::VORPSZrr:
8348	case X86::VXORPDrr:
8349	case X86::VXORPSrr:
8350	case X86::VXORPDYrr:
8351	case X86::VXORPSYrr:
8352	case X86::VXORPDZ128rr:
8353	case X86::VXORPSZ128rr:
8354	case X86::VXORPDZ256rr:
8355	case X86::VXORPSZ256rr:
8356	case X86::VXORPDZrr:
8357	case X86::VXORPSZrr:
8358	case X86::KADDBrr:
8359	case X86::KADDWrr:
8360	case X86::KADDDrr:
8361	case X86::KADDQrr:
8362	case X86::KANDBrr:
8363	case X86::KANDWrr:
8364	case X86::KANDDrr:
8365	case X86::KANDQrr:
8366	case X86::KORBrr:
8367	case X86::KORWrr:
8368	case X86::KORDrr:
8369	case X86::KORQrr:
8370	case X86::KXORBrr:
8371	case X86::KXORWrr:
8372	case X86::KXORDrr:
8373	case X86::KXORQrr:
8374	case X86::VPADDBrr:
8375	case X86::VPADDWrr:
8376	case X86::VPADDDrr:
8377	case X86::VPADDQrr:
8378	case X86::VPADDBYrr:
8379	case X86::VPADDWYrr:
8380	case X86::VPADDDYrr:
8381	case X86::VPADDQYrr:
8382	case X86::VPADDBZ128rr:
8383	case X86::VPADDWZ128rr:
8384	case X86::VPADDDZ128rr:
8385	case X86::VPADDQZ128rr:
8386	case X86::VPADDBZ256rr:
8387	case X86::VPADDWZ256rr:
8388	case X86::VPADDDZ256rr:
8389	case X86::VPADDQZ256rr:
8390	case X86::VPADDBZrr:
8391	case X86::VPADDWZrr:
8392	case X86::VPADDDZrr:
8393	case X86::VPADDQZrr:
8394	case X86::VPMULLWrr:
8395	case X86::VPMULLWYrr:
8396	case X86::VPMULLWZ128rr:
8397	case X86::VPMULLWZ256rr:
8398	case X86::VPMULLWZrr:
8399	case X86::VPMULLDrr:
8400	case X86::VPMULLDYrr:
8401	case X86::VPMULLDZ128rr:
8402	case X86::VPMULLDZ256rr:
8403	case X86::VPMULLDZrr:
8404	case X86::VPMULLQZ128rr:
8405	case X86::VPMULLQZ256rr:
8406	case X86::VPMULLQZrr:
8407	case X86::VPMAXSBrr:
8408	case X86::VPMAXSBYrr:
8409	case X86::VPMAXSBZ128rr:
8410	case X86::VPMAXSBZ256rr:
8411	case X86::VPMAXSBZrr:
8412	case X86::VPMAXSDrr:
8413	case X86::VPMAXSDYrr:
8414	case X86::VPMAXSDZ128rr:
8415	case X86::VPMAXSDZ256rr:
8416	case X86::VPMAXSDZrr:
8417	case X86::VPMAXSQZ128rr:
8418	case X86::VPMAXSQZ256rr:
8419	case X86::VPMAXSQZrr:
8420	case X86::VPMAXSWrr:
8421	case X86::VPMAXSWYrr:
8422	case X86::VPMAXSWZ128rr:
8423	case X86::VPMAXSWZ256rr:
8424	case X86::VPMAXSWZrr:
8425	case X86::VPMAXUBrr:
8426	case X86::VPMAXUBYrr:
8427	case X86::VPMAXUBZ128rr:
8428	case X86::VPMAXUBZ256rr:
8429	case X86::VPMAXUBZrr:
8430	case X86::VPMAXUDrr:
8431	case X86::VPMAXUDYrr:
8432	case X86::VPMAXUDZ128rr:
8433	case X86::VPMAXUDZ256rr:
8434	case X86::VPMAXUDZrr:
8435	case X86::VPMAXUQZ128rr:
8436	case X86::VPMAXUQZ256rr:
8437	case X86::VPMAXUQZrr:
8438	case X86::VPMAXUWrr:
8439	case X86::VPMAXUWYrr:
8440	case X86::VPMAXUWZ128rr:
8441	case X86::VPMAXUWZ256rr:
8442	case X86::VPMAXUWZrr:
8443	case X86::VPMINSBrr:
8444	case X86::VPMINSBYrr:
8445	case X86::VPMINSBZ128rr:
8446	case X86::VPMINSBZ256rr:
8447	case X86::VPMINSBZrr:
8448	case X86::VPMINSDrr:
8449	case X86::VPMINSDYrr:
8450	case X86::VPMINSDZ128rr:
8451	case X86::VPMINSDZ256rr:
8452	case X86::VPMINSDZrr:
8453	case X86::VPMINSQZ128rr:
8454	case X86::VPMINSQZ256rr:
8455	case X86::VPMINSQZrr:
8456	case X86::VPMINSWrr:
8457	case X86::VPMINSWYrr:
8458	case X86::VPMINSWZ128rr:
8459	case X86::VPMINSWZ256rr:
8460	case X86::VPMINSWZrr:
8461	case X86::VPMINUBrr:
8462	case X86::VPMINUBYrr:
8463	case X86::VPMINUBZ128rr:
8464	case X86::VPMINUBZ256rr:
8465	case X86::VPMINUBZrr:
8466	case X86::VPMINUDrr:
8467	case X86::VPMINUDYrr:
8468	case X86::VPMINUDZ128rr:
8469	case X86::VPMINUDZ256rr:
8470	case X86::VPMINUDZrr:
8471	case X86::VPMINUQZ128rr:
8472	case X86::VPMINUQZ256rr:
8473	case X86::VPMINUQZrr:
8474	case X86::VPMINUWrr:
8475	case X86::VPMINUWYrr:
8476	case X86::VPMINUWZ128rr:
8477	case X86::VPMINUWZ256rr:
8478	case X86::VPMINUWZrr:
8479	// Normal min/max instructions are not commutative because of NaN and signed
8480	// zero semantics, but these are. Thus, there's no need to check for global
8481	// relaxed math; the instructions themselves have the properties we need.
8482	case X86::MAXCPDrr:
8483	case X86::MAXCPSrr:
8484	case X86::MAXCSDrr:
8485	case X86::MAXCSSrr:
8486	case X86::MINCPDrr:
8487	case X86::MINCPSrr:
8488	case X86::MINCSDrr:
8489	case X86::MINCSSrr:
8490	case X86::VMAXCPDrr:
8491	case X86::VMAXCPSrr:
8492	case X86::VMAXCPDYrr:
8493	case X86::VMAXCPSYrr:
8494	case X86::VMAXCPDZ128rr:
8495	case X86::VMAXCPSZ128rr:
8496	case X86::VMAXCPDZ256rr:
8497	case X86::VMAXCPSZ256rr:
8498	case X86::VMAXCPDZrr:
8499	case X86::VMAXCPSZrr:
8500	case X86::VMAXCSDrr:
8501	case X86::VMAXCSSrr:
8502	case X86::VMAXCSDZrr:
8503	case X86::VMAXCSSZrr:
8504	case X86::VMINCPDrr:
8505	case X86::VMINCPSrr:
8506	case X86::VMINCPDYrr:
8507	case X86::VMINCPSYrr:
8508	case X86::VMINCPDZ128rr:
8509	case X86::VMINCPSZ128rr:
8510	case X86::VMINCPDZ256rr:
8511	case X86::VMINCPSZ256rr:
8512	case X86::VMINCPDZrr:
8513	case X86::VMINCPSZrr:
8514	case X86::VMINCSDrr:
8515	case X86::VMINCSSrr:
8516	case X86::VMINCSDZrr:
8517	case X86::VMINCSSZrr:
8518	case X86::VMAXCPHZ128rr:
8519	case X86::VMAXCPHZ256rr:
8520	case X86::VMAXCPHZrr:
8521	case X86::VMAXCSHZrr:
8522	case X86::VMINCPHZ128rr:
8523	case X86::VMINCPHZ256rr:
8524	case X86::VMINCPHZrr:
8525	case X86::VMINCSHZrr:
8526	return true;
8527	case X86::ADDPDrr:
8528	case X86::ADDPSrr:
8529	case X86::ADDSDrr:
8530	case X86::ADDSSrr:
8531	case X86::MULPDrr:
8532	case X86::MULPSrr:
8533	case X86::MULSDrr:
8534	case X86::MULSSrr:
8535	case X86::VADDPDrr:
8536	case X86::VADDPSrr:
8537	case X86::VADDPDYrr:
8538	case X86::VADDPSYrr:
8539	case X86::VADDPDZ128rr:
8540	case X86::VADDPSZ128rr:
8541	case X86::VADDPDZ256rr:
8542	case X86::VADDPSZ256rr:
8543	case X86::VADDPDZrr:
8544	case X86::VADDPSZrr:
8545	case X86::VADDSDrr:
8546	case X86::VADDSSrr:
8547	case X86::VADDSDZrr:
8548	case X86::VADDSSZrr:
8549	case X86::VMULPDrr:
8550	case X86::VMULPSrr:
8551	case X86::VMULPDYrr:
8552	case X86::VMULPSYrr:
8553	case X86::VMULPDZ128rr:
8554	case X86::VMULPSZ128rr:
8555	case X86::VMULPDZ256rr:
8556	case X86::VMULPSZ256rr:
8557	case X86::VMULPDZrr:
8558	case X86::VMULPSZrr:
8559	case X86::VMULSDrr:
8560	case X86::VMULSSrr:
8561	case X86::VMULSDZrr:
8562	case X86::VMULSSZrr:
8563	case X86::VADDPHZ128rr:
8564	case X86::VADDPHZ256rr:
8565	case X86::VADDPHZrr:
8566	case X86::VADDSHZrr:
8567	case X86::VMULPHZ128rr:
8568	case X86::VMULPHZ256rr:
8569	case X86::VMULPHZrr:
8570	case X86::VMULSHZrr:
8571	return Inst.getFlag(MachineInstr::MIFlag::FmReassoc) &&
8572	Inst.getFlag(MachineInstr::MIFlag::FmNsz);
8573	default:
8574	return false;
8575	}
8576	}
8577
8578	/// If \p DescribedReg overlaps with the MOVrr instruction's destination
8579	/// register then, if possible, describe the value in terms of the source
8580	/// register.
8581	static Optional<ParamLoadedValue>
8582	describeMOVrrLoadedValue(const MachineInstr &MI, Register DescribedReg,
8583	const TargetRegisterInfo *TRI) {
8584	Register DestReg = MI.getOperand(0).getReg();
8585	Register SrcReg = MI.getOperand(1).getReg();
8586
8587	auto Expr = DIExpression::get(MI.getMF()->getFunction().getContext(), {});
8588
8589	// If the described register is the destination, just return the source.
8590	if (DestReg == DescribedReg)
8591	return ParamLoadedValue(MachineOperand::CreateReg(SrcReg, false), Expr);
8592
8593	// If the described register is a sub-register of the destination register,
8594	// then pick out the source register's corresponding sub-register.
8595	if (unsigned SubRegIdx = TRI->getSubRegIndex(DestReg, DescribedReg)) {
8596	Register SrcSubReg = TRI->getSubReg(SrcReg, SubRegIdx);
8597	return ParamLoadedValue(MachineOperand::CreateReg(SrcSubReg, false), Expr);
8598	}
8599
8600	// The remaining case to consider is when the described register is a
8601	// super-register of the destination register. MOV8rr and MOV16rr does not
8602	// write to any of the other bytes in the register, meaning that we'd have to
8603	// describe the value using a combination of the source register and the
8604	// non-overlapping bits in the described register, which is not currently
8605	// possible.
8606	if (MI.getOpcode() == X86::MOV8rr \|\| MI.getOpcode() == X86::MOV16rr \|\|
8607	!TRI->isSuperRegister(DestReg, DescribedReg))
8608	return None;
8609
8610	assert(MI.getOpcode() == X86::MOV32rr && "Unexpected super-register case")(static_cast <bool> (MI.getOpcode() == X86::MOV32rr && "Unexpected super-register case") ? void (0) : __assert_fail ("MI.getOpcode() == X86::MOV32rr && \"Unexpected super-register case\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8610, __extension__ __PRETTY_FUNCTION__));
8611	return ParamLoadedValue(MachineOperand::CreateReg(SrcReg, false), Expr);
8612	}
8613
8614	Optional<ParamLoadedValue>
8615	X86InstrInfo::describeLoadedValue(const MachineInstr &MI, Register Reg) const {
8616	const MachineOperand *Op = nullptr;
8617	DIExpression *Expr = nullptr;
8618
8619	const TargetRegisterInfo *TRI = &getRegisterInfo();
8620
8621	switch (MI.getOpcode()) {
8622	case X86::LEA32r:
8623	case X86::LEA64r:
8624	case X86::LEA64_32r: {
8625	// We may need to describe a 64-bit parameter with a 32-bit LEA.
8626	if (!TRI->isSuperRegisterEq(MI.getOperand(0).getReg(), Reg))
8627	return None;
8628
8629	// Operand 4 could be global address. For now we do not support
8630	// such situation.
8631	if (!MI.getOperand(4).isImm() \|\| !MI.getOperand(2).isImm())
8632	return None;
8633
8634	const MachineOperand &Op1 = MI.getOperand(1);
8635	const MachineOperand &Op2 = MI.getOperand(3);
8636	assert(Op2.isReg() && (Op2.getReg() == X86::NoRegister \|\|(static_cast <bool> (Op2.isReg() && (Op2.getReg () == X86::NoRegister \|\| Register::isPhysicalRegister(Op2.getReg ()))) ? void (0) : __assert_fail ("Op2.isReg() && (Op2.getReg() == X86::NoRegister \|\| Register::isPhysicalRegister(Op2.getReg()))" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8637, __extension__ __PRETTY_FUNCTION__))
8637	Register::isPhysicalRegister(Op2.getReg())))(static_cast <bool> (Op2.isReg() && (Op2.getReg () == X86::NoRegister \|\| Register::isPhysicalRegister(Op2.getReg ()))) ? void (0) : __assert_fail ("Op2.isReg() && (Op2.getReg() == X86::NoRegister \|\| Register::isPhysicalRegister(Op2.getReg()))" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8637, __extension__ __PRETTY_FUNCTION__));
8638
8639	// Omit situations like:
8640	// %rsi = lea %rsi, 4, ...
8641	if ((Op1.isReg() && Op1.getReg() == MI.getOperand(0).getReg()) \|\|
8642	Op2.getReg() == MI.getOperand(0).getReg())
8643	return None;
8644	else if ((Op1.isReg() && Op1.getReg() != X86::NoRegister &&
8645	TRI->regsOverlap(Op1.getReg(), MI.getOperand(0).getReg())) \|\|
8646	(Op2.getReg() != X86::NoRegister &&
8647	TRI->regsOverlap(Op2.getReg(), MI.getOperand(0).getReg())))
8648	return None;
8649
8650	int64_t Coef = MI.getOperand(2).getImm();
8651	int64_t Offset = MI.getOperand(4).getImm();
8652	SmallVector<uint64_t, 8> Ops;
8653
8654	if ((Op1.isReg() && Op1.getReg() != X86::NoRegister)) {
8655	Op = &Op1;
8656	} else if (Op1.isFI())
8657	Op = &Op1;
8658
8659	if (Op && Op->isReg() && Op->getReg() == Op2.getReg() && Coef > 0) {
8660	Ops.push_back(dwarf::DW_OP_constu);
8661	Ops.push_back(Coef + 1);
8662	Ops.push_back(dwarf::DW_OP_mul);
8663	} else {
8664	if (Op && Op2.getReg() != X86::NoRegister) {
8665	int dwarfReg = TRI->getDwarfRegNum(Op2.getReg(), false);
8666	if (dwarfReg < 0)
8667	return None;
8668	else if (dwarfReg < 32) {
8669	Ops.push_back(dwarf::DW_OP_breg0 + dwarfReg);
8670	Ops.push_back(0);
8671	} else {
8672	Ops.push_back(dwarf::DW_OP_bregx);
8673	Ops.push_back(dwarfReg);
8674	Ops.push_back(0);
8675	}
8676	} else if (!Op) {
8677	assert(Op2.getReg() != X86::NoRegister)(static_cast <bool> (Op2.getReg() != X86::NoRegister) ? void (0) : __assert_fail ("Op2.getReg() != X86::NoRegister", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8677, __extension__ __PRETTY_FUNCTION__));
8678	Op = &Op2;
8679	}
8680
8681	if (Coef > 1) {
8682	assert(Op2.getReg() != X86::NoRegister)(static_cast <bool> (Op2.getReg() != X86::NoRegister) ? void (0) : __assert_fail ("Op2.getReg() != X86::NoRegister", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8682, __extension__ __PRETTY_FUNCTION__));
8683	Ops.push_back(dwarf::DW_OP_constu);
8684	Ops.push_back(Coef);
8685	Ops.push_back(dwarf::DW_OP_mul);
8686	}
8687
8688	if (((Op1.isReg() && Op1.getReg() != X86::NoRegister) \|\| Op1.isFI()) &&
8689	Op2.getReg() != X86::NoRegister) {
8690	Ops.push_back(dwarf::DW_OP_plus);
8691	}
8692	}
8693
8694	DIExpression::appendOffset(Ops, Offset);
8695	Expr = DIExpression::get(MI.getMF()->getFunction().getContext(), Ops);
8696
8697	return ParamLoadedValue(*Op, Expr);;
8698	}
8699	case X86::MOV8ri:
8700	case X86::MOV16ri:
8701	// TODO: Handle MOV8ri and MOV16ri.
8702	return None;
8703	case X86::MOV32ri:
8704	case X86::MOV64ri:
8705	case X86::MOV64ri32:
8706	// MOV32ri may be used for producing zero-extended 32-bit immediates in
8707	// 64-bit parameters, so we need to consider super-registers.
8708	if (!TRI->isSuperRegisterEq(MI.getOperand(0).getReg(), Reg))
8709	return None;
8710	return ParamLoadedValue(MI.getOperand(1), Expr);
8711	case X86::MOV8rr:
8712	case X86::MOV16rr:
8713	case X86::MOV32rr:
8714	case X86::MOV64rr:
8715	return describeMOVrrLoadedValue(MI, Reg, TRI);
8716	case X86::XOR32rr: {
8717	// 64-bit parameters are zero-materialized using XOR32rr, so also consider
8718	// super-registers.
8719	if (!TRI->isSuperRegisterEq(MI.getOperand(0).getReg(), Reg))
8720	return None;
8721	if (MI.getOperand(1).getReg() == MI.getOperand(2).getReg())
8722	return ParamLoadedValue(MachineOperand::CreateImm(0), Expr);
8723	return None;
8724	}
8725	case X86::MOVSX64rr32: {
8726	// We may need to describe the lower 32 bits of the MOVSX; for example, in
8727	// cases like this:
8728	//
8729	// $ebx = [...]
8730	// $rdi = MOVSX64rr32 $ebx
8731	// $esi = MOV32rr $edi
8732	if (!TRI->isSubRegisterEq(MI.getOperand(0).getReg(), Reg))
8733	return None;
8734
8735	Expr = DIExpression::get(MI.getMF()->getFunction().getContext(), {});
8736
8737	// If the described register is the destination register we need to
8738	// sign-extend the source register from 32 bits. The other case we handle
8739	// is when the described register is the 32-bit sub-register of the
8740	// destination register, in case we just need to return the source
8741	// register.
8742	if (Reg == MI.getOperand(0).getReg())
8743	Expr = DIExpression::appendExt(Expr, 32, 64, true);
8744	else
8745	assert(X86MCRegisterClasses[X86::GR32RegClassID].contains(Reg) &&(static_cast <bool> (X86MCRegisterClasses[X86::GR32RegClassID ].contains(Reg) && "Unhandled sub-register case for MOVSX64rr32" ) ? void (0) : __assert_fail ("X86MCRegisterClasses[X86::GR32RegClassID].contains(Reg) && \"Unhandled sub-register case for MOVSX64rr32\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8746, __extension__ __PRETTY_FUNCTION__))
8746	"Unhandled sub-register case for MOVSX64rr32")(static_cast <bool> (X86MCRegisterClasses[X86::GR32RegClassID ].contains(Reg) && "Unhandled sub-register case for MOVSX64rr32" ) ? void (0) : __assert_fail ("X86MCRegisterClasses[X86::GR32RegClassID].contains(Reg) && \"Unhandled sub-register case for MOVSX64rr32\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8746, __extension__ __PRETTY_FUNCTION__));
8747
8748	return ParamLoadedValue(MI.getOperand(1), Expr);
8749	}
8750	default:
8751	assert(!MI.isMoveImmediate() && "Unexpected MoveImm instruction")(static_cast <bool> (!MI.isMoveImmediate() && "Unexpected MoveImm instruction" ) ? void (0) : __assert_fail ("!MI.isMoveImmediate() && \"Unexpected MoveImm instruction\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8751, __extension__ __PRETTY_FUNCTION__));
8752	return TargetInstrInfo::describeLoadedValue(MI, Reg);
8753	}
8754	}
8755
8756	/// This is an architecture-specific helper function of reassociateOps.
8757	/// Set special operand attributes for new instructions after reassociation.
8758	void X86InstrInfo::setSpecialOperandAttr(MachineInstr &OldMI1,
8759	MachineInstr &OldMI2,
8760	MachineInstr &NewMI1,
8761	MachineInstr &NewMI2) const {
8762	// Propagate FP flags from the original instructions.
8763	// But clear poison-generating flags because those may not be valid now.
8764	// TODO: There should be a helper function for copying only fast-math-flags.
8765	uint16_t IntersectedFlags = OldMI1.getFlags() & OldMI2.getFlags();
8766	NewMI1.setFlags(IntersectedFlags);
8767	NewMI1.clearFlag(MachineInstr::MIFlag::NoSWrap);
8768	NewMI1.clearFlag(MachineInstr::MIFlag::NoUWrap);
8769	NewMI1.clearFlag(MachineInstr::MIFlag::IsExact);
8770
8771	NewMI2.setFlags(IntersectedFlags);
8772	NewMI2.clearFlag(MachineInstr::MIFlag::NoSWrap);
8773	NewMI2.clearFlag(MachineInstr::MIFlag::NoUWrap);
8774	NewMI2.clearFlag(MachineInstr::MIFlag::IsExact);
8775
8776	// Integer instructions may define an implicit EFLAGS dest register operand.
8777	MachineOperand *OldFlagDef1 = OldMI1.findRegisterDefOperand(X86::EFLAGS);
8778	MachineOperand *OldFlagDef2 = OldMI2.findRegisterDefOperand(X86::EFLAGS);
8779
8780	assert(!OldFlagDef1 == !OldFlagDef2 &&(static_cast <bool> (!OldFlagDef1 == !OldFlagDef2 && "Unexpected instruction type for reassociation") ? void (0) : __assert_fail ("!OldFlagDef1 == !OldFlagDef2 && \"Unexpected instruction type for reassociation\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8781, __extension__ __PRETTY_FUNCTION__))
8781	"Unexpected instruction type for reassociation")(static_cast <bool> (!OldFlagDef1 == !OldFlagDef2 && "Unexpected instruction type for reassociation") ? void (0) : __assert_fail ("!OldFlagDef1 == !OldFlagDef2 && \"Unexpected instruction type for reassociation\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8781, __extension__ __PRETTY_FUNCTION__));
8782
8783	if (!OldFlagDef1 \|\| !OldFlagDef2)
8784	return;
8785
8786	assert(OldFlagDef1->isDead() && OldFlagDef2->isDead() &&(static_cast <bool> (OldFlagDef1->isDead() && OldFlagDef2->isDead() && "Must have dead EFLAGS operand in reassociable instruction" ) ? void (0) : __assert_fail ("OldFlagDef1->isDead() && OldFlagDef2->isDead() && \"Must have dead EFLAGS operand in reassociable instruction\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8787, __extension__ __PRETTY_FUNCTION__))
8787	"Must have dead EFLAGS operand in reassociable instruction")(static_cast <bool> (OldFlagDef1->isDead() && OldFlagDef2->isDead() && "Must have dead EFLAGS operand in reassociable instruction" ) ? void (0) : __assert_fail ("OldFlagDef1->isDead() && OldFlagDef2->isDead() && \"Must have dead EFLAGS operand in reassociable instruction\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8787, __extension__ __PRETTY_FUNCTION__));
8788
8789	MachineOperand *NewFlagDef1 = NewMI1.findRegisterDefOperand(X86::EFLAGS);
8790	MachineOperand *NewFlagDef2 = NewMI2.findRegisterDefOperand(X86::EFLAGS);
8791
8792	assert(NewFlagDef1 && NewFlagDef2 &&(static_cast <bool> (NewFlagDef1 && NewFlagDef2 && "Unexpected operand in reassociable instruction") ? void (0) : __assert_fail ("NewFlagDef1 && NewFlagDef2 && \"Unexpected operand in reassociable instruction\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8793, __extension__ __PRETTY_FUNCTION__))
8793	"Unexpected operand in reassociable instruction")(static_cast <bool> (NewFlagDef1 && NewFlagDef2 && "Unexpected operand in reassociable instruction") ? void (0) : __assert_fail ("NewFlagDef1 && NewFlagDef2 && \"Unexpected operand in reassociable instruction\"" , "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8793, __extension__ __PRETTY_FUNCTION__));
8794
8795	// Mark the new EFLAGS operands as dead to be helpful to subsequent iterations
8796	// of this pass or other passes. The EFLAGS operands must be dead in these new
8797	// instructions because the EFLAGS operands in the original instructions must
8798	// be dead in order for reassociation to occur.
8799	NewFlagDef1->setIsDead();
8800	NewFlagDef2->setIsDead();
8801	}
8802
8803	std::pair<unsigned, unsigned>
8804	X86InstrInfo::decomposeMachineOperandsTargetFlags(unsigned TF) const {
8805	return std::make_pair(TF, 0u);
8806	}
8807
8808	ArrayRef<std::pair<unsigned, const char *>>
8809	X86InstrInfo::getSerializableDirectMachineOperandTargetFlags() const {
8810	using namespace X86II;
8811	static const std::pair<unsigned, const char *> TargetFlags[] = {
8812	{MO_GOT_ABSOLUTE_ADDRESS, "x86-got-absolute-address"},
8813	{MO_PIC_BASE_OFFSET, "x86-pic-base-offset"},
8814	{MO_GOT, "x86-got"},
8815	{MO_GOTOFF, "x86-gotoff"},
8816	{MO_GOTPCREL, "x86-gotpcrel"},
8817	{MO_PLT, "x86-plt"},
8818	{MO_TLSGD, "x86-tlsgd"},
8819	{MO_TLSLD, "x86-tlsld"},
8820	{MO_TLSLDM, "x86-tlsldm"},
8821	{MO_GOTTPOFF, "x86-gottpoff"},
8822	{MO_INDNTPOFF, "x86-indntpoff"},
8823	{MO_TPOFF, "x86-tpoff"},
8824	{MO_DTPOFF, "x86-dtpoff"},
8825	{MO_NTPOFF, "x86-ntpoff"},
8826	{MO_GOTNTPOFF, "x86-gotntpoff"},
8827	{MO_DLLIMPORT, "x86-dllimport"},
8828	{MO_DARWIN_NONLAZY, "x86-darwin-nonlazy"},
8829	{MO_DARWIN_NONLAZY_PIC_BASE, "x86-darwin-nonlazy-pic-base"},
8830	{MO_TLVP, "x86-tlvp"},
8831	{MO_TLVP_PIC_BASE, "x86-tlvp-pic-base"},
8832	{MO_SECREL, "x86-secrel"},
8833	{MO_COFFSTUB, "x86-coffstub"}};
8834	return makeArrayRef(TargetFlags);
8835	}
8836
8837	namespace {
8838	/// Create Global Base Reg pass. This initializes the PIC
8839	/// global base register for x86-32.
8840	struct CGBR : public MachineFunctionPass {
8841	static char ID;
8842	CGBR() : MachineFunctionPass(ID) {}
8843
8844	bool runOnMachineFunction(MachineFunction &MF) override {
8845	const X86TargetMachine *TM =
8846	static_cast<const X86TargetMachine *>(&MF.getTarget());
8847	const X86Subtarget &STI = MF.getSubtarget<X86Subtarget>();
8848
8849	// Don't do anything in the 64-bit small and kernel code models. They use
8850	// RIP-relative addressing for everything.
8851	if (STI.is64Bit() && (TM->getCodeModel() == CodeModel::Small \|\|
8852	TM->getCodeModel() == CodeModel::Kernel))
8853	return false;
8854
8855	// Only emit a global base reg in PIC mode.
8856	if (!TM->isPositionIndependent())
8857	return false;
8858
8859	X86MachineFunctionInfo *X86FI = MF.getInfo<X86MachineFunctionInfo>();
8860	Register GlobalBaseReg = X86FI->getGlobalBaseReg();
8861
8862	// If we didn't need a GlobalBaseReg, don't insert code.
8863	if (GlobalBaseReg == 0)
8864	return false;
8865
8866	// Insert the set of GlobalBaseReg into the first MBB of the function
8867	MachineBasicBlock &FirstMBB = MF.front();
8868	MachineBasicBlock::iterator MBBI = FirstMBB.begin();
8869	DebugLoc DL = FirstMBB.findDebugLoc(MBBI);
8870	MachineRegisterInfo &RegInfo = MF.getRegInfo();
8871	const X86InstrInfo *TII = STI.getInstrInfo();
8872
8873	Register PC;
8874	if (STI.isPICStyleGOT())
8875	PC = RegInfo.createVirtualRegister(&X86::GR32RegClass);
8876	else
8877	PC = GlobalBaseReg;
8878
8879	if (STI.is64Bit()) {
8880	if (TM->getCodeModel() == CodeModel::Medium) {
8881	// In the medium code model, use a RIP-relative LEA to materialize the
8882	// GOT.
8883	BuildMI(FirstMBB, MBBI, DL, TII->get(X86::LEA64r), PC)
8884	.addReg(X86::RIP)
8885	.addImm(0)
8886	.addReg(0)
8887	.addExternalSymbol("_GLOBAL_OFFSET_TABLE_")
8888	.addReg(0);
8889	} else if (TM->getCodeModel() == CodeModel::Large) {
8890	// In the large code model, we are aiming for this code, though the
8891	// register allocation may vary:
8892	// leaq .LN$pb(%rip), %rax
8893	// movq $_GLOBAL_OFFSET_TABLE_ - .LN$pb, %rcx
8894	// addq %rcx, %rax
8895	// RAX now holds address of _GLOBAL_OFFSET_TABLE_.
8896	Register PBReg = RegInfo.createVirtualRegister(&X86::GR64RegClass);
8897	Register GOTReg = RegInfo.createVirtualRegister(&X86::GR64RegClass);
8898	BuildMI(FirstMBB, MBBI, DL, TII->get(X86::LEA64r), PBReg)
8899	.addReg(X86::RIP)
8900	.addImm(0)
8901	.addReg(0)
8902	.addSym(MF.getPICBaseSymbol())
8903	.addReg(0);
8904	std::prev(MBBI)->setPreInstrSymbol(MF, MF.getPICBaseSymbol());
8905	BuildMI(FirstMBB, MBBI, DL, TII->get(X86::MOV64ri), GOTReg)
8906	.addExternalSymbol("_GLOBAL_OFFSET_TABLE_",
8907	X86II::MO_PIC_BASE_OFFSET);
8908	BuildMI(FirstMBB, MBBI, DL, TII->get(X86::ADD64rr), PC)
8909	.addReg(PBReg, RegState::Kill)
8910	.addReg(GOTReg, RegState::Kill);
8911	} else {
8912	llvm_unreachable("unexpected code model")::llvm::llvm_unreachable_internal("unexpected code model", "/build/llvm-toolchain-snapshot-14~++20210828111110+16086d47c0d0/llvm/lib/Target/X86/X86InstrInfo.cpp" , 8912);
8913	}
8914	} else {
8915	// Operand of MovePCtoStack is completely ignored by asm printer. It's
8916	// only used in JIT code emission as displacement to pc.
8917	BuildMI(FirstMBB, MBBI, DL, TII->get(X86::MOVPC32r), PC).addImm(0);
8918
8919	// If we're using vanilla 'GOT' PIC style, we should use relative
8920	// addressing not to pc, but to _GLOBAL_OFFSET_TABLE_ external.
8921	if (STI.isPICStyleGOT()) {
8922	// Generate addl $__GLOBAL_OFFSET_TABLE_ + [.-piclabel],
8923	// %some_register
8924	BuildMI(FirstMBB, MBBI, DL, TII->get(X86::ADD32ri), GlobalBaseReg)
8925	.addReg(PC)
8926	.addExternalSymbol("_GLOBAL_OFFSET_TABLE_",
8927	X86II::MO_GOT_ABSOLUTE_ADDRESS);
8928	}
8929	}
8930
8931	return true;
8932	}
8933
8934	StringRef getPassName() const override {
8935	return "X86 PIC Global Base Reg Initialization";
8936	}
8937
8938	void getAnalysisUsage(AnalysisUsage &AU) const override {
8939	AU.setPreservesCFG();
8940	MachineFunctionPass::getAnalysisUsage(AU);
8941	}
8942	};
8943	} // namespace
8944
8945	char CGBR::ID = 0;
8946	FunctionPass*
8947	llvm::createX86GlobalBaseRegPass() { return new CGBR(); }
8948
8949	namespace {
8950	struct LDTLSCleanup : public MachineFunctionPass {
8951	static char ID;
8952	LDTLSCleanup() : MachineFunctionPass(ID) {}
8953
8954	bool runOnMachineFunction(MachineFunction &MF) override {
8955	if (skipFunction(MF.getFunction()))
8956	return false;
8957
8958	X86MachineFunctionInfo *MFI = MF.getInfo<X86MachineFunctionInfo>();
8959	if (MFI->getNumLocalDynamicTLSAccesses() < 2) {
8960	// No point folding accesses if there isn't at least two.
8961	return false;
8962	}
8963
8964	MachineDominatorTree *DT = &getAnalysis<MachineDominatorTree>();
8965	return VisitNode(DT->getRootNode(), 0);
8966	}
8967
8968	// Visit the dominator subtree rooted at Node in pre-order.
8969	// If TLSBaseAddrReg is non-null, then use that to replace any
8970	// TLS_base_addr instructions. Otherwise, create the register
8971	// when the first such instruction is seen, and then use it
8972	// as we encounter more instructions.
8973	bool VisitNode(MachineDomTreeNode *Node, unsigned TLSBaseAddrReg) {
8974	MachineBasicBlock *BB = Node->getBlock();
8975	bool Changed = false;
8976
8977	// Traverse the current block.
8978	for (MachineBasicBlock::iterator I = BB->begin(), E = BB->end(); I != E;
8979	++I) {
8980	switch (I->getOpcode()) {
8981	case X86::TLS_base_addr32:
8982	case X86::TLS_base_addr64:
8983	if (TLSBaseAddrReg)
8984	I = ReplaceTLSBaseAddrCall(*I, TLSBaseAddrReg);
8985	else
8986	I = SetRegister(*I, &TLSBaseAddrReg);
8987	Changed = true;
8988	break;
8989	default:
8990	break;
8991	}
8992	}
8993
8994	// Visit the children of this block in the dominator tree.
8995	for (auto I = Node->begin(), E = Node->end(); I != E; ++I) {
8996	Changed \|= VisitNode(*I, TLSBaseAddrReg);
8997	}
8998
8999	return Changed;
9000	}
9001
9002	// Replace the TLS_base_addr instruction I with a copy from
9003	// TLSBaseAddrReg, returning the new instruction.
9004	MachineInstr *ReplaceTLSBaseAddrCall(MachineInstr &I,
9005	unsigned TLSBaseAddrReg) {
9006	MachineFunction *MF = I.getParent()->getParent();
9007	const X86Subtarget &STI = MF->getSubtarget<X86Subtarget>();
9008	const bool is64Bit = STI.is64Bit();
9009	const X86InstrInfo *TII = STI.getInstrInfo();
9010
9011	// Insert a Copy from TLSBaseAddrReg to RAX/EAX.
9012	MachineInstr *Copy =
9013	BuildMI(*I.getParent(), I, I.getDebugLoc(),
9014	TII->get(TargetOpcode::COPY), is64Bit ? X86::RAX : X86::EAX)
9015	.addReg(TLSBaseAddrReg);
9016
9017	// Erase the TLS_base_addr instruction.
9018	I.eraseFromParent();
9019
9020	return Copy;
9021	}
9022
9023	// Create a virtual register in *TLSBaseAddrReg, and populate it by
9024	// inserting a copy instruction after I. Returns the new instruction.
9025	MachineInstr SetRegister(MachineInstr &I, unsigned TLSBaseAddrReg) {
9026	MachineFunction *MF = I.getParent()->getParent();
9027	const X86Subtarget &STI = MF->getSubtarget<X86Subtarget>();
9028	const bool is64Bit = STI.is64Bit();
9029	const X86InstrInfo *TII = STI.getInstrInfo();
9030
9031	// Create a virtual register for the TLS base address.
9032	MachineRegisterInfo &RegInfo = MF->getRegInfo();
9033	*TLSBaseAddrReg = RegInfo.createVirtualRegister(is64Bit
9034	? &X86::GR64RegClass
9035	: &X86::GR32RegClass);
9036
9037	// Insert a copy from RAX/EAX to TLSBaseAddrReg.
9038	MachineInstr *Next = I.getNextNode();
9039	MachineInstr *Copy =
9040	BuildMI(*I.getParent(), Next, I.getDebugLoc(),
9041	TII->get(TargetOpcode::COPY), *TLSBaseAddrReg)
9042	.addReg(is64Bit ? X86::RAX : X86::EAX);
9043
9044	return Copy;
9045	}
9046
9047	StringRef getPassName() const override {
9048	return "Local Dynamic TLS Access Clean-up";
9049	}
9050
9051	void getAnalysisUsage(AnalysisUsage &AU) const override {
9052	AU.setPreservesCFG();
9053	AU.addRequired<MachineDominatorTree>();
9054	MachineFunctionPass::getAnalysisUsage(AU);
9055	}
9056	};
9057	}
9058
9059	char LDTLSCleanup::ID = 0;
9060	FunctionPass*
9061	llvm::createCleanupLocalDynamicTLSPass() { return new LDTLSCleanup(); }
9062
9063	/// Constants defining how certain sequences should be outlined.
9064	///
9065	/// \p MachineOutlinerDefault implies that the function is called with a call
9066	/// instruction, and a return must be emitted for the outlined function frame.
9067	///
9068	/// That is,
9069	///
9070	/// I1 OUTLINED_FUNCTION:
9071	/// I2 --> call OUTLINED_FUNCTION I1
9072	/// I3 I2
9073	/// I3
9074	/// ret
9075	///
9076	/// * Call construction overhead: 1 (call instruction)
9077	/// * Frame construction overhead: 1 (return instruction)
9078	///
9079	/// \p MachineOutlinerTailCall implies that the function is being tail called.
9080	/// A jump is emitted instead of a call, and the return is already present in
9081	/// the outlined sequence. That is,
9082	///
9083	/// I1 OUTLINED_FUNCTION:
9084	/// I2 --> jmp OUTLINED_FUNCTION I1
9085	/// ret I2
9086	/// ret
9087	///
9088	/// * Call construction overhead: 1 (jump instruction)
9089	/// * Frame construction overhead: 0 (don't need to return)
9090	///
9091	enum MachineOutlinerClass {
9092	MachineOutlinerDefault,
9093	MachineOutlinerTailCall
9094	};
9095
9096	outliner::OutlinedFunction X86InstrInfo::getOutliningCandidateInfo(
9097	std::vector<outliner::Candidate> &RepeatedSequenceLocs) const {
9098	unsigned SequenceSize =
9099	std::accumulate(RepeatedSequenceLocs[0].front(),
9100	std::next(RepeatedSequenceLocs[0].back()), 0,
9101	[](unsigned Sum, const MachineInstr &MI) {
9102	// FIXME: x86 doesn't implement getInstSizeInBytes, so
9103	// we can't tell the cost. Just assume each instruction
9104	// is one byte.
9105	if (MI.isDebugInstr() \|\| MI.isKill())
9106	return Sum;
9107	return Sum + 1;
9108	});
9109
9110	// We check to see if CFI Instructions are present, and if they are
9111	// we find the number of CFI Instructions in the candidates.
9112	unsigned CFICount = 0;
9113	MachineBasicBlock::iterator MBBI = RepeatedSequenceLocs[0].front();
9114	for (unsigned Loc = RepeatedSequenceLocs[0].getStartIdx();
9115	Loc < RepeatedSequenceLocs[0].getEndIdx() + 1; Loc++) {
9116	const std::vector<MCCFIInstruction> &CFIInstructions =
9117	RepeatedSequenceLocs[0].getMF()->getFrameInstructions();
9118	if (MBBI->isCFIInstruction()) {
9119	unsigned CFIIndex = MBBI->getOperand(0).getCFIIndex();
9120	MCCFIInstruction CFI = CFIInstructions[CFIIndex];
9121	CFICount++;
9122	}
9123	MBBI++;
9124	}
9125
9126	// We compare the number of found CFI Instructions to the number of CFI
9127	// instructions in the parent function for each candidate. We must check this
9128	// since if we outline one of the CFI instructions in a function, we have to
9129	// outline them all for correctness. If we do not, the address offsets will be
9130	// incorrect between the two sections of the program.
9131	for (outliner::Candidate &C : RepeatedSequenceLocs) {
9132	std::vector<MCCFIInstruction> CFIInstructions =
9133	C.getMF()->getFrameInstructions();
9134
9135	if (CFICount > 0 && CFICount != CFIInstructions.size())
9136	return outliner::OutlinedFunction();
9137	}
9138
9139	// FIXME: Use real size in bytes for call and ret instructions.
9140	if (RepeatedSequenceLocs[0].back()->isTerminator()) {
9141	for (outliner::Candidate &C : RepeatedSequenceLocs)
9142	C.setCallInfo(MachineOutlinerTailCall, 1);
9143
9144	return outliner::OutlinedFunction(RepeatedSequenceLocs, SequenceSize,
9145	0, // Number of bytes to emit frame.
9146	MachineOutlinerTailCall // Type of frame.
9147	);
9148	}
9149
9150	if (CFICount > 0)
9151	return outliner::OutlinedFunction();
9152
9153	for (outliner::Candidate &C : RepeatedSequenceLocs)
9154	C.setCallInfo(MachineOutlinerDefault, 1);
9155
9156	return outliner::OutlinedFunction(RepeatedSequenceLocs, SequenceSize, 1,
9157	MachineOutlinerDefault);
9158	}
9159
9160	bool X86InstrInfo::isFunctionSafeToOutlineFrom(MachineFunction &MF,
9161	bool OutlineFromLinkOnceODRs) const {
9162	const Function &F = MF.getFunction();
9163
9164	// Does the function use a red zone? If it does, then we can't risk messing
9165	// with the stack.
9166	if (Subtarget.getFrameLowering()->has128ByteRedZone(MF)) {
9167	// It could have a red zone. If it does, then we don't want to touch it.
9168	const X86MachineFunctionInfo *X86FI = MF.getInfo<X86MachineFunctionInfo>();
9169	if (!X86FI \|\| X86FI->getUsesRedZone())
9170	return false;
9171	}
9172
9173	// If we don't want to outline from things that could potentially be deduped
9174	// then return false.
9175	if (!OutlineFromLinkOnceODRs && F.hasLinkOnceODRLinkage())
9176	return false;
9177
9178	// This function is viable for outlining, so return true.
9179	return true;
9180	}
9181
9182	outliner::InstrType
9183	X86InstrInfo::getOutliningType(MachineBasicBlock::iterator &MIT, unsigned Flags) const {
9184	MachineInstr &MI = *MIT;
9185	// Don't allow debug values to impact outlining type.
9186	if (MI.isDebugInstr() \|\| MI.isIndirectDebugValue())
9187	return outliner::InstrType::Invisible;
9188
9189	// At this point, KILL instructions don't really tell us much so we can go
9190	// ahead and skip over them.
9191	if (MI.isKill())
9192	return outliner::InstrType::Invisible;
9193
9194	// Is this a tail call? If yes, we can outline as a tail call.
9195	if (isTailCall(MI))
9196	return outliner::InstrType::Legal;
9197
9198	// Is this the terminator of a basic block?
9199	if (MI.isTerminator() \|\| MI.isReturn()) {
9200
9201	// Does its parent have any successors in its MachineFunction?
9202	if (MI.getParent()->succ_empty())
9203	return outliner::InstrType::Legal;
9204
9205	// It does, so we can't tail call it.
9206	return outliner::InstrType::Illegal;
9207	}
9208
9209	// Don't outline anything that modifies or reads from the stack pointer.
9210	//
9211	// FIXME: There are instructions which are being manually built without
9212	// explicit uses/defs so we also have to check the MCInstrDesc. We should be
9213	// able to remove the extra checks once those are fixed up. For example,
9214	// sometimes we might get something like %rax = POP64r 1. This won't be
9215	// caught by modifiesRegister or readsRegister even though the instruction
9216	// really ought to be formed so that modifiesRegister/readsRegister would
9217	// catch it.
9218	if (MI.modifiesRegister(X86::RSP, &RI) \|\| MI.readsRegister(X86::RSP, &RI) \|\|
9219	MI.getDesc().hasImplicitUseOfPhysReg(X86::RSP) \|\|
9220	MI.getDesc().hasImplicitDefOfPhysReg(X86::RSP))
9221	return outliner::InstrType::Illegal;
9222
9223	// Outlined calls change the instruction pointer, so don't read from it.
9224	if (MI.readsRegister(X86::RIP, &RI) \|\|
9225	MI.getDesc().hasImplicitUseOfPhysReg(X86::RIP) \|\|
9226	MI.getDesc().hasImplicitDefOfPhysReg(X86::RIP))
9227	return outliner::InstrType::Illegal;
9228
9229	// Positions can't safely be outlined.
9230	if (MI.isPosition())
9231	return outliner::InstrType::Illegal;
9232
9233	// Make sure none of the operands of this instruction do anything tricky.
9234	for (const MachineOperand &MOP : MI.operands())
9235	if (MOP.isCPI() \|\| MOP.isJTI() \|\| MOP.isCFIIndex() \|\| MOP.isFI() \|\|
9236	MOP.isTargetIndex())
9237	return outliner::InstrType::Illegal;
9238
9239	return outliner::InstrType::Legal;
9240	}
9241
9242	void X86InstrInfo::buildOutlinedFrame(MachineBasicBlock &MBB,
9243	MachineFunction &MF,
9244	const outliner::OutlinedFunction &OF)
9245	const {
9246	// If we're a tail call, we already have a return, so don't do anything.
9247	if (OF.FrameConstructionID == MachineOutlinerTailCall)
9248	return;
9249
9250	// We're a normal call, so our sequence doesn't have a return instruction.
9251	// Add it in.
9252	MachineInstr *retq = BuildMI(MF, DebugLoc(), get(X86::RETQ));
9253	MBB.insert(MBB.end(), retq);
9254	}
9255
9256	MachineBasicBlock::iterator
9257	X86InstrInfo::insertOutlinedCall(Module &M, MachineBasicBlock &MBB,
9258	MachineBasicBlock::iterator &It,
9259	MachineFunction &MF,
9260	const outliner::Candidate &C) const {
9261	// Is it a tail call?
9262	if (C.CallConstructionID == MachineOutlinerTailCall) {
9263	// Yes, just insert a JMP.
9264	It = MBB.insert(It,
9265	BuildMI(MF, DebugLoc(), get(X86::TAILJMPd64))
9266	.addGlobalAddress(M.getNamedValue(MF.getName())));
9267	} else {
9268	// No, insert a call.
9269	It = MBB.insert(It,
9270	BuildMI(MF, DebugLoc(), get(X86::CALL64pcrel32))
9271	.addGlobalAddress(M.getNamedValue(MF.getName())));
9272	}
9273
9274	return It;
9275	}
9276
9277	#define GET_INSTRINFO_HELPERS
9278	#include "X86GenInstrInfo.inc"