docs/doxygen/AArch64FastISel_8cpp_source.html

//===- AArch6464FastISel.cpp - AArch64 FastISel implementation ------------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This file defines the AArch64-specific support for the FastISel class. Some

// of the target-specific code is generated by tablegen in the file

// AArch64GenFastISel.inc, which is #included here.

//

//===----------------------------------------------------------------------===//


#include "AArch64.h"

#include "AArch64CallingConvention.h"

#include "AArch64MachineFunctionInfo.h"

#include "AArch64RegisterInfo.h"

#include "AArch64Subtarget.h"

#include "MCTargetDesc/AArch64AddressingModes.h"

#include "Utils/AArch64BaseInfo.h"

#include "Utils/AArch64SMEAttributes.h"

#include "llvm/ADT/APFloat.h"

#include "llvm/ADT/APInt.h"

#include "llvm/ADT/DenseMap.h"

#include "llvm/ADT/SmallVector.h"

#include "llvm/Analysis/BranchProbabilityInfo.h"

#include "llvm/CodeGen/CallingConvLower.h"

#include "llvm/CodeGen/FastISel.h"

#include "llvm/CodeGen/FunctionLoweringInfo.h"

#include "llvm/CodeGen/ISDOpcodes.h"

#include "llvm/CodeGen/MachineBasicBlock.h"

#include "llvm/CodeGen/MachineConstantPool.h"

#include "llvm/CodeGen/MachineFrameInfo.h"

#include "llvm/CodeGen/MachineInstr.h"

#include "llvm/CodeGen/MachineInstrBuilder.h"

#include "llvm/CodeGen/MachineMemOperand.h"

#include "llvm/CodeGen/MachineRegisterInfo.h"

#include "llvm/CodeGen/ValueTypes.h"

#include "llvm/CodeGenTypes/MachineValueType.h"

#include "llvm/IR/Argument.h"

#include "llvm/IR/Attributes.h"

#include "llvm/IR/BasicBlock.h"

#include "llvm/IR/CallingConv.h"

#include "llvm/IR/Constant.h"

#include "llvm/IR/Constants.h"

#include "llvm/IR/DataLayout.h"

#include "llvm/IR/DerivedTypes.h"

#include "llvm/IR/Function.h"

#include "llvm/IR/GetElementPtrTypeIterator.h"

#include "llvm/IR/GlobalValue.h"

#include "llvm/IR/InstrTypes.h"

#include "llvm/IR/Instruction.h"

#include "llvm/IR/Instructions.h"

#include "llvm/IR/IntrinsicInst.h"

#include "llvm/IR/Intrinsics.h"

#include "llvm/IR/IntrinsicsAArch64.h"

#include "llvm/IR/Module.h"

#include "llvm/IR/Operator.h"

#include "llvm/IR/Type.h"

#include "llvm/IR/User.h"

#include "llvm/IR/Value.h"

#include "llvm/MC/MCInstrDesc.h"

#include "llvm/MC/MCSymbol.h"

#include "llvm/Support/AtomicOrdering.h"

#include "llvm/Support/Casting.h"

#include "llvm/Support/CodeGen.h"

#include "llvm/Support/Compiler.h"

#include "llvm/Support/ErrorHandling.h"

#include "llvm/Support/MathExtras.h"

#include <algorithm>

#include <cassert>

#include <cstdint>

#include <iterator>

#include <utility>


using namespace llvm;


namespace {


class AArch64FastISel final : public FastISel {

  class Address {

  public:

    using BaseKind = enum {

      RegBase,

      FrameIndexBase

    };


  private:

    BaseKind Kind = RegBase;

    AArch64_AM::ShiftExtendType ExtType = AArch64_AM::InvalidShiftExtend;

    union {

      unsigned Reg;

      int FI;

    } Base;

    unsigned OffsetReg = 0;

    unsigned Shift = 0;

    int64_t Offset = 0;

    const GlobalValue *GV = nullptr;


  public:

    Address() { Base.Reg = 0; }


    void setKind(BaseKind K) { Kind = K; }

    BaseKind getKind() const { return Kind; }

    void setExtendType(AArch64_AM::ShiftExtendType E) { ExtType = E; }

    AArch64_AM::ShiftExtendType getExtendType() const { return ExtType; }

    bool isRegBase() const { return Kind == RegBase; }

    bool isFIBase() const { return Kind == FrameIndexBase; }


    void setReg(unsigned Reg) {

      assert(isRegBase() && "Invalid base register access!");

      Base.Reg = Reg;

    }


    unsigned getReg() const {

      assert(isRegBase() && "Invalid base register access!");

      return Base.Reg;

    }


    void setOffsetReg(unsigned Reg) {

      OffsetReg = Reg;

    }


    unsigned getOffsetReg() const {

      return OffsetReg;

    }


    void setFI(unsigned FI) {

      assert(isFIBase() && "Invalid base frame index  access!");

      Base.FI = FI;

    }


    unsigned getFI() const {

      assert(isFIBase() && "Invalid base frame index access!");

      return Base.FI;

    }


    void setOffset(int64_t O) { Offset = O; }

    int64_t getOffset() { return Offset; }

    void setShift(unsigned S) { Shift = S; }

    unsigned getShift() { return Shift; }


    void setGlobalValue(const GlobalValue *G) { GV = G; }

    const GlobalValue *getGlobalValue() { return GV; }

  };


  /// Subtarget - Keep a pointer to the AArch64Subtarget around so that we can

  /// make the right decision when generating code for different targets.

  const AArch64Subtarget *Subtarget;

  LLVMContext *Context;


  bool fastLowerArguments() override;

  bool fastLowerCall(CallLoweringInfo &CLI) override;

  bool fastLowerIntrinsicCall(const IntrinsicInst *II) override;


private:

  // Selection routines.

  bool selectAddSub(const Instruction *I);

  bool selectLogicalOp(const Instruction *I);

  bool selectLoad(const Instruction *I);

  bool selectStore(const Instruction *I);

  bool selectBranch(const Instruction *I);

  bool selectIndirectBr(const Instruction *I);

  bool selectCmp(const Instruction *I);

  bool selectSelect(const Instruction *I);

  bool selectFPExt(const Instruction *I);

  bool selectFPTrunc(const Instruction *I);

  bool selectFPToInt(const Instruction *I, bool Signed);

  bool selectIntToFP(const Instruction *I, bool Signed);

  bool selectRem(const Instruction *I, unsigned ISDOpcode);

  bool selectRet(const Instruction *I);

  bool selectTrunc(const Instruction *I);

  bool selectIntExt(const Instruction *I);

  bool selectMul(const Instruction *I);

  bool selectShift(const Instruction *I);

  bool selectBitCast(const Instruction *I);

  bool selectFRem(const Instruction *I);

  bool selectSDiv(const Instruction *I);

  bool selectGetElementPtr(const Instruction *I);

  bool selectAtomicCmpXchg(const AtomicCmpXchgInst *I);


  // Utility helper routines.

  bool isTypeLegal(Type *Ty, MVT &VT);

  bool isTypeSupported(Type *Ty, MVT &VT, bool IsVectorAllowed = false);

  bool isValueAvailable(const Value *V) const;

  bool computeAddress(const Value *Obj, Address &Addr, Type *Ty = nullptr);

  bool computeCallAddress(const Value *V, Address &Addr);

  bool simplifyAddress(Address &Addr, MVT VT);

  void addLoadStoreOperands(Address &Addr, const MachineInstrBuilder &MIB,

                            MachineMemOperand::Flags Flags,

                            unsigned ScaleFactor, MachineMemOperand *MMO);

  bool isMemCpySmall(uint64_t Len, MaybeAlign Alignment);

  bool tryEmitSmallMemCpy(Address Dest, Address Src, uint64_t Len,

                          MaybeAlign Alignment);

  bool foldXALUIntrinsic(AArch64CC::CondCode &CC, const Instruction *I,

                         const Value *Cond);

  bool optimizeIntExtLoad(const Instruction *I, MVT RetVT, MVT SrcVT);

  bool optimizeSelect(const SelectInst *SI);

  unsigned getRegForGEPIndex(const Value *Idx);


  // Emit helper routines.

  unsigned emitAddSub(bool UseAdd, MVT RetVT, const Value *LHS,

                      const Value *RHS, bool SetFlags = false,

                      bool WantResult = true,  bool IsZExt = false);

  unsigned emitAddSub_rr(bool UseAdd, MVT RetVT, unsigned LHSReg,

                         unsigned RHSReg, bool SetFlags = false,

                         bool WantResult = true);

  unsigned emitAddSub_ri(bool UseAdd, MVT RetVT, unsigned LHSReg,

                         uint64_t Imm, bool SetFlags = false,

                         bool WantResult = true);

  unsigned emitAddSub_rs(bool UseAdd, MVT RetVT, unsigned LHSReg,

                         unsigned RHSReg, AArch64_AM::ShiftExtendType ShiftType,

                         uint64_t ShiftImm, bool SetFlags = false,

                         bool WantResult = true);

  unsigned emitAddSub_rx(bool UseAdd, MVT RetVT, unsigned LHSReg,

                         unsigned RHSReg, AArch64_AM::ShiftExtendType ExtType,

                         uint64_t ShiftImm, bool SetFlags = false,

                         bool WantResult = true);


  // Emit functions.

  bool emitCompareAndBranch(const BranchInst *BI);

  bool emitCmp(const Value *LHS, const Value *RHS, bool IsZExt);

  bool emitICmp(MVT RetVT, const Value *LHS, const Value *RHS, bool IsZExt);

  bool emitICmp_ri(MVT RetVT, unsigned LHSReg, uint64_t Imm);

  bool emitFCmp(MVT RetVT, const Value *LHS, const Value *RHS);

  unsigned emitLoad(MVT VT, MVT ResultVT, Address Addr, bool WantZExt = true,

                    MachineMemOperand *MMO = nullptr);

  bool emitStore(MVT VT, unsigned SrcReg, Address Addr,

                 MachineMemOperand *MMO = nullptr);

  bool emitStoreRelease(MVT VT, unsigned SrcReg, unsigned AddrReg,

                        MachineMemOperand *MMO = nullptr);

  unsigned emitIntExt(MVT SrcVT, unsigned SrcReg, MVT DestVT, bool isZExt);

  unsigned emiti1Ext(unsigned SrcReg, MVT DestVT, bool isZExt);

  unsigned emitAdd(MVT RetVT, const Value *LHS, const Value *RHS,

                   bool SetFlags = false, bool WantResult = true,

                   bool IsZExt = false);

  unsigned emitAdd_ri_(MVT VT, unsigned Op0, int64_t Imm);

  unsigned emitSub(MVT RetVT, const Value *LHS, const Value *RHS,

                   bool SetFlags = false, bool WantResult = true,

                   bool IsZExt = false);

  unsigned emitSubs_rr(MVT RetVT, unsigned LHSReg, unsigned RHSReg,

                       bool WantResult = true);

  unsigned emitSubs_rs(MVT RetVT, unsigned LHSReg, unsigned RHSReg,

                       AArch64_AM::ShiftExtendType ShiftType, uint64_t ShiftImm,

                       bool WantResult = true);

  unsigned emitLogicalOp(unsigned ISDOpc, MVT RetVT, const Value *LHS,

                         const Value *RHS);

  unsigned emitLogicalOp_ri(unsigned ISDOpc, MVT RetVT, unsigned LHSReg,

                            uint64_t Imm);

  unsigned emitLogicalOp_rs(unsigned ISDOpc, MVT RetVT, unsigned LHSReg,

                            unsigned RHSReg, uint64_t ShiftImm);

  unsigned emitAnd_ri(MVT RetVT, unsigned LHSReg, uint64_t Imm);

  unsigned emitMul_rr(MVT RetVT, unsigned Op0, unsigned Op1);

  unsigned emitSMULL_rr(MVT RetVT, unsigned Op0, unsigned Op1);

  unsigned emitUMULL_rr(MVT RetVT, unsigned Op0, unsigned Op1);

  unsigned emitLSL_rr(MVT RetVT, unsigned Op0Reg, unsigned Op1Reg);

  unsigned emitLSL_ri(MVT RetVT, MVT SrcVT, unsigned Op0Reg, uint64_t Imm,

                      bool IsZExt = true);

  unsigned emitLSR_rr(MVT RetVT, unsigned Op0Reg, unsigned Op1Reg);

  unsigned emitLSR_ri(MVT RetVT, MVT SrcVT, unsigned Op0Reg, uint64_t Imm,

                      bool IsZExt = true);

  unsigned emitASR_rr(MVT RetVT, unsigned Op0Reg, unsigned Op1Reg);

  unsigned emitASR_ri(MVT RetVT, MVT SrcVT, unsigned Op0Reg, uint64_t Imm,

                      bool IsZExt = false);


  unsigned materializeInt(const ConstantInt *CI, MVT VT);

  unsigned materializeFP(const ConstantFP *CFP, MVT VT);

  unsigned materializeGV(const GlobalValue *GV);


  // Call handling routines.

private:

  CCAssignFn *CCAssignFnForCall(CallingConv::ID CC) const;

  bool processCallArgs(CallLoweringInfo &CLI, SmallVectorImpl<MVT> &ArgVTs,

                       unsigned &NumBytes);

  bool finishCall(CallLoweringInfo &CLI, unsigned NumBytes);


public:

  // Backend specific FastISel code.

  unsigned fastMaterializeAlloca(const AllocaInst *AI) override;

  unsigned fastMaterializeConstant(const Constant *C) override;

  unsigned fastMaterializeFloatZero(const ConstantFP* CF) override;


  explicit AArch64FastISel(FunctionLoweringInfo &FuncInfo,

                           const TargetLibraryInfo *LibInfo)

      : FastISel(FuncInfo, LibInfo, /*SkipTargetIndependentISel=*/true) {

    Subtarget = &FuncInfo.MF->getSubtarget<AArch64Subtarget>();

    Context = &FuncInfo.Fn->getContext();

  }


  bool fastSelectInstruction(const Instruction *I) override;


#include "AArch64GenFastISel.inc"

};


} // end anonymous namespace


/// Check if the sign-/zero-extend will be a noop.

static bool isIntExtFree(const Instruction *I) {

  assert((isa<ZExtInst>(I) || isa<SExtInst>(I)) &&

         "Unexpected integer extend instruction.");

  assert(!I->getType()->isVectorTy() && I->getType()->isIntegerTy() &&

         "Unexpected value type.");

  bool IsZExt = isa<ZExtInst>(I);


  if (const auto *LI = dyn_cast<LoadInst>(I->getOperand(0)))

    if (LI->hasOneUse())

      return true;


  if (const auto *Arg = dyn_cast<Argument>(I->getOperand(0)))

    if ((IsZExt && Arg->hasZExtAttr()) || (!IsZExt && Arg->hasSExtAttr()))

      return true;


  return false;

}


/// Determine the implicit scale factor that is applied by a memory

/// operation for a given value type.

static unsigned getImplicitScaleFactor(MVT VT) {

  switch (VT.SimpleTy) {

  default:

    return 0;    // invalid

  case MVT::i1:  // fall-through

  case MVT::i8:

    return 1;

  case MVT::i16:

    return 2;

  case MVT::i32: // fall-through

  case MVT::f32:

    return 4;

  case MVT::i64: // fall-through

  case MVT::f64:

    return 8;

  }

}


CCAssignFn *AArch64FastISel::CCAssignFnForCall(CallingConv::ID CC) const {

  if (CC == CallingConv::GHC)

    return CC_AArch64_GHC;

  if (CC == CallingConv::CFGuard_Check)

    return CC_AArch64_Win64_CFGuard_Check;

  if (Subtarget->isTargetDarwin())

    return CC_AArch64_DarwinPCS;

  if (Subtarget->isTargetWindows())

    return CC_AArch64_Win64PCS;

  return CC_AArch64_AAPCS;

}


unsigned AArch64FastISel::fastMaterializeAlloca(const AllocaInst *AI) {

  assert(TLI.getValueType(DL, AI->getType(), true) == MVT::i64 &&

         "Alloca should always return a pointer.");


  // Don't handle dynamic allocas.

  if (!FuncInfo.StaticAllocaMap.count(AI))

    return 0;


  DenseMap<const AllocaInst *, int>::iterator SI =

      FuncInfo.StaticAllocaMap.find(AI);


  if (SI != FuncInfo.StaticAllocaMap.end()) {

    Register ResultReg = createResultReg(&AArch64::GPR64spRegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::ADDXri),

            ResultReg)

        .addFrameIndex(SI->second)

        .addImm(0)

        .addImm(0);

    return ResultReg;

  }


  return 0;

}


unsigned AArch64FastISel::materializeInt(const ConstantInt *CI, MVT VT) {

  if (VT > MVT::i64)

    return 0;


  if (!CI->isZero())

    return fastEmit_i(VT, VT, ISD::Constant, CI->getZExtValue());


  // Create a copy from the zero register to materialize a "0" value.

  const TargetRegisterClass *RC = (VT == MVT::i64) ? &AArch64::GPR64RegClass

                                                   : &AArch64::GPR32RegClass;

  unsigned ZeroReg = (VT == MVT::i64) ? AArch64::XZR : AArch64::WZR;

  Register ResultReg = createResultReg(RC);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(TargetOpcode::COPY),

          ResultReg).addReg(ZeroReg, getKillRegState(true));

  return ResultReg;

}


unsigned AArch64FastISel::materializeFP(const ConstantFP *CFP, MVT VT) {

  // Positive zero (+0.0) has to be materialized with a fmov from the zero

  // register, because the immediate version of fmov cannot encode zero.

  if (CFP->isNullValue())

    return fastMaterializeFloatZero(CFP);


  if (VT != MVT::f32 && VT != MVT::f64)

    return 0;


  const APFloat Val = CFP->getValueAPF();

  bool Is64Bit = (VT == MVT::f64);

  // This checks to see if we can use FMOV instructions to materialize

  // a constant, otherwise we have to materialize via the constant pool.

  int Imm =

      Is64Bit ? AArch64_AM::getFP64Imm(Val) : AArch64_AM::getFP32Imm(Val);

  if (Imm != -1) {

    unsigned Opc = Is64Bit ? AArch64::FMOVDi : AArch64::FMOVSi;

    return fastEmitInst_i(Opc, TLI.getRegClassFor(VT), Imm);

  }


  // For the large code model materialize the FP constant in code.

  if (TM.getCodeModel() == CodeModel::Large) {

    unsigned Opc1 = Is64Bit ? AArch64::MOVi64imm : AArch64::MOVi32imm;

    const TargetRegisterClass *RC = Is64Bit ?

        &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;


    Register TmpReg = createResultReg(RC);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(Opc1), TmpReg)

        .addImm(CFP->getValueAPF().bitcastToAPInt().getZExtValue());


    Register ResultReg = createResultReg(TLI.getRegClassFor(VT));

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(TargetOpcode::COPY), ResultReg)

        .addReg(TmpReg, getKillRegState(true));


    return ResultReg;

  }


  // Materialize via constant pool.  MachineConstantPool wants an explicit

  // alignment.

  Align Alignment = DL.getPrefTypeAlign(CFP->getType());


  unsigned CPI = MCP.getConstantPoolIndex(cast<Constant>(CFP), Alignment);

  Register ADRPReg = createResultReg(&AArch64::GPR64commonRegClass);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::ADRP),

          ADRPReg).addConstantPoolIndex(CPI, 0, AArch64II::MO_PAGE);


  unsigned Opc = Is64Bit ? AArch64::LDRDui : AArch64::LDRSui;

  Register ResultReg = createResultReg(TLI.getRegClassFor(VT));

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(Opc), ResultReg)

      .addReg(ADRPReg)

      .addConstantPoolIndex(CPI, 0, AArch64II::MO_PAGEOFF | AArch64II::MO_NC);

  return ResultReg;

}


unsigned AArch64FastISel::materializeGV(const GlobalValue *GV) {

  // We can't handle thread-local variables quickly yet.

  if (GV->isThreadLocal())

    return 0;


  // MachO still uses GOT for large code-model accesses, but ELF requires

  // movz/movk sequences, which FastISel doesn't handle yet.

  if (!Subtarget->useSmallAddressing() && !Subtarget->isTargetMachO())

    return 0;


  if (FuncInfo.MF->getInfo<AArch64FunctionInfo>()->hasELFSignedGOT())

    return 0;


  unsigned OpFlags = Subtarget->ClassifyGlobalReference(GV, TM);


  EVT DestEVT = TLI.getValueType(DL, GV->getType(), true);

  if (!DestEVT.isSimple())

    return 0;


  Register ADRPReg = createResultReg(&AArch64::GPR64commonRegClass);

  unsigned ResultReg;


  if (OpFlags & AArch64II::MO_GOT) {

    // ADRP + LDRX

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::ADRP),

            ADRPReg)

        .addGlobalAddress(GV, 0, AArch64II::MO_PAGE | OpFlags);


    unsigned LdrOpc;

    if (Subtarget->isTargetILP32()) {

      ResultReg = createResultReg(&AArch64::GPR32RegClass);

      LdrOpc = AArch64::LDRWui;

    } else {

      ResultReg = createResultReg(&AArch64::GPR64RegClass);

      LdrOpc = AArch64::LDRXui;

    }

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(LdrOpc),

            ResultReg)

      .addReg(ADRPReg)

      .addGlobalAddress(GV, 0, AArch64II::MO_GOT | AArch64II::MO_PAGEOFF |

                        AArch64II::MO_NC | OpFlags);

    if (!Subtarget->isTargetILP32())

      return ResultReg;


    // LDRWui produces a 32-bit register, but pointers in-register are 64-bits

    // so we must extend the result on ILP32.

    Register Result64 = createResultReg(&AArch64::GPR64RegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(TargetOpcode::SUBREG_TO_REG))

        .addDef(Result64)

        .addImm(0)

        .addReg(ResultReg, RegState::Kill)

        .addImm(AArch64::sub_32);

    return Result64;

  } else {

    // ADRP + ADDX

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::ADRP),

            ADRPReg)

        .addGlobalAddress(GV, 0, AArch64II::MO_PAGE | OpFlags);


    if (OpFlags & AArch64II::MO_TAGGED) {

      // MO_TAGGED on the page indicates a tagged address. Set the tag now.

      // We do so by creating a MOVK that sets bits 48-63 of the register to

      // (global address + 0x100000000 - PC) >> 48. This assumes that we're in

      // the small code model so we can assume a binary size of <= 4GB, which

      // makes the untagged PC relative offset positive. The binary must also be

      // loaded into address range [0, 2^48). Both of these properties need to

      // be ensured at runtime when using tagged addresses.

      //

      // TODO: There is duplicate logic in AArch64ExpandPseudoInsts.cpp that

      // also uses BuildMI for making an ADRP (+ MOVK) + ADD, but the operands

      // are not exactly 1:1 with FastISel so we cannot easily abstract this

      // out. At some point, it would be nice to find a way to not have this

      // duplciate code.

      unsigned DstReg = createResultReg(&AArch64::GPR64commonRegClass);

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::MOVKXi),

              DstReg)

          .addReg(ADRPReg)

          .addGlobalAddress(GV, /*Offset=*/0x100000000,

                            AArch64II::MO_PREL | AArch64II::MO_G3)

          .addImm(48);

      ADRPReg = DstReg;

    }


    ResultReg = createResultReg(&AArch64::GPR64spRegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::ADDXri),

            ResultReg)

        .addReg(ADRPReg)

        .addGlobalAddress(GV, 0,

                          AArch64II::MO_PAGEOFF | AArch64II::MO_NC | OpFlags)

        .addImm(0);

  }

  return ResultReg;

}


unsigned AArch64FastISel::fastMaterializeConstant(const Constant *C) {

  EVT CEVT = TLI.getValueType(DL, C->getType(), true);


  // Only handle simple types.

  if (!CEVT.isSimple())

    return 0;

  MVT VT = CEVT.getSimpleVT();

  // arm64_32 has 32-bit pointers held in 64-bit registers. Because of that,

  // 'null' pointers need to have a somewhat special treatment.

  if (isa<ConstantPointerNull>(C)) {

    assert(VT == MVT::i64 && "Expected 64-bit pointers");

    return materializeInt(ConstantInt::get(Type::getInt64Ty(*Context), 0), VT);

  }


  if (const auto *CI = dyn_cast<ConstantInt>(C))

    return materializeInt(CI, VT);

  else if (const ConstantFP *CFP = dyn_cast<ConstantFP>(C))

    return materializeFP(CFP, VT);

  else if (const GlobalValue *GV = dyn_cast<GlobalValue>(C))

    return materializeGV(GV);


  return 0;

}


unsigned AArch64FastISel::fastMaterializeFloatZero(const ConstantFP* CFP) {

  assert(CFP->isNullValue() &&

         "Floating-point constant is not a positive zero.");

  MVT VT;

  if (!isTypeLegal(CFP->getType(), VT))

    return 0;


  if (VT != MVT::f32 && VT != MVT::f64)

    return 0;


  bool Is64Bit = (VT == MVT::f64);

  unsigned ZReg = Is64Bit ? AArch64::XZR : AArch64::WZR;

  unsigned Opc = Is64Bit ? AArch64::FMOVXDr : AArch64::FMOVWSr;

  return fastEmitInst_r(Opc, TLI.getRegClassFor(VT), ZReg);

}


/// Check if the multiply is by a power-of-2 constant.

static bool isMulPowOf2(const Value *I) {

  if (const auto *MI = dyn_cast<MulOperator>(I)) {

    if (const auto *C = dyn_cast<ConstantInt>(MI->getOperand(0)))

      if (C->getValue().isPowerOf2())

        return true;

    if (const auto *C = dyn_cast<ConstantInt>(MI->getOperand(1)))

      if (C->getValue().isPowerOf2())

        return true;

  }

  return false;

}


// Computes the address to get to an object.

bool AArch64FastISel::computeAddress(const Value *Obj, Address &Addr, Type *Ty)

{

  const User *U = nullptr;

  unsigned Opcode = Instruction::UserOp1;

  if (const Instruction *I = dyn_cast<Instruction>(Obj)) {

    // Don't walk into other basic blocks unless the object is an alloca from

    // another block, otherwise it may not have a virtual register assigned.

    if (FuncInfo.StaticAllocaMap.count(static_cast<const AllocaInst *>(Obj)) ||

        FuncInfo.getMBB(I->getParent()) == FuncInfo.MBB) {

      Opcode = I->getOpcode();

      U = I;

    }

  } else if (const ConstantExpr *C = dyn_cast<ConstantExpr>(Obj)) {

    Opcode = C->getOpcode();

    U = C;

  }


  if (auto *Ty = dyn_cast<PointerType>(Obj->getType()))

    if (Ty->getAddressSpace() > 255)

      // Fast instruction selection doesn't support the special

      // address spaces.

      return false;


  switch (Opcode) {

  default:

    break;

  case Instruction::BitCast:

    // Look through bitcasts.

    return computeAddress(U->getOperand(0), Addr, Ty);


  case Instruction::IntToPtr:

    // Look past no-op inttoptrs.

    if (TLI.getValueType(DL, U->getOperand(0)->getType()) ==

        TLI.getPointerTy(DL))

      return computeAddress(U->getOperand(0), Addr, Ty);

    break;


  case Instruction::PtrToInt:

    // Look past no-op ptrtoints.

    if (TLI.getValueType(DL, U->getType()) == TLI.getPointerTy(DL))

      return computeAddress(U->getOperand(0), Addr, Ty);

    break;


  case Instruction::GetElementPtr: {

    Address SavedAddr = Addr;

    uint64_t TmpOffset = Addr.getOffset();


    // Iterate through the GEP folding the constants into offsets where

    // we can.

    for (gep_type_iterator GTI = gep_type_begin(U), E = gep_type_end(U);

         GTI != E; ++GTI) {

      const Value *Op = GTI.getOperand();

      if (StructType *STy = GTI.getStructTypeOrNull()) {

        const StructLayout *SL = DL.getStructLayout(STy);

        unsigned Idx = cast<ConstantInt>(Op)->getZExtValue();

        TmpOffset += SL->getElementOffset(Idx);

      } else {

        uint64_t S = GTI.getSequentialElementStride(DL);

        while (true) {

          if (const ConstantInt *CI = dyn_cast<ConstantInt>(Op)) {

            // Constant-offset addressing.

            TmpOffset += CI->getSExtValue() * S;

            break;

          }

          if (canFoldAddIntoGEP(U, Op)) {

            // A compatible add with a constant operand. Fold the constant.

            ConstantInt *CI =

                cast<ConstantInt>(cast<AddOperator>(Op)->getOperand(1));

            TmpOffset += CI->getSExtValue() * S;

            // Iterate on the other operand.

            Op = cast<AddOperator>(Op)->getOperand(0);

            continue;

          }

          // Unsupported

          goto unsupported_gep;

        }

      }

    }


    // Try to grab the base operand now.

    Addr.setOffset(TmpOffset);

    if (computeAddress(U->getOperand(0), Addr, Ty))

      return true;


    // We failed, restore everything and try the other options.

    Addr = SavedAddr;


  unsupported_gep:

    break;

  }

  case Instruction::Alloca: {

    const AllocaInst *AI = cast<AllocaInst>(Obj);

    DenseMap<const AllocaInst *, int>::iterator SI =

        FuncInfo.StaticAllocaMap.find(AI);

    if (SI != FuncInfo.StaticAllocaMap.end()) {

      Addr.setKind(Address::FrameIndexBase);

      Addr.setFI(SI->second);

      return true;

    }

    break;

  }

  case Instruction::Add: {

    // Adds of constants are common and easy enough.

    const Value *LHS = U->getOperand(0);

    const Value *RHS = U->getOperand(1);


    if (isa<ConstantInt>(LHS))

      std::swap(LHS, RHS);


    if (const ConstantInt *CI = dyn_cast<ConstantInt>(RHS)) {

      Addr.setOffset(Addr.getOffset() + CI->getSExtValue());

      return computeAddress(LHS, Addr, Ty);

    }


    Address Backup = Addr;

    if (computeAddress(LHS, Addr, Ty) && computeAddress(RHS, Addr, Ty))

      return true;

    Addr = Backup;


    break;

  }

  case Instruction::Sub: {

    // Subs of constants are common and easy enough.

    const Value *LHS = U->getOperand(0);

    const Value *RHS = U->getOperand(1);


    if (const ConstantInt *CI = dyn_cast<ConstantInt>(RHS)) {

      Addr.setOffset(Addr.getOffset() - CI->getSExtValue());

      return computeAddress(LHS, Addr, Ty);

    }

    break;

  }

  case Instruction::Shl: {

    if (Addr.getOffsetReg())

      break;


    const auto *CI = dyn_cast<ConstantInt>(U->getOperand(1));

    if (!CI)

      break;


    unsigned Val = CI->getZExtValue();

    if (Val < 1 || Val > 3)

      break;


    uint64_t NumBytes = 0;

    if (Ty && Ty->isSized()) {

      uint64_t NumBits = DL.getTypeSizeInBits(Ty);

      NumBytes = NumBits / 8;

      if (!isPowerOf2_64(NumBits))

        NumBytes = 0;

    }


    if (NumBytes != (1ULL << Val))

      break;


    Addr.setShift(Val);

    Addr.setExtendType(AArch64_AM::LSL);


    const Value *Src = U->getOperand(0);

    if (const auto *I = dyn_cast<Instruction>(Src)) {

      if (FuncInfo.getMBB(I->getParent()) == FuncInfo.MBB) {

        // Fold the zext or sext when it won't become a noop.

        if (const auto *ZE = dyn_cast<ZExtInst>(I)) {

          if (!isIntExtFree(ZE) &&

              ZE->getOperand(0)->getType()->isIntegerTy(32)) {

            Addr.setExtendType(AArch64_AM::UXTW);

            Src = ZE->getOperand(0);

          }

        } else if (const auto *SE = dyn_cast<SExtInst>(I)) {

          if (!isIntExtFree(SE) &&

              SE->getOperand(0)->getType()->isIntegerTy(32)) {

            Addr.setExtendType(AArch64_AM::SXTW);

            Src = SE->getOperand(0);

          }

        }

      }

    }


    if (const auto *AI = dyn_cast<BinaryOperator>(Src))

      if (AI->getOpcode() == Instruction::And) {

        const Value *LHS = AI->getOperand(0);

        const Value *RHS = AI->getOperand(1);


        if (const auto *C = dyn_cast<ConstantInt>(LHS))

          if (C->getValue() == 0xffffffff)

            std::swap(LHS, RHS);


        if (const auto *C = dyn_cast<ConstantInt>(RHS))

          if (C->getValue() == 0xffffffff) {

            Addr.setExtendType(AArch64_AM::UXTW);

            Register Reg = getRegForValue(LHS);

            if (!Reg)

              return false;

            Reg = fastEmitInst_extractsubreg(MVT::i32, Reg, AArch64::sub_32);

            Addr.setOffsetReg(Reg);

            return true;

          }

      }


    Register Reg = getRegForValue(Src);

    if (!Reg)

      return false;

    Addr.setOffsetReg(Reg);

    return true;

  }

  case Instruction::Mul: {

    if (Addr.getOffsetReg())

      break;


    if (!isMulPowOf2(U))

      break;


    const Value *LHS = U->getOperand(0);

    const Value *RHS = U->getOperand(1);


    // Canonicalize power-of-2 value to the RHS.

    if (const auto *C = dyn_cast<ConstantInt>(LHS))

      if (C->getValue().isPowerOf2())

        std::swap(LHS, RHS);


    assert(isa<ConstantInt>(RHS) && "Expected an ConstantInt.");

    const auto *C = cast<ConstantInt>(RHS);

    unsigned Val = C->getValue().logBase2();

    if (Val < 1 || Val > 3)

      break;


    uint64_t NumBytes = 0;

    if (Ty && Ty->isSized()) {

      uint64_t NumBits = DL.getTypeSizeInBits(Ty);

      NumBytes = NumBits / 8;

      if (!isPowerOf2_64(NumBits))

        NumBytes = 0;

    }


    if (NumBytes != (1ULL << Val))

      break;


    Addr.setShift(Val);

    Addr.setExtendType(AArch64_AM::LSL);


    const Value *Src = LHS;

    if (const auto *I = dyn_cast<Instruction>(Src)) {

      if (FuncInfo.getMBB(I->getParent()) == FuncInfo.MBB) {

        // Fold the zext or sext when it won't become a noop.

        if (const auto *ZE = dyn_cast<ZExtInst>(I)) {

          if (!isIntExtFree(ZE) &&

              ZE->getOperand(0)->getType()->isIntegerTy(32)) {

            Addr.setExtendType(AArch64_AM::UXTW);

            Src = ZE->getOperand(0);

          }

        } else if (const auto *SE = dyn_cast<SExtInst>(I)) {

          if (!isIntExtFree(SE) &&

              SE->getOperand(0)->getType()->isIntegerTy(32)) {

            Addr.setExtendType(AArch64_AM::SXTW);

            Src = SE->getOperand(0);

          }

        }

      }

    }


    Register Reg = getRegForValue(Src);

    if (!Reg)

      return false;

    Addr.setOffsetReg(Reg);

    return true;

  }

  case Instruction::And: {

    if (Addr.getOffsetReg())

      break;


    if (!Ty || DL.getTypeSizeInBits(Ty) != 8)

      break;


    const Value *LHS = U->getOperand(0);

    const Value *RHS = U->getOperand(1);


    if (const auto *C = dyn_cast<ConstantInt>(LHS))

      if (C->getValue() == 0xffffffff)

        std::swap(LHS, RHS);


    if (const auto *C = dyn_cast<ConstantInt>(RHS))

      if (C->getValue() == 0xffffffff) {

        Addr.setShift(0);

        Addr.setExtendType(AArch64_AM::LSL);

        Addr.setExtendType(AArch64_AM::UXTW);


        Register Reg = getRegForValue(LHS);

        if (!Reg)

          return false;

        Reg = fastEmitInst_extractsubreg(MVT::i32, Reg, AArch64::sub_32);

        Addr.setOffsetReg(Reg);

        return true;

      }

    break;

  }

  case Instruction::SExt:

  case Instruction::ZExt: {

    if (!Addr.getReg() || Addr.getOffsetReg())

      break;


    const Value *Src = nullptr;

    // Fold the zext or sext when it won't become a noop.

    if (const auto *ZE = dyn_cast<ZExtInst>(U)) {

      if (!isIntExtFree(ZE) && ZE->getOperand(0)->getType()->isIntegerTy(32)) {

        Addr.setExtendType(AArch64_AM::UXTW);

        Src = ZE->getOperand(0);

      }

    } else if (const auto *SE = dyn_cast<SExtInst>(U)) {

      if (!isIntExtFree(SE) && SE->getOperand(0)->getType()->isIntegerTy(32)) {

        Addr.setExtendType(AArch64_AM::SXTW);

        Src = SE->getOperand(0);

      }

    }


    if (!Src)

      break;


    Addr.setShift(0);

    Register Reg = getRegForValue(Src);

    if (!Reg)

      return false;

    Addr.setOffsetReg(Reg);

    return true;

  }

  } // end switch


  if (Addr.isRegBase() && !Addr.getReg()) {

    Register Reg = getRegForValue(Obj);

    if (!Reg)

      return false;

    Addr.setReg(Reg);

    return true;

  }


  if (!Addr.getOffsetReg()) {

    Register Reg = getRegForValue(Obj);

    if (!Reg)

      return false;

    Addr.setOffsetReg(Reg);

    return true;

  }


  return false;

}


bool AArch64FastISel::computeCallAddress(const Value *V, Address &Addr) {

  const User *U = nullptr;

  unsigned Opcode = Instruction::UserOp1;

  bool InMBB = true;


  if (const auto *I = dyn_cast<Instruction>(V)) {

    Opcode = I->getOpcode();

    U = I;

    InMBB = I->getParent() == FuncInfo.MBB->getBasicBlock();

  } else if (const auto *C = dyn_cast<ConstantExpr>(V)) {

    Opcode = C->getOpcode();

    U = C;

  }


  switch (Opcode) {

  default: break;

  case Instruction::BitCast:

    // Look past bitcasts if its operand is in the same BB.

    if (InMBB)

      return computeCallAddress(U->getOperand(0), Addr);

    break;

  case Instruction::IntToPtr:

    // Look past no-op inttoptrs if its operand is in the same BB.

    if (InMBB &&

        TLI.getValueType(DL, U->getOperand(0)->getType()) ==

            TLI.getPointerTy(DL))

      return computeCallAddress(U->getOperand(0), Addr);

    break;

  case Instruction::PtrToInt:

    // Look past no-op ptrtoints if its operand is in the same BB.

    if (InMBB && TLI.getValueType(DL, U->getType()) == TLI.getPointerTy(DL))

      return computeCallAddress(U->getOperand(0), Addr);

    break;

  }


  if (const GlobalValue *GV = dyn_cast<GlobalValue>(V)) {

    Addr.setGlobalValue(GV);

    return true;

  }


  // If all else fails, try to materialize the value in a register.

  if (!Addr.getGlobalValue()) {

    Addr.setReg(getRegForValue(V));

    return Addr.getReg() != 0;

  }


  return false;

}


bool AArch64FastISel::isTypeLegal(Type *Ty, MVT &VT) {

  EVT evt = TLI.getValueType(DL, Ty, true);


  if (Subtarget->isTargetILP32() && Ty->isPointerTy())

    return false;


  // Only handle simple types.

  if (evt == MVT::Other || !evt.isSimple())

    return false;

  VT = evt.getSimpleVT();


  // This is a legal type, but it's not something we handle in fast-isel.

  if (VT == MVT::f128)

    return false;


  // Handle all other legal types, i.e. a register that will directly hold this

  // value.

  return TLI.isTypeLegal(VT);

}


/// Determine if the value type is supported by FastISel.

///

/// FastISel for AArch64 can handle more value types than are legal. This adds

/// simple value type such as i1, i8, and i16.

bool AArch64FastISel::isTypeSupported(Type *Ty, MVT &VT, bool IsVectorAllowed) {

  if (Ty->isVectorTy() && !IsVectorAllowed)

    return false;


  if (isTypeLegal(Ty, VT))

    return true;


  // If this is a type than can be sign or zero-extended to a basic operation

  // go ahead and accept it now.

  if (VT == MVT::i1 || VT == MVT::i8 || VT == MVT::i16)

    return true;


  return false;

}


bool AArch64FastISel::isValueAvailable(const Value *V) const {

  if (!isa<Instruction>(V))

    return true;


  const auto *I = cast<Instruction>(V);

  return FuncInfo.getMBB(I->getParent()) == FuncInfo.MBB;

}


bool AArch64FastISel::simplifyAddress(Address &Addr, MVT VT) {

  if (Subtarget->isTargetILP32())

    return false;


  unsigned ScaleFactor = getImplicitScaleFactor(VT);

  if (!ScaleFactor)

    return false;


  bool ImmediateOffsetNeedsLowering = false;

  bool RegisterOffsetNeedsLowering = false;

  int64_t Offset = Addr.getOffset();

  if (((Offset < 0) || (Offset & (ScaleFactor - 1))) && !isInt<9>(Offset))

    ImmediateOffsetNeedsLowering = true;

  else if (Offset > 0 && !(Offset & (ScaleFactor - 1)) &&

           !isUInt<12>(Offset / ScaleFactor))

    ImmediateOffsetNeedsLowering = true;


  // Cannot encode an offset register and an immediate offset in the same

  // instruction. Fold the immediate offset into the load/store instruction and

  // emit an additional add to take care of the offset register.

  if (!ImmediateOffsetNeedsLowering && Addr.getOffset() && Addr.getOffsetReg())

    RegisterOffsetNeedsLowering = true;


  // Cannot encode zero register as base.

  if (Addr.isRegBase() && Addr.getOffsetReg() && !Addr.getReg())

    RegisterOffsetNeedsLowering = true;


  // If this is a stack pointer and the offset needs to be simplified then put

  // the alloca address into a register, set the base type back to register and

  // continue. This should almost never happen.

  if ((ImmediateOffsetNeedsLowering || Addr.getOffsetReg()) && Addr.isFIBase())

  {

    Register ResultReg = createResultReg(&AArch64::GPR64spRegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::ADDXri),

            ResultReg)

      .addFrameIndex(Addr.getFI())

      .addImm(0)

      .addImm(0);

    Addr.setKind(Address::RegBase);

    Addr.setReg(ResultReg);

  }


  if (RegisterOffsetNeedsLowering) {

    unsigned ResultReg = 0;

    if (Addr.getReg()) {

      if (Addr.getExtendType() == AArch64_AM::SXTW ||

          Addr.getExtendType() == AArch64_AM::UXTW   )

        ResultReg = emitAddSub_rx(/*UseAdd=*/true, MVT::i64, Addr.getReg(),

                                  Addr.getOffsetReg(), Addr.getExtendType(),

                                  Addr.getShift());

      else

        ResultReg = emitAddSub_rs(/*UseAdd=*/true, MVT::i64, Addr.getReg(),

                                  Addr.getOffsetReg(), AArch64_AM::LSL,

                                  Addr.getShift());

    } else {

      if (Addr.getExtendType() == AArch64_AM::UXTW)

        ResultReg = emitLSL_ri(MVT::i64, MVT::i32, Addr.getOffsetReg(),

                               Addr.getShift(), /*IsZExt=*/true);

      else if (Addr.getExtendType() == AArch64_AM::SXTW)

        ResultReg = emitLSL_ri(MVT::i64, MVT::i32, Addr.getOffsetReg(),

                               Addr.getShift(), /*IsZExt=*/false);

      else

        ResultReg = emitLSL_ri(MVT::i64, MVT::i64, Addr.getOffsetReg(),

                               Addr.getShift());

    }

    if (!ResultReg)

      return false;


    Addr.setReg(ResultReg);

    Addr.setOffsetReg(0);

    Addr.setShift(0);

    Addr.setExtendType(AArch64_AM::InvalidShiftExtend);

  }


  // Since the offset is too large for the load/store instruction get the

  // reg+offset into a register.

  if (ImmediateOffsetNeedsLowering) {

    unsigned ResultReg;

    if (Addr.getReg())

      // Try to fold the immediate into the add instruction.

      ResultReg = emitAdd_ri_(MVT::i64, Addr.getReg(), Offset);

    else

      ResultReg = fastEmit_i(MVT::i64, MVT::i64, ISD::Constant, Offset);


    if (!ResultReg)

      return false;

    Addr.setReg(ResultReg);

    Addr.setOffset(0);

  }

  return true;

}


void AArch64FastISel::addLoadStoreOperands(Address &Addr,

                                           const MachineInstrBuilder &MIB,

                                           MachineMemOperand::Flags Flags,

                                           unsigned ScaleFactor,

                                           MachineMemOperand *MMO) {

  int64_t Offset = Addr.getOffset() / ScaleFactor;

  // Frame base works a bit differently. Handle it separately.

  if (Addr.isFIBase()) {

    int FI = Addr.getFI();

    // FIXME: We shouldn't be using getObjectSize/getObjectAlignment.  The size

    // and alignment should be based on the VT.

    MMO = FuncInfo.MF->getMachineMemOperand(

        MachinePointerInfo::getFixedStack(*FuncInfo.MF, FI, Offset), Flags,

        MFI.getObjectSize(FI), MFI.getObjectAlign(FI));

    // Now add the rest of the operands.

    MIB.addFrameIndex(FI).addImm(Offset);

  } else {

    assert(Addr.isRegBase() && "Unexpected address kind.");

    const MCInstrDesc &II = MIB->getDesc();

    unsigned Idx = (Flags & MachineMemOperand::MOStore) ? 1 : 0;

    Addr.setReg(

      constrainOperandRegClass(II, Addr.getReg(), II.getNumDefs()+Idx));

    Addr.setOffsetReg(

      constrainOperandRegClass(II, Addr.getOffsetReg(), II.getNumDefs()+Idx+1));

    if (Addr.getOffsetReg()) {

      assert(Addr.getOffset() == 0 && "Unexpected offset");

      bool IsSigned = Addr.getExtendType() == AArch64_AM::SXTW ||

                      Addr.getExtendType() == AArch64_AM::SXTX;

      MIB.addReg(Addr.getReg());

      MIB.addReg(Addr.getOffsetReg());

      MIB.addImm(IsSigned);

      MIB.addImm(Addr.getShift() != 0);

    } else

      MIB.addReg(Addr.getReg()).addImm(Offset);

  }


  if (MMO)

    MIB.addMemOperand(MMO);

}


unsigned AArch64FastISel::emitAddSub(bool UseAdd, MVT RetVT, const Value *LHS,

                                     const Value *RHS, bool SetFlags,

                                     bool WantResult,  bool IsZExt) {

  AArch64_AM::ShiftExtendType ExtendType = AArch64_AM::InvalidShiftExtend;

  bool NeedExtend = false;

  switch (RetVT.SimpleTy) {

  default:

    return 0;

  case MVT::i1:

    NeedExtend = true;

    break;

  case MVT::i8:

    NeedExtend = true;

    ExtendType = IsZExt ? AArch64_AM::UXTB : AArch64_AM::SXTB;

    break;

  case MVT::i16:

    NeedExtend = true;

    ExtendType = IsZExt ? AArch64_AM::UXTH : AArch64_AM::SXTH;

    break;

  case MVT::i32:  // fall-through

  case MVT::i64:

    break;

  }

  MVT SrcVT = RetVT;

  RetVT.SimpleTy = std::max(RetVT.SimpleTy, MVT::i32);


  // Canonicalize immediates to the RHS first.

  if (UseAdd && isa<Constant>(LHS) && !isa<Constant>(RHS))

    std::swap(LHS, RHS);


  // Canonicalize mul by power of 2 to the RHS.

  if (UseAdd && LHS->hasOneUse() && isValueAvailable(LHS))

    if (isMulPowOf2(LHS))

      std::swap(LHS, RHS);


  // Canonicalize shift immediate to the RHS.

  if (UseAdd && LHS->hasOneUse() && isValueAvailable(LHS))

    if (const auto *SI = dyn_cast<BinaryOperator>(LHS))

      if (isa<ConstantInt>(SI->getOperand(1)))

        if (SI->getOpcode() == Instruction::Shl  ||

            SI->getOpcode() == Instruction::LShr ||

            SI->getOpcode() == Instruction::AShr   )

          std::swap(LHS, RHS);


  Register LHSReg = getRegForValue(LHS);

  if (!LHSReg)

    return 0;


  if (NeedExtend)

    LHSReg = emitIntExt(SrcVT, LHSReg, RetVT, IsZExt);


  unsigned ResultReg = 0;

  if (const auto *C = dyn_cast<ConstantInt>(RHS)) {

    uint64_t Imm = IsZExt ? C->getZExtValue() : C->getSExtValue();

    if (C->isNegative())

      ResultReg = emitAddSub_ri(!UseAdd, RetVT, LHSReg, -Imm, SetFlags,

                                WantResult);

    else

      ResultReg = emitAddSub_ri(UseAdd, RetVT, LHSReg, Imm, SetFlags,

                                WantResult);

  } else if (const auto *C = dyn_cast<Constant>(RHS))

    if (C->isNullValue())

      ResultReg = emitAddSub_ri(UseAdd, RetVT, LHSReg, 0, SetFlags, WantResult);


  if (ResultReg)

    return ResultReg;


  // Only extend the RHS within the instruction if there is a valid extend type.

  if (ExtendType != AArch64_AM::InvalidShiftExtend && RHS->hasOneUse() &&

      isValueAvailable(RHS)) {

    Register RHSReg = getRegForValue(RHS);

    if (!RHSReg)

      return 0;

    return emitAddSub_rx(UseAdd, RetVT, LHSReg, RHSReg, ExtendType, 0,

                         SetFlags, WantResult);

  }


  // Check if the mul can be folded into the instruction.

  if (RHS->hasOneUse() && isValueAvailable(RHS)) {

    if (isMulPowOf2(RHS)) {

      const Value *MulLHS = cast<MulOperator>(RHS)->getOperand(0);

      const Value *MulRHS = cast<MulOperator>(RHS)->getOperand(1);


      if (const auto *C = dyn_cast<ConstantInt>(MulLHS))

        if (C->getValue().isPowerOf2())

          std::swap(MulLHS, MulRHS);


      assert(isa<ConstantInt>(MulRHS) && "Expected a ConstantInt.");

      uint64_t ShiftVal = cast<ConstantInt>(MulRHS)->getValue().logBase2();

      Register RHSReg = getRegForValue(MulLHS);

      if (!RHSReg)

        return 0;

      ResultReg = emitAddSub_rs(UseAdd, RetVT, LHSReg, RHSReg, AArch64_AM::LSL,

                                ShiftVal, SetFlags, WantResult);

      if (ResultReg)

        return ResultReg;

    }

  }


  // Check if the shift can be folded into the instruction.

  if (RHS->hasOneUse() && isValueAvailable(RHS)) {

    if (const auto *SI = dyn_cast<BinaryOperator>(RHS)) {

      if (const auto *C = dyn_cast<ConstantInt>(SI->getOperand(1))) {

        AArch64_AM::ShiftExtendType ShiftType = AArch64_AM::InvalidShiftExtend;

        switch (SI->getOpcode()) {

        default: break;

        case Instruction::Shl:  ShiftType = AArch64_AM::LSL; break;

        case Instruction::LShr: ShiftType = AArch64_AM::LSR; break;

        case Instruction::AShr: ShiftType = AArch64_AM::ASR; break;

        }

        uint64_t ShiftVal = C->getZExtValue();

        if (ShiftType != AArch64_AM::InvalidShiftExtend) {

          Register RHSReg = getRegForValue(SI->getOperand(0));

          if (!RHSReg)

            return 0;

          ResultReg = emitAddSub_rs(UseAdd, RetVT, LHSReg, RHSReg, ShiftType,

                                    ShiftVal, SetFlags, WantResult);

          if (ResultReg)

            return ResultReg;

        }

      }

    }

  }


  Register RHSReg = getRegForValue(RHS);

  if (!RHSReg)

    return 0;


  if (NeedExtend)

    RHSReg = emitIntExt(SrcVT, RHSReg, RetVT, IsZExt);


  return emitAddSub_rr(UseAdd, RetVT, LHSReg, RHSReg, SetFlags, WantResult);

}


unsigned AArch64FastISel::emitAddSub_rr(bool UseAdd, MVT RetVT, unsigned LHSReg,

                                        unsigned RHSReg, bool SetFlags,

                                        bool WantResult) {

  assert(LHSReg && RHSReg && "Invalid register number.");


  if (LHSReg == AArch64::SP || LHSReg == AArch64::WSP ||

      RHSReg == AArch64::SP || RHSReg == AArch64::WSP)

    return 0;


  if (RetVT != MVT::i32 && RetVT != MVT::i64)

    return 0;


  static const unsigned OpcTable[2][2][2] = {

    { { AArch64::SUBWrr,  AArch64::SUBXrr  },

      { AArch64::ADDWrr,  AArch64::ADDXrr  }  },

    { { AArch64::SUBSWrr, AArch64::SUBSXrr },

      { AArch64::ADDSWrr, AArch64::ADDSXrr }  }

  };

  bool Is64Bit = RetVT == MVT::i64;

  unsigned Opc = OpcTable[SetFlags][UseAdd][Is64Bit];

  const TargetRegisterClass *RC =

      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  unsigned ResultReg;

  if (WantResult)

    ResultReg = createResultReg(RC);

  else

    ResultReg = Is64Bit ? AArch64::XZR : AArch64::WZR;


  const MCInstrDesc &II = TII.get(Opc);

  LHSReg = constrainOperandRegClass(II, LHSReg, II.getNumDefs());

  RHSReg = constrainOperandRegClass(II, RHSReg, II.getNumDefs() + 1);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II, ResultReg)

      .addReg(LHSReg)

      .addReg(RHSReg);

  return ResultReg;

}


unsigned AArch64FastISel::emitAddSub_ri(bool UseAdd, MVT RetVT, unsigned LHSReg,

                                        uint64_t Imm, bool SetFlags,

                                        bool WantResult) {

  assert(LHSReg && "Invalid register number.");


  if (RetVT != MVT::i32 && RetVT != MVT::i64)

    return 0;


  unsigned ShiftImm;

  if (isUInt<12>(Imm))

    ShiftImm = 0;

  else if ((Imm & 0xfff000) == Imm) {

    ShiftImm = 12;

    Imm >>= 12;

  } else

    return 0;


  static const unsigned OpcTable[2][2][2] = {

    { { AArch64::SUBWri,  AArch64::SUBXri  },

      { AArch64::ADDWri,  AArch64::ADDXri  }  },

    { { AArch64::SUBSWri, AArch64::SUBSXri },

      { AArch64::ADDSWri, AArch64::ADDSXri }  }

  };

  bool Is64Bit = RetVT == MVT::i64;

  unsigned Opc = OpcTable[SetFlags][UseAdd][Is64Bit];

  const TargetRegisterClass *RC;

  if (SetFlags)

    RC = Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  else

    RC = Is64Bit ? &AArch64::GPR64spRegClass : &AArch64::GPR32spRegClass;

  unsigned ResultReg;

  if (WantResult)

    ResultReg = createResultReg(RC);

  else

    ResultReg = Is64Bit ? AArch64::XZR : AArch64::WZR;


  const MCInstrDesc &II = TII.get(Opc);

  LHSReg = constrainOperandRegClass(II, LHSReg, II.getNumDefs());

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II, ResultReg)

      .addReg(LHSReg)

      .addImm(Imm)

      .addImm(getShifterImm(AArch64_AM::LSL, ShiftImm));

  return ResultReg;

}


unsigned AArch64FastISel::emitAddSub_rs(bool UseAdd, MVT RetVT, unsigned LHSReg,

                                        unsigned RHSReg,

                                        AArch64_AM::ShiftExtendType ShiftType,

                                        uint64_t ShiftImm, bool SetFlags,

                                        bool WantResult) {

  assert(LHSReg && RHSReg && "Invalid register number.");

  assert(LHSReg != AArch64::SP && LHSReg != AArch64::WSP &&

         RHSReg != AArch64::SP && RHSReg != AArch64::WSP);


  if (RetVT != MVT::i32 && RetVT != MVT::i64)

    return 0;


  // Don't deal with undefined shifts.

  if (ShiftImm >= RetVT.getSizeInBits())

    return 0;


  static const unsigned OpcTable[2][2][2] = {

    { { AArch64::SUBWrs,  AArch64::SUBXrs  },

      { AArch64::ADDWrs,  AArch64::ADDXrs  }  },

    { { AArch64::SUBSWrs, AArch64::SUBSXrs },

      { AArch64::ADDSWrs, AArch64::ADDSXrs }  }

  };

  bool Is64Bit = RetVT == MVT::i64;

  unsigned Opc = OpcTable[SetFlags][UseAdd][Is64Bit];

  const TargetRegisterClass *RC =

      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  unsigned ResultReg;

  if (WantResult)

    ResultReg = createResultReg(RC);

  else

    ResultReg = Is64Bit ? AArch64::XZR : AArch64::WZR;


  const MCInstrDesc &II = TII.get(Opc);

  LHSReg = constrainOperandRegClass(II, LHSReg, II.getNumDefs());

  RHSReg = constrainOperandRegClass(II, RHSReg, II.getNumDefs() + 1);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II, ResultReg)

      .addReg(LHSReg)

      .addReg(RHSReg)

      .addImm(getShifterImm(ShiftType, ShiftImm));

  return ResultReg;

}


unsigned AArch64FastISel::emitAddSub_rx(bool UseAdd, MVT RetVT, unsigned LHSReg,

                                        unsigned RHSReg,

                                        AArch64_AM::ShiftExtendType ExtType,

                                        uint64_t ShiftImm, bool SetFlags,

                                        bool WantResult) {

  assert(LHSReg && RHSReg && "Invalid register number.");

  assert(LHSReg != AArch64::XZR && LHSReg != AArch64::WZR &&

         RHSReg != AArch64::XZR && RHSReg != AArch64::WZR);


  if (RetVT != MVT::i32 && RetVT != MVT::i64)

    return 0;


  if (ShiftImm >= 4)

    return 0;


  static const unsigned OpcTable[2][2][2] = {

    { { AArch64::SUBWrx,  AArch64::SUBXrx  },

      { AArch64::ADDWrx,  AArch64::ADDXrx  }  },

    { { AArch64::SUBSWrx, AArch64::SUBSXrx },

      { AArch64::ADDSWrx, AArch64::ADDSXrx }  }

  };

  bool Is64Bit = RetVT == MVT::i64;

  unsigned Opc = OpcTable[SetFlags][UseAdd][Is64Bit];

  const TargetRegisterClass *RC = nullptr;

  if (SetFlags)

    RC = Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  else

    RC = Is64Bit ? &AArch64::GPR64spRegClass : &AArch64::GPR32spRegClass;

  unsigned ResultReg;

  if (WantResult)

    ResultReg = createResultReg(RC);

  else

    ResultReg = Is64Bit ? AArch64::XZR : AArch64::WZR;


  const MCInstrDesc &II = TII.get(Opc);

  LHSReg = constrainOperandRegClass(II, LHSReg, II.getNumDefs());

  RHSReg = constrainOperandRegClass(II, RHSReg, II.getNumDefs() + 1);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II, ResultReg)

      .addReg(LHSReg)

      .addReg(RHSReg)

      .addImm(getArithExtendImm(ExtType, ShiftImm));

  return ResultReg;

}


bool AArch64FastISel::emitCmp(const Value *LHS, const Value *RHS, bool IsZExt) {

  Type *Ty = LHS->getType();

  EVT EVT = TLI.getValueType(DL, Ty, true);

  if (!EVT.isSimple())

    return false;

  MVT VT = EVT.getSimpleVT();


  switch (VT.SimpleTy) {

  default:

    return false;

  case MVT::i1:

  case MVT::i8:

  case MVT::i16:

  case MVT::i32:

  case MVT::i64:

    return emitICmp(VT, LHS, RHS, IsZExt);

  case MVT::f32:

  case MVT::f64:

    return emitFCmp(VT, LHS, RHS);

  }

}


bool AArch64FastISel::emitICmp(MVT RetVT, const Value *LHS, const Value *RHS,

                               bool IsZExt) {

  return emitSub(RetVT, LHS, RHS, /*SetFlags=*/true, /*WantResult=*/false,

                 IsZExt) != 0;

}


bool AArch64FastISel::emitICmp_ri(MVT RetVT, unsigned LHSReg, uint64_t Imm) {

  return emitAddSub_ri(/*UseAdd=*/false, RetVT, LHSReg, Imm,

                       /*SetFlags=*/true, /*WantResult=*/false) != 0;

}


bool AArch64FastISel::emitFCmp(MVT RetVT, const Value *LHS, const Value *RHS) {

  if (RetVT != MVT::f32 && RetVT != MVT::f64)

    return false;


  // Check to see if the 2nd operand is a constant that we can encode directly

  // in the compare.

  bool UseImm = false;

  if (const auto *CFP = dyn_cast<ConstantFP>(RHS))

    if (CFP->isZero() && !CFP->isNegative())

      UseImm = true;


  Register LHSReg = getRegForValue(LHS);

  if (!LHSReg)

    return false;


  if (UseImm) {

    unsigned Opc = (RetVT == MVT::f64) ? AArch64::FCMPDri : AArch64::FCMPSri;

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(Opc))

        .addReg(LHSReg);

    return true;

  }


  Register RHSReg = getRegForValue(RHS);

  if (!RHSReg)

    return false;


  unsigned Opc = (RetVT == MVT::f64) ? AArch64::FCMPDrr : AArch64::FCMPSrr;

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(Opc))

      .addReg(LHSReg)

      .addReg(RHSReg);

  return true;

}


unsigned AArch64FastISel::emitAdd(MVT RetVT, const Value *LHS, const Value *RHS,

                                  bool SetFlags, bool WantResult, bool IsZExt) {

  return emitAddSub(/*UseAdd=*/true, RetVT, LHS, RHS, SetFlags, WantResult,

                    IsZExt);

}


/// This method is a wrapper to simplify add emission.

///

/// First try to emit an add with an immediate operand using emitAddSub_ri. If

/// that fails, then try to materialize the immediate into a register and use

/// emitAddSub_rr instead.

unsigned AArch64FastISel::emitAdd_ri_(MVT VT, unsigned Op0, int64_t Imm) {

  unsigned ResultReg;

  if (Imm < 0)

    ResultReg = emitAddSub_ri(false, VT, Op0, -Imm);

  else

    ResultReg = emitAddSub_ri(true, VT, Op0, Imm);


  if (ResultReg)

    return ResultReg;


  unsigned CReg = fastEmit_i(VT, VT, ISD::Constant, Imm);

  if (!CReg)

    return 0;


  ResultReg = emitAddSub_rr(true, VT, Op0, CReg);

  return ResultReg;

}


unsigned AArch64FastISel::emitSub(MVT RetVT, const Value *LHS, const Value *RHS,

                                  bool SetFlags, bool WantResult, bool IsZExt) {

  return emitAddSub(/*UseAdd=*/false, RetVT, LHS, RHS, SetFlags, WantResult,

                    IsZExt);

}


unsigned AArch64FastISel::emitSubs_rr(MVT RetVT, unsigned LHSReg,

                                      unsigned RHSReg, bool WantResult) {

  return emitAddSub_rr(/*UseAdd=*/false, RetVT, LHSReg, RHSReg,

                       /*SetFlags=*/true, WantResult);

}


unsigned AArch64FastISel::emitSubs_rs(MVT RetVT, unsigned LHSReg,

                                      unsigned RHSReg,

                                      AArch64_AM::ShiftExtendType ShiftType,

                                      uint64_t ShiftImm, bool WantResult) {

  return emitAddSub_rs(/*UseAdd=*/false, RetVT, LHSReg, RHSReg, ShiftType,

                       ShiftImm, /*SetFlags=*/true, WantResult);

}


unsigned AArch64FastISel::emitLogicalOp(unsigned ISDOpc, MVT RetVT,

                                        const Value *LHS, const Value *RHS) {

  // Canonicalize immediates to the RHS first.

  if (isa<ConstantInt>(LHS) && !isa<ConstantInt>(RHS))

    std::swap(LHS, RHS);


  // Canonicalize mul by power-of-2 to the RHS.

  if (LHS->hasOneUse() && isValueAvailable(LHS))

    if (isMulPowOf2(LHS))

      std::swap(LHS, RHS);


  // Canonicalize shift immediate to the RHS.

  if (LHS->hasOneUse() && isValueAvailable(LHS))

    if (const auto *SI = dyn_cast<ShlOperator>(LHS))

      if (isa<ConstantInt>(SI->getOperand(1)))

        std::swap(LHS, RHS);


  Register LHSReg = getRegForValue(LHS);

  if (!LHSReg)

    return 0;


  unsigned ResultReg = 0;

  if (const auto *C = dyn_cast<ConstantInt>(RHS)) {

    uint64_t Imm = C->getZExtValue();

    ResultReg = emitLogicalOp_ri(ISDOpc, RetVT, LHSReg, Imm);

  }

  if (ResultReg)

    return ResultReg;


  // Check if the mul can be folded into the instruction.

  if (RHS->hasOneUse() && isValueAvailable(RHS)) {

    if (isMulPowOf2(RHS)) {

      const Value *MulLHS = cast<MulOperator>(RHS)->getOperand(0);

      const Value *MulRHS = cast<MulOperator>(RHS)->getOperand(1);


      if (const auto *C = dyn_cast<ConstantInt>(MulLHS))

        if (C->getValue().isPowerOf2())

          std::swap(MulLHS, MulRHS);


      assert(isa<ConstantInt>(MulRHS) && "Expected a ConstantInt.");

      uint64_t ShiftVal = cast<ConstantInt>(MulRHS)->getValue().logBase2();


      Register RHSReg = getRegForValue(MulLHS);

      if (!RHSReg)

        return 0;

      ResultReg = emitLogicalOp_rs(ISDOpc, RetVT, LHSReg, RHSReg, ShiftVal);

      if (ResultReg)

        return ResultReg;

    }

  }


  // Check if the shift can be folded into the instruction.

  if (RHS->hasOneUse() && isValueAvailable(RHS)) {

    if (const auto *SI = dyn_cast<ShlOperator>(RHS))

      if (const auto *C = dyn_cast<ConstantInt>(SI->getOperand(1))) {

        uint64_t ShiftVal = C->getZExtValue();

        Register RHSReg = getRegForValue(SI->getOperand(0));

        if (!RHSReg)

          return 0;

        ResultReg = emitLogicalOp_rs(ISDOpc, RetVT, LHSReg, RHSReg, ShiftVal);

        if (ResultReg)

          return ResultReg;

      }

  }


  Register RHSReg = getRegForValue(RHS);

  if (!RHSReg)

    return 0;


  MVT VT = std::max(MVT::i32, RetVT.SimpleTy);

  ResultReg = fastEmit_rr(VT, VT, ISDOpc, LHSReg, RHSReg);

  if (RetVT >= MVT::i8 && RetVT <= MVT::i16) {

    uint64_t Mask = (RetVT == MVT::i8) ? 0xff : 0xffff;

    ResultReg = emitAnd_ri(MVT::i32, ResultReg, Mask);

  }

  return ResultReg;

}


unsigned AArch64FastISel::emitLogicalOp_ri(unsigned ISDOpc, MVT RetVT,

                                           unsigned LHSReg, uint64_t Imm) {

  static_assert((ISD::AND + 1 == ISD::OR) && (ISD::AND + 2 == ISD::XOR),

                "ISD nodes are not consecutive!");

  static const unsigned OpcTable[3][2] = {

    { AArch64::ANDWri, AArch64::ANDXri },

    { AArch64::ORRWri, AArch64::ORRXri },

    { AArch64::EORWri, AArch64::EORXri }

  };

  const TargetRegisterClass *RC;

  unsigned Opc;

  unsigned RegSize;

  switch (RetVT.SimpleTy) {

  default:

    return 0;

  case MVT::i1:

  case MVT::i8:

  case MVT::i16:

  case MVT::i32: {

    unsigned Idx = ISDOpc - ISD::AND;

    Opc = OpcTable[Idx][0];

    RC = &AArch64::GPR32spRegClass;

    RegSize = 32;

    break;

  }

  case MVT::i64:

    Opc = OpcTable[ISDOpc - ISD::AND][1];

    RC = &AArch64::GPR64spRegClass;

    RegSize = 64;

    break;

  }


  if (!AArch64_AM::isLogicalImmediate(Imm, RegSize))

    return 0;


  Register ResultReg =

      fastEmitInst_ri(Opc, RC, LHSReg,

                      AArch64_AM::encodeLogicalImmediate(Imm, RegSize));

  if (RetVT >= MVT::i8 && RetVT <= MVT::i16 && ISDOpc != ISD::AND) {

    uint64_t Mask = (RetVT == MVT::i8) ? 0xff : 0xffff;

    ResultReg = emitAnd_ri(MVT::i32, ResultReg, Mask);

  }

  return ResultReg;

}


unsigned AArch64FastISel::emitLogicalOp_rs(unsigned ISDOpc, MVT RetVT,

                                           unsigned LHSReg, unsigned RHSReg,

                                           uint64_t ShiftImm) {

  static_assert((ISD::AND + 1 == ISD::OR) && (ISD::AND + 2 == ISD::XOR),

                "ISD nodes are not consecutive!");

  static const unsigned OpcTable[3][2] = {

    { AArch64::ANDWrs, AArch64::ANDXrs },

    { AArch64::ORRWrs, AArch64::ORRXrs },

    { AArch64::EORWrs, AArch64::EORXrs }

  };


  // Don't deal with undefined shifts.

  if (ShiftImm >= RetVT.getSizeInBits())

    return 0;


  const TargetRegisterClass *RC;

  unsigned Opc;

  switch (RetVT.SimpleTy) {

  default:

    return 0;

  case MVT::i1:

  case MVT::i8:

  case MVT::i16:

  case MVT::i32:

    Opc = OpcTable[ISDOpc - ISD::AND][0];

    RC = &AArch64::GPR32RegClass;

    break;

  case MVT::i64:

    Opc = OpcTable[ISDOpc - ISD::AND][1];

    RC = &AArch64::GPR64RegClass;

    break;

  }

  Register ResultReg =

      fastEmitInst_rri(Opc, RC, LHSReg, RHSReg,

                       AArch64_AM::getShifterImm(AArch64_AM::LSL, ShiftImm));

  if (RetVT >= MVT::i8 && RetVT <= MVT::i16) {

    uint64_t Mask = (RetVT == MVT::i8) ? 0xff : 0xffff;

    ResultReg = emitAnd_ri(MVT::i32, ResultReg, Mask);

  }

  return ResultReg;

}


unsigned AArch64FastISel::emitAnd_ri(MVT RetVT, unsigned LHSReg,

                                     uint64_t Imm) {

  return emitLogicalOp_ri(ISD::AND, RetVT, LHSReg, Imm);

}


unsigned AArch64FastISel::emitLoad(MVT VT, MVT RetVT, Address Addr,

                                   bool WantZExt, MachineMemOperand *MMO) {

  if (!TLI.allowsMisalignedMemoryAccesses(VT))

    return 0;


  // Simplify this down to something we can handle.

  if (!simplifyAddress(Addr, VT))

    return 0;


  unsigned ScaleFactor = getImplicitScaleFactor(VT);

  if (!ScaleFactor)

    llvm_unreachable("Unexpected value type.");


  // Negative offsets require unscaled, 9-bit, signed immediate offsets.

  // Otherwise, we try using scaled, 12-bit, unsigned immediate offsets.

  bool UseScaled = true;

  if ((Addr.getOffset() < 0) || (Addr.getOffset() & (ScaleFactor - 1))) {

    UseScaled = false;

    ScaleFactor = 1;

  }


  static const unsigned GPOpcTable[2][8][4] = {

    // Sign-extend.

    { { AArch64::LDURSBWi,  AArch64::LDURSHWi,  AArch64::LDURWi,

        AArch64::LDURXi  },

      { AArch64::LDURSBXi,  AArch64::LDURSHXi,  AArch64::LDURSWi,

        AArch64::LDURXi  },

      { AArch64::LDRSBWui,  AArch64::LDRSHWui,  AArch64::LDRWui,

        AArch64::LDRXui  },

      { AArch64::LDRSBXui,  AArch64::LDRSHXui,  AArch64::LDRSWui,

        AArch64::LDRXui  },

      { AArch64::LDRSBWroX, AArch64::LDRSHWroX, AArch64::LDRWroX,

        AArch64::LDRXroX },

      { AArch64::LDRSBXroX, AArch64::LDRSHXroX, AArch64::LDRSWroX,

        AArch64::LDRXroX },

      { AArch64::LDRSBWroW, AArch64::LDRSHWroW, AArch64::LDRWroW,

        AArch64::LDRXroW },

      { AArch64::LDRSBXroW, AArch64::LDRSHXroW, AArch64::LDRSWroW,

        AArch64::LDRXroW }

    },

    // Zero-extend.

    { { AArch64::LDURBBi,   AArch64::LDURHHi,   AArch64::LDURWi,

        AArch64::LDURXi  },

      { AArch64::LDURBBi,   AArch64::LDURHHi,   AArch64::LDURWi,

        AArch64::LDURXi  },

      { AArch64::LDRBBui,   AArch64::LDRHHui,   AArch64::LDRWui,

        AArch64::LDRXui  },

      { AArch64::LDRBBui,   AArch64::LDRHHui,   AArch64::LDRWui,

        AArch64::LDRXui  },

      { AArch64::LDRBBroX,  AArch64::LDRHHroX,  AArch64::LDRWroX,

        AArch64::LDRXroX },

      { AArch64::LDRBBroX,  AArch64::LDRHHroX,  AArch64::LDRWroX,

        AArch64::LDRXroX },

      { AArch64::LDRBBroW,  AArch64::LDRHHroW,  AArch64::LDRWroW,

        AArch64::LDRXroW },

      { AArch64::LDRBBroW,  AArch64::LDRHHroW,  AArch64::LDRWroW,

        AArch64::LDRXroW }

    }

  };


  static const unsigned FPOpcTable[4][2] = {

    { AArch64::LDURSi,  AArch64::LDURDi  },

    { AArch64::LDRSui,  AArch64::LDRDui  },

    { AArch64::LDRSroX, AArch64::LDRDroX },

    { AArch64::LDRSroW, AArch64::LDRDroW }

  };


  unsigned Opc;

  const TargetRegisterClass *RC;

  bool UseRegOffset = Addr.isRegBase() && !Addr.getOffset() && Addr.getReg() &&

                      Addr.getOffsetReg();

  unsigned Idx = UseRegOffset ? 2 : UseScaled ? 1 : 0;

  if (Addr.getExtendType() == AArch64_AM::UXTW ||

      Addr.getExtendType() == AArch64_AM::SXTW)

    Idx++;


  bool IsRet64Bit = RetVT == MVT::i64;

  switch (VT.SimpleTy) {

  default:

    llvm_unreachable("Unexpected value type.");

  case MVT::i1: // Intentional fall-through.

  case MVT::i8:

    Opc = GPOpcTable[WantZExt][2 * Idx + IsRet64Bit][0];

    RC = (IsRet64Bit && !WantZExt) ?

             &AArch64::GPR64RegClass: &AArch64::GPR32RegClass;

    break;

  case MVT::i16:

    Opc = GPOpcTable[WantZExt][2 * Idx + IsRet64Bit][1];

    RC = (IsRet64Bit && !WantZExt) ?

             &AArch64::GPR64RegClass: &AArch64::GPR32RegClass;

    break;

  case MVT::i32:

    Opc = GPOpcTable[WantZExt][2 * Idx + IsRet64Bit][2];

    RC = (IsRet64Bit && !WantZExt) ?

             &AArch64::GPR64RegClass: &AArch64::GPR32RegClass;

    break;

  case MVT::i64:

    Opc = GPOpcTable[WantZExt][2 * Idx + IsRet64Bit][3];

    RC = &AArch64::GPR64RegClass;

    break;

  case MVT::f32:

    Opc = FPOpcTable[Idx][0];

    RC = &AArch64::FPR32RegClass;

    break;

  case MVT::f64:

    Opc = FPOpcTable[Idx][1];

    RC = &AArch64::FPR64RegClass;

    break;

  }


  // Create the base instruction, then add the operands.

  Register ResultReg = createResultReg(RC);

  MachineInstrBuilder MIB = BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

                                    TII.get(Opc), ResultReg);

  addLoadStoreOperands(Addr, MIB, MachineMemOperand::MOLoad, ScaleFactor, MMO);


  // Loading an i1 requires special handling.

  if (VT == MVT::i1) {

    unsigned ANDReg = emitAnd_ri(MVT::i32, ResultReg, 1);

    assert(ANDReg && "Unexpected AND instruction emission failure.");

    ResultReg = ANDReg;

  }


  // For zero-extending loads to 64bit we emit a 32bit load and then convert

  // the 32bit reg to a 64bit reg.

  if (WantZExt && RetVT == MVT::i64 && VT <= MVT::i32) {

    Register Reg64 = createResultReg(&AArch64::GPR64RegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(AArch64::SUBREG_TO_REG), Reg64)

        .addImm(0)

        .addReg(ResultReg, getKillRegState(true))

        .addImm(AArch64::sub_32);

    ResultReg = Reg64;

  }

  return ResultReg;

}


bool AArch64FastISel::selectAddSub(const Instruction *I) {

  MVT VT;

  if (!isTypeSupported(I->getType(), VT, /*IsVectorAllowed=*/true))

    return false;


  if (VT.isVector())

    return selectOperator(I, I->getOpcode());


  unsigned ResultReg;

  switch (I->getOpcode()) {

  default:

    llvm_unreachable("Unexpected instruction.");

  case Instruction::Add:

    ResultReg = emitAdd(VT, I->getOperand(0), I->getOperand(1));

    break;

  case Instruction::Sub:

    ResultReg = emitSub(VT, I->getOperand(0), I->getOperand(1));

    break;

  }

  if (!ResultReg)

    return false;


  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectLogicalOp(const Instruction *I) {

  MVT VT;

  if (!isTypeSupported(I->getType(), VT, /*IsVectorAllowed=*/true))

    return false;


  if (VT.isVector())

    return selectOperator(I, I->getOpcode());


  unsigned ResultReg;

  switch (I->getOpcode()) {

  default:

    llvm_unreachable("Unexpected instruction.");

  case Instruction::And:

    ResultReg = emitLogicalOp(ISD::AND, VT, I->getOperand(0), I->getOperand(1));

    break;

  case Instruction::Or:

    ResultReg = emitLogicalOp(ISD::OR, VT, I->getOperand(0), I->getOperand(1));

    break;

  case Instruction::Xor:

    ResultReg = emitLogicalOp(ISD::XOR, VT, I->getOperand(0), I->getOperand(1));

    break;

  }

  if (!ResultReg)

    return false;


  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectLoad(const Instruction *I) {

  MVT VT;

  // Verify we have a legal type before going any further.  Currently, we handle

  // simple types that will directly fit in a register (i32/f32/i64/f64) or

  // those that can be sign or zero-extended to a basic operation (i1/i8/i16).

  if (!isTypeSupported(I->getType(), VT, /*IsVectorAllowed=*/true) ||

      cast<LoadInst>(I)->isAtomic())

    return false;


  const Value *SV = I->getOperand(0);

  if (TLI.supportSwiftError()) {

    // Swifterror values can come from either a function parameter with

    // swifterror attribute or an alloca with swifterror attribute.

    if (const Argument *Arg = dyn_cast<Argument>(SV)) {

      if (Arg->hasSwiftErrorAttr())

        return false;

    }


    if (const AllocaInst *Alloca = dyn_cast<AllocaInst>(SV)) {

      if (Alloca->isSwiftError())

        return false;

    }

  }


  // See if we can handle this address.

  Address Addr;

  if (!computeAddress(I->getOperand(0), Addr, I->getType()))

    return false;


  // Fold the following sign-/zero-extend into the load instruction.

  bool WantZExt = true;

  MVT RetVT = VT;

  const Value *IntExtVal = nullptr;

  if (I->hasOneUse()) {

    if (const auto *ZE = dyn_cast<ZExtInst>(I->use_begin()->getUser())) {

      if (isTypeSupported(ZE->getType(), RetVT))

        IntExtVal = ZE;

      else

        RetVT = VT;

    } else if (const auto *SE = dyn_cast<SExtInst>(I->use_begin()->getUser())) {

      if (isTypeSupported(SE->getType(), RetVT))

        IntExtVal = SE;

      else

        RetVT = VT;

      WantZExt = false;

    }

  }


  unsigned ResultReg =

      emitLoad(VT, RetVT, Addr, WantZExt, createMachineMemOperandFor(I));

  if (!ResultReg)

    return false;


  // There are a few different cases we have to handle, because the load or the

  // sign-/zero-extend might not be selected by FastISel if we fall-back to

  // SelectionDAG. There is also an ordering issue when both instructions are in

  // different basic blocks.

  // 1.) The load instruction is selected by FastISel, but the integer extend

  //     not. This usually happens when the integer extend is in a different

  //     basic block and SelectionDAG took over for that basic block.

  // 2.) The load instruction is selected before the integer extend. This only

  //     happens when the integer extend is in a different basic block.

  // 3.) The load instruction is selected by SelectionDAG and the integer extend

  //     by FastISel. This happens if there are instructions between the load

  //     and the integer extend that couldn't be selected by FastISel.

  if (IntExtVal) {

    // The integer extend hasn't been emitted yet. FastISel or SelectionDAG

    // could select it. Emit a copy to subreg if necessary. FastISel will remove

    // it when it selects the integer extend.

    Register Reg = lookUpRegForValue(IntExtVal);

    auto *MI = MRI.getUniqueVRegDef(Reg);

    if (!MI) {

      if (RetVT == MVT::i64 && VT <= MVT::i32) {

        if (WantZExt) {

          // Delete the last emitted instruction from emitLoad (SUBREG_TO_REG).

          MachineBasicBlock::iterator I(std::prev(FuncInfo.InsertPt));

          ResultReg = std::prev(I)->getOperand(0).getReg();

          removeDeadCode(I, std::next(I));

        } else

          ResultReg = fastEmitInst_extractsubreg(MVT::i32, ResultReg,

                                                 AArch64::sub_32);

      }

      updateValueMap(I, ResultReg);

      return true;

    }


    // The integer extend has already been emitted - delete all the instructions

    // that have been emitted by the integer extend lowering code and use the

    // result from the load instruction directly.

    while (MI) {

      Reg = 0;

      for (auto &Opnd : MI->uses()) {

        if (Opnd.isReg()) {

          Reg = Opnd.getReg();

          break;

        }

      }

      MachineBasicBlock::iterator I(MI);

      removeDeadCode(I, std::next(I));

      MI = nullptr;

      if (Reg)

        MI = MRI.getUniqueVRegDef(Reg);

    }

    updateValueMap(IntExtVal, ResultReg);

    return true;

  }


  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::emitStoreRelease(MVT VT, unsigned SrcReg,

                                       unsigned AddrReg,

                                       MachineMemOperand *MMO) {

  unsigned Opc;

  switch (VT.SimpleTy) {

  default: return false;

  case MVT::i8:  Opc = AArch64::STLRB; break;

  case MVT::i16: Opc = AArch64::STLRH; break;

  case MVT::i32: Opc = AArch64::STLRW; break;

  case MVT::i64: Opc = AArch64::STLRX; break;

  }


  const MCInstrDesc &II = TII.get(Opc);

  SrcReg = constrainOperandRegClass(II, SrcReg, 0);

  AddrReg = constrainOperandRegClass(II, AddrReg, 1);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II)

      .addReg(SrcReg)

      .addReg(AddrReg)

      .addMemOperand(MMO);

  return true;

}


bool AArch64FastISel::emitStore(MVT VT, unsigned SrcReg, Address Addr,

                                MachineMemOperand *MMO) {

  if (!TLI.allowsMisalignedMemoryAccesses(VT))

    return false;


  // Simplify this down to something we can handle.

  if (!simplifyAddress(Addr, VT))

    return false;


  unsigned ScaleFactor = getImplicitScaleFactor(VT);

  if (!ScaleFactor)

    llvm_unreachable("Unexpected value type.");


  // Negative offsets require unscaled, 9-bit, signed immediate offsets.

  // Otherwise, we try using scaled, 12-bit, unsigned immediate offsets.

  bool UseScaled = true;

  if ((Addr.getOffset() < 0) || (Addr.getOffset() & (ScaleFactor - 1))) {

    UseScaled = false;

    ScaleFactor = 1;

  }


  static const unsigned OpcTable[4][6] = {

    { AArch64::STURBBi,  AArch64::STURHHi,  AArch64::STURWi,  AArch64::STURXi,

      AArch64::STURSi,   AArch64::STURDi },

    { AArch64::STRBBui,  AArch64::STRHHui,  AArch64::STRWui,  AArch64::STRXui,

      AArch64::STRSui,   AArch64::STRDui },

    { AArch64::STRBBroX, AArch64::STRHHroX, AArch64::STRWroX, AArch64::STRXroX,

      AArch64::STRSroX,  AArch64::STRDroX },

    { AArch64::STRBBroW, AArch64::STRHHroW, AArch64::STRWroW, AArch64::STRXroW,

      AArch64::STRSroW,  AArch64::STRDroW }

  };


  unsigned Opc;

  bool VTIsi1 = false;

  bool UseRegOffset = Addr.isRegBase() && !Addr.getOffset() && Addr.getReg() &&

                      Addr.getOffsetReg();

  unsigned Idx = UseRegOffset ? 2 : UseScaled ? 1 : 0;

  if (Addr.getExtendType() == AArch64_AM::UXTW ||

      Addr.getExtendType() == AArch64_AM::SXTW)

    Idx++;


  switch (VT.SimpleTy) {

  default: llvm_unreachable("Unexpected value type.");

  case MVT::i1:  VTIsi1 = true; [[fallthrough]];

  case MVT::i8:  Opc = OpcTable[Idx][0]; break;

  case MVT::i16: Opc = OpcTable[Idx][1]; break;

  case MVT::i32: Opc = OpcTable[Idx][2]; break;

  case MVT::i64: Opc = OpcTable[Idx][3]; break;

  case MVT::f32: Opc = OpcTable[Idx][4]; break;

  case MVT::f64: Opc = OpcTable[Idx][5]; break;

  }


  // Storing an i1 requires special handling.

  if (VTIsi1 && SrcReg != AArch64::WZR) {

    unsigned ANDReg = emitAnd_ri(MVT::i32, SrcReg, 1);

    assert(ANDReg && "Unexpected AND instruction emission failure.");

    SrcReg = ANDReg;

  }

  // Create the base instruction, then add the operands.

  const MCInstrDesc &II = TII.get(Opc);

  SrcReg = constrainOperandRegClass(II, SrcReg, II.getNumDefs());

  MachineInstrBuilder MIB =

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II).addReg(SrcReg);

  addLoadStoreOperands(Addr, MIB, MachineMemOperand::MOStore, ScaleFactor, MMO);


  return true;

}


bool AArch64FastISel::selectStore(const Instruction *I) {

  MVT VT;

  const Value *Op0 = I->getOperand(0);

  // Verify we have a legal type before going any further.  Currently, we handle

  // simple types that will directly fit in a register (i32/f32/i64/f64) or

  // those that can be sign or zero-extended to a basic operation (i1/i8/i16).

  if (!isTypeSupported(Op0->getType(), VT, /*IsVectorAllowed=*/true))

    return false;


  const Value *PtrV = I->getOperand(1);

  if (TLI.supportSwiftError()) {

    // Swifterror values can come from either a function parameter with

    // swifterror attribute or an alloca with swifterror attribute.

    if (const Argument *Arg = dyn_cast<Argument>(PtrV)) {

      if (Arg->hasSwiftErrorAttr())

        return false;

    }


    if (const AllocaInst *Alloca = dyn_cast<AllocaInst>(PtrV)) {

      if (Alloca->isSwiftError())

        return false;

    }

  }


  // Get the value to be stored into a register. Use the zero register directly

  // when possible to avoid an unnecessary copy and a wasted register.

  unsigned SrcReg = 0;

  if (const auto *CI = dyn_cast<ConstantInt>(Op0)) {

    if (CI->isZero())

      SrcReg = (VT == MVT::i64) ? AArch64::XZR : AArch64::WZR;

  } else if (const auto *CF = dyn_cast<ConstantFP>(Op0)) {

    if (CF->isZero() && !CF->isNegative()) {

      VT = MVT::getIntegerVT(VT.getSizeInBits());

      SrcReg = (VT == MVT::i64) ? AArch64::XZR : AArch64::WZR;

    }

  }


  if (!SrcReg)

    SrcReg = getRegForValue(Op0);


  if (!SrcReg)

    return false;


  auto *SI = cast<StoreInst>(I);


  // Try to emit a STLR for seq_cst/release.

  if (SI->isAtomic()) {

    AtomicOrdering Ord = SI->getOrdering();

    // The non-atomic instructions are sufficient for relaxed stores.

    if (isReleaseOrStronger(Ord)) {

      // The STLR addressing mode only supports a base reg; pass that directly.

      Register AddrReg = getRegForValue(PtrV);

      return emitStoreRelease(VT, SrcReg, AddrReg,

                              createMachineMemOperandFor(I));

    }

  }


  // See if we can handle this address.

  Address Addr;

  if (!computeAddress(PtrV, Addr, Op0->getType()))

    return false;


  if (!emitStore(VT, SrcReg, Addr, createMachineMemOperandFor(I)))

    return false;

  return true;

}


static AArch64CC::CondCode getCompareCC(CmpInst::Predicate Pred) {

  switch (Pred) {

  case CmpInst::FCMP_ONE:

  case CmpInst::FCMP_UEQ:

  default:

    // AL is our "false" for now. The other two need more compares.

    return AArch64CC::AL;

  case CmpInst::ICMP_EQ:

  case CmpInst::FCMP_OEQ:

    return AArch64CC::EQ;

  case CmpInst::ICMP_SGT:

  case CmpInst::FCMP_OGT:

    return AArch64CC::GT;

  case CmpInst::ICMP_SGE:

  case CmpInst::FCMP_OGE:

    return AArch64CC::GE;

  case CmpInst::ICMP_UGT:

  case CmpInst::FCMP_UGT:

    return AArch64CC::HI;

  case CmpInst::FCMP_OLT:

    return AArch64CC::MI;

  case CmpInst::ICMP_ULE:

  case CmpInst::FCMP_OLE:

    return AArch64CC::LS;

  case CmpInst::FCMP_ORD:

    return AArch64CC::VC;

  case CmpInst::FCMP_UNO:

    return AArch64CC::VS;

  case CmpInst::FCMP_UGE:

    return AArch64CC::PL;

  case CmpInst::ICMP_SLT:

  case CmpInst::FCMP_ULT:

    return AArch64CC::LT;

  case CmpInst::ICMP_SLE:

  case CmpInst::FCMP_ULE:

    return AArch64CC::LE;

  case CmpInst::FCMP_UNE:

  case CmpInst::ICMP_NE:

    return AArch64CC::NE;

  case CmpInst::ICMP_UGE:

    return AArch64CC::HS;

  case CmpInst::ICMP_ULT:

    return AArch64CC::LO;

  }

}


/// Try to emit a combined compare-and-branch instruction.

bool AArch64FastISel::emitCompareAndBranch(const BranchInst *BI) {

  // Speculation tracking/SLH assumes that optimized TB(N)Z/CB(N)Z instructions

  // will not be produced, as they are conditional branch instructions that do

  // not set flags.

  if (FuncInfo.MF->getFunction().hasFnAttribute(

          Attribute::SpeculativeLoadHardening))

    return false;


  assert(isa<CmpInst>(BI->getCondition()) && "Expected cmp instruction");

  const CmpInst *CI = cast<CmpInst>(BI->getCondition());

  CmpInst::Predicate Predicate = optimizeCmpPredicate(CI);


  const Value *LHS = CI->getOperand(0);

  const Value *RHS = CI->getOperand(1);


  MVT VT;

  if (!isTypeSupported(LHS->getType(), VT))

    return false;


  unsigned BW = VT.getSizeInBits();

  if (BW > 64)

    return false;


  MachineBasicBlock *TBB = FuncInfo.getMBB(BI->getSuccessor(0));

  MachineBasicBlock *FBB = FuncInfo.getMBB(BI->getSuccessor(1));


  // Try to take advantage of fallthrough opportunities.

  if (FuncInfo.MBB->isLayoutSuccessor(TBB)) {

    std::swap(TBB, FBB);

    Predicate = CmpInst::getInversePredicate(Predicate);

  }


  int TestBit = -1;

  bool IsCmpNE;

  switch (Predicate) {

  default:

    return false;

  case CmpInst::ICMP_EQ:

  case CmpInst::ICMP_NE:

    if (isa<Constant>(LHS) && cast<Constant>(LHS)->isNullValue())

      std::swap(LHS, RHS);


    if (!isa<Constant>(RHS) || !cast<Constant>(RHS)->isNullValue())

      return false;


    if (const auto *AI = dyn_cast<BinaryOperator>(LHS))

      if (AI->getOpcode() == Instruction::And && isValueAvailable(AI)) {

        const Value *AndLHS = AI->getOperand(0);

        const Value *AndRHS = AI->getOperand(1);


        if (const auto *C = dyn_cast<ConstantInt>(AndLHS))

          if (C->getValue().isPowerOf2())

            std::swap(AndLHS, AndRHS);


        if (const auto *C = dyn_cast<ConstantInt>(AndRHS))

          if (C->getValue().isPowerOf2()) {

            TestBit = C->getValue().logBase2();

            LHS = AndLHS;

          }

      }


    if (VT == MVT::i1)

      TestBit = 0;


    IsCmpNE = Predicate == CmpInst::ICMP_NE;

    break;

  case CmpInst::ICMP_SLT:

  case CmpInst::ICMP_SGE:

    if (!isa<Constant>(RHS) || !cast<Constant>(RHS)->isNullValue())

      return false;


    TestBit = BW - 1;

    IsCmpNE = Predicate == CmpInst::ICMP_SLT;

    break;

  case CmpInst::ICMP_SGT:

  case CmpInst::ICMP_SLE:

    if (!isa<ConstantInt>(RHS))

      return false;


    if (cast<ConstantInt>(RHS)->getValue() != APInt(BW, -1, true))

      return false;


    TestBit = BW - 1;

    IsCmpNE = Predicate == CmpInst::ICMP_SLE;

    break;

  } // end switch


  static const unsigned OpcTable[2][2][2] = {

    { {AArch64::CBZW,  AArch64::CBZX },

      {AArch64::CBNZW, AArch64::CBNZX} },

    { {AArch64::TBZW,  AArch64::TBZX },

      {AArch64::TBNZW, AArch64::TBNZX} }

  };


  bool IsBitTest = TestBit != -1;

  bool Is64Bit = BW == 64;

  if (TestBit < 32 && TestBit >= 0)

    Is64Bit = false;


  unsigned Opc = OpcTable[IsBitTest][IsCmpNE][Is64Bit];

  const MCInstrDesc &II = TII.get(Opc);


  Register SrcReg = getRegForValue(LHS);

  if (!SrcReg)

    return false;


  if (BW == 64 && !Is64Bit)

    SrcReg = fastEmitInst_extractsubreg(MVT::i32, SrcReg, AArch64::sub_32);


  if ((BW < 32) && !IsBitTest)

    SrcReg = emitIntExt(VT, SrcReg, MVT::i32, /*isZExt=*/true);


  // Emit the combined compare and branch instruction.

  SrcReg = constrainOperandRegClass(II, SrcReg,  II.getNumDefs());

  MachineInstrBuilder MIB =

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(Opc))

          .addReg(SrcReg);

  if (IsBitTest)

    MIB.addImm(TestBit);

  MIB.addMBB(TBB);


  finishCondBranch(BI->getParent(), TBB, FBB);

  return true;

}


bool AArch64FastISel::selectBranch(const Instruction *I) {

  const BranchInst *BI = cast<BranchInst>(I);

  if (BI->isUnconditional()) {

    MachineBasicBlock *MSucc = FuncInfo.getMBB(BI->getSuccessor(0));

    fastEmitBranch(MSucc, BI->getDebugLoc());

    return true;

  }


  MachineBasicBlock *TBB = FuncInfo.getMBB(BI->getSuccessor(0));

  MachineBasicBlock *FBB = FuncInfo.getMBB(BI->getSuccessor(1));


  if (const CmpInst *CI = dyn_cast<CmpInst>(BI->getCondition())) {

    if (CI->hasOneUse() && isValueAvailable(CI)) {

      // Try to optimize or fold the cmp.

      CmpInst::Predicate Predicate = optimizeCmpPredicate(CI);

      switch (Predicate) {

      default:

        break;

      case CmpInst::FCMP_FALSE:

        fastEmitBranch(FBB, MIMD.getDL());

        return true;

      case CmpInst::FCMP_TRUE:

        fastEmitBranch(TBB, MIMD.getDL());

        return true;

      }


      // Try to emit a combined compare-and-branch first.

      if (emitCompareAndBranch(BI))

        return true;


      // Try to take advantage of fallthrough opportunities.

      if (FuncInfo.MBB->isLayoutSuccessor(TBB)) {

        std::swap(TBB, FBB);

        Predicate = CmpInst::getInversePredicate(Predicate);

      }


      // Emit the cmp.

      if (!emitCmp(CI->getOperand(0), CI->getOperand(1), CI->isUnsigned()))

        return false;


      // FCMP_UEQ and FCMP_ONE cannot be checked with a single branch

      // instruction.

      AArch64CC::CondCode CC = getCompareCC(Predicate);

      AArch64CC::CondCode ExtraCC = AArch64CC::AL;

      switch (Predicate) {

      default:

        break;

      case CmpInst::FCMP_UEQ:

        ExtraCC = AArch64CC::EQ;

        CC = AArch64CC::VS;

        break;

      case CmpInst::FCMP_ONE:

        ExtraCC = AArch64CC::MI;

        CC = AArch64CC::GT;

        break;

      }

      assert((CC != AArch64CC::AL) && "Unexpected condition code.");


      // Emit the extra branch for FCMP_UEQ and FCMP_ONE.

      if (ExtraCC != AArch64CC::AL) {

        BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::Bcc))

            .addImm(ExtraCC)

            .addMBB(TBB);

      }


      // Emit the branch.

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::Bcc))

          .addImm(CC)

          .addMBB(TBB);


      finishCondBranch(BI->getParent(), TBB, FBB);

      return true;

    }

  } else if (const auto *CI = dyn_cast<ConstantInt>(BI->getCondition())) {

    uint64_t Imm = CI->getZExtValue();

    MachineBasicBlock *Target = (Imm == 0) ? FBB : TBB;

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::B))

        .addMBB(Target);


    // Obtain the branch probability and add the target to the successor list.

    if (FuncInfo.BPI) {

      auto BranchProbability = FuncInfo.BPI->getEdgeProbability(

          BI->getParent(), Target->getBasicBlock());

      FuncInfo.MBB->addSuccessor(Target, BranchProbability);

    } else

      FuncInfo.MBB->addSuccessorWithoutProb(Target);

    return true;

  } else {

    AArch64CC::CondCode CC = AArch64CC::NE;

    if (foldXALUIntrinsic(CC, I, BI->getCondition())) {

      // Fake request the condition, otherwise the intrinsic might be completely

      // optimized away.

      Register CondReg = getRegForValue(BI->getCondition());

      if (!CondReg)

        return false;


      // Emit the branch.

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::Bcc))

        .addImm(CC)

        .addMBB(TBB);


      finishCondBranch(BI->getParent(), TBB, FBB);

      return true;

    }

  }


  Register CondReg = getRegForValue(BI->getCondition());

  if (CondReg == 0)

    return false;


  // i1 conditions come as i32 values, test the lowest bit with tb(n)z.

  unsigned Opcode = AArch64::TBNZW;

  if (FuncInfo.MBB->isLayoutSuccessor(TBB)) {

    std::swap(TBB, FBB);

    Opcode = AArch64::TBZW;

  }


  const MCInstrDesc &II = TII.get(Opcode);

  Register ConstrainedCondReg

    = constrainOperandRegClass(II, CondReg, II.getNumDefs());

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II)

      .addReg(ConstrainedCondReg)

      .addImm(0)

      .addMBB(TBB);


  finishCondBranch(BI->getParent(), TBB, FBB);

  return true;

}


bool AArch64FastISel::selectIndirectBr(const Instruction *I) {

  const IndirectBrInst *BI = cast<IndirectBrInst>(I);

  Register AddrReg = getRegForValue(BI->getOperand(0));

  if (AddrReg == 0)

    return false;


  // Authenticated indirectbr is not implemented yet.

  if (FuncInfo.MF->getFunction().hasFnAttribute("ptrauth-indirect-gotos"))

    return false;


  // Emit the indirect branch.

  const MCInstrDesc &II = TII.get(AArch64::BR);

  AddrReg = constrainOperandRegClass(II, AddrReg,  II.getNumDefs());

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II).addReg(AddrReg);


  // Make sure the CFG is up-to-date.

  for (const auto *Succ : BI->successors())

    FuncInfo.MBB->addSuccessor(FuncInfo.getMBB(Succ));


  return true;

}


bool AArch64FastISel::selectCmp(const Instruction *I) {

  const CmpInst *CI = cast<CmpInst>(I);


  // Vectors of i1 are weird: bail out.

  if (CI->getType()->isVectorTy())

    return false;


  // Try to optimize or fold the cmp.

  CmpInst::Predicate Predicate = optimizeCmpPredicate(CI);

  unsigned ResultReg = 0;

  switch (Predicate) {

  default:

    break;

  case CmpInst::FCMP_FALSE:

    ResultReg = createResultReg(&AArch64::GPR32RegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(TargetOpcode::COPY), ResultReg)

        .addReg(AArch64::WZR, getKillRegState(true));

    break;

  case CmpInst::FCMP_TRUE:

    ResultReg = fastEmit_i(MVT::i32, MVT::i32, ISD::Constant, 1);

    break;

  }


  if (ResultReg) {

    updateValueMap(I, ResultReg);

    return true;

  }


  // Emit the cmp.

  if (!emitCmp(CI->getOperand(0), CI->getOperand(1), CI->isUnsigned()))

    return false;


  ResultReg = createResultReg(&AArch64::GPR32RegClass);


  // FCMP_UEQ and FCMP_ONE cannot be checked with a single instruction. These

  // condition codes are inverted, because they are used by CSINC.

  static unsigned CondCodeTable[2][2] = {

    { AArch64CC::NE, AArch64CC::VC },

    { AArch64CC::PL, AArch64CC::LE }

  };

  unsigned *CondCodes = nullptr;

  switch (Predicate) {

  default:

    break;

  case CmpInst::FCMP_UEQ:

    CondCodes = &CondCodeTable[0][0];

    break;

  case CmpInst::FCMP_ONE:

    CondCodes = &CondCodeTable[1][0];

    break;

  }


  if (CondCodes) {

    Register TmpReg1 = createResultReg(&AArch64::GPR32RegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::CSINCWr),

            TmpReg1)

        .addReg(AArch64::WZR, getKillRegState(true))

        .addReg(AArch64::WZR, getKillRegState(true))

        .addImm(CondCodes[0]);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::CSINCWr),

            ResultReg)

        .addReg(TmpReg1, getKillRegState(true))

        .addReg(AArch64::WZR, getKillRegState(true))

        .addImm(CondCodes[1]);


    updateValueMap(I, ResultReg);

    return true;

  }


  // Now set a register based on the comparison.

  AArch64CC::CondCode CC = getCompareCC(Predicate);

  assert((CC != AArch64CC::AL) && "Unexpected condition code.");

  AArch64CC::CondCode invertedCC = getInvertedCondCode(CC);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::CSINCWr),

          ResultReg)

      .addReg(AArch64::WZR, getKillRegState(true))

      .addReg(AArch64::WZR, getKillRegState(true))

      .addImm(invertedCC);


  updateValueMap(I, ResultReg);

  return true;

}


/// Optimize selects of i1 if one of the operands has a 'true' or 'false'

/// value.

bool AArch64FastISel::optimizeSelect(const SelectInst *SI) {

  if (!SI->getType()->isIntegerTy(1))

    return false;


  const Value *Src1Val, *Src2Val;

  unsigned Opc = 0;

  bool NeedExtraOp = false;

  if (auto *CI = dyn_cast<ConstantInt>(SI->getTrueValue())) {

    if (CI->isOne()) {

      Src1Val = SI->getCondition();

      Src2Val = SI->getFalseValue();

      Opc = AArch64::ORRWrr;

    } else {

      assert(CI->isZero());

      Src1Val = SI->getFalseValue();

      Src2Val = SI->getCondition();

      Opc = AArch64::BICWrr;

    }

  } else if (auto *CI = dyn_cast<ConstantInt>(SI->getFalseValue())) {

    if (CI->isOne()) {

      Src1Val = SI->getCondition();

      Src2Val = SI->getTrueValue();

      Opc = AArch64::ORRWrr;

      NeedExtraOp = true;

    } else {

      assert(CI->isZero());

      Src1Val = SI->getCondition();

      Src2Val = SI->getTrueValue();

      Opc = AArch64::ANDWrr;

    }

  }


  if (!Opc)

    return false;


  Register Src1Reg = getRegForValue(Src1Val);

  if (!Src1Reg)

    return false;


  Register Src2Reg = getRegForValue(Src2Val);

  if (!Src2Reg)

    return false;


  if (NeedExtraOp)

    Src1Reg = emitLogicalOp_ri(ISD::XOR, MVT::i32, Src1Reg, 1);


  Register ResultReg = fastEmitInst_rr(Opc, &AArch64::GPR32RegClass, Src1Reg,

                                       Src2Reg);

  updateValueMap(SI, ResultReg);

  return true;

}


bool AArch64FastISel::selectSelect(const Instruction *I) {

  assert(isa<SelectInst>(I) && "Expected a select instruction.");

  MVT VT;

  if (!isTypeSupported(I->getType(), VT))

    return false;


  unsigned Opc;

  const TargetRegisterClass *RC;

  switch (VT.SimpleTy) {

  default:

    return false;

  case MVT::i1:

  case MVT::i8:

  case MVT::i16:

  case MVT::i32:

    Opc = AArch64::CSELWr;

    RC = &AArch64::GPR32RegClass;

    break;

  case MVT::i64:

    Opc = AArch64::CSELXr;

    RC = &AArch64::GPR64RegClass;

    break;

  case MVT::f32:

    Opc = AArch64::FCSELSrrr;

    RC = &AArch64::FPR32RegClass;

    break;

  case MVT::f64:

    Opc = AArch64::FCSELDrrr;

    RC = &AArch64::FPR64RegClass;

    break;

  }


  const SelectInst *SI = cast<SelectInst>(I);

  const Value *Cond = SI->getCondition();

  AArch64CC::CondCode CC = AArch64CC::NE;

  AArch64CC::CondCode ExtraCC = AArch64CC::AL;


  if (optimizeSelect(SI))

    return true;


  // Try to pickup the flags, so we don't have to emit another compare.

  if (foldXALUIntrinsic(CC, I, Cond)) {

    // Fake request the condition to force emission of the XALU intrinsic.

    Register CondReg = getRegForValue(Cond);

    if (!CondReg)

      return false;

  } else if (isa<CmpInst>(Cond) && cast<CmpInst>(Cond)->hasOneUse() &&

             isValueAvailable(Cond)) {

    const auto *Cmp = cast<CmpInst>(Cond);

    // Try to optimize or fold the cmp.

    CmpInst::Predicate Predicate = optimizeCmpPredicate(Cmp);

    const Value *FoldSelect = nullptr;

    switch (Predicate) {

    default:

      break;

    case CmpInst::FCMP_FALSE:

      FoldSelect = SI->getFalseValue();

      break;

    case CmpInst::FCMP_TRUE:

      FoldSelect = SI->getTrueValue();

      break;

    }


    if (FoldSelect) {

      Register SrcReg = getRegForValue(FoldSelect);

      if (!SrcReg)

        return false;


      updateValueMap(I, SrcReg);

      return true;

    }


    // Emit the cmp.

    if (!emitCmp(Cmp->getOperand(0), Cmp->getOperand(1), Cmp->isUnsigned()))

      return false;


    // FCMP_UEQ and FCMP_ONE cannot be checked with a single select instruction.

    CC = getCompareCC(Predicate);

    switch (Predicate) {

    default:

      break;

    case CmpInst::FCMP_UEQ:

      ExtraCC = AArch64CC::EQ;

      CC = AArch64CC::VS;

      break;

    case CmpInst::FCMP_ONE:

      ExtraCC = AArch64CC::MI;

      CC = AArch64CC::GT;

      break;

    }

    assert((CC != AArch64CC::AL) && "Unexpected condition code.");

  } else {

    Register CondReg = getRegForValue(Cond);

    if (!CondReg)

      return false;


    const MCInstrDesc &II = TII.get(AArch64::ANDSWri);

    CondReg = constrainOperandRegClass(II, CondReg, 1);


    // Emit a TST instruction (ANDS wzr, reg, #imm).

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II,

            AArch64::WZR)

        .addReg(CondReg)

        .addImm(AArch64_AM::encodeLogicalImmediate(1, 32));

  }


  Register Src1Reg = getRegForValue(SI->getTrueValue());

  Register Src2Reg = getRegForValue(SI->getFalseValue());


  if (!Src1Reg || !Src2Reg)

    return false;


  if (ExtraCC != AArch64CC::AL)

    Src2Reg = fastEmitInst_rri(Opc, RC, Src1Reg, Src2Reg, ExtraCC);


  Register ResultReg = fastEmitInst_rri(Opc, RC, Src1Reg, Src2Reg, CC);

  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectFPExt(const Instruction *I) {

  Value *V = I->getOperand(0);

  if (!I->getType()->isDoubleTy() || !V->getType()->isFloatTy())

    return false;


  Register Op = getRegForValue(V);

  if (Op == 0)

    return false;


  Register ResultReg = createResultReg(&AArch64::FPR64RegClass);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::FCVTDSr),

          ResultReg).addReg(Op);

  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectFPTrunc(const Instruction *I) {

  Value *V = I->getOperand(0);

  if (!I->getType()->isFloatTy() || !V->getType()->isDoubleTy())

    return false;


  Register Op = getRegForValue(V);

  if (Op == 0)

    return false;


  Register ResultReg = createResultReg(&AArch64::FPR32RegClass);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::FCVTSDr),

          ResultReg).addReg(Op);

  updateValueMap(I, ResultReg);

  return true;

}


// FPToUI and FPToSI

bool AArch64FastISel::selectFPToInt(const Instruction *I, bool Signed) {

  MVT DestVT;

  if (!isTypeLegal(I->getType(), DestVT) || DestVT.isVector())

    return false;


  Register SrcReg = getRegForValue(I->getOperand(0));

  if (SrcReg == 0)

    return false;


  EVT SrcVT = TLI.getValueType(DL, I->getOperand(0)->getType(), true);

  if (SrcVT == MVT::f128 || SrcVT == MVT::f16 || SrcVT == MVT::bf16)

    return false;


  unsigned Opc;

  if (SrcVT == MVT::f64) {

    if (Signed)

      Opc = (DestVT == MVT::i32) ? AArch64::FCVTZSUWDr : AArch64::FCVTZSUXDr;

    else

      Opc = (DestVT == MVT::i32) ? AArch64::FCVTZUUWDr : AArch64::FCVTZUUXDr;

  } else {

    if (Signed)

      Opc = (DestVT == MVT::i32) ? AArch64::FCVTZSUWSr : AArch64::FCVTZSUXSr;

    else

      Opc = (DestVT == MVT::i32) ? AArch64::FCVTZUUWSr : AArch64::FCVTZUUXSr;

  }

  Register ResultReg = createResultReg(

      DestVT == MVT::i32 ? &AArch64::GPR32RegClass : &AArch64::GPR64RegClass);

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(Opc), ResultReg)

      .addReg(SrcReg);

  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectIntToFP(const Instruction *I, bool Signed) {

  MVT DestVT;

  if (!isTypeLegal(I->getType(), DestVT) || DestVT.isVector())

    return false;

  // Let regular ISEL handle FP16

  if (DestVT == MVT::f16 || DestVT == MVT::bf16)

    return false;


  assert((DestVT == MVT::f32 || DestVT == MVT::f64) &&

         "Unexpected value type.");


  Register SrcReg = getRegForValue(I->getOperand(0));

  if (!SrcReg)

    return false;


  EVT SrcVT = TLI.getValueType(DL, I->getOperand(0)->getType(), true);


  // Handle sign-extension.

  if (SrcVT == MVT::i16 || SrcVT == MVT::i8 || SrcVT == MVT::i1) {

    SrcReg =

        emitIntExt(SrcVT.getSimpleVT(), SrcReg, MVT::i32, /*isZExt*/ !Signed);

    if (!SrcReg)

      return false;

  }


  unsigned Opc;

  if (SrcVT == MVT::i64) {

    if (Signed)

      Opc = (DestVT == MVT::f32) ? AArch64::SCVTFUXSri : AArch64::SCVTFUXDri;

    else

      Opc = (DestVT == MVT::f32) ? AArch64::UCVTFUXSri : AArch64::UCVTFUXDri;

  } else {

    if (Signed)

      Opc = (DestVT == MVT::f32) ? AArch64::SCVTFUWSri : AArch64::SCVTFUWDri;

    else

      Opc = (DestVT == MVT::f32) ? AArch64::UCVTFUWSri : AArch64::UCVTFUWDri;

  }


  Register ResultReg = fastEmitInst_r(Opc, TLI.getRegClassFor(DestVT), SrcReg);

  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::fastLowerArguments() {

  if (!FuncInfo.CanLowerReturn)

    return false;


  const Function *F = FuncInfo.Fn;

  if (F->isVarArg())

    return false;


  CallingConv::ID CC = F->getCallingConv();

  if (CC != CallingConv::C && CC != CallingConv::Swift)

    return false;


  if (Subtarget->hasCustomCallingConv())

    return false;


  // Only handle simple cases of up to 8 GPR and FPR each.

  unsigned GPRCnt = 0;

  unsigned FPRCnt = 0;

  for (auto const &Arg : F->args()) {

    if (Arg.hasAttribute(Attribute::ByVal) ||

        Arg.hasAttribute(Attribute::InReg) ||

        Arg.hasAttribute(Attribute::StructRet) ||

        Arg.hasAttribute(Attribute::SwiftSelf) ||

        Arg.hasAttribute(Attribute::SwiftAsync) ||

        Arg.hasAttribute(Attribute::SwiftError) ||

        Arg.hasAttribute(Attribute::Nest))

      return false;


    Type *ArgTy = Arg.getType();

    if (ArgTy->isStructTy() || ArgTy->isArrayTy())

      return false;


    EVT ArgVT = TLI.getValueType(DL, ArgTy);

    if (!ArgVT.isSimple())

      return false;


    MVT VT = ArgVT.getSimpleVT().SimpleTy;

    if (VT.isFloatingPoint() && !Subtarget->hasFPARMv8())

      return false;


    if (VT.isVector() &&

        (!Subtarget->hasNEON() || !Subtarget->isLittleEndian()))

      return false;


    if (VT >= MVT::i1 && VT <= MVT::i64)

      ++GPRCnt;

    else if ((VT >= MVT::f16 && VT <= MVT::f64) || VT.is64BitVector() ||

             VT.is128BitVector())

      ++FPRCnt;

    else

      return false;


    if (GPRCnt > 8 || FPRCnt > 8)

      return false;

  }


  static const MCPhysReg Registers[6][8] = {

    { AArch64::W0, AArch64::W1, AArch64::W2, AArch64::W3, AArch64::W4,

      AArch64::W5, AArch64::W6, AArch64::W7 },

    { AArch64::X0, AArch64::X1, AArch64::X2, AArch64::X3, AArch64::X4,

      AArch64::X5, AArch64::X6, AArch64::X7 },

    { AArch64::H0, AArch64::H1, AArch64::H2, AArch64::H3, AArch64::H4,

      AArch64::H5, AArch64::H6, AArch64::H7 },

    { AArch64::S0, AArch64::S1, AArch64::S2, AArch64::S3, AArch64::S4,

      AArch64::S5, AArch64::S6, AArch64::S7 },

    { AArch64::D0, AArch64::D1, AArch64::D2, AArch64::D3, AArch64::D4,

      AArch64::D5, AArch64::D6, AArch64::D7 },

    { AArch64::Q0, AArch64::Q1, AArch64::Q2, AArch64::Q3, AArch64::Q4,

      AArch64::Q5, AArch64::Q6, AArch64::Q7 }

  };


  unsigned GPRIdx = 0;

  unsigned FPRIdx = 0;

  for (auto const &Arg : F->args()) {

    MVT VT = TLI.getSimpleValueType(DL, Arg.getType());

    unsigned SrcReg;

    const TargetRegisterClass *RC;

    if (VT >= MVT::i1 && VT <= MVT::i32) {

      SrcReg = Registers[0][GPRIdx++];

      RC = &AArch64::GPR32RegClass;

      VT = MVT::i32;

    } else if (VT == MVT::i64) {

      SrcReg = Registers[1][GPRIdx++];

      RC = &AArch64::GPR64RegClass;

    } else if (VT == MVT::f16 || VT == MVT::bf16) {

      SrcReg = Registers[2][FPRIdx++];

      RC = &AArch64::FPR16RegClass;

    } else if (VT ==  MVT::f32) {

      SrcReg = Registers[3][FPRIdx++];

      RC = &AArch64::FPR32RegClass;

    } else if ((VT == MVT::f64) || VT.is64BitVector()) {

      SrcReg = Registers[4][FPRIdx++];

      RC = &AArch64::FPR64RegClass;

    } else if (VT.is128BitVector()) {

      SrcReg = Registers[5][FPRIdx++];

      RC = &AArch64::FPR128RegClass;

    } else

      llvm_unreachable("Unexpected value type.");


    Register DstReg = FuncInfo.MF->addLiveIn(SrcReg, RC);

    // FIXME: Unfortunately it's necessary to emit a copy from the livein copy.

    // Without this, EmitLiveInCopies may eliminate the livein if its only

    // use is a bitcast (which isn't turned into an instruction).

    Register ResultReg = createResultReg(RC);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(TargetOpcode::COPY), ResultReg)

        .addReg(DstReg, getKillRegState(true));

    updateValueMap(&Arg, ResultReg);

  }

  return true;

}


bool AArch64FastISel::processCallArgs(CallLoweringInfo &CLI,

                                      SmallVectorImpl<MVT> &OutVTs,

                                      unsigned &NumBytes) {

  CallingConv::ID CC = CLI.CallConv;

  SmallVector<CCValAssign, 16> ArgLocs;

  CCState CCInfo(CC, false, *FuncInfo.MF, ArgLocs, *Context);

  CCInfo.AnalyzeCallOperands(OutVTs, CLI.OutFlags, CCAssignFnForCall(CC));


  // Get a count of how many bytes are to be pushed on the stack.

  NumBytes = CCInfo.getStackSize();


  // Issue CALLSEQ_START

  unsigned AdjStackDown = TII.getCallFrameSetupOpcode();

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AdjStackDown))

    .addImm(NumBytes).addImm(0);


  // Process the args.

  for (CCValAssign &VA : ArgLocs) {

    const Value *ArgVal = CLI.OutVals[VA.getValNo()];

    MVT ArgVT = OutVTs[VA.getValNo()];


    Register ArgReg = getRegForValue(ArgVal);

    if (!ArgReg)

      return false;


    // Handle arg promotion: SExt, ZExt, AExt.

    switch (VA.getLocInfo()) {

    case CCValAssign::Full:

      break;

    case CCValAssign::SExt: {

      MVT DestVT = VA.getLocVT();

      MVT SrcVT = ArgVT;

      ArgReg = emitIntExt(SrcVT, ArgReg, DestVT, /*isZExt=*/false);

      if (!ArgReg)

        return false;

      break;

    }

    case CCValAssign::AExt:

    // Intentional fall-through.

    case CCValAssign::ZExt: {

      MVT DestVT = VA.getLocVT();

      MVT SrcVT = ArgVT;

      ArgReg = emitIntExt(SrcVT, ArgReg, DestVT, /*isZExt=*/true);

      if (!ArgReg)

        return false;

      break;

    }

    default:

      llvm_unreachable("Unknown arg promotion!");

    }


    // Now copy/store arg to correct locations.

    if (VA.isRegLoc() && !VA.needsCustom()) {

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

              TII.get(TargetOpcode::COPY), VA.getLocReg()).addReg(ArgReg);

      CLI.OutRegs.push_back(VA.getLocReg());

    } else if (VA.needsCustom()) {

      // FIXME: Handle custom args.

      return false;

    } else {

      assert(VA.isMemLoc() && "Assuming store on stack.");


      // Don't emit stores for undef values.

      if (isa<UndefValue>(ArgVal))

        continue;


      // Need to store on the stack.

      unsigned ArgSize = (ArgVT.getSizeInBits() + 7) / 8;


      unsigned BEAlign = 0;

      if (ArgSize < 8 && !Subtarget->isLittleEndian())

        BEAlign = 8 - ArgSize;


      Address Addr;

      Addr.setKind(Address::RegBase);

      Addr.setReg(AArch64::SP);

      Addr.setOffset(VA.getLocMemOffset() + BEAlign);


      Align Alignment = DL.getABITypeAlign(ArgVal->getType());

      MachineMemOperand *MMO = FuncInfo.MF->getMachineMemOperand(

          MachinePointerInfo::getStack(*FuncInfo.MF, Addr.getOffset()),

          MachineMemOperand::MOStore, ArgVT.getStoreSize(), Alignment);


      if (!emitStore(ArgVT, ArgReg, Addr, MMO))

        return false;

    }

  }

  return true;

}


bool AArch64FastISel::finishCall(CallLoweringInfo &CLI, unsigned NumBytes) {

  CallingConv::ID CC = CLI.CallConv;


  // Issue CALLSEQ_END

  unsigned AdjStackUp = TII.getCallFrameDestroyOpcode();

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AdjStackUp))

    .addImm(NumBytes).addImm(0);


  // Now the return values.

  SmallVector<CCValAssign, 16> RVLocs;

  CCState CCInfo(CC, false, *FuncInfo.MF, RVLocs, *Context);

  CCInfo.AnalyzeCallResult(CLI.Ins, CCAssignFnForCall(CC));


  Register ResultReg = FuncInfo.CreateRegs(CLI.RetTy);

  for (unsigned i = 0; i != RVLocs.size(); ++i) {

    CCValAssign &VA = RVLocs[i];

    MVT CopyVT = VA.getValVT();

    unsigned CopyReg = ResultReg + i;


    // TODO: Handle big-endian results

    if (CopyVT.isVector() && !Subtarget->isLittleEndian())

      return false;


    // Copy result out of their specified physreg.

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(TargetOpcode::COPY),

            CopyReg)

        .addReg(VA.getLocReg());

    CLI.InRegs.push_back(VA.getLocReg());

  }


  CLI.ResultReg = ResultReg;

  CLI.NumResultRegs = RVLocs.size();


  return true;

}


bool AArch64FastISel::fastLowerCall(CallLoweringInfo &CLI) {

  CallingConv::ID CC  = CLI.CallConv;

  bool IsTailCall     = CLI.IsTailCall;

  bool IsVarArg       = CLI.IsVarArg;

  const Value *Callee = CLI.Callee;

  MCSymbol *Symbol = CLI.Symbol;


  if (!Callee && !Symbol)

    return false;


  // Allow SelectionDAG isel to handle calls to functions like setjmp that need

  // a bti instruction following the call.

  if (CLI.CB && CLI.CB->hasFnAttr(Attribute::ReturnsTwice) &&

      !Subtarget->noBTIAtReturnTwice() &&

      MF->getInfo<AArch64FunctionInfo>()->branchTargetEnforcement())

    return false;


  // Allow SelectionDAG isel to handle indirect calls with KCFI checks.

  if (CLI.CB && CLI.CB->isIndirectCall() &&

      CLI.CB->getOperandBundle(LLVMContext::OB_kcfi))

    return false;


  // Allow SelectionDAG isel to handle tail calls.

  if (IsTailCall)

    return false;


  // FIXME: we could and should support this, but for now correctness at -O0 is

  // more important.

  if (Subtarget->isTargetILP32())

    return false;


  CodeModel::Model CM = TM.getCodeModel();

  // Only support the small-addressing and large code models.

  if (CM != CodeModel::Large && !Subtarget->useSmallAddressing())

    return false;


  // FIXME: Add large code model support for ELF.

  if (CM == CodeModel::Large && !Subtarget->isTargetMachO())

    return false;


  // ELF -fno-plt compiled intrinsic calls do not have the nonlazybind

  // attribute. Check "RtLibUseGOT" instead.

  if (MF->getFunction().getParent()->getRtLibUseGOT())

    return false;


  // Let SDISel handle vararg functions.

  if (IsVarArg)

    return false;


  if (Subtarget->isWindowsArm64EC())

    return false;


  for (auto Flag : CLI.OutFlags)

    if (Flag.isInReg() || Flag.isSRet() || Flag.isNest() || Flag.isByVal() ||

        Flag.isSwiftSelf() || Flag.isSwiftAsync() || Flag.isSwiftError())

      return false;


  // Set up the argument vectors.

  SmallVector<MVT, 16> OutVTs;

  OutVTs.reserve(CLI.OutVals.size());


  for (auto *Val : CLI.OutVals) {

    MVT VT;

    if (!isTypeLegal(Val->getType(), VT) &&

        !(VT == MVT::i1 || VT == MVT::i8 || VT == MVT::i16))

      return false;


    // We don't handle vector parameters yet.

    if (VT.isVector() || VT.getSizeInBits() > 64)

      return false;


    OutVTs.push_back(VT);

  }


  Address Addr;

  if (Callee && !computeCallAddress(Callee, Addr))

    return false;


  // The weak function target may be zero; in that case we must use indirect

  // addressing via a stub on windows as it may be out of range for a

  // PC-relative jump.

  if (Subtarget->isTargetWindows() && Addr.getGlobalValue() &&

      Addr.getGlobalValue()->hasExternalWeakLinkage())

    return false;


  // Handle the arguments now that we've gotten them.

  unsigned NumBytes;

  if (!processCallArgs(CLI, OutVTs, NumBytes))

    return false;


  const AArch64RegisterInfo *RegInfo = Subtarget->getRegisterInfo();

  if (RegInfo->isAnyArgRegReserved(*MF))

    RegInfo->emitReservedArgRegCallError(*MF);


  // Issue the call.

  MachineInstrBuilder MIB;

  if (Subtarget->useSmallAddressing()) {

    const MCInstrDesc &II =

        TII.get(Addr.getReg() ? getBLRCallOpcode(*MF) : (unsigned)AArch64::BL);

    MIB = BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II);

    if (Symbol)

      MIB.addSym(Symbol, 0);

    else if (Addr.getGlobalValue())

      MIB.addGlobalAddress(Addr.getGlobalValue(), 0, 0);

    else if (Addr.getReg()) {

      Register Reg = constrainOperandRegClass(II, Addr.getReg(), 0);

      MIB.addReg(Reg);

    } else

      return false;

  } else {

    unsigned CallReg = 0;

    if (Symbol) {

      Register ADRPReg = createResultReg(&AArch64::GPR64commonRegClass);

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::ADRP),

              ADRPReg)

          .addSym(Symbol, AArch64II::MO_GOT | AArch64II::MO_PAGE);


      CallReg = createResultReg(&AArch64::GPR64RegClass);

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

              TII.get(AArch64::LDRXui), CallReg)

          .addReg(ADRPReg)

          .addSym(Symbol,

                  AArch64II::MO_GOT | AArch64II::MO_PAGEOFF | AArch64II::MO_NC);

    } else if (Addr.getGlobalValue())

      CallReg = materializeGV(Addr.getGlobalValue());

    else if (Addr.getReg())

      CallReg = Addr.getReg();


    if (!CallReg)

      return false;


    const MCInstrDesc &II = TII.get(getBLRCallOpcode(*MF));

    CallReg = constrainOperandRegClass(II, CallReg, 0);

    MIB = BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II).addReg(CallReg);

  }


  // Add implicit physical register uses to the call.

  for (auto Reg : CLI.OutRegs)

    MIB.addReg(Reg, RegState::Implicit);


  // Add a register mask with the call-preserved registers.

  // Proper defs for return values will be added by setPhysRegsDeadExcept().

  MIB.addRegMask(TRI.getCallPreservedMask(*FuncInfo.MF, CC));


  CLI.Call = MIB;


  // Finish off the call including any return values.

  return finishCall(CLI, NumBytes);

}


bool AArch64FastISel::isMemCpySmall(uint64_t Len, MaybeAlign Alignment) {

  if (Alignment)

    return Len / Alignment->value() <= 4;

  else

    return Len < 32;

}


bool AArch64FastISel::tryEmitSmallMemCpy(Address Dest, Address Src,

                                         uint64_t Len, MaybeAlign Alignment) {

  // Make sure we don't bloat code by inlining very large memcpy's.

  if (!isMemCpySmall(Len, Alignment))

    return false;


  int64_t UnscaledOffset = 0;

  Address OrigDest = Dest;

  Address OrigSrc = Src;


  while (Len) {

    MVT VT;

    if (!Alignment || *Alignment >= 8) {

      if (Len >= 8)

        VT = MVT::i64;

      else if (Len >= 4)

        VT = MVT::i32;

      else if (Len >= 2)

        VT = MVT::i16;

      else {

        VT = MVT::i8;

      }

    } else {

      assert(Alignment && "Alignment is set in this branch");

      // Bound based on alignment.

      if (Len >= 4 && *Alignment == 4)

        VT = MVT::i32;

      else if (Len >= 2 && *Alignment == 2)

        VT = MVT::i16;

      else {

        VT = MVT::i8;

      }

    }


    unsigned ResultReg = emitLoad(VT, VT, Src);

    if (!ResultReg)

      return false;


    if (!emitStore(VT, ResultReg, Dest))

      return false;


    int64_t Size = VT.getSizeInBits() / 8;

    Len -= Size;

    UnscaledOffset += Size;


    // We need to recompute the unscaled offset for each iteration.

    Dest.setOffset(OrigDest.getOffset() + UnscaledOffset);

    Src.setOffset(OrigSrc.getOffset() + UnscaledOffset);

  }


  return true;

}


/// Check if it is possible to fold the condition from the XALU intrinsic

/// into the user. The condition code will only be updated on success.

bool AArch64FastISel::foldXALUIntrinsic(AArch64CC::CondCode &CC,

                                        const Instruction *I,

                                        const Value *Cond) {

  if (!isa<ExtractValueInst>(Cond))

    return false;


  const auto *EV = cast<ExtractValueInst>(Cond);

  if (!isa<IntrinsicInst>(EV->getAggregateOperand()))

    return false;


  const auto *II = cast<IntrinsicInst>(EV->getAggregateOperand());

  MVT RetVT;

  const Function *Callee = II->getCalledFunction();

  Type *RetTy =

  cast<StructType>(Callee->getReturnType())->getTypeAtIndex(0U);

  if (!isTypeLegal(RetTy, RetVT))

    return false;


  if (RetVT != MVT::i32 && RetVT != MVT::i64)

    return false;


  const Value *LHS = II->getArgOperand(0);

  const Value *RHS = II->getArgOperand(1);


  // Canonicalize immediate to the RHS.

  if (isa<ConstantInt>(LHS) && !isa<ConstantInt>(RHS) && II->isCommutative())

    std::swap(LHS, RHS);


  // Simplify multiplies.

  Intrinsic::ID IID = II->getIntrinsicID();

  switch (IID) {

  default:

    break;

  case Intrinsic::smul_with_overflow:

    if (const auto *C = dyn_cast<ConstantInt>(RHS))

      if (C->getValue() == 2)

        IID = Intrinsic::sadd_with_overflow;

    break;

  case Intrinsic::umul_with_overflow:

    if (const auto *C = dyn_cast<ConstantInt>(RHS))

      if (C->getValue() == 2)

        IID = Intrinsic::uadd_with_overflow;

    break;

  }


  AArch64CC::CondCode TmpCC;

  switch (IID) {

  default:

    return false;

  case Intrinsic::sadd_with_overflow:

  case Intrinsic::ssub_with_overflow:

    TmpCC = AArch64CC::VS;

    break;

  case Intrinsic::uadd_with_overflow:

    TmpCC = AArch64CC::HS;

    break;

  case Intrinsic::usub_with_overflow:

    TmpCC = AArch64CC::LO;

    break;

  case Intrinsic::smul_with_overflow:

  case Intrinsic::umul_with_overflow:

    TmpCC = AArch64CC::NE;

    break;

  }


  // Check if both instructions are in the same basic block.

  if (!isValueAvailable(II))

    return false;


  // Make sure nothing is in the way

  BasicBlock::const_iterator Start(I);

  BasicBlock::const_iterator End(II);

  for (auto Itr = std::prev(Start); Itr != End; --Itr) {

    // We only expect extractvalue instructions between the intrinsic and the

    // instruction to be selected.

    if (!isa<ExtractValueInst>(Itr))

      return false;


    // Check that the extractvalue operand comes from the intrinsic.

    const auto *EVI = cast<ExtractValueInst>(Itr);

    if (EVI->getAggregateOperand() != II)

      return false;

  }


  CC = TmpCC;

  return true;

}


bool AArch64FastISel::fastLowerIntrinsicCall(const IntrinsicInst *II) {

  // FIXME: Handle more intrinsics.

  switch (II->getIntrinsicID()) {

  default: return false;

  case Intrinsic::frameaddress: {

    MachineFrameInfo &MFI = FuncInfo.MF->getFrameInfo();

    MFI.setFrameAddressIsTaken(true);


    const AArch64RegisterInfo *RegInfo = Subtarget->getRegisterInfo();

    Register FramePtr = RegInfo->getFrameRegister(*(FuncInfo.MF));

    Register SrcReg = MRI.createVirtualRegister(&AArch64::GPR64RegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(TargetOpcode::COPY), SrcReg).addReg(FramePtr);

    // Recursively load frame address

    // ldr x0, [fp]

    // ldr x0, [x0]

    // ldr x0, [x0]

    // ...

    unsigned DestReg;

    unsigned Depth = cast<ConstantInt>(II->getOperand(0))->getZExtValue();

    while (Depth--) {

      DestReg = fastEmitInst_ri(AArch64::LDRXui, &AArch64::GPR64RegClass,

                                SrcReg, 0);

      assert(DestReg && "Unexpected LDR instruction emission failure.");

      SrcReg = DestReg;

    }


    updateValueMap(II, SrcReg);

    return true;

  }

  case Intrinsic::sponentry: {

    MachineFrameInfo &MFI = FuncInfo.MF->getFrameInfo();


    // SP = FP + Fixed Object + 16

    int FI = MFI.CreateFixedObject(4, 0, false);

    Register ResultReg = createResultReg(&AArch64::GPR64spRegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(AArch64::ADDXri), ResultReg)

            .addFrameIndex(FI)

            .addImm(0)

            .addImm(0);


    updateValueMap(II, ResultReg);

    return true;

  }

  case Intrinsic::memcpy:

  case Intrinsic::memmove: {

    const auto *MTI = cast<MemTransferInst>(II);

    // Don't handle volatile.

    if (MTI->isVolatile())

      return false;


    // Disable inlining for memmove before calls to ComputeAddress.  Otherwise,

    // we would emit dead code because we don't currently handle memmoves.

    bool IsMemCpy = (II->getIntrinsicID() == Intrinsic::memcpy);

    if (isa<ConstantInt>(MTI->getLength()) && IsMemCpy) {

      // Small memcpy's are common enough that we want to do them without a call

      // if possible.

      uint64_t Len = cast<ConstantInt>(MTI->getLength())->getZExtValue();

      MaybeAlign Alignment;

      if (MTI->getDestAlign() || MTI->getSourceAlign())

        Alignment = std::min(MTI->getDestAlign().valueOrOne(),

                             MTI->getSourceAlign().valueOrOne());

      if (isMemCpySmall(Len, Alignment)) {

        Address Dest, Src;

        if (!computeAddress(MTI->getRawDest(), Dest) ||

            !computeAddress(MTI->getRawSource(), Src))

          return false;

        if (tryEmitSmallMemCpy(Dest, Src, Len, Alignment))

          return true;

      }

    }


    if (!MTI->getLength()->getType()->isIntegerTy(64))

      return false;


    if (MTI->getSourceAddressSpace() > 255 || MTI->getDestAddressSpace() > 255)

      // Fast instruction selection doesn't support the special

      // address spaces.

      return false;


    const char *IntrMemName = isa<MemCpyInst>(II) ? "memcpy" : "memmove";

    return lowerCallTo(II, IntrMemName, II->arg_size() - 1);

  }

  case Intrinsic::memset: {

    const MemSetInst *MSI = cast<MemSetInst>(II);

    // Don't handle volatile.

    if (MSI->isVolatile())

      return false;


    if (!MSI->getLength()->getType()->isIntegerTy(64))

      return false;


    if (MSI->getDestAddressSpace() > 255)

      // Fast instruction selection doesn't support the special

      // address spaces.

      return false;


    return lowerCallTo(II, "memset", II->arg_size() - 1);

  }

  case Intrinsic::sin:

  case Intrinsic::cos:

  case Intrinsic::tan:

  case Intrinsic::pow: {

    MVT RetVT;

    if (!isTypeLegal(II->getType(), RetVT))

      return false;


    if (RetVT != MVT::f32 && RetVT != MVT::f64)

      return false;


    static const RTLIB::Libcall LibCallTable[4][2] = {

        {RTLIB::SIN_F32, RTLIB::SIN_F64},

        {RTLIB::COS_F32, RTLIB::COS_F64},

        {RTLIB::TAN_F32, RTLIB::TAN_F64},

        {RTLIB::POW_F32, RTLIB::POW_F64}};

    RTLIB::Libcall LC;

    bool Is64Bit = RetVT == MVT::f64;

    switch (II->getIntrinsicID()) {

    default:

      llvm_unreachable("Unexpected intrinsic.");

    case Intrinsic::sin:

      LC = LibCallTable[0][Is64Bit];

      break;

    case Intrinsic::cos:

      LC = LibCallTable[1][Is64Bit];

      break;

    case Intrinsic::tan:

      LC = LibCallTable[2][Is64Bit];

      break;

    case Intrinsic::pow:

      LC = LibCallTable[3][Is64Bit];

      break;

    }


    ArgListTy Args;

    Args.reserve(II->arg_size());


    // Populate the argument list.

    for (auto &Arg : II->args()) {

      ArgListEntry Entry;

      Entry.Val = Arg;

      Entry.Ty = Arg->getType();

      Args.push_back(Entry);

    }


    CallLoweringInfo CLI;

    MCContext &Ctx = MF->getContext();

    CLI.setCallee(DL, Ctx, TLI.getLibcallCallingConv(LC), II->getType(),

                  TLI.getLibcallName(LC), std::move(Args));

    if (!lowerCallTo(CLI))

      return false;

    updateValueMap(II, CLI.ResultReg);

    return true;

  }

  case Intrinsic::fabs: {

    MVT VT;

    if (!isTypeLegal(II->getType(), VT))

      return false;


    unsigned Opc;

    switch (VT.SimpleTy) {

    default:

      return false;

    case MVT::f32:

      Opc = AArch64::FABSSr;

      break;

    case MVT::f64:

      Opc = AArch64::FABSDr;

      break;

    }

    Register SrcReg = getRegForValue(II->getOperand(0));

    if (!SrcReg)

      return false;

    Register ResultReg = createResultReg(TLI.getRegClassFor(VT));

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(Opc), ResultReg)

      .addReg(SrcReg);

    updateValueMap(II, ResultReg);

    return true;

  }

  case Intrinsic::trap:

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::BRK))

        .addImm(1);

    return true;

  case Intrinsic::debugtrap:

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::BRK))

        .addImm(0xF000);

    return true;


  case Intrinsic::sqrt: {

    Type *RetTy = II->getCalledFunction()->getReturnType();


    MVT VT;

    if (!isTypeLegal(RetTy, VT))

      return false;


    Register Op0Reg = getRegForValue(II->getOperand(0));

    if (!Op0Reg)

      return false;


    unsigned ResultReg = fastEmit_r(VT, VT, ISD::FSQRT, Op0Reg);

    if (!ResultReg)

      return false;


    updateValueMap(II, ResultReg);

    return true;

  }

  case Intrinsic::sadd_with_overflow:

  case Intrinsic::uadd_with_overflow:

  case Intrinsic::ssub_with_overflow:

  case Intrinsic::usub_with_overflow:

  case Intrinsic::smul_with_overflow:

  case Intrinsic::umul_with_overflow: {

    // This implements the basic lowering of the xalu with overflow intrinsics.

    const Function *Callee = II->getCalledFunction();

    auto *Ty = cast<StructType>(Callee->getReturnType());

    Type *RetTy = Ty->getTypeAtIndex(0U);


    MVT VT;

    if (!isTypeLegal(RetTy, VT))

      return false;


    if (VT != MVT::i32 && VT != MVT::i64)

      return false;


    const Value *LHS = II->getArgOperand(0);

    const Value *RHS = II->getArgOperand(1);

    // Canonicalize immediate to the RHS.

    if (isa<ConstantInt>(LHS) && !isa<ConstantInt>(RHS) && II->isCommutative())

      std::swap(LHS, RHS);


    // Simplify multiplies.

    Intrinsic::ID IID = II->getIntrinsicID();

    switch (IID) {

    default:

      break;

    case Intrinsic::smul_with_overflow:

      if (const auto *C = dyn_cast<ConstantInt>(RHS))

        if (C->getValue() == 2) {

          IID = Intrinsic::sadd_with_overflow;

          RHS = LHS;

        }

      break;

    case Intrinsic::umul_with_overflow:

      if (const auto *C = dyn_cast<ConstantInt>(RHS))

        if (C->getValue() == 2) {

          IID = Intrinsic::uadd_with_overflow;

          RHS = LHS;

        }

      break;

    }


    unsigned ResultReg1 = 0, ResultReg2 = 0, MulReg = 0;

    AArch64CC::CondCode CC = AArch64CC::Invalid;

    switch (IID) {

    default: llvm_unreachable("Unexpected intrinsic!");

    case Intrinsic::sadd_with_overflow:

      ResultReg1 = emitAdd(VT, LHS, RHS, /*SetFlags=*/true);

      CC = AArch64CC::VS;

      break;

    case Intrinsic::uadd_with_overflow:

      ResultReg1 = emitAdd(VT, LHS, RHS, /*SetFlags=*/true);

      CC = AArch64CC::HS;

      break;

    case Intrinsic::ssub_with_overflow:

      ResultReg1 = emitSub(VT, LHS, RHS, /*SetFlags=*/true);

      CC = AArch64CC::VS;

      break;

    case Intrinsic::usub_with_overflow:

      ResultReg1 = emitSub(VT, LHS, RHS, /*SetFlags=*/true);

      CC = AArch64CC::LO;

      break;

    case Intrinsic::smul_with_overflow: {

      CC = AArch64CC::NE;

      Register LHSReg = getRegForValue(LHS);

      if (!LHSReg)

        return false;


      Register RHSReg = getRegForValue(RHS);

      if (!RHSReg)

        return false;


      if (VT == MVT::i32) {

        MulReg = emitSMULL_rr(MVT::i64, LHSReg, RHSReg);

        Register MulSubReg =

            fastEmitInst_extractsubreg(VT, MulReg, AArch64::sub_32);

        // cmp xreg, wreg, sxtw

        emitAddSub_rx(/*UseAdd=*/false, MVT::i64, MulReg, MulSubReg,

                      AArch64_AM::SXTW, /*ShiftImm=*/0, /*SetFlags=*/true,

                      /*WantResult=*/false);

        MulReg = MulSubReg;

      } else {

        assert(VT == MVT::i64 && "Unexpected value type.");

        // LHSReg and RHSReg cannot be killed by this Mul, since they are

        // reused in the next instruction.

        MulReg = emitMul_rr(VT, LHSReg, RHSReg);

        unsigned SMULHReg = fastEmit_rr(VT, VT, ISD::MULHS, LHSReg, RHSReg);

        emitSubs_rs(VT, SMULHReg, MulReg, AArch64_AM::ASR, 63,

                    /*WantResult=*/false);

      }

      break;

    }

    case Intrinsic::umul_with_overflow: {

      CC = AArch64CC::NE;

      Register LHSReg = getRegForValue(LHS);

      if (!LHSReg)

        return false;


      Register RHSReg = getRegForValue(RHS);

      if (!RHSReg)

        return false;


      if (VT == MVT::i32) {

        MulReg = emitUMULL_rr(MVT::i64, LHSReg, RHSReg);

        // tst xreg, #0xffffffff00000000

        BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

                TII.get(AArch64::ANDSXri), AArch64::XZR)

            .addReg(MulReg)

            .addImm(AArch64_AM::encodeLogicalImmediate(0xFFFFFFFF00000000, 64));

        MulReg = fastEmitInst_extractsubreg(VT, MulReg, AArch64::sub_32);

      } else {

        assert(VT == MVT::i64 && "Unexpected value type.");

        // LHSReg and RHSReg cannot be killed by this Mul, since they are

        // reused in the next instruction.

        MulReg = emitMul_rr(VT, LHSReg, RHSReg);

        unsigned UMULHReg = fastEmit_rr(VT, VT, ISD::MULHU, LHSReg, RHSReg);

        emitSubs_rr(VT, AArch64::XZR, UMULHReg, /*WantResult=*/false);

      }

      break;

    }

    }


    if (MulReg) {

      ResultReg1 = createResultReg(TLI.getRegClassFor(VT));

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

              TII.get(TargetOpcode::COPY), ResultReg1).addReg(MulReg);

    }


    if (!ResultReg1)

      return false;


    ResultReg2 = fastEmitInst_rri(AArch64::CSINCWr, &AArch64::GPR32RegClass,

                                  AArch64::WZR, AArch64::WZR,

                                  getInvertedCondCode(CC));

    (void)ResultReg2;

    assert((ResultReg1 + 1) == ResultReg2 &&

           "Nonconsecutive result registers.");

    updateValueMap(II, ResultReg1, 2);

    return true;

  }

  case Intrinsic::aarch64_crc32b:

  case Intrinsic::aarch64_crc32h:

  case Intrinsic::aarch64_crc32w:

  case Intrinsic::aarch64_crc32x:

  case Intrinsic::aarch64_crc32cb:

  case Intrinsic::aarch64_crc32ch:

  case Intrinsic::aarch64_crc32cw:

  case Intrinsic::aarch64_crc32cx: {

    if (!Subtarget->hasCRC())

      return false;


    unsigned Opc;

    switch (II->getIntrinsicID()) {

    default:

      llvm_unreachable("Unexpected intrinsic!");

    case Intrinsic::aarch64_crc32b:

      Opc = AArch64::CRC32Brr;

      break;

    case Intrinsic::aarch64_crc32h:

      Opc = AArch64::CRC32Hrr;

      break;

    case Intrinsic::aarch64_crc32w:

      Opc = AArch64::CRC32Wrr;

      break;

    case Intrinsic::aarch64_crc32x:

      Opc = AArch64::CRC32Xrr;

      break;

    case Intrinsic::aarch64_crc32cb:

      Opc = AArch64::CRC32CBrr;

      break;

    case Intrinsic::aarch64_crc32ch:

      Opc = AArch64::CRC32CHrr;

      break;

    case Intrinsic::aarch64_crc32cw:

      Opc = AArch64::CRC32CWrr;

      break;

    case Intrinsic::aarch64_crc32cx:

      Opc = AArch64::CRC32CXrr;

      break;

    }


    Register LHSReg = getRegForValue(II->getArgOperand(0));

    Register RHSReg = getRegForValue(II->getArgOperand(1));

    if (!LHSReg || !RHSReg)

      return false;


    Register ResultReg =

        fastEmitInst_rr(Opc, &AArch64::GPR32RegClass, LHSReg, RHSReg);

    updateValueMap(II, ResultReg);

    return true;

  }

  }

  return false;

}


bool AArch64FastISel::selectRet(const Instruction *I) {

  const ReturnInst *Ret = cast<ReturnInst>(I);

  const Function &F = *I->getParent()->getParent();


  if (!FuncInfo.CanLowerReturn)

    return false;


  if (F.isVarArg())

    return false;


  if (TLI.supportSwiftError() &&

      F.getAttributes().hasAttrSomewhere(Attribute::SwiftError))

    return false;


  if (TLI.supportSplitCSR(FuncInfo.MF))

    return false;


  // Build a list of return value registers.

  SmallVector<unsigned, 4> RetRegs;


  if (Ret->getNumOperands() > 0) {

    CallingConv::ID CC = F.getCallingConv();

    SmallVector<ISD::OutputArg, 4> Outs;

    GetReturnInfo(CC, F.getReturnType(), F.getAttributes(), Outs, TLI, DL);


    // Analyze operands of the call, assigning locations to each operand.

    SmallVector<CCValAssign, 16> ValLocs;

    CCState CCInfo(CC, F.isVarArg(), *FuncInfo.MF, ValLocs, I->getContext());

    CCInfo.AnalyzeReturn(Outs, RetCC_AArch64_AAPCS);


    // Only handle a single return value for now.

    if (ValLocs.size() != 1)

      return false;


    CCValAssign &VA = ValLocs[0];

    const Value *RV = Ret->getOperand(0);


    // Don't bother handling odd stuff for now.

    if ((VA.getLocInfo() != CCValAssign::Full) &&

        (VA.getLocInfo() != CCValAssign::BCvt))

      return false;


    // Only handle register returns for now.

    if (!VA.isRegLoc())

      return false;


    Register Reg = getRegForValue(RV);

    if (Reg == 0)

      return false;


    unsigned SrcReg = Reg + VA.getValNo();

    Register DestReg = VA.getLocReg();

    // Avoid a cross-class copy. This is very unlikely.

    if (!MRI.getRegClass(SrcReg)->contains(DestReg))

      return false;


    EVT RVEVT = TLI.getValueType(DL, RV->getType());

    if (!RVEVT.isSimple())

      return false;


    // Vectors (of > 1 lane) in big endian need tricky handling.

    if (RVEVT.isVector() && RVEVT.getVectorElementCount().isVector() &&

        !Subtarget->isLittleEndian())

      return false;


    MVT RVVT = RVEVT.getSimpleVT();

    if (RVVT == MVT::f128)

      return false;


    MVT DestVT = VA.getValVT();

    // Special handling for extended integers.

    if (RVVT != DestVT) {

      if (RVVT != MVT::i1 && RVVT != MVT::i8 && RVVT != MVT::i16)

        return false;


      if (!Outs[0].Flags.isZExt() && !Outs[0].Flags.isSExt())

        return false;


      bool IsZExt = Outs[0].Flags.isZExt();

      SrcReg = emitIntExt(RVVT, SrcReg, DestVT, IsZExt);

      if (SrcReg == 0)

        return false;

    }


    // "Callee" (i.e. value producer) zero extends pointers at function

    // boundary.

    if (Subtarget->isTargetILP32() && RV->getType()->isPointerTy())

      SrcReg = emitAnd_ri(MVT::i64, SrcReg, 0xffffffff);


    // Make the copy.

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(TargetOpcode::COPY), DestReg).addReg(SrcReg);


    // Add register to return instruction.

    RetRegs.push_back(VA.getLocReg());

  }


  MachineInstrBuilder MIB = BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

                                    TII.get(AArch64::RET_ReallyLR));

  for (unsigned RetReg : RetRegs)

    MIB.addReg(RetReg, RegState::Implicit);

  return true;

}


bool AArch64FastISel::selectTrunc(const Instruction *I) {

  Type *DestTy = I->getType();

  Value *Op = I->getOperand(0);

  Type *SrcTy = Op->getType();


  EVT SrcEVT = TLI.getValueType(DL, SrcTy, true);

  EVT DestEVT = TLI.getValueType(DL, DestTy, true);

  if (!SrcEVT.isSimple())

    return false;

  if (!DestEVT.isSimple())

    return false;


  MVT SrcVT = SrcEVT.getSimpleVT();

  MVT DestVT = DestEVT.getSimpleVT();


  if (SrcVT != MVT::i64 && SrcVT != MVT::i32 && SrcVT != MVT::i16 &&

      SrcVT != MVT::i8)

    return false;

  if (DestVT != MVT::i32 && DestVT != MVT::i16 && DestVT != MVT::i8 &&

      DestVT != MVT::i1)

    return false;


  Register SrcReg = getRegForValue(Op);

  if (!SrcReg)

    return false;


  // If we're truncating from i64 to a smaller non-legal type then generate an

  // AND. Otherwise, we know the high bits are undefined and a truncate only

  // generate a COPY. We cannot mark the source register also as result

  // register, because this can incorrectly transfer the kill flag onto the

  // source register.

  unsigned ResultReg;

  if (SrcVT == MVT::i64) {

    uint64_t Mask = 0;

    switch (DestVT.SimpleTy) {

    default:

      // Trunc i64 to i32 is handled by the target-independent fast-isel.

      return false;

    case MVT::i1:

      Mask = 0x1;

      break;

    case MVT::i8:

      Mask = 0xff;

      break;

    case MVT::i16:

      Mask = 0xffff;

      break;

    }

    // Issue an extract_subreg to get the lower 32-bits.

    Register Reg32 = fastEmitInst_extractsubreg(MVT::i32, SrcReg,

                                                AArch64::sub_32);

    // Create the AND instruction which performs the actual truncation.

    ResultReg = emitAnd_ri(MVT::i32, Reg32, Mask);

    assert(ResultReg && "Unexpected AND instruction emission failure.");

  } else {

    ResultReg = createResultReg(&AArch64::GPR32RegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(TargetOpcode::COPY), ResultReg)

        .addReg(SrcReg);

  }


  updateValueMap(I, ResultReg);

  return true;

}


unsigned AArch64FastISel::emiti1Ext(unsigned SrcReg, MVT DestVT, bool IsZExt) {

  assert((DestVT == MVT::i8 || DestVT == MVT::i16 || DestVT == MVT::i32 ||

          DestVT == MVT::i64) &&

         "Unexpected value type.");

  // Handle i8 and i16 as i32.

  if (DestVT == MVT::i8 || DestVT == MVT::i16)

    DestVT = MVT::i32;


  if (IsZExt) {

    unsigned ResultReg = emitAnd_ri(MVT::i32, SrcReg, 1);

    assert(ResultReg && "Unexpected AND instruction emission failure.");

    if (DestVT == MVT::i64) {

      // We're ZExt i1 to i64.  The ANDWri Wd, Ws, #1 implicitly clears the

      // upper 32 bits.  Emit a SUBREG_TO_REG to extend from Wd to Xd.

      Register Reg64 = MRI.createVirtualRegister(&AArch64::GPR64RegClass);

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

              TII.get(AArch64::SUBREG_TO_REG), Reg64)

          .addImm(0)

          .addReg(ResultReg)

          .addImm(AArch64::sub_32);

      ResultReg = Reg64;

    }

    return ResultReg;

  } else {

    if (DestVT == MVT::i64) {

      // FIXME: We're SExt i1 to i64.

      return 0;

    }

    return fastEmitInst_rii(AArch64::SBFMWri, &AArch64::GPR32RegClass, SrcReg,

                            0, 0);

  }

}


unsigned AArch64FastISel::emitMul_rr(MVT RetVT, unsigned Op0, unsigned Op1) {

  unsigned Opc, ZReg;

  switch (RetVT.SimpleTy) {

  default: return 0;

  case MVT::i8:

  case MVT::i16:

  case MVT::i32:

    RetVT = MVT::i32;

    Opc = AArch64::MADDWrrr; ZReg = AArch64::WZR; break;

  case MVT::i64:

    Opc = AArch64::MADDXrrr; ZReg = AArch64::XZR; break;

  }


  const TargetRegisterClass *RC =

      (RetVT == MVT::i64) ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  return fastEmitInst_rrr(Opc, RC, Op0, Op1, ZReg);

}


unsigned AArch64FastISel::emitSMULL_rr(MVT RetVT, unsigned Op0, unsigned Op1) {

  if (RetVT != MVT::i64)

    return 0;


  return fastEmitInst_rrr(AArch64::SMADDLrrr, &AArch64::GPR64RegClass,

                          Op0, Op1, AArch64::XZR);

}


unsigned AArch64FastISel::emitUMULL_rr(MVT RetVT, unsigned Op0, unsigned Op1) {

  if (RetVT != MVT::i64)

    return 0;


  return fastEmitInst_rrr(AArch64::UMADDLrrr, &AArch64::GPR64RegClass,

                          Op0, Op1, AArch64::XZR);

}


unsigned AArch64FastISel::emitLSL_rr(MVT RetVT, unsigned Op0Reg,

                                     unsigned Op1Reg) {

  unsigned Opc = 0;

  bool NeedTrunc = false;

  uint64_t Mask = 0;

  switch (RetVT.SimpleTy) {

  default: return 0;

  case MVT::i8:  Opc = AArch64::LSLVWr; NeedTrunc = true; Mask = 0xff;   break;

  case MVT::i16: Opc = AArch64::LSLVWr; NeedTrunc = true; Mask = 0xffff; break;

  case MVT::i32: Opc = AArch64::LSLVWr;                                  break;

  case MVT::i64: Opc = AArch64::LSLVXr;                                  break;

  }


  const TargetRegisterClass *RC =

      (RetVT == MVT::i64) ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  if (NeedTrunc)

    Op1Reg = emitAnd_ri(MVT::i32, Op1Reg, Mask);


  Register ResultReg = fastEmitInst_rr(Opc, RC, Op0Reg, Op1Reg);

  if (NeedTrunc)

    ResultReg = emitAnd_ri(MVT::i32, ResultReg, Mask);

  return ResultReg;

}


unsigned AArch64FastISel::emitLSL_ri(MVT RetVT, MVT SrcVT, unsigned Op0,

                                     uint64_t Shift, bool IsZExt) {

  assert(RetVT.SimpleTy >= SrcVT.SimpleTy &&

         "Unexpected source/return type pair.");

  assert((SrcVT == MVT::i1 || SrcVT == MVT::i8 || SrcVT == MVT::i16 ||

          SrcVT == MVT::i32 || SrcVT == MVT::i64) &&

         "Unexpected source value type.");

  assert((RetVT == MVT::i8 || RetVT == MVT::i16 || RetVT == MVT::i32 ||

          RetVT == MVT::i64) && "Unexpected return value type.");


  bool Is64Bit = (RetVT == MVT::i64);

  unsigned RegSize = Is64Bit ? 64 : 32;

  unsigned DstBits = RetVT.getSizeInBits();

  unsigned SrcBits = SrcVT.getSizeInBits();

  const TargetRegisterClass *RC =

      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;


  // Just emit a copy for "zero" shifts.

  if (Shift == 0) {

    if (RetVT == SrcVT) {

      Register ResultReg = createResultReg(RC);

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

              TII.get(TargetOpcode::COPY), ResultReg)

          .addReg(Op0);

      return ResultReg;

    } else

      return emitIntExt(SrcVT, Op0, RetVT, IsZExt);

  }


  // Don't deal with undefined shifts.

  if (Shift >= DstBits)

    return 0;


  // For immediate shifts we can fold the zero-/sign-extension into the shift.

  // {S|U}BFM Wd, Wn, #r, #s

  // Wd<32+s-r,32-r> = Wn<s:0> when r > s


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = shl i16 %1, 4

  // Wd<32+7-28,32-28> = Wn<7:0> <- clamp s to 7

  // 0b1111_1111_1111_1111__1111_1010_1010_0000 sext

  // 0b0000_0000_0000_0000__0000_0101_0101_0000 sext | zext

  // 0b0000_0000_0000_0000__0000_1010_1010_0000 zext


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = shl i16 %1, 8

  // Wd<32+7-24,32-24> = Wn<7:0>

  // 0b1111_1111_1111_1111__1010_1010_0000_0000 sext

  // 0b0000_0000_0000_0000__0101_0101_0000_0000 sext | zext

  // 0b0000_0000_0000_0000__1010_1010_0000_0000 zext


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = shl i16 %1, 12

  // Wd<32+3-20,32-20> = Wn<3:0>

  // 0b1111_1111_1111_1111__1010_0000_0000_0000 sext

  // 0b0000_0000_0000_0000__0101_0000_0000_0000 sext | zext

  // 0b0000_0000_0000_0000__1010_0000_0000_0000 zext


  unsigned ImmR = RegSize - Shift;

  // Limit the width to the length of the source type.

  unsigned ImmS = std::min<unsigned>(SrcBits - 1, DstBits - 1 - Shift);

  static const unsigned OpcTable[2][2] = {

    {AArch64::SBFMWri, AArch64::SBFMXri},

    {AArch64::UBFMWri, AArch64::UBFMXri}

  };

  unsigned Opc = OpcTable[IsZExt][Is64Bit];

  if (SrcVT.SimpleTy <= MVT::i32 && RetVT == MVT::i64) {

    Register TmpReg = MRI.createVirtualRegister(RC);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(AArch64::SUBREG_TO_REG), TmpReg)

        .addImm(0)

        .addReg(Op0)

        .addImm(AArch64::sub_32);

    Op0 = TmpReg;

  }

  return fastEmitInst_rii(Opc, RC, Op0, ImmR, ImmS);

}


unsigned AArch64FastISel::emitLSR_rr(MVT RetVT, unsigned Op0Reg,

                                     unsigned Op1Reg) {

  unsigned Opc = 0;

  bool NeedTrunc = false;

  uint64_t Mask = 0;

  switch (RetVT.SimpleTy) {

  default: return 0;

  case MVT::i8:  Opc = AArch64::LSRVWr; NeedTrunc = true; Mask = 0xff;   break;

  case MVT::i16: Opc = AArch64::LSRVWr; NeedTrunc = true; Mask = 0xffff; break;

  case MVT::i32: Opc = AArch64::LSRVWr; break;

  case MVT::i64: Opc = AArch64::LSRVXr; break;

  }


  const TargetRegisterClass *RC =

      (RetVT == MVT::i64) ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  if (NeedTrunc) {

    Op0Reg = emitAnd_ri(MVT::i32, Op0Reg, Mask);

    Op1Reg = emitAnd_ri(MVT::i32, Op1Reg, Mask);

  }

  Register ResultReg = fastEmitInst_rr(Opc, RC, Op0Reg, Op1Reg);

  if (NeedTrunc)

    ResultReg = emitAnd_ri(MVT::i32, ResultReg, Mask);

  return ResultReg;

}


unsigned AArch64FastISel::emitLSR_ri(MVT RetVT, MVT SrcVT, unsigned Op0,

                                     uint64_t Shift, bool IsZExt) {

  assert(RetVT.SimpleTy >= SrcVT.SimpleTy &&

         "Unexpected source/return type pair.");

  assert((SrcVT == MVT::i1 || SrcVT == MVT::i8 || SrcVT == MVT::i16 ||

          SrcVT == MVT::i32 || SrcVT == MVT::i64) &&

         "Unexpected source value type.");

  assert((RetVT == MVT::i8 || RetVT == MVT::i16 || RetVT == MVT::i32 ||

          RetVT == MVT::i64) && "Unexpected return value type.");


  bool Is64Bit = (RetVT == MVT::i64);

  unsigned RegSize = Is64Bit ? 64 : 32;

  unsigned DstBits = RetVT.getSizeInBits();

  unsigned SrcBits = SrcVT.getSizeInBits();

  const TargetRegisterClass *RC =

      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;


  // Just emit a copy for "zero" shifts.

  if (Shift == 0) {

    if (RetVT == SrcVT) {

      Register ResultReg = createResultReg(RC);

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

              TII.get(TargetOpcode::COPY), ResultReg)

      .addReg(Op0);

      return ResultReg;

    } else

      return emitIntExt(SrcVT, Op0, RetVT, IsZExt);

  }


  // Don't deal with undefined shifts.

  if (Shift >= DstBits)

    return 0;


  // For immediate shifts we can fold the zero-/sign-extension into the shift.

  // {S|U}BFM Wd, Wn, #r, #s

  // Wd<s-r:0> = Wn<s:r> when r <= s


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = lshr i16 %1, 4

  // Wd<7-4:0> = Wn<7:4>

  // 0b0000_0000_0000_0000__0000_1111_1111_1010 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0101 sext | zext

  // 0b0000_0000_0000_0000__0000_0000_0000_1010 zext


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = lshr i16 %1, 8

  // Wd<7-7,0> = Wn<7:7>

  // 0b0000_0000_0000_0000__0000_0000_1111_1111 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0000 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0000 zext


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = lshr i16 %1, 12

  // Wd<7-7,0> = Wn<7:7> <- clamp r to 7

  // 0b0000_0000_0000_0000__0000_0000_0000_1111 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0000 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0000 zext


  if (Shift >= SrcBits && IsZExt)

    return materializeInt(ConstantInt::get(*Context, APInt(RegSize, 0)), RetVT);


  // It is not possible to fold a sign-extend into the LShr instruction. In this

  // case emit a sign-extend.

  if (!IsZExt) {

    Op0 = emitIntExt(SrcVT, Op0, RetVT, IsZExt);

    if (!Op0)

      return 0;

    SrcVT = RetVT;

    SrcBits = SrcVT.getSizeInBits();

    IsZExt = true;

  }


  unsigned ImmR = std::min<unsigned>(SrcBits - 1, Shift);

  unsigned ImmS = SrcBits - 1;

  static const unsigned OpcTable[2][2] = {

    {AArch64::SBFMWri, AArch64::SBFMXri},

    {AArch64::UBFMWri, AArch64::UBFMXri}

  };

  unsigned Opc = OpcTable[IsZExt][Is64Bit];

  if (SrcVT.SimpleTy <= MVT::i32 && RetVT == MVT::i64) {

    Register TmpReg = MRI.createVirtualRegister(RC);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(AArch64::SUBREG_TO_REG), TmpReg)

        .addImm(0)

        .addReg(Op0)

        .addImm(AArch64::sub_32);

    Op0 = TmpReg;

  }

  return fastEmitInst_rii(Opc, RC, Op0, ImmR, ImmS);

}


unsigned AArch64FastISel::emitASR_rr(MVT RetVT, unsigned Op0Reg,

                                     unsigned Op1Reg) {

  unsigned Opc = 0;

  bool NeedTrunc = false;

  uint64_t Mask = 0;

  switch (RetVT.SimpleTy) {

  default: return 0;

  case MVT::i8:  Opc = AArch64::ASRVWr; NeedTrunc = true; Mask = 0xff;   break;

  case MVT::i16: Opc = AArch64::ASRVWr; NeedTrunc = true; Mask = 0xffff; break;

  case MVT::i32: Opc = AArch64::ASRVWr;                                  break;

  case MVT::i64: Opc = AArch64::ASRVXr;                                  break;

  }


  const TargetRegisterClass *RC =

      (RetVT == MVT::i64) ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  if (NeedTrunc) {

    Op0Reg = emitIntExt(RetVT, Op0Reg, MVT::i32, /*isZExt=*/false);

    Op1Reg = emitAnd_ri(MVT::i32, Op1Reg, Mask);

  }

  Register ResultReg = fastEmitInst_rr(Opc, RC, Op0Reg, Op1Reg);

  if (NeedTrunc)

    ResultReg = emitAnd_ri(MVT::i32, ResultReg, Mask);

  return ResultReg;

}


unsigned AArch64FastISel::emitASR_ri(MVT RetVT, MVT SrcVT, unsigned Op0,

                                     uint64_t Shift, bool IsZExt) {

  assert(RetVT.SimpleTy >= SrcVT.SimpleTy &&

         "Unexpected source/return type pair.");

  assert((SrcVT == MVT::i1 || SrcVT == MVT::i8 || SrcVT == MVT::i16 ||

          SrcVT == MVT::i32 || SrcVT == MVT::i64) &&

         "Unexpected source value type.");

  assert((RetVT == MVT::i8 || RetVT == MVT::i16 || RetVT == MVT::i32 ||

          RetVT == MVT::i64) && "Unexpected return value type.");


  bool Is64Bit = (RetVT == MVT::i64);

  unsigned RegSize = Is64Bit ? 64 : 32;

  unsigned DstBits = RetVT.getSizeInBits();

  unsigned SrcBits = SrcVT.getSizeInBits();

  const TargetRegisterClass *RC =

      Is64Bit ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;


  // Just emit a copy for "zero" shifts.

  if (Shift == 0) {

    if (RetVT == SrcVT) {

      Register ResultReg = createResultReg(RC);

      BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

              TII.get(TargetOpcode::COPY), ResultReg)

      .addReg(Op0);

      return ResultReg;

    } else

      return emitIntExt(SrcVT, Op0, RetVT, IsZExt);

  }


  // Don't deal with undefined shifts.

  if (Shift >= DstBits)

    return 0;


  // For immediate shifts we can fold the zero-/sign-extension into the shift.

  // {S|U}BFM Wd, Wn, #r, #s

  // Wd<s-r:0> = Wn<s:r> when r <= s


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = ashr i16 %1, 4

  // Wd<7-4:0> = Wn<7:4>

  // 0b1111_1111_1111_1111__1111_1111_1111_1010 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0101 sext | zext

  // 0b0000_0000_0000_0000__0000_0000_0000_1010 zext


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = ashr i16 %1, 8

  // Wd<7-7,0> = Wn<7:7>

  // 0b1111_1111_1111_1111__1111_1111_1111_1111 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0000 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0000 zext


  // %1 = {s|z}ext i8 {0b1010_1010|0b0101_0101} to i16

  // %2 = ashr i16 %1, 12

  // Wd<7-7,0> = Wn<7:7> <- clamp r to 7

  // 0b1111_1111_1111_1111__1111_1111_1111_1111 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0000 sext

  // 0b0000_0000_0000_0000__0000_0000_0000_0000 zext


  if (Shift >= SrcBits && IsZExt)

    return materializeInt(ConstantInt::get(*Context, APInt(RegSize, 0)), RetVT);


  unsigned ImmR = std::min<unsigned>(SrcBits - 1, Shift);

  unsigned ImmS = SrcBits - 1;

  static const unsigned OpcTable[2][2] = {

    {AArch64::SBFMWri, AArch64::SBFMXri},

    {AArch64::UBFMWri, AArch64::UBFMXri}

  };

  unsigned Opc = OpcTable[IsZExt][Is64Bit];

  if (SrcVT.SimpleTy <= MVT::i32 && RetVT == MVT::i64) {

    Register TmpReg = MRI.createVirtualRegister(RC);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(AArch64::SUBREG_TO_REG), TmpReg)

        .addImm(0)

        .addReg(Op0)

        .addImm(AArch64::sub_32);

    Op0 = TmpReg;

  }

  return fastEmitInst_rii(Opc, RC, Op0, ImmR, ImmS);

}


unsigned AArch64FastISel::emitIntExt(MVT SrcVT, unsigned SrcReg, MVT DestVT,

                                     bool IsZExt) {

  assert(DestVT != MVT::i1 && "ZeroExt/SignExt an i1?");


  // FastISel does not have plumbing to deal with extensions where the SrcVT or

  // DestVT are odd things, so test to make sure that they are both types we can

  // handle (i1/i8/i16/i32 for SrcVT and i8/i16/i32/i64 for DestVT), otherwise

  // bail out to SelectionDAG.

  if (((DestVT != MVT::i8) && (DestVT != MVT::i16) &&

       (DestVT != MVT::i32) && (DestVT != MVT::i64)) ||

      ((SrcVT !=  MVT::i1) && (SrcVT !=  MVT::i8) &&

       (SrcVT !=  MVT::i16) && (SrcVT !=  MVT::i32)))

    return 0;


  unsigned Opc;

  unsigned Imm = 0;


  switch (SrcVT.SimpleTy) {

  default:

    return 0;

  case MVT::i1:

    return emiti1Ext(SrcReg, DestVT, IsZExt);

  case MVT::i8:

    if (DestVT == MVT::i64)

      Opc = IsZExt ? AArch64::UBFMXri : AArch64::SBFMXri;

    else

      Opc = IsZExt ? AArch64::UBFMWri : AArch64::SBFMWri;

    Imm = 7;

    break;

  case MVT::i16:

    if (DestVT == MVT::i64)

      Opc = IsZExt ? AArch64::UBFMXri : AArch64::SBFMXri;

    else

      Opc = IsZExt ? AArch64::UBFMWri : AArch64::SBFMWri;

    Imm = 15;

    break;

  case MVT::i32:

    assert(DestVT == MVT::i64 && "IntExt i32 to i32?!?");

    Opc = IsZExt ? AArch64::UBFMXri : AArch64::SBFMXri;

    Imm = 31;

    break;

  }


  // Handle i8 and i16 as i32.

  if (DestVT == MVT::i8 || DestVT == MVT::i16)

    DestVT = MVT::i32;

  else if (DestVT == MVT::i64) {

    Register Src64 = MRI.createVirtualRegister(&AArch64::GPR64RegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(AArch64::SUBREG_TO_REG), Src64)

        .addImm(0)

        .addReg(SrcReg)

        .addImm(AArch64::sub_32);

    SrcReg = Src64;

  }


  const TargetRegisterClass *RC =

      (DestVT == MVT::i64) ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  return fastEmitInst_rii(Opc, RC, SrcReg, 0, Imm);

}


static bool isZExtLoad(const MachineInstr *LI) {

  switch (LI->getOpcode()) {

  default:

    return false;

  case AArch64::LDURBBi:

  case AArch64::LDURHHi:

  case AArch64::LDURWi:

  case AArch64::LDRBBui:

  case AArch64::LDRHHui:

  case AArch64::LDRWui:

  case AArch64::LDRBBroX:

  case AArch64::LDRHHroX:

  case AArch64::LDRWroX:

  case AArch64::LDRBBroW:

  case AArch64::LDRHHroW:

  case AArch64::LDRWroW:

    return true;

  }

}


static bool isSExtLoad(const MachineInstr *LI) {

  switch (LI->getOpcode()) {

  default:

    return false;

  case AArch64::LDURSBWi:

  case AArch64::LDURSHWi:

  case AArch64::LDURSBXi:

  case AArch64::LDURSHXi:

  case AArch64::LDURSWi:

  case AArch64::LDRSBWui:

  case AArch64::LDRSHWui:

  case AArch64::LDRSBXui:

  case AArch64::LDRSHXui:

  case AArch64::LDRSWui:

  case AArch64::LDRSBWroX:

  case AArch64::LDRSHWroX:

  case AArch64::LDRSBXroX:

  case AArch64::LDRSHXroX:

  case AArch64::LDRSWroX:

  case AArch64::LDRSBWroW:

  case AArch64::LDRSHWroW:

  case AArch64::LDRSBXroW:

  case AArch64::LDRSHXroW:

  case AArch64::LDRSWroW:

    return true;

  }

}


bool AArch64FastISel::optimizeIntExtLoad(const Instruction *I, MVT RetVT,

                                         MVT SrcVT) {

  const auto *LI = dyn_cast<LoadInst>(I->getOperand(0));

  if (!LI || !LI->hasOneUse())

    return false;


  // Check if the load instruction has already been selected.

  Register Reg = lookUpRegForValue(LI);

  if (!Reg)

    return false;


  MachineInstr *MI = MRI.getUniqueVRegDef(Reg);

  if (!MI)

    return false;


  // Check if the correct load instruction has been emitted - SelectionDAG might

  // have emitted a zero-extending load, but we need a sign-extending load.

  bool IsZExt = isa<ZExtInst>(I);

  const auto *LoadMI = MI;

  if (LoadMI->getOpcode() == TargetOpcode::COPY &&

      LoadMI->getOperand(1).getSubReg() == AArch64::sub_32) {

    Register LoadReg = MI->getOperand(1).getReg();

    LoadMI = MRI.getUniqueVRegDef(LoadReg);

    assert(LoadMI && "Expected valid instruction");

  }

  if (!(IsZExt && isZExtLoad(LoadMI)) && !(!IsZExt && isSExtLoad(LoadMI)))

    return false;


  // Nothing to be done.

  if (RetVT != MVT::i64 || SrcVT > MVT::i32) {

    updateValueMap(I, Reg);

    return true;

  }


  if (IsZExt) {

    Register Reg64 = createResultReg(&AArch64::GPR64RegClass);

    BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

            TII.get(AArch64::SUBREG_TO_REG), Reg64)

        .addImm(0)

        .addReg(Reg, getKillRegState(true))

        .addImm(AArch64::sub_32);

    Reg = Reg64;

  } else {

    assert((MI->getOpcode() == TargetOpcode::COPY &&

            MI->getOperand(1).getSubReg() == AArch64::sub_32) &&

           "Expected copy instruction");

    Reg = MI->getOperand(1).getReg();

    MachineBasicBlock::iterator I(MI);

    removeDeadCode(I, std::next(I));

  }

  updateValueMap(I, Reg);

  return true;

}


bool AArch64FastISel::selectIntExt(const Instruction *I) {

  assert((isa<ZExtInst>(I) || isa<SExtInst>(I)) &&

         "Unexpected integer extend instruction.");

  MVT RetVT;

  MVT SrcVT;

  if (!isTypeSupported(I->getType(), RetVT))

    return false;


  if (!isTypeSupported(I->getOperand(0)->getType(), SrcVT))

    return false;


  // Try to optimize already sign-/zero-extended values from load instructions.

  if (optimizeIntExtLoad(I, RetVT, SrcVT))

    return true;


  Register SrcReg = getRegForValue(I->getOperand(0));

  if (!SrcReg)

    return false;


  // Try to optimize already sign-/zero-extended values from function arguments.

  bool IsZExt = isa<ZExtInst>(I);

  if (const auto *Arg = dyn_cast<Argument>(I->getOperand(0))) {

    if ((IsZExt && Arg->hasZExtAttr()) || (!IsZExt && Arg->hasSExtAttr())) {

      if (RetVT == MVT::i64 && SrcVT != MVT::i64) {

        Register ResultReg = createResultReg(&AArch64::GPR64RegClass);

        BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD,

                TII.get(AArch64::SUBREG_TO_REG), ResultReg)

            .addImm(0)

            .addReg(SrcReg)

            .addImm(AArch64::sub_32);

        SrcReg = ResultReg;

      }


      updateValueMap(I, SrcReg);

      return true;

    }

  }


  unsigned ResultReg = emitIntExt(SrcVT, SrcReg, RetVT, IsZExt);

  if (!ResultReg)

    return false;


  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectRem(const Instruction *I, unsigned ISDOpcode) {

  EVT DestEVT = TLI.getValueType(DL, I->getType(), true);

  if (!DestEVT.isSimple())

    return false;


  MVT DestVT = DestEVT.getSimpleVT();

  if (DestVT != MVT::i64 && DestVT != MVT::i32)

    return false;


  unsigned DivOpc;

  bool Is64bit = (DestVT == MVT::i64);

  switch (ISDOpcode) {

  default:

    return false;

  case ISD::SREM:

    DivOpc = Is64bit ? AArch64::SDIVXr : AArch64::SDIVWr;

    break;

  case ISD::UREM:

    DivOpc = Is64bit ? AArch64::UDIVXr : AArch64::UDIVWr;

    break;

  }

  unsigned MSubOpc = Is64bit ? AArch64::MSUBXrrr : AArch64::MSUBWrrr;

  Register Src0Reg = getRegForValue(I->getOperand(0));

  if (!Src0Reg)

    return false;


  Register Src1Reg = getRegForValue(I->getOperand(1));

  if (!Src1Reg)

    return false;


  const TargetRegisterClass *RC =

      (DestVT == MVT::i64) ? &AArch64::GPR64RegClass : &AArch64::GPR32RegClass;

  Register QuotReg = fastEmitInst_rr(DivOpc, RC, Src0Reg, Src1Reg);

  assert(QuotReg && "Unexpected DIV instruction emission failure.");

  // The remainder is computed as numerator - (quotient * denominator) using the

  // MSUB instruction.

  Register ResultReg = fastEmitInst_rrr(MSubOpc, RC, QuotReg, Src1Reg, Src0Reg);

  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectMul(const Instruction *I) {

  MVT VT;

  if (!isTypeSupported(I->getType(), VT, /*IsVectorAllowed=*/true))

    return false;


  if (VT.isVector())

    return selectBinaryOp(I, ISD::MUL);


  const Value *Src0 = I->getOperand(0);

  const Value *Src1 = I->getOperand(1);

  if (const auto *C = dyn_cast<ConstantInt>(Src0))

    if (C->getValue().isPowerOf2())

      std::swap(Src0, Src1);


  // Try to simplify to a shift instruction.

  if (const auto *C = dyn_cast<ConstantInt>(Src1))

    if (C->getValue().isPowerOf2()) {

      uint64_t ShiftVal = C->getValue().logBase2();

      MVT SrcVT = VT;

      bool IsZExt = true;

      if (const auto *ZExt = dyn_cast<ZExtInst>(Src0)) {

        if (!isIntExtFree(ZExt)) {

          MVT VT;

          if (isValueAvailable(ZExt) && isTypeSupported(ZExt->getSrcTy(), VT)) {

            SrcVT = VT;

            IsZExt = true;

            Src0 = ZExt->getOperand(0);

          }

        }

      } else if (const auto *SExt = dyn_cast<SExtInst>(Src0)) {

        if (!isIntExtFree(SExt)) {

          MVT VT;

          if (isValueAvailable(SExt) && isTypeSupported(SExt->getSrcTy(), VT)) {

            SrcVT = VT;

            IsZExt = false;

            Src0 = SExt->getOperand(0);

          }

        }

      }


      Register Src0Reg = getRegForValue(Src0);

      if (!Src0Reg)

        return false;


      unsigned ResultReg =

          emitLSL_ri(VT, SrcVT, Src0Reg, ShiftVal, IsZExt);


      if (ResultReg) {

        updateValueMap(I, ResultReg);

        return true;

      }

    }


  Register Src0Reg = getRegForValue(I->getOperand(0));

  if (!Src0Reg)

    return false;


  Register Src1Reg = getRegForValue(I->getOperand(1));

  if (!Src1Reg)

    return false;


  unsigned ResultReg = emitMul_rr(VT, Src0Reg, Src1Reg);


  if (!ResultReg)

    return false;


  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectShift(const Instruction *I) {

  MVT RetVT;

  if (!isTypeSupported(I->getType(), RetVT, /*IsVectorAllowed=*/true))

    return false;


  if (RetVT.isVector())

    return selectOperator(I, I->getOpcode());


  if (const auto *C = dyn_cast<ConstantInt>(I->getOperand(1))) {

    unsigned ResultReg = 0;

    uint64_t ShiftVal = C->getZExtValue();

    MVT SrcVT = RetVT;

    bool IsZExt = I->getOpcode() != Instruction::AShr;

    const Value *Op0 = I->getOperand(0);

    if (const auto *ZExt = dyn_cast<ZExtInst>(Op0)) {

      if (!isIntExtFree(ZExt)) {

        MVT TmpVT;

        if (isValueAvailable(ZExt) && isTypeSupported(ZExt->getSrcTy(), TmpVT)) {

          SrcVT = TmpVT;

          IsZExt = true;

          Op0 = ZExt->getOperand(0);

        }

      }

    } else if (const auto *SExt = dyn_cast<SExtInst>(Op0)) {

      if (!isIntExtFree(SExt)) {

        MVT TmpVT;

        if (isValueAvailable(SExt) && isTypeSupported(SExt->getSrcTy(), TmpVT)) {

          SrcVT = TmpVT;

          IsZExt = false;

          Op0 = SExt->getOperand(0);

        }

      }

    }


    Register Op0Reg = getRegForValue(Op0);

    if (!Op0Reg)

      return false;


    switch (I->getOpcode()) {

    default: llvm_unreachable("Unexpected instruction.");

    case Instruction::Shl:

      ResultReg = emitLSL_ri(RetVT, SrcVT, Op0Reg, ShiftVal, IsZExt);

      break;

    case Instruction::AShr:

      ResultReg = emitASR_ri(RetVT, SrcVT, Op0Reg, ShiftVal, IsZExt);

      break;

    case Instruction::LShr:

      ResultReg = emitLSR_ri(RetVT, SrcVT, Op0Reg, ShiftVal, IsZExt);

      break;

    }

    if (!ResultReg)

      return false;


    updateValueMap(I, ResultReg);

    return true;

  }


  Register Op0Reg = getRegForValue(I->getOperand(0));

  if (!Op0Reg)

    return false;


  Register Op1Reg = getRegForValue(I->getOperand(1));

  if (!Op1Reg)

    return false;


  unsigned ResultReg = 0;

  switch (I->getOpcode()) {

  default: llvm_unreachable("Unexpected instruction.");

  case Instruction::Shl:

    ResultReg = emitLSL_rr(RetVT, Op0Reg, Op1Reg);

    break;

  case Instruction::AShr:

    ResultReg = emitASR_rr(RetVT, Op0Reg, Op1Reg);

    break;

  case Instruction::LShr:

    ResultReg = emitLSR_rr(RetVT, Op0Reg, Op1Reg);

    break;

  }


  if (!ResultReg)

    return false;


  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectBitCast(const Instruction *I) {

  MVT RetVT, SrcVT;


  if (!isTypeLegal(I->getOperand(0)->getType(), SrcVT))

    return false;

  if (!isTypeLegal(I->getType(), RetVT))

    return false;


  unsigned Opc;

  if (RetVT == MVT::f32 && SrcVT == MVT::i32)

    Opc = AArch64::FMOVWSr;

  else if (RetVT == MVT::f64 && SrcVT == MVT::i64)

    Opc = AArch64::FMOVXDr;

  else if (RetVT == MVT::i32 && SrcVT == MVT::f32)

    Opc = AArch64::FMOVSWr;

  else if (RetVT == MVT::i64 && SrcVT == MVT::f64)

    Opc = AArch64::FMOVDXr;

  else

    return false;


  const TargetRegisterClass *RC = nullptr;

  switch (RetVT.SimpleTy) {

  default: llvm_unreachable("Unexpected value type.");

  case MVT::i32: RC = &AArch64::GPR32RegClass; break;

  case MVT::i64: RC = &AArch64::GPR64RegClass; break;

  case MVT::f32: RC = &AArch64::FPR32RegClass; break;

  case MVT::f64: RC = &AArch64::FPR64RegClass; break;

  }

  Register Op0Reg = getRegForValue(I->getOperand(0));

  if (!Op0Reg)

    return false;


  Register ResultReg = fastEmitInst_r(Opc, RC, Op0Reg);

  if (!ResultReg)

    return false;


  updateValueMap(I, ResultReg);

  return true;

}


bool AArch64FastISel::selectFRem(const Instruction *I) {

  MVT RetVT;

  if (!isTypeLegal(I->getType(), RetVT))

    return false;


  RTLIB::Libcall LC;

  switch (RetVT.SimpleTy) {

  default:

    return false;

  case MVT::f32:

    LC = RTLIB::REM_F32;

    break;

  case MVT::f64:

    LC = RTLIB::REM_F64;

    break;

  }


  ArgListTy Args;

  Args.reserve(I->getNumOperands());


  // Populate the argument list.

  for (auto &Arg : I->operands()) {

    ArgListEntry Entry;

    Entry.Val = Arg;

    Entry.Ty = Arg->getType();

    Args.push_back(Entry);

  }


  CallLoweringInfo CLI;

  MCContext &Ctx = MF->getContext();

  CLI.setCallee(DL, Ctx, TLI.getLibcallCallingConv(LC), I->getType(),

                TLI.getLibcallName(LC), std::move(Args));

  if (!lowerCallTo(CLI))

    return false;

  updateValueMap(I, CLI.ResultReg);

  return true;

}


bool AArch64FastISel::selectSDiv(const Instruction *I) {

  MVT VT;

  if (!isTypeLegal(I->getType(), VT))

    return false;


  if (!isa<ConstantInt>(I->getOperand(1)))

    return selectBinaryOp(I, ISD::SDIV);


  const APInt &C = cast<ConstantInt>(I->getOperand(1))->getValue();

  if ((VT != MVT::i32 && VT != MVT::i64) || !C ||

      !(C.isPowerOf2() || C.isNegatedPowerOf2()))

    return selectBinaryOp(I, ISD::SDIV);


  unsigned Lg2 = C.countr_zero();

  Register Src0Reg = getRegForValue(I->getOperand(0));

  if (!Src0Reg)

    return false;


  if (cast<BinaryOperator>(I)->isExact()) {

    unsigned ResultReg = emitASR_ri(VT, VT, Src0Reg, Lg2);

    if (!ResultReg)

      return false;

    updateValueMap(I, ResultReg);

    return true;

  }


  int64_t Pow2MinusOne = (1ULL << Lg2) - 1;

  unsigned AddReg = emitAdd_ri_(VT, Src0Reg, Pow2MinusOne);

  if (!AddReg)

    return false;


  // (Src0 < 0) ? Pow2 - 1 : 0;

  if (!emitICmp_ri(VT, Src0Reg, 0))

    return false;


  unsigned SelectOpc;

  const TargetRegisterClass *RC;

  if (VT == MVT::i64) {

    SelectOpc = AArch64::CSELXr;

    RC = &AArch64::GPR64RegClass;

  } else {

    SelectOpc = AArch64::CSELWr;

    RC = &AArch64::GPR32RegClass;

  }

  Register SelectReg = fastEmitInst_rri(SelectOpc, RC, AddReg, Src0Reg,

                                        AArch64CC::LT);

  if (!SelectReg)

    return false;


  // Divide by Pow2 --> ashr. If we're dividing by a negative value we must also

  // negate the result.

  unsigned ZeroReg = (VT == MVT::i64) ? AArch64::XZR : AArch64::WZR;

  unsigned ResultReg;

  if (C.isNegative())

    ResultReg = emitAddSub_rs(/*UseAdd=*/false, VT, ZeroReg, SelectReg,

                              AArch64_AM::ASR, Lg2);

  else

    ResultReg = emitASR_ri(VT, VT, SelectReg, Lg2);


  if (!ResultReg)

    return false;


  updateValueMap(I, ResultReg);

  return true;

}


/// This is mostly a copy of the existing FastISel getRegForGEPIndex code. We

/// have to duplicate it for AArch64, because otherwise we would fail during the

/// sign-extend emission.

unsigned AArch64FastISel::getRegForGEPIndex(const Value *Idx) {

  Register IdxN = getRegForValue(Idx);

  if (IdxN == 0)

    // Unhandled operand. Halt "fast" selection and bail.

    return 0;


  // If the index is smaller or larger than intptr_t, truncate or extend it.

  MVT PtrVT = TLI.getPointerTy(DL);

  EVT IdxVT = EVT::getEVT(Idx->getType(), /*HandleUnknown=*/false);

  if (IdxVT.bitsLT(PtrVT)) {

    IdxN = emitIntExt(IdxVT.getSimpleVT(), IdxN, PtrVT, /*isZExt=*/false);

  } else if (IdxVT.bitsGT(PtrVT))

    llvm_unreachable("AArch64 FastISel doesn't support types larger than i64");

  return IdxN;

}


/// This is mostly a copy of the existing FastISel GEP code, but we have to

/// duplicate it for AArch64, because otherwise we would bail out even for

/// simple cases. This is because the standard fastEmit functions don't cover

/// MUL at all and ADD is lowered very inefficientily.

bool AArch64FastISel::selectGetElementPtr(const Instruction *I) {

  if (Subtarget->isTargetILP32())

    return false;


  Register N = getRegForValue(I->getOperand(0));

  if (!N)

    return false;


  // Keep a running tab of the total offset to coalesce multiple N = N + Offset

  // into a single N = N + TotalOffset.

  uint64_t TotalOffs = 0;

  MVT VT = TLI.getPointerTy(DL);

  for (gep_type_iterator GTI = gep_type_begin(I), E = gep_type_end(I);

       GTI != E; ++GTI) {

    const Value *Idx = GTI.getOperand();

    if (auto *StTy = GTI.getStructTypeOrNull()) {

      unsigned Field = cast<ConstantInt>(Idx)->getZExtValue();

      // N = N + Offset

      if (Field)

        TotalOffs += DL.getStructLayout(StTy)->getElementOffset(Field);

    } else {

      // If this is a constant subscript, handle it quickly.

      if (const auto *CI = dyn_cast<ConstantInt>(Idx)) {

        if (CI->isZero())

          continue;

        // N = N + Offset

        TotalOffs += GTI.getSequentialElementStride(DL) *

                     cast<ConstantInt>(CI)->getSExtValue();

        continue;

      }

      if (TotalOffs) {

        N = emitAdd_ri_(VT, N, TotalOffs);

        if (!N)

          return false;

        TotalOffs = 0;

      }


      // N = N + Idx * ElementSize;

      uint64_t ElementSize = GTI.getSequentialElementStride(DL);

      unsigned IdxN = getRegForGEPIndex(Idx);

      if (!IdxN)

        return false;


      if (ElementSize != 1) {

        unsigned C = fastEmit_i(VT, VT, ISD::Constant, ElementSize);

        if (!C)

          return false;

        IdxN = emitMul_rr(VT, IdxN, C);

        if (!IdxN)

          return false;

      }

      N = fastEmit_rr(VT, VT, ISD::ADD, N, IdxN);

      if (!N)

        return false;

    }

  }

  if (TotalOffs) {

    N = emitAdd_ri_(VT, N, TotalOffs);

    if (!N)

      return false;

  }

  updateValueMap(I, N);

  return true;

}


bool AArch64FastISel::selectAtomicCmpXchg(const AtomicCmpXchgInst *I) {

  assert(TM.getOptLevel() == CodeGenOptLevel::None &&

         "cmpxchg survived AtomicExpand at optlevel > -O0");


  auto *RetPairTy = cast<StructType>(I->getType());

  Type *RetTy = RetPairTy->getTypeAtIndex(0U);

  assert(RetPairTy->getTypeAtIndex(1U)->isIntegerTy(1) &&

         "cmpxchg has a non-i1 status result");


  MVT VT;

  if (!isTypeLegal(RetTy, VT))

    return false;


  const TargetRegisterClass *ResRC;

  unsigned Opc, CmpOpc;

  // This only supports i32/i64, because i8/i16 aren't legal, and the generic

  // extractvalue selection doesn't support that.

  if (VT == MVT::i32) {

    Opc = AArch64::CMP_SWAP_32;

    CmpOpc = AArch64::SUBSWrs;

    ResRC = &AArch64::GPR32RegClass;

  } else if (VT == MVT::i64) {

    Opc = AArch64::CMP_SWAP_64;

    CmpOpc = AArch64::SUBSXrs;

    ResRC = &AArch64::GPR64RegClass;

  } else {

    return false;

  }


  const MCInstrDesc &II = TII.get(Opc);


  const Register AddrReg = constrainOperandRegClass(

      II, getRegForValue(I->getPointerOperand()), II.getNumDefs());

  const Register DesiredReg = constrainOperandRegClass(

      II, getRegForValue(I->getCompareOperand()), II.getNumDefs() + 1);

  const Register NewReg = constrainOperandRegClass(

      II, getRegForValue(I->getNewValOperand()), II.getNumDefs() + 2);


  const Register ResultReg1 = createResultReg(ResRC);

  const Register ResultReg2 = createResultReg(&AArch64::GPR32RegClass);

  const Register ScratchReg = createResultReg(&AArch64::GPR32RegClass);


  // FIXME: MachineMemOperand doesn't support cmpxchg yet.

  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, II)

      .addDef(ResultReg1)

      .addDef(ScratchReg)

      .addUse(AddrReg)

      .addUse(DesiredReg)

      .addUse(NewReg);


  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(CmpOpc))

      .addDef(VT == MVT::i32 ? AArch64::WZR : AArch64::XZR)

      .addUse(ResultReg1)

      .addUse(DesiredReg)

      .addImm(0);


  BuildMI(*FuncInfo.MBB, FuncInfo.InsertPt, MIMD, TII.get(AArch64::CSINCWr))

      .addDef(ResultReg2)

      .addUse(AArch64::WZR)

      .addUse(AArch64::WZR)

      .addImm(AArch64CC::NE);


  assert((ResultReg1 + 1) == ResultReg2 && "Nonconsecutive result registers.");

  updateValueMap(I, ResultReg1, 2);

  return true;

}


bool AArch64FastISel::fastSelectInstruction(const Instruction *I) {

  if (TLI.fallBackToDAGISel(*I))

    return false;

  switch (I->getOpcode()) {

  default:

    break;

  case Instruction::Add:

  case Instruction::Sub:

    return selectAddSub(I);

  case Instruction::Mul:

    return selectMul(I);

  case Instruction::SDiv:

    return selectSDiv(I);

  case Instruction::SRem:

    if (!selectBinaryOp(I, ISD::SREM))

      return selectRem(I, ISD::SREM);

    return true;

  case Instruction::URem:

    if (!selectBinaryOp(I, ISD::UREM))

      return selectRem(I, ISD::UREM);

    return true;

  case Instruction::Shl:

  case Instruction::LShr:

  case Instruction::AShr:

    return selectShift(I);

  case Instruction::And:

  case Instruction::Or:

  case Instruction::Xor:

    return selectLogicalOp(I);

  case Instruction::Br:

    return selectBranch(I);

  case Instruction::IndirectBr:

    return selectIndirectBr(I);

  case Instruction::BitCast:

    if (!FastISel::selectBitCast(I))

      return selectBitCast(I);

    return true;

  case Instruction::FPToSI:

    if (!selectCast(I, ISD::FP_TO_SINT))

      return selectFPToInt(I, /*Signed=*/true);

    return true;

  case Instruction::FPToUI:

    return selectFPToInt(I, /*Signed=*/false);

  case Instruction::ZExt:

  case Instruction::SExt:

    return selectIntExt(I);

  case Instruction::Trunc:

    if (!selectCast(I, ISD::TRUNCATE))

      return selectTrunc(I);

    return true;

  case Instruction::FPExt:

    return selectFPExt(I);

  case Instruction::FPTrunc:

    return selectFPTrunc(I);

  case Instruction::SIToFP:

    if (!selectCast(I, ISD::SINT_TO_FP))

      return selectIntToFP(I, /*Signed=*/true);

    return true;

  case Instruction::UIToFP:

    return selectIntToFP(I, /*Signed=*/false);

  case Instruction::Load:

    return selectLoad(I);

  case Instruction::Store:

    return selectStore(I);

  case Instruction::FCmp:

  case Instruction::ICmp:

    return selectCmp(I);

  case Instruction::Select:

    return selectSelect(I);

  case Instruction::Ret:

    return selectRet(I);

  case Instruction::FRem:

    return selectFRem(I);

  case Instruction::GetElementPtr:

    return selectGetElementPtr(I);

  case Instruction::AtomicCmpXchg:

    return selectAtomicCmpXchg(cast<AtomicCmpXchgInst>(I));

  }


  // fall-back to target-independent instruction selection.

  return selectOperator(I, I->getOpcode());

}


FastISel *AArch64::createFastISel(FunctionLoweringInfo &FuncInfo,

                                        const TargetLibraryInfo *LibInfo) {


  SMEAttrs CallerAttrs(*FuncInfo.Fn);

  if (CallerAttrs.hasZAState() || CallerAttrs.hasZT0State() ||

      CallerAttrs.hasStreamingInterfaceOrBody() ||

      CallerAttrs.hasStreamingCompatibleInterface() ||

      CallerAttrs.hasAgnosticZAInterface())

    return nullptr;

  return new AArch64FastISel(FuncInfo, LibInfo);

}

AArch64AddressingModes.h

MRI
unsigned const MachineRegisterInfo * MRI
Definition: AArch64AdvSIMDScalarPass.cpp:105

AArch64BaseInfo.h

AArch64CallingConvention.h

isIntExtFree
static bool isIntExtFree(const Instruction *I)
Check if the sign-/zero-extend will be a noop.
Definition: AArch64FastISel.cpp:299

isSExtLoad
static bool isSExtLoad(const MachineInstr *LI)
Definition: AArch64FastISel.cpp:4487

getCompareCC
static AArch64CC::CondCode getCompareCC(CmpInst::Predicate Pred)
Definition: AArch64FastISel.cpp:2214

isMulPowOf2
static bool isMulPowOf2(const Value *I)
Check if the multiply is by a power-of-2 constant.
Definition: AArch64FastISel.cpp:581

getImplicitScaleFactor
static unsigned getImplicitScaleFactor(MVT VT)
Determine the implicit scale factor that is applied by a memory operation for a given value type.
Definition: AArch64FastISel.cpp:319

isZExtLoad
static bool isZExtLoad(const MachineInstr *LI)
Definition: AArch64FastISel.cpp:4467

selectBinaryOp
static unsigned selectBinaryOp(unsigned GenericOpc, unsigned RegBankID, unsigned OpSize)
Select the AArch64 opcode for the basic binary operation GenericOpc (such as G_OR or G_SDIV),...
Definition: AArch64InstructionSelector.cpp:819

emitLoad
static void emitLoad(MachineFunction &MF, MachineBasicBlock &MBB, MachineBasicBlock::iterator Pos, const TargetInstrInfo &TII, unsigned Reg1, unsigned Reg2, int Offset, bool IsPostDec)
Emit a load-pair instruction for frame-destroy.
Definition: AArch64LowerHomogeneousPrologEpilog.cpp:239

emitStore
static void emitStore(MachineFunction &MF, MachineBasicBlock &MBB, MachineBasicBlock::iterator Pos, const TargetInstrInfo &TII, unsigned Reg1, unsigned Reg2, int Offset, bool IsPreDec)
Emit a store-pair instruction for frame-setup.
Definition: AArch64LowerHomogeneousPrologEpilog.cpp:198

RegSize
unsigned RegSize
Definition: AArch64MIPeepholeOpt.cpp:161

AArch64MachineFunctionInfo.h

AArch64RegisterInfo.h

AArch64SMEAttributes.h

AArch64Subtarget.h

AArch64.h

APFloat.h
This file declares a class to represent arbitrary precision floating point values and provide a varie...

APInt.h
This file implements a class to represent arbitrary precision integral constant values and operations...

DL
MachineBasicBlock MachineBasicBlock::iterator DebugLoc DL
Definition: ARMSLSHardening.cpp:73

AtomicOrdering.h
Atomic ordering constants.

Attributes.h
This file contains the simple types necessary to represent the attributes associated with functions a...

true
basic Basic Alias true
Definition: BasicAliasAnalysis.cpp:1981

BranchProbabilityInfo.h

CallingConvLower.h

CallingConv.h

Casting.h

CodeGen.h

Compiler.h

Constants.h
This file contains the declarations for the subclasses of Constant, which represent the different fla...

DataLayout.h

RetTy
return RetTy
Definition: DeadArgumentElimination.cpp:361

Idx
Returns the sub type a function will return at a given Idx Should correspond to the result type of an ExtractValue instruction executed with just that one unsigned Idx
Definition: DeadArgumentElimination.cpp:353

DenseMap.h
This file defines the DenseMap class.

DerivedTypes.h

Addr
uint64_t Addr
Definition: ELFObjHandler.cpp:79

Size
uint64_t Size
Definition: ELFObjHandler.cpp:81

End
bool End
Definition: ELF_riscv.cpp:480

FastISel.h
This file defines the FastISel class.

FunctionLoweringInfo.h

GetElementPtrTypeIterator.h

GlobalValue.h

TII
const HexagonInstrInfo * TII
Definition: HexagonCopyToCombine.cpp:125

MI
IRTranslator LLVM IR MI
Definition: IRTranslator.cpp:112

Argument.h

BasicBlock.h

Constant.h

Function.h

Instruction.h

IntrinsicInst.h

Module.h
Module.h This file contains the declarations for the Module class.

Operator.h

Type.h

User.h

Value.h

ISDOpcodes.h

InstrTypes.h

Instructions.h

Intrinsics.h

MCInstrDesc.h

MCSymbol.h

F
#define F(x, y, z)
Definition: MD5.cpp:55

I
#define I(x, y, z)
Definition: MD5.cpp:58

G
#define G(x, y, z)
Definition: MD5.cpp:56

MachineBasicBlock.h

MachineConstantPool.h
This file declares the MachineConstantPool class which is an abstract constant pool to keep track of ...

MachineFrameInfo.h

MachineInstrBuilder.h

MachineInstr.h

MachineMemOperand.h

MachineRegisterInfo.h

TRI
unsigned const TargetRegisterInfo * TRI
Definition: MachineSink.cpp:2029

MachineValueType.h

MathExtras.h

getReg
static unsigned getReg(const MCDisassembler *D, unsigned RC, unsigned RegNo)
Definition: MipsDisassembler.cpp:520

Signed
@ Signed
Definition: NVPTXISelLowering.cpp:4789

II
uint64_t IntrinsicInst * II
Definition: NVVMIntrRange.cpp:51

TBB
const SmallVectorImpl< MachineOperand > MachineBasicBlock * TBB
Definition: RISCVRedundantCopyElimination.cpp:76

Cond
const SmallVectorImpl< MachineOperand > & Cond
Definition: RISCVRedundantCopyElimination.cpp:75

CC
auto CC
Definition: RISCVRedundantCopyElimination.cpp:79

assert
assert(ImpDefSCC.getReg()==AMDGPU::SCC &&ImpDefSCC.isDef())

Registers
SI Pre allocate WWM Registers
Definition: SIPreAllocateWWMRegs.cpp:86

Address
@ Address
Definition: SPIRVEmitNonSemanticDI.cpp:68

SmallVector.h
This file defines the SmallVector class.

emitCmp
static SDValue emitCmp(SelectionDAG &DAG, const SDLoc &DL, Comparison &C)
Definition: SystemZISelLowering.cpp:3417

ValueTypes.h

RHS
Value * RHS
Definition: X86PartialReduction.cpp:74

LHS
Value * LHS
Definition: X86PartialReduction.cpp:73

FramePtr
static const unsigned FramePtr
Definition: XCoreFrameLowering.cpp:32

Predicate
Definition: AMDGPURegBankLegalizeRules.cpp:332

llvm::AArch64FunctionInfo
AArch64FunctionInfo - This class is derived from MachineFunctionInfo and contains private AArch64-spe...
Definition: AArch64MachineFunctionInfo.h:46

llvm::AArch64FunctionInfo::branchTargetEnforcement
bool branchTargetEnforcement() const
Definition: AArch64MachineFunctionInfo.h:538

llvm::AArch64FunctionInfo::hasELFSignedGOT
bool hasELFSignedGOT() const
Definition: AArch64MachineFunctionInfo.h:531

llvm::AArch64RegisterInfo
Definition: AArch64RegisterInfo.h:26

llvm::AArch64Subtarget
Definition: AArch64Subtarget.h:38

llvm::APFloat
Definition: APFloat.h:904

llvm::APFloat::bitcastToAPInt
APInt bitcastToAPInt() const
Definition: APFloat.h:1351

llvm::APInt
Class for arbitrary precision integers.
Definition: APInt.h:78

llvm::APInt::getZExtValue
uint64_t getZExtValue() const
Get zero extended value.
Definition: APInt.h:1520

llvm::AllocaInst
an instruction to allocate memory on the stack
Definition: Instructions.h:63

llvm::AllocaInst::getType
PointerType * getType() const
Overload to return most specific pointer type.
Definition: Instructions.h:99

llvm::Argument
This class represents an incoming formal argument to a Function.
Definition: Argument.h:31

llvm::AtomicCmpXchgInst
An instruction that atomically checks whether a specified value is in a memory location,...
Definition: Instructions.h:501

llvm::BasicBlock::const_iterator
InstListType::const_iterator const_iterator
Definition: BasicBlock.h:178

llvm::BranchInst
Conditional or Unconditional Branch instruction.
Definition: Instructions.h:3016

llvm::BranchInst::getSuccessor
BasicBlock * getSuccessor(unsigned i) const
Definition: Instructions.h:3104

llvm::BranchInst::isUnconditional
bool isUnconditional() const
Definition: Instructions.h:3089

llvm::BranchInst::getCondition
Value * getCondition() const
Definition: Instructions.h:3092

llvm::BranchProbability
Definition: BranchProbability.h:30

llvm::CCState
CCState - This class holds information needed while lowering arguments and return values.
Definition: CallingConvLower.h:170

llvm::CCValAssign
CCValAssign - Represent assignment of one arg/retval to a location.
Definition: CallingConvLower.h:33

llvm::CCValAssign::isRegLoc
bool isRegLoc() const
Definition: CallingConvLower.h:122

llvm::CCValAssign::getLocReg
Register getLocReg() const
Definition: CallingConvLower.h:128

llvm::CCValAssign::getLocInfo
LocInfo getLocInfo() const
Definition: CallingConvLower.h:134

llvm::CCValAssign::BCvt
@ BCvt
Definition: CallingConvLower.h:46

llvm::CCValAssign::SExt
@ SExt
Definition: CallingConvLower.h:37

llvm::CCValAssign::ZExt
@ ZExt
Definition: CallingConvLower.h:38

llvm::CCValAssign::Full
@ Full
Definition: CallingConvLower.h:36

llvm::CCValAssign::AExt
@ AExt
Definition: CallingConvLower.h:39

llvm::CCValAssign::getValVT
MVT getValVT() const
Definition: CallingConvLower.h:120

llvm::CCValAssign::getValNo
unsigned getValNo() const
Definition: CallingConvLower.h:119

llvm::CmpInst
This class is the base class for the comparison instructions.
Definition: InstrTypes.h:661

llvm::CmpInst::Predicate
Predicate
This enumeration lists the possible predicates for CmpInst subclasses.
Definition: InstrTypes.h:673

llvm::CmpInst::FCMP_OEQ
@ FCMP_OEQ
0 0 0 1 True if ordered and equal
Definition: InstrTypes.h:676

llvm::CmpInst::FCMP_TRUE
@ FCMP_TRUE
1 1 1 1 Always true (always folded)
Definition: InstrTypes.h:690

llvm::CmpInst::ICMP_SLT
@ ICMP_SLT
signed less than
Definition: InstrTypes.h:702

llvm::CmpInst::ICMP_SLE
@ ICMP_SLE
signed less or equal
Definition: InstrTypes.h:703

llvm::CmpInst::FCMP_OLT
@ FCMP_OLT
0 1 0 0 True if ordered and less than
Definition: InstrTypes.h:679

llvm::CmpInst::FCMP_ULE
@ FCMP_ULE
1 1 0 1 True if unordered, less than, or equal
Definition: InstrTypes.h:688

llvm::CmpInst::FCMP_OGT
@ FCMP_OGT
0 0 1 0 True if ordered and greater than
Definition: InstrTypes.h:677

llvm::CmpInst::FCMP_OGE
@ FCMP_OGE
0 0 1 1 True if ordered and greater than or equal
Definition: InstrTypes.h:678

llvm::CmpInst::ICMP_UGE
@ ICMP_UGE
unsigned greater or equal
Definition: InstrTypes.h:697

llvm::CmpInst::ICMP_UGT
@ ICMP_UGT
unsigned greater than
Definition: InstrTypes.h:696

llvm::CmpInst::ICMP_SGT
@ ICMP_SGT
signed greater than
Definition: InstrTypes.h:700

llvm::CmpInst::FCMP_ULT
@ FCMP_ULT
1 1 0 0 True if unordered or less than
Definition: InstrTypes.h:687

llvm::CmpInst::FCMP_ONE
@ FCMP_ONE
0 1 1 0 True if ordered and operands are unequal
Definition: InstrTypes.h:681

llvm::CmpInst::FCMP_UEQ
@ FCMP_UEQ
1 0 0 1 True if unordered or equal
Definition: InstrTypes.h:684

llvm::CmpInst::ICMP_ULT
@ ICMP_ULT
unsigned less than
Definition: InstrTypes.h:698

llvm::CmpInst::FCMP_UGT
@ FCMP_UGT
1 0 1 0 True if unordered or greater than
Definition: InstrTypes.h:685

llvm::CmpInst::FCMP_OLE
@ FCMP_OLE
0 1 0 1 True if ordered and less than or equal
Definition: InstrTypes.h:680

llvm::CmpInst::FCMP_ORD
@ FCMP_ORD
0 1 1 1 True if ordered (no nans)
Definition: InstrTypes.h:682

llvm::CmpInst::ICMP_EQ
@ ICMP_EQ
equal
Definition: InstrTypes.h:694

llvm::CmpInst::ICMP_NE
@ ICMP_NE
not equal
Definition: InstrTypes.h:695

llvm::CmpInst::ICMP_SGE
@ ICMP_SGE
signed greater or equal
Definition: InstrTypes.h:701

llvm::CmpInst::FCMP_UNE
@ FCMP_UNE
1 1 1 0 True if unordered or not equal
Definition: InstrTypes.h:689

llvm::CmpInst::ICMP_ULE
@ ICMP_ULE
unsigned less or equal
Definition: InstrTypes.h:699

llvm::CmpInst::FCMP_UGE
@ FCMP_UGE
1 0 1 1 True if unordered, greater than, or equal
Definition: InstrTypes.h:686

llvm::CmpInst::FCMP_FALSE
@ FCMP_FALSE
0 0 0 0 Always false (always folded)
Definition: InstrTypes.h:675

llvm::CmpInst::FCMP_UNO
@ FCMP_UNO
1 0 0 0 True if unordered: isnan(X) | isnan(Y)
Definition: InstrTypes.h:683

llvm::CmpInst::getInversePredicate
Predicate getInversePredicate() const
For example, EQ -> NE, UGT -> ULE, SLT -> SGE, OEQ -> UNE, UGT -> OLE, OLT -> UGE,...
Definition: InstrTypes.h:787

llvm::CmpInst::isUnsigned
bool isUnsigned() const
Definition: InstrTypes.h:934

llvm::ConstantExpr
A constant value that is initialized with an expression using other constant values.
Definition: Constants.h:1108

llvm::ConstantFP
ConstantFP - Floating Point Values [float, double].
Definition: Constants.h:271

llvm::ConstantFP::getValueAPF
const APFloat & getValueAPF() const
Definition: Constants.h:314

llvm::ConstantFP::isNegative
bool isNegative() const
Return true if the sign bit is set.
Definition: Constants.h:321

llvm::ConstantFP::isZero
bool isZero() const
Return true if the value is positive or negative zero.
Definition: Constants.h:318

llvm::ConstantInt
This is the shared class of boolean and integer constants.
Definition: Constants.h:83

llvm::ConstantInt::isZero
bool isZero() const
This is just a convenience method to make client code smaller for a common code.
Definition: Constants.h:208

llvm::ConstantInt::getSExtValue
int64_t getSExtValue() const
Return the constant as a 64-bit integer value after it has been sign extended as appropriate for the ...
Definition: Constants.h:163

llvm::ConstantInt::getZExtValue
uint64_t getZExtValue() const
Return the constant as a 64-bit unsigned integer value after it has been zero extended as appropriate...
Definition: Constants.h:157

llvm::Constant
This is an important base class in LLVM.
Definition: Constant.h:42

llvm::Constant::isNullValue
bool isNullValue() const
Return true if this is the value that would be returned by getNullValue.
Definition: Constants.cpp:90

llvm::DWARFExpression::Operation
This class represents an Operation in the Expression.
Definition: DWARFExpression.h:32

llvm::DenseMap
Definition: DenseMap.h:727

llvm::ElementCount::isVector
constexpr bool isVector() const
One or more elements.
Definition: TypeSize.h:326

llvm::FastISel
This is a fast-path instruction selection class that generates poor code and doesn't support illegal ...
Definition: FastISel.h:66

llvm::FastISel::selectGetElementPtr
bool selectGetElementPtr(const User *I)
Definition: FastISel.cpp:530

llvm::FastISel::fastMaterializeFloatZero
virtual unsigned fastMaterializeFloatZero(const ConstantFP *CF)
Emit the floating-point constant +0.0 in a register using target- specific logic.
Definition: FastISel.h:480

llvm::FastISel::fastLowerIntrinsicCall
virtual bool fastLowerIntrinsicCall(const IntrinsicInst *II)
This method is called by target-independent code to do target- specific intrinsic lowering.
Definition: FastISel.cpp:1948

llvm::FastISel::getRegForGEPIndex
Register getRegForGEPIndex(MVT PtrVT, const Value *Idx)
This is a wrapper around getRegForValue that also takes care of truncating or sign-extending the give...
Definition: FastISel.cpp:383

llvm::FastISel::fastMaterializeConstant
virtual unsigned fastMaterializeConstant(const Constant *C)
Emit a constant in a register using target-specific logic, such as constant pool loads.
Definition: FastISel.h:473

llvm::FastISel::fastLowerCall
virtual bool fastLowerCall(CallLoweringInfo &CLI)
This method is called by target-independent code to do target- specific call lowering.
Definition: FastISel.cpp:1946

llvm::FastISel::fastLowerArguments
virtual bool fastLowerArguments()
This method is called by target-independent code to do target- specific argument lowering.
Definition: FastISel.cpp:1944

llvm::FastISel::fastSelectInstruction
virtual bool fastSelectInstruction(const Instruction *I)=0
This method is called by target-independent code when the normal FastISel process fails to select an ...

llvm::FastISel::selectBitCast
bool selectBitCast(const User *I)
Definition: FastISel.cpp:1516

llvm::FastISel::fastMaterializeAlloca
virtual unsigned fastMaterializeAlloca(const AllocaInst *C)
Emit an alloca address in a register using target-specific logic.
Definition: FastISel.h:476

llvm::FunctionLoweringInfo
FunctionLoweringInfo - This contains information that is global to a function that is used when lower...
Definition: FunctionLoweringInfo.h:57

llvm::FunctionLoweringInfo::Fn
const Function * Fn
Definition: FunctionLoweringInfo.h:59

llvm::FunctionLoweringInfo::MF
MachineFunction * MF
Definition: FunctionLoweringInfo.h:60

llvm::Function
Definition: Function.h:63

llvm::Function::getContext
LLVMContext & getContext() const
getContext - Return a reference to the LLVMContext associated with this function.
Definition: Function.cpp:369

llvm::GlobalValue
Definition: GlobalValue.h:48

llvm::GlobalValue::isThreadLocal
bool isThreadLocal() const
If the value is "Thread Local", its value isn't shared by the threads.
Definition: GlobalValue.h:264

llvm::GlobalValue::getType
PointerType * getType() const
Global values are always pointers.
Definition: GlobalValue.h:295

llvm::IndirectBrInst
Indirect Branch Instruction.
Definition: Instructions.h:3544

llvm::IndirectBrInst::successors
iterator_range< succ_op_iterator > successors()
Definition: Instructions.h:3639

llvm::Instruction
Definition: Instruction.h:68

llvm::Instruction::getDebugLoc
const DebugLoc & getDebugLoc() const
Return the debug location for this node as a DebugLoc.
Definition: Instruction.h:511

llvm::Instruction::getOpcode
unsigned getOpcode() const
Returns a member of one of the enums like Instruction::Add.
Definition: Instruction.h:310

llvm::IntrinsicInst
A wrapper class for inspecting calls to intrinsic functions.
Definition: IntrinsicInst.h:48

llvm::LLVMContext
This is an important class for using LLVM in a threaded context.
Definition: LLVMContext.h:67

llvm::LLVMContext::OB_kcfi
@ OB_kcfi
Definition: LLVMContext.h:97

llvm::MCContext
Context object for machine code objects.
Definition: MCContext.h:83

llvm::MCInstrDesc
Describe properties that are true of each instruction in the target description file.
Definition: MCInstrDesc.h:198

llvm::MCSymbol
MCSymbol - Instances of this class represent a symbol name in the MC file, and MCSymbols are created ...
Definition: MCSymbol.h:41

llvm::MVT
Machine Value Type.
Definition: MachineValueType.h:35

llvm::MVT::is128BitVector
bool is128BitVector() const
Return true if this is a 128-bit vector type.
Definition: MachineValueType.h:156

llvm::MVT::SimpleTy
SimpleValueType SimpleTy
Definition: MachineValueType.h:55

llvm::MVT::isVector
bool isVector() const
Return true if this is a vector value type.
Definition: MachineValueType.h:106

llvm::MVT::getSizeInBits
TypeSize getSizeInBits() const
Returns the size of the specified MVT in bits.
Definition: MachineValueType.h:308

llvm::MVT::getStoreSize
TypeSize getStoreSize() const
Return the number of bytes overwritten by a store of the specified value type.
Definition: MachineValueType.h:356

llvm::MVT::isFloatingPoint
bool isFloatingPoint() const
Return true if this is a FP or a vector FP type.
Definition: MachineValueType.h:80

llvm::MVT::getIntegerVT
static MVT getIntegerVT(unsigned BitWidth)
Definition: MachineValueType.h:441

llvm::MVT::is64BitVector
bool is64BitVector() const
Return true if this is a 64-bit vector type.
Definition: MachineValueType.h:151

llvm::MachineBasicBlock
Definition: MachineBasicBlock.h:125

llvm::MachineFrameInfo
The MachineFrameInfo class represents an abstract stack frame until prolog/epilog code is inserted.
Definition: MachineFrameInfo.h:106

llvm::MachineFrameInfo::CreateFixedObject
int CreateFixedObject(uint64_t Size, int64_t SPOffset, bool IsImmutable, bool isAliased=false)
Create a new object at a fixed location on the stack.
Definition: MachineFrameInfo.cpp:83

llvm::MachineFrameInfo::setFrameAddressIsTaken
void setFrameAddressIsTaken(bool T)
Definition: MachineFrameInfo.h:374

llvm::MachineFunction::getSubtarget
const TargetSubtargetInfo & getSubtarget() const
getSubtarget - Return the subtarget for which this machine code is being compiled.
Definition: MachineFunction.h:733

llvm::MachineInstrBuilder
Definition: MachineInstrBuilder.h:71

llvm::MachineInstrBuilder::addImm
const MachineInstrBuilder & addImm(int64_t Val) const
Add a new immediate operand.
Definition: MachineInstrBuilder.h:133

llvm::MachineInstrBuilder::addSym
const MachineInstrBuilder & addSym(MCSymbol *Sym, unsigned char TargetFlags=0) const
Definition: MachineInstrBuilder.h:269

llvm::MachineInstrBuilder::addFrameIndex
const MachineInstrBuilder & addFrameIndex(int Idx) const
Definition: MachineInstrBuilder.h:154

llvm::MachineInstrBuilder::addConstantPoolIndex
const MachineInstrBuilder & addConstantPoolIndex(unsigned Idx, int Offset=0, unsigned TargetFlags=0) const
Definition: MachineInstrBuilder.h:160

llvm::MachineInstrBuilder::addRegMask
const MachineInstrBuilder & addRegMask(const uint32_t *Mask) const
Definition: MachineInstrBuilder.h:199

llvm::MachineInstrBuilder::addGlobalAddress
const MachineInstrBuilder & addGlobalAddress(const GlobalValue *GV, int64_t Offset=0, unsigned TargetFlags=0) const
Definition: MachineInstrBuilder.h:179

llvm::MachineInstrBuilder::addReg
const MachineInstrBuilder & addReg(Register RegNo, unsigned flags=0, unsigned SubReg=0) const
Add a new virtual register operand.
Definition: MachineInstrBuilder.h:99

llvm::MachineInstrBuilder::addMBB
const MachineInstrBuilder & addMBB(MachineBasicBlock *MBB, unsigned TargetFlags=0) const
Definition: MachineInstrBuilder.h:148

llvm::MachineInstrBuilder::addUse
const MachineInstrBuilder & addUse(Register RegNo, unsigned Flags=0, unsigned SubReg=0) const
Add a virtual register use operand.
Definition: MachineInstrBuilder.h:125

llvm::MachineInstrBuilder::addMemOperand
const MachineInstrBuilder & addMemOperand(MachineMemOperand *MMO) const
Definition: MachineInstrBuilder.h:204

llvm::MachineInstrBuilder::addDef
const MachineInstrBuilder & addDef(Register RegNo, unsigned Flags=0, unsigned SubReg=0) const
Add a virtual register definition operand.
Definition: MachineInstrBuilder.h:118

llvm::MachineInstrBundleIterator< MachineInstr >

llvm::MachineInstr
Representation of each machine instruction.
Definition: MachineInstr.h:71

llvm::MachineInstr::getOpcode
unsigned getOpcode() const
Returns the opcode of this MachineInstr.
Definition: MachineInstr.h:577

llvm::MachineInstr::getDesc
const MCInstrDesc & getDesc() const
Returns the target instruction descriptor of this MachineInstr.
Definition: MachineInstr.h:574

llvm::MachineMemOperand
A description of a memory reference used in the backend.
Definition: MachineMemOperand.h:129

llvm::MachineMemOperand::Flags
Flags
Flags values. These may be or'd together.
Definition: MachineMemOperand.h:132

llvm::MachineMemOperand::MOLoad
@ MOLoad
The memory access reads data.
Definition: MachineMemOperand.h:136

llvm::MachineMemOperand::MOStore
@ MOStore
The memory access writes data.
Definition: MachineMemOperand.h:138

llvm::MemIntrinsicBase::getLength
Value * getLength() const
Definition: IntrinsicInst.h:981

llvm::MemIntrinsicBase::getDestAddressSpace
unsigned getDestAddressSpace() const
Definition: IntrinsicInst.h:992

llvm::MemIntrinsic::isVolatile
bool isVolatile() const
Definition: IntrinsicInst.h:1214

llvm::MemSetInst
This class wraps the llvm.memset and llvm.memset.inline intrinsics.
Definition: IntrinsicInst.h:1237

llvm::Register
Wrapper class representing virtual and physical registers.
Definition: Register.h:19

llvm::ReturnInst
Return a value (possibly void), from a function.
Definition: Instructions.h:2938

llvm::SMEAttrs
SMEAttrs is a utility class to parse the SME ACLE attributes on functions.
Definition: AArch64SMEAttributes.h:25

llvm::SMEAttrs::hasStreamingCompatibleInterface
bool hasStreamingCompatibleInterface() const
Definition: AArch64SMEAttributes.h:66

llvm::SMEAttrs::hasAgnosticZAInterface
bool hasAgnosticZAInterface() const
Definition: AArch64SMEAttributes.h:100

llvm::SMEAttrs::hasStreamingInterfaceOrBody
bool hasStreamingInterfaceOrBody() const
Definition: AArch64SMEAttributes.h:63

llvm::SMEAttrs::hasZAState
bool hasZAState() const
Definition: AArch64SMEAttributes.h:105

llvm::SMEAttrs::hasZT0State
bool hasZT0State() const
Definition: AArch64SMEAttributes.h:133

llvm::SelectInst
This class represents the LLVM 'select' instruction.
Definition: Instructions.h:1657

llvm::SmallVectorBase::size
size_t size() const
Definition: SmallVector.h:78

llvm::SmallVectorImpl
This class consists of common code factored out of the SmallVector class to reduce code duplication b...
Definition: SmallVector.h:573

llvm::SmallVectorImpl::reserve
void reserve(size_type N)
Definition: SmallVector.h:663

llvm::SmallVectorTemplateBase::push_back
void push_back(const T &Elt)
Definition: SmallVector.h:413

llvm::SmallVector
This is a 'vector' (really, a variable-sized array), optimized for the case when the array is small.
Definition: SmallVector.h:1196

llvm::StructLayout
Used to lazily calculate structure layout information for a target machine, based on the DataLayout s...
Definition: DataLayout.h:567

llvm::StructLayout::getElementOffset
TypeSize getElementOffset(unsigned Idx) const
Definition: DataLayout.h:596

llvm::StructType
Class to represent struct types.
Definition: DerivedTypes.h:218

llvm::TargetLibraryInfo
Provides information about what library functions are available for the current target.
Definition: TargetLibraryInfo.h:280

llvm::TargetRegisterClass
Definition: TargetRegisterInfo.h:44

llvm::Target
Target - Wrapper for Target specific information.
Definition: TargetRegistry.h:144

llvm::Type
The instances of the Type class are immutable: once they are created, they are never changed.
Definition: Type.h:45

llvm::Type::isVectorTy
bool isVectorTy() const
True if this is an instance of VectorType.
Definition: Type.h:270

llvm::Type::isArrayTy
bool isArrayTy() const
True if this is an instance of ArrayType.
Definition: Type.h:261

llvm::Type::isPointerTy
bool isPointerTy() const
True if this is an instance of PointerType.
Definition: Type.h:264

llvm::Type::isStructTy
bool isStructTy() const
True if this is an instance of StructType.
Definition: Type.h:258

llvm::Type::isSized
bool isSized(SmallPtrSetImpl< Type * > *Visited=nullptr) const
Return true if it makes sense to take the size of this type.
Definition: Type.h:310

llvm::Type::getInt64Ty
static IntegerType * getInt64Ty(LLVMContext &C)

llvm::Type::isIntegerTy
bool isIntegerTy() const
True if this is an instance of IntegerType.
Definition: Type.h:237

llvm::User
Definition: User.h:44

llvm::User::getOperand
Value * getOperand(unsigned i) const
Definition: User.h:228

llvm::Value
LLVM Value Representation.
Definition: Value.h:74

llvm::Value::getType
Type * getType() const
All values are typed, get the type of this value.
Definition: Value.h:255

llvm::Value::hasOneUse
bool hasOneUse() const
Return true if there is exactly one use of this value.
Definition: Value.h:434

llvm::generic_gep_type_iterator
Definition: GetElementPtrTypeIterator.h:31

llvm::ilist_detail::node_parent_access::getParent
const ParentTy * getParent() const
Definition: ilist_node.h:32

uint16_t

uint64_t

unsigned

ErrorHandling.h

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition: ErrorHandling.h:143

llvm::AArch64CC::CondCode
CondCode
Definition: AArch64BaseInfo.h:254

llvm::AArch64CC::VC
@ VC
Definition: AArch64BaseInfo.h:262

llvm::AArch64CC::NE
@ NE
Definition: AArch64BaseInfo.h:256

llvm::AArch64CC::GE
@ GE
Definition: AArch64BaseInfo.h:265

llvm::AArch64CC::PL
@ PL
Definition: AArch64BaseInfo.h:260

llvm::AArch64CC::EQ
@ EQ
Definition: AArch64BaseInfo.h:255

llvm::AArch64CC::HS
@ HS
Definition: AArch64BaseInfo.h:257

llvm::AArch64CC::MI
@ MI
Definition: AArch64BaseInfo.h:259

llvm::AArch64CC::GT
@ GT
Definition: AArch64BaseInfo.h:267

llvm::AArch64CC::LT
@ LT
Definition: AArch64BaseInfo.h:266

llvm::AArch64CC::VS
@ VS
Definition: AArch64BaseInfo.h:261

llvm::AArch64CC::HI
@ HI
Definition: AArch64BaseInfo.h:263

llvm::AArch64CC::LO
@ LO
Definition: AArch64BaseInfo.h:258

llvm::AArch64CC::AL
@ AL
Definition: AArch64BaseInfo.h:269

llvm::AArch64CC::LE
@ LE
Definition: AArch64BaseInfo.h:268

llvm::AArch64CC::Invalid
@ Invalid
Definition: AArch64BaseInfo.h:272

llvm::AArch64CC::LS
@ LS
Definition: AArch64BaseInfo.h:264

llvm::AArch64II::MO_NC
@ MO_NC
MO_NC - Indicates whether the linker is expected to check the symbol reference for overflow.
Definition: AArch64BaseInfo.h:832

llvm::AArch64II::MO_PAGEOFF
@ MO_PAGEOFF
MO_PAGEOFF - A symbol operand with this flag represents the offset of that symbol within a 4K page.
Definition: AArch64BaseInfo.h:796

llvm::AArch64II::MO_GOT
@ MO_GOT
MO_GOT - This flag indicates that a symbol operand represents the address of the GOT entry for the sy...
Definition: AArch64BaseInfo.h:827

llvm::AArch64II::MO_PREL
@ MO_PREL
MO_PREL - Indicates that the bits of the symbol operand represented by MO_G0 etc are PC relative.
Definition: AArch64BaseInfo.h:851

llvm::AArch64II::MO_PAGE
@ MO_PAGE
MO_PAGE - A symbol operand with this flag represents the pc-relative offset of the 4K page containing...
Definition: AArch64BaseInfo.h:791

llvm::AArch64II::MO_TAGGED
@ MO_TAGGED
MO_TAGGED - With MO_PAGE, indicates that the page includes a memory tag in bits 56-63.
Definition: AArch64BaseInfo.h:859

llvm::AArch64II::MO_G3
@ MO_G3
MO_G3 - A symbol operand with this flag (granule 3) represents the high 16-bits of a 64-bit address,...
Definition: AArch64BaseInfo.h:800

llvm::AArch64_AM::isLogicalImmediate
static bool isLogicalImmediate(uint64_t imm, unsigned regSize)
isLogicalImmediate - Return true if the immediate is valid for a logical immediate instruction of the...
Definition: AArch64AddressingModes.h:275

llvm::AArch64_AM::ShiftExtendType
ShiftExtendType
Definition: AArch64AddressingModes.h:32

llvm::AArch64_AM::SXTW
@ SXTW
Definition: AArch64AddressingModes.h:47

llvm::AArch64_AM::LSL
@ LSL
Definition: AArch64AddressingModes.h:34

llvm::AArch64_AM::UXTW
@ UXTW
Definition: AArch64AddressingModes.h:42

llvm::AArch64_AM::ASR
@ ASR
Definition: AArch64AddressingModes.h:36

llvm::AArch64_AM::InvalidShiftExtend
@ InvalidShiftExtend
Definition: AArch64AddressingModes.h:33

llvm::AArch64_AM::UXTB
@ UXTB
Definition: AArch64AddressingModes.h:40

llvm::AArch64_AM::LSR
@ LSR
Definition: AArch64AddressingModes.h:35

llvm::AArch64_AM::UXTH
@ UXTH
Definition: AArch64AddressingModes.h:41

llvm::AArch64_AM::SXTB
@ SXTB
Definition: AArch64AddressingModes.h:45

llvm::AArch64_AM::SXTX
@ SXTX
Definition: AArch64AddressingModes.h:48

llvm::AArch64_AM::SXTH
@ SXTH
Definition: AArch64AddressingModes.h:46

llvm::AArch64_AM::encodeLogicalImmediate
static uint64_t encodeLogicalImmediate(uint64_t imm, unsigned regSize)
encodeLogicalImmediate - Return the encoded immediate value for a logical immediate instruction of th...
Definition: AArch64AddressingModes.h:282

llvm::AArch64_AM::getFP64Imm
static int getFP64Imm(const APInt &Imm)
getFP64Imm - Return an 8-bit floating-point version of the 64-bit floating-point value.
Definition: AArch64AddressingModes.h:421

llvm::AArch64_AM::getShifterImm
static unsigned getShifterImm(AArch64_AM::ShiftExtendType ST, unsigned Imm)
getShifterImm - Encode the shift type and amount: imm: 6-bit shift amount shifter: 000 ==> lsl 001 ==...
Definition: AArch64AddressingModes.h:98

llvm::AArch64::createFastISel
FastISel * createFastISel(FunctionLoweringInfo &funcInfo, const TargetLibraryInfo *libInfo)
Definition: AArch64FastISel.cpp:5194

llvm::AMDGPU::HSAMD::Kernel::Key::Args
constexpr char Args[]
Key for Kernel::Metadata::mArgs.
Definition: AMDGPUMetadata.h:395

llvm::AMDGPU::Hwreg::Offset
Offset
Definition: SIDefines.h:553

llvm::AMDGPU::Imm
@ Imm
Definition: AMDGPURegBankLegalizeRules.h:105

llvm::ARMBuildAttrs::Symbol
@ Symbol
Definition: ARMBuildAttributes.h:83

llvm::ARMCC::CondCodes
CondCodes
Definition: ARMBaseInfo.h:30

llvm::ARM_AM::getFP32Imm
int getFP32Imm(const APInt &Imm)
getFP32Imm - Return an 8-bit floating-point version of the 32-bit floating-point value.
Definition: ARMAddressingModes.h:692

llvm::BitmaskEnumDetail::Mask
constexpr std::underlying_type_t< E > Mask()
Get a bitmask with 1s in all places up to the high-order bit of E's largest value.
Definition: BitmaskEnum.h:125

llvm::COFF::Entry
@ Entry
Definition: COFF.h:844

llvm::CallingConv::Swift
@ Swift
Calling convention for Swift.
Definition: CallingConv.h:69

llvm::CallingConv::CFGuard_Check
@ CFGuard_Check
Special calling convention on Windows for calling the Control Guard Check ICall funtion.
Definition: CallingConv.h:82

llvm::CallingConv::GHC
@ GHC
Used by the Glasgow Haskell Compiler (GHC).
Definition: CallingConv.h:50

llvm::CallingConv::C
@ C
The default llvm calling convention, compatible with C.
Definition: CallingConv.h:34

llvm::CodeModel::Model
Model
Definition: CodeGen.h:31

llvm::CodeModel::Large
@ Large
Definition: CodeGen.h:31

llvm::ISD::SREM
@ SREM
Definition: ISDOpcodes.h:251

llvm::ISD::SDIV
@ SDIV
Definition: ISDOpcodes.h:249

llvm::ISD::ADD
@ ADD
Simple integer binary arithmetic operators.
Definition: ISDOpcodes.h:246

llvm::ISD::SINT_TO_FP
@ SINT_TO_FP
[SU]INT_TO_FP - These operators convert integers (whose interpreted sign depends on the first letter)...
Definition: ISDOpcodes.h:841

llvm::ISD::OR
@ OR
Definition: ISDOpcodes.h:710

llvm::ISD::MULHU
@ MULHU
MULHU/MULHS - Multiply high - Multiply two integers of type iN, producing an unsigned/signed value of...
Definition: ISDOpcodes.h:674

llvm::ISD::XOR
@ XOR
Definition: ISDOpcodes.h:711

llvm::ISD::MULHS
@ MULHS
Definition: ISDOpcodes.h:675

llvm::ISD::Constant
@ Constant
Definition: ISDOpcodes.h:76

llvm::ISD::FP_TO_SINT
@ FP_TO_SINT
FP_TO_[US]INT - Convert a floating point value to a signed or unsigned integer.
Definition: ISDOpcodes.h:887

llvm::ISD::AND
@ AND
Bitwise operators - logical and, logical or, logical xor.
Definition: ISDOpcodes.h:709

llvm::ISD::UREM
@ UREM
Definition: ISDOpcodes.h:252

llvm::ISD::MUL
@ MUL
Definition: ISDOpcodes.h:248

llvm::ISD::FSQRT
@ FSQRT
Definition: ISDOpcodes.h:983

llvm::ISD::TRUNCATE
@ TRUNCATE
TRUNCATE - Completely drop the high bits.
Definition: ISDOpcodes.h:817

llvm::M68k::MemAddrModeKind::U
@ U

llvm::M68k::MemAddrModeKind::V
@ V

llvm::M68k::MemAddrModeKind::K
@ K

llvm::MCID::Flag
Flag
These should be considered private to the implementation of the MCInstrDesc class.
Definition: MCInstrDesc.h:148

llvm::MipsISD::Ret
@ Ret
Definition: MipsISelLowering.h:117

llvm::Mips::GPRIdx
@ GPRIdx
Definition: MipsRegisterBankInfo.cpp:44

llvm::RISCVFenceField::O
@ O
Definition: RISCVBaseInfo.h:372

llvm::RTLIB::Libcall
Libcall
RTLIB::Libcall enum - This enum defines all of the runtime library calls the backend can emit.
Definition: RuntimeLibcalls.h:33

llvm::RegState::Implicit
@ Implicit
Not emitted register (e.g. carry, or temporary result).
Definition: MachineInstrBuilder.h:48

llvm::RegState::Kill
@ Kill
The last use of a register.
Definition: MachineInstrBuilder.h:50

llvm::SIEncodingFamily::SI
@ SI
Definition: SIDefines.h:36

llvm::SystemZISD::TM
@ TM
Definition: SystemZISelLowering.h:66

llvm::X86Disassembler::Reg
Reg
All possible values of the reg field in the ModR/M byte.
Definition: X86DisassemblerDecoder.h:621

llvm::X86::FirstMacroFusionInstKind::Cmp
@ Cmp

llvm::lltok::Kind
Kind
Definition: LLToken.h:18

llvm::omp::RTLDependInfoFields::Flags
@ Flags

llvm::omp::RTLDependInfoFields::Len
@ Len

llvm::pdb::PDB_SymType::Callee
@ Callee

llvm::sampleprof::Base
@ Base
Definition: Discriminator.h:58

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition: AddressRanges.h:18

llvm::RetCC_AArch64_AAPCS
bool RetCC_AArch64_AAPCS(unsigned ValNo, MVT ValVT, MVT LocVT, CCValAssign::LocInfo LocInfo, ISD::ArgFlagsTy ArgFlags, CCState &State)

llvm::Offset
@ Offset
Definition: DWP.cpp:480

llvm::CC_AArch64_GHC
bool CC_AArch64_GHC(unsigned ValNo, MVT ValVT, MVT LocVT, CCValAssign::LocInfo LocInfo, ISD::ArgFlagsTy ArgFlags, CCState &State)

llvm::constrainOperandRegClass
Register constrainOperandRegClass(const MachineFunction &MF, const TargetRegisterInfo &TRI, MachineRegisterInfo &MRI, const TargetInstrInfo &TII, const RegisterBankInfo &RBI, MachineInstr &InsertPt, const TargetRegisterClass &RegClass, MachineOperand &RegMO)
Constrain the Register operand OpIdx, so that it is now constrained to the TargetRegisterClass passed...
Definition: Utils.cpp:56

llvm::GetReturnInfo
void GetReturnInfo(CallingConv::ID CC, Type *ReturnType, AttributeList attr, SmallVectorImpl< ISD::OutputArg > &Outs, const TargetLowering &TLI, const DataLayout &DL)
Given an LLVM IR type and return type attributes, compute the return value EVTs and flags,...
Definition: TargetLoweringBase.cpp:1661

llvm::BuildMI
MachineInstrBuilder BuildMI(MachineFunction &MF, const MIMetadata &MIMD, const MCInstrDesc &MCID)
Builder interface. Specify how to create the initial instruction itself.
Definition: MachineInstrBuilder.h:373

llvm::Depth
@ Depth
Definition: SIMachineScheduler.h:36

llvm::CC_AArch64_Win64PCS
bool CC_AArch64_Win64PCS(unsigned ValNo, MVT ValVT, MVT LocVT, CCValAssign::LocInfo LocInfo, ISD::ArgFlagsTy ArgFlags, CCState &State)

llvm::CC_AArch64_Win64_CFGuard_Check
bool CC_AArch64_Win64_CFGuard_Check(unsigned ValNo, MVT ValVT, MVT LocVT, CCValAssign::LocInfo LocInfo, ISD::ArgFlagsTy ArgFlags, CCState &State)

llvm::getBLRCallOpcode
unsigned getBLRCallOpcode(const MachineFunction &MF)
Return opcode to be used for indirect calls.
Definition: AArch64InstrInfo.cpp:9989

llvm::isPowerOf2_64
constexpr bool isPowerOf2_64(uint64_t Value)
Return true if the argument is a power of two > 0 (64 bit edition.)
Definition: MathExtras.h:297

llvm::gep_type_end
gep_type_iterator gep_type_end(const User *GEP)
Definition: GetElementPtrTypeIterator.h:180

llvm::isReleaseOrStronger
bool isReleaseOrStronger(AtomicOrdering AO)
Definition: AtomicOrdering.h:133

llvm::getOffset
static Error getOffset(const SymbolRef &Sym, SectionRef Sec, uint64_t &Result)
Definition: RuntimeDyld.cpp:172

llvm::CC_AArch64_AAPCS
bool CC_AArch64_AAPCS(unsigned ValNo, MVT ValVT, MVT LocVT, CCValAssign::LocInfo LocInfo, ISD::ArgFlagsTy ArgFlags, CCState &State)

llvm::AtomicOrdering
AtomicOrdering
Atomic ordering for LLVM's memory model.
Definition: AtomicOrdering.h:56

llvm::CCAssignFn
bool CCAssignFn(unsigned ValNo, MVT ValVT, MVT LocVT, CCValAssign::LocInfo LocInfo, ISD::ArgFlagsTy ArgFlags, CCState &State)
CCAssignFn - This function assigns a location for Val, updating State to reflect the change.
Definition: CallingConvLower.h:156

llvm::getKillRegState
unsigned getKillRegState(bool B)
Definition: MachineInstrBuilder.h:555

llvm::CC_AArch64_DarwinPCS
bool CC_AArch64_DarwinPCS(unsigned ValNo, MVT ValVT, MVT LocVT, CCValAssign::LocInfo LocInfo, ISD::ArgFlagsTy ArgFlags, CCState &State)

llvm::gep_type_begin
gep_type_iterator gep_type_begin(const User *GEP)
Definition: GetElementPtrTypeIterator.h:173

std::swap
void swap(llvm::BitVector &LHS, llvm::BitVector &RHS)
Implement std::swap in terms of BitVector swap.
Definition: BitVector.h:860

N
#define N

RegInfo
Definition: AMDGPUAsmParser.cpp:2770

llvm::Align
This struct is a compact representation of a valid (non-zero power of two) alignment.
Definition: Alignment.h:39

llvm::EVT
Extended Value Type.
Definition: ValueTypes.h:35

llvm::EVT::isSimple
bool isSimple() const
Test if the given EVT is simple (as opposed to being extended).
Definition: ValueTypes.h:137

llvm::EVT::bitsGT
bool bitsGT(EVT VT) const
Return true if this has more bits than VT.
Definition: ValueTypes.h:279

llvm::EVT::bitsLT
bool bitsLT(EVT VT) const
Return true if this has less bits than VT.
Definition: ValueTypes.h:295

llvm::EVT::getVectorElementCount
ElementCount getVectorElementCount() const
Definition: ValueTypes.h:345

llvm::EVT::getEVT
static EVT getEVT(Type *Ty, bool HandleUnknown=false)
Return the value type corresponding to the specified type.
Definition: ValueTypes.cpp:289

llvm::EVT::getSimpleVT
MVT getSimpleVT() const
Return the SimpleValueType held in the specified simple EVT.
Definition: ValueTypes.h:311

llvm::EVT::isVector
bool isVector() const
Return true if this is a vector value type.
Definition: ValueTypes.h:168

llvm::MachinePointerInfo::getStack
static MachinePointerInfo getStack(MachineFunction &MF, int64_t Offset, uint8_t ID=0)
Stack pointer relative access.
Definition: MachineOperand.cpp:1085

llvm::MachinePointerInfo::getFixedStack
static MachinePointerInfo getFixedStack(MachineFunction &MF, int FI, int64_t Offset=0)
Return a MachinePointerInfo record that refers to the specified FrameIndex.
Definition: MachineOperand.cpp:1072

llvm::MaybeAlign
This struct is a compact representation of a valid (power of two) or undefined (0) alignment.
Definition: Alignment.h:117

llvm::OptimizedStructLayoutField
A field in a structure.
Definition: OptimizedStructLayout.h:45