doxygen/html/AMDGPUDisassembler_8cpp_source.html

//===- AMDGPUDisassembler.cpp - Disassembler for AMDGPU ISA ---------------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

//===----------------------------------------------------------------------===//

//

/// \file

///

/// This file contains definition for AMDGPU ISA disassembler

//

//===----------------------------------------------------------------------===//


// ToDo: What to do with instruction suffixes (v_mov_b32 vs v_mov_b32_e32)?


#include "Disassembler/AMDGPUDisassembler.h"

#include "MCTargetDesc/AMDGPUMCTargetDesc.h"

#include "SIDefines.h"

#include "SIRegisterInfo.h"

#include "TargetInfo/AMDGPUTargetInfo.h"

#include "Utils/AMDGPUBaseInfo.h"

#include "llvm-c/DisassemblerTypes.h"

#include "llvm/BinaryFormat/ELF.h"

#include "llvm/MC/MCAsmInfo.h"

#include "llvm/MC/MCContext.h"

#include "llvm/MC/MCDecoderOps.h"

#include "llvm/MC/MCExpr.h"

#include "llvm/MC/MCInstrDesc.h"

#include "llvm/MC/MCRegisterInfo.h"

#include "llvm/MC/MCSubtargetInfo.h"

#include "llvm/MC/TargetRegistry.h"

#include "llvm/Support/AMDHSAKernelDescriptor.h"


using namespace llvm;


#define DEBUG_TYPE "amdgpu-disassembler"


#define SGPR_MAX                                                               \

  (isGFX10Plus() ? AMDGPU::EncValues::SGPR_MAX_GFX10                           \

                 : AMDGPU::EncValues::SGPR_MAX_SI)


using DecodeStatus = llvm::MCDisassembler::DecodeStatus;


AMDGPUDisassembler::AMDGPUDisassembler(const MCSubtargetInfo &STI,

                                       MCContext &Ctx, MCInstrInfo const *MCII)

    : MCDisassembler(STI, Ctx), MCII(MCII), MRI(*Ctx.getRegisterInfo()),

      MAI(*Ctx.getAsmInfo()), TargetMaxInstBytes(MAI.getMaxInstLength(&STI)),

      CodeObjectVersion(AMDGPU::getDefaultAMDHSACodeObjectVersion()) {

  // ToDo: AMDGPUDisassembler supports only VI ISA.

  if (!STI.hasFeature(AMDGPU::FeatureGCN3Encoding) && !isGFX10Plus())

    report_fatal_error("Disassembly not yet supported for subtarget");

}


void AMDGPUDisassembler::setABIVersion(unsigned Version) {

  CodeObjectVersion = AMDGPU::getAMDHSACodeObjectVersion(Version);

}


inline static MCDisassembler::DecodeStatus

addOperand(MCInst &Inst, const MCOperand& Opnd) {

  Inst.addOperand(Opnd);

  return Opnd.isValid() ?

    MCDisassembler::Success :

    MCDisassembler::Fail;

}


static int insertNamedMCOperand(MCInst &MI, const MCOperand &Op,

                                uint16_t NameIdx) {

  int OpIdx = AMDGPU::getNamedOperandIdx(MI.getOpcode(), NameIdx);

  if (OpIdx != -1) {

    auto I = MI.begin();

    std::advance(I, OpIdx);

    MI.insert(I, Op);

  }

  return OpIdx;

}


static DecodeStatus decodeSOPPBrTarget(MCInst &Inst, unsigned Imm,

                                       uint64_t Addr,

                                       const MCDisassembler *Decoder) {

  auto DAsm = static_cast<const AMDGPUDisassembler*>(Decoder);


  // Our branches take a simm16, but we need two extra bits to account for the

  // factor of 4.

  APInt SignedOffset(18, Imm * 4, true);

  int64_t Offset = (SignedOffset.sext(64) + 4 + Addr).getSExtValue();


  if (DAsm->tryAddingSymbolicOperand(Inst, Offset, Addr, true, 2, 2, 0))

    return MCDisassembler::Success;

  return addOperand(Inst, MCOperand::createImm(Imm));

}


static DecodeStatus decodeSMEMOffset(MCInst &Inst, unsigned Imm, uint64_t Addr,

                                     const MCDisassembler *Decoder) {

  auto DAsm = static_cast<const AMDGPUDisassembler*>(Decoder);

  int64_t Offset;

  if (DAsm->isGFX12Plus()) { // GFX12 supports 24-bit signed offsets.

    Offset = SignExtend64<24>(Imm);

  } else if (DAsm->isVI()) { // VI supports 20-bit unsigned offsets.

    Offset = Imm & 0xFFFFF;

  } else { // GFX9+ supports 21-bit signed offsets.

    Offset = SignExtend64<21>(Imm);

  }

  return addOperand(Inst, MCOperand::createImm(Offset));

}


static DecodeStatus decodeBoolReg(MCInst &Inst, unsigned Val, uint64_t Addr,

                                  const MCDisassembler *Decoder) {

  auto DAsm = static_cast<const AMDGPUDisassembler*>(Decoder);

  return addOperand(Inst, DAsm->decodeBoolReg(Val));

}


static DecodeStatus decodeSplitBarrier(MCInst &Inst, unsigned Val,

                                       uint64_t Addr,

                                       const MCDisassembler *Decoder) {

  auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  return addOperand(Inst, DAsm->decodeSplitBarrier(Val));

}


static DecodeStatus decodeDpp8FI(MCInst &Inst, unsigned Val, uint64_t Addr,

                                 const MCDisassembler *Decoder) {

  auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  return addOperand(Inst, DAsm->decodeDpp8FI(Val));

}


#define DECODE_OPERAND(StaticDecoderName, DecoderName)                         \

  static DecodeStatus StaticDecoderName(MCInst &Inst, unsigned Imm,            \

                                        uint64_t /*Addr*/,                     \

                                        const MCDisassembler *Decoder) {       \

    auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);              \

    return addOperand(Inst, DAsm->DecoderName(Imm));                           \

  }


// Decoder for registers, decode directly using RegClassID. Imm(8-bit) is

// number of register. Used by VGPR only and AGPR only operands.

#define DECODE_OPERAND_REG_8(RegClass)                                         \

  static DecodeStatus Decode##RegClass##RegisterClass(                         \

      MCInst &Inst, unsigned Imm, uint64_t /*Addr*/,                           \

      const MCDisassembler *Decoder) {                                         \

    assert(Imm < (1 << 8) && "8-bit encoding");                                \

    auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);              \

    return addOperand(                                                         \

        Inst, DAsm->createRegOperand(AMDGPU::RegClass##RegClassID, Imm));      \

  }


#define DECODE_SrcOp(Name, EncSize, OpWidth, EncImm, MandatoryLiteral,         \

                     ImmWidth)                                                 \

  static DecodeStatus Name(MCInst &Inst, unsigned Imm, uint64_t /*Addr*/,      \

                           const MCDisassembler *Decoder) {                    \

    assert(Imm < (1 << EncSize) && #EncSize "-bit encoding");                  \

    auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);              \

    return addOperand(Inst,                                                    \

                      DAsm->decodeSrcOp(AMDGPUDisassembler::OpWidth, EncImm,   \

                                        MandatoryLiteral, ImmWidth));          \

  }


static DecodeStatus decodeSrcOp(MCInst &Inst, unsigned EncSize,

                                AMDGPUDisassembler::OpWidthTy OpWidth,

                                unsigned Imm, unsigned EncImm,

                                bool MandatoryLiteral, unsigned ImmWidth,

                                AMDGPU::OperandSemantics Sema,

                                const MCDisassembler *Decoder) {

  assert(Imm < (1U << EncSize) && "Operand doesn't fit encoding!");

  auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  return addOperand(Inst, DAsm->decodeSrcOp(OpWidth, EncImm, MandatoryLiteral,

                                            ImmWidth, Sema));

}


// Decoder for registers. Imm(7-bit) is number of register, uses decodeSrcOp to

// get register class. Used by SGPR only operands.

#define DECODE_OPERAND_REG_7(RegClass, OpWidth)                                \

  DECODE_SrcOp(Decode##RegClass##RegisterClass, 7, OpWidth, Imm, false, 0)


// Decoder for registers. Imm(10-bit): Imm{7-0} is number of register,

// Imm{9} is acc(agpr or vgpr) Imm{8} should be 0 (see VOP3Pe_SMFMAC).

// Set Imm{8} to 1 (IS_VGPR) to decode using 'enum10' from decodeSrcOp.

// Used by AV_ register classes (AGPR or VGPR only register operands).

template <AMDGPUDisassembler::OpWidthTy OpWidth>

static DecodeStatus decodeAV10(MCInst &Inst, unsigned Imm, uint64_t /* Addr */,

                               const MCDisassembler *Decoder) {

  return decodeSrcOp(Inst, 10, OpWidth, Imm, Imm | AMDGPU::EncValues::IS_VGPR,

                     false, 0, AMDGPU::OperandSemantics::INT, Decoder);

}


// Decoder for Src(9-bit encoding) registers only.

template <AMDGPUDisassembler::OpWidthTy OpWidth>

static DecodeStatus decodeSrcReg9(MCInst &Inst, unsigned Imm,

                                  uint64_t /* Addr */,

                                  const MCDisassembler *Decoder) {

  return decodeSrcOp(Inst, 9, OpWidth, Imm, Imm, false, 0,

                     AMDGPU::OperandSemantics::INT, Decoder);

}


// Decoder for Src(9-bit encoding) AGPR, register number encoded in 9bits, set

// Imm{9} to 1 (set acc) and decode using 'enum10' from decodeSrcOp, registers

// only.

template <AMDGPUDisassembler::OpWidthTy OpWidth>

static DecodeStatus decodeSrcA9(MCInst &Inst, unsigned Imm, uint64_t /* Addr */,

                                const MCDisassembler *Decoder) {

  return decodeSrcOp(Inst, 9, OpWidth, Imm, Imm | 512, false, 0,

                     AMDGPU::OperandSemantics::INT, Decoder);

}


// Decoder for 'enum10' from decodeSrcOp, Imm{0-8} is 9-bit Src encoding

// Imm{9} is acc, registers only.

template <AMDGPUDisassembler::OpWidthTy OpWidth>

static DecodeStatus decodeSrcAV10(MCInst &Inst, unsigned Imm,

                                  uint64_t /* Addr */,

                                  const MCDisassembler *Decoder) {

  return decodeSrcOp(Inst, 10, OpWidth, Imm, Imm, false, 0,

                     AMDGPU::OperandSemantics::INT, Decoder);

}


// Decoder for RegisterOperands using 9-bit Src encoding. Operand can be

// register from RegClass or immediate. Registers that don't belong to RegClass

// will be decoded and InstPrinter will report warning. Immediate will be

// decoded into constant of size ImmWidth, should match width of immediate used

// by OperandType (important for floating point types).

template <AMDGPUDisassembler::OpWidthTy OpWidth, unsigned ImmWidth,

          unsigned OperandSemantics>

static DecodeStatus decodeSrcRegOrImm9(MCInst &Inst, unsigned Imm,

                                       uint64_t /* Addr */,

                                       const MCDisassembler *Decoder) {

  return decodeSrcOp(Inst, 9, OpWidth, Imm, Imm, false, ImmWidth,

                     (AMDGPU::OperandSemantics)OperandSemantics, Decoder);

}


// Decoder for Src(9-bit encoding) AGPR or immediate. Set Imm{9} to 1 (set acc)

// and decode using 'enum10' from decodeSrcOp.

template <AMDGPUDisassembler::OpWidthTy OpWidth, unsigned ImmWidth,

          unsigned OperandSemantics>

static DecodeStatus decodeSrcRegOrImmA9(MCInst &Inst, unsigned Imm,

                                        uint64_t /* Addr */,

                                        const MCDisassembler *Decoder) {

  return decodeSrcOp(Inst, 9, OpWidth, Imm, Imm | 512, false, ImmWidth,

                     (AMDGPU::OperandSemantics)OperandSemantics, Decoder);

}


template <AMDGPUDisassembler::OpWidthTy OpWidth, unsigned ImmWidth,

          unsigned OperandSemantics>

static DecodeStatus decodeSrcRegOrImmDeferred9(MCInst &Inst, unsigned Imm,

                                               uint64_t /* Addr */,

                                               const MCDisassembler *Decoder) {

  return decodeSrcOp(Inst, 9, OpWidth, Imm, Imm, true, ImmWidth,

                     (AMDGPU::OperandSemantics)OperandSemantics, Decoder);

}


// Default decoders generated by tablegen: 'Decode<RegClass>RegisterClass'

// when RegisterClass is used as an operand. Most often used for destination

// operands.


DECODE_OPERAND_REG_8(VGPR_32)

DECODE_OPERAND_REG_8(VGPR_32_Lo128)

DECODE_OPERAND_REG_8(VReg_64)

DECODE_OPERAND_REG_8(VReg_96)

DECODE_OPERAND_REG_8(VReg_128)

DECODE_OPERAND_REG_8(VReg_256)

DECODE_OPERAND_REG_8(VReg_288)

DECODE_OPERAND_REG_8(VReg_352)

DECODE_OPERAND_REG_8(VReg_384)

DECODE_OPERAND_REG_8(VReg_512)

DECODE_OPERAND_REG_8(VReg_1024)


DECODE_OPERAND_REG_7(SReg_32, OPW32)

DECODE_OPERAND_REG_7(SReg_32_XEXEC, OPW32)

DECODE_OPERAND_REG_7(SReg_32_XM0_XEXEC, OPW32)

DECODE_OPERAND_REG_7(SReg_32_XEXEC_HI, OPW32)

DECODE_OPERAND_REG_7(SReg_64, OPW64)

DECODE_OPERAND_REG_7(SReg_64_XEXEC, OPW64)

DECODE_OPERAND_REG_7(SReg_96, OPW96)

DECODE_OPERAND_REG_7(SReg_128, OPW128)

DECODE_OPERAND_REG_7(SReg_256, OPW256)

DECODE_OPERAND_REG_7(SReg_512, OPW512)


DECODE_OPERAND_REG_8(AGPR_32)

DECODE_OPERAND_REG_8(AReg_64)

DECODE_OPERAND_REG_8(AReg_128)

DECODE_OPERAND_REG_8(AReg_256)

DECODE_OPERAND_REG_8(AReg_512)

DECODE_OPERAND_REG_8(AReg_1024)


static DecodeStatus DecodeVGPR_16RegisterClass(MCInst &Inst, unsigned Imm,

                                               uint64_t /*Addr*/,

                                               const MCDisassembler *Decoder) {

  assert(isUInt<10>(Imm) && "10-bit encoding expected");

  assert((Imm & (1 << 8)) == 0 && "Imm{8} should not be used");


  bool IsHi = Imm & (1 << 9);

  unsigned RegIdx = Imm & 0xff;

  auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  return addOperand(Inst, DAsm->createVGPR16Operand(RegIdx, IsHi));

}


static DecodeStatus

DecodeVGPR_16_Lo128RegisterClass(MCInst &Inst, unsigned Imm, uint64_t /*Addr*/,

                                 const MCDisassembler *Decoder) {

  assert(isUInt<8>(Imm) && "8-bit encoding expected");


  bool IsHi = Imm & (1 << 7);

  unsigned RegIdx = Imm & 0x7f;

  auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  return addOperand(Inst, DAsm->createVGPR16Operand(RegIdx, IsHi));

}


static DecodeStatus decodeOperand_VSrcT16_Lo128(MCInst &Inst, unsigned Imm,

                                                uint64_t /*Addr*/,

                                                const MCDisassembler *Decoder) {

  assert(isUInt<9>(Imm) && "9-bit encoding expected");


  const auto *DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  bool IsVGPR = Imm & (1 << 8);

  if (IsVGPR) {

    bool IsHi = Imm & (1 << 7);

    unsigned RegIdx = Imm & 0x7f;

    return addOperand(Inst, DAsm->createVGPR16Operand(RegIdx, IsHi));

  }

  return addOperand(Inst, DAsm->decodeNonVGPRSrcOp(AMDGPUDisassembler::OPW16,

                                                   Imm & 0xFF, false, 16));

}


static DecodeStatus decodeOperand_VSrcT16(MCInst &Inst, unsigned Imm,

                                          uint64_t /*Addr*/,

                                          const MCDisassembler *Decoder) {

  assert(isUInt<10>(Imm) && "10-bit encoding expected");


  const auto *DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  bool IsVGPR = Imm & (1 << 8);

  if (IsVGPR) {

    bool IsHi = Imm & (1 << 9);

    unsigned RegIdx = Imm & 0xff;

    return addOperand(Inst, DAsm->createVGPR16Operand(RegIdx, IsHi));

  }

  return addOperand(Inst, DAsm->decodeNonVGPRSrcOp(AMDGPUDisassembler::OPW16,

                                                   Imm & 0xFF, false, 16));

}


static DecodeStatus decodeOperand_KImmFP(MCInst &Inst, unsigned Imm,

                                         uint64_t Addr,

                                         const MCDisassembler *Decoder) {

  const auto *DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  return addOperand(Inst, DAsm->decodeMandatoryLiteralConstant(Imm));

}


static DecodeStatus decodeOperandVOPDDstY(MCInst &Inst, unsigned Val,

                                          uint64_t Addr, const void *Decoder) {

  const auto *DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  return addOperand(Inst, DAsm->decodeVOPDDstYOp(Inst, Val));

}


static bool IsAGPROperand(const MCInst &Inst, int OpIdx,

                          const MCRegisterInfo *MRI) {

  if (OpIdx < 0)

    return false;


  const MCOperand &Op = Inst.getOperand(OpIdx);

  if (!Op.isReg())

    return false;


  unsigned Sub = MRI->getSubReg(Op.getReg(), AMDGPU::sub0);

  auto Reg = Sub ? Sub : Op.getReg();

  return Reg >= AMDGPU::AGPR0 && Reg <= AMDGPU::AGPR255;

}


static DecodeStatus decodeAVLdSt(MCInst &Inst, unsigned Imm,

                                 AMDGPUDisassembler::OpWidthTy Opw,

                                 const MCDisassembler *Decoder) {

  auto DAsm = static_cast<const AMDGPUDisassembler*>(Decoder);

  if (!DAsm->isGFX90A()) {

    Imm &= 511;

  } else {

    // If atomic has both vdata and vdst their register classes are tied.

    // The bit is decoded along with the vdst, first operand. We need to

    // change register class to AGPR if vdst was AGPR.

    // If a DS instruction has both data0 and data1 their register classes

    // are also tied.

    unsigned Opc = Inst.getOpcode();

    uint64_t TSFlags = DAsm->getMCII()->get(Opc).TSFlags;

    uint16_t DataNameIdx = (TSFlags & SIInstrFlags::DS) ? AMDGPU::OpName::data0

                                                        : AMDGPU::OpName::vdata;

    const MCRegisterInfo *MRI = DAsm->getContext().getRegisterInfo();

    int DataIdx = AMDGPU::getNamedOperandIdx(Opc, DataNameIdx);

    if ((int)Inst.getNumOperands() == DataIdx) {

      int DstIdx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::vdst);

      if (IsAGPROperand(Inst, DstIdx, MRI))

        Imm |= 512;

    }


    if (TSFlags & SIInstrFlags::DS) {

      int Data2Idx = AMDGPU::getNamedOperandIdx(Opc, AMDGPU::OpName::data1);

      if ((int)Inst.getNumOperands() == Data2Idx &&

          IsAGPROperand(Inst, DataIdx, MRI))

        Imm |= 512;

    }

  }

  return addOperand(Inst, DAsm->decodeSrcOp(Opw, Imm | 256));

}


template <AMDGPUDisassembler::OpWidthTy Opw>

static DecodeStatus decodeAVLdSt(MCInst &Inst, unsigned Imm,

                                 uint64_t /* Addr */,

                                 const MCDisassembler *Decoder) {

  return decodeAVLdSt(Inst, Imm, Opw, Decoder);

}


static DecodeStatus decodeOperand_VSrc_f64(MCInst &Inst, unsigned Imm,

                                           uint64_t Addr,

                                           const MCDisassembler *Decoder) {

  assert(Imm < (1 << 9) && "9-bit encoding");

  auto DAsm = static_cast<const AMDGPUDisassembler *>(Decoder);

  return addOperand(Inst,

                    DAsm->decodeSrcOp(AMDGPUDisassembler::OPW64, Imm, false, 64,

                                      AMDGPU::OperandSemantics::FP64));

}


#define DECODE_SDWA(DecName) \

DECODE_OPERAND(decodeSDWA##DecName, decodeSDWA##DecName)


DECODE_SDWA(Src32)

DECODE_SDWA(Src16)

DECODE_SDWA(VopcDst)


#include "AMDGPUGenDisassemblerTables.inc"


//===----------------------------------------------------------------------===//

//

//===----------------------------------------------------------------------===//


template <typename T> static inline T eatBytes(ArrayRef<uint8_t>& Bytes) {

  assert(Bytes.size() >= sizeof(T));

  const auto Res =

      support::endian::read<T, llvm::endianness::little>(Bytes.data());

  Bytes = Bytes.slice(sizeof(T));

  return Res;

}


static inline DecoderUInt128 eat12Bytes(ArrayRef<uint8_t> &Bytes) {

  assert(Bytes.size() >= 12);

  uint64_t Lo =

      support::endian::read<uint64_t, llvm::endianness::little>(Bytes.data());

  Bytes = Bytes.slice(8);

  uint64_t Hi =

      support::endian::read<uint32_t, llvm::endianness::little>(Bytes.data());

  Bytes = Bytes.slice(4);

  return DecoderUInt128(Lo, Hi);

}


DecodeStatus AMDGPUDisassembler::getInstruction(MCInst &MI, uint64_t &Size,

                                                ArrayRef<uint8_t> Bytes_,

                                                uint64_t Address,

                                                raw_ostream &CS) const {

  unsigned MaxInstBytesNum = std::min((size_t)TargetMaxInstBytes, Bytes_.size());

  Bytes = Bytes_.slice(0, MaxInstBytesNum);


  // In case the opcode is not recognized we'll assume a Size of 4 bytes (unless

  // there are fewer bytes left). This will be overridden on success.

  Size = std::min((size_t)4, Bytes_.size());


  do {

    // ToDo: better to switch encoding length using some bit predicate

    // but it is unknown yet, so try all we can


    // Try to decode DPP and SDWA first to solve conflict with VOP1 and VOP2

    // encodings

    if (isGFX11Plus() && Bytes.size() >= 12 ) {

      DecoderUInt128 DecW = eat12Bytes(Bytes);


      if (isGFX11() &&

          tryDecodeInst(DecoderTableGFX1196, DecoderTableGFX11_FAKE1696, MI,

                        DecW, Address, CS))

        break;


      if (isGFX12() &&

          tryDecodeInst(DecoderTableGFX1296, DecoderTableGFX12_FAKE1696, MI,

                        DecW, Address, CS))

        break;


      if (isGFX12() &&

          tryDecodeInst(DecoderTableGFX12W6496, MI, DecW, Address, CS))

        break;

    }


    // Reinitialize Bytes

    Bytes = Bytes_.slice(0, MaxInstBytesNum);


    if (Bytes.size() >= 8) {

      const uint64_t QW = eatBytes<uint64_t>(Bytes);


      if (STI.hasFeature(AMDGPU::FeatureGFX10_BEncoding) &&

          tryDecodeInst(DecoderTableGFX10_B64, MI, QW, Address, CS))

        break;


      if (STI.hasFeature(AMDGPU::FeatureUnpackedD16VMem) &&

          tryDecodeInst(DecoderTableGFX80_UNPACKED64, MI, QW, Address, CS))

        break;


      // Some GFX9 subtargets repurposed the v_mad_mix_f32, v_mad_mixlo_f16 and

      // v_mad_mixhi_f16 for FMA variants. Try to decode using this special

      // table first so we print the correct name.

      if (STI.hasFeature(AMDGPU::FeatureFmaMixInsts) &&

          tryDecodeInst(DecoderTableGFX9_DL64, MI, QW, Address, CS))

        break;


      if (STI.hasFeature(AMDGPU::FeatureGFX940Insts) &&

          tryDecodeInst(DecoderTableGFX94064, MI, QW, Address, CS))

        break;


      if (STI.hasFeature(AMDGPU::FeatureGFX90AInsts) &&

          tryDecodeInst(DecoderTableGFX90A64, MI, QW, Address, CS))

        break;


      if ((isVI() || isGFX9()) &&

          tryDecodeInst(DecoderTableGFX864, MI, QW, Address, CS))

        break;


      if (isGFX9() && tryDecodeInst(DecoderTableGFX964, MI, QW, Address, CS))

        break;


      if (isGFX10() && tryDecodeInst(DecoderTableGFX1064, MI, QW, Address, CS))

        break;


      if (isGFX12() &&

          tryDecodeInst(DecoderTableGFX1264, DecoderTableGFX12_FAKE1664, MI, QW,

                        Address, CS))

        break;


      if (isGFX11() &&

          tryDecodeInst(DecoderTableGFX1164, DecoderTableGFX11_FAKE1664, MI, QW,

                        Address, CS))

        break;


      if (isGFX11() &&

          tryDecodeInst(DecoderTableGFX11W6464, MI, QW, Address, CS))

        break;


      if (isGFX12() &&

          tryDecodeInst(DecoderTableGFX12W6464, MI, QW, Address, CS))

        break;

    }


    // Reinitialize Bytes

    Bytes = Bytes_.slice(0, MaxInstBytesNum);


    // Try decode 32-bit instruction

    if (Bytes.size() >= 4) {

      const uint32_t DW = eatBytes<uint32_t>(Bytes);


      if ((isVI() || isGFX9()) &&

          tryDecodeInst(DecoderTableGFX832, MI, DW, Address, CS))

        break;


      if (tryDecodeInst(DecoderTableAMDGPU32, MI, DW, Address, CS))

        break;


      if (isGFX9() && tryDecodeInst(DecoderTableGFX932, MI, DW, Address, CS))

        break;


      if (STI.hasFeature(AMDGPU::FeatureGFX90AInsts) &&

          tryDecodeInst(DecoderTableGFX90A32, MI, DW, Address, CS))

        break;


      if (STI.hasFeature(AMDGPU::FeatureGFX10_BEncoding) &&

          tryDecodeInst(DecoderTableGFX10_B32, MI, DW, Address, CS))

        break;


      if (isGFX10() && tryDecodeInst(DecoderTableGFX1032, MI, DW, Address, CS))

        break;


      if (isGFX11() &&

          tryDecodeInst(DecoderTableGFX1132, DecoderTableGFX11_FAKE1632, MI, DW,

                        Address, CS))

        break;


      if (isGFX12() &&

          tryDecodeInst(DecoderTableGFX1232, DecoderTableGFX12_FAKE1632, MI, DW,

                        Address, CS))

        break;

    }


    return MCDisassembler::Fail;

  } while (false);


  if (MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::DPP) {

    if (isMacDPP(MI))

      convertMacDPPInst(MI);


    if (MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::VOP3P)

      convertVOP3PDPPInst(MI);

    else if ((MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::VOPC) ||

             AMDGPU::isVOPC64DPP(MI.getOpcode()))

      convertVOPCDPPInst(MI); // Special VOP3 case

    else if (AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::dpp8) !=

             -1)

      convertDPP8Inst(MI);

    else if (MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::VOP3)

      convertVOP3DPPInst(MI); // Regular VOP3 case

  }


  if (AMDGPU::isMAC(MI.getOpcode())) {

    // Insert dummy unused src2_modifiers.

    insertNamedMCOperand(MI, MCOperand::createImm(0),

                         AMDGPU::OpName::src2_modifiers);

  }


  if (MI.getOpcode() == AMDGPU::V_CVT_SR_BF8_F32_e64_dpp ||

      MI.getOpcode() == AMDGPU::V_CVT_SR_FP8_F32_e64_dpp) {

    // Insert dummy unused src2_modifiers.

    insertNamedMCOperand(MI, MCOperand::createImm(0),

                         AMDGPU::OpName::src2_modifiers);

  }


  if ((MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::DS) &&

      !AMDGPU::hasGDS(STI)) {

    insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::gds);

  }


  if (MCII->get(MI.getOpcode()).TSFlags &

      (SIInstrFlags::MUBUF | SIInstrFlags::FLAT | SIInstrFlags::SMRD)) {

    int CPolPos = AMDGPU::getNamedOperandIdx(MI.getOpcode(),

                                             AMDGPU::OpName::cpol);

    if (CPolPos != -1) {

      unsigned CPol =

          (MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::IsAtomicRet) ?

              AMDGPU::CPol::GLC : 0;

      if (MI.getNumOperands() <= (unsigned)CPolPos) {

        insertNamedMCOperand(MI, MCOperand::createImm(CPol),

                             AMDGPU::OpName::cpol);

      } else if (CPol) {

        MI.getOperand(CPolPos).setImm(MI.getOperand(CPolPos).getImm() | CPol);

      }

    }

  }


  if ((MCII->get(MI.getOpcode()).TSFlags &

       (SIInstrFlags::MTBUF | SIInstrFlags::MUBUF)) &&

      (STI.hasFeature(AMDGPU::FeatureGFX90AInsts))) {

    // GFX90A lost TFE, its place is occupied by ACC.

    int TFEOpIdx =

        AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::tfe);

    if (TFEOpIdx != -1) {

      auto TFEIter = MI.begin();

      std::advance(TFEIter, TFEOpIdx);

      MI.insert(TFEIter, MCOperand::createImm(0));

    }

  }


  if (MCII->get(MI.getOpcode()).TSFlags &

      (SIInstrFlags::MTBUF | SIInstrFlags::MUBUF)) {

    int SWZOpIdx =

        AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::swz);

    if (SWZOpIdx != -1) {

      auto SWZIter = MI.begin();

      std::advance(SWZIter, SWZOpIdx);

      MI.insert(SWZIter, MCOperand::createImm(0));

    }

  }


  if (MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::MIMG) {

    int VAddr0Idx =

        AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::vaddr0);

    int RsrcIdx =

        AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::srsrc);

    unsigned NSAArgs = RsrcIdx - VAddr0Idx - 1;

    if (VAddr0Idx >= 0 && NSAArgs > 0) {

      unsigned NSAWords = (NSAArgs + 3) / 4;

      if (Bytes.size() < 4 * NSAWords)

        return MCDisassembler::Fail;

      for (unsigned i = 0; i < NSAArgs; ++i) {

        const unsigned VAddrIdx = VAddr0Idx + 1 + i;

        auto VAddrRCID =

            MCII->get(MI.getOpcode()).operands()[VAddrIdx].RegClass;

        MI.insert(MI.begin() + VAddrIdx, createRegOperand(VAddrRCID, Bytes[i]));

      }

      Bytes = Bytes.slice(4 * NSAWords);

    }


    convertMIMGInst(MI);

  }


  if (MCII->get(MI.getOpcode()).TSFlags &

      (SIInstrFlags::VIMAGE | SIInstrFlags::VSAMPLE))

    convertMIMGInst(MI);


  if (MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::EXP)

    convertEXPInst(MI);


  if (MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::VINTERP)

    convertVINTERPInst(MI);


  if (MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::SDWA)

    convertSDWAInst(MI);


  int VDstIn_Idx = AMDGPU::getNamedOperandIdx(MI.getOpcode(),

                                              AMDGPU::OpName::vdst_in);

  if (VDstIn_Idx != -1) {

    int Tied = MCII->get(MI.getOpcode()).getOperandConstraint(VDstIn_Idx,

                           MCOI::OperandConstraint::TIED_TO);

    if (Tied != -1 && (MI.getNumOperands() <= (unsigned)VDstIn_Idx ||

         !MI.getOperand(VDstIn_Idx).isReg() ||

         MI.getOperand(VDstIn_Idx).getReg() != MI.getOperand(Tied).getReg())) {

      if (MI.getNumOperands() > (unsigned)VDstIn_Idx)

        MI.erase(&MI.getOperand(VDstIn_Idx));

      insertNamedMCOperand(MI,

        MCOperand::createReg(MI.getOperand(Tied).getReg()),

        AMDGPU::OpName::vdst_in);

    }

  }


  int ImmLitIdx =

      AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::imm);

  bool IsSOPK = MCII->get(MI.getOpcode()).TSFlags & SIInstrFlags::SOPK;

  if (ImmLitIdx != -1 && !IsSOPK)

    convertFMAanyK(MI, ImmLitIdx);


  Size = MaxInstBytesNum - Bytes.size();

  return MCDisassembler::Success;

}


void AMDGPUDisassembler::convertEXPInst(MCInst &MI) const {

  if (STI.hasFeature(AMDGPU::FeatureGFX11Insts)) {

    // The MCInst still has these fields even though they are no longer encoded

    // in the GFX11 instruction.

    insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::vm);

    insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::compr);

  }

}


void AMDGPUDisassembler::convertVINTERPInst(MCInst &MI) const {

  if (MI.getOpcode() == AMDGPU::V_INTERP_P10_F16_F32_inreg_gfx11 ||

      MI.getOpcode() == AMDGPU::V_INTERP_P10_F16_F32_inreg_gfx12 ||

      MI.getOpcode() == AMDGPU::V_INTERP_P10_RTZ_F16_F32_inreg_gfx11 ||

      MI.getOpcode() == AMDGPU::V_INTERP_P10_RTZ_F16_F32_inreg_gfx12 ||

      MI.getOpcode() == AMDGPU::V_INTERP_P2_F16_F32_inreg_gfx11 ||

      MI.getOpcode() == AMDGPU::V_INTERP_P2_F16_F32_inreg_gfx12 ||

      MI.getOpcode() == AMDGPU::V_INTERP_P2_RTZ_F16_F32_inreg_gfx11 ||

      MI.getOpcode() == AMDGPU::V_INTERP_P2_RTZ_F16_F32_inreg_gfx12) {

    // The MCInst has this field that is not directly encoded in the

    // instruction.

    insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::op_sel);

  }

}


void AMDGPUDisassembler::convertSDWAInst(MCInst &MI) const {

  if (STI.hasFeature(AMDGPU::FeatureGFX9) ||

      STI.hasFeature(AMDGPU::FeatureGFX10)) {

    if (AMDGPU::hasNamedOperand(MI.getOpcode(), AMDGPU::OpName::sdst))

      // VOPC - insert clamp

      insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::clamp);

  } else if (STI.hasFeature(AMDGPU::FeatureVolcanicIslands)) {

    int SDst = AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::sdst);

    if (SDst != -1) {

      // VOPC - insert VCC register as sdst

      insertNamedMCOperand(MI, createRegOperand(AMDGPU::VCC),

                           AMDGPU::OpName::sdst);

    } else {

      // VOP1/2 - insert omod if present in instruction

      insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::omod);

    }

  }

}


struct VOPModifiers {

  unsigned OpSel = 0;

  unsigned OpSelHi = 0;

  unsigned NegLo = 0;

  unsigned NegHi = 0;

};


// Reconstruct values of VOP3/VOP3P operands such as op_sel.

// Note that these values do not affect disassembler output,

// so this is only necessary for consistency with src_modifiers.

static VOPModifiers collectVOPModifiers(const MCInst &MI,

                                        bool IsVOP3P = false) {

  VOPModifiers Modifiers;

  unsigned Opc = MI.getOpcode();

  const int ModOps[] = {AMDGPU::OpName::src0_modifiers,

                        AMDGPU::OpName::src1_modifiers,

                        AMDGPU::OpName::src2_modifiers};

  for (int J = 0; J < 3; ++J) {

    int OpIdx = AMDGPU::getNamedOperandIdx(Opc, ModOps[J]);

    if (OpIdx == -1)

      continue;


    unsigned Val = MI.getOperand(OpIdx).getImm();


    Modifiers.OpSel |= !!(Val & SISrcMods::OP_SEL_0) << J;

    if (IsVOP3P) {

      Modifiers.OpSelHi |= !!(Val & SISrcMods::OP_SEL_1) << J;

      Modifiers.NegLo |= !!(Val & SISrcMods::NEG) << J;

      Modifiers.NegHi |= !!(Val & SISrcMods::NEG_HI) << J;

    } else if (J == 0) {

      Modifiers.OpSel |= !!(Val & SISrcMods::DST_OP_SEL) << 3;

    }

  }


  return Modifiers;

}


// Instructions decode the op_sel/suffix bits into the src_modifier

// operands. Copy those bits into the src operands for true16 VGPRs.

void AMDGPUDisassembler::convertTrue16OpSel(MCInst &MI) const {

  const unsigned Opc = MI.getOpcode();

  const MCRegisterClass &ConversionRC =

      MRI.getRegClass(AMDGPU::VGPR_16RegClassID);

  constexpr std::array<std::tuple<int, int, unsigned>, 4> OpAndOpMods = {

      {{AMDGPU::OpName::src0, AMDGPU::OpName::src0_modifiers,

        SISrcMods::OP_SEL_0},

       {AMDGPU::OpName::src1, AMDGPU::OpName::src1_modifiers,

        SISrcMods::OP_SEL_0},

       {AMDGPU::OpName::src2, AMDGPU::OpName::src2_modifiers,

        SISrcMods::OP_SEL_0},

       {AMDGPU::OpName::vdst, AMDGPU::OpName::src0_modifiers,

        SISrcMods::DST_OP_SEL}}};

  for (const auto &[OpName, OpModsName, OpSelMask] : OpAndOpMods) {

    int OpIdx = AMDGPU::getNamedOperandIdx(Opc, OpName);

    int OpModsIdx = AMDGPU::getNamedOperandIdx(Opc, OpModsName);

    if (OpIdx == -1 || OpModsIdx == -1)

      continue;

    MCOperand &Op = MI.getOperand(OpIdx);

    if (!Op.isReg())

      continue;

    if (!ConversionRC.contains(Op.getReg()))

      continue;

    unsigned OpEnc = MRI.getEncodingValue(Op.getReg());

    const MCOperand &OpMods = MI.getOperand(OpModsIdx);

    unsigned ModVal = OpMods.getImm();

    if (ModVal & OpSelMask) { // isHi

      unsigned RegIdx = OpEnc & AMDGPU::HWEncoding::REG_IDX_MASK;

      Op.setReg(ConversionRC.getRegister(RegIdx * 2 + 1));

    }

  }

}


// MAC opcodes have special old and src2 operands.

// src2 is tied to dst, while old is not tied (but assumed to be).

bool AMDGPUDisassembler::isMacDPP(MCInst &MI) const {

  constexpr int DST_IDX = 0;

  auto Opcode = MI.getOpcode();

  const auto &Desc = MCII->get(Opcode);

  auto OldIdx = AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::old);


  if (OldIdx != -1 && Desc.getOperandConstraint(

                          OldIdx, MCOI::OperandConstraint::TIED_TO) == -1) {

    assert(AMDGPU::hasNamedOperand(Opcode, AMDGPU::OpName::src2));

    assert(Desc.getOperandConstraint(

               AMDGPU::getNamedOperandIdx(Opcode, AMDGPU::OpName::src2),

               MCOI::OperandConstraint::TIED_TO) == DST_IDX);

    (void)DST_IDX;

    return true;

  }


  return false;

}


// Create dummy old operand and insert dummy unused src2_modifiers

void AMDGPUDisassembler::convertMacDPPInst(MCInst &MI) const {

  assert(MI.getNumOperands() + 1 < MCII->get(MI.getOpcode()).getNumOperands());

  insertNamedMCOperand(MI, MCOperand::createReg(0), AMDGPU::OpName::old);

  insertNamedMCOperand(MI, MCOperand::createImm(0),

                       AMDGPU::OpName::src2_modifiers);

}


void AMDGPUDisassembler::convertDPP8Inst(MCInst &MI) const {

  unsigned Opc = MI.getOpcode();


  int VDstInIdx =

      AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::vdst_in);

  if (VDstInIdx != -1)

    insertNamedMCOperand(MI, MI.getOperand(0), AMDGPU::OpName::vdst_in);


  unsigned DescNumOps = MCII->get(Opc).getNumOperands();

  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::op_sel)) {

    convertTrue16OpSel(MI);

    auto Mods = collectVOPModifiers(MI);

    insertNamedMCOperand(MI, MCOperand::createImm(Mods.OpSel),

                         AMDGPU::OpName::op_sel);

  } else {

    // Insert dummy unused src modifiers.

    if (MI.getNumOperands() < DescNumOps &&

        AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::src0_modifiers))

      insertNamedMCOperand(MI, MCOperand::createImm(0),

                           AMDGPU::OpName::src0_modifiers);


    if (MI.getNumOperands() < DescNumOps &&

        AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::src1_modifiers))

      insertNamedMCOperand(MI, MCOperand::createImm(0),

                           AMDGPU::OpName::src1_modifiers);

  }

}


void AMDGPUDisassembler::convertVOP3DPPInst(MCInst &MI) const {

  convertTrue16OpSel(MI);


  int VDstInIdx =

      AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::vdst_in);

  if (VDstInIdx != -1)

    insertNamedMCOperand(MI, MI.getOperand(0), AMDGPU::OpName::vdst_in);


  unsigned Opc = MI.getOpcode();

  unsigned DescNumOps = MCII->get(Opc).getNumOperands();

  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::op_sel)) {

    auto Mods = collectVOPModifiers(MI);

    insertNamedMCOperand(MI, MCOperand::createImm(Mods.OpSel),

                         AMDGPU::OpName::op_sel);

  }

}


// Note that before gfx10, the MIMG encoding provided no information about

// VADDR size. Consequently, decoded instructions always show address as if it

// has 1 dword, which could be not really so.

void AMDGPUDisassembler::convertMIMGInst(MCInst &MI) const {

  auto TSFlags = MCII->get(MI.getOpcode()).TSFlags;


  int VDstIdx = AMDGPU::getNamedOperandIdx(MI.getOpcode(),

                                           AMDGPU::OpName::vdst);


  int VDataIdx = AMDGPU::getNamedOperandIdx(MI.getOpcode(),

                                            AMDGPU::OpName::vdata);

  int VAddr0Idx =

      AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::vaddr0);

  int RsrcOpName = TSFlags & SIInstrFlags::MIMG ? AMDGPU::OpName::srsrc

                                                : AMDGPU::OpName::rsrc;

  int RsrcIdx = AMDGPU::getNamedOperandIdx(MI.getOpcode(), RsrcOpName);

  int DMaskIdx = AMDGPU::getNamedOperandIdx(MI.getOpcode(),

                                            AMDGPU::OpName::dmask);


  int TFEIdx   = AMDGPU::getNamedOperandIdx(MI.getOpcode(),

                                            AMDGPU::OpName::tfe);

  int D16Idx   = AMDGPU::getNamedOperandIdx(MI.getOpcode(),

                                            AMDGPU::OpName::d16);


  const AMDGPU::MIMGInfo *Info = AMDGPU::getMIMGInfo(MI.getOpcode());

  const AMDGPU::MIMGBaseOpcodeInfo *BaseOpcode =

      AMDGPU::getMIMGBaseOpcodeInfo(Info->BaseOpcode);


  assert(VDataIdx != -1);

  if (BaseOpcode->BVH) {

    // Add A16 operand for intersect_ray instructions

    addOperand(MI, MCOperand::createImm(BaseOpcode->A16));

    return;

  }


  bool IsAtomic = (VDstIdx != -1);

  bool IsGather4 = TSFlags & SIInstrFlags::Gather4;

  bool IsVSample = TSFlags & SIInstrFlags::VSAMPLE;

  bool IsNSA = false;

  bool IsPartialNSA = false;

  unsigned AddrSize = Info->VAddrDwords;


  if (isGFX10Plus()) {

    unsigned DimIdx =

        AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::dim);

    int A16Idx =

        AMDGPU::getNamedOperandIdx(MI.getOpcode(), AMDGPU::OpName::a16);

    const AMDGPU::MIMGDimInfo *Dim =

        AMDGPU::getMIMGDimInfoByEncoding(MI.getOperand(DimIdx).getImm());

    const bool IsA16 = (A16Idx != -1 && MI.getOperand(A16Idx).getImm());


    AddrSize =

        AMDGPU::getAddrSizeMIMGOp(BaseOpcode, Dim, IsA16, AMDGPU::hasG16(STI));


    // VSAMPLE insts that do not use vaddr3 behave the same as NSA forms.

    // VIMAGE insts other than BVH never use vaddr4.

    IsNSA = Info->MIMGEncoding == AMDGPU::MIMGEncGfx10NSA ||

            Info->MIMGEncoding == AMDGPU::MIMGEncGfx11NSA ||

            Info->MIMGEncoding == AMDGPU::MIMGEncGfx12;

    if (!IsNSA) {

      if (!IsVSample && AddrSize > 12)

        AddrSize = 16;

    } else {

      if (AddrSize > Info->VAddrDwords) {

        if (!STI.hasFeature(AMDGPU::FeaturePartialNSAEncoding)) {

          // The NSA encoding does not contain enough operands for the

          // combination of base opcode / dimension. Should this be an error?

          return;

        }

        IsPartialNSA = true;

      }

    }

  }


  unsigned DMask = MI.getOperand(DMaskIdx).getImm() & 0xf;

  unsigned DstSize = IsGather4 ? 4 : std::max(llvm::popcount(DMask), 1);


  bool D16 = D16Idx >= 0 && MI.getOperand(D16Idx).getImm();

  if (D16 && AMDGPU::hasPackedD16(STI)) {

    DstSize = (DstSize + 1) / 2;

  }


  if (TFEIdx != -1 && MI.getOperand(TFEIdx).getImm())

    DstSize += 1;


  if (DstSize == Info->VDataDwords && AddrSize == Info->VAddrDwords)

    return;


  int NewOpcode =

      AMDGPU::getMIMGOpcode(Info->BaseOpcode, Info->MIMGEncoding, DstSize, AddrSize);

  if (NewOpcode == -1)

    return;


  // Widen the register to the correct number of enabled channels.

  unsigned NewVdata = AMDGPU::NoRegister;

  if (DstSize != Info->VDataDwords) {

    auto DataRCID = MCII->get(NewOpcode).operands()[VDataIdx].RegClass;


    // Get first subregister of VData

    unsigned Vdata0 = MI.getOperand(VDataIdx).getReg();

    unsigned VdataSub0 = MRI.getSubReg(Vdata0, AMDGPU::sub0);

    Vdata0 = (VdataSub0 != 0)? VdataSub0 : Vdata0;


    NewVdata = MRI.getMatchingSuperReg(Vdata0, AMDGPU::sub0,

                                       &MRI.getRegClass(DataRCID));

    if (NewVdata == AMDGPU::NoRegister) {

      // It's possible to encode this such that the low register + enabled

      // components exceeds the register count.

      return;

    }

  }


  // If not using NSA on GFX10+, widen vaddr0 address register to correct size.

  // If using partial NSA on GFX11+ widen last address register.

  int VAddrSAIdx = IsPartialNSA ? (RsrcIdx - 1) : VAddr0Idx;

  unsigned NewVAddrSA = AMDGPU::NoRegister;

  if (STI.hasFeature(AMDGPU::FeatureNSAEncoding) && (!IsNSA || IsPartialNSA) &&

      AddrSize != Info->VAddrDwords) {

    unsigned VAddrSA = MI.getOperand(VAddrSAIdx).getReg();

    unsigned VAddrSubSA = MRI.getSubReg(VAddrSA, AMDGPU::sub0);

    VAddrSA = VAddrSubSA ? VAddrSubSA : VAddrSA;


    auto AddrRCID = MCII->get(NewOpcode).operands()[VAddrSAIdx].RegClass;

    NewVAddrSA = MRI.getMatchingSuperReg(VAddrSA, AMDGPU::sub0,

                                        &MRI.getRegClass(AddrRCID));

    if (!NewVAddrSA)

      return;

  }


  MI.setOpcode(NewOpcode);


  if (NewVdata != AMDGPU::NoRegister) {

    MI.getOperand(VDataIdx) = MCOperand::createReg(NewVdata);


    if (IsAtomic) {

      // Atomic operations have an additional operand (a copy of data)

      MI.getOperand(VDstIdx) = MCOperand::createReg(NewVdata);

    }

  }


  if (NewVAddrSA) {

    MI.getOperand(VAddrSAIdx) = MCOperand::createReg(NewVAddrSA);

  } else if (IsNSA) {

    assert(AddrSize <= Info->VAddrDwords);

    MI.erase(MI.begin() + VAddr0Idx + AddrSize,

             MI.begin() + VAddr0Idx + Info->VAddrDwords);

  }

}


// Opsel and neg bits are used in src_modifiers and standalone operands. Autogen

// decoder only adds to src_modifiers, so manually add the bits to the other

// operands.

void AMDGPUDisassembler::convertVOP3PDPPInst(MCInst &MI) const {

  unsigned Opc = MI.getOpcode();

  unsigned DescNumOps = MCII->get(Opc).getNumOperands();

  auto Mods = collectVOPModifiers(MI, true);


  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::vdst_in))

    insertNamedMCOperand(MI, MCOperand::createImm(0), AMDGPU::OpName::vdst_in);


  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::op_sel))

    insertNamedMCOperand(MI, MCOperand::createImm(Mods.OpSel),

                         AMDGPU::OpName::op_sel);

  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::op_sel_hi))

    insertNamedMCOperand(MI, MCOperand::createImm(Mods.OpSelHi),

                         AMDGPU::OpName::op_sel_hi);

  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::neg_lo))

    insertNamedMCOperand(MI, MCOperand::createImm(Mods.NegLo),

                         AMDGPU::OpName::neg_lo);

  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::neg_hi))

    insertNamedMCOperand(MI, MCOperand::createImm(Mods.NegHi),

                         AMDGPU::OpName::neg_hi);

}


// Create dummy old operand and insert optional operands

void AMDGPUDisassembler::convertVOPCDPPInst(MCInst &MI) const {

  unsigned Opc = MI.getOpcode();

  unsigned DescNumOps = MCII->get(Opc).getNumOperands();


  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::old))

    insertNamedMCOperand(MI, MCOperand::createReg(0), AMDGPU::OpName::old);


  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::src0_modifiers))

    insertNamedMCOperand(MI, MCOperand::createImm(0),

                         AMDGPU::OpName::src0_modifiers);


  if (MI.getNumOperands() < DescNumOps &&

      AMDGPU::hasNamedOperand(Opc, AMDGPU::OpName::src1_modifiers))

    insertNamedMCOperand(MI, MCOperand::createImm(0),

                         AMDGPU::OpName::src1_modifiers);

}


void AMDGPUDisassembler::convertFMAanyK(MCInst &MI, int ImmLitIdx) const {

  assert(HasLiteral && "Should have decoded a literal");

  const MCInstrDesc &Desc = MCII->get(MI.getOpcode());

  unsigned DescNumOps = Desc.getNumOperands();

  insertNamedMCOperand(MI, MCOperand::createImm(Literal),

                       AMDGPU::OpName::immDeferred);

  assert(DescNumOps == MI.getNumOperands());

  for (unsigned I = 0; I < DescNumOps; ++I) {

    auto &Op = MI.getOperand(I);

    auto OpType = Desc.operands()[I].OperandType;

    bool IsDeferredOp = (OpType == AMDGPU::OPERAND_REG_IMM_FP32_DEFERRED ||

                         OpType == AMDGPU::OPERAND_REG_IMM_FP16_DEFERRED);

    if (Op.isImm() && Op.getImm() == AMDGPU::EncValues::LITERAL_CONST &&

        IsDeferredOp)

      Op.setImm(Literal);

  }

}


const char* AMDGPUDisassembler::getRegClassName(unsigned RegClassID) const {

  return getContext().getRegisterInfo()->

    getRegClassName(&AMDGPUMCRegisterClasses[RegClassID]);

}


inline

MCOperand AMDGPUDisassembler::errOperand(unsigned V,

                                         const Twine& ErrMsg) const {

  *CommentStream << "Error: " + ErrMsg;


  // ToDo: add support for error operands to MCInst.h

  // return MCOperand::createError(V);

  return MCOperand();

}


inline

MCOperand AMDGPUDisassembler::createRegOperand(unsigned int RegId) const {

  return MCOperand::createReg(AMDGPU::getMCReg(RegId, STI));

}


inline

MCOperand AMDGPUDisassembler::createRegOperand(unsigned RegClassID,

                                               unsigned Val) const {

  const auto& RegCl = AMDGPUMCRegisterClasses[RegClassID];

  if (Val >= RegCl.getNumRegs())

    return errOperand(Val, Twine(getRegClassName(RegClassID)) +

                           ": unknown register " + Twine(Val));

  return createRegOperand(RegCl.getRegister(Val));

}


inline

MCOperand AMDGPUDisassembler::createSRegOperand(unsigned SRegClassID,

                                                unsigned Val) const {

  // ToDo: SI/CI have 104 SGPRs, VI - 102

  // Valery: here we accepting as much as we can, let assembler sort it out

  int shift = 0;

  switch (SRegClassID) {

  case AMDGPU::SGPR_32RegClassID:

  case AMDGPU::TTMP_32RegClassID:

    break;

  case AMDGPU::SGPR_64RegClassID:

  case AMDGPU::TTMP_64RegClassID:

    shift = 1;

    break;

  case AMDGPU::SGPR_96RegClassID:

  case AMDGPU::TTMP_96RegClassID:

  case AMDGPU::SGPR_128RegClassID:

  case AMDGPU::TTMP_128RegClassID:

  // ToDo: unclear if s[100:104] is available on VI. Can we use VCC as SGPR in

  // this bundle?

  case AMDGPU::SGPR_256RegClassID:

  case AMDGPU::TTMP_256RegClassID:

    // ToDo: unclear if s[96:104] is available on VI. Can we use VCC as SGPR in

  // this bundle?

  case AMDGPU::SGPR_288RegClassID:

  case AMDGPU::TTMP_288RegClassID:

  case AMDGPU::SGPR_320RegClassID:

  case AMDGPU::TTMP_320RegClassID:

  case AMDGPU::SGPR_352RegClassID:

  case AMDGPU::TTMP_352RegClassID:

  case AMDGPU::SGPR_384RegClassID:

  case AMDGPU::TTMP_384RegClassID:

  case AMDGPU::SGPR_512RegClassID:

  case AMDGPU::TTMP_512RegClassID:

    shift = 2;

    break;

  // ToDo: unclear if s[88:104] is available on VI. Can we use VCC as SGPR in

  // this bundle?

  default:

    llvm_unreachable("unhandled register class");

  }


  if (Val % (1 << shift)) {

    *CommentStream << "Warning: " << getRegClassName(SRegClassID)

                   << ": scalar reg isn't aligned " << Val;

  }


  return createRegOperand(SRegClassID, Val >> shift);

}


MCOperand AMDGPUDisassembler::createVGPR16Operand(unsigned RegIdx,

                                                  bool IsHi) const {

  unsigned RegIdxInVGPR16 = RegIdx * 2 + (IsHi ? 1 : 0);

  return createRegOperand(AMDGPU::VGPR_16RegClassID, RegIdxInVGPR16);

}


// Decode Literals for insts which always have a literal in the encoding

MCOperand

AMDGPUDisassembler::decodeMandatoryLiteralConstant(unsigned Val) const {

  if (HasLiteral) {

    assert(

        AMDGPU::hasVOPD(STI) &&

        "Should only decode multiple kimm with VOPD, check VSrc operand types");

    if (Literal != Val)

      return errOperand(Val, "More than one unique literal is illegal");

  }

  HasLiteral = true;

  Literal = Val;

  return MCOperand::createImm(Literal);

}


MCOperand AMDGPUDisassembler::decodeLiteralConstant(bool ExtendFP64) const {

  // For now all literal constants are supposed to be unsigned integer

  // ToDo: deal with signed/unsigned 64-bit integer constants

  // ToDo: deal with float/double constants

  if (!HasLiteral) {

    if (Bytes.size() < 4) {

      return errOperand(0, "cannot read literal, inst bytes left " +

                        Twine(Bytes.size()));

    }

    HasLiteral = true;

    Literal = Literal64 = eatBytes<uint32_t>(Bytes);

    if (ExtendFP64)

      Literal64 <<= 32;

  }

  return MCOperand::createImm(ExtendFP64 ? Literal64 : Literal);

}


MCOperand AMDGPUDisassembler::decodeIntImmed(unsigned Imm) {

  using namespace AMDGPU::EncValues;


  assert(Imm >= INLINE_INTEGER_C_MIN && Imm <= INLINE_INTEGER_C_MAX);

  return MCOperand::createImm((Imm <= INLINE_INTEGER_C_POSITIVE_MAX) ?

    (static_cast<int64_t>(Imm) - INLINE_INTEGER_C_MIN) :

    (INLINE_INTEGER_C_POSITIVE_MAX - static_cast<int64_t>(Imm)));

      // Cast prevents negative overflow.

}


static int64_t getInlineImmVal32(unsigned Imm) {

  switch (Imm) {

  case 240:

    return llvm::bit_cast<uint32_t>(0.5f);

  case 241:

    return llvm::bit_cast<uint32_t>(-0.5f);

  case 242:

    return llvm::bit_cast<uint32_t>(1.0f);

  case 243:

    return llvm::bit_cast<uint32_t>(-1.0f);

  case 244:

    return llvm::bit_cast<uint32_t>(2.0f);

  case 245:

    return llvm::bit_cast<uint32_t>(-2.0f);

  case 246:

    return llvm::bit_cast<uint32_t>(4.0f);

  case 247:

    return llvm::bit_cast<uint32_t>(-4.0f);

  case 248: // 1 / (2 * PI)

    return 0x3e22f983;

  default:

    llvm_unreachable("invalid fp inline imm");

  }

}


static int64_t getInlineImmVal64(unsigned Imm) {

  switch (Imm) {

  case 240:

    return llvm::bit_cast<uint64_t>(0.5);

  case 241:

    return llvm::bit_cast<uint64_t>(-0.5);

  case 242:

    return llvm::bit_cast<uint64_t>(1.0);

  case 243:

    return llvm::bit_cast<uint64_t>(-1.0);

  case 244:

    return llvm::bit_cast<uint64_t>(2.0);

  case 245:

    return llvm::bit_cast<uint64_t>(-2.0);

  case 246:

    return llvm::bit_cast<uint64_t>(4.0);

  case 247:

    return llvm::bit_cast<uint64_t>(-4.0);

  case 248: // 1 / (2 * PI)

    return 0x3fc45f306dc9c882;

  default:

    llvm_unreachable("invalid fp inline imm");

  }

}


static int64_t getInlineImmValF16(unsigned Imm) {

  switch (Imm) {

  case 240:

    return 0x3800;

  case 241:

    return 0xB800;

  case 242:

    return 0x3C00;

  case 243:

    return 0xBC00;

  case 244:

    return 0x4000;

  case 245:

    return 0xC000;

  case 246:

    return 0x4400;

  case 247:

    return 0xC400;

  case 248: // 1 / (2 * PI)

    return 0x3118;

  default:

    llvm_unreachable("invalid fp inline imm");

  }

}


static int64_t getInlineImmValBF16(unsigned Imm) {

  switch (Imm) {

  case 240:

    return 0x3F00;

  case 241:

    return 0xBF00;

  case 242:

    return 0x3F80;

  case 243:

    return 0xBF80;

  case 244:

    return 0x4000;

  case 245:

    return 0xC000;

  case 246:

    return 0x4080;

  case 247:

    return 0xC080;

  case 248: // 1 / (2 * PI)

    return 0x3E22;

  default:

    llvm_unreachable("invalid fp inline imm");

  }

}


static int64_t getInlineImmVal16(unsigned Imm, AMDGPU::OperandSemantics Sema) {

  return (Sema == AMDGPU::OperandSemantics::BF16) ? getInlineImmValBF16(Imm)

                                                  : getInlineImmValF16(Imm);

}


MCOperand AMDGPUDisassembler::decodeFPImmed(unsigned ImmWidth, unsigned Imm,

                                            AMDGPU::OperandSemantics Sema) {

  assert(Imm >= AMDGPU::EncValues::INLINE_FLOATING_C_MIN &&

         Imm <= AMDGPU::EncValues::INLINE_FLOATING_C_MAX);


  // ToDo: case 248: 1/(2*PI) - is allowed only on VI

  // ImmWidth 0 is a default case where operand should not allow immediates.

  // Imm value is still decoded into 32 bit immediate operand, inst printer will

  // use it to print verbose error message.

  switch (ImmWidth) {

  case 0:

  case 32:

    return MCOperand::createImm(getInlineImmVal32(Imm));

  case 64:

    return MCOperand::createImm(getInlineImmVal64(Imm));

  case 16:

    return MCOperand::createImm(getInlineImmVal16(Imm, Sema));

  default:

    llvm_unreachable("implement me");

  }

}


unsigned AMDGPUDisassembler::getVgprClassId(const OpWidthTy Width) const {

  using namespace AMDGPU;


  assert(OPW_FIRST_ <= Width && Width < OPW_LAST_);

  switch (Width) {

  default: // fall

  case OPW32:

  case OPW16:

  case OPWV216:

    return VGPR_32RegClassID;

  case OPW64:

  case OPWV232: return VReg_64RegClassID;

  case OPW96: return VReg_96RegClassID;

  case OPW128: return VReg_128RegClassID;

  case OPW160: return VReg_160RegClassID;

  case OPW256: return VReg_256RegClassID;

  case OPW288: return VReg_288RegClassID;

  case OPW320: return VReg_320RegClassID;

  case OPW352: return VReg_352RegClassID;

  case OPW384: return VReg_384RegClassID;

  case OPW512: return VReg_512RegClassID;

  case OPW1024: return VReg_1024RegClassID;

  }

}


unsigned AMDGPUDisassembler::getAgprClassId(const OpWidthTy Width) const {

  using namespace AMDGPU;


  assert(OPW_FIRST_ <= Width && Width < OPW_LAST_);

  switch (Width) {

  default: // fall

  case OPW32:

  case OPW16:

  case OPWV216:

    return AGPR_32RegClassID;

  case OPW64:

  case OPWV232: return AReg_64RegClassID;

  case OPW96: return AReg_96RegClassID;

  case OPW128: return AReg_128RegClassID;

  case OPW160: return AReg_160RegClassID;

  case OPW256: return AReg_256RegClassID;

  case OPW288: return AReg_288RegClassID;

  case OPW320: return AReg_320RegClassID;

  case OPW352: return AReg_352RegClassID;

  case OPW384: return AReg_384RegClassID;

  case OPW512: return AReg_512RegClassID;

  case OPW1024: return AReg_1024RegClassID;

  }

}


unsigned AMDGPUDisassembler::getSgprClassId(const OpWidthTy Width) const {

  using namespace AMDGPU;


  assert(OPW_FIRST_ <= Width && Width < OPW_LAST_);

  switch (Width) {

  default: // fall

  case OPW32:

  case OPW16:

  case OPWV216:

    return SGPR_32RegClassID;

  case OPW64:

  case OPWV232: return SGPR_64RegClassID;

  case OPW96: return SGPR_96RegClassID;

  case OPW128: return SGPR_128RegClassID;

  case OPW160: return SGPR_160RegClassID;

  case OPW256: return SGPR_256RegClassID;

  case OPW288: return SGPR_288RegClassID;

  case OPW320: return SGPR_320RegClassID;

  case OPW352: return SGPR_352RegClassID;

  case OPW384: return SGPR_384RegClassID;

  case OPW512: return SGPR_512RegClassID;

  }

}


unsigned AMDGPUDisassembler::getTtmpClassId(const OpWidthTy Width) const {

  using namespace AMDGPU;


  assert(OPW_FIRST_ <= Width && Width < OPW_LAST_);

  switch (Width) {

  default: // fall

  case OPW32:

  case OPW16:

  case OPWV216:

    return TTMP_32RegClassID;

  case OPW64:

  case OPWV232: return TTMP_64RegClassID;

  case OPW128: return TTMP_128RegClassID;

  case OPW256: return TTMP_256RegClassID;

  case OPW288: return TTMP_288RegClassID;

  case OPW320: return TTMP_320RegClassID;

  case OPW352: return TTMP_352RegClassID;

  case OPW384: return TTMP_384RegClassID;

  case OPW512: return TTMP_512RegClassID;

  }

}


int AMDGPUDisassembler::getTTmpIdx(unsigned Val) const {

  using namespace AMDGPU::EncValues;


  unsigned TTmpMin = isGFX9Plus() ? TTMP_GFX9PLUS_MIN : TTMP_VI_MIN;

  unsigned TTmpMax = isGFX9Plus() ? TTMP_GFX9PLUS_MAX : TTMP_VI_MAX;


  return (TTmpMin <= Val && Val <= TTmpMax)? Val - TTmpMin : -1;

}


MCOperand AMDGPUDisassembler::decodeSrcOp(const OpWidthTy Width, unsigned Val,

                                          bool MandatoryLiteral,

                                          unsigned ImmWidth,

                                          AMDGPU::OperandSemantics Sema) const {

  using namespace AMDGPU::EncValues;


  assert(Val < 1024); // enum10


  bool IsAGPR = Val & 512;

  Val &= 511;


  if (VGPR_MIN <= Val && Val <= VGPR_MAX) {

    return createRegOperand(IsAGPR ? getAgprClassId(Width)

                                   : getVgprClassId(Width), Val - VGPR_MIN);

  }

  return decodeNonVGPRSrcOp(Width, Val & 0xFF, MandatoryLiteral, ImmWidth,

                            Sema);

}


MCOperand

AMDGPUDisassembler::decodeNonVGPRSrcOp(const OpWidthTy Width, unsigned Val,

                                       bool MandatoryLiteral, unsigned ImmWidth,

                                       AMDGPU::OperandSemantics Sema) const {

  // Cases when Val{8} is 1 (vgpr, agpr or true 16 vgpr) should have been

  // decoded earlier.

  assert(Val < (1 << 8) && "9-bit Src encoding when Val{8} is 0");

  using namespace AMDGPU::EncValues;


  if (Val <= SGPR_MAX) {

    // "SGPR_MIN <= Val" is always true and causes compilation warning.

    static_assert(SGPR_MIN == 0);

    return createSRegOperand(getSgprClassId(Width), Val - SGPR_MIN);

  }


  int TTmpIdx = getTTmpIdx(Val);

  if (TTmpIdx >= 0) {

    return createSRegOperand(getTtmpClassId(Width), TTmpIdx);

  }


  if (INLINE_INTEGER_C_MIN <= Val && Val <= INLINE_INTEGER_C_MAX)

    return decodeIntImmed(Val);


  if (INLINE_FLOATING_C_MIN <= Val && Val <= INLINE_FLOATING_C_MAX)

    return decodeFPImmed(ImmWidth, Val, Sema);


  if (Val == LITERAL_CONST) {

    if (MandatoryLiteral)

      // Keep a sentinel value for deferred setting

      return MCOperand::createImm(LITERAL_CONST);

    else

      return decodeLiteralConstant(Sema == AMDGPU::OperandSemantics::FP64);

  }


  switch (Width) {

  case OPW32:

  case OPW16:

  case OPWV216:

    return decodeSpecialReg32(Val);

  case OPW64:

  case OPWV232:

    return decodeSpecialReg64(Val);

  default:

    llvm_unreachable("unexpected immediate type");

  }

}


// Bit 0 of DstY isn't stored in the instruction, because it's always the

// opposite of bit 0 of DstX.

MCOperand AMDGPUDisassembler::decodeVOPDDstYOp(MCInst &Inst,

                                               unsigned Val) const {

  int VDstXInd =

      AMDGPU::getNamedOperandIdx(Inst.getOpcode(), AMDGPU::OpName::vdstX);

  assert(VDstXInd != -1);

  assert(Inst.getOperand(VDstXInd).isReg());

  unsigned XDstReg = MRI.getEncodingValue(Inst.getOperand(VDstXInd).getReg());

  Val |= ~XDstReg & 1;

  auto Width = llvm::AMDGPUDisassembler::OPW32;

  return createRegOperand(getVgprClassId(Width), Val);

}


MCOperand AMDGPUDisassembler::decodeSpecialReg32(unsigned Val) const {

  using namespace AMDGPU;


  switch (Val) {

  // clang-format off

  case 102: return createRegOperand(FLAT_SCR_LO);

  case 103: return createRegOperand(FLAT_SCR_HI);

  case 104: return createRegOperand(XNACK_MASK_LO);

  case 105: return createRegOperand(XNACK_MASK_HI);

  case 106: return createRegOperand(VCC_LO);

  case 107: return createRegOperand(VCC_HI);

  case 108: return createRegOperand(TBA_LO);

  case 109: return createRegOperand(TBA_HI);

  case 110: return createRegOperand(TMA_LO);

  case 111: return createRegOperand(TMA_HI);

  case 124:

    return isGFX11Plus() ? createRegOperand(SGPR_NULL) : createRegOperand(M0);

  case 125:

    return isGFX11Plus() ? createRegOperand(M0) : createRegOperand(SGPR_NULL);

  case 126: return createRegOperand(EXEC_LO);

  case 127: return createRegOperand(EXEC_HI);

  case 235: return createRegOperand(SRC_SHARED_BASE_LO);

  case 236: return createRegOperand(SRC_SHARED_LIMIT_LO);

  case 237: return createRegOperand(SRC_PRIVATE_BASE_LO);

  case 238: return createRegOperand(SRC_PRIVATE_LIMIT_LO);

  case 239: return createRegOperand(SRC_POPS_EXITING_WAVE_ID);

  case 251: return createRegOperand(SRC_VCCZ);

  case 252: return createRegOperand(SRC_EXECZ);

  case 253: return createRegOperand(SRC_SCC);

  case 254: return createRegOperand(LDS_DIRECT);

  default: break;

    // clang-format on

  }

  return errOperand(Val, "unknown operand encoding " + Twine(Val));

}


MCOperand AMDGPUDisassembler::decodeSpecialReg64(unsigned Val) const {

  using namespace AMDGPU;


  switch (Val) {

  case 102: return createRegOperand(FLAT_SCR);

  case 104: return createRegOperand(XNACK_MASK);

  case 106: return createRegOperand(VCC);

  case 108: return createRegOperand(TBA);

  case 110: return createRegOperand(TMA);

  case 124:

    if (isGFX11Plus())

      return createRegOperand(SGPR_NULL);

    break;

  case 125:

    if (!isGFX11Plus())

      return createRegOperand(SGPR_NULL);

    break;

  case 126: return createRegOperand(EXEC);

  case 235: return createRegOperand(SRC_SHARED_BASE);

  case 236: return createRegOperand(SRC_SHARED_LIMIT);

  case 237: return createRegOperand(SRC_PRIVATE_BASE);

  case 238: return createRegOperand(SRC_PRIVATE_LIMIT);

  case 239: return createRegOperand(SRC_POPS_EXITING_WAVE_ID);

  case 251: return createRegOperand(SRC_VCCZ);

  case 252: return createRegOperand(SRC_EXECZ);

  case 253: return createRegOperand(SRC_SCC);

  default: break;

  }

  return errOperand(Val, "unknown operand encoding " + Twine(Val));

}


MCOperand

AMDGPUDisassembler::decodeSDWASrc(const OpWidthTy Width, const unsigned Val,

                                  unsigned ImmWidth,

                                  AMDGPU::OperandSemantics Sema) const {

  using namespace AMDGPU::SDWA;

  using namespace AMDGPU::EncValues;


  if (STI.hasFeature(AMDGPU::FeatureGFX9) ||

      STI.hasFeature(AMDGPU::FeatureGFX10)) {

    // XXX: cast to int is needed to avoid stupid warning:

    // compare with unsigned is always true

    if (int(SDWA9EncValues::SRC_VGPR_MIN) <= int(Val) &&

        Val <= SDWA9EncValues::SRC_VGPR_MAX) {

      return createRegOperand(getVgprClassId(Width),

                              Val - SDWA9EncValues::SRC_VGPR_MIN);

    }

    if (SDWA9EncValues::SRC_SGPR_MIN <= Val &&

        Val <= (isGFX10Plus() ? SDWA9EncValues::SRC_SGPR_MAX_GFX10

                              : SDWA9EncValues::SRC_SGPR_MAX_SI)) {

      return createSRegOperand(getSgprClassId(Width),

                               Val - SDWA9EncValues::SRC_SGPR_MIN);

    }

    if (SDWA9EncValues::SRC_TTMP_MIN <= Val &&

        Val <= SDWA9EncValues::SRC_TTMP_MAX) {

      return createSRegOperand(getTtmpClassId(Width),

                               Val - SDWA9EncValues::SRC_TTMP_MIN);

    }


    const unsigned SVal = Val - SDWA9EncValues::SRC_SGPR_MIN;


    if (INLINE_INTEGER_C_MIN <= SVal && SVal <= INLINE_INTEGER_C_MAX)

      return decodeIntImmed(SVal);


    if (INLINE_FLOATING_C_MIN <= SVal && SVal <= INLINE_FLOATING_C_MAX)

      return decodeFPImmed(ImmWidth, SVal, Sema);


    return decodeSpecialReg32(SVal);

  } else if (STI.hasFeature(AMDGPU::FeatureVolcanicIslands)) {

    return createRegOperand(getVgprClassId(Width), Val);

  }

  llvm_unreachable("unsupported target");

}


MCOperand AMDGPUDisassembler::decodeSDWASrc16(unsigned Val) const {

  return decodeSDWASrc(OPW16, Val, 16, AMDGPU::OperandSemantics::FP16);

}


MCOperand AMDGPUDisassembler::decodeSDWASrc32(unsigned Val) const {

  return decodeSDWASrc(OPW32, Val, 32, AMDGPU::OperandSemantics::FP32);

}


MCOperand AMDGPUDisassembler::decodeSDWAVopcDst(unsigned Val) const {

  using namespace AMDGPU::SDWA;


  assert((STI.hasFeature(AMDGPU::FeatureGFX9) ||

          STI.hasFeature(AMDGPU::FeatureGFX10)) &&

         "SDWAVopcDst should be present only on GFX9+");


  bool IsWave64 = STI.hasFeature(AMDGPU::FeatureWavefrontSize64);


  if (Val & SDWA9EncValues::VOPC_DST_VCC_MASK) {

    Val &= SDWA9EncValues::VOPC_DST_SGPR_MASK;


    int TTmpIdx = getTTmpIdx(Val);

    if (TTmpIdx >= 0) {

      auto TTmpClsId = getTtmpClassId(IsWave64 ? OPW64 : OPW32);

      return createSRegOperand(TTmpClsId, TTmpIdx);

    } else if (Val > SGPR_MAX) {

      return IsWave64 ? decodeSpecialReg64(Val)

                      : decodeSpecialReg32(Val);

    } else {

      return createSRegOperand(getSgprClassId(IsWave64 ? OPW64 : OPW32), Val);

    }

  } else {

    return createRegOperand(IsWave64 ? AMDGPU::VCC : AMDGPU::VCC_LO);

  }

}


MCOperand AMDGPUDisassembler::decodeBoolReg(unsigned Val) const {

  return STI.hasFeature(AMDGPU::FeatureWavefrontSize64)

             ? decodeSrcOp(OPW64, Val)

             : decodeSrcOp(OPW32, Val);

}


MCOperand AMDGPUDisassembler::decodeSplitBarrier(unsigned Val) const {

  return decodeSrcOp(OPW32, Val);

}


MCOperand AMDGPUDisassembler::decodeDpp8FI(unsigned Val) const {

  if (Val != AMDGPU::DPP::DPP8_FI_0 && Val != AMDGPU::DPP::DPP8_FI_1)

    return MCOperand();

  return MCOperand::createImm(Val);

}


bool AMDGPUDisassembler::isVI() const {

  return STI.hasFeature(AMDGPU::FeatureVolcanicIslands);

}


bool AMDGPUDisassembler::isGFX9() const { return AMDGPU::isGFX9(STI); }


bool AMDGPUDisassembler::isGFX90A() const {

  return STI.hasFeature(AMDGPU::FeatureGFX90AInsts);

}


bool AMDGPUDisassembler::isGFX9Plus() const { return AMDGPU::isGFX9Plus(STI); }


bool AMDGPUDisassembler::isGFX10() const { return AMDGPU::isGFX10(STI); }


bool AMDGPUDisassembler::isGFX10Plus() const {

  return AMDGPU::isGFX10Plus(STI);

}


bool AMDGPUDisassembler::isGFX11() const {

  return STI.hasFeature(AMDGPU::FeatureGFX11);

}


bool AMDGPUDisassembler::isGFX11Plus() const {

  return AMDGPU::isGFX11Plus(STI);

}


bool AMDGPUDisassembler::isGFX12() const {

  return STI.hasFeature(AMDGPU::FeatureGFX12);

}


bool AMDGPUDisassembler::isGFX12Plus() const {

  return AMDGPU::isGFX12Plus(STI);

}


bool AMDGPUDisassembler::hasArchitectedFlatScratch() const {

  return STI.hasFeature(AMDGPU::FeatureArchitectedFlatScratch);

}


bool AMDGPUDisassembler::hasKernargPreload() const {

  return AMDGPU::hasKernargPreload(STI);

}


//===----------------------------------------------------------------------===//

// AMDGPU specific symbol handling

//===----------------------------------------------------------------------===//


/// Print a string describing the reserved bit range specified by Mask with

/// offset BaseBytes for use in error comments. Mask is a single continuous

/// range of 1s surrounded by zeros. The format here is meant to align with the

/// tables that describe these bits in llvm.org/docs/AMDGPUUsage.html.

static SmallString<32> getBitRangeFromMask(uint32_t Mask, unsigned BaseBytes) {

  SmallString<32> Result;

  raw_svector_ostream S(Result);


  int TrailingZeros = llvm::countr_zero(Mask);

  int PopCount = llvm::popcount(Mask);


  if (PopCount == 1) {

    S << "bit (" << (TrailingZeros + BaseBytes * CHAR_BIT) << ')';

  } else {

    S << "bits in range ("

      << (TrailingZeros + PopCount - 1 + BaseBytes * CHAR_BIT) << ':'

      << (TrailingZeros + BaseBytes * CHAR_BIT) << ')';

  }


  return Result;

}


#define GET_FIELD(MASK) (AMDHSA_BITS_GET(FourByteBuffer, MASK))

#define PRINT_DIRECTIVE(DIRECTIVE, MASK)                                       \

  do {                                                                         \

    KdStream << Indent << DIRECTIVE " " << GET_FIELD(MASK) << '\n';            \

  } while (0)

#define PRINT_PSEUDO_DIRECTIVE_COMMENT(DIRECTIVE, MASK)                        \

  do {                                                                         \

    KdStream << Indent << MAI.getCommentString() << ' ' << DIRECTIVE " "       \

             << GET_FIELD(MASK) << '\n';                                       \

  } while (0)


#define CHECK_RESERVED_BITS_IMPL(MASK, DESC, MSG)                              \

  do {                                                                         \

    if (FourByteBuffer & (MASK)) {                                             \

      return createStringError(std::errc::invalid_argument,                    \

                               "kernel descriptor " DESC                       \

                               " reserved %s set" MSG,                         \

                               getBitRangeFromMask((MASK), 0).c_str());        \

    }                                                                          \

  } while (0)


#define CHECK_RESERVED_BITS(MASK) CHECK_RESERVED_BITS_IMPL(MASK, #MASK, "")

#define CHECK_RESERVED_BITS_MSG(MASK, MSG)                                     \

  CHECK_RESERVED_BITS_IMPL(MASK, #MASK, ", " MSG)

#define CHECK_RESERVED_BITS_DESC(MASK, DESC)                                   \

  CHECK_RESERVED_BITS_IMPL(MASK, DESC, "")

#define CHECK_RESERVED_BITS_DESC_MSG(MASK, DESC, MSG)                          \

  CHECK_RESERVED_BITS_IMPL(MASK, DESC, ", " MSG)


// NOLINTNEXTLINE(readability-identifier-naming)

Expected<bool> AMDGPUDisassembler::decodeCOMPUTE_PGM_RSRC1(

    uint32_t FourByteBuffer, raw_string_ostream &KdStream) const {

  using namespace amdhsa;

  StringRef Indent = "\t";


  // We cannot accurately backward compute #VGPRs used from

  // GRANULATED_WORKITEM_VGPR_COUNT. But we are concerned with getting the same

  // value of GRANULATED_WORKITEM_VGPR_COUNT in the reassembled binary. So we

  // simply calculate the inverse of what the assembler does.


  uint32_t GranulatedWorkitemVGPRCount =

      GET_FIELD(COMPUTE_PGM_RSRC1_GRANULATED_WORKITEM_VGPR_COUNT);


  uint32_t NextFreeVGPR =

      (GranulatedWorkitemVGPRCount + 1) *

      AMDGPU::IsaInfo::getVGPREncodingGranule(&STI, EnableWavefrontSize32);


  KdStream << Indent << ".amdhsa_next_free_vgpr " << NextFreeVGPR << '\n';


  // We cannot backward compute values used to calculate

  // GRANULATED_WAVEFRONT_SGPR_COUNT. Hence the original values for following

  // directives can't be computed:

  // .amdhsa_reserve_vcc

  // .amdhsa_reserve_flat_scratch

  // .amdhsa_reserve_xnack_mask

  // They take their respective default values if not specified in the assembly.

  //

  // GRANULATED_WAVEFRONT_SGPR_COUNT

  //    = f(NEXT_FREE_SGPR + VCC + FLAT_SCRATCH + XNACK_MASK)

  //

  // We compute the inverse as though all directives apart from NEXT_FREE_SGPR

  // are set to 0. So while disassembling we consider that:

  //

  // GRANULATED_WAVEFRONT_SGPR_COUNT

  //    = f(NEXT_FREE_SGPR + 0 + 0 + 0)

  //

  // The disassembler cannot recover the original values of those 3 directives.


  uint32_t GranulatedWavefrontSGPRCount =

      GET_FIELD(COMPUTE_PGM_RSRC1_GRANULATED_WAVEFRONT_SGPR_COUNT);


  if (isGFX10Plus())

    CHECK_RESERVED_BITS_MSG(COMPUTE_PGM_RSRC1_GRANULATED_WAVEFRONT_SGPR_COUNT,

                            "must be zero on gfx10+");


  uint32_t NextFreeSGPR = (GranulatedWavefrontSGPRCount + 1) *

                          AMDGPU::IsaInfo::getSGPREncodingGranule(&STI);


  KdStream << Indent << ".amdhsa_reserve_vcc " << 0 << '\n';

  if (!hasArchitectedFlatScratch())

    KdStream << Indent << ".amdhsa_reserve_flat_scratch " << 0 << '\n';

  KdStream << Indent << ".amdhsa_reserve_xnack_mask " << 0 << '\n';

  KdStream << Indent << ".amdhsa_next_free_sgpr " << NextFreeSGPR << "\n";


  CHECK_RESERVED_BITS(COMPUTE_PGM_RSRC1_PRIORITY);


  PRINT_DIRECTIVE(".amdhsa_float_round_mode_32",

                  COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_32);

  PRINT_DIRECTIVE(".amdhsa_float_round_mode_16_64",

                  COMPUTE_PGM_RSRC1_FLOAT_ROUND_MODE_16_64);

  PRINT_DIRECTIVE(".amdhsa_float_denorm_mode_32",

                  COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_32);

  PRINT_DIRECTIVE(".amdhsa_float_denorm_mode_16_64",

                  COMPUTE_PGM_RSRC1_FLOAT_DENORM_MODE_16_64);


  CHECK_RESERVED_BITS(COMPUTE_PGM_RSRC1_PRIV);


  if (!isGFX12Plus())

    PRINT_DIRECTIVE(".amdhsa_dx10_clamp",

                    COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_DX10_CLAMP);


  CHECK_RESERVED_BITS(COMPUTE_PGM_RSRC1_DEBUG_MODE);


  if (!isGFX12Plus())

    PRINT_DIRECTIVE(".amdhsa_ieee_mode",

                    COMPUTE_PGM_RSRC1_GFX6_GFX11_ENABLE_IEEE_MODE);


  CHECK_RESERVED_BITS(COMPUTE_PGM_RSRC1_BULKY);

  CHECK_RESERVED_BITS(COMPUTE_PGM_RSRC1_CDBG_USER);


  if (isGFX9Plus())

    PRINT_DIRECTIVE(".amdhsa_fp16_overflow", COMPUTE_PGM_RSRC1_GFX9_PLUS_FP16_OVFL);


  if (!isGFX9Plus())

    CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC1_GFX6_GFX8_RESERVED0,

                                 "COMPUTE_PGM_RSRC1", "must be zero pre-gfx9");


  CHECK_RESERVED_BITS_DESC(COMPUTE_PGM_RSRC1_RESERVED1, "COMPUTE_PGM_RSRC1");


  if (!isGFX10Plus())

    CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC1_GFX6_GFX9_RESERVED2,

                                 "COMPUTE_PGM_RSRC1", "must be zero pre-gfx10");


  if (isGFX10Plus()) {

    PRINT_DIRECTIVE(".amdhsa_workgroup_processor_mode",

                    COMPUTE_PGM_RSRC1_GFX10_PLUS_WGP_MODE);

    PRINT_DIRECTIVE(".amdhsa_memory_ordered", COMPUTE_PGM_RSRC1_GFX10_PLUS_MEM_ORDERED);

    PRINT_DIRECTIVE(".amdhsa_forward_progress", COMPUTE_PGM_RSRC1_GFX10_PLUS_FWD_PROGRESS);

  }


  if (isGFX12Plus())

    PRINT_DIRECTIVE(".amdhsa_round_robin_scheduling",

                    COMPUTE_PGM_RSRC1_GFX12_PLUS_ENABLE_WG_RR_EN);


  return true;

}


// NOLINTNEXTLINE(readability-identifier-naming)

Expected<bool> AMDGPUDisassembler::decodeCOMPUTE_PGM_RSRC2(

    uint32_t FourByteBuffer, raw_string_ostream &KdStream) const {

  using namespace amdhsa;

  StringRef Indent = "\t";

  if (hasArchitectedFlatScratch())

    PRINT_DIRECTIVE(".amdhsa_enable_private_segment",

                    COMPUTE_PGM_RSRC2_ENABLE_PRIVATE_SEGMENT);

  else

    PRINT_DIRECTIVE(".amdhsa_system_sgpr_private_segment_wavefront_offset",

                    COMPUTE_PGM_RSRC2_ENABLE_PRIVATE_SEGMENT);

  PRINT_DIRECTIVE(".amdhsa_system_sgpr_workgroup_id_x",

                  COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_X);

  PRINT_DIRECTIVE(".amdhsa_system_sgpr_workgroup_id_y",

                  COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Y);

  PRINT_DIRECTIVE(".amdhsa_system_sgpr_workgroup_id_z",

                  COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_ID_Z);

  PRINT_DIRECTIVE(".amdhsa_system_sgpr_workgroup_info",

                  COMPUTE_PGM_RSRC2_ENABLE_SGPR_WORKGROUP_INFO);

  PRINT_DIRECTIVE(".amdhsa_system_vgpr_workitem_id",

                  COMPUTE_PGM_RSRC2_ENABLE_VGPR_WORKITEM_ID);


  CHECK_RESERVED_BITS(COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_ADDRESS_WATCH);

  CHECK_RESERVED_BITS(COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_MEMORY);

  CHECK_RESERVED_BITS(COMPUTE_PGM_RSRC2_GRANULATED_LDS_SIZE);


  PRINT_DIRECTIVE(

      ".amdhsa_exception_fp_ieee_invalid_op",

      COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INVALID_OPERATION);

  PRINT_DIRECTIVE(".amdhsa_exception_fp_denorm_src",

                  COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_FP_DENORMAL_SOURCE);

  PRINT_DIRECTIVE(

      ".amdhsa_exception_fp_ieee_div_zero",

      COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_DIVISION_BY_ZERO);

  PRINT_DIRECTIVE(".amdhsa_exception_fp_ieee_overflow",

                  COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_OVERFLOW);

  PRINT_DIRECTIVE(".amdhsa_exception_fp_ieee_underflow",

                  COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_UNDERFLOW);

  PRINT_DIRECTIVE(".amdhsa_exception_fp_ieee_inexact",

                  COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_IEEE_754_FP_INEXACT);

  PRINT_DIRECTIVE(".amdhsa_exception_int_div_zero",

                  COMPUTE_PGM_RSRC2_ENABLE_EXCEPTION_INT_DIVIDE_BY_ZERO);


  CHECK_RESERVED_BITS_DESC(COMPUTE_PGM_RSRC2_RESERVED0, "COMPUTE_PGM_RSRC2");


  return true;

}


// NOLINTNEXTLINE(readability-identifier-naming)

Expected<bool> AMDGPUDisassembler::decodeCOMPUTE_PGM_RSRC3(

    uint32_t FourByteBuffer, raw_string_ostream &KdStream) const {

  using namespace amdhsa;

  StringRef Indent = "\t";

  if (isGFX90A()) {

    KdStream << Indent << ".amdhsa_accum_offset "

             << (GET_FIELD(COMPUTE_PGM_RSRC3_GFX90A_ACCUM_OFFSET) + 1) * 4

             << '\n';


    PRINT_DIRECTIVE(".amdhsa_tg_split", COMPUTE_PGM_RSRC3_GFX90A_TG_SPLIT);


    CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC3_GFX90A_RESERVED0,

                                 "COMPUTE_PGM_RSRC3", "must be zero on gfx90a");

    CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC3_GFX90A_RESERVED1,

                                 "COMPUTE_PGM_RSRC3", "must be zero on gfx90a");

  } else if (isGFX10Plus()) {

    // Bits [0-3].

    if (!isGFX12Plus()) {

      if (!EnableWavefrontSize32 || !*EnableWavefrontSize32) {

        PRINT_DIRECTIVE(".amdhsa_shared_vgpr_count",

                        COMPUTE_PGM_RSRC3_GFX10_GFX11_SHARED_VGPR_COUNT);

      } else {

        PRINT_PSEUDO_DIRECTIVE_COMMENT(

            "SHARED_VGPR_COUNT",

            COMPUTE_PGM_RSRC3_GFX10_GFX11_SHARED_VGPR_COUNT);

      }

    } else {

      CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC3_GFX12_PLUS_RESERVED0,

                                   "COMPUTE_PGM_RSRC3",

                                   "must be zero on gfx12+");

    }


    // Bits [4-11].

    if (isGFX11()) {

      PRINT_PSEUDO_DIRECTIVE_COMMENT("INST_PREF_SIZE",

                                     COMPUTE_PGM_RSRC3_GFX11_INST_PREF_SIZE);

      PRINT_PSEUDO_DIRECTIVE_COMMENT("TRAP_ON_START",

                                     COMPUTE_PGM_RSRC3_GFX11_TRAP_ON_START);

      PRINT_PSEUDO_DIRECTIVE_COMMENT("TRAP_ON_END",

                                     COMPUTE_PGM_RSRC3_GFX11_TRAP_ON_END);

    } else if (isGFX12Plus()) {

      PRINT_PSEUDO_DIRECTIVE_COMMENT(

          "INST_PREF_SIZE", COMPUTE_PGM_RSRC3_GFX12_PLUS_INST_PREF_SIZE);

    } else {

      CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC3_GFX10_RESERVED1,

                                   "COMPUTE_PGM_RSRC3",

                                   "must be zero on gfx10");

    }


    // Bits [12].

    CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC3_GFX10_PLUS_RESERVED2,

                                 "COMPUTE_PGM_RSRC3", "must be zero on gfx10+");


    // Bits [13].

    if (isGFX12Plus()) {

      PRINT_PSEUDO_DIRECTIVE_COMMENT("GLG_EN",

                                     COMPUTE_PGM_RSRC3_GFX12_PLUS_GLG_EN);

    } else {

      CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC3_GFX10_GFX11_RESERVED3,

                                   "COMPUTE_PGM_RSRC3",

                                   "must be zero on gfx10 or gfx11");

    }


    // Bits [14-30].

    CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC3_GFX10_PLUS_RESERVED4,

                                 "COMPUTE_PGM_RSRC3", "must be zero on gfx10+");


    // Bits [31].

    if (isGFX11Plus()) {

      PRINT_PSEUDO_DIRECTIVE_COMMENT("IMAGE_OP",

                                     COMPUTE_PGM_RSRC3_GFX11_PLUS_IMAGE_OP);

    } else {

      CHECK_RESERVED_BITS_DESC_MSG(COMPUTE_PGM_RSRC3_GFX10_RESERVED5,

                                   "COMPUTE_PGM_RSRC3",

                                   "must be zero on gfx10");

    }

  } else if (FourByteBuffer) {

    return createStringError(

        std::errc::invalid_argument,

        "kernel descriptor COMPUTE_PGM_RSRC3 must be all zero before gfx9");

  }

  return true;

}

#undef PRINT_PSEUDO_DIRECTIVE_COMMENT

#undef PRINT_DIRECTIVE

#undef GET_FIELD

#undef CHECK_RESERVED_BITS_IMPL

#undef CHECK_RESERVED_BITS

#undef CHECK_RESERVED_BITS_MSG

#undef CHECK_RESERVED_BITS_DESC

#undef CHECK_RESERVED_BITS_DESC_MSG


/// Create an error object to return from onSymbolStart for reserved kernel

/// descriptor bits being set.

static Error createReservedKDBitsError(uint32_t Mask, unsigned BaseBytes,

                                       const char *Msg = "") {

  return createStringError(

      std::errc::invalid_argument, "kernel descriptor reserved %s set%s%s",

      getBitRangeFromMask(Mask, BaseBytes).c_str(), *Msg ? ", " : "", Msg);

}


/// Create an error object to return from onSymbolStart for reserved kernel

/// descriptor bytes being set.

static Error createReservedKDBytesError(unsigned BaseInBytes,

                                        unsigned WidthInBytes) {

  // Create an error comment in the same format as the "Kernel Descriptor"

  // table here: https://llvm.org/docs/AMDGPUUsage.html#kernel-descriptor .

  return createStringError(

      std::errc::invalid_argument,

      "kernel descriptor reserved bits in range (%u:%u) set",

      (BaseInBytes + WidthInBytes) * CHAR_BIT - 1, BaseInBytes * CHAR_BIT);

}


Expected<bool> AMDGPUDisassembler::decodeKernelDescriptorDirective(

    DataExtractor::Cursor &Cursor, ArrayRef<uint8_t> Bytes,

    raw_string_ostream &KdStream) const {

#define PRINT_DIRECTIVE(DIRECTIVE, MASK)                                       \

  do {                                                                         \

    KdStream << Indent << DIRECTIVE " "                                        \

             << ((TwoByteBuffer & MASK) >> (MASK##_SHIFT)) << '\n';            \

  } while (0)


  uint16_t TwoByteBuffer = 0;

  uint32_t FourByteBuffer = 0;


  StringRef ReservedBytes;

  StringRef Indent = "\t";


  assert(Bytes.size() == 64);

  DataExtractor DE(Bytes, /*IsLittleEndian=*/true, /*AddressSize=*/8);


  switch (Cursor.tell()) {

  case amdhsa::GROUP_SEGMENT_FIXED_SIZE_OFFSET:

    FourByteBuffer = DE.getU32(Cursor);

    KdStream << Indent << ".amdhsa_group_segment_fixed_size " << FourByteBuffer

             << '\n';

    return true;


  case amdhsa::PRIVATE_SEGMENT_FIXED_SIZE_OFFSET:

    FourByteBuffer = DE.getU32(Cursor);

    KdStream << Indent << ".amdhsa_private_segment_fixed_size "

             << FourByteBuffer << '\n';

    return true;


  case amdhsa::KERNARG_SIZE_OFFSET:

    FourByteBuffer = DE.getU32(Cursor);

    KdStream << Indent << ".amdhsa_kernarg_size "

             << FourByteBuffer << '\n';

    return true;


  case amdhsa::RESERVED0_OFFSET:

    // 4 reserved bytes, must be 0.

    ReservedBytes = DE.getBytes(Cursor, 4);

    for (int I = 0; I < 4; ++I) {

      if (ReservedBytes[I] != 0)

        return createReservedKDBytesError(amdhsa::RESERVED0_OFFSET, 4);

    }

    return true;


  case amdhsa::KERNEL_CODE_ENTRY_BYTE_OFFSET_OFFSET:

    // KERNEL_CODE_ENTRY_BYTE_OFFSET

    // So far no directive controls this for Code Object V3, so simply skip for

    // disassembly.

    DE.skip(Cursor, 8);

    return true;


  case amdhsa::RESERVED1_OFFSET:

    // 20 reserved bytes, must be 0.

    ReservedBytes = DE.getBytes(Cursor, 20);

    for (int I = 0; I < 20; ++I) {

      if (ReservedBytes[I] != 0)

        return createReservedKDBytesError(amdhsa::RESERVED1_OFFSET, 20);

    }

    return true;


  case amdhsa::COMPUTE_PGM_RSRC3_OFFSET:

    FourByteBuffer = DE.getU32(Cursor);

    return decodeCOMPUTE_PGM_RSRC3(FourByteBuffer, KdStream);


  case amdhsa::COMPUTE_PGM_RSRC1_OFFSET:

    FourByteBuffer = DE.getU32(Cursor);

    return decodeCOMPUTE_PGM_RSRC1(FourByteBuffer, KdStream);


  case amdhsa::COMPUTE_PGM_RSRC2_OFFSET:

    FourByteBuffer = DE.getU32(Cursor);

    return decodeCOMPUTE_PGM_RSRC2(FourByteBuffer, KdStream);


  case amdhsa::KERNEL_CODE_PROPERTIES_OFFSET:

    using namespace amdhsa;

    TwoByteBuffer = DE.getU16(Cursor);


    if (!hasArchitectedFlatScratch())

      PRINT_DIRECTIVE(".amdhsa_user_sgpr_private_segment_buffer",

                      KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_BUFFER);

    PRINT_DIRECTIVE(".amdhsa_user_sgpr_dispatch_ptr",

                    KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_PTR);

    PRINT_DIRECTIVE(".amdhsa_user_sgpr_queue_ptr",

                    KERNEL_CODE_PROPERTY_ENABLE_SGPR_QUEUE_PTR);

    PRINT_DIRECTIVE(".amdhsa_user_sgpr_kernarg_segment_ptr",

                    KERNEL_CODE_PROPERTY_ENABLE_SGPR_KERNARG_SEGMENT_PTR);

    PRINT_DIRECTIVE(".amdhsa_user_sgpr_dispatch_id",

                    KERNEL_CODE_PROPERTY_ENABLE_SGPR_DISPATCH_ID);

    if (!hasArchitectedFlatScratch())

      PRINT_DIRECTIVE(".amdhsa_user_sgpr_flat_scratch_init",

                      KERNEL_CODE_PROPERTY_ENABLE_SGPR_FLAT_SCRATCH_INIT);

    PRINT_DIRECTIVE(".amdhsa_user_sgpr_private_segment_size",

                    KERNEL_CODE_PROPERTY_ENABLE_SGPR_PRIVATE_SEGMENT_SIZE);


    if (TwoByteBuffer & KERNEL_CODE_PROPERTY_RESERVED0)

      return createReservedKDBitsError(KERNEL_CODE_PROPERTY_RESERVED0,

                                       amdhsa::KERNEL_CODE_PROPERTIES_OFFSET);


    // Reserved for GFX9

    if (isGFX9() &&

        (TwoByteBuffer & KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32)) {

      return createReservedKDBitsError(

          KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32,

          amdhsa::KERNEL_CODE_PROPERTIES_OFFSET, "must be zero on gfx9");

    } else if (isGFX10Plus()) {

      PRINT_DIRECTIVE(".amdhsa_wavefront_size32",

                      KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32);

    }


    if (CodeObjectVersion >= AMDGPU::AMDHSA_COV5)

      PRINT_DIRECTIVE(".amdhsa_uses_dynamic_stack",

                      KERNEL_CODE_PROPERTY_USES_DYNAMIC_STACK);


    if (TwoByteBuffer & KERNEL_CODE_PROPERTY_RESERVED1) {

      return createReservedKDBitsError(KERNEL_CODE_PROPERTY_RESERVED1,

                                       amdhsa::KERNEL_CODE_PROPERTIES_OFFSET);

    }


    return true;


  case amdhsa::KERNARG_PRELOAD_OFFSET:

    using namespace amdhsa;

    TwoByteBuffer = DE.getU16(Cursor);

    if (TwoByteBuffer & KERNARG_PRELOAD_SPEC_LENGTH) {

      PRINT_DIRECTIVE(".amdhsa_user_sgpr_kernarg_preload_length",

                      KERNARG_PRELOAD_SPEC_LENGTH);

    }


    if (TwoByteBuffer & KERNARG_PRELOAD_SPEC_OFFSET) {

      PRINT_DIRECTIVE(".amdhsa_user_sgpr_kernarg_preload_offset",

                      KERNARG_PRELOAD_SPEC_OFFSET);

    }

    return true;


  case amdhsa::RESERVED3_OFFSET:

    // 4 bytes from here are reserved, must be 0.

    ReservedBytes = DE.getBytes(Cursor, 4);

    for (int I = 0; I < 4; ++I) {

      if (ReservedBytes[I] != 0)

        return createReservedKDBytesError(amdhsa::RESERVED3_OFFSET, 4);

    }

    return true;


  default:

    llvm_unreachable("Unhandled index. Case statements cover everything.");

    return true;

  }

#undef PRINT_DIRECTIVE

}


Expected<bool> AMDGPUDisassembler::decodeKernelDescriptor(

    StringRef KdName, ArrayRef<uint8_t> Bytes, uint64_t KdAddress) const {


  // CP microcode requires the kernel descriptor to be 64 aligned.

  if (Bytes.size() != 64 || KdAddress % 64 != 0)

    return createStringError(std::errc::invalid_argument,

                             "kernel descriptor must be 64-byte aligned");


  // FIXME: We can't actually decode "in order" as is done below, as e.g. GFX10

  // requires us to know the setting of .amdhsa_wavefront_size32 in order to

  // accurately produce .amdhsa_next_free_vgpr, and they appear in the wrong

  // order. Workaround this by first looking up .amdhsa_wavefront_size32 here

  // when required.

  if (isGFX10Plus()) {

    uint16_t KernelCodeProperties =

        support::endian::read16(&Bytes[amdhsa::KERNEL_CODE_PROPERTIES_OFFSET],

                                llvm::endianness::little);

    EnableWavefrontSize32 =

        AMDHSA_BITS_GET(KernelCodeProperties,

                        amdhsa::KERNEL_CODE_PROPERTY_ENABLE_WAVEFRONT_SIZE32);

  }


  std::string Kd;

  raw_string_ostream KdStream(Kd);

  KdStream << ".amdhsa_kernel " << KdName << '\n';


  DataExtractor::Cursor C(0);

  while (C && C.tell() < Bytes.size()) {

    Expected<bool> Res = decodeKernelDescriptorDirective(C, Bytes, KdStream);


    cantFail(C.takeError());


    if (!Res)

      return Res;

  }

  KdStream << ".end_amdhsa_kernel\n";

  outs() << KdStream.str();

  return true;

}


Expected<bool> AMDGPUDisassembler::onSymbolStart(SymbolInfoTy &Symbol,

                                                 uint64_t &Size,

                                                 ArrayRef<uint8_t> Bytes,

                                                 uint64_t Address) const {

  // Right now only kernel descriptor needs to be handled.

  // We ignore all other symbols for target specific handling.

  // TODO:

  // Fix the spurious symbol issue for AMDGPU kernels. Exists for both Code

  // Object V2 and V3 when symbols are marked protected.


  // amd_kernel_code_t for Code Object V2.

  if (Symbol.Type == ELF::STT_AMDGPU_HSA_KERNEL) {

    Size = 256;

    return createStringError(std::errc::invalid_argument,

                             "code object v2 is not supported");

  }


  // Code Object V3 kernel descriptors.

  StringRef Name = Symbol.Name;

  if (Symbol.Type == ELF::STT_OBJECT && Name.ends_with(StringRef(".kd"))) {

    Size = 64; // Size = 64 regardless of success or failure.

    return decodeKernelDescriptor(Name.drop_back(3), Bytes, Address);

  }


  return false;

}


//===----------------------------------------------------------------------===//

// AMDGPUSymbolizer

//===----------------------------------------------------------------------===//


// Try to find symbol name for specified label

bool AMDGPUSymbolizer::tryAddingSymbolicOperand(

    MCInst &Inst, raw_ostream & /*cStream*/, int64_t Value,

    uint64_t /*Address*/, bool IsBranch, uint64_t /*Offset*/,

    uint64_t /*OpSize*/, uint64_t /*InstSize*/) {


  if (!IsBranch) {

    return false;

  }


  auto *Symbols = static_cast<SectionSymbolsTy *>(DisInfo);

  if (!Symbols)

    return false;


  auto Result = llvm::find_if(*Symbols, [Value](const SymbolInfoTy &Val) {

    return Val.Addr == static_cast<uint64_t>(Value) &&

           Val.Type == ELF::STT_NOTYPE;

  });

  if (Result != Symbols->end()) {

    auto *Sym = Ctx.getOrCreateSymbol(Result->Name);

    const auto *Add = MCSymbolRefExpr::create(Sym, Ctx);

    Inst.addOperand(MCOperand::createExpr(Add));

    return true;

  }

  // Add to list of referenced addresses, so caller can synthesize a label.

  ReferencedAddresses.push_back(static_cast<uint64_t>(Value));

  return false;

}


void AMDGPUSymbolizer::tryAddingPcLoadReferenceComment(raw_ostream &cStream,

                                                       int64_t Value,

                                                       uint64_t Address) {

  llvm_unreachable("unimplemented");

}


//===----------------------------------------------------------------------===//

// Initialization

//===----------------------------------------------------------------------===//


static MCSymbolizer *createAMDGPUSymbolizer(const Triple &/*TT*/,

                              LLVMOpInfoCallback /*GetOpInfo*/,

                              LLVMSymbolLookupCallback /*SymbolLookUp*/,

                              void *DisInfo,

                              MCContext *Ctx,

                              std::unique_ptr<MCRelocationInfo> &&RelInfo) {

  return new AMDGPUSymbolizer(*Ctx, std::move(RelInfo), DisInfo);

}


static MCDisassembler *createAMDGPUDisassembler(const Target &T,

                                                const MCSubtargetInfo &STI,

                                                MCContext &Ctx) {

  return new AMDGPUDisassembler(STI, Ctx, T.createMCInstrInfo());

}


extern "C" LLVM_EXTERNAL_VISIBILITY void LLVMInitializeAMDGPUDisassembler() {

  TargetRegistry::RegisterMCDisassembler(getTheGCNTarget(),

                                         createAMDGPUDisassembler);

  TargetRegistry::RegisterMCSymbolizer(getTheGCNTarget(),

                                       createAMDGPUSymbolizer);

}

MRI
unsigned const MachineRegisterInfo * MRI
Definition: AArch64AdvSIMDScalarPass.cpp:105

const
aarch64 promote const
Definition: AArch64PromoteConstant.cpp:232

IsAGPROperand
static int IsAGPROperand(const MCInst &Inst, uint16_t NameIdx, const MCRegisterInfo *MRI)
Definition: AMDGPUAsmParser.cpp:4726

AMDGPUBaseInfo.h

CHECK_RESERVED_BITS_DESC
#define CHECK_RESERVED_BITS_DESC(MASK, DESC)
Definition: AMDGPUDisassembler.cpp:1822

collectVOPModifiers
static VOPModifiers collectVOPModifiers(const MCInst &MI, bool IsVOP3P=false)
Definition: AMDGPUDisassembler.cpp:773

decodeSrcRegOrImm9
static DecodeStatus decodeSrcRegOrImm9(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:223

getBitRangeFromMask
static SmallString< 32 > getBitRangeFromMask(uint32_t Mask, unsigned BaseBytes)
Print a string describing the reserved bit range specified by Mask with offset BaseBytes for use in e...
Definition: AMDGPUDisassembler.cpp:1780

decodeSMEMOffset
static DecodeStatus decodeSMEMOffset(MCInst &Inst, unsigned Imm, uint64_t Addr, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:95

decodeSrcA9
static DecodeStatus decodeSrcA9(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:200

insertNamedMCOperand
static int insertNamedMCOperand(MCInst &MI, const MCOperand &Op, uint16_t NameIdx)
Definition: AMDGPUDisassembler.cpp:69

eat12Bytes
static DecoderUInt128 eat12Bytes(ArrayRef< uint8_t > &Bytes)
Definition: AMDGPUDisassembler.cpp:438

PRINT_PSEUDO_DIRECTIVE_COMMENT
#define PRINT_PSEUDO_DIRECTIVE_COMMENT(DIRECTIVE, MASK)
Definition: AMDGPUDisassembler.cpp:1803

decodeSrcRegOrImmDeferred9
static DecodeStatus decodeSrcRegOrImmDeferred9(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:243

decodeDpp8FI
static DecodeStatus decodeDpp8FI(MCInst &Inst, unsigned Val, uint64_t Addr, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:122

decodeOperand_VSrc_f64
static DecodeStatus decodeOperand_VSrc_f64(MCInst &Inst, unsigned Imm, uint64_t Addr, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:407

getInlineImmVal16
static int64_t getInlineImmVal16(unsigned Imm, AMDGPU::OperandSemantics Sema)
Definition: AMDGPUDisassembler.cpp:1356

getInlineImmValBF16
static int64_t getInlineImmValBF16(unsigned Imm)
Definition: AMDGPUDisassembler.cpp:1331

DECODE_SDWA
#define DECODE_SDWA(DecName)
Definition: AMDGPUDisassembler.cpp:417

decodeSOPPBrTarget
static DecodeStatus decodeSOPPBrTarget(MCInst &Inst, unsigned Imm, uint64_t Addr, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:80

decodeSrcRegOrImmA9
static DecodeStatus decodeSrcRegOrImmA9(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:234

DECODE_OPERAND_REG_8
#define DECODE_OPERAND_REG_8(RegClass)
Definition: AMDGPUDisassembler.cpp:138

decodeSrcOp
static DecodeStatus decodeSrcOp(MCInst &Inst, unsigned EncSize, AMDGPUDisassembler::OpWidthTy OpWidth, unsigned Imm, unsigned EncImm, bool MandatoryLiteral, unsigned ImmWidth, AMDGPU::OperandSemantics Sema, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:159

decodeOperand_VSrcT16_Lo128
static DecodeStatus decodeOperand_VSrcT16_Lo128(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:307

PRINT_DIRECTIVE
#define PRINT_DIRECTIVE(DIRECTIVE, MASK)
Definition: AMDGPUDisassembler.cpp:1799

DecodeVGPR_16RegisterClass
static DecodeStatus DecodeVGPR_16RegisterClass(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:284

decodeSrcReg9
static DecodeStatus decodeSrcReg9(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:189

getInlineImmVal32
static int64_t getInlineImmVal32(unsigned Imm)
Definition: AMDGPUDisassembler.cpp:1256

DECODE_OPERAND_REG_7
#define DECODE_OPERAND_REG_7(RegClass, OpWidth)
Definition: AMDGPUDisassembler.cpp:173

addOperand
static MCDisassembler::DecodeStatus addOperand(MCInst &Inst, const MCOperand &Opnd)
Definition: AMDGPUDisassembler.cpp:62

CHECK_RESERVED_BITS
#define CHECK_RESERVED_BITS(MASK)
Definition: AMDGPUDisassembler.cpp:1819

decodeSrcAV10
static DecodeStatus decodeSrcAV10(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:209

SGPR_MAX
#define SGPR_MAX
Definition: AMDGPUDisassembler.cpp:41

getInlineImmVal64
static int64_t getInlineImmVal64(unsigned Imm)
Definition: AMDGPUDisassembler.cpp:1281

eatBytes
static T eatBytes(ArrayRef< uint8_t > &Bytes)
Definition: AMDGPUDisassembler.cpp:430

decodeOperand_KImmFP
static DecodeStatus decodeOperand_KImmFP(MCInst &Inst, unsigned Imm, uint64_t Addr, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:339

createAMDGPUDisassembler
static MCDisassembler * createAMDGPUDisassembler(const Target &T, const MCSubtargetInfo &STI, MCContext &Ctx)
Definition: AMDGPUDisassembler.cpp:2367

LLVMInitializeAMDGPUDisassembler
LLVM_EXTERNAL_VISIBILITY void LLVMInitializeAMDGPUDisassembler()
Definition: AMDGPUDisassembler.cpp:2373

decodeOperand_VSrcT16
static DecodeStatus decodeOperand_VSrcT16(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:323

decodeAVLdSt
static DecodeStatus decodeAVLdSt(MCInst &Inst, unsigned Imm, AMDGPUDisassembler::OpWidthTy Opw, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:366

DecodeVGPR_16_Lo128RegisterClass
static DecodeStatus DecodeVGPR_16_Lo128RegisterClass(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:297

CHECK_RESERVED_BITS_MSG
#define CHECK_RESERVED_BITS_MSG(MASK, MSG)
Definition: AMDGPUDisassembler.cpp:1820

decodeOperandVOPDDstY
static DecodeStatus decodeOperandVOPDDstY(MCInst &Inst, unsigned Val, uint64_t Addr, const void *Decoder)
Definition: AMDGPUDisassembler.cpp:346

createAMDGPUSymbolizer
static MCSymbolizer * createAMDGPUSymbolizer(const Triple &, LLVMOpInfoCallback, LLVMSymbolLookupCallback, void *DisInfo, MCContext *Ctx, std::unique_ptr< MCRelocationInfo > &&RelInfo)
Definition: AMDGPUDisassembler.cpp:2358

decodeBoolReg
static DecodeStatus decodeBoolReg(MCInst &Inst, unsigned Val, uint64_t Addr, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:109

getInlineImmValF16
static int64_t getInlineImmValF16(unsigned Imm)
Definition: AMDGPUDisassembler.cpp:1306

GET_FIELD
#define GET_FIELD(MASK)
Definition: AMDGPUDisassembler.cpp:1798

createReservedKDBytesError
static Error createReservedKDBytesError(unsigned BaseInBytes, unsigned WidthInBytes)
Create an error object to return from onSymbolStart for reserved kernel descriptor bytes being set.
Definition: AMDGPUDisassembler.cpp:2087

decodeSplitBarrier
static DecodeStatus decodeSplitBarrier(MCInst &Inst, unsigned Val, uint64_t Addr, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:115

decodeAV10
static DecodeStatus decodeAV10(MCInst &Inst, unsigned Imm, uint64_t, const MCDisassembler *Decoder)
Definition: AMDGPUDisassembler.cpp:181

CHECK_RESERVED_BITS_DESC_MSG
#define CHECK_RESERVED_BITS_DESC_MSG(MASK, DESC, MSG)
Definition: AMDGPUDisassembler.cpp:1824

createReservedKDBitsError
static Error createReservedKDBitsError(uint32_t Mask, unsigned BaseBytes, const char *Msg="")
Create an error object to return from onSymbolStart for reserved kernel descriptor bits being set.
Definition: AMDGPUDisassembler.cpp:2078

AMDGPUDisassembler.h
This file contains declaration for AMDGPU ISA disassembler.

AMDGPUMCTargetDesc.h
Provides AMDGPU specific target descriptions.

AMDGPUTargetInfo.h

AMDHSAKernelDescriptor.h
AMDHSA kernel descriptor definitions.

AMDHSA_BITS_GET
#define AMDHSA_BITS_GET(SRC, MSK)
Definition: AMDHSAKernelDescriptor.h:44

ELF.h

Info
Analysis containing CSE Info
Definition: CSEInfo.cpp:27

LLVM_EXTERNAL_VISIBILITY
#define LLVM_EXTERNAL_VISIBILITY
Definition: Compiler.h:135

DisassemblerTypes.h

Addr
uint64_t Addr
Definition: ELFObjHandler.cpp:79

Name
std::string Name
Definition: ELFObjHandler.cpp:77

Size
uint64_t Size
Definition: ELFObjHandler.cpp:81

Sym
Symbol * Sym
Definition: ELF_riscv.cpp:479

MI
IRTranslator LLVM IR MI
Definition: IRTranslator.cpp:113

MCAsmInfo.h

MCContext.h

MCDecoderOps.h

MCExpr.h

MCInstrDesc.h

MCRegisterInfo.h

MCSubtargetInfo.h

I
#define I(x, y, z)
Definition: MD5.cpp:58

SIDefines.h

assert
assert(ImpDefSCC.getReg()==AMDGPU::SCC &&ImpDefSCC.isDef())

SIRegisterInfo.h
Interface definition for SIRegisterInfo.

TargetRegistry.h

T

llvm::AMDGPUDisassembler
Definition: AMDGPUDisassembler.h:93

llvm::AMDGPUDisassembler::hasKernargPreload
bool hasKernargPreload() const
Definition: AMDGPUDisassembler.cpp:1768

llvm::AMDGPUDisassembler::convertEXPInst
void convertEXPInst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:720

llvm::AMDGPUDisassembler::createRegOperand
MCOperand createRegOperand(unsigned int RegId) const
Definition: AMDGPUDisassembler.cpp:1144

llvm::AMDGPUDisassembler::decodeSpecialReg64
MCOperand decodeSpecialReg64(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1605

llvm::AMDGPUDisassembler::getRegClassName
const char * getRegClassName(unsigned RegClassID) const
Definition: AMDGPUDisassembler.cpp:1128

llvm::AMDGPUDisassembler::isGFX12
bool isGFX12() const
Definition: AMDGPUDisassembler.cpp:1756

llvm::AMDGPUDisassembler::decodeCOMPUTE_PGM_RSRC1
Expected< bool > decodeCOMPUTE_PGM_RSRC1(uint32_t FourByteBuffer, raw_string_ostream &KdStream) const
Decode as directives that handle COMPUTE_PGM_RSRC1.
Definition: AMDGPUDisassembler.cpp:1828

llvm::AMDGPUDisassembler::decodeKernelDescriptorDirective
Expected< bool > decodeKernelDescriptorDirective(DataExtractor::Cursor &Cursor, ArrayRef< uint8_t > Bytes, raw_string_ostream &KdStream) const
Definition: AMDGPUDisassembler.cpp:2097

llvm::AMDGPUDisassembler::convertVOPCDPPInst
void convertVOPCDPPInst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:1091

llvm::AMDGPUDisassembler::getVgprClassId
unsigned getVgprClassId(const OpWidthTy Width) const
Definition: AMDGPUDisassembler.cpp:1383

llvm::AMDGPUDisassembler::getAgprClassId
unsigned getAgprClassId(const OpWidthTy Width) const
Definition: AMDGPUDisassembler.cpp:1408

llvm::AMDGPUDisassembler::decodeSDWASrc32
MCOperand decodeSDWASrc32(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1683

llvm::AMDGPUDisassembler::setABIVersion
void setABIVersion(unsigned Version) override
ELF-specific, set the ABI version from the object header.
Definition: AMDGPUDisassembler.cpp:57

llvm::AMDGPUDisassembler::decodeCOMPUTE_PGM_RSRC2
Expected< bool > decodeCOMPUTE_PGM_RSRC2(uint32_t FourByteBuffer, raw_string_ostream &KdStream) const
Decode as directives that handle COMPUTE_PGM_RSRC2.
Definition: AMDGPUDisassembler.cpp:1936

llvm::AMDGPUDisassembler::isGFX11
bool isGFX11() const
Definition: AMDGPUDisassembler.cpp:1748

llvm::AMDGPUDisassembler::decodeDpp8FI
MCOperand decodeDpp8FI(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1724

llvm::AMDGPUDisassembler::isGFX9Plus
bool isGFX9Plus() const
Definition: AMDGPUDisassembler.cpp:1740

llvm::AMDGPUDisassembler::convertMacDPPInst
void convertMacDPPInst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:857

llvm::AMDGPUDisassembler::decodeVOPDDstYOp
MCOperand decodeVOPDDstYOp(MCInst &Inst, unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1557

llvm::AMDGPUDisassembler::decodeBoolReg
MCOperand decodeBoolReg(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1714

llvm::AMDGPUDisassembler::isGFX10Plus
bool isGFX10Plus() const
Definition: AMDGPUDisassembler.cpp:1744

llvm::AMDGPUDisassembler::convertDPP8Inst
void convertDPP8Inst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:864

llvm::AMDGPUDisassembler::createVGPR16Operand
MCOperand createVGPR16Operand(unsigned RegIdx, bool IsHi) const
Definition: AMDGPUDisassembler.cpp:1208

llvm::AMDGPUDisassembler::errOperand
MCOperand errOperand(unsigned V, const Twine &ErrMsg) const
Definition: AMDGPUDisassembler.cpp:1134

llvm::AMDGPUDisassembler::decodeSDWASrc
MCOperand decodeSDWASrc(const OpWidthTy Width, unsigned Val, unsigned ImmWidth, AMDGPU::OperandSemantics Sema) const
Definition: AMDGPUDisassembler.cpp:1637

llvm::AMDGPUDisassembler::decodeKernelDescriptor
Expected< bool > decodeKernelDescriptor(StringRef KdName, ArrayRef< uint8_t > Bytes, uint64_t KdAddress) const
Definition: AMDGPUDisassembler.cpp:2248

llvm::AMDGPUDisassembler::decodeSplitBarrier
MCOperand decodeSplitBarrier(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1720

llvm::AMDGPUDisassembler::convertVOP3DPPInst
void convertVOP3DPPInst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:893

llvm::AMDGPUDisassembler::convertTrue16OpSel
void convertTrue16OpSel(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:802

llvm::AMDGPUDisassembler::convertFMAanyK
void convertFMAanyK(MCInst &MI, int ImmLitIdx) const
Definition: AMDGPUDisassembler.cpp:1110

llvm::AMDGPUDisassembler::isVI
bool isVI() const
Definition: AMDGPUDisassembler.cpp:1730

llvm::AMDGPUDisassembler::decodeMandatoryLiteralConstant
MCOperand decodeMandatoryLiteralConstant(unsigned Imm) const
Definition: AMDGPUDisassembler.cpp:1216

llvm::AMDGPUDisassembler::decodeNonVGPRSrcOp
MCOperand decodeNonVGPRSrcOp(const OpWidthTy Width, unsigned Val, bool MandatoryLiteral=false, unsigned ImmWidth=0, AMDGPU::OperandSemantics Sema=AMDGPU::OperandSemantics::INT) const
Definition: AMDGPUDisassembler.cpp:1509

llvm::AMDGPUDisassembler::decodeCOMPUTE_PGM_RSRC3
Expected< bool > decodeCOMPUTE_PGM_RSRC3(uint32_t FourByteBuffer, raw_string_ostream &KdStream) const
Decode as directives that handle COMPUTE_PGM_RSRC3.
Definition: AMDGPUDisassembler.cpp:1984

llvm::AMDGPUDisassembler::decodeFPImmed
static MCOperand decodeFPImmed(unsigned ImmWidth, unsigned Imm, AMDGPU::OperandSemantics Sema)
Definition: AMDGPUDisassembler.cpp:1361

llvm::AMDGPUDisassembler::decodeSrcOp
MCOperand decodeSrcOp(const OpWidthTy Width, unsigned Val, bool MandatoryLiteral=false, unsigned ImmWidth=0, AMDGPU::OperandSemantics Sema=AMDGPU::OperandSemantics::INT) const
Definition: AMDGPUDisassembler.cpp:1489

llvm::AMDGPUDisassembler::AMDGPUDisassembler
AMDGPUDisassembler(const MCSubtargetInfo &STI, MCContext &Ctx, MCInstrInfo const *MCII)
Definition: AMDGPUDisassembler.cpp:47

llvm::AMDGPUDisassembler::decodeSpecialReg32
MCOperand decodeSpecialReg32(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1569

llvm::AMDGPUDisassembler::decodeLiteralConstant
MCOperand decodeLiteralConstant(bool ExtendFP64) const
Definition: AMDGPUDisassembler.cpp:1229

llvm::AMDGPUDisassembler::decodeSDWAVopcDst
MCOperand decodeSDWAVopcDst(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1687

llvm::AMDGPUDisassembler::convertVINTERPInst
void convertVINTERPInst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:729

llvm::AMDGPUDisassembler::convertSDWAInst
void convertSDWAInst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:744

llvm::AMDGPUDisassembler::isGFX12Plus
bool isGFX12Plus() const
Definition: AMDGPUDisassembler.cpp:1760

llvm::AMDGPUDisassembler::tryDecodeInst
DecodeStatus tryDecodeInst(const uint8_t *Table, MCInst &MI, InsnType Inst, uint64_t Address, raw_ostream &Comments) const
Definition: AMDGPUDisassembler.h:127

llvm::AMDGPUDisassembler::getSgprClassId
unsigned getSgprClassId(const OpWidthTy Width) const
Definition: AMDGPUDisassembler.cpp:1434

llvm::AMDGPUDisassembler::decodeIntImmed
static MCOperand decodeIntImmed(unsigned Imm)
Definition: AMDGPUDisassembler.cpp:1246

llvm::AMDGPUDisassembler::OpWidthTy
OpWidthTy
Definition: AMDGPUDisassembler.h:210

llvm::AMDGPUDisassembler::OPWV216
@ OPWV216
Definition: AMDGPUDisassembler.h:224

llvm::AMDGPUDisassembler::OPW384
@ OPW384
Definition: AMDGPUDisassembler.h:220

llvm::AMDGPUDisassembler::OPW_FIRST_
@ OPW_FIRST_
Definition: AMDGPUDisassembler.h:227

llvm::AMDGPUDisassembler::OPW32
@ OPW32
Definition: AMDGPUDisassembler.h:211

llvm::AMDGPUDisassembler::OPW512
@ OPW512
Definition: AMDGPUDisassembler.h:221

llvm::AMDGPUDisassembler::OPW96
@ OPW96
Definition: AMDGPUDisassembler.h:213

llvm::AMDGPUDisassembler::OPW128
@ OPW128
Definition: AMDGPUDisassembler.h:214

llvm::AMDGPUDisassembler::OPW_LAST_
@ OPW_LAST_
Definition: AMDGPUDisassembler.h:226

llvm::AMDGPUDisassembler::OPW16
@ OPW16
Definition: AMDGPUDisassembler.h:223

llvm::AMDGPUDisassembler::OPW352
@ OPW352
Definition: AMDGPUDisassembler.h:219

llvm::AMDGPUDisassembler::OPW288
@ OPW288
Definition: AMDGPUDisassembler.h:217

llvm::AMDGPUDisassembler::OPW1024
@ OPW1024
Definition: AMDGPUDisassembler.h:222

llvm::AMDGPUDisassembler::OPW256
@ OPW256
Definition: AMDGPUDisassembler.h:216

llvm::AMDGPUDisassembler::OPWV232
@ OPWV232
Definition: AMDGPUDisassembler.h:225

llvm::AMDGPUDisassembler::OPW320
@ OPW320
Definition: AMDGPUDisassembler.h:218

llvm::AMDGPUDisassembler::OPW64
@ OPW64
Definition: AMDGPUDisassembler.h:212

llvm::AMDGPUDisassembler::OPW160
@ OPW160
Definition: AMDGPUDisassembler.h:215

llvm::AMDGPUDisassembler::isGFX9
bool isGFX9() const
Definition: AMDGPUDisassembler.cpp:1734

llvm::AMDGPUDisassembler::hasArchitectedFlatScratch
bool hasArchitectedFlatScratch() const
Definition: AMDGPUDisassembler.cpp:1764

llvm::AMDGPUDisassembler::getInstruction
DecodeStatus getInstruction(MCInst &MI, uint64_t &Size, ArrayRef< uint8_t > Bytes, uint64_t Address, raw_ostream &CS) const override
Returns the disassembly of a single instruction.
Definition: AMDGPUDisassembler.cpp:449

llvm::AMDGPUDisassembler::getTtmpClassId
unsigned getTtmpClassId(const OpWidthTy Width) const
Definition: AMDGPUDisassembler.cpp:1458

llvm::AMDGPUDisassembler::isGFX90A
bool isGFX90A() const
Definition: AMDGPUDisassembler.cpp:1736

llvm::AMDGPUDisassembler::convertMIMGInst
void convertMIMGInst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:914

llvm::AMDGPUDisassembler::isMacDPP
bool isMacDPP(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:837

llvm::AMDGPUDisassembler::getTTmpIdx
int getTTmpIdx(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1480

llvm::AMDGPUDisassembler::isGFX10
bool isGFX10() const
Definition: AMDGPUDisassembler.cpp:1742

llvm::AMDGPUDisassembler::convertVOP3PDPPInst
void convertVOP3PDPPInst(MCInst &MI) const
Definition: AMDGPUDisassembler.cpp:1063

llvm::AMDGPUDisassembler::createSRegOperand
MCOperand createSRegOperand(unsigned SRegClassID, unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1159

llvm::AMDGPUDisassembler::isGFX11Plus
bool isGFX11Plus() const
Definition: AMDGPUDisassembler.cpp:1752

llvm::AMDGPUDisassembler::decodeSDWASrc16
MCOperand decodeSDWASrc16(unsigned Val) const
Definition: AMDGPUDisassembler.cpp:1679

llvm::AMDGPUDisassembler::onSymbolStart
Expected< bool > onSymbolStart(SymbolInfoTy &Symbol, uint64_t &Size, ArrayRef< uint8_t > Bytes, uint64_t Address) const override
Used to perform separate target specific disassembly for a particular symbol.
Definition: AMDGPUDisassembler.cpp:2288

llvm::AMDGPUSymbolizer
Definition: AMDGPUDisassembler.h:292

llvm::AMDGPUSymbolizer::tryAddingSymbolicOperand
bool tryAddingSymbolicOperand(MCInst &Inst, raw_ostream &cStream, int64_t Value, uint64_t Address, bool IsBranch, uint64_t Offset, uint64_t OpSize, uint64_t InstSize) override
Try to add a symbolic operand instead of Value to the MCInst.
Definition: AMDGPUDisassembler.cpp:2320

llvm::AMDGPUSymbolizer::tryAddingPcLoadReferenceComment
void tryAddingPcLoadReferenceComment(raw_ostream &cStream, int64_t Value, uint64_t Address) override
Try to add a comment on the PC-relative load.
Definition: AMDGPUDisassembler.cpp:2348

llvm::APInt
Class for arbitrary precision integers.
Definition: APInt.h:76

llvm::APInt::sext
APInt sext(unsigned width) const
Sign extend to a new width.
Definition: APInt.cpp:954

llvm::ArrayRef
ArrayRef - Represent a constant reference to an array (0 or more elements consecutively in memory),...
Definition: ArrayRef.h:41

llvm::ArrayRef::size
size_t size() const
size - Get the array size.
Definition: ArrayRef.h:165

llvm::ArrayRef::data
const T * data() const
Definition: ArrayRef.h:162

llvm::ArrayRef::slice
ArrayRef< T > slice(size_t N, size_t M) const
slice(n, m) - Chop off the first N elements of the array, and keep M elements in the array.
Definition: ArrayRef.h:195

llvm::DWARFExpression::Operation
This class represents an Operation in the Expression.
Definition: DWARFExpression.h:32

llvm::DataExtractor::Cursor
A class representing a position in a DataExtractor, as well as any error encountered during extractio...
Definition: DataExtractor.h:54

llvm::DataExtractor::Cursor::tell
uint64_t tell() const
Return the current position of this Cursor.
Definition: DataExtractor.h:71

llvm::DataExtractor
Definition: DataExtractor.h:41

llvm::DataExtractor::getU32
uint32_t getU32(uint64_t *offset_ptr, Error *Err=nullptr) const
Extract a uint32_t value from *offset_ptr.
Definition: DataExtractor.cpp:108

llvm::DataExtractor::getU16
uint16_t getU16(uint64_t *offset_ptr, Error *Err=nullptr) const
Extract a uint16_t value from *offset_ptr.
Definition: DataExtractor.cpp:93

llvm::DataExtractor::skip
void skip(Cursor &C, uint64_t Length) const
Advance the Cursor position by the given number of bytes.
Definition: DataExtractor.cpp:229

llvm::DataExtractor::getBytes
StringRef getBytes(uint64_t *OffsetPtr, uint64_t Length, Error *Err=nullptr) const
Extract a fixed number of bytes from the specified offset.
Definition: DataExtractor.cpp:181

llvm::DecoderUInt128
Definition: AMDGPUDisassembler.h:37

llvm::Error
Lightweight error class with error context and mandatory checking.
Definition: Error.h:160

llvm::Expected
Tagged union holding either a T or a Error.
Definition: Error.h:474

llvm::MCContext
Context object for machine code objects.
Definition: MCContext.h:81

llvm::MCContext::getRegisterInfo
const MCRegisterInfo * getRegisterInfo() const
Definition: MCContext.h:455

llvm::MCContext::getOrCreateSymbol
MCSymbol * getOrCreateSymbol(const Twine &Name)
Lookup the symbol inside with the specified Name.
Definition: MCContext.cpp:201

llvm::MCDisassembler
Superclass for all disassemblers.
Definition: MCDisassembler.h:84

llvm::MCDisassembler::getContext
MCContext & getContext() const
Definition: MCDisassembler.h:215

llvm::MCDisassembler::STI
const MCSubtargetInfo & STI
Definition: MCDisassembler.h:200

llvm::MCDisassembler::CommentStream
raw_ostream * CommentStream
Definition: MCDisassembler.h:224

llvm::MCDisassembler::DecodeStatus
DecodeStatus
Ternary decode status.
Definition: MCDisassembler.h:108

llvm::MCDisassembler::Fail
@ Fail
Definition: MCDisassembler.h:109

llvm::MCDisassembler::Success
@ Success
Definition: MCDisassembler.h:111

llvm::MCInst
Instances of this class represent a single low-level machine instruction.
Definition: MCInst.h:184

llvm::MCInst::getNumOperands
unsigned getNumOperands() const
Definition: MCInst.h:208

llvm::MCInst::getOpcode
unsigned getOpcode() const
Definition: MCInst.h:198

llvm::MCInst::addOperand
void addOperand(const MCOperand Op)
Definition: MCInst.h:210

llvm::MCInst::getOperand
const MCOperand & getOperand(unsigned i) const
Definition: MCInst.h:206

llvm::MCInstrDesc
Describe properties that are true of each instruction in the target description file.
Definition: MCInstrDesc.h:198

llvm::MCInstrInfo
Interface to description of machine instruction set.
Definition: MCInstrInfo.h:26

llvm::MCOperand
Instances of this class represent operands of the MCInst class.
Definition: MCInst.h:36

llvm::MCOperand::createReg
static MCOperand createReg(unsigned Reg)
Definition: MCInst.h:134

llvm::MCOperand::createExpr
static MCOperand createExpr(const MCExpr *Val)
Definition: MCInst.h:162

llvm::MCOperand::getImm
int64_t getImm() const
Definition: MCInst.h:80

llvm::MCOperand::createImm
static MCOperand createImm(int64_t Val)
Definition: MCInst.h:141

llvm::MCOperand::getReg
unsigned getReg() const
Returns the register number.
Definition: MCInst.h:69

llvm::MCOperand::isReg
bool isReg() const
Definition: MCInst.h:61

llvm::MCOperand::isValid
bool isValid() const
Definition: MCInst.h:60

llvm::MCRegisterClass
MCRegisterClass - Base class of TargetRegisterClass.
Definition: MCRegisterInfo.h:35

llvm::MCRegisterClass::getRegister
unsigned getRegister(unsigned i) const
getRegister - Return the specified register in the class.
Definition: MCRegisterInfo.h:66

llvm::MCRegisterClass::contains
bool contains(MCRegister Reg) const
contains - Return true if the specified register is included in this register class.
Definition: MCRegisterInfo.h:73

llvm::MCRegisterInfo
MCRegisterInfo base class - We assume that the target defines a static array of MCRegisterDesc object...
Definition: MCRegisterInfo.h:143

llvm::MCRegisterInfo::getMatchingSuperReg
MCRegister getMatchingSuperReg(MCRegister Reg, unsigned SubIdx, const MCRegisterClass *RC) const
Return a super-register of the specified register Reg so its sub-register of index SubIdx is Reg.
Definition: MCRegisterInfo.cpp:24

llvm::MCRegisterInfo::getEncodingValue
uint16_t getEncodingValue(MCRegister RegNo) const
Returns the encoding for RegNo.
Definition: MCRegisterInfo.h:449

llvm::MCRegisterInfo::getRegClass
const MCRegisterClass & getRegClass(unsigned i) const
Returns the register class associated with the enumeration value.
Definition: MCRegisterInfo.h:439

llvm::MCRegisterInfo::getSubReg
MCRegister getSubReg(MCRegister Reg, unsigned Idx) const
Returns the physical register number of sub-register "Index" for physical register RegNo.
Definition: MCRegisterInfo.cpp:32

llvm::MCSubtargetInfo
Generic base class for all target subtargets.
Definition: MCSubtargetInfo.h:76

llvm::MCSubtargetInfo::hasFeature
bool hasFeature(unsigned Feature) const
Definition: MCSubtargetInfo.h:119

llvm::MCSymbolRefExpr::create
static const MCSymbolRefExpr * create(const MCSymbol *Symbol, MCContext &Ctx)
Definition: MCExpr.h:397

llvm::MCSymbolizer
Symbolize and annotate disassembled instructions.
Definition: MCSymbolizer.h:39

llvm::MCSymbolizer::Ctx
MCContext & Ctx
Definition: MCSymbolizer.h:41

llvm::SmallString
SmallString - A SmallString is just a SmallVector with methods and accessors that make it work better...
Definition: SmallString.h:26

llvm::StringRef
StringRef - Represent a constant reference to a string, i.e.
Definition: StringRef.h:50

llvm::Target
Target - Wrapper for Target specific information.
Definition: TargetRegistry.h:148

llvm::Triple
Triple - Helper class for working with autoconf configuration names.
Definition: Triple.h:44

llvm::Twine
Twine - A lightweight data structure for efficiently representing the concatenation of temporary valu...
Definition: Twine.h:81

llvm::Value
LLVM Value Representation.
Definition: Value.h:74

llvm::raw_ostream
This class implements an extremely fast bulk output stream that can only output to a stream.
Definition: raw_ostream.h:52

llvm::raw_string_ostream
A raw_ostream that writes to an std::string.
Definition: raw_ostream.h:660

llvm::raw_string_ostream::str
std::string & str()
Returns the string's reference.
Definition: raw_ostream.h:678

llvm::raw_svector_ostream
A raw_ostream that writes to an SmallVector or SmallString.
Definition: raw_ostream.h:690

uint16_t

uint32_t

uint64_t

unsigned

LLVMSymbolLookupCallback
const char *(* LLVMSymbolLookupCallback)(void *DisInfo, uint64_t ReferenceValue, uint64_t *ReferenceType, uint64_t ReferencePC, const char **ReferenceName)
The type for the symbol lookup function.
Definition: DisassemblerTypes.h:118

LLVMOpInfoCallback
int(* LLVMOpInfoCallback)(void *DisInfo, uint64_t PC, uint64_t Offset, uint64_t OpSize, uint64_t InstSize, int TagType, void *TagBuf)
The type for the operand information call back function.
Definition: DisassemblerTypes.h:48

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition: ErrorHandling.h:143

OpName
Definition: R600Defines.h:62

llvm::AMDGPU::CPol::GLC
@ GLC
Definition: SIDefines.h:380

llvm::AMDGPU::DPP::DPP8_FI_1
@ DPP8_FI_1
Definition: SIDefines.h:967

llvm::AMDGPU::DPP::DPP8_FI_0
@ DPP8_FI_0
Definition: SIDefines.h:966

llvm::AMDGPU::EncValues::INLINE_FLOATING_C_MAX
@ INLINE_FLOATING_C_MAX
Definition: SIDefines.h:359

llvm::AMDGPU::EncValues::IS_VGPR
@ IS_VGPR
Definition: SIDefines.h:363

llvm::AMDGPU::EncValues::INLINE_FLOATING_C_MIN
@ INLINE_FLOATING_C_MIN
Definition: SIDefines.h:358

llvm::AMDGPU::EncValues::LITERAL_CONST
@ LITERAL_CONST
Definition: SIDefines.h:360

llvm::AMDGPU::HWEncoding::REG_IDX_MASK
@ REG_IDX_MASK
Definition: SIDefines.h:371

llvm::AMDGPU::IsaInfo::getVGPREncodingGranule
unsigned getVGPREncodingGranule(const MCSubtargetInfo *STI, std::optional< bool > EnableWavefrontSize32)
Definition: AMDGPUBaseInfo.cpp:1099

llvm::AMDGPU::IsaInfo::getSGPREncodingGranule
unsigned getSGPREncodingGranule(const MCSubtargetInfo *STI)
Definition: AMDGPUBaseInfo.cpp:982

llvm::AMDGPU::getMIMGInfo
LLVM_READONLY const MIMGInfo * getMIMGInfo(unsigned Opc)

llvm::AMDGPU::getMIMGOpcode
int getMIMGOpcode(unsigned BaseOpcode, unsigned MIMGEncoding, unsigned VDataDwords, unsigned VAddrDwords)
Definition: AMDGPUBaseInfo.cpp:267

llvm::AMDGPU::isGFX10
bool isGFX10(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2189

llvm::AMDGPU::getNamedOperandIdx
LLVM_READONLY int16_t getNamedOperandIdx(uint16_t Opcode, uint16_t NamedIdx)

llvm::AMDGPU::isGFX12Plus
bool isGFX12Plus(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2213

llvm::AMDGPU::hasPackedD16
bool hasPackedD16(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2131

llvm::AMDGPU::isVOPC64DPP
bool isVOPC64DPP(unsigned Opc)
Definition: AMDGPUBaseInfo.cpp:497

llvm::AMDGPU::getAMDHSACodeObjectVersion
unsigned getAMDHSACodeObjectVersion(const Module &M)
Definition: AMDGPUBaseInfo.cpp:166

llvm::AMDGPU::isGFX9
bool isGFX9(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2165

llvm::AMDGPU::getMIMGDimInfoByEncoding
LLVM_READONLY const MIMGDimInfo * getMIMGDimInfoByEncoding(uint8_t DimEnc)

llvm::AMDGPU::hasNamedOperand
LLVM_READONLY bool hasNamedOperand(uint64_t Opcode, uint64_t NamedIdx)
Definition: AMDGPUBaseInfo.h:365

llvm::AMDGPU::hasG16
bool hasG16(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2127

llvm::AMDGPU::getAddrSizeMIMGOp
unsigned getAddrSizeMIMGOp(const MIMGBaseOpcodeInfo *BaseOpcode, const MIMGDimInfo *Dim, bool IsA16, bool IsG16Supported)
Definition: AMDGPUBaseInfo.cpp:287

llvm::AMDGPU::AMDHSA_COV5
@ AMDHSA_COV5
Definition: AMDGPUBaseInfo.h:52

llvm::AMDGPU::isGFX11Plus
bool isGFX11Plus(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2205

llvm::AMDGPU::isGFX10Plus
bool isGFX10Plus(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2197

llvm::AMDGPU::getMCReg
unsigned getMCReg(unsigned Reg, const MCSubtargetInfo &STI)
If Reg is a pseudo reg, return the correct hardware register given STI otherwise return Reg.
Definition: AMDGPUBaseInfo.cpp:2352

llvm::AMDGPU::OperandSemantics
OperandSemantics
Definition: SIDefines.h:274

llvm::AMDGPU::INT
@ INT
Definition: SIDefines.h:275

llvm::AMDGPU::FP32
@ FP32
Definition: SIDefines.h:278

llvm::AMDGPU::FP64
@ FP64
Definition: SIDefines.h:279

llvm::AMDGPU::BF16
@ BF16
Definition: SIDefines.h:277

llvm::AMDGPU::FP16
@ FP16
Definition: SIDefines.h:276

llvm::AMDGPU::OPERAND_REG_IMM_FP32_DEFERRED
@ OPERAND_REG_IMM_FP32_DEFERRED
Definition: SIDefines.h:209

llvm::AMDGPU::OPERAND_REG_IMM_FP16_DEFERRED
@ OPERAND_REG_IMM_FP16_DEFERRED
Definition: SIDefines.h:208

llvm::AMDGPU::hasGDS
bool hasGDS(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2136

llvm::AMDGPU::isGFX9Plus
bool isGFX9Plus(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2185

llvm::AMDGPU::hasKernargPreload
unsigned hasKernargPreload(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2273

llvm::AMDGPU::isMAC
bool isMAC(unsigned Opc)
Definition: AMDGPUBaseInfo.cpp:538

llvm::AMDGPU::getMIMGBaseOpcodeInfo
LLVM_READONLY const MIMGBaseOpcodeInfo * getMIMGBaseOpcodeInfo(unsigned BaseOpcode)

llvm::AMDGPU::hasVOPD
bool hasVOPD(const MCSubtargetInfo &STI)
Definition: AMDGPUBaseInfo.cpp:2265

llvm::CallingConv::C
@ C
The default llvm calling convention, compatible with C.
Definition: CallingConv.h:34

llvm::ELF::STT_NOTYPE
@ STT_NOTYPE
Definition: ELF.h:1322

llvm::ELF::STT_AMDGPU_HSA_KERNEL
@ STT_AMDGPU_HSA_KERNEL
Definition: ELF.h:1336

llvm::ELF::STT_OBJECT
@ STT_OBJECT
Definition: ELF.h:1323

llvm::MCOI::TIED_TO
@ TIED_TO
Definition: MCInstrDesc.h:36

llvm::SIInstrFlags::IsAtomicRet
@ IsAtomicRet
Definition: SIDefines.h:163

llvm::SIInstrFlags::DPP
@ DPP
Definition: SIDefines.h:76

llvm::SIInstrFlags::MIMG
@ MIMG
Definition: SIDefines.h:83

llvm::SIInstrFlags::VINTERP
@ VINTERP
Definition: SIDefines.h:98

llvm::SIInstrFlags::Gather4
@ Gather4
Definition: SIDefines.h:107

llvm::SIInstrFlags::MUBUF
@ MUBUF
Definition: SIDefines.h:80

llvm::SIInstrFlags::SMRD
@ SMRD
Definition: SIDefines.h:82

llvm::SIInstrFlags::SDWA
@ SDWA
Definition: SIDefines.h:75

llvm::SIInstrFlags::EXP
@ EXP
Definition: SIDefines.h:86

llvm::SIInstrFlags::VOPC
@ VOPC
Definition: SIDefines.h:68

llvm::SIInstrFlags::MTBUF
@ MTBUF
Definition: SIDefines.h:81

llvm::SIInstrFlags::VOP3P
@ VOP3P
Definition: SIDefines.h:72

llvm::SIInstrFlags::VSAMPLE
@ VSAMPLE
Definition: SIDefines.h:85

llvm::SIInstrFlags::VOP3
@ VOP3
Definition: SIDefines.h:71

llvm::SIInstrFlags::DS
@ DS
Definition: SIDefines.h:88

llvm::SIInstrFlags::SOPK
@ SOPK
Definition: SIDefines.h:62

llvm::SIInstrFlags::FLAT
@ FLAT
Definition: SIDefines.h:87

llvm::SIInstrFlags::VIMAGE
@ VIMAGE
Definition: SIDefines.h:84

llvm::SISrcMods::OP_SEL_0
@ OP_SEL_0
Definition: SIDefines.h:292

llvm::SISrcMods::DST_OP_SEL
@ DST_OP_SEL
Definition: SIDefines.h:294

llvm::SISrcMods::NEG_HI
@ NEG_HI
Definition: SIDefines.h:291

llvm::SISrcMods::OP_SEL_1
@ OP_SEL_1
Definition: SIDefines.h:293

llvm::SISrcMods::NEG
@ NEG
Definition: SIDefines.h:288

llvm::amdhsa::KERNEL_CODE_PROPERTIES_OFFSET
@ KERNEL_CODE_PROPERTIES_OFFSET
Definition: AMDHSAKernelDescriptor.h:268

llvm::amdhsa::GROUP_SEGMENT_FIXED_SIZE_OFFSET
@ GROUP_SEGMENT_FIXED_SIZE_OFFSET
Definition: AMDHSAKernelDescriptor.h:259

llvm::amdhsa::RESERVED1_OFFSET
@ RESERVED1_OFFSET
Definition: AMDHSAKernelDescriptor.h:264

llvm::amdhsa::COMPUTE_PGM_RSRC3_OFFSET
@ COMPUTE_PGM_RSRC3_OFFSET
Definition: AMDHSAKernelDescriptor.h:265

llvm::amdhsa::KERNEL_CODE_ENTRY_BYTE_OFFSET_OFFSET
@ KERNEL_CODE_ENTRY_BYTE_OFFSET_OFFSET
Definition: AMDHSAKernelDescriptor.h:263

llvm::amdhsa::COMPUTE_PGM_RSRC1_OFFSET
@ COMPUTE_PGM_RSRC1_OFFSET
Definition: AMDHSAKernelDescriptor.h:266

llvm::amdhsa::COMPUTE_PGM_RSRC2_OFFSET
@ COMPUTE_PGM_RSRC2_OFFSET
Definition: AMDHSAKernelDescriptor.h:267

llvm::amdhsa::RESERVED0_OFFSET
@ RESERVED0_OFFSET
Definition: AMDHSAKernelDescriptor.h:262

llvm::amdhsa::PRIVATE_SEGMENT_FIXED_SIZE_OFFSET
@ PRIVATE_SEGMENT_FIXED_SIZE_OFFSET
Definition: AMDHSAKernelDescriptor.h:260

llvm::amdhsa::RESERVED3_OFFSET
@ RESERVED3_OFFSET
Definition: AMDHSAKernelDescriptor.h:270

llvm::amdhsa::KERNARG_SIZE_OFFSET
@ KERNARG_SIZE_OFFSET
Definition: AMDHSAKernelDescriptor.h:261

llvm::amdhsa::KERNARG_PRELOAD_OFFSET
@ KERNARG_PRELOAD_OFFSET
Definition: AMDHSAKernelDescriptor.h:269

llvm::support::endian::read16
uint16_t read16(const void *P, endianness E)
Definition: Endian.h:401

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition: AddressRanges.h:18

llvm::Offset
@ Offset
Definition: DWP.cpp:456

llvm::popcount
int popcount(T Value) noexcept
Count the number of set bits in a value.
Definition: bit.h:385

llvm::outs
raw_fd_ostream & outs()
This returns a reference to a raw_fd_ostream for standard output.
Definition: raw_ostream.cpp:896

llvm::c_str
SmallVectorImpl< T >::const_pointer c_str(SmallVectorImpl< T > &str)
Definition: WindowsSupport.h:196

llvm::createStringError
Error createStringError(std::error_code EC, char const *Fmt, const Ts &... Vals)
Create formatted StringError object.
Definition: Error.h:1258

llvm::countr_zero
int countr_zero(T Val)
Count number of 0's from the least significant bit to the most stopping at the first 1.
Definition: bit.h:215

llvm::report_fatal_error
void report_fatal_error(Error Err, bool gen_crash_diag=true)
Report a serious error, calling any installed error handler.
Definition: Error.cpp:156

llvm::PackElem::Hi
@ Hi

llvm::PackElem::Lo
@ Lo

llvm::cantFail
void cantFail(Error Err, const char *Msg=nullptr)
Report a fatal error if Err is a failure value.
Definition: Error.h:749

llvm::getTheGCNTarget
Target & getTheGCNTarget()
The target for GCN GPUs.
Definition: AMDGPUTargetInfo.cpp:25

llvm::RecurKind::Add
@ Add
Sum of integers.

llvm::SectionSymbolsTy
std::vector< SymbolInfoTy > SectionSymbolsTy
Definition: MCDisassembler.h:74

llvm::M0
unsigned M0(unsigned Val)
Definition: VE.h:375

llvm::HighlightColor::Address
@ Address

llvm::find_if
auto find_if(R &&Range, UnaryPredicate P)
Provide wrappers to std::find_if which take ranges instead of having to pass begin/end explicitly.
Definition: STLExtras.h:1749

llvm::endianness::little
@ little

VOPModifiers
Definition: AMDGPUDisassembler.cpp:763

VOPModifiers::NegHi
unsigned NegHi
Definition: AMDGPUDisassembler.cpp:767

VOPModifiers::OpSel
unsigned OpSel
Definition: AMDGPUDisassembler.cpp:764

VOPModifiers::NegLo
unsigned NegLo
Definition: AMDGPUDisassembler.cpp:766

VOPModifiers::OpSelHi
unsigned OpSelHi
Definition: AMDGPUDisassembler.cpp:765

llvm::AMDGPU::MIMGBaseOpcodeInfo
Definition: AMDGPUBaseInfo.h:372

llvm::AMDGPU::MIMGBaseOpcodeInfo::A16
bool A16
Definition: AMDGPUBaseInfo.h:388

llvm::AMDGPU::MIMGBaseOpcodeInfo::BVH
bool BVH
Definition: AMDGPUBaseInfo.h:387

llvm::AMDGPU::MIMGDimInfo
Definition: AMDGPUBaseInfo.h:397

llvm::AMDGPU::MIMGInfo
Definition: AMDGPUBaseInfo.h:473

llvm::DWARFExpression::Operation::Description
Description of the encoding of one expression Op.
Definition: DWARFExpression.h:66

llvm::SymbolInfoTy
Definition: MCDisassembler.h:29

llvm::SymbolInfoTy::Type
uint8_t Type
Definition: MCDisassembler.h:34

llvm::SymbolInfoTy::Addr
uint64_t Addr
Definition: MCDisassembler.h:30

llvm::TargetRegistry::RegisterMCSymbolizer
static void RegisterMCSymbolizer(Target &T, Target::MCSymbolizerCtorTy Fn)
RegisterMCSymbolizer - Register an MCSymbolizer implementation for the given target.
Definition: TargetRegistry.h:1081

llvm::TargetRegistry::RegisterMCDisassembler
static void RegisterMCDisassembler(Target &T, Target::MCDisassemblerCtorTy Fn)
RegisterMCDisassembler - Register a MCDisassembler implementation for the given target.
Definition: TargetRegistry.h:979