docs/doxygen/HexagonTargetTransformInfo_8h_source.html

//==- HexagonTargetTransformInfo.cpp - Hexagon specific TTI pass -*- C++ -*-==//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

/// \file

/// This file implements a TargetTransformInfo analysis pass specific to the

/// Hexagon target machine. It uses the target's detailed information to provide

/// more precise answers to certain TTI queries, while letting the target

/// independent and default TTI implementations handle the rest.

///

//===----------------------------------------------------------------------===//


#ifndef LLVM_LIB_TARGET_HEXAGON_HEXAGONTARGETTRANSFORMINFO_H

#define LLVM_LIB_TARGET_HEXAGON_HEXAGONTARGETTRANSFORMINFO_H


#include "Hexagon.h"

#include "HexagonSubtarget.h"

#include "HexagonTargetMachine.h"

#include "llvm/ADT/ArrayRef.h"

#include "llvm/Analysis/TargetTransformInfo.h"

#include "llvm/CodeGen/BasicTTIImpl.h"

#include "llvm/IR/Function.h"


namespace llvm {


class Loop;

class ScalarEvolution;

class User;

class Value;


class HexagonTTIImpl : public BasicTTIImplBase<HexagonTTIImpl> {

  using BaseT = BasicTTIImplBase<HexagonTTIImpl>;

  using TTI = TargetTransformInfo;


  friend BaseT;


  const HexagonSubtarget &ST;

  const HexagonTargetLowering &TLI;


  const HexagonSubtarget *getST() const { return &ST; }

  const HexagonTargetLowering *getTLI() const { return &TLI; }


  bool useHVX() const;

  bool isHVXVectorType(Type *Ty) const;


  // Returns the number of vector elements of Ty, if Ty is a vector type,

  // or 1 if Ty is a scalar type. It is incorrect to call this function

  // with any other type.

  unsigned getTypeNumElements(Type *Ty) const;


public:

  explicit HexagonTTIImpl(const HexagonTargetMachine *TM, const Function &F)

      : BaseT(TM, F.getDataLayout()),

        ST(*TM->getSubtargetImpl(F)), TLI(*ST.getTargetLowering()) {}


  /// \name Scalar TTI Implementations

  /// @{


  TTI::PopcntSupportKind getPopcntSupport(unsigned IntTyWidthInBit) const;


  // The Hexagon target can unroll loops with run-time trip counts.

  void getUnrollingPreferences(Loop *L, ScalarEvolution &SE,

                               TTI::UnrollingPreferences &UP,

                               OptimizationRemarkEmitter *ORE);


  void getPeelingPreferences(Loop *L, ScalarEvolution &SE,

                             TTI::PeelingPreferences &PP);


  /// Bias LSR towards creating post-increment opportunities.

  TTI::AddressingModeKind

    getPreferredAddressingMode(const Loop *L, ScalarEvolution *SE) const;


  // L1 cache prefetch.

  unsigned getPrefetchDistance() const override;

  unsigned getCacheLineSize() const override;


  /// @}


  /// \name Vector TTI Implementations

  /// @{


  unsigned getNumberOfRegisters(bool vector) const;

  unsigned getMaxInterleaveFactor(ElementCount VF);

  TypeSize getRegisterBitWidth(TargetTransformInfo::RegisterKind K) const;

  unsigned getMinVectorRegisterBitWidth() const;

  ElementCount getMinimumVF(unsigned ElemWidth, bool IsScalable) const;


  bool

  shouldMaximizeVectorBandwidth(TargetTransformInfo::RegisterKind K) const {

    return true;

  }

  bool supportsEfficientVectorElementLoadStore() { return false; }

  bool hasBranchDivergence(const Function *F = nullptr) { return false; }

  bool enableAggressiveInterleaving(bool LoopHasReductions) {

    return false;

  }

  bool prefersVectorizedAddressing() {

    return false;

  }

  bool enableInterleavedAccessVectorization() {

    return true;

  }


  InstructionCost getCallInstrCost(Function *F, Type *RetTy,

                                   ArrayRef<Type *> Tys,

                                   TTI::TargetCostKind CostKind);

  InstructionCost getIntrinsicInstrCost(const IntrinsicCostAttributes &ICA,

                                        TTI::TargetCostKind CostKind);

  InstructionCost getAddressComputationCost(Type *Tp, ScalarEvolution *SE,

                                            const SCEV *S);

  InstructionCost

  getMemoryOpCost(unsigned Opcode, Type *Src, MaybeAlign Alignment,

                  unsigned AddressSpace, TTI::TargetCostKind CostKind,

                  TTI::OperandValueInfo OpInfo = {TTI::OK_AnyValue, TTI::OP_None},

                  const Instruction *I = nullptr);

  InstructionCost getMaskedMemoryOpCost(unsigned Opcode, Type *Src,

                                        Align Alignment, unsigned AddressSpace,

                                        TTI::TargetCostKind CostKind);

  InstructionCost getShuffleCost(TTI::ShuffleKind Kind, Type *Tp,

                                 ArrayRef<int> Mask,

                                 TTI::TargetCostKind CostKind, int Index,

                                 Type *SubTp, ArrayRef<const Value *> Args = {},

                                 const Instruction *CxtI = nullptr);

  InstructionCost getGatherScatterOpCost(unsigned Opcode, Type *DataTy,

                                         const Value *Ptr, bool VariableMask,

                                         Align Alignment,

                                         TTI::TargetCostKind CostKind,

                                         const Instruction *I);

  InstructionCost getInterleavedMemoryOpCost(

      unsigned Opcode, Type *VecTy, unsigned Factor, ArrayRef<unsigned> Indices,

      Align Alignment, unsigned AddressSpace, TTI::TargetCostKind CostKind,

      bool UseMaskForCond = false, bool UseMaskForGaps = false);

  InstructionCost getCmpSelInstrCost(

      unsigned Opcode, Type *ValTy, Type *CondTy, CmpInst::Predicate VecPred,

      TTI::TargetCostKind CostKind,

      TTI::OperandValueInfo Op1Info = {TTI::OK_AnyValue, TTI::OP_None},

      TTI::OperandValueInfo Op2Info = {TTI::OK_AnyValue, TTI::OP_None},

      const Instruction *I = nullptr);

  InstructionCost getArithmeticInstrCost(

      unsigned Opcode, Type *Ty, TTI::TargetCostKind CostKind,

      TTI::OperandValueInfo Op1Info = {TTI::OK_AnyValue, TTI::OP_None},

      TTI::OperandValueInfo Op2Info = {TTI::OK_AnyValue, TTI::OP_None},

      ArrayRef<const Value *> Args = {}, const Instruction *CxtI = nullptr);

  InstructionCost getCastInstrCost(unsigned Opcode, Type *Dst, Type *Src,

                                   TTI::CastContextHint CCH,

                                   TTI::TargetCostKind CostKind,

                                   const Instruction *I = nullptr);

  using BaseT::getVectorInstrCost;

  InstructionCost getVectorInstrCost(unsigned Opcode, Type *Val,

                                     TTI::TargetCostKind CostKind,

                                     unsigned Index, Value *Op0, Value *Op1);


  InstructionCost getCFInstrCost(unsigned Opcode, TTI::TargetCostKind CostKind,

                                 const Instruction *I = nullptr) {

    return 1;

  }


  bool isLegalMaskedStore(Type *DataType, Align Alignment);

  bool isLegalMaskedLoad(Type *DataType, Align Alignment);


  /// @}


  InstructionCost getInstructionCost(const User *U,

                                     ArrayRef<const Value *> Operands,

                                     TTI::TargetCostKind CostKind);


  // Hexagon specific decision to generate a lookup table.

  bool shouldBuildLookupTables() const;

};


} // end namespace llvm

#endif // LLVM_LIB_TARGET_HEXAGON_HEXAGONTARGETTRANSFORMINFO_H

vector
AMDGPU promote alloca to vector or false DEBUG_TYPE to vector
Definition: AMDGPUPromoteAlloca.cpp:214

ArrayRef.h

BasicTTIImpl.h
This file provides a helper that implements much of the TTI interface in terms of the target-independ...

CostKind
static cl::opt< TargetTransformInfo::TargetCostKind > CostKind("cost-kind", cl::desc("Target cost kind"), cl::init(TargetTransformInfo::TCK_RecipThroughput), cl::values(clEnumValN(TargetTransformInfo::TCK_RecipThroughput, "throughput", "Reciprocal throughput"), clEnumValN(TargetTransformInfo::TCK_Latency, "latency", "Instruction latency"), clEnumValN(TargetTransformInfo::TCK_CodeSize, "code-size", "Code size"), clEnumValN(TargetTransformInfo::TCK_SizeAndLatency, "size-latency", "Code size and latency")))

RetTy
return RetTy
Definition: DeadArgumentElimination.cpp:361

Index
uint32_t Index
Definition: ELFObjHandler.cpp:83

HexagonSubtarget.h

HexagonTargetMachine.h

Hexagon.h

Function.h

F
#define F(x, y, z)
Definition: MD5.cpp:55

I
#define I(x, y, z)
Definition: MD5.cpp:58

Operands
mir Rename Register Operands
Definition: MIRNamerPass.cpp:74

Ptr
@ Ptr
Definition: TargetLibraryInfo.cpp:77

TargetTransformInfo.h
This pass exposes codegen information to IR-level passes.

llvm::ArrayRef
ArrayRef - Represent a constant reference to an array (0 or more elements consecutively in memory),...
Definition: ArrayRef.h:41

llvm::BasicTTIImplBase
Base class which can be used to help build a TTI implementation.
Definition: BasicTTIImpl.h:80

llvm::BasicTTIImplBase< HexagonTTIImpl >::getVectorInstrCost
InstructionCost getVectorInstrCost(unsigned Opcode, Type *Val, TTI::TargetCostKind CostKind, unsigned Index, Value *Op0, Value *Op1)
Definition: BasicTTIImpl.h:1346

llvm::CmpInst::Predicate
Predicate
This enumeration lists the possible predicates for CmpInst subclasses.
Definition: InstrTypes.h:673

llvm::ElementCount
Definition: TypeSize.h:300

llvm::Function
Definition: Function.h:63

llvm::HexagonSubtarget
Definition: HexagonSubtarget.h:43

llvm::HexagonTTIImpl
Definition: HexagonTargetTransformInfo.h:33

llvm::HexagonTTIImpl::getMemoryOpCost
InstructionCost getMemoryOpCost(unsigned Opcode, Type *Src, MaybeAlign Alignment, unsigned AddressSpace, TTI::TargetCostKind CostKind, TTI::OperandValueInfo OpInfo={TTI::OK_AnyValue, TTI::OP_None}, const Instruction *I=nullptr)
Definition: HexagonTargetTransformInfo.cpp:164

llvm::HexagonTTIImpl::getCastInstrCost
InstructionCost getCastInstrCost(unsigned Opcode, Type *Dst, Type *Src, TTI::CastContextHint CCH, TTI::TargetCostKind CostKind, const Instruction *I=nullptr)
Definition: HexagonTargetTransformInfo.cpp:294

llvm::HexagonTTIImpl::enableAggressiveInterleaving
bool enableAggressiveInterleaving(bool LoopHasReductions)
Definition: HexagonTargetTransformInfo.h:96

llvm::HexagonTTIImpl::getUnrollingPreferences
void getUnrollingPreferences(Loop *L, ScalarEvolution &SE, TTI::UnrollingPreferences &UP, OptimizationRemarkEmitter *ORE)
Definition: HexagonTargetTransformInfo.cpp:81

llvm::HexagonTTIImpl::isLegalMaskedLoad
bool isLegalMaskedLoad(Type *DataType, Align Alignment)
Definition: HexagonTargetTransformInfo.cpp:349

llvm::HexagonTTIImpl::getAddressComputationCost
InstructionCost getAddressComputationCost(Type *Tp, ScalarEvolution *SE, const SCEV *S)
Definition: HexagonTargetTransformInfo.cpp:158

llvm::HexagonTTIImpl::getGatherScatterOpCost
InstructionCost getGatherScatterOpCost(unsigned Opcode, Type *DataTy, const Value *Ptr, bool VariableMask, Align Alignment, TTI::TargetCostKind CostKind, const Instruction *I)
Definition: HexagonTargetTransformInfo.cpp:238

llvm::HexagonTTIImpl::getNumberOfRegisters
unsigned getNumberOfRegisters(bool vector) const
— Vector TTI begin —
Definition: HexagonTargetTransformInfo.cpp:107

llvm::HexagonTTIImpl::shouldMaximizeVectorBandwidth
bool shouldMaximizeVectorBandwidth(TargetTransformInfo::RegisterKind K) const
Definition: HexagonTargetTransformInfo.h:91

llvm::HexagonTTIImpl::getInterleavedMemoryOpCost
InstructionCost getInterleavedMemoryOpCost(unsigned Opcode, Type *VecTy, unsigned Factor, ArrayRef< unsigned > Indices, Align Alignment, unsigned AddressSpace, TTI::TargetCostKind CostKind, bool UseMaskForCond=false, bool UseMaskForGaps=false)
Definition: HexagonTargetTransformInfo.cpp:245

llvm::HexagonTTIImpl::getMaskedMemoryOpCost
InstructionCost getMaskedMemoryOpCost(unsigned Opcode, Type *Src, Align Alignment, unsigned AddressSpace, TTI::TargetCostKind CostKind)
Definition: HexagonTargetTransformInfo.cpp:222

llvm::HexagonTTIImpl::supportsEfficientVectorElementLoadStore
bool supportsEfficientVectorElementLoadStore()
Definition: HexagonTargetTransformInfo.h:94

llvm::HexagonTTIImpl::getVectorInstrCost
InstructionCost getVectorInstrCost(unsigned Opcode, Type *Val, TTI::TargetCostKind CostKind, unsigned Index, Value *Op0, Value *Op1)
Definition: HexagonTargetTransformInfo.cpp:321

llvm::HexagonTTIImpl::shouldBuildLookupTables
bool shouldBuildLookupTables() const
Definition: HexagonTargetTransformInfo.cpp:393

llvm::HexagonTTIImpl::getIntrinsicInstrCost
InstructionCost getIntrinsicInstrCost(const IntrinsicCostAttributes &ICA, TTI::TargetCostKind CostKind)
Definition: HexagonTargetTransformInfo.cpp:148

llvm::HexagonTTIImpl::getCFInstrCost
InstructionCost getCFInstrCost(unsigned Opcode, TTI::TargetCostKind CostKind, const Instruction *I=nullptr)
Definition: HexagonTargetTransformInfo.h:155

llvm::HexagonTTIImpl::getRegisterBitWidth
TypeSize getRegisterBitWidth(TargetTransformInfo::RegisterKind K) const
Definition: HexagonTargetTransformInfo.cpp:118

llvm::HexagonTTIImpl::getPeelingPreferences
void getPeelingPreferences(Loop *L, ScalarEvolution &SE, TTI::PeelingPreferences &PP)
Definition: HexagonTargetTransformInfo.cpp:87

llvm::HexagonTTIImpl::HexagonTTIImpl
HexagonTTIImpl(const HexagonTargetMachine *TM, const Function &F)
Definition: HexagonTargetTransformInfo.h:54

llvm::HexagonTTIImpl::isLegalMaskedStore
bool isLegalMaskedStore(Type *DataType, Align Alignment)
Definition: HexagonTargetTransformInfo.cpp:343

llvm::HexagonTTIImpl::getPreferredAddressingMode
TTI::AddressingModeKind getPreferredAddressingMode(const Loop *L, ScalarEvolution *SE) const
Bias LSR towards creating post-increment opportunities.
Definition: HexagonTargetTransformInfo.cpp:100

llvm::HexagonTTIImpl::getCmpSelInstrCost
InstructionCost getCmpSelInstrCost(unsigned Opcode, Type *ValTy, Type *CondTy, CmpInst::Predicate VecPred, TTI::TargetCostKind CostKind, TTI::OperandValueInfo Op1Info={TTI::OK_AnyValue, TTI::OP_None}, TTI::OperandValueInfo Op2Info={TTI::OK_AnyValue, TTI::OP_None}, const Instruction *I=nullptr)
Definition: HexagonTargetTransformInfo.cpp:258

llvm::HexagonTTIImpl::getMinVectorRegisterBitWidth
unsigned getMinVectorRegisterBitWidth() const
Definition: HexagonTargetTransformInfo.cpp:131

llvm::HexagonTTIImpl::getInstructionCost
InstructionCost getInstructionCost(const User *U, ArrayRef< const Value * > Operands, TTI::TargetCostKind CostKind)
Definition: HexagonTargetTransformInfo.cpp:366

llvm::HexagonTTIImpl::getShuffleCost
InstructionCost getShuffleCost(TTI::ShuffleKind Kind, Type *Tp, ArrayRef< int > Mask, TTI::TargetCostKind CostKind, int Index, Type *SubTp, ArrayRef< const Value * > Args={}, const Instruction *CxtI=nullptr)
Definition: HexagonTargetTransformInfo.cpp:229

llvm::HexagonTTIImpl::getMinimumVF
ElementCount getMinimumVF(unsigned ElemWidth, bool IsScalable) const
Definition: HexagonTargetTransformInfo.cpp:135

llvm::HexagonTTIImpl::getCallInstrCost
InstructionCost getCallInstrCost(Function *F, Type *RetTy, ArrayRef< Type * > Tys, TTI::TargetCostKind CostKind)
Definition: HexagonTargetTransformInfo.cpp:141

llvm::HexagonTTIImpl::getArithmeticInstrCost
InstructionCost getArithmeticInstrCost(unsigned Opcode, Type *Ty, TTI::TargetCostKind CostKind, TTI::OperandValueInfo Op1Info={TTI::OK_AnyValue, TTI::OP_None}, TTI::OperandValueInfo Op2Info={TTI::OK_AnyValue, TTI::OP_None}, ArrayRef< const Value * > Args={}, const Instruction *CxtI=nullptr)
Definition: HexagonTargetTransformInfo.cpp:273

llvm::HexagonTTIImpl::enableInterleavedAccessVectorization
bool enableInterleavedAccessVectorization()
Definition: HexagonTargetTransformInfo.h:102

llvm::HexagonTTIImpl::getCacheLineSize
unsigned getCacheLineSize() const override
Definition: HexagonTargetTransformInfo.cpp:361

llvm::HexagonTTIImpl::hasBranchDivergence
bool hasBranchDivergence(const Function *F=nullptr)
Definition: HexagonTargetTransformInfo.h:95

llvm::HexagonTTIImpl::getPrefetchDistance
unsigned getPrefetchDistance() const override
— Vector TTI end —
Definition: HexagonTargetTransformInfo.cpp:357

llvm::HexagonTTIImpl::prefersVectorizedAddressing
bool prefersVectorizedAddressing()
Definition: HexagonTargetTransformInfo.h:99

llvm::HexagonTTIImpl::getPopcntSupport
TTI::PopcntSupportKind getPopcntSupport(unsigned IntTyWidthInBit) const
Definition: HexagonTargetTransformInfo.cpp:74

llvm::HexagonTTIImpl::getMaxInterleaveFactor
unsigned getMaxInterleaveFactor(ElementCount VF)
Definition: HexagonTargetTransformInfo.cpp:113

llvm::HexagonTargetLowering
Definition: HexagonISelLowering.h:127

llvm::HexagonTargetMachine
Definition: HexagonTargetMachine.h:24

llvm::InstructionCost
Definition: InstructionCost.h:29

llvm::Instruction
Definition: Instruction.h:68

llvm::IntrinsicCostAttributes
Definition: TargetTransformInfo.h:119

llvm::Loop
Represents a single loop in the control flow graph.
Definition: LoopInfo.h:39

llvm::OptimizationRemarkEmitter
The optimization diagnostic interface.
Definition: OptimizationRemarkEmitter.h:32

llvm::SCEV
This class represents an analyzed expression in the program.
Definition: ScalarEvolution.h:71

llvm::ScalarEvolution
The main scalar evolution driver.
Definition: ScalarEvolution.h:447

llvm::TargetTransformInfoImplBase::getDataLayout
const DataLayout & getDataLayout() const
Definition: TargetTransformInfoImpl.h:48

llvm::TargetTransformInfo
This pass provides access to the codegen interfaces that are needed for IR-level transformations.
Definition: TargetTransformInfo.h:212

llvm::TargetTransformInfo::TargetCostKind
TargetCostKind
The kind of cost model.
Definition: TargetTransformInfo.h:257

llvm::TargetTransformInfo::OP_None
@ OP_None
Definition: TargetTransformInfo.h:1116

llvm::TargetTransformInfo::RegisterKind
RegisterKind
Definition: TargetTransformInfo.h:1169

llvm::TargetTransformInfo::PopcntSupportKind
PopcntSupportKind
Flags indicating the kind of support for population count.
Definition: TargetTransformInfo.h:708

llvm::TargetTransformInfo::AddressingModeKind
AddressingModeKind
Definition: TargetTransformInfo.h:769

llvm::TargetTransformInfo::ShuffleKind
ShuffleKind
The various kinds of shuffle patterns for vector queries.
Definition: TargetTransformInfo.h:1087

llvm::TargetTransformInfo::CastContextHint
CastContextHint
Represents a hint about the context in which a cast is used.
Definition: TargetTransformInfo.h:1364

llvm::TargetTransformInfo::OK_AnyValue
@ OK_AnyValue
Definition: TargetTransformInfo.h:1108

llvm::TypeSize
Definition: TypeSize.h:334

llvm::Type
The instances of the Type class are immutable: once they are created, they are never changed.
Definition: Type.h:45

llvm::User
Definition: User.h:44

llvm::AMDGPU::HSAMD::Kernel::Key::Args
constexpr char Args[]
Key for Kernel::Metadata::mArgs.
Definition: AMDGPUMetadata.h:395

llvm::NVPTXAS::AddressSpace
AddressSpace
Definition: NVPTXAddrSpace.h:20

llvm::TargetStackID::Value
Value
Definition: TargetFrameLowering.h:29

llvm::objcarc::ARCInstKind::User
@ User
could "use" a pointer

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition: AddressRanges.h:18

llvm::Align
This struct is a compact representation of a valid (non-zero power of two) alignment.
Definition: Alignment.h:39

llvm::MaybeAlign
This struct is a compact representation of a valid (power of two) or undefined (0) alignment.
Definition: Alignment.h:117

llvm::TargetTransformInfo::OperandValueInfo
Definition: TargetTransformInfo.h:1124

llvm::TargetTransformInfo::PeelingPreferences
Definition: TargetTransformInfo.h:652

llvm::TargetTransformInfo::UnrollingPreferences
Parameters that control the generic loop unrolling transformation.
Definition: TargetTransformInfo.h:530