docs/doxygen/DXILIntrinsicExpansion_8cpp_source.html

//===- DXILIntrinsicExpansion.cpp - Prepare LLVM Module for DXIL encoding--===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

///

/// \file This file contains DXIL intrinsic expansions for those that don't have

//  opcodes in DirectX Intermediate Language (DXIL).

//===----------------------------------------------------------------------===//


#include "DXILIntrinsicExpansion.h"

#include "DirectX.h"

#include "llvm/ADT/STLExtras.h"

#include "llvm/ADT/SmallVector.h"

#include "llvm/CodeGen/Passes.h"

#include "llvm/IR/IRBuilder.h"

#include "llvm/IR/InstrTypes.h"

#include "llvm/IR/Instruction.h"

#include "llvm/IR/Instructions.h"

#include "llvm/IR/Intrinsics.h"

#include "llvm/IR/IntrinsicsDirectX.h"

#include "llvm/IR/Module.h"

#include "llvm/IR/PassManager.h"

#include "llvm/IR/Type.h"

#include "llvm/Pass.h"

#include "llvm/Support/ErrorHandling.h"

#include "llvm/Support/MathExtras.h"


#define DEBUG_TYPE "dxil-intrinsic-expansion"


using namespace llvm;


class DXILIntrinsicExpansionLegacy : public ModulePass {


public:

  bool runOnModule(Module &M) override;

  DXILIntrinsicExpansionLegacy() : ModulePass(ID) {}


  static char ID; // Pass identification.

};


static bool isIntrinsicExpansion(Function &F) {

  switch (F.getIntrinsicID()) {

  case Intrinsic::abs:

  case Intrinsic::atan2:

  case Intrinsic::exp:

  case Intrinsic::log:

  case Intrinsic::log10:

  case Intrinsic::pow:

  case Intrinsic::dx_all:

  case Intrinsic::dx_any:

  case Intrinsic::dx_cross:

  case Intrinsic::dx_uclamp:

  case Intrinsic::dx_sclamp:

  case Intrinsic::dx_nclamp:

  case Intrinsic::dx_degrees:

  case Intrinsic::dx_lerp:

  case Intrinsic::dx_normalize:

  case Intrinsic::dx_fdot:

  case Intrinsic::dx_sdot:

  case Intrinsic::dx_udot:

  case Intrinsic::dx_sign:

  case Intrinsic::dx_step:

  case Intrinsic::dx_radians:

  case Intrinsic::vector_reduce_add:

  case Intrinsic::vector_reduce_fadd:

    return true;

  }

  return false;

}

static Value *expandVecReduceAdd(CallInst *Orig, Intrinsic::ID IntrinsicId) {

  assert(IntrinsicId == Intrinsic::vector_reduce_add ||

         IntrinsicId == Intrinsic::vector_reduce_fadd);


  IRBuilder<> Builder(Orig);

  bool IsFAdd = (IntrinsicId == Intrinsic::vector_reduce_fadd);


  Value *X = Orig->getOperand(IsFAdd ? 1 : 0);

  Type *Ty = X->getType();

  auto *XVec = dyn_cast<FixedVectorType>(Ty);

  unsigned XVecSize = XVec->getNumElements();

  Value *Sum = Builder.CreateExtractElement(X, static_cast<uint64_t>(0));


  // Handle the initial start value for floating-point addition.

  if (IsFAdd) {

    Constant *StartValue = dyn_cast<Constant>(Orig->getOperand(0));

    if (StartValue && !StartValue->isZeroValue())

      Sum = Builder.CreateFAdd(Sum, StartValue);

  }


  // Accumulate the remaining vector elements.

  for (unsigned I = 1; I < XVecSize; I++) {

    Value *Elt = Builder.CreateExtractElement(X, I);

    if (IsFAdd)

      Sum = Builder.CreateFAdd(Sum, Elt);

    else

      Sum = Builder.CreateAdd(Sum, Elt);

  }


  return Sum;

}


static Value *expandAbs(CallInst *Orig) {

  Value *X = Orig->getOperand(0);

  IRBuilder<> Builder(Orig);

  Type *Ty = X->getType();

  Type *EltTy = Ty->getScalarType();

  Constant *Zero = Ty->isVectorTy()

                       ? ConstantVector::getSplat(

                             ElementCount::getFixed(

                                 cast<FixedVectorType>(Ty)->getNumElements()),

                             ConstantInt::get(EltTy, 0))

                       : ConstantInt::get(EltTy, 0);

  auto *V = Builder.CreateSub(Zero, X);

  return Builder.CreateIntrinsic(Ty, Intrinsic::smax, {X, V}, nullptr,

                                 "dx.max");

}


static Value *expandCrossIntrinsic(CallInst *Orig) {


  VectorType *VT = cast<VectorType>(Orig->getType());

  if (cast<FixedVectorType>(VT)->getNumElements() != 3)

    report_fatal_error(Twine("return vector must have exactly 3 elements"),

                       /* gen_crash_diag=*/false);


  Value *op0 = Orig->getOperand(0);

  Value *op1 = Orig->getOperand(1);

  IRBuilder<> Builder(Orig);


  Value *op0_x = Builder.CreateExtractElement(op0, (uint64_t)0, "x0");

  Value *op0_y = Builder.CreateExtractElement(op0, 1, "x1");

  Value *op0_z = Builder.CreateExtractElement(op0, 2, "x2");


  Value *op1_x = Builder.CreateExtractElement(op1, (uint64_t)0, "y0");

  Value *op1_y = Builder.CreateExtractElement(op1, 1, "y1");

  Value *op1_z = Builder.CreateExtractElement(op1, 2, "y2");


  auto MulSub = [&](Value *x0, Value *y0, Value *x1, Value *y1) -> Value * {

    Value *xy = Builder.CreateFMul(x0, y1);

    Value *yx = Builder.CreateFMul(y0, x1);

    return Builder.CreateFSub(xy, yx, Orig->getName());

  };


  Value *yz_zy = MulSub(op0_y, op0_z, op1_y, op1_z);

  Value *zx_xz = MulSub(op0_z, op0_x, op1_z, op1_x);

  Value *xy_yx = MulSub(op0_x, op0_y, op1_x, op1_y);


  Value *cross = UndefValue::get(VT);

  cross = Builder.CreateInsertElement(cross, yz_zy, (uint64_t)0);

  cross = Builder.CreateInsertElement(cross, zx_xz, 1);

  cross = Builder.CreateInsertElement(cross, xy_yx, 2);

  return cross;

}


// Create appropriate DXIL float dot intrinsic for the given A and B operands

// The appropriate opcode will be determined by the size of the operands

// The dot product is placed in the position indicated by Orig

static Value *expandFloatDotIntrinsic(CallInst *Orig, Value *A, Value *B) {

  Type *ATy = A->getType();

  [[maybe_unused]] Type *BTy = B->getType();

  assert(ATy->isVectorTy() && BTy->isVectorTy());


  IRBuilder<> Builder(Orig);


  auto *AVec = dyn_cast<FixedVectorType>(ATy);


  assert(ATy->getScalarType()->isFloatingPointTy());


  Intrinsic::ID DotIntrinsic = Intrinsic::dx_dot4;

  switch (AVec->getNumElements()) {

  case 2:

    DotIntrinsic = Intrinsic::dx_dot2;

    break;

  case 3:

    DotIntrinsic = Intrinsic::dx_dot3;

    break;

  case 4:

    DotIntrinsic = Intrinsic::dx_dot4;

    break;

  default:

    report_fatal_error(

        Twine("Invalid dot product input vector: length is outside 2-4"),

        /* gen_crash_diag=*/false);

    return nullptr;

  }

  return Builder.CreateIntrinsic(ATy->getScalarType(), DotIntrinsic,

                                 ArrayRef<Value *>{A, B}, nullptr, "dot");

}


// Create the appropriate DXIL float dot intrinsic for the operands of Orig

// The appropriate opcode will be determined by the size of the operands

// The dot product is placed in the position indicated by Orig

static Value *expandFloatDotIntrinsic(CallInst *Orig) {

  return expandFloatDotIntrinsic(Orig, Orig->getOperand(0),

                                 Orig->getOperand(1));

}


// Expand integer dot product to multiply and add ops

static Value *expandIntegerDotIntrinsic(CallInst *Orig,

                                        Intrinsic::ID DotIntrinsic) {

  assert(DotIntrinsic == Intrinsic::dx_sdot ||

         DotIntrinsic == Intrinsic::dx_udot);

  Value *A = Orig->getOperand(0);

  Value *B = Orig->getOperand(1);

  Type *ATy = A->getType();

  [[maybe_unused]] Type *BTy = B->getType();

  assert(ATy->isVectorTy() && BTy->isVectorTy());


  IRBuilder<> Builder(Orig);


  auto *AVec = dyn_cast<FixedVectorType>(ATy);


  assert(ATy->getScalarType()->isIntegerTy());


  Value *Result;

  Intrinsic::ID MadIntrinsic = DotIntrinsic == Intrinsic::dx_sdot

                                   ? Intrinsic::dx_imad

                                   : Intrinsic::dx_umad;

  Value *Elt0 = Builder.CreateExtractElement(A, (uint64_t)0);

  Value *Elt1 = Builder.CreateExtractElement(B, (uint64_t)0);

  Result = Builder.CreateMul(Elt0, Elt1);

  for (unsigned I = 1; I < AVec->getNumElements(); I++) {

    Elt0 = Builder.CreateExtractElement(A, I);

    Elt1 = Builder.CreateExtractElement(B, I);

    Result = Builder.CreateIntrinsic(Result->getType(), MadIntrinsic,

                                     ArrayRef<Value *>{Elt0, Elt1, Result},

                                     nullptr, "dx.mad");

  }

  return Result;

}


static Value *expandExpIntrinsic(CallInst *Orig) {

  Value *X = Orig->getOperand(0);

  IRBuilder<> Builder(Orig);

  Type *Ty = X->getType();

  Type *EltTy = Ty->getScalarType();

  Constant *Log2eConst =

      Ty->isVectorTy() ? ConstantVector::getSplat(

                             ElementCount::getFixed(

                                 cast<FixedVectorType>(Ty)->getNumElements()),

                             ConstantFP::get(EltTy, numbers::log2ef))

                       : ConstantFP::get(EltTy, numbers::log2ef);

  Value *NewX = Builder.CreateFMul(Log2eConst, X);

  auto *Exp2Call =

      Builder.CreateIntrinsic(Ty, Intrinsic::exp2, {NewX}, nullptr, "dx.exp2");

  Exp2Call->setTailCall(Orig->isTailCall());

  Exp2Call->setAttributes(Orig->getAttributes());

  return Exp2Call;

}


static Value *expandAnyOrAllIntrinsic(CallInst *Orig,

                                      Intrinsic::ID intrinsicId) {

  Value *X = Orig->getOperand(0);

  IRBuilder<> Builder(Orig);

  Type *Ty = X->getType();

  Type *EltTy = Ty->getScalarType();


  auto ApplyOp = [&Builder](Intrinsic::ID IntrinsicId, Value *Result,

                            Value *Elt) {

    if (IntrinsicId == Intrinsic::dx_any)

      return Builder.CreateOr(Result, Elt);

    assert(IntrinsicId == Intrinsic::dx_all);

    return Builder.CreateAnd(Result, Elt);

  };


  Value *Result = nullptr;

  if (!Ty->isVectorTy()) {

    Result = EltTy->isFloatingPointTy()

                 ? Builder.CreateFCmpUNE(X, ConstantFP::get(EltTy, 0))

                 : Builder.CreateICmpNE(X, ConstantInt::get(EltTy, 0));

  } else {

    auto *XVec = dyn_cast<FixedVectorType>(Ty);

    Value *Cond =

        EltTy->isFloatingPointTy()

            ? Builder.CreateFCmpUNE(

                  X, ConstantVector::getSplat(

                         ElementCount::getFixed(XVec->getNumElements()),

                         ConstantFP::get(EltTy, 0)))

            : Builder.CreateICmpNE(

                  X, ConstantVector::getSplat(

                         ElementCount::getFixed(XVec->getNumElements()),

                         ConstantInt::get(EltTy, 0)));

    Result = Builder.CreateExtractElement(Cond, (uint64_t)0);

    for (unsigned I = 1; I < XVec->getNumElements(); I++) {

      Value *Elt = Builder.CreateExtractElement(Cond, I);

      Result = ApplyOp(intrinsicId, Result, Elt);

    }

  }

  return Result;

}


static Value *expandLerpIntrinsic(CallInst *Orig) {

  Value *X = Orig->getOperand(0);

  Value *Y = Orig->getOperand(1);

  Value *S = Orig->getOperand(2);

  IRBuilder<> Builder(Orig);

  auto *V = Builder.CreateFSub(Y, X);

  V = Builder.CreateFMul(S, V);

  return Builder.CreateFAdd(X, V, "dx.lerp");

}


static Value *expandLogIntrinsic(CallInst *Orig,

                                 float LogConstVal = numbers::ln2f) {

  Value *X = Orig->getOperand(0);

  IRBuilder<> Builder(Orig);

  Type *Ty = X->getType();

  Type *EltTy = Ty->getScalarType();

  Constant *Ln2Const =

      Ty->isVectorTy() ? ConstantVector::getSplat(

                             ElementCount::getFixed(

                                 cast<FixedVectorType>(Ty)->getNumElements()),

                             ConstantFP::get(EltTy, LogConstVal))

                       : ConstantFP::get(EltTy, LogConstVal);

  auto *Log2Call =

      Builder.CreateIntrinsic(Ty, Intrinsic::log2, {X}, nullptr, "elt.log2");

  Log2Call->setTailCall(Orig->isTailCall());

  Log2Call->setAttributes(Orig->getAttributes());

  return Builder.CreateFMul(Ln2Const, Log2Call);

}

static Value *expandLog10Intrinsic(CallInst *Orig) {

  return expandLogIntrinsic(Orig, numbers::ln2f / numbers::ln10f);

}


// Use dot product of vector operand with itself to calculate the length.

// Divide the vector by that length to normalize it.

static Value *expandNormalizeIntrinsic(CallInst *Orig) {

  Value *X = Orig->getOperand(0);

  Type *Ty = Orig->getType();

  Type *EltTy = Ty->getScalarType();

  IRBuilder<> Builder(Orig);


  auto *XVec = dyn_cast<FixedVectorType>(Ty);

  if (!XVec) {

    if (auto *constantFP = dyn_cast<ConstantFP>(X)) {

      const APFloat &fpVal = constantFP->getValueAPF();

      if (fpVal.isZero())

        report_fatal_error(Twine("Invalid input scalar: length is zero"),

                           /* gen_crash_diag=*/false);

    }

    return Builder.CreateFDiv(X, X);

  }


  Value *DotProduct = expandFloatDotIntrinsic(Orig, X, X);


  // verify that the length is non-zero

  // (if the dot product is non-zero, then the length is non-zero)

  if (auto *constantFP = dyn_cast<ConstantFP>(DotProduct)) {

    const APFloat &fpVal = constantFP->getValueAPF();

    if (fpVal.isZero())

      report_fatal_error(Twine("Invalid input vector: length is zero"),

                         /* gen_crash_diag=*/false);

  }


  Value *Multiplicand = Builder.CreateIntrinsic(EltTy, Intrinsic::dx_rsqrt,

                                                ArrayRef<Value *>{DotProduct},

                                                nullptr, "dx.rsqrt");


  Value *MultiplicandVec =

      Builder.CreateVectorSplat(XVec->getNumElements(), Multiplicand);

  return Builder.CreateFMul(X, MultiplicandVec);

}


static Value *expandAtan2Intrinsic(CallInst *Orig) {

  Value *Y = Orig->getOperand(0);

  Value *X = Orig->getOperand(1);

  Type *Ty = X->getType();

  IRBuilder<> Builder(Orig);

  Builder.setFastMathFlags(Orig->getFastMathFlags());


  Value *Tan = Builder.CreateFDiv(Y, X);


  CallInst *Atan =

      Builder.CreateIntrinsic(Ty, Intrinsic::atan, {Tan}, nullptr, "Elt.Atan");

  Atan->setTailCall(Orig->isTailCall());

  Atan->setAttributes(Orig->getAttributes());


  // Modify atan result based on https://en.wikipedia.org/wiki/Atan2.

  Constant *Pi = ConstantFP::get(Ty, llvm::numbers::pi);

  Constant *HalfPi = ConstantFP::get(Ty, llvm::numbers::pi / 2);

  Constant *NegHalfPi = ConstantFP::get(Ty, -llvm::numbers::pi / 2);

  Constant *Zero = ConstantFP::get(Ty, 0);

  Value *AtanAddPi = Builder.CreateFAdd(Atan, Pi);

  Value *AtanSubPi = Builder.CreateFSub(Atan, Pi);


  // x > 0 -> atan.

  Value *Result = Atan;

  Value *XLt0 = Builder.CreateFCmpOLT(X, Zero);

  Value *XEq0 = Builder.CreateFCmpOEQ(X, Zero);

  Value *YGe0 = Builder.CreateFCmpOGE(Y, Zero);

  Value *YLt0 = Builder.CreateFCmpOLT(Y, Zero);


  // x < 0, y >= 0 -> atan + pi.

  Value *XLt0AndYGe0 = Builder.CreateAnd(XLt0, YGe0);

  Result = Builder.CreateSelect(XLt0AndYGe0, AtanAddPi, Result);


  // x < 0, y < 0 -> atan - pi.

  Value *XLt0AndYLt0 = Builder.CreateAnd(XLt0, YLt0);

  Result = Builder.CreateSelect(XLt0AndYLt0, AtanSubPi, Result);


  // x == 0, y < 0 -> -pi/2

  Value *XEq0AndYLt0 = Builder.CreateAnd(XEq0, YLt0);

  Result = Builder.CreateSelect(XEq0AndYLt0, NegHalfPi, Result);


  // x == 0, y > 0 -> pi/2

  Value *XEq0AndYGe0 = Builder.CreateAnd(XEq0, YGe0);

  Result = Builder.CreateSelect(XEq0AndYGe0, HalfPi, Result);


  return Result;

}


static Value *expandPowIntrinsic(CallInst *Orig) {


  Value *X = Orig->getOperand(0);

  Value *Y = Orig->getOperand(1);

  Type *Ty = X->getType();

  IRBuilder<> Builder(Orig);


  auto *Log2Call =

      Builder.CreateIntrinsic(Ty, Intrinsic::log2, {X}, nullptr, "elt.log2");

  auto *Mul = Builder.CreateFMul(Log2Call, Y);

  auto *Exp2Call =

      Builder.CreateIntrinsic(Ty, Intrinsic::exp2, {Mul}, nullptr, "elt.exp2");

  Exp2Call->setTailCall(Orig->isTailCall());

  Exp2Call->setAttributes(Orig->getAttributes());

  return Exp2Call;

}


static Value *expandStepIntrinsic(CallInst *Orig) {


  Value *X = Orig->getOperand(0);

  Value *Y = Orig->getOperand(1);

  Type *Ty = X->getType();

  IRBuilder<> Builder(Orig);


  Constant *One = ConstantFP::get(Ty->getScalarType(), 1.0);

  Constant *Zero = ConstantFP::get(Ty->getScalarType(), 0.0);

  Value *Cond = Builder.CreateFCmpOLT(Y, X);


  if (Ty != Ty->getScalarType()) {

    auto *XVec = dyn_cast<FixedVectorType>(Ty);

    One = ConstantVector::getSplat(

        ElementCount::getFixed(XVec->getNumElements()), One);

    Zero = ConstantVector::getSplat(

        ElementCount::getFixed(XVec->getNumElements()), Zero);

  }


  return Builder.CreateSelect(Cond, Zero, One);

}


static Value *expandRadiansIntrinsic(CallInst *Orig) {

  Value *X = Orig->getOperand(0);

  Type *Ty = X->getType();

  IRBuilder<> Builder(Orig);

  Value *PiOver180 = ConstantFP::get(Ty, llvm::numbers::pi / 180.0);

  return Builder.CreateFMul(X, PiOver180);

}


static Intrinsic::ID getMaxForClamp(Intrinsic::ID ClampIntrinsic) {

  if (ClampIntrinsic == Intrinsic::dx_uclamp)

    return Intrinsic::umax;

  if (ClampIntrinsic == Intrinsic::dx_sclamp)

    return Intrinsic::smax;

  assert(ClampIntrinsic == Intrinsic::dx_nclamp);

  return Intrinsic::maxnum;

}


static Intrinsic::ID getMinForClamp(Intrinsic::ID ClampIntrinsic) {

  if (ClampIntrinsic == Intrinsic::dx_uclamp)

    return Intrinsic::umin;

  if (ClampIntrinsic == Intrinsic::dx_sclamp)

    return Intrinsic::smin;

  assert(ClampIntrinsic == Intrinsic::dx_nclamp);

  return Intrinsic::minnum;

}


static Value *expandClampIntrinsic(CallInst *Orig,

                                   Intrinsic::ID ClampIntrinsic) {

  Value *X = Orig->getOperand(0);

  Value *Min = Orig->getOperand(1);

  Value *Max = Orig->getOperand(2);

  Type *Ty = X->getType();

  IRBuilder<> Builder(Orig);

  auto *MaxCall = Builder.CreateIntrinsic(Ty, getMaxForClamp(ClampIntrinsic),

                                          {X, Min}, nullptr, "dx.max");

  return Builder.CreateIntrinsic(Ty, getMinForClamp(ClampIntrinsic),

                                 {MaxCall, Max}, nullptr, "dx.min");

}


static Value *expandDegreesIntrinsic(CallInst *Orig) {

  Value *X = Orig->getOperand(0);

  Type *Ty = X->getType();

  IRBuilder<> Builder(Orig);

  Value *DegreesRatio = ConstantFP::get(Ty, 180.0 * llvm::numbers::inv_pi);

  return Builder.CreateFMul(X, DegreesRatio);

}


static Value *expandSignIntrinsic(CallInst *Orig) {

  Value *X = Orig->getOperand(0);

  Type *Ty = X->getType();

  Type *ScalarTy = Ty->getScalarType();

  Type *RetTy = Orig->getType();

  Constant *Zero = Constant::getNullValue(Ty);


  IRBuilder<> Builder(Orig);


  Value *GT;

  Value *LT;

  if (ScalarTy->isFloatingPointTy()) {

    GT = Builder.CreateFCmpOLT(Zero, X);

    LT = Builder.CreateFCmpOLT(X, Zero);

  } else {

    assert(ScalarTy->isIntegerTy());

    GT = Builder.CreateICmpSLT(Zero, X);

    LT = Builder.CreateICmpSLT(X, Zero);

  }


  Value *ZextGT = Builder.CreateZExt(GT, RetTy);

  Value *ZextLT = Builder.CreateZExt(LT, RetTy);


  return Builder.CreateSub(ZextGT, ZextLT);

}


static bool expandIntrinsic(Function &F, CallInst *Orig) {

  Value *Result = nullptr;

  Intrinsic::ID IntrinsicId = F.getIntrinsicID();

  switch (IntrinsicId) {

  case Intrinsic::abs:

    Result = expandAbs(Orig);

    break;

  case Intrinsic::atan2:

    Result = expandAtan2Intrinsic(Orig);

    break;

  case Intrinsic::exp:

    Result = expandExpIntrinsic(Orig);

    break;

  case Intrinsic::log:

    Result = expandLogIntrinsic(Orig);

    break;

  case Intrinsic::log10:

    Result = expandLog10Intrinsic(Orig);

    break;

  case Intrinsic::pow:

    Result = expandPowIntrinsic(Orig);

    break;

  case Intrinsic::dx_all:

  case Intrinsic::dx_any:

    Result = expandAnyOrAllIntrinsic(Orig, IntrinsicId);

    break;

  case Intrinsic::dx_cross:

    Result = expandCrossIntrinsic(Orig);

    break;

  case Intrinsic::dx_uclamp:

  case Intrinsic::dx_sclamp:

  case Intrinsic::dx_nclamp:

    Result = expandClampIntrinsic(Orig, IntrinsicId);

    break;

  case Intrinsic::dx_degrees:

    Result = expandDegreesIntrinsic(Orig);

    break;

  case Intrinsic::dx_lerp:

    Result = expandLerpIntrinsic(Orig);

    break;

  case Intrinsic::dx_normalize:

    Result = expandNormalizeIntrinsic(Orig);

    break;

  case Intrinsic::dx_fdot:

    Result = expandFloatDotIntrinsic(Orig);

    break;

  case Intrinsic::dx_sdot:

  case Intrinsic::dx_udot:

    Result = expandIntegerDotIntrinsic(Orig, IntrinsicId);

    break;

  case Intrinsic::dx_sign:

    Result = expandSignIntrinsic(Orig);

    break;

  case Intrinsic::dx_step:

    Result = expandStepIntrinsic(Orig);

    break;

  case Intrinsic::dx_radians:

    Result = expandRadiansIntrinsic(Orig);

    break;

  case Intrinsic::vector_reduce_add:

  case Intrinsic::vector_reduce_fadd:

    Result = expandVecReduceAdd(Orig, IntrinsicId);

    break;

  }

  if (Result) {

    Orig->replaceAllUsesWith(Result);

    Orig->eraseFromParent();

    return true;

  }

  return false;

}


static bool expansionIntrinsics(Module &M) {

  for (auto &F : make_early_inc_range(M.functions())) {

    if (!isIntrinsicExpansion(F))

      continue;

    bool IntrinsicExpanded = false;

    for (User *U : make_early_inc_range(F.users())) {

      auto *IntrinsicCall = dyn_cast<CallInst>(U);

      if (!IntrinsicCall)

        continue;

      IntrinsicExpanded = expandIntrinsic(F, IntrinsicCall);

    }

    if (F.user_empty() && IntrinsicExpanded)

      F.eraseFromParent();

  }

  return true;

}


PreservedAnalyses DXILIntrinsicExpansion::run(Module &M,

                                              ModuleAnalysisManager &) {

  if (expansionIntrinsics(M))

    return PreservedAnalyses::none();

  return PreservedAnalyses::all();

}


bool DXILIntrinsicExpansionLegacy::runOnModule(Module &M) {

  return expansionIntrinsics(M);

}


char DXILIntrinsicExpansionLegacy::ID = 0;


INITIALIZE_PASS_BEGIN(DXILIntrinsicExpansionLegacy, DEBUG_TYPE,

                      "DXIL Intrinsic Expansion", false, false)

INITIALIZE_PASS_END(DXILIntrinsicExpansionLegacy, DEBUG_TYPE,

                    "DXIL Intrinsic Expansion", false, false)


ModulePass *llvm::createDXILIntrinsicExpansionLegacyPass() {

  return new DXILIntrinsicExpansionLegacy();

}

B
static GCRegistry::Add< OcamlGC > B("ocaml", "ocaml 3.10-compatible GC")

A
static GCRegistry::Add< ErlangGC > A("erlang", "erlang-compatible garbage collector")

Passes.h

expandNormalizeIntrinsic
static Value * expandNormalizeIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:328

Expansion
DXIL Intrinsic Expansion
Definition: DXILIntrinsicExpansion.cpp:630

expandIntrinsic
static bool expandIntrinsic(Function &F, CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:525

expandClampIntrinsic
static Value * expandClampIntrinsic(CallInst *Orig, Intrinsic::ID ClampIntrinsic)
Definition: DXILIntrinsicExpansion.cpp:478

expansionIntrinsics
static bool expansionIntrinsics(Module &M)
Definition: DXILIntrinsicExpansion.cpp:597

expandLerpIntrinsic
static Value * expandLerpIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:294

expandCrossIntrinsic
static Value * expandCrossIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:121

expandVecReduceAdd
static Value * expandVecReduceAdd(CallInst *Orig, Intrinsic::ID IntrinsicId)
Definition: DXILIntrinsicExpansion.cpp:73

expandAtan2Intrinsic
static Value * expandAtan2Intrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:365

expandLog10Intrinsic
static Value * expandLog10Intrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:322

getMinForClamp
static Intrinsic::ID getMinForClamp(Intrinsic::ID ClampIntrinsic)
Definition: DXILIntrinsicExpansion.cpp:469

expandStepIntrinsic
static Value * expandStepIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:430

expandIntegerDotIntrinsic
static Value * expandIntegerDotIntrinsic(CallInst *Orig, Intrinsic::ID DotIntrinsic)
Definition: DXILIntrinsicExpansion.cpp:201

expandPowIntrinsic
static Value * expandPowIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:413

expandLogIntrinsic
static Value * expandLogIntrinsic(CallInst *Orig, float LogConstVal=numbers::ln2f)
Definition: DXILIntrinsicExpansion.cpp:304

expandDegreesIntrinsic
static Value * expandDegreesIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:491

expandExpIntrinsic
static Value * expandExpIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:234

expandSignIntrinsic
static Value * expandSignIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:499

getMaxForClamp
static Intrinsic::ID getMaxForClamp(Intrinsic::ID ClampIntrinsic)
Definition: DXILIntrinsicExpansion.cpp:460

expandAnyOrAllIntrinsic
static Value * expandAnyOrAllIntrinsic(CallInst *Orig, Intrinsic::ID intrinsicId)
Definition: DXILIntrinsicExpansion.cpp:253

expandAbs
static Value * expandAbs(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:105

expandFloatDotIntrinsic
static Value * expandFloatDotIntrinsic(CallInst *Orig, Value *A, Value *B)
Definition: DXILIntrinsicExpansion.cpp:160

expandRadiansIntrinsic
static Value * expandRadiansIntrinsic(CallInst *Orig)
Definition: DXILIntrinsicExpansion.cpp:452

isIntrinsicExpansion
static bool isIntrinsicExpansion(Function &F)
Definition: DXILIntrinsicExpansion.cpp:44

DXILIntrinsicExpansion.h

RetTy
return RetTy
Definition: DeadArgumentElimination.cpp:361

DirectX.h

X
static GCMetadataPrinterRegistry::Add< ErlangGCPrinter > X("erlang", "erlang-compatible garbage collector")

DEBUG_TYPE
#define DEBUG_TYPE
Definition: GenericCycleImpl.h:31

IRBuilder.h

Instruction.h

Module.h
Module.h This file contains the declarations for the Module class.

PassManager.h
This header defines various interfaces for pass management in LLVM.

Type.h

InstrTypes.h

Instructions.h

Intrinsics.h

F
#define F(x, y, z)
Definition: MD5.cpp:55

I
#define I(x, y, z)
Definition: MD5.cpp:58

MathExtras.h

Y
static GCMetadataPrinterRegistry::Add< OcamlGCMetadataPrinter > Y("ocaml", "ocaml 3.10-compatible collector")

INITIALIZE_PASS_END
#define INITIALIZE_PASS_END(passName, arg, name, cfg, analysis)
Definition: PassSupport.h:57

INITIALIZE_PASS_BEGIN
#define INITIALIZE_PASS_BEGIN(passName, arg, name, cfg, analysis)
Definition: PassSupport.h:52

Pass.h

Cond
const SmallVectorImpl< MachineOperand > & Cond
Definition: RISCVRedundantCopyElimination.cpp:75

assert
assert(ImpDefSCC.getReg()==AMDGPU::SCC &&ImpDefSCC.isDef())

getNumElements
static unsigned getNumElements(Type *Ty)
Definition: SLPVectorizer.cpp:254

STLExtras.h
This file contains some templates that are useful if you are working with the STL at all.

SmallVector.h
This file defines the SmallVector class.

Mul
BinaryOperator * Mul
Definition: X86PartialReduction.cpp:68

DXILIntrinsicExpansionLegacy
Definition: DXILIntrinsicExpansion.cpp:35

DXILIntrinsicExpansionLegacy::ID
static char ID
Definition: DXILIntrinsicExpansion.cpp:41

DXILIntrinsicExpansionLegacy::runOnModule
bool runOnModule(Module &M) override
runOnModule - Virtual method overriden by subclasses to process the module being operated on.
Definition: DXILIntrinsicExpansion.cpp:621

DXILIntrinsicExpansionLegacy::DXILIntrinsicExpansionLegacy
DXILIntrinsicExpansionLegacy()
Definition: DXILIntrinsicExpansion.cpp:39

VectorType
Definition: ItaniumDemangle.h:1173

llvm::APFloat
Definition: APFloat.h:904

llvm::APFloat::isZero
bool isZero() const
Definition: APFloat.h:1441

llvm::AnalysisManager
A container for analyses that lazily runs them and caches their results.
Definition: PassManager.h:253

llvm::ArrayRef
ArrayRef - Represent a constant reference to an array (0 or more elements consecutively in memory),...
Definition: ArrayRef.h:41

llvm::CallBase::setAttributes
void setAttributes(AttributeList A)
Set the attributes for this call.
Definition: InstrTypes.h:1420

llvm::CallBase::getAttributes
AttributeList getAttributes() const
Return the attributes for this call.
Definition: InstrTypes.h:1417

llvm::CallInst
This class represents a function call, abstracting a target machine's calling convention.
Definition: Instructions.h:1479

llvm::CallInst::isTailCall
bool isTailCall() const
Definition: Instructions.h:1589

llvm::CallInst::setTailCall
void setTailCall(bool IsTc=true)
Definition: Instructions.h:1602

llvm::ConstantVector::getSplat
static Constant * getSplat(ElementCount EC, Constant *Elt)
Return a ConstantVector with the specified constant in each element.
Definition: Constants.cpp:1472

llvm::Constant
This is an important base class in LLVM.
Definition: Constant.h:42

llvm::Constant::getNullValue
static Constant * getNullValue(Type *Ty)
Constructor to create a '0' constant of arbitrary type.
Definition: Constants.cpp:373

llvm::Constant::isZeroValue
bool isZeroValue() const
Return true if the value is negative zero or null value.
Definition: Constants.cpp:76

llvm::DXILIntrinsicExpansion::run
PreservedAnalyses run(Module &M, ModuleAnalysisManager &)
Definition: DXILIntrinsicExpansion.cpp:614

llvm::ElementCount::getFixed
static constexpr ElementCount getFixed(ScalarTy MinVal)
Definition: TypeSize.h:311

llvm::Function
Definition: Function.h:63

llvm::IRBuilderBase::CreateFSub
Value * CreateFSub(Value *L, Value *R, const Twine &Name="", MDNode *FPMD=nullptr)
Definition: IRBuilder.h:1595

llvm::IRBuilderBase::CreateInsertElement
Value * CreateInsertElement(Type *VecTy, Value *NewElt, Value *Idx, const Twine &Name="")
Definition: IRBuilder.h:2511

llvm::IRBuilderBase::CreateFDiv
Value * CreateFDiv(Value *L, Value *R, const Twine &Name="", MDNode *FPMD=nullptr)
Definition: IRBuilder.h:1633

llvm::IRBuilderBase::CreateExtractElement
Value * CreateExtractElement(Value *Vec, Value *Idx, const Twine &Name="")
Definition: IRBuilder.h:2499

llvm::IRBuilderBase::CreateFAdd
Value * CreateFAdd(Value *L, Value *R, const Twine &Name="", MDNode *FPMD=nullptr)
Definition: IRBuilder.h:1576

llvm::IRBuilderBase::CreateVectorSplat
Value * CreateVectorSplat(unsigned NumElts, Value *V, const Twine &Name="")
Return a vector value that contains.
Definition: IRBuilder.cpp:1163

llvm::IRBuilderBase::CreateSelect
Value * CreateSelect(Value *C, Value *True, Value *False, const Twine &Name="", Instruction *MDFrom=nullptr)
Definition: IRBuilder.cpp:1053

llvm::IRBuilderBase::CreateFCmpUNE
Value * CreateFCmpUNE(Value *LHS, Value *RHS, const Twine &Name="", MDNode *FPMathTag=nullptr)
Definition: IRBuilder.h:2375

llvm::IRBuilderBase::setFastMathFlags
void setFastMathFlags(FastMathFlags NewFMF)
Set the fast-math flags to be used with generated fp-math operators.
Definition: IRBuilder.h:330

llvm::IRBuilderBase::CreateFCmpOLT
Value * CreateFCmpOLT(Value *LHS, Value *RHS, const Twine &Name="", MDNode *FPMathTag=nullptr)
Definition: IRBuilder.h:2325

llvm::IRBuilderBase::CreateICmpNE
Value * CreateICmpNE(Value *LHS, Value *RHS, const Twine &Name="")
Definition: IRBuilder.h:2274

llvm::IRBuilderBase::CreateIntrinsic
CallInst * CreateIntrinsic(Intrinsic::ID ID, ArrayRef< Type * > Types, ArrayRef< Value * > Args, FMFSource FMFSource={}, const Twine &Name="")
Create a call to intrinsic ID with Args, mangled using Types.
Definition: IRBuilder.cpp:900

llvm::IRBuilderBase::CreateSub
Value * CreateSub(Value *LHS, Value *RHS, const Twine &Name="", bool HasNUW=false, bool HasNSW=false)
Definition: IRBuilder.h:1387

llvm::IRBuilderBase::CreateZExt
Value * CreateZExt(Value *V, Type *DestTy, const Twine &Name="", bool IsNonNeg=false)
Definition: IRBuilder.h:2033

llvm::IRBuilderBase::CreateFCmpOEQ
Value * CreateFCmpOEQ(Value *LHS, Value *RHS, const Twine &Name="", MDNode *FPMathTag=nullptr)
Definition: IRBuilder.h:2310

llvm::IRBuilderBase::CreateAnd
Value * CreateAnd(Value *LHS, Value *RHS, const Twine &Name="")
Definition: IRBuilder.h:1518

llvm::IRBuilderBase::CreateAdd
Value * CreateAdd(Value *LHS, Value *RHS, const Twine &Name="", bool HasNUW=false, bool HasNSW=false)
Definition: IRBuilder.h:1370

llvm::IRBuilderBase::CreateOr
Value * CreateOr(Value *LHS, Value *RHS, const Twine &Name="")
Definition: IRBuilder.h:1540

llvm::IRBuilderBase::CreateICmpSLT
Value * CreateICmpSLT(Value *LHS, Value *RHS, const Twine &Name="")
Definition: IRBuilder.h:2302

llvm::IRBuilderBase::CreateFMul
Value * CreateFMul(Value *L, Value *R, const Twine &Name="", MDNode *FPMD=nullptr)
Definition: IRBuilder.h:1614

llvm::IRBuilderBase::CreateMul
Value * CreateMul(Value *LHS, Value *RHS, const Twine &Name="", bool HasNUW=false, bool HasNSW=false)
Definition: IRBuilder.h:1404

llvm::IRBuilderBase::CreateFCmpOGE
Value * CreateFCmpOGE(Value *LHS, Value *RHS, const Twine &Name="", MDNode *FPMathTag=nullptr)
Definition: IRBuilder.h:2320

llvm::IRBuilder
This provides a uniform API for creating instructions and inserting them into a basic block: either a...
Definition: IRBuilder.h:2705

llvm::Instruction::eraseFromParent
InstListType::iterator eraseFromParent()
This method unlinks 'this' from the containing basic block and deletes it.
Definition: Instruction.cpp:94

llvm::Instruction::getFastMathFlags
FastMathFlags getFastMathFlags() const LLVM_READONLY
Convenience function for getting all the fast-math flags, which must be an operator which supports th...
Definition: Instruction.cpp:637

llvm::ModulePass
ModulePass class - This class is used to implement unstructured interprocedural optimizations and ana...
Definition: Pass.h:251

llvm::Module
A Module instance is used to store all the information related to an LLVM module.
Definition: Module.h:65

llvm::PreservedAnalyses
A set of analyses that are preserved following a run of a transformation pass.
Definition: Analysis.h:111

llvm::PreservedAnalyses::none
static PreservedAnalyses none()
Convenience factory function for the empty preserved set.
Definition: Analysis.h:114

llvm::PreservedAnalyses::all
static PreservedAnalyses all()
Construct a special preserved set that preserves all passes.
Definition: Analysis.h:117

llvm::Twine
Twine - A lightweight data structure for efficiently representing the concatenation of temporary valu...
Definition: Twine.h:81

llvm::Type
The instances of the Type class are immutable: once they are created, they are never changed.
Definition: Type.h:45

llvm::Type::isVectorTy
bool isVectorTy() const
True if this is an instance of VectorType.
Definition: Type.h:270

llvm::Type::isFloatingPointTy
bool isFloatingPointTy() const
Return true if this is one of the floating-point types.
Definition: Type.h:184

llvm::Type::isIntegerTy
bool isIntegerTy() const
True if this is an instance of IntegerType.
Definition: Type.h:237

llvm::Type::getScalarType
Type * getScalarType() const
If this is a vector type, return the element type, otherwise return 'this'.
Definition: Type.h:355

llvm::UndefValue::get
static UndefValue * get(Type *T)
Static factory methods - Return an 'undef' object of the specified type.
Definition: Constants.cpp:1859

llvm::User
Definition: User.h:44

llvm::User::getOperand
Value * getOperand(unsigned i) const
Definition: User.h:228

llvm::Value
LLVM Value Representation.
Definition: Value.h:74

llvm::Value::getType
Type * getType() const
All values are typed, get the type of this value.
Definition: Value.h:255

llvm::Value::replaceAllUsesWith
void replaceAllUsesWith(Value *V)
Change all uses of this to point to a new Value.
Definition: Value.cpp:534

llvm::Value::getName
StringRef getName() const
Return a constant reference to the value's name.
Definition: Value.cpp:309

uint64_t

unsigned

ErrorHandling.h

false
Definition: StackSlotColoring.cpp:193

llvm::Intrinsic::ID
unsigned ID
Definition: GenericSSAContext.h:28

llvm::numbers::inv_pi
constexpr double inv_pi
Definition: MathExtras.h:55

llvm::numbers::ln10f
constexpr float ln10f
Definition: MathExtras.h:66

llvm::numbers::log2ef
constexpr float log2ef
Definition: MathExtras.h:67

llvm::numbers::pi
constexpr double pi
Definition: MathExtras.h:54

llvm::numbers::ln2f
constexpr float ln2f
Definition: MathExtras.h:65

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition: AddressRanges.h:18

llvm::make_early_inc_range
iterator_range< early_inc_iterator_impl< detail::IterOfRange< RangeT > > > make_early_inc_range(RangeT &&Range)
Make a range that does early increment to allow mutation of the underlying range without disrupting i...
Definition: STLExtras.h:657

llvm::report_fatal_error
void report_fatal_error(Error Err, bool gen_crash_diag=true)
Report a serious error, calling any installed error handler.
Definition: Error.cpp:167

llvm::createDXILIntrinsicExpansionLegacyPass
ModulePass * createDXILIntrinsicExpansionLegacyPass()
Pass to expand intrinsic operations that lack DXIL opCodes.
Definition: DXILIntrinsicExpansion.cpp:632