This pass optimizes atomic operations by using a single lane of a wavefront to perform the atomic operation, thus reducing contention on that memory location. More...

#include "AMDGPU.h"
#include "GCNSubtarget.h"
#include "llvm/Analysis/DomTreeUpdater.h"
#include "llvm/Analysis/UniformityAnalysis.h"
#include "llvm/CodeGen/TargetPassConfig.h"
#include "llvm/IR/IRBuilder.h"
#include "llvm/IR/InstVisitor.h"
#include "llvm/IR/IntrinsicsAMDGPU.h"
#include "llvm/InitializePasses.h"
#include "llvm/Target/TargetMachine.h"
#include "llvm/Transforms/Utils/BasicBlockUtils.h"

Macros
#define	DEBUG_TYPE "amdgpu-atomic-optimizer"
	of Wavefront using llvm.cttz and performs scan using readlane & writelane intrinsics

Functions
static bool	isLegalCrossLaneType (Type *Ty)
static Value *	buildNonAtomicBinOp (IRBuilder<> &B, AtomicRMWInst::BinOp Op, Value LHS, Value RHS)
static Constant *	getIdentityValueForAtomicOp (Type *const Ty, AtomicRMWInst::BinOp Op)
static Value *	buildMul (IRBuilder<> &B, Value LHS, Value RHS)
	INITIALIZE_PASS_BEGIN (AMDGPUAtomicOptimizer, DEBUG_TYPE, "AMDGPU atomic optimizations", false, false) INITIALIZE_PASS_END(AMDGPUAtomicOptimizer

Variables
	DEBUG_TYPE
AMDGPU atomic	optimizations
AMDGPU atomic	false

Detailed Description

This pass optimizes atomic operations by using a single lane of a wavefront to perform the atomic operation, thus reducing contention on that memory location.

Atomic optimizer uses following strategies to compute scan and reduced values

DPP - This is the most efficient implementation for scan. DPP uses Whole Wave Mode (WWM)
Iterative -

Definition in file AMDGPUAtomicOptimizer.cpp.

Macro Definition Documentation

◆ DEBUG_TYPE

#define DEBUG_TYPE "amdgpu-atomic-optimizer"

of Wavefront using llvm.cttz and performs scan using readlane & writelane intrinsics

Definition at line 36 of file AMDGPUAtomicOptimizer.cpp.

Function Documentation

◆ buildMul()

Value * buildMul	(	IRBuilder<> &	B,
		Value *	LHS,
		Value *	RHS )

static

Definition at line 639 of file AMDGPUAtomicOptimizer.cpp.

References B(), llvm::dyn_cast(), llvm::ConstantInt::isOne(), LHS, and RHS.

◆ buildNonAtomicBinOp()

Value * buildNonAtomicBinOp	(	IRBuilder<> &	B,
		AtomicRMWInst::BinOp	Op,
		Value *	LHS,
		Value *	RHS )

static

◆ getIdentityValueForAtomicOp()

Constant * getIdentityValueForAtomicOp	(	Type *const	Ty,
		AtomicRMWInst::BinOp	Op )

static

◆ INITIALIZE_PASS_BEGIN()

INITIALIZE_PASS_BEGIN	(	AMDGPUAtomicOptimizer	,
		DEBUG_TYPE	,
		"AMDGPU atomic optimizations"	,
		false	,
		false	)

References DEBUG_TYPE, and INITIALIZE_PASS_DEPENDENCY.

◆ isLegalCrossLaneType()

bool isLegalCrossLaneType ( Type * Ty )

static

Definition at line 168 of file AMDGPUAtomicOptimizer.cpp.

References llvm::Type::DoubleTyID, llvm::Type::FloatTyID, llvm::Type::IntegerTyID, and Size.

Variable Documentation

◆ DEBUG_TYPE

DEBUG_TYPE

Definition at line 981 of file AMDGPUAtomicOptimizer.cpp.

◆ false

AMDGPU atomic false

Definition at line 982 of file AMDGPUAtomicOptimizer.cpp.

◆ optimizations

AMDGPU atomic optimizations

Definition at line 982 of file AMDGPUAtomicOptimizer.cpp.

Macros

Functions

Variables

Detailed Description

Macro Definition Documentation

◆ DEBUG_TYPE

Function Documentation

◆ buildMul()

◆ buildNonAtomicBinOp()

◆ getIdentityValueForAtomicOp()

◆ INITIALIZE_PASS_BEGIN()

◆ isLegalCrossLaneType()

Variable Documentation

◆ DEBUG_TYPE

◆ false

◆ optimizations