Collect the global load streams for multiplicands.
#include <gemm_stream_pair.h>
◆ Index
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ StreamA
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ StreamB
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ ThreadblockTileRef
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ ThreadblockTileStorage
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ GlobalLoadStreamPair()
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ add_batch_offset()
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ commit()
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ copy()
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ move_to_residue()
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ operator+=()
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ residue()
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ rollback()
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ stream_a
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
◆ stream_b
template<typename StreamA_ , typename StreamB_ , bool kResidueInProlog_>
The documentation for this struct was generated from the following file: