#include <TensorBlock.h>

Classes
struct	Dst

struct	Src

Public Types
enum class	Kind { Linear = 0 , Scatter = 1 , FillLinear = 2 , FillScatter = 3 , Gather = 4 , Random = 5 }

Static Public Member Functions
template<typename StridedLinearBufferCopy::Kind kind>
static EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE void	Run (const Dst &dst, const Src &src, const size_t count)

Private Types
enum	{ Vectorizable = packet_traits<Scalar>::Vectorizable , PacketSize = packet_traits<Scalar>::size , HalfPacketSize = unpacket_traits<HalfPacket>::size }

typedef packet_traits< Scalar >::type	Packet

typedef unpacket_traits< Packet >::half	HalfPacket

Static Private Member Functions
template<typename StridedLinearBufferCopy::Kind kind>
static EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE void	Run (const IndexType count, const IndexType dst_offset, const IndexType dst_stride, Scalar EIGEN_RESTRICT dst_data, const IndexType src_offset, const IndexType src_stride, const Scalar EIGEN_RESTRICT src_data)

Member Typedef Documentation

◆ HalfPacket

template<typename Scalar , typename IndexType >

typedef unpacket_traits<Packet>::half Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::HalfPacket

private

◆ Packet

template<typename Scalar , typename IndexType >

typedef packet_traits<Scalar>::type Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Packet

private

Member Enumeration Documentation

◆ anonymous enum

template<typename Scalar , typename IndexType >

anonymous enum

private

Enumerator
Vectorizable
PacketSize
HalfPacketSize

        {
     Vectorizable = packet_traits<Scalar>::Vectorizable,
     PacketSize = packet_traits<Scalar>::size,
     HalfPacketSize = unpacket_traits<HalfPacket>::size,
     HasHalfPacket = static_cast<int>(HalfPacketSize) < static_cast<int>(PacketSize)
   };

◆ Kind

template<typename Scalar , typename IndexType >

enum Eigen::internal::StridedLinearBufferCopy::Kind

strong

Enumerator
Linear
Scatter
FillLinear
FillScatter
Gather
Random

                   {
     Linear = 0,       // src_stride == 1 && dst_stride == 1
     Scatter = 1,      // src_stride == 1 && dst_stride != 1
     FillLinear = 2,   // src_stride == 0 && dst_stride == 1
     FillScatter = 3,  // src_stride == 0 && dst_stride != 1
     Gather = 4,       // dst_stride == 1
     Random = 5        // everything else
   };

Member Function Documentation

◆ Run() [1/2]

template<typename Scalar , typename IndexType >

template<typename StridedLinearBufferCopy::Kind kind>

static EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE void Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Run	(	const Dst &	dst,
		const Src &	src,
		const size_t	count
	)

inlinestatic

                                                                                                             {
     Run<kind>(count, dst.offset, dst.stride, dst.data, src.offset, src.stride, src.data);
   }

References Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Dst::data, Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Src::data, Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Dst::offset, Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Src::offset, Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Dst::stride, and Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Src::stride.

◆ Run() [2/2]

template<typename Scalar , typename IndexType >

template<typename StridedLinearBufferCopy::Kind kind>

static EIGEN_DEVICE_FUNC EIGEN_STRONG_INLINE void Eigen::internal::StridedLinearBufferCopy< Scalar, IndexType >::Run	(	const IndexType	count,
		const IndexType	dst_offset,
		const IndexType	dst_stride,
		Scalar *EIGEN_RESTRICT	dst_data,
		const IndexType	src_offset,
		const IndexType	src_stride,
		const Scalar *EIGEN_RESTRICT	src_data
	)

inlinestaticprivate

                                                                                                {
     const Scalar* src = &src_data[src_offset];
     Scalar* dst = &dst_data[dst_offset];
  
     if (!Vectorizable) {
       for (Index i = 0; i < count; ++i) {
         dst[i * dst_stride] = src[i * src_stride];
       }
       return;
     }
  
     const IndexType vectorized_size = PacketSize * (count / PacketSize);
     IndexType i = 0;
  
     if (kind == StridedLinearBufferCopy::Kind::Linear) {
       // ******************************************************************** //
       // Linear copy from `src` to `dst`.
       const IndexType unrolled_size = (4 * PacketSize) * (count / (4 * PacketSize));
       eigen_assert(src_stride == 1 && dst_stride == 1);
       for (; i < unrolled_size; i += 4 * PacketSize) {
         for (int j = 0; j < 4; ++j) {
           Packet p = ploadu<Packet>(src + i + j * PacketSize);
           pstoreu<Scalar, Packet>(dst + i + j * PacketSize, p);
         }
       }
       for (; i < vectorized_size; i += PacketSize) {
         Packet p = ploadu<Packet>(src + i);
         pstoreu<Scalar, Packet>(dst + i, p);
       }
       if (HasHalfPacket) {
         const IndexType vectorized_half_size = HalfPacketSize * (count / HalfPacketSize);
         if (i < vectorized_half_size) {
           HalfPacket p = ploadu<HalfPacket>(src + i);
           pstoreu<Scalar, HalfPacket>(dst + i, p);
           i += HalfPacketSize;
         }
       }
       for (; i < count; ++i) {
         dst[i] = src[i];
       }
       // ******************************************************************** //
     } else if (kind == StridedLinearBufferCopy::Kind::Scatter) {
       // Scatter from `src` to `dst`.
       eigen_assert(src_stride == 1 && dst_stride != 1);
       for (; i < vectorized_size; i += PacketSize) {
         Packet p = ploadu<Packet>(src + i);
         pscatter<Scalar, Packet>(dst + i * dst_stride, p, dst_stride);
       }
       if (HasHalfPacket) {
         const IndexType vectorized_half_size = HalfPacketSize * (count / HalfPacketSize);
         if (i < vectorized_half_size) {
           HalfPacket p = ploadu<HalfPacket>(src + i);
           pscatter<Scalar, HalfPacket>(dst + i * dst_stride, p, dst_stride);
           i += HalfPacketSize;
         }
       }
       for (; i < count; ++i) {
         dst[i * dst_stride] = src[i];
       }
       // ******************************************************************** //
     } else if (kind == StridedLinearBufferCopy::Kind::FillLinear) {
       // Fill `dst` with value at `*src`.
       eigen_assert(src_stride == 0 && dst_stride == 1);
  
       const IndexType unrolled_size = (4 * PacketSize) * (count / (4 * PacketSize));
       Scalar s = *src;
       Packet p = pset1<Packet>(s);
       for (; i < unrolled_size; i += 4 * PacketSize) {
         for (int j = 0; j < 4; ++j) {
           pstoreu<Scalar, Packet>(dst + i + j * PacketSize, p);
         }
       }
       for (; i < vectorized_size; i += PacketSize) {
         pstoreu<Scalar, Packet>(dst + i, p);
       }
       if (HasHalfPacket) {
         const IndexType vectorized_half_size = HalfPacketSize * (count / HalfPacketSize);
         if (i < vectorized_half_size) {
           HalfPacket hp = pset1<HalfPacket>(s);
           pstoreu<Scalar, HalfPacket>(dst + i, hp);
           i += HalfPacketSize;
         }
       }
       for (; i < count; ++i) {
         dst[i] = s;
       }
       // ******************************************************************** //
     } else if (kind == StridedLinearBufferCopy::Kind::FillScatter) {
       // Scatter `*src` into `dst`.
       eigen_assert(src_stride == 0 && dst_stride != 1);
       Scalar s = *src;
       Packet p = pset1<Packet>(s);
       for (; i < vectorized_size; i += PacketSize) {
         pscatter<Scalar, Packet>(dst + i * dst_stride, p, dst_stride);
       }
       if (HasHalfPacket) {
         const IndexType vectorized_half_size = HalfPacketSize * (count / HalfPacketSize);
         if (i < vectorized_half_size) {
           HalfPacket hp = pset1<HalfPacket>(s);
           pscatter<Scalar, HalfPacket>(dst + i * dst_stride, hp, dst_stride);
           i += HalfPacketSize;
         }
       }
       for (; i < count; ++i) {
         dst[i * dst_stride] = s;
       }
       // ******************************************************************** //
     } else if (kind == StridedLinearBufferCopy::Kind::Gather) {
       // Gather from `src` into `dst`.
       eigen_assert(dst_stride == 1);
       for (; i < vectorized_size; i += PacketSize) {
         Packet p = pgather<Scalar, Packet>(src + i * src_stride, src_stride);
         pstoreu<Scalar, Packet>(dst + i, p);
       }
       if (HasHalfPacket) {
         const IndexType vectorized_half_size = HalfPacketSize * (count / HalfPacketSize);
         if (i < vectorized_half_size) {
           HalfPacket p = pgather<Scalar, HalfPacket>(src + i * src_stride, src_stride);
           pstoreu<Scalar, HalfPacket>(dst + i, p);
           i += HalfPacketSize;
         }
       }
       for (; i < count; ++i) {
         dst[i] = src[i * src_stride];
       }
       // ******************************************************************** //
     } else if (kind == StridedLinearBufferCopy::Kind::Random) {
       // Random.
       for (; i < count; ++i) {
         dst[i * dst_stride] = src[i * src_stride];
       }
     } else {
       eigen_assert(false);
     }
   }

The documentation for this class was generated from the following file:

TensorBlock.h

Classes

Public Types

Static Public Member Functions

Private Types

Static Private Member Functions

Member Typedef Documentation

◆ HalfPacket

◆ Packet

Member Enumeration Documentation

◆ anonymous enum

◆ Kind

Member Function Documentation

◆ Run() [1/2]

◆ Run() [2/2]