#include "main.h"
#include <unsupported/Eigen/CXX11/Tensor>

Macros
#define	EIGEN_TEST_NO_LONGDOUBLE

#define	EIGEN_TEST_NO_COMPLEX

#define	EIGEN_DEFAULT_DENSE_INDEX_TYPE int64_t

#define	EIGEN_USE_SYCL

Functions
template<typename DataType , int DataLayout, typename IndexType >
static void	test_simple_concatenation (const Eigen::SyclDevice &sycl_device)

template<typename DataType , int DataLayout, typename IndexType >
static void	test_concatenation_as_lvalue (const Eigen::SyclDevice &sycl_device)

template<typename DataType , typename Dev_selector >
void	tensorConcat_perDevice (Dev_selector s)

	EIGEN_DECLARE_TEST (cxx11_tensor_concatenation_sycl)

Macro Definition Documentation

◆ EIGEN_DEFAULT_DENSE_INDEX_TYPE

#define EIGEN_DEFAULT_DENSE_INDEX_TYPE int64_t

◆ EIGEN_TEST_NO_COMPLEX

#define EIGEN_TEST_NO_COMPLEX

◆ EIGEN_TEST_NO_LONGDOUBLE

#define EIGEN_TEST_NO_LONGDOUBLE

◆ EIGEN_USE_SYCL

#define EIGEN_USE_SYCL

Function Documentation

◆ EIGEN_DECLARE_TEST()

EIGEN_DECLARE_TEST ( cxx11_tensor_concatenation_sycl )

                                                     {
   for (const auto& device : Eigen::get_sycl_supported_devices()) {
     CALL_SUBTEST(tensorConcat_perDevice<half>(device));
     CALL_SUBTEST(tensorConcat_perDevice<float>(device));
   }
 }

References CALL_SUBTEST.

◆ tensorConcat_perDevice()

template<typename DataType , typename Dev_selector >

void tensorConcat_perDevice ( Dev_selector s )

                                             {
   QueueInterface queueInterface(s);
   auto sycl_device = Eigen::SyclDevice(&queueInterface);
   test_simple_concatenation<DataType, RowMajor, int64_t>(sycl_device);
   test_simple_concatenation<DataType, ColMajor, int64_t>(sycl_device);
   test_concatenation_as_lvalue<DataType, ColMajor, int64_t>(sycl_device);
 }

References s.

◆ test_concatenation_as_lvalue()

template<typename DataType , int DataLayout, typename IndexType >

static void test_concatenation_as_lvalue ( const Eigen::SyclDevice & sycl_device )

static

                                                                              {
   IndexType leftDim1 = 2;
   IndexType leftDim2 = 3;
   Eigen::array<IndexType, 2> leftRange = {{leftDim1, leftDim2}};
  
   IndexType rightDim1 = 2;
   IndexType rightDim2 = 3;
   Eigen::array<IndexType, 2> rightRange = {{rightDim1, rightDim2}};
  
   IndexType concatDim1 = 4;
   IndexType concatDim2 = 3;
   Eigen::array<IndexType, 2> resRange = {{concatDim1, concatDim2}};
  
   Tensor<DataType, 2, DataLayout, IndexType> left(leftRange);
   Tensor<DataType, 2, DataLayout, IndexType> right(rightRange);
   Tensor<DataType, 2, DataLayout, IndexType> result(resRange);
  
   left.setRandom();
   right.setRandom();
   result.setRandom();
  
   DataType* gpu_in1_data =
       static_cast<DataType*>(sycl_device.allocate(left.dimensions().TotalSize() * sizeof(DataType)));
   DataType* gpu_in2_data =
       static_cast<DataType*>(sycl_device.allocate(right.dimensions().TotalSize() * sizeof(DataType)));
   DataType* gpu_out_data =
       static_cast<DataType*>(sycl_device.allocate(result.dimensions().TotalSize() * sizeof(DataType)));
  
   Eigen::TensorMap<Eigen::Tensor<DataType, 2, DataLayout, IndexType>> gpu_in1(gpu_in1_data, leftRange);
   Eigen::TensorMap<Eigen::Tensor<DataType, 2, DataLayout, IndexType>> gpu_in2(gpu_in2_data, rightRange);
   Eigen::TensorMap<Eigen::Tensor<DataType, 2, DataLayout, IndexType>> gpu_out(gpu_out_data, resRange);
  
   sycl_device.memcpyHostToDevice(gpu_in1_data, left.data(), (left.dimensions().TotalSize()) * sizeof(DataType));
   sycl_device.memcpyHostToDevice(gpu_in2_data, right.data(), (right.dimensions().TotalSize()) * sizeof(DataType));
   sycl_device.memcpyHostToDevice(gpu_out_data, result.data(), (result.dimensions().TotalSize()) * sizeof(DataType));
  
   //  t1.concatenate(t2, 0) = result;
   gpu_in1.concatenate(gpu_in2, 0).device(sycl_device) = gpu_out;
   sycl_device.memcpyDeviceToHost(left.data(), gpu_in1_data, (left.dimensions().TotalSize()) * sizeof(DataType));
   sycl_device.memcpyDeviceToHost(right.data(), gpu_in2_data, (right.dimensions().TotalSize()) * sizeof(DataType));
  
   for (IndexType i = 0; i < 2; ++i) {
     for (IndexType j = 0; j < 3; ++j) {
       VERIFY_IS_EQUAL(left(i, j), result(i, j));
       VERIFY_IS_EQUAL(right(i, j), result(i + 2, j));
     }
   }
   sycl_device.deallocate(gpu_in1_data);
   sycl_device.deallocate(gpu_in2_data);
   sycl_device.deallocate(gpu_out_data);
 }

References Eigen::TensorBase< Derived, AccessLevel >::concatenate(), Eigen::Tensor< Scalar_, NumIndices_, Options_, IndexType_ >::data(), Eigen::Tensor< Scalar_, NumIndices_, Options_, IndexType_ >::dimensions(), i, j, Eigen::TensorBase< Derived, AccessLevel >::setRandom(), Eigen::DSizes< DenseIndex, NumDims >::TotalSize(), and VERIFY_IS_EQUAL.

◆ test_simple_concatenation()