da/d4c/Assign__MKL_8h_source.html

 /*

  Copyright (c) 2011, Intel Corporation. All rights reserved.

  Copyright (C) 2015 Gael Guennebaud <gael.guennebaud@inria.fr>


  Redistribution and use in source and binary forms, with or without modification,

  are permitted provided that the following conditions are met:


  * Redistributions of source code must retain the above copyright notice, this

    list of conditions and the following disclaimer.

  * Redistributions in binary form must reproduce the above copyright notice,

    this list of conditions and the following disclaimer in the documentation

    and/or other materials provided with the distribution.

  * Neither the name of Intel Corporation nor the names of its contributors may

    be used to endorse or promote products derived from this software without

    specific prior written permission.


  THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS "AS IS" AND

  ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED

  WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE

  DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR CONTRIBUTORS BE LIABLE FOR

  ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES

  (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;

  LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON

  ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT

  (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS

  SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.


  ********************************************************************************

  *   Content : Eigen bindings to Intel(R) MKL

  *   MKL VML support for coefficient-wise unary Eigen expressions like a=b.sin()

  ********************************************************************************

 */


 #ifndef EIGEN_ASSIGN_VML_H

 #define EIGEN_ASSIGN_VML_H


 // IWYU pragma: private

 #include "./InternalHeaderCheck.h"


 namespace Eigen {


 namespace internal {


 template <typename Dst, typename Src>

 class vml_assign_traits {

  private:

   enum {

     DstHasDirectAccess = Dst::Flags & DirectAccessBit,

     SrcHasDirectAccess = Src::Flags & DirectAccessBit,

     StorageOrdersAgree = (int(Dst::IsRowMajor) == int(Src::IsRowMajor)),

     InnerSize = int(Dst::IsVectorAtCompileTime) ? int(Dst::SizeAtCompileTime)

                 : int(Dst::Flags) & RowMajorBit ? int(Dst::ColsAtCompileTime)

                                                 : int(Dst::RowsAtCompileTime),

     InnerMaxSize = int(Dst::IsVectorAtCompileTime) ? int(Dst::MaxSizeAtCompileTime)

                    : int(Dst::Flags) & RowMajorBit ? int(Dst::MaxColsAtCompileTime)

                                                    : int(Dst::MaxRowsAtCompileTime),

     MaxSizeAtCompileTime = Dst::SizeAtCompileTime,


     MightEnableVml = StorageOrdersAgree && DstHasDirectAccess && SrcHasDirectAccess &&

                      Src::InnerStrideAtCompileTime == 1 && Dst::InnerStrideAtCompileTime == 1,

     MightLinearize = MightEnableVml && (int(Dst::Flags) & int(Src::Flags) & LinearAccessBit),

     VmlSize = MightLinearize ? MaxSizeAtCompileTime : InnerMaxSize,

     LargeEnough = VmlSize == Dynamic || VmlSize >= EIGEN_MKL_VML_THRESHOLD

   };


  public:

   enum { EnableVml = MightEnableVml && LargeEnough, Traversal = MightLinearize ? LinearTraversal : DefaultTraversal };

 };


 #define EIGEN_PP_EXPAND(ARG) ARG

 #if !defined(EIGEN_FAST_MATH) || (EIGEN_FAST_MATH != 1)

 #define EIGEN_VMLMODE_EXPAND_xLA , VML_HA

 #else

 #define EIGEN_VMLMODE_EXPAND_xLA , VML_LA

 #endif


 #define EIGEN_VMLMODE_EXPAND_x_


 #define EIGEN_VMLMODE_PREFIX_xLA vm

 #define EIGEN_VMLMODE_PREFIX_x_ v

 #define EIGEN_VMLMODE_PREFIX(VMLMODE) EIGEN_CAT(EIGEN_VMLMODE_PREFIX_x, VMLMODE)


 #define EIGEN_MKL_VML_DECLARE_UNARY_CALL(EIGENOP, VMLOP, EIGENTYPE, VMLTYPE, VMLMODE)                      \

   template <typename DstXprType, typename SrcXprNested>                                                    \

   struct Assignment<DstXprType, CwiseUnaryOp<scalar_##EIGENOP##_op<EIGENTYPE>, SrcXprNested>,              \

                     assign_op<EIGENTYPE, EIGENTYPE>, Dense2Dense,                                          \

                     std::enable_if_t<vml_assign_traits<DstXprType, SrcXprNested>::EnableVml>> {            \

     typedef CwiseUnaryOp<scalar_##EIGENOP##_op<EIGENTYPE>, SrcXprNested> SrcXprType;                       \

     static void run(DstXprType &dst, const SrcXprType &src, const assign_op<EIGENTYPE, EIGENTYPE> &func) { \

       resize_if_allowed(dst, src, func);                                                                   \

       eigen_assert(dst.rows() == src.rows() && dst.cols() == src.cols());                                  \

       if (vml_assign_traits<DstXprType, SrcXprNested>::Traversal == (int)LinearTraversal) {                \

         VMLOP(dst.size(), (const VMLTYPE *)src.nestedExpression().data(),                                  \

               (VMLTYPE *)dst.data() EIGEN_PP_EXPAND(EIGEN_VMLMODE_EXPAND_x##VMLMODE));                     \

       } else {                                                                                             \

         const Index outerSize = dst.outerSize();                                                           \

         for (Index outer = 0; outer < outerSize; ++outer) {                                                \

           const EIGENTYPE *src_ptr = src.IsRowMajor ? &(src.nestedExpression().coeffRef(outer, 0))         \

                                                     : &(src.nestedExpression().coeffRef(0, outer));        \

           EIGENTYPE *dst_ptr = dst.IsRowMajor ? &(dst.coeffRef(outer, 0)) : &(dst.coeffRef(0, outer));     \

           VMLOP(dst.innerSize(), (const VMLTYPE *)src_ptr,                                                 \

                 (VMLTYPE *)dst_ptr EIGEN_PP_EXPAND(EIGEN_VMLMODE_EXPAND_x##VMLMODE));                      \

         }                                                                                                  \

       }                                                                                                    \

     }                                                                                                      \

   };


 #define EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL(EIGENOP, VMLOP, VMLMODE)                                                \

   EIGEN_MKL_VML_DECLARE_UNARY_CALL(EIGENOP, EIGEN_CAT(EIGEN_VMLMODE_PREFIX(VMLMODE), s##VMLOP), float, float, VMLMODE) \

   EIGEN_MKL_VML_DECLARE_UNARY_CALL(EIGENOP, EIGEN_CAT(EIGEN_VMLMODE_PREFIX(VMLMODE), d##VMLOP), double, double, VMLMODE)


 #define EIGEN_MKL_VML_DECLARE_UNARY_CALLS_CPLX(EIGENOP, VMLOP, VMLMODE)                                   \

   EIGEN_MKL_VML_DECLARE_UNARY_CALL(EIGENOP, EIGEN_CAT(EIGEN_VMLMODE_PREFIX(VMLMODE), c##VMLOP), scomplex, \

                                    MKL_Complex8, VMLMODE)                                                 \

   EIGEN_MKL_VML_DECLARE_UNARY_CALL(EIGENOP, EIGEN_CAT(EIGEN_VMLMODE_PREFIX(VMLMODE), z##VMLOP), dcomplex, \

                                    MKL_Complex16, VMLMODE)


 #define EIGEN_MKL_VML_DECLARE_UNARY_CALLS(EIGENOP, VMLOP, VMLMODE) \

   EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL(EIGENOP, VMLOP, VMLMODE)  \

   EIGEN_MKL_VML_DECLARE_UNARY_CALLS_CPLX(EIGENOP, VMLOP, VMLMODE)


 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(sin, Sin, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(asin, Asin, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(sinh, Sinh, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(cos, Cos, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(acos, Acos, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(cosh, Cosh, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(tan, Tan, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(atan, Atan, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(tanh, Tanh, LA)

 // EIGEN_MKL_VML_DECLARE_UNARY_CALLS(abs,   Abs,    _)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(exp, Exp, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(log, Ln, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(log10, Log10, LA)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS(sqrt, Sqrt, _)


 EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL(square, Sqr, _)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS_CPLX(arg, Arg, _)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL(round, Round, _)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL(floor, Floor, _)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL(ceil, Ceil, _)

 EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL(cbrt, Cbrt, _)


 #define EIGEN_MKL_VML_DECLARE_POW_CALL(EIGENOP, VMLOP, EIGENTYPE, VMLTYPE, VMLMODE)                        \

   template <typename DstXprType, typename SrcXprNested, typename Plain>                                    \

   struct Assignment<DstXprType,                                                                            \

                     CwiseBinaryOp<scalar_##EIGENOP##_op<EIGENTYPE, EIGENTYPE>, SrcXprNested,               \

                                   const CwiseNullaryOp<internal::scalar_constant_op<EIGENTYPE>, Plain>>,   \

                     assign_op<EIGENTYPE, EIGENTYPE>, Dense2Dense,                                          \

                     std::enable_if_t<vml_assign_traits<DstXprType, SrcXprNested>::EnableVml>> {            \

     typedef CwiseBinaryOp<scalar_##EIGENOP##_op<EIGENTYPE, EIGENTYPE>, SrcXprNested,                       \

                           const CwiseNullaryOp<internal::scalar_constant_op<EIGENTYPE>, Plain>>            \

         SrcXprType;                                                                                        \

     static void run(DstXprType &dst, const SrcXprType &src, const assign_op<EIGENTYPE, EIGENTYPE> &func) { \

       resize_if_allowed(dst, src, func);                                                                   \

       eigen_assert(dst.rows() == src.rows() && dst.cols() == src.cols());                                  \

       VMLTYPE exponent = reinterpret_cast<const VMLTYPE &>(src.rhs().functor().m_other);                   \

       if (vml_assign_traits<DstXprType, SrcXprNested>::Traversal == LinearTraversal) {                     \

         VMLOP(dst.size(), (const VMLTYPE *)src.lhs().data(), exponent,                                     \

               (VMLTYPE *)dst.data() EIGEN_PP_EXPAND(EIGEN_VMLMODE_EXPAND_x##VMLMODE));                     \

       } else {                                                                                             \

         const Index outerSize = dst.outerSize();                                                           \

         for (Index outer = 0; outer < outerSize; ++outer) {                                                \

           const EIGENTYPE *src_ptr =                                                                       \

               src.IsRowMajor ? &(src.lhs().coeffRef(outer, 0)) : &(src.lhs().coeffRef(0, outer));          \

           EIGENTYPE *dst_ptr = dst.IsRowMajor ? &(dst.coeffRef(outer, 0)) : &(dst.coeffRef(0, outer));     \

           VMLOP(dst.innerSize(), (const VMLTYPE *)src_ptr, exponent,                                       \

                 (VMLTYPE *)dst_ptr EIGEN_PP_EXPAND(EIGEN_VMLMODE_EXPAND_x##VMLMODE));                      \

         }                                                                                                  \

       }                                                                                                    \

     }                                                                                                      \

   };


 EIGEN_MKL_VML_DECLARE_POW_CALL(pow, vmsPowx, float, float, LA)

 EIGEN_MKL_VML_DECLARE_POW_CALL(pow, vmdPowx, double, double, LA)

 EIGEN_MKL_VML_DECLARE_POW_CALL(pow, vmcPowx, scomplex, MKL_Complex8, LA)

 EIGEN_MKL_VML_DECLARE_POW_CALL(pow, vmzPowx, dcomplex, MKL_Complex16, LA)


 }  // end namespace internal


 }  // end namespace Eigen


 #endif  // EIGEN_ASSIGN_VML_H

cos
AnnoyingScalar cos(const AnnoyingScalar &x)
Definition: AnnoyingScalar.h:136

acos
AnnoyingScalar acos(const AnnoyingScalar &x)
Definition: AnnoyingScalar.h:138

sin
AnnoyingScalar sin(const AnnoyingScalar &x)
Definition: AnnoyingScalar.h:137

sqrt
AnnoyingScalar sqrt(const AnnoyingScalar &x)
Definition: AnnoyingScalar.h:134

EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL
#define EIGEN_MKL_VML_DECLARE_UNARY_CALLS_REAL(EIGENOP, VMLOP, VMLMODE)
Definition: Assign_MKL.h:108

EIGEN_MKL_VML_DECLARE_UNARY_CALLS
#define EIGEN_MKL_VML_DECLARE_UNARY_CALLS(EIGENOP, VMLOP, VMLMODE)
Definition: Assign_MKL.h:118

EIGEN_MKL_VML_DECLARE_POW_CALL
#define EIGEN_MKL_VML_DECLARE_POW_CALL(EIGENOP, VMLOP, EIGENTYPE, VMLTYPE, VMLMODE)
Definition: Assign_MKL.h:144

EIGEN_MKL_VML_DECLARE_UNARY_CALLS_CPLX
#define EIGEN_MKL_VML_DECLARE_UNARY_CALLS_CPLX(EIGENOP, VMLOP, VMLMODE)
Definition: Assign_MKL.h:112

Round
static int Round(int n)
Definition: benchmark_main.cc:39

_
#define _(A, B)
Definition: cfortran.h:132

Eigen::internal::vml_assign_traits
Definition: Assign_MKL.h:45

Eigen::internal::vml_assign_traits::SrcHasDirectAccess
@ SrcHasDirectAccess
Definition: Assign_MKL.h:49

Eigen::internal::vml_assign_traits::InnerSize
@ InnerSize
Definition: Assign_MKL.h:51

Eigen::internal::vml_assign_traits::StorageOrdersAgree
@ StorageOrdersAgree
Definition: Assign_MKL.h:50

Eigen::internal::vml_assign_traits::MaxSizeAtCompileTime
@ MaxSizeAtCompileTime
Definition: Assign_MKL.h:57

Eigen::internal::vml_assign_traits::InnerMaxSize
@ InnerMaxSize
Definition: Assign_MKL.h:54

Eigen::internal::vml_assign_traits::MightEnableVml
@ MightEnableVml
Definition: Assign_MKL.h:59

Eigen::internal::vml_assign_traits::DstHasDirectAccess
@ DstHasDirectAccess
Definition: Assign_MKL.h:48

Eigen::internal::vml_assign_traits::MightLinearize
@ MightLinearize
Definition: Assign_MKL.h:61

Eigen::internal::vml_assign_traits::VmlSize
@ VmlSize
Definition: Assign_MKL.h:62

Eigen::internal::vml_assign_traits::EnableVml
@ EnableVml
Definition: Assign_MKL.h:67

Eigen::internal::vml_assign_traits::Traversal
@ Traversal
Definition: Assign_MKL.h:67

Eigen::DefaultTraversal
@ DefaultTraversal
Definition: Constants.h:279

Eigen::LinearTraversal
@ LinearTraversal
Definition: Constants.h:281

Eigen::LinearAccessBit
const unsigned int LinearAccessBit
Definition: Constants.h:133

Eigen::DirectAccessBit
const unsigned int DirectAccessBit
Definition: Constants.h:159

Eigen::RowMajorBit
const unsigned int RowMajorBit
Definition: Constants.h:70

int
return int(ret)+1

Eigen::bfloat16_impl::tanh
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 tanh(const bfloat16 &a)
Definition: BFloat16.h:639

Eigen::bfloat16_impl::floor
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 floor(const bfloat16 &a)
Definition: BFloat16.h:643

Eigen::bfloat16_impl::cosh
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 cosh(const bfloat16 &a)
Definition: BFloat16.h:638

Eigen::bfloat16_impl::ceil
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 ceil(const bfloat16 &a)
Definition: BFloat16.h:644

Eigen::bfloat16_impl::asin
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 asin(const bfloat16 &a)
Definition: BFloat16.h:634

Eigen::bfloat16_impl::log10
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 log10(const bfloat16 &a)
Definition: BFloat16.h:620

Eigen::bfloat16_impl::atan
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 atan(const bfloat16 &a)
Definition: BFloat16.h:636

Eigen::bfloat16_impl::exp
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 exp(const bfloat16 &a)
Definition: BFloat16.h:615

Eigen::bfloat16_impl::pow
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 pow(const bfloat16 &a, const bfloat16 &b)
Definition: BFloat16.h:625

Eigen::bfloat16_impl::round
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 round(const bfloat16 &a)
Definition: BFloat16.h:646

Eigen::bfloat16_impl::log
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 log(const bfloat16 &a)
Definition: BFloat16.h:618

Eigen::bfloat16_impl::sinh
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 sinh(const bfloat16 &a)
Definition: BFloat16.h:637

Eigen::bfloat16_impl::tan
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC bfloat16 tan(const bfloat16 &a)
Definition: BFloat16.h:633

Eigen::numext::cbrt
EIGEN_DEVICE_FUNC EIGEN_ALWAYS_INLINE T cbrt(const T &x)
Definition: MathFunctions.h:1320

Eigen
Namespace containing all symbols from the Eigen library.
Definition: bench_norm.cpp:70

Eigen::dcomplex
std::complex< double > dcomplex
Definition: MKL_support.h:128

Eigen::scomplex
std::complex< float > scomplex
Definition: MKL_support.h:129

Eigen::square
squared absolute sa ArrayBase::abs2 DOXCOMMA MatrixBase::cwiseAbs2 square(power 2)

Eigen::Dynamic
const int Dynamic
Definition: Constants.h:25

Flags
Extend namespace for flags.
Definition: fsi_chan_precond_driver.cc:56

internal
Definition: Eigen_Colamd.h:49

InternalHeaderCheck.h