d9/d78/SVE_2PacketMath_8h_source.html

 // This file is part of Eigen, a lightweight C++ template library

 // for linear algebra.

 //

 // Copyright (C) 2020, Arm Limited and Contributors

 //

 // This Source Code Form is subject to the terms of the Mozilla

 // Public License v. 2.0. If a copy of the MPL was not distributed

 // with this file, You can obtain one at http://mozilla.org/MPL/2.0/.


 #ifndef EIGEN_PACKET_MATH_SVE_H

 #define EIGEN_PACKET_MATH_SVE_H


 // IWYU pragma: private

 #include "../../InternalHeaderCheck.h"


 namespace Eigen {

 namespace internal {

 #ifndef EIGEN_CACHEFRIENDLY_PRODUCT_THRESHOLD

 #define EIGEN_CACHEFRIENDLY_PRODUCT_THRESHOLD 8

 #endif


 #ifndef EIGEN_HAS_SINGLE_INSTRUCTION_MADD

 #define EIGEN_HAS_SINGLE_INSTRUCTION_MADD

 #endif


 #define EIGEN_ARCH_DEFAULT_NUMBER_OF_REGISTERS 32


 template <typename Scalar, int SVEVectorLength>

 struct sve_packet_size_selector {

   enum { size = SVEVectorLength / (sizeof(Scalar) * CHAR_BIT) };

 };


 /********************************* int32 **************************************/

 typedef svint32_t PacketXi __attribute__((arm_sve_vector_bits(EIGEN_ARM64_SVE_VL)));


 template <>

 struct packet_traits<numext::int32_t> : default_packet_traits {

   typedef PacketXi type;

   typedef PacketXi half;  // Half not implemented yet

   enum {

     Vectorizable = 1,

     AlignedOnScalar = 1,

     size = sve_packet_size_selector<numext::int32_t, EIGEN_ARM64_SVE_VL>::size,


     HasAdd = 1,

     HasSub = 1,

     HasShift = 1,

     HasMul = 1,

     HasNegate = 1,

     HasAbs = 1,

     HasArg = 0,

     HasAbs2 = 1,

     HasMin = 1,

     HasMax = 1,

     HasConj = 1,

     HasSetLinear = 0,

     HasBlend = 0,

     HasReduxp = 0  // Not implemented in SVE

   };

 };


 template <>

 struct unpacket_traits<PacketXi> {

   typedef numext::int32_t type;

   typedef PacketXi half;  // Half not yet implemented

   enum {

     size = sve_packet_size_selector<numext::int32_t, EIGEN_ARM64_SVE_VL>::size,

     alignment = Aligned64,

     vectorizable = true,

     masked_load_available = false,

     masked_store_available = false

   };

 };


 template <>

 EIGEN_STRONG_INLINE void prefetch<numext::int32_t>(const numext::int32_t* addr) {

   svprfw(svptrue_b32(), addr, SV_PLDL1KEEP);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pset1<PacketXi>(const numext::int32_t& from) {

   return svdup_n_s32(from);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi plset<PacketXi>(const numext::int32_t& a) {

   numext::int32_t c[packet_traits<numext::int32_t>::size];

   for (int i = 0; i < packet_traits<numext::int32_t>::size; i++) c[i] = i;

   return svadd_s32_x(svptrue_b32(), pset1<PacketXi>(a), svld1_s32(svptrue_b32(), c));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi padd<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svadd_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi psub<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svsub_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pnegate(const PacketXi& a) {

   return svneg_s32_x(svptrue_b32(), a);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pconj(const PacketXi& a) {

   return a;

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pmul<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svmul_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pdiv<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svdiv_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pmadd(const PacketXi& a, const PacketXi& b, const PacketXi& c) {

   return svmla_s32_x(svptrue_b32(), c, a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pmin<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svmin_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pmax<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svmax_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pcmp_le<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svdup_n_s32_z(svcmple_s32(svptrue_b32(), a, b), 0xffffffffu);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pcmp_lt<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svdup_n_s32_z(svcmplt_s32(svptrue_b32(), a, b), 0xffffffffu);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pcmp_eq<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svdup_n_s32_z(svcmpeq_s32(svptrue_b32(), a, b), 0xffffffffu);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi ptrue<PacketXi>(const PacketXi& /*a*/) {

   return svdup_n_s32_x(svptrue_b32(), 0xffffffffu);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pzero<PacketXi>(const PacketXi& /*a*/) {

   return svdup_n_s32_x(svptrue_b32(), 0);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pand<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svand_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi por<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svorr_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pxor<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return sveor_s32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pandnot<PacketXi>(const PacketXi& a, const PacketXi& b) {

   return svbic_s32_x(svptrue_b32(), a, b);

 }


 template <int N>

 EIGEN_STRONG_INLINE PacketXi parithmetic_shift_right(PacketXi a) {

   return svasrd_n_s32_x(svptrue_b32(), a, N);

 }


 template <int N>

 EIGEN_STRONG_INLINE PacketXi plogical_shift_right(PacketXi a) {

   return svreinterpret_s32_u32(svlsr_n_u32_x(svptrue_b32(), svreinterpret_u32_s32(a), N));

 }


 template <int N>

 EIGEN_STRONG_INLINE PacketXi plogical_shift_left(PacketXi a) {

   return svlsl_n_s32_x(svptrue_b32(), a, N);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pload<PacketXi>(const numext::int32_t* from) {

   EIGEN_DEBUG_ALIGNED_LOAD return svld1_s32(svptrue_b32(), from);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi ploadu<PacketXi>(const numext::int32_t* from) {

   EIGEN_DEBUG_UNALIGNED_LOAD return svld1_s32(svptrue_b32(), from);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi ploaddup<PacketXi>(const numext::int32_t* from) {

   svuint32_t indices = svindex_u32(0, 1);  // index {base=0, base+step=1, base+step*2, ...}

   indices = svzip1_u32(indices, indices);  // index in the format {a0, a0, a1, a1, a2, a2, ...}

   return svld1_gather_u32index_s32(svptrue_b32(), from, indices);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi ploadquad<PacketXi>(const numext::int32_t* from) {

   svuint32_t indices = svindex_u32(0, 1);  // index {base=0, base+step=1, base+step*2, ...}

   indices = svzip1_u32(indices, indices);  // index in the format {a0, a0, a1, a1, a2, a2, ...}

   indices = svzip1_u32(indices, indices);  // index in the format {a0, a0, a0, a0, a1, a1, a1, a1, ...}

   return svld1_gather_u32index_s32(svptrue_b32(), from, indices);

 }


 template <>

 EIGEN_STRONG_INLINE void pstore<numext::int32_t>(numext::int32_t* to, const PacketXi& from) {

   EIGEN_DEBUG_ALIGNED_STORE svst1_s32(svptrue_b32(), to, from);

 }


 template <>

 EIGEN_STRONG_INLINE void pstoreu<numext::int32_t>(numext::int32_t* to, const PacketXi& from) {

   EIGEN_DEBUG_UNALIGNED_STORE svst1_s32(svptrue_b32(), to, from);

 }


 template <>

 EIGEN_DEVICE_FUNC inline PacketXi pgather<numext::int32_t, PacketXi>(const numext::int32_t* from, Index stride) {

   // Indice format: {base=0, base+stride, base+stride*2, base+stride*3, ...}

   svint32_t indices = svindex_s32(0, stride);

   return svld1_gather_s32index_s32(svptrue_b32(), from, indices);

 }


 template <>

 EIGEN_DEVICE_FUNC inline void pscatter<numext::int32_t, PacketXi>(numext::int32_t* to, const PacketXi& from,

                                                                   Index stride) {

   // Indice format: {base=0, base+stride, base+stride*2, base+stride*3, ...}

   svint32_t indices = svindex_s32(0, stride);

   svst1_scatter_s32index_s32(svptrue_b32(), to, indices, from);

 }


 template <>

 EIGEN_STRONG_INLINE numext::int32_t pfirst<PacketXi>(const PacketXi& a) {

   // svlasta returns the first element if all predicate bits are 0

   return svlasta_s32(svpfalse_b(), a);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi preverse(const PacketXi& a) {

   return svrev_s32(a);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXi pabs(const PacketXi& a) {

   return svabs_s32_x(svptrue_b32(), a);

 }


 template <>

 EIGEN_STRONG_INLINE numext::int32_t predux<PacketXi>(const PacketXi& a) {

   return static_cast<numext::int32_t>(svaddv_s32(svptrue_b32(), a));

 }


 template <>

 EIGEN_STRONG_INLINE numext::int32_t predux_mul<PacketXi>(const PacketXi& a) {

   EIGEN_STATIC_ASSERT((EIGEN_ARM64_SVE_VL % 128 == 0), EIGEN_INTERNAL_ERROR_PLEASE_FILE_A_BUG_REPORT);


   // Multiply the vector by its reverse

   svint32_t prod = svmul_s32_x(svptrue_b32(), a, svrev_s32(a));

   svint32_t half_prod;


   // Extract the high half of the vector. Depending on the VL more reductions need to be done

   if (EIGEN_ARM64_SVE_VL >= 2048) {

     half_prod = svtbl_s32(prod, svindex_u32(32, 1));

     prod = svmul_s32_x(svptrue_b32(), prod, half_prod);

   }

   if (EIGEN_ARM64_SVE_VL >= 1024) {

     half_prod = svtbl_s32(prod, svindex_u32(16, 1));

     prod = svmul_s32_x(svptrue_b32(), prod, half_prod);

   }

   if (EIGEN_ARM64_SVE_VL >= 512) {

     half_prod = svtbl_s32(prod, svindex_u32(8, 1));

     prod = svmul_s32_x(svptrue_b32(), prod, half_prod);

   }

   if (EIGEN_ARM64_SVE_VL >= 256) {

     half_prod = svtbl_s32(prod, svindex_u32(4, 1));

     prod = svmul_s32_x(svptrue_b32(), prod, half_prod);

   }

   // Last reduction

   half_prod = svtbl_s32(prod, svindex_u32(2, 1));

   prod = svmul_s32_x(svptrue_b32(), prod, half_prod);


   // The reduction is done to the first element.

   return pfirst<PacketXi>(prod);

 }


 template <>

 EIGEN_STRONG_INLINE numext::int32_t predux_min<PacketXi>(const PacketXi& a) {

   return svminv_s32(svptrue_b32(), a);

 }


 template <>

 EIGEN_STRONG_INLINE numext::int32_t predux_max<PacketXi>(const PacketXi& a) {

   return svmaxv_s32(svptrue_b32(), a);

 }


 template <int N>

 EIGEN_DEVICE_FUNC inline void ptranspose(PacketBlock<PacketXi, N>& kernel) {

   int buffer[packet_traits<numext::int32_t>::size * N] = {0};

   int i = 0;


   PacketXi stride_index = svindex_s32(0, N);


   for (i = 0; i < N; i++) {

     svst1_scatter_s32index_s32(svptrue_b32(), buffer + i, stride_index, kernel.packet[i]);

   }

   for (i = 0; i < N; i++) {

     kernel.packet[i] = svld1_s32(svptrue_b32(), buffer + i * packet_traits<numext::int32_t>::size);

   }

 }


 /********************************* float32 ************************************/


 typedef svfloat32_t PacketXf __attribute__((arm_sve_vector_bits(EIGEN_ARM64_SVE_VL)));


 template <>

 struct packet_traits<float> : default_packet_traits {

   typedef PacketXf type;

   typedef PacketXf half;


   enum {

     Vectorizable = 1,

     AlignedOnScalar = 1,

     size = sve_packet_size_selector<float, EIGEN_ARM64_SVE_VL>::size,


     HasAdd = 1,

     HasSub = 1,

     HasShift = 1,

     HasMul = 1,

     HasNegate = 1,

     HasAbs = 1,

     HasArg = 0,

     HasAbs2 = 1,

     HasMin = 1,

     HasMax = 1,

     HasConj = 1,

     HasSetLinear = 0,

     HasBlend = 0,

     HasReduxp = 0,  // Not implemented in SVE


     HasDiv = 1,


     HasSin = EIGEN_FAST_MATH,

     HasCos = EIGEN_FAST_MATH,

     HasLog = 1,

     HasExp = 1,

     HasSqrt = 1,

     HasTanh = EIGEN_FAST_MATH,

     HasErf = EIGEN_FAST_MATH,

     HasErfc = EIGEN_FAST_MATH

   };

 };


 template <>

 struct unpacket_traits<PacketXf> {

   typedef float type;

   typedef PacketXf half;  // Half not yet implemented

   typedef PacketXi integer_packet;


   enum {

     size = sve_packet_size_selector<float, EIGEN_ARM64_SVE_VL>::size,

     alignment = Aligned64,

     vectorizable = true,

     masked_load_available = false,

     masked_store_available = false

   };

 };


 template <>

 EIGEN_STRONG_INLINE PacketXf pset1<PacketXf>(const float& from) {

   return svdup_n_f32(from);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pset1frombits<PacketXf>(numext::uint32_t from) {

   return svreinterpret_f32_u32(svdup_n_u32_x(svptrue_b32(), from));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf plset<PacketXf>(const float& a) {

   float c[packet_traits<float>::size];

   for (int i = 0; i < packet_traits<float>::size; i++) c[i] = i;

   return svadd_f32_x(svptrue_b32(), pset1<PacketXf>(a), svld1_f32(svptrue_b32(), c));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf padd<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svadd_f32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf psub<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svsub_f32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pnegate(const PacketXf& a) {

   return svneg_f32_x(svptrue_b32(), a);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pconj(const PacketXf& a) {

   return a;

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pmul<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svmul_f32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pdiv<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svdiv_f32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pmadd(const PacketXf& a, const PacketXf& b, const PacketXf& c) {

   return svmla_f32_x(svptrue_b32(), c, a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pmin<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svmin_f32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pmin<PropagateNaN, PacketXf>(const PacketXf& a, const PacketXf& b) {

   return pmin<PacketXf>(a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pmin<PropagateNumbers, PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svminnm_f32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pmax<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svmax_f32_x(svptrue_b32(), a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pmax<PropagateNaN, PacketXf>(const PacketXf& a, const PacketXf& b) {

   return pmax<PacketXf>(a, b);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pmax<PropagateNumbers, PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svmaxnm_f32_x(svptrue_b32(), a, b);

 }


 // Float comparisons in SVE return svbool (predicate). Use svdup to set active

 // lanes to 1 (0xffffffffu) and inactive lanes to 0.

 template <>

 EIGEN_STRONG_INLINE PacketXf pcmp_le<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svreinterpret_f32_u32(svdup_n_u32_z(svcmple_f32(svptrue_b32(), a, b), 0xffffffffu));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pcmp_lt<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svreinterpret_f32_u32(svdup_n_u32_z(svcmplt_f32(svptrue_b32(), a, b), 0xffffffffu));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pcmp_eq<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svreinterpret_f32_u32(svdup_n_u32_z(svcmpeq_f32(svptrue_b32(), a, b), 0xffffffffu));

 }


 // Do a predicate inverse (svnot_b_z) on the predicate resulted from the

 // greater/equal comparison (svcmpge_f32). Then fill a float vector with the

 // active elements.

 template <>

 EIGEN_STRONG_INLINE PacketXf pcmp_lt_or_nan<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svreinterpret_f32_u32(svdup_n_u32_z(svnot_b_z(svptrue_b32(), svcmpge_f32(svptrue_b32(), a, b)), 0xffffffffu));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pfloor<PacketXf>(const PacketXf& a) {

   return svrintm_f32_x(svptrue_b32(), a);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf ptrue<PacketXf>(const PacketXf& /*a*/) {

   return svreinterpret_f32_u32(svdup_n_u32_x(svptrue_b32(), 0xffffffffu));

 }


 // Logical Operations are not supported for float, so reinterpret casts

 template <>

 EIGEN_STRONG_INLINE PacketXf pand<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svreinterpret_f32_u32(svand_u32_x(svptrue_b32(), svreinterpret_u32_f32(a), svreinterpret_u32_f32(b)));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf por<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svreinterpret_f32_u32(svorr_u32_x(svptrue_b32(), svreinterpret_u32_f32(a), svreinterpret_u32_f32(b)));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pxor<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svreinterpret_f32_u32(sveor_u32_x(svptrue_b32(), svreinterpret_u32_f32(a), svreinterpret_u32_f32(b)));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pandnot<PacketXf>(const PacketXf& a, const PacketXf& b) {

   return svreinterpret_f32_u32(svbic_u32_x(svptrue_b32(), svreinterpret_u32_f32(a), svreinterpret_u32_f32(b)));

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pload<PacketXf>(const float* from) {

   EIGEN_DEBUG_ALIGNED_LOAD return svld1_f32(svptrue_b32(), from);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf ploadu<PacketXf>(const float* from) {

   EIGEN_DEBUG_UNALIGNED_LOAD return svld1_f32(svptrue_b32(), from);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf ploaddup<PacketXf>(const float* from) {

   svuint32_t indices = svindex_u32(0, 1);  // index {base=0, base+step=1, base+step*2, ...}

   indices = svzip1_u32(indices, indices);  // index in the format {a0, a0, a1, a1, a2, a2, ...}

   return svld1_gather_u32index_f32(svptrue_b32(), from, indices);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf ploadquad<PacketXf>(const float* from) {

   svuint32_t indices = svindex_u32(0, 1);  // index {base=0, base+step=1, base+step*2, ...}

   indices = svzip1_u32(indices, indices);  // index in the format {a0, a0, a1, a1, a2, a2, ...}

   indices = svzip1_u32(indices, indices);  // index in the format {a0, a0, a0, a0, a1, a1, a1, a1, ...}

   return svld1_gather_u32index_f32(svptrue_b32(), from, indices);

 }


 template <>

 EIGEN_STRONG_INLINE void pstore<float>(float* to, const PacketXf& from) {

   EIGEN_DEBUG_ALIGNED_STORE svst1_f32(svptrue_b32(), to, from);

 }


 template <>

 EIGEN_STRONG_INLINE void pstoreu<float>(float* to, const PacketXf& from) {

   EIGEN_DEBUG_UNALIGNED_STORE svst1_f32(svptrue_b32(), to, from);

 }


 template <>

 EIGEN_DEVICE_FUNC inline PacketXf pgather<float, PacketXf>(const float* from, Index stride) {

   // Indice format: {base=0, base+stride, base+stride*2, base+stride*3, ...}

   svint32_t indices = svindex_s32(0, stride);

   return svld1_gather_s32index_f32(svptrue_b32(), from, indices);

 }


 template <>

 EIGEN_DEVICE_FUNC inline void pscatter<float, PacketXf>(float* to, const PacketXf& from, Index stride) {

   // Indice format: {base=0, base+stride, base+stride*2, base+stride*3, ...}

   svint32_t indices = svindex_s32(0, stride);

   svst1_scatter_s32index_f32(svptrue_b32(), to, indices, from);

 }


 template <>

 EIGEN_STRONG_INLINE float pfirst<PacketXf>(const PacketXf& a) {

   // svlasta returns the first element if all predicate bits are 0

   return svlasta_f32(svpfalse_b(), a);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf preverse(const PacketXf& a) {

   return svrev_f32(a);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pabs(const PacketXf& a) {

   return svabs_f32_x(svptrue_b32(), a);

 }


 // TODO(tellenbach): Should this go into MathFunctions.h? If so, change for

 // all vector extensions and the generic version.

 template <>

 EIGEN_STRONG_INLINE PacketXf pfrexp<PacketXf>(const PacketXf& a, PacketXf& exponent) {

   return pfrexp_generic(a, exponent);

 }


 template <>

 EIGEN_STRONG_INLINE float predux<PacketXf>(const PacketXf& a) {

   return svaddv_f32(svptrue_b32(), a);

 }


 // Other reduction functions:

 // mul

 // Only works for SVE Vls multiple of 128

 template <>

 EIGEN_STRONG_INLINE float predux_mul<PacketXf>(const PacketXf& a) {

   EIGEN_STATIC_ASSERT((EIGEN_ARM64_SVE_VL % 128 == 0), EIGEN_INTERNAL_ERROR_PLEASE_FILE_A_BUG_REPORT);

   // Multiply the vector by its reverse

   svfloat32_t prod = svmul_f32_x(svptrue_b32(), a, svrev_f32(a));

   svfloat32_t half_prod;


   // Extract the high half of the vector. Depending on the VL more reductions need to be done

   if (EIGEN_ARM64_SVE_VL >= 2048) {

     half_prod = svtbl_f32(prod, svindex_u32(32, 1));

     prod = svmul_f32_x(svptrue_b32(), prod, half_prod);

   }

   if (EIGEN_ARM64_SVE_VL >= 1024) {

     half_prod = svtbl_f32(prod, svindex_u32(16, 1));

     prod = svmul_f32_x(svptrue_b32(), prod, half_prod);

   }

   if (EIGEN_ARM64_SVE_VL >= 512) {

     half_prod = svtbl_f32(prod, svindex_u32(8, 1));

     prod = svmul_f32_x(svptrue_b32(), prod, half_prod);

   }

   if (EIGEN_ARM64_SVE_VL >= 256) {

     half_prod = svtbl_f32(prod, svindex_u32(4, 1));

     prod = svmul_f32_x(svptrue_b32(), prod, half_prod);

   }

   // Last reduction

   half_prod = svtbl_f32(prod, svindex_u32(2, 1));

   prod = svmul_f32_x(svptrue_b32(), prod, half_prod);


   // The reduction is done to the first element.

   return pfirst<PacketXf>(prod);

 }


 template <>

 EIGEN_STRONG_INLINE float predux_min<PacketXf>(const PacketXf& a) {

   return svminv_f32(svptrue_b32(), a);

 }


 template <>

 EIGEN_STRONG_INLINE float predux_max<PacketXf>(const PacketXf& a) {

   return svmaxv_f32(svptrue_b32(), a);

 }


 template <int N>

 EIGEN_DEVICE_FUNC inline void ptranspose(PacketBlock<PacketXf, N>& kernel) {

   float buffer[packet_traits<float>::size * N] = {0};

   int i = 0;


   PacketXi stride_index = svindex_s32(0, N);


   for (i = 0; i < N; i++) {

     svst1_scatter_s32index_f32(svptrue_b32(), buffer + i, stride_index, kernel.packet[i]);

   }


   for (i = 0; i < N; i++) {

     kernel.packet[i] = svld1_f32(svptrue_b32(), buffer + i * packet_traits<float>::size);

   }

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf pldexp<PacketXf>(const PacketXf& a, const PacketXf& exponent) {

   return pldexp_generic(a, exponent);

 }


 template <>

 EIGEN_STRONG_INLINE PacketXf psqrt<PacketXf>(const PacketXf& a) {

   return svsqrt_f32_x(svptrue_b32(), a);

 }


 }  // namespace internal

 }  // namespace Eigen


 #endif  // EIGEN_PACKET_MATH_SVE_H

i
int i
Definition: BiCGSTAB_step_by_step.cpp:9

EIGEN_DEBUG_ALIGNED_STORE
#define EIGEN_DEBUG_ALIGNED_STORE
Definition: GenericPacketMath.h:38

EIGEN_DEBUG_ALIGNED_LOAD
#define EIGEN_DEBUG_ALIGNED_LOAD
Definition: GenericPacketMath.h:30

EIGEN_DEBUG_UNALIGNED_STORE
#define EIGEN_DEBUG_UNALIGNED_STORE
Definition: GenericPacketMath.h:42

EIGEN_DEBUG_UNALIGNED_LOAD
#define EIGEN_DEBUG_UNALIGNED_LOAD
Definition: GenericPacketMath.h:34

EIGEN_DEVICE_FUNC
#define EIGEN_DEVICE_FUNC
Definition: Macros.h:892

EIGEN_FAST_MATH
#define EIGEN_FAST_MATH
Definition: Macros.h:51

EIGEN_STRONG_INLINE
#define EIGEN_STRONG_INLINE
Definition: Macros.h:834

EIGEN_STATIC_ASSERT
#define EIGEN_STATIC_ASSERT(X, MSG)
Definition: StaticAssert.h:26

size
Scalar Scalar int size
Definition: benchVecAdd.cpp:17

b
Scalar * b
Definition: benchVecAdd.cpp:17

Scalar
SCALAR Scalar
Definition: bench_gemm.cpp:45

N
@ N
Definition: constructor.cpp:22

Eigen::Aligned64
@ Aligned64
Definition: Constants.h:239

a
const Scalar * a
Definition: level2_cplx_impl.h:32

Eigen::internal::pxor< PacketXf >
EIGEN_STRONG_INLINE PacketXf pxor< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:512

Eigen::internal::pconj
EIGEN_STRONG_INLINE Packet2cf pconj(const Packet2cf &a)
Definition: AltiVec/Complex.h:268

Eigen::internal::pmin< PropagateNumbers, PacketXf >
EIGEN_STRONG_INLINE PacketXf pmin< PropagateNumbers, PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:446

Eigen::internal::pmul< PacketXf >
EIGEN_STRONG_INLINE PacketXf pmul< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:421

Eigen::internal::predux_mul< PacketXf >
EIGEN_STRONG_INLINE float predux_mul< PacketXf >(const PacketXf &a)
Definition: SVE/PacketMath.h:602

Eigen::internal::predux_max< PacketXi >
EIGEN_STRONG_INLINE numext::int32_t predux_max< PacketXi >(const PacketXi &a)
Definition: SVE/PacketMath.h:307

Eigen::internal::pcmp_lt< PacketXf >
EIGEN_STRONG_INLINE PacketXf pcmp_lt< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:473

Eigen::internal::por< PacketXi >
EIGEN_STRONG_INLINE PacketXi por< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:168

Eigen::internal::pfloor< PacketXf >
EIGEN_STRONG_INLINE PacketXf pfloor< PacketXf >(const PacketXf &a)
Definition: SVE/PacketMath.h:491

Eigen::internal::ploaddup< PacketXi >
EIGEN_STRONG_INLINE PacketXi ploaddup< PacketXi >(const numext::int32_t *from)
Definition: SVE/PacketMath.h:208

Eigen::internal::psub< PacketXi >
EIGEN_STRONG_INLINE PacketXi psub< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:98

Eigen::internal::predux< PacketXf >
EIGEN_STRONG_INLINE float predux< PacketXf >(const PacketXf &a)
Definition: SVE/PacketMath.h:594

Eigen::internal::pcmp_lt_or_nan< PacketXf >
EIGEN_STRONG_INLINE PacketXf pcmp_lt_or_nan< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:486

Eigen::internal::pcmp_eq< PacketXf >
EIGEN_STRONG_INLINE PacketXf pcmp_eq< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:478

Eigen::internal::pfirst< PacketXf >
EIGEN_STRONG_INLINE float pfirst< PacketXf >(const PacketXf &a)
Definition: SVE/PacketMath.h:571

Eigen::internal::ptranspose
EIGEN_STRONG_INLINE void ptranspose(PacketBlock< Packet2cf, 2 > &kernel)
Definition: AltiVec/Complex.h:339

Eigen::internal::pload< PacketXi >
EIGEN_STRONG_INLINE PacketXi pload< PacketXi >(const numext::int32_t *from)
Definition: SVE/PacketMath.h:198

Eigen::internal::pandnot< PacketXf >
EIGEN_STRONG_INLINE PacketXf pandnot< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:517

Eigen::internal::predux< PacketXi >
EIGEN_STRONG_INLINE numext::int32_t predux< PacketXi >(const PacketXi &a)
Definition: SVE/PacketMath.h:264

Eigen::internal::padd< PacketXf >
EIGEN_STRONG_INLINE PacketXf padd< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:401

Eigen::internal::pcmp_le< PacketXf >
EIGEN_STRONG_INLINE PacketXf pcmp_le< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:468

Eigen::internal::pmax< PropagateNaN, PacketXf >
EIGEN_STRONG_INLINE PacketXf pmax< PropagateNaN, PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:456

Eigen::internal::plset< PacketXi >
EIGEN_STRONG_INLINE PacketXi plset< PacketXi >(const numext::int32_t &a)
Definition: SVE/PacketMath.h:86

Eigen::internal::plogical_shift_left
EIGEN_STRONG_INLINE Packet4i plogical_shift_left(const Packet4i &a)
Definition: AltiVec/PacketMath.h:1983

Eigen::internal::pcmp_eq< PacketXi >
EIGEN_STRONG_INLINE PacketXi pcmp_eq< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:148

Eigen::internal::pmax< PacketXi >
EIGEN_STRONG_INLINE PacketXi pmax< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:133

Eigen::internal::pdiv< PacketXi >
EIGEN_STRONG_INLINE PacketXi pdiv< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:118

Eigen::internal::plogical_shift_right
EIGEN_STRONG_INLINE Packet4i plogical_shift_right(const Packet4i &a)
Definition: AltiVec/PacketMath.h:1979

Eigen::internal::predux_min< PacketXf >
EIGEN_STRONG_INLINE float predux_min< PacketXf >(const PacketXf &a)
Definition: SVE/PacketMath.h:634

Eigen::internal::ptrue< PacketXi >
EIGEN_STRONG_INLINE PacketXi ptrue< PacketXi >(const PacketXi &)
Definition: SVE/PacketMath.h:153

Eigen::internal::preverse
EIGEN_STRONG_INLINE Packet2cf preverse(const Packet2cf &a)
Definition: AltiVec/Complex.h:303

Eigen::internal::psub< PacketXf >
EIGEN_STRONG_INLINE PacketXf psub< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:406

Eigen::internal::pmadd
EIGEN_STRONG_INLINE Packet4f pmadd(const Packet4f &a, const Packet4f &b, const Packet4f &c)
Definition: AltiVec/PacketMath.h:1218

Eigen::internal::por< PacketXf >
EIGEN_STRONG_INLINE PacketXf por< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:507

Eigen::internal::ploadquad< PacketXi >
EIGEN_STRONG_INLINE PacketXi ploadquad< PacketXi >(const numext::int32_t *from)
Definition: SVE/PacketMath.h:215

Eigen::internal::pnegate
EIGEN_STRONG_INLINE Packet2cf pnegate(const Packet2cf &a)
Definition: AltiVec/Complex.h:264

Eigen::internal::plset< PacketXf >
EIGEN_STRONG_INLINE PacketXf plset< PacketXf >(const float &a)
Definition: SVE/PacketMath.h:394

Eigen::internal::ptrue< PacketXf >
EIGEN_STRONG_INLINE PacketXf ptrue< PacketXf >(const PacketXf &)
Definition: SVE/PacketMath.h:496

Eigen::internal::parithmetic_shift_right
EIGEN_STRONG_INLINE Packet4i parithmetic_shift_right(const Packet4i &a)
Definition: AltiVec/PacketMath.h:1975

Eigen::internal::pset1< PacketXi >
EIGEN_STRONG_INLINE PacketXi pset1< PacketXi >(const numext::int32_t &from)
Definition: SVE/PacketMath.h:81

Eigen::internal::pxor< PacketXi >
EIGEN_STRONG_INLINE PacketXi pxor< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:173

Eigen::internal::pmin< PacketXf >
EIGEN_STRONG_INLINE PacketXf pmin< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:436

Eigen::internal::pset1frombits< PacketXf >
EIGEN_STRONG_INLINE PacketXf pset1frombits< PacketXf >(numext::uint32_t from)
Definition: SVE/PacketMath.h:389

Eigen::internal::pldexp< PacketXf >
EIGEN_STRONG_INLINE PacketXf pldexp< PacketXf >(const PacketXf &a, const PacketXf &exponent)
Definition: SVE/PacketMath.h:660

Eigen::internal::pmin< PropagateNaN, PacketXf >
EIGEN_STRONG_INLINE PacketXf pmin< PropagateNaN, PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:441

Eigen::internal::pfrexp< PacketXf >
EIGEN_STRONG_INLINE PacketXf pfrexp< PacketXf >(const PacketXf &a, PacketXf &exponent)
Definition: SVE/PacketMath.h:589

Eigen::internal::pcmp_le< PacketXi >
EIGEN_STRONG_INLINE PacketXi pcmp_le< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:138

Eigen::internal::ploadu< PacketXi >
EIGEN_STRONG_INLINE PacketXi ploadu< PacketXi >(const numext::int32_t *from)
Definition: SVE/PacketMath.h:203

Eigen::internal::predux_min< PacketXi >
EIGEN_STRONG_INLINE numext::int32_t predux_min< PacketXi >(const PacketXi &a)
Definition: SVE/PacketMath.h:302

Eigen::internal::pstore< float >
EIGEN_STRONG_INLINE void pstore< float >(float *to, const Packet4f &from)
Definition: AltiVec/PacketMath.h:642

Eigen::internal::pabs
EIGEN_STRONG_INLINE Packet4f pabs(const Packet4f &a)
Definition: AltiVec/PacketMath.h:1936

Eigen::internal::predux_max< PacketXf >
EIGEN_STRONG_INLINE float predux_max< PacketXf >(const PacketXf &a)
Definition: SVE/PacketMath.h:639

Eigen::internal::pcmp_lt< PacketXi >
EIGEN_STRONG_INLINE PacketXi pcmp_lt< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:143

Eigen::internal::pmul< PacketXi >
EIGEN_STRONG_INLINE PacketXi pmul< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:113

Eigen::internal::pscatter< float, PacketXf >
EIGEN_DEVICE_FUNC void pscatter< float, PacketXf >(float *to, const PacketXf &from, Index stride)
Definition: SVE/PacketMath.h:564

Eigen::internal::pload< PacketXf >
EIGEN_STRONG_INLINE PacketXf pload< PacketXf >(const float *from)
Definition: SVE/PacketMath.h:522

Eigen::internal::pand< PacketXf >
EIGEN_STRONG_INLINE PacketXf pand< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:502

Eigen::internal::pldexp_generic
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC Packet pldexp_generic(const Packet &a, const Packet &exponent)
Definition: GenericPacketMathFunctions.h:226

Eigen::internal::pmin< PacketXi >
EIGEN_STRONG_INLINE PacketXi pmin< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:128

Eigen::internal::ploadu< PacketXf >
EIGEN_STRONG_INLINE PacketXf ploadu< PacketXf >(const float *from)
Definition: SVE/PacketMath.h:527

Eigen::internal::predux_mul< PacketXi >
EIGEN_STRONG_INLINE numext::int32_t predux_mul< PacketXi >(const PacketXi &a)
Definition: SVE/PacketMath.h:269

Eigen::internal::pand< PacketXi >
EIGEN_STRONG_INLINE PacketXi pand< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:163

Eigen::internal::ploadquad< PacketXf >
EIGEN_STRONG_INLINE PacketXf ploadquad< PacketXf >(const float *from)
Definition: SVE/PacketMath.h:539

Eigen::internal::pgather< float, PacketXf >
EIGEN_DEVICE_FUNC PacketXf pgather< float, PacketXf >(const float *from, Index stride)
Definition: SVE/PacketMath.h:557

Eigen::internal::pfirst< PacketXi >
EIGEN_STRONG_INLINE numext::int32_t pfirst< PacketXi >(const PacketXi &a)
Definition: SVE/PacketMath.h:248

Eigen::internal::pfrexp_generic
EIGEN_STRONG_INLINE EIGEN_DEVICE_FUNC Packet pfrexp_generic(const Packet &a, Packet &exponent)
Definition: GenericPacketMathFunctions.h:184

Eigen::internal::pzero< PacketXi >
EIGEN_STRONG_INLINE PacketXi pzero< PacketXi >(const PacketXi &)
Definition: SVE/PacketMath.h:158

Eigen::internal::pmax< PacketXf >
EIGEN_STRONG_INLINE PacketXf pmax< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:451

Eigen::internal::__attribute__
svint32_t PacketXi __attribute__((arm_sve_vector_bits(EIGEN_ARM64_SVE_VL)))
Definition: SVE/PacketMath.h:34

Eigen::internal::pmax< PropagateNumbers, PacketXf >
EIGEN_STRONG_INLINE PacketXf pmax< PropagateNumbers, PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:461

Eigen::internal::pandnot< PacketXi >
EIGEN_STRONG_INLINE PacketXi pandnot< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:178

Eigen::internal::padd< PacketXi >
EIGEN_STRONG_INLINE PacketXi padd< PacketXi >(const PacketXi &a, const PacketXi &b)
Definition: SVE/PacketMath.h:93

Eigen::internal::psqrt< PacketXf >
EIGEN_STRONG_INLINE PacketXf psqrt< PacketXf >(const PacketXf &a)
Definition: SVE/PacketMath.h:665

Eigen::internal::pdiv< PacketXf >
EIGEN_STRONG_INLINE PacketXf pdiv< PacketXf >(const PacketXf &a, const PacketXf &b)
Definition: SVE/PacketMath.h:426

Eigen::internal::pset1< PacketXf >
EIGEN_STRONG_INLINE PacketXf pset1< PacketXf >(const float &from)
Definition: SVE/PacketMath.h:384

Eigen::internal::pstoreu< float >
EIGEN_STRONG_INLINE void pstoreu< float >(float *to, const Packet4f &from)
Definition: AltiVec/PacketMath.h:1756

Eigen::internal::ploaddup< PacketXf >
EIGEN_STRONG_INLINE PacketXf ploaddup< PacketXf >(const float *from)
Definition: SVE/PacketMath.h:532

Eigen::numext::int32_t
std::int32_t int32_t
Definition: Meta.h:41

Eigen::numext::uint32_t
std::uint32_t uint32_t
Definition: Meta.h:40

Eigen
Namespace containing all symbols from the Eigen library.
Definition: bench_norm.cpp:70

Eigen::Index
EIGEN_DEFAULT_DENSE_INDEX_TYPE Index
The Index type as used for the API.
Definition: Meta.h:83

Eigen::prod
const Product< Lhs, Rhs > prod(const Lhs &lhs, const Rhs &rhs)
Definition: evaluators.cpp:7

calibrate.c
int c
Definition: calibrate.py:100

internal
Definition: Eigen_Colamd.h:49

Eigen::internal::PacketBlock
Definition: GenericPacketMath.h:1407

Eigen::internal::PacketBlock::packet
Packet packet[N]
Definition: GenericPacketMath.h:1408

Eigen::internal::default_packet_traits
Definition: GenericPacketMath.h:45

Eigen::internal::default_packet_traits::HasSin
@ HasSin
Definition: GenericPacketMath.h:81

Eigen::internal::default_packet_traits::HasBlend
@ HasBlend
Definition: GenericPacketMath.h:66

Eigen::internal::default_packet_traits::HasErfc
@ HasErfc
Definition: GenericPacketMath.h:96

Eigen::internal::default_packet_traits::HasArg
@ HasArg
Definition: GenericPacketMath.h:64

Eigen::internal::default_packet_traits::HasCos
@ HasCos
Definition: GenericPacketMath.h:82

Eigen::internal::default_packet_traits::HasShift
@ HasShift
Definition: GenericPacketMath.h:50

Eigen::internal::default_packet_traits::HasExp
@ HasExp
Definition: GenericPacketMath.h:75

Eigen::internal::default_packet_traits::HasSqrt
@ HasSqrt
Definition: GenericPacketMath.h:73

Eigen::internal::default_packet_traits::HasErf
@ HasErf
Definition: GenericPacketMath.h:95

Eigen::internal::default_packet_traits::HasLog
@ HasLog
Definition: GenericPacketMath.h:77

Eigen::internal::default_packet_traits::HasTanh
@ HasTanh
Definition: GenericPacketMath.h:90

Eigen::internal::default_packet_traits::HasDiv
@ HasDiv
Definition: GenericPacketMath.h:71

Eigen::internal::packet_traits< float >::type
PacketXf type
Definition: SVE/PacketMath.h:332

Eigen::internal::packet_traits< float >::half
PacketXf half
Definition: SVE/PacketMath.h:333

Eigen::internal::packet_traits< numext::int32_t >::half
PacketXi half
Definition: SVE/PacketMath.h:39

Eigen::internal::packet_traits< numext::int32_t >::type
PacketXi type
Definition: SVE/PacketMath.h:38

Eigen::internal::packet_traits
Definition: GenericPacketMath.h:108

Eigen::internal::packet_traits::size
@ size
Definition: GenericPacketMath.h:113

Eigen::internal::packet_traits::AlignedOnScalar
@ AlignedOnScalar
Definition: GenericPacketMath.h:114

Eigen::internal::packet_traits::Vectorizable
@ Vectorizable
Definition: GenericPacketMath.h:112

Eigen::internal::packet_traits::HasSub
@ HasSub
Definition: GenericPacketMath.h:118

Eigen::internal::packet_traits::HasMax
@ HasMax
Definition: GenericPacketMath.h:124

Eigen::internal::packet_traits::HasNegate
@ HasNegate
Definition: GenericPacketMath.h:120

Eigen::internal::packet_traits::HasMul
@ HasMul
Definition: GenericPacketMath.h:119

Eigen::internal::packet_traits::HasAdd
@ HasAdd
Definition: GenericPacketMath.h:117

Eigen::internal::packet_traits::HasSetLinear
@ HasSetLinear
Definition: GenericPacketMath.h:126

Eigen::internal::packet_traits::HasMin
@ HasMin
Definition: GenericPacketMath.h:123

Eigen::internal::packet_traits::HasConj
@ HasConj
Definition: GenericPacketMath.h:125

Eigen::internal::packet_traits::HasAbs2
@ HasAbs2
Definition: GenericPacketMath.h:122

Eigen::internal::packet_traits::HasAbs
@ HasAbs
Definition: GenericPacketMath.h:121

Eigen::internal::sve_packet_size_selector
Definition: SVE/PacketMath.h:29

Eigen::internal::sve_packet_size_selector::size
@ size
Definition: SVE/PacketMath.h:30

Eigen::internal::unpacket_traits< PacketXf >::integer_packet
PacketXi integer_packet
Definition: SVE/PacketMath.h:372

Eigen::internal::unpacket_traits< PacketXf >::type
float type
Definition: SVE/PacketMath.h:370

Eigen::internal::unpacket_traits< PacketXf >::half
PacketXf half
Definition: SVE/PacketMath.h:371

Eigen::internal::unpacket_traits< PacketXi >::type
numext::int32_t type
Definition: SVE/PacketMath.h:64

Eigen::internal::unpacket_traits< PacketXi >::half
PacketXi half
Definition: SVE/PacketMath.h:65

Eigen::internal::unpacket_traits
Definition: GenericPacketMath.h:134

Eigen::internal::unpacket_traits::masked_load_available
@ masked_load_available
Definition: GenericPacketMath.h:142

Eigen::internal::unpacket_traits::size
@ size
Definition: GenericPacketMath.h:139

Eigen::internal::unpacket_traits::masked_store_available
@ masked_store_available
Definition: GenericPacketMath.h:143

Eigen::internal::unpacket_traits::vectorizable
@ vectorizable
Definition: GenericPacketMath.h:141

Eigen::internal::unpacket_traits::alignment
@ alignment
Definition: GenericPacketMath.h:140