包含标签:intrinsics 的文章
-
AVX2:AVX 寄存器中 8 位元素的 BitScanReverse 或 CountLeadingZeros
我想提取具有 8 位元素的 256 位 AVX 寄存器中最高设置位的索引。我既找不到bsr也找不到clz实现。 对于clz32 位元素,有一个带有浮点转换的 bithack,但这对于…… -
AVX2:有没有办法实现 _mm256_mul_epi8 函数的 2 的恒定幂?
我想对 8 位元素实现以下操作: _a = _b * 8 + _c 与向量。对于加号,显然有_mm256_add_epi8但我无法找到一个_mm256_mul_epi8或其他东西与 8 位元素相乘。我也……