解决方法
有一种方法来模拟这个操作,但它不是很漂亮:
const __m256i K0 = _mm256_setr_epi8( 0x70,0x70,0xF0,0xF0); const __m256i K1 = _mm256_setr_epi8( 0xF0,0x70); inline const __m256i Shuffle(const __m256i & value,const __m256i & shuffle) { return _mm256_or_si256(_mm256_shuffle_epi8(value,_mm256_add_epi8(shuffle,K0)),_mm256_shuffle_epi8(_mm256_permute4x64_epi64(value,0x4E),K1))); }