Guide agents through SIMD: reading auto-vectorization output, writing SSE2/AVX2/NEON intrinsics, runtime CPU feature detection, and choosing between compiler auto-vectorization and manual intrinsics.
| Loop-carried dependency | Restructure to remove dependency | | Data-dependent exit (early return) | Move exit after loop | | Non-contiguous memory | Use gather/scatter or restructure | | Aliasing (pointer may alias) | Add restrict or restrict | | Unknown trip count | Add builtinexpect or hint | | Function call in loop body | Inline the function |
For Intel Intrinsics Guide reference and NEON lookup tables, see references/intel-intrinsics-guide.md.
x86(SSE/AVX) 및 ARM(NEON) 벡터화를 위한 SIMD 내장 기술입니다. 자동 벡터화 보고서 읽기, SSE2/AVX2/NEON 내장 함수 작성, 런타임 시 CPU 기능 플래그 확인, 컴파일러 내장 및 원시 내장 함수 중에서 선택, 자동 벡터화 실패 이유 진단 등에 사용합니다. SIMD, SSE2, AVX2, NEON, 내장 함수, -fopt-info-vec, 자동 벡터화 또는 벡터화 실패에 대한 쿼리에서 활성화됩니다. 출처: mohitmishra786/low-level-dev-skills.