Guide agents through SIMD: reading auto-vectorization output, writing SSE2/AVX2/NEON intrinsics, runtime CPU feature detection, and choosing between compiler auto-vectorization and manual intrinsics.
| Loop-carried dependency | Restructure to remove dependency | | Data-dependent exit (early return) | Move exit after loop | | Non-contiguous memory | Use gather/scatter or restructure | | Aliasing (pointer may alias) | Add restrict or restrict | | Unknown trip count | Add builtinexpect or hint | | Function call in loop body | Inline the function |
For Intel Intrinsics Guide reference and NEON lookup tables, see references/intel-intrinsics-guide.md.
Навыки встроенных функций SIMD для векторизации x86 (SSE/AVX) и ARM (NEON). Используйте при чтении отчетов об автоматической векторизации, написании встроенных функций SSE2/AVX2/NEON, проверке флагов функций ЦП во время выполнения, выборе между встроенными встроенными функциями компилятора и необработанными встроенными функциями или диагностике причин сбоя автоматической векторизации. Активируется при запросах о SIMD, SSE2, AVX2, NEON, встроенных функциях, -fopt-info-vec, автоматической векторизации или сбоях векторизации. Источник: mohitmishra786/low-level-dev-skills.