transformer-lens-interpretability

Name: transformer-lens-interpretability
Author: orchestra-research

✓

Fournit des conseils pour la recherche d’interprétabilité mécaniste à l’aide de TransformerLens pour inspecter et manipuler les composants internes du transformateur via HookPoints et la mise en cache d’activation. À utiliser lors de la rétro-ingénierie d'algorithmes de modèles, de l'étude des modèles d'attention ou de la réalisation d'expériences de correctifs d'activation.

orchestra-research·transformer·lens·interpretability

14Installations·0Tendance·@orchestra-research