ما هي whisper؟
نموذج التعرف على الكلام للأغراض العامة من OpenAI. يدعم 99 لغة والنسخ والترجمة إلى الإنجليزية وتحديد اللغة. ستة أحجام للنماذج من الصغير (39 مليون بارم) إلى الكبير (1550 مليون بارام). يستخدم لتحويل الكلام إلى نص، أو نسخ البودكاست، أو معالجة الصوت متعدد اللغات. الأفضل لـ ASR قوي ومتعدد اللغات. المصدر: ovachiever/droid-tings.