لم يعد Whisper يرتدي تاج دقة نسخ الأوزان المفتوحة مع الوافدين الجدد الذين يحققون درجات أفضل في معدل خطأ الكلمات في التحليل الاصطناعي بمجرد اعتباره الخيار الافتراضي لنسخ الأوزان المفتوحة ، تم الآن تجاوز OpenAI's Whisper من قبل نماذج الأوزان المفتوحة الأحدث على معيار معدل خطأ الكلمات للتحليل الاصطناعي (AA-WER) لقياس دقة النسخ. يشتمل AA-WER على ثلاث مجموعات بيانات صعبة تتماشى مع حالات الاستخدام في العالم الحقيقي: AMI-SDM (اجتماعات متعددة المتحدثين) ، و Earnings-22 (مكالمات الأرباح) ، و VoxPopuli (الإجراءات البرلمانية). أفضل أداء الأوزان المفتوحة: @NVIDIA's Canary Qwen 2.5B و Parakeet TDT 0.6B V2 ، يليه @Mistral's Voxtral Small and Mini ، و @IBM Granite Speech 3.3 8B. توفر نماذج تحويل الكلام إلى نص الأوزان المفتوحة مرونة في النشر ومزايا التكلفة وإمكانية التخصيص/الضبط الدقيق وتمكين حالات الاستخدام مثل أحمال العمل الحساسة للخصوصية التي تحتاج إلى التشغيل محليا.