Whisper bär inte längre kronan för transkriptionsnoggrannhet med öppna vikter med nya deltagare som uppnår bättre poäng för artificiell analys av ordfel OpenAI:s Whisper, som en gång ansågs vara standardvalet för transkription av öppna vikter, har nu överträffats av nyare modeller med öppna vikter som mäter transkriptionsnoggrannheten enligt Artificial Analysis Word Error Rate (AA-WER) som mäter transkriptionsnoggrannhet. AA-WER består av tre utmanande datauppsättningar som är anpassade till verkliga användningsfall: AMI-SDM (möten med flera talare), Earnings-22 (intäktssamtal) och VoxPopuli (parlamentariska förfaranden). De bästa toppmodellerna av öppna vikter: @NVIDIA's Canary Qwen 2.5B och Parakeet TDT 0.6B V2, följt av @Mistral's Voxtral Small och Mini, och @IBM Granite Speech 3.3 8B. Tal till text-modeller med öppna vikter erbjuder distributionsflexibilitet, kostnadsfördelar, potential för anpassning/finjustering och möjliggör användningsfall som sekretesskänsliga arbetsbelastningar som måste köras lokalt.