🚨 A Apple acaba de lançar o FastVLM no Hugging Face - VLMs em tempo real de 0.5, 1.5 e 7B com suporte a WebGPU 🤯 > 85x mais rápido e 3.4x menor do que VLMs de tamanho comparável > 7.9x mais rápido TTFT para modelos maiores > projetado para gerar menos tokens de saída e reduzir o tempo de codificação para imagens de alta resolução Bônus: funciona em TEMPO REAL diretamente no seu navegador, alimentado por transformers.js e WebGPU 🔥 Experimente na demonstração abaixo 👇
160