🚨 蘋果剛剛在 Hugging Face 上發布了 FastVLM - 0.5、1.5 和 7B 實時 VLM,支持 WebGPU 🤯 > 比同類 VLM 快 85 倍,體積小 3.4 倍 > 對於更大的模型,TTFT 快 7.9 倍 > 旨在輸出更少的輸出令牌,並減少高解析度圖像的編碼時間 額外福利:直接在瀏覽器中實時運行,基於 transformers.js 和 WebGPU 🔥 在下面的演示中試用一下 👇
80