苹果在HF上开源文物是一种特别的快乐!
Vaibhav (VB) Srivastav
Vaibhav (VB) Srivastav2025年8月30日
🚨 苹果刚刚在 Hugging Face 上发布了 FastVLM - 0.5、1.5 和 7B 实时 VLM,支持 WebGPU 🤯 > 比同类 VLM 快 85 倍,体积小 3.4 倍 > 对于更大的模型,TTFT 快 7.9 倍 > 旨在输出更少的输出令牌,并减少高分辨率图像的编码时间 额外福利:直接在浏览器中实时运行,基于 transformers.js 和 WebGPU 🔥 在下面的演示中试用一下 👇
13.3K