Hugging Face发布两款多模态SmolVLM模型:性能与资源需求之间实现平衡
2025-01-27 09:14:41来源:www.luwei123.com发布:二蛋
1月26日,Hugging Face发布了两款全新多模态模型:SmolVLM-256M和SmolVLM-500M。据悉,这两款模型都是基于去年训练的80B参数模型进行提炼而成,实现了性能与资源需求之间的平衡。官方表示,这两款模型可以直接部署在transformer MLX和ONNX平台上。
具体来说,SmolVLM-256M采用了SigLIP作为图片编码器,而SmolVLM-500M则使用了更强大的SmolLM2作为文本编码器。值得一提的是,SmolVLM-256M是目前最小的多模态模型之一,它可以接受任意序列图片和文本输入,并生成文字输出。该功能包括描述图片内容、为短视频生成字幕以及处理PDF等任务。
关于价格方面,在移动平台上运行仅需不到1GB的GPU显存即可完成单张图片的推理工作。而对于需要更高性能的企业运营环境来说,则更适合使用 SmolVLM-500M ,该模型在单张图片上仅需1.23GB的GPU显存,虽然负载较大,但其输出结果更加精准。
最后要注意的是,这两款模型都采用了Apache 2.0开源授权,并提供了基于transformer和WebGUI的示例程序。所有模型及其演示已公开便于开发者下载和使用。
上一篇: Capcom生存游戏《生化危机7》发售8周年 累计销量1080万套 下一篇: 最后一篇
相关阅读
- 01-27 Capcom生存游戏《生化危机7》发售8周年 累计销量1080万套
- 01-27 蔚来发布打击黑公关和网络水军的声明
- 01-27 庆祝小米公司成立15周年 小米SU7璀璨洋红版本上市
- 01-27 《黑神话:悟空》官方表情包上线啦!祝大家新年快乐
- 01-27 玩家们的小心愿Steam终于有回应啦 !
- 01-27 坐过这车的路过美国要被罚 美国宣布对中国三蹦子征税
- 01-27 蔚来起诉网络黑公关 官方出手维权!
- 01-27 《影之刃零》全平台上线 与新华社联合推出视频访谈
- 01-27 理想汽车公布增程技术真实数据:纯电行驶里程占比高达63%
- 01-27 Steam新一轮大促即将到来!农历新年特卖活动即将上线
- 01-27 电影《唐人街探案3》预售总票房已破1亿 刘昊然王宝强主演
- 01-27 《笑傲江湖》终极预告:张雨绮绝美亮相