2025年7月,vivo AI Lab正式发布端侧多模态模型BlueLM-2.5-3B,以30亿参数规模实现跨模态理解与推理能力的双重突破,成为端侧AI领域的重要里程碑。该模型专为移动设备设计,在保持紧凑高效的同时,首次在端侧实现“思考模式”与“非思考模式”的自由切换,并引入思考预算控制机制,可动态平衡推理深度与计算成本。
技术层面,BlueLM-2.5-3B采用ViT+Adapter+LLM架构,通过四阶段预训练策略优化模型性能:从文本模型裁剪蒸馏到图文数据联合训练,再到推理增强与长文激活,最终实现多模态与纯文本任务的协同优化。其动态分辨率方案支持最大1512×1512图像输入,子图并行推理机制使推理耗时随输入token数量线性增长,显著降低端侧部署功耗。
实测数据显示,BlueLM-2.5-3B在20余项评测中表现优异:在AIME25数学推理任务中,思考模式较非思考模式提升40分;在ScreenSpot GUI理解评测中,得分超越同规模模型Qwen2.5-VL-3B与UI-TARS-2B。得益于自建高性能训练平台与优质数据筛选策略,该模型训练效率提升4%,数据利用率达行业领先水平。
这一突破标志着端侧AI从“感知智能”向“认知智能”跃迁,为智能手机、IoT设备等边缘场景提供强大算力支撑,推动AI技术真正融入日常生活。
版权声明:本文仅代表作者观点,不代表智能互通网立场。
本文系作者授权智能互通网发表,未经许可,不得转载。