面壁智能BitCPM-CANN:中国首个三值大模型,手机手表都能跑AI
600亿参数模型装进手机的瓶颈被突破了
2026年5月,面壁智能联合清华大学、OpenBMB正式发布中国首个1.58-bit三值大模型BitCPM-CANN,基于华为昇腾平台实现全链路原生开发。该成果标志着大模型端侧部署迈出关键一步。
技术突破
- 三值量化:将模型权重压缩为-1、0、+1三种状态,相比传统16位浮点节省约6倍显存
- 能力保留率高达97.2%:8B模型压缩后仍保留原版95%以上能力
- 四个尺寸开源:0.5B、1B、3B、8B四个版本全部开源(HuggingFace和ModelScope)
- 极致轻量:最小0.5B版本仅需约200MB内存,可在智能手表上运行
- 国产算力训练:基于华为昇腾平台,采用MindSpeed+Megatron-LM训练底座
实际意义
以往大模型必须在云端运行,用户数据需上传处理,存在隐私和延迟问题。BitCPM-CANN让8B模型可在旗舰手机上本地运行,3B模型可在中端手机上运行,0.5B模型甚至能跑在智能手表上。这意味着未来的AI功能可以完全不联网、零延迟、隐私全保护。
行业影响
端侧AI是2026年最大趋势之一。苹果、三星、高通都在布局,面壁智能率先给出可行的开源方案。对于开发者而言,这意味着可以为移动App、IoT设备、车载系统嵌入本地AI能力,无需依赖云端API。