面壁智能与清华大学于2024年5月25日联合发布中国首个基于昇腾训练的低比特端侧大模型BitCPM-CANN。该模型采用1.58-bit量化技术,从算子到训练算法实现全链路框架创新。技术验证显示,BitCPM-CANN在推理阶段可释放约6倍显存资源。性能测试表明,模型能力保留率达到90%-97.2%区间。此次开源标志着国产AI框架在端侧部署领域取得突破。