百川智能 × 昇腾ai|百川重磅发布baichuan2大模型!已上线昇思开源社区
2023-09-08
来源:未知
- 分享到:
摘要: 昇腾ai正式支持 baichuan2开源大模型 【2023年9月6日,北京】今日,百川智能在北京召开大模型发布会,正式发
摘要:昇腾ai正式支持baichuan2开源大模型
【2023年9月6日,北京】今日,百川智能在北京召开大模型发布会,正式发布baichuan2开源大模型,昇腾ai基础软硬件平台正式支持baichuan2大模型,并在昇思mindspore开源社区大模型平台上线baichuan2-7b模型开放体验。
发布会现场,百川智能宣布正式开源微调后的baichuan2-7b、baichuan2-13b、baichuan2-13b-chat与其量化版本4bit,面向学术及商业市场提供大模型服务,并且均为免费可商用。
昇思mindspore版本开源仓链接:
https://gitee.com/mindspore/mindformers/blob/dev/research/baichuan2/baichuan2.md
昇思mindspore开源社区大模型平台:
https://xihe.mindspore.cn/modelzoo/baichuan2_7b_chat
文理兼备性能优异,全面领先 llama 2
baichuan2-7b-base 和 baichuan2-13b-base,均基于2.6t⾼质量多语⾔数据进⾏训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署⻔槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能⼒有显著提升。其中baichuan2-13b-base相比上⼀代13b模型,数学能力提升49%,代码能⼒提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。
本次开源的两个模型在各⼤评测榜单上的表现优秀,在mmlu、cmmlu、gsm8k等几⼤权威评估基准中,以绝对优势领先llama 2,相比其他同等参数量大模型,表现也十分亮眼,性能大幅度优于llama 2等同尺寸模型竞品。
更值得一提的是,根据mmlu等多个权威英文评估基准评分 baichuan2-7b以70亿的参数在英文主流任务上与130 亿参数量的llama 2基本持平。
7b参数模型的benchmark成绩
13b参数模型的benchmark成绩
baichuan2-7b和baichuan2-13b不仅对学术研究完全开放,开发者也仅需邮件申请获得官方商用许可后,即可以免费商用。
baichuan2大模型
baichuan2大模型是由百川智能开发的一系列开源可商用的大规模预训练语言模型。包含了70亿、130亿、530亿参数的模型。百川智能⾃成⽴之初,就将通过开源⽅式助⼒中国⼤模型⽣态繁荣作为公司的重要发展⽅向。此次开源的两款baichuan2⼤模型,得到了上下游企业的积极响应,华为等众多知名企业均参加了本次发布会并与百川智能达成了合作。
昇腾ai
昇腾 ai 是以昇腾 ai 基础软硬件平台为基础构建的人工智能计算产业。昇腾ai基础软硬件平台包括 atlas 系列硬件及伙伴自有品牌硬件、异构计算架构 cann、全场景ai框架昇思 mindspore、昇腾应用使能 mindx、一站式开发平台 modelarts 和统一工具链mindstudio 等。
相关新闻
-
电动车充电慢?北汽新能 电动车即将没电?开到换电站,全程扫描...
-
iphone 8要出新皮肤?传苹果 美国运营商virgin mobile发给员工的一份内部...
-
oculus视频负责人:vr将为电 你喜欢在看电影时吃爆米花吗?如果是的...
-
打破理所当然,oppo find 6 月 12 日,oppo 官方微博发布最新产品猜...
-
不只是表,更是生活 pac 说起智能穿戴产品大家第一个想到的肯定...