近日,中国电信宣布,将自研星辰AI大型模型全面开源。
星辰AI大模型通过Github、Gitee及Huggingface平台面向全社会开源,公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。同时开放的还有超 1T 高质量清洗的基础数据,是由星辰大模型预训练语料中抽取出的综合性大规模中文数据集。数据主要来源于网页、书籍、官方媒体等媒介,数据集大约公开了 2.7 亿条数据,由纯中文文本构成。用户既可以直接调用大模型,也可以根据自身业务需求对大模型进行微调或个性化设置,或者加载自己的知识库或数据。从而调整出更符合自身业务需求、更加个性化的理想结果。面对市场竞争,开源软件的免费,当然是一个很有力的获客手段。更是一个可以促进技术的普及和推广的好办法。比如,开源大模型可以吸引更多的开发者和企业参与,能加速大模型的优化、改进和应用。不仅是软件行业,对GPU硬件产业的发展也很有利。 还有,敢于开源,表明从底层代码就是自研而不是抄的。
星辰AI大型模型是什么呢?由中国电信完全自主研发,构建了语义、语音、视觉及多模态大模型完备的基础框架。2923年11月10日,2023数字科技生态大会举办期间,中国电信在主论坛发布千亿参数星辰大模型。 可以预见,中国电信未来将重点围绕开源来做建设,通过持续开源基础大模型,尽可能广泛地赋能更多的用户场景,扩展基础模型的能力边界, 加速行业的数字化转型和升级。从大模型开源,想到中国电信做科技创新的特点。一向是自己先用上,然后劝企事业单位客户用。比如,在推云网融合时,先在企业内部说:“早上云,晚上云,早晚要上云,早上云早受益”。从2020年开始,中国电信内部启动了IT上云计划,在两年的时间将全集团3000多套IT系统迁移到天翼云。又在象2023年世界电信和信息社会日大会这样的公开场合,动员全社会来“早上云早受益”。在大模型,也是如此。 中国电信内部比较有代表性的两个大模型应用场景,分别是:公文写作以及网络故障分析。在对外部的项目中,星辰语义大模型提供的应用场景包括企业市场经营分析、政务公开咨询、医保民生诉求接待等。在这些场景下,星辰语义大模型强大的理解能力和意图理解能力,能够支撑更准确的业务决策。
|