查看: 4644|回复: 5

中国电信开源了 [复制链接]

coordinate

军衔等级：

新兵

注册：2010-10-29

电梯直达

1^# 大中小

发表于 2024-1-15 00:31:50 |只看该作者 |倒序浏览

近日，中国电信宣布，将自研星辰AI大型模型全面开源。
星辰AI大模型通过Github、Gitee及Huggingface平台面向全社会开源，公开其底层代码、算法逻辑及其预制的各种基础大模型、开发模块、训练工具等核心产品能力。同时开放的还有超 1T 高质量清洗的基础数据，是由星辰大模型预训练语料中抽取出的综合性大规模中文数据集。数据主要来源于网页、书籍、官方媒体等媒介，数据集大约公开了 2.7 亿条数据，由纯中文文本构成。用户既可以直接调用大模型，也可以根据自身业务需求对大模型进行微调或个性化设置，或者加载自己的知识库或数据。从而调整出更符合自身业务需求、更加个性化的理想结果。面对市场竞争，开源软件的免费，当然是一个很有力的获客手段。更是一个可以促进技术的普及和推广的好办法。比如，开源大模型可以吸引更多的开发者和企业参与，能加速大模型的优化、改进和应用。不仅是软件行业，对GPU硬件产业的发展也很有利。 还有，敢于开源，表明从底层代码就是自研而不是抄的。
星辰AI大型模型是什么呢？由中国电信完全自主研发，构建了语义、语音、视觉及多模态大模型完备的基础框架。

2923年11月10日，2023数字科技生态大会举办期间，中国电信在主论坛发布千亿参数星辰大模型。

可以预见，中国电信未来将重点围绕开源来做建设，通过持续开源基础大模型，尽可能广泛地赋能更多的用户场景，扩展基础模型的能力边界，加速行业的数字化转型和升级。从大模型开源，想到中国电信做科技创新的特点。一向是自己先用上，然后劝企事业单位客户用。比如，在推云网融合时，先在企业内部说:“早上云，晚上云，早晚要上云，早上云早受益”。从2020年开始，中国电信内部启动了IT上云计划，在两年的时间将全集团3000多套IT系统迁移到天翼云。又在象2023年世界电信和信息社会日大会这样的公开场合，动员全社会来“早上云早受益”。在大模型，也是如此。 中国电信内部比较有代表性的两个大模型应用场景,分别是:公文写作以及网络故障分析。在对外部的项目中，星辰语义大模型提供的应用场景包括企业市场经营分析、政务公开咨询、医保民生诉求接待等。在这些场景下，星辰语义大模型强大的理解能力和意图理解能力，能够支撑更准确的业务决策。

0 举报本楼

本帖有 5 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2025-8-16 02:41 , Processed in 0.136462 second(s), 17 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册

中国电信开源了 [复制链接]

浏览过的帖子

浏览过的版块