通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  大元帅

注册:2007-12-101364
跳转到指定楼层
1#
发表于 2024-3-5 10:00:45 |只看该作者 |倒序浏览
早在ChatGPT出现时,有很多人也讨论过“ChatGPT为什么没有首先出现在中国”。而当我们还在困扰为什么国内大模型没有GPT4好用的时候,Sora来了。


从通用人工智能(AGI)视角看,这意味着我们与OpenAI的差距又被拉大了。


中国人工智能发展的制约因素是什么?当前的发展到底处于第几梯队?2023年下半年,我密集调研了十几家人工智能企业,来宽泛地谈谈我自己的看法。


算力


算力是人工智能竞争的核心,算力的背后是芯片。


Meta一家公司已经有50万块GPU,微软也有几十万块,而且两家公司还在不断采购。国内所有的人工智能公司加在一起,可能有50万块左右,所以在算力的存量层面,我们跟国外的差距很大。


芯片又分为芯片设计和芯片制造。中国的芯片设计能力在全球应该可以划分到第一梯队。在传统的CPU和GPU领域,与国外几乎没有差距。在人工智能芯片的细分领域,比如半定制化的FPGA、全定制化的ASIC、类脑芯片等领域,已经有个别很优秀的公司极度贴近甚至部分超越国际顶尖水平,但顶尖公司的数量和生态,总体上与国外发达国家还有不小的差距。


在芯片制造环节,面临卡脖子。


从制程上看,90nm以上制程的芯片,技术上我们已经几乎可以完全自主。有消息说,2023年下半年,28nm的国产(后道封装)光刻机也已经交付芯片制造厂商。但也有消息说,仍然正在研发,还没有交付。


即使已经交付芯片制造商,在一切顺利的情况下,参考阿斯麦(ASML)和台积电的经验,从安装完成、调试到可以稳定生产,至少需要2年的时间。考虑到这是中国首台全国产的28nm光刻机,以及光刻机的高度复杂性,所需时间大概率会更长。


特别需要注意的是,光刻机完成实验室阶段的研发和在厂商完成产业化生产是完全不同的两个概念。


在研发阶段,只要成功流片,就算是研发成功,但在实际的产业应用阶段,要求在保证良率和产能的情况下,能够安全稳定地持续运营,这个过程是很难的。


所以,光刻机从实验研发到正式投产,花费十年八年都是很正常的。即使ASML,前几款光刻机,从研发成功到正式投产,也在5年以上。


至于28nm以下的芯片制造,必须还要依赖国外的光刻机。


当前全球的光刻机市场被荷兰阿斯麦(ASML)、日本尼康(Nikon)和佳能(Canon)三大巨头垄断。尼康的光刻机集中在中高端区域,佳能则集中在低端区域。


至于2023年某厂商成功制造5nm的芯片,业内普遍推测,芯片自主设计是没问题的,但在制造环节,使用的还是国外的设备,区别无非是ASML的还是Nikon或者Canon的。


光刻产业链具有极度复杂性。光刻机的制造研发绝不是某一个企业能够单独完成的(包括ASML也不是一家就能造DUV和EUV,很多核心零部件都要进口),需要很多顶尖的企业相互配合才可以完成。


光刻产业链的高度复杂性主要体现在两点:


一是作为光刻核心设备的光刻机组件复杂,包括光源系统、照明系统、物镜系统、浸入式系统、双工件台等在内的组件技术全球只有极少数几家公司能够掌握。比如物镜镜片被德国企业蔡司(ZEISS)垄断。


二是与光刻机配套的光刻胶、光刻气体、掩膜版等半导体材料和涂胶显影设备等同样要求很高的技术含量。比如,宽谱g/i/h线光刻胶基本完成国产替代,但高端KrF、ArF和EUV光刻胶基本被美国和日本的企业垄断,韩国企业占一点比重,中国大陆基本依靠进口。


现在的问题是ASML被限制向中国出口最新的光刻机,英伟达(NVIDIA)被限制向中国出口最新的芯片。


虽然我们还可以买到性能受限的“特供版”芯片,但限售既限制了企业的算力获取,又拉高了算力成本,而且扰乱了企业的研发预期。


短期来看,部分企业有储备算力可供使用,而且现在也没有到单纯拼算力的地步,算法依然有很大的优化提升空间。但长远来看,仅从技术的角度,人工智能竞争的本质还是算力的竞争。


尽管当前我们已经加大在半导体领域的研发投入,但短期内中国在芯片制造领域取得颠覆性突破的困难还比较大,所以未来在算力竞争层面,无论是国家还是企业,都要提前做好各方面的应对准备。


数据


数据是重要的基础性战略资源,高质量数据对人工智能的重要性无需赘言。


中国是世界上数据最丰富、也是最重视数据的国家之一,将数据的重要性提升到了前所未有的高度,专门设立了国家大数据局,并出台了系列法律法规和行业规范。


“数据二十条”针对数据要素与其他生产要素的不同特点,构建起“四梁八柱”的主要架构,从数据产权、流通交易、收益分配、安全治理四方面初步搭建了中国的数据基础制度体系。


当然,数据二十条只是纲领性文件,未来许多更具体的内容需要不断探索发展。数据交易所的建设效果如何,还有待观察。


就目前来看,至少存在三方面的问题——


第一是优质数据太少,很多企业需要花大成本重新清洗和标注数据。所以经常有人开玩笑说:人工智能,有多少人工就有多少智能。


第二,数据的灰色交易问题。有的行业或者企业可以更优先拿到部分受限的数据,由于数据复用的边际成本极低,所以很多企业就通过不合规的渠道以很低的价格买卖数据,导致不公平竞争。


第三,数据的保护和治理水平还有待提高。数据中敏感信息多,许多数据内容多层次多元化,可能承载了需要保护的个人信息和商业机密,即使匿名化和去标识化,也有可能被挖掘出来。


资本


如果只看ChatGPT的技术路线的话,其实是一个大力出奇迹的过程。


很多公司都曾经实验过这一技术路线,但都受限于算力成本和数据量,在做了一段时间后就放弃了。

不仅是国内的很多公司没有做出来,Google也没有做出来。只有OpenAI不断地堆算力、堆数据,最终实现了由量变到质变。所以,ChatGPT的成功具有一定的偶然性。


但偶然中又蕴含着必然。仅就人工智能领域来说,中国好像并没有做出太杰出的原创性贡献。AlphaGo,ChatGPT是国外先出现的,智能音箱、智能驾驶、人脸识别,都是人工智能的工程应用,也不是中国的原创。


有很多人说,国外有成熟的投融资体系,所以可以支持OpenAI不断烧钱。


确实,原创性的科技创新投入大、周期长、成功概率低。OpenAI的资金密度、人才密度都很高。而中国的多层次资本市场仍不够健全,尤其是VC和PE市场建设比较滞后。未来还是需要花大力气完善。


但我觉得这不是根本原因。


一般的中小公司很难获得如OpenAI那么多的融资,但如果我们仔细统计,在2022年ChatGPT横空出世以前,中国有不少公司的融资额是比OpenAI还多的,但我们还是没有做出ChatGPT。


所以投融资很重要,资本市场很重要。但融资额多少不是创新成功与否的决定性因素。

举报本楼

本帖有 22 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-6-14 18:54 , Processed in 0.629322 second(s), 17 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部