通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  上校

注册:2007-10-2920
跳转到指定楼层
1#
发表于 2025-12-30 18:08:48 |只看该作者 |倒序浏览

一年即将结束,是时候回顾今年的人工智能发展现状,并展望来年的发展趋势了。这份概述基于包括麻省理工学院、普华永道、OpenAI、OpenRouter 等在内的众多全球机构的数据。

一 “高采纳率,低转化率”悖论

企业人工智能领域存在着巨大的脱节:许多组织都在广泛使用人工智能工具,但真正获得可衡量的经济回报的却寥寥无几。事实上,尽管投入了巨额资金,95% 的企业却一无所获。哦,对了,你终于可以松一口气了——失败的并非只有你,几乎所有人都是如此。尽管科技大会层出不穷,各大公司都在吹嘘人工智能的奇迹,但匿名调查显示,很多 企业 都在谈论人工智能,但真正付诸行动的却寥寥无几。

麻省理工学院的报告称之为“人工智能世代分化”

数据有力地证明了这一悖论的正反两面:

高采纳率(普遍性)

低转化率(低价值/投资回报率)

88% 的组织报告在至少一个业务职能中定期使用人工智能,较前一年的 78% 有所上升。

仅有 39% 的组织报告其收益增长可归因于人工智能。

超过 90% 的企业正试图采用人工智能解决方案以保持竞争力。

95% 的组织从生成式人工智能(GenAI)投资中获得零回报,且陷入无实际可衡量影响的困境。

预计到 2025 年,全球人工智能支出将接近 1.5 万亿美元。

仅约三分之一的组织已成功开始在全企业范围内扩展人工智能应用。

企业用户个人报告称,由于使用人工智能,每天节省 40 至 60 分钟时间。

投资环境正从“无节制的乐观”转向要求提供盈利能力与投资回报率(ROI)的具体证据。

为什么会这样呢?

其实,任何新技术的发展都难免如此,这也在意料之中。互联网和之前的电力也是如此。事实上,人工智能的普及速度惊人,仅仅两年时间就出现了大规模的投资和部署,而互联网用了大约十年,电力则用了大约三十年。

所以这种情况在某种程度上是可以预料的,系统的各个部分以不同的速度发展,而这正是系统出现故障的地方。

让我们来看一些具体原因:

1. 组织和文化惯性

成功扩展规模的主要障碍往往是文化和组织方面的,而不是技术方面的。

(1)未能重新设计工作流程:大多数组织将人工智能视为增强工具(以略快的速度完成相同的任务),而不是变革的催化剂(或重新设计整个业务流程)。

(2)从试点到生产的鸿沟:尽管80%的组织都进行了试点,但将这些实验转化为可扩展的、与工作流程集成的系统仍然十分罕见,失败的原因往往是工作流程脆弱或缺乏情境学习。据报道,只有约5%的定制企业级AI工具最终投入生产。我认为这个数字存在很大的偏差,因为科技行业的成功率通常较高,其他行业的成功率可能更低。

(3)影子人工智能:相当一部分人工智能应用发生在官方渠道之外;超过90%的受访员工使用个人人工智能工具(如ChatGPT或Claude)完成工作任务,尽管只有40%的公司正式购买了订阅服务。我们都知道人们会这样做,对吧?

这就像禁止小学生使用人工智能做作业一样。

因此,这种“影子人工智能”证明了其效用,但也暴露出组织在安全可靠地大规模嵌入这些工具方面存在重大缺陷。

(4)心理安全感:员工的恐惧和犹豫会显著阻碍人工智能的推广应用。83%的企业领导者表示,心理安全感直接影响人工智能项目的成功。此外,22%的领导者承认,由于害怕失败或潜在的批评,他们曾犹豫是否要领导人工智能项目。鉴于这样的推广成功率,我完全理解他们的顾虑——这无异于自毁前程。

2. 技术与战略错位

这个听起来高深莫测的标题背后隐藏着一个非常简单的道理。把一切都归咎于公司和个人固然容易,但说实话——技术本身也难辞其咎。英伟达、OpenAI 和其他一些所谓的专家在过去三年里一直在大肆宣传和夸大其词,难怪人们会相信通用人工智能(AGI)的新时代已经到来。但这完全是谎言。

它终将到来,但肯定不是明天,也不是明年。因此,人们(我指的是高管,尽管有人说他们根本不是人,而是靠奖金操控的机器人)对这项技术抱有过高的期望。

现实情况是,在许多复杂、涉及整个公司的案例中,现有技术尚未成熟。在复杂核心业务流程的背景下,现有工具存在根本性的局限性。生成式人工智能工具经常在关键工作流程中失效,因为它们是静态的——无法保留反馈、适应环境或随时间改进。

用户表示对定制或厂商推销的工具持高度怀疑态度,他们要求工具能够持久记忆并具备情境感知能力,以应对高风险工作。另一方面,人虽然学习速度不快,但至少在工作过程中也能有所收获——从某种意义上说,这才是真正的无监督学习。

在更复杂的(例如,由智能体驱动的)工作流程中,由于能够更长时间地保留上下文信息,因此工作流程中任何步骤都可能出现的错误会随着工作流程长度的增加而累积,从而降低其可靠性。而在人工工作流程中,每个步骤都由单个员工执行,因此错误很有可能在下一步被发现,系统也会进行追溯性自我纠正,尽管这可能需要很长时间。

3. 投资偏见

企业往往倾向于投资销售和市场营销等前台职能部门,并为此投入大量预算,因为这些部门的业绩显而易见且易于衡量(例如,个性化内容和智能线索评分)。因此,管理者更容易夸耀业绩并获得晋升。然而,财务和制造等领域的后台自动化通常得到的关注和资源却相对较少。

这主要是因为这些内部职能的直接财务影响往往很难在管理层谈话或投资者更新中量化,尽管财务影响可能要大得多。

4. 代理治理滞后

当前智能体人工智能(能够独立行动的自主系统)的快速部署加剧了转型难题。这种转变带来了全新的运营和合规风险,而传统的治理模式无法应对。40%的人工智能决策者认为监管滞后是采用人工智能技术的主要挑战,直接阻碍了其规模化部署。

5. 难以衡量影响

在许多领域,尤其是在时间紧迫的情况下,很难确定确切的影响。对于结构性变革或小的流程改进,需要数年时间收集数据才能了解其带来的改变,前提是这些数据能够被收集到,而这种情况往往并不存在。

二 成功的企业

大约只有5%的公司能够成功。它们究竟有何不同之处?

1. 战略方向和自上而下的纪律

成功的组织不会将人工智能视为辅助工具,而是将其视为战略重点,由最高领导层进行管理。这意味着高层领导会制定自上而下的计划,选择几个重点领域进行投资,而不是将资源分散到零散的、众包式的项目中,并将顶尖人才分配到这些关键领域。这些顶尖人才拥有资源和授权,可以推行重大变革。

2. 运营转型和工作流程重新设计

业绩最佳的组织会彻底改革其内部流程,以最大限度地发挥人工智能固有的速度和能力,而不是简单地将人工智能应用于旧任务。

根据我们的经验,这也是主要障碍——自动化一个原本就糟糕的流程非常困难。例如,如果数据存储在搜索和提取每次查询都需要几分钟的系统中,那么任何人工智能(或非人工智能)助手都将无法使用。任何人工智能转型都需要彻底重新思考工作流程,有时甚至需要将多步骤流程简化为单步骤,而不仅仅是自动化其中的一小部分。

目标是实现深度系统集成——即将内部知识转换为机器可读格式,为关键数据管道构建API,并启用连接器,使人工智能能够安全地访问核心工具中的公司数据,从而做出情境感知响应。这比仅仅在现有数据基础设施之上构建一个RAG系统要昂贵得多。

3. 文化准备度和心理安全感

成功很大程度上取决于建立一种组织文化,这种文化能够减轻人们对新技术和由此带来的工作变化的抵触和恐惧。

他们试图明确地沟通人工智能将如何影响以及不会如何影响工作,以建立信任并减少员工的抵触情绪。他们将人工智能视为提高生产力和重新分配任务的手段,而不是立即裁员。

除此之外,他们还在初期阶段跟踪员工情绪、使用率和感知生产力等非财务指标,并据此进行调整。

4. 重点实施和外部合作

成功的公司不会依赖缓慢的内部 IT 项目,而是利用外部专业知识,并授权运营人员引领变革。

战略伙伴关系的部署率(66%)大约是内部开发努力(33%)的两倍。

成功的供应商提供的系统能够从反馈中学习,保留上下文,并适应特定的工作流程,从而解决阻碍通用工具发展的“学习差距”。

5. 衡量财务回报

成功的采用者专注于将效率提升转化为切实的经济收益,尤其注重通过替代现有的外部成本来实现。他们会制定具体的成果和“硬性”绩效指标(例如损益影响、市场差异化或客户满意度评分),而不是接受抽象的报告或模糊的流程改进。

财务影响不仅体现在成本优化上,还体现在产品创新、个性化和利润率提高带来的收入增长上。

后台可量化价值的一个关键来源是取代外部成本,例如取消业务流程外包 (BPO) 合同和削减内容创作的代理费用,而不是减少内部员工人数。

三 采用率最高的行业

来自 ChatGPT 企业客户的数据、OpenRouter 统计数据以及 Anthropic 对生成的代币的分析表明,科技、销售与市场营销、媒体与娱乐以及电子商务行业的采用率最高。

其他值得关注的行业包括专业服务、金融、医疗保健和电信(客户支持)。

OpenRouter统计数据显示,令牌的使用主要分为两大类:

编程:与代码编写相关的查询已成为增长最稳定的类别,从2025年初约占总令牌量的11%增长到最近几周在平台所有模型中超过50%。编程工作负载被认为是令牌量快速增长的主要驱动力,输入令牌量经常超过20,000个。

角色扮演:这一类别涵盖创意对话(例如性短信)、故事讲述、角色扮演和游戏场景,使用量巨大,几乎与编程量不相上下。尤其是在开源模型中,角色扮演的使用量占比超过一半(约 52%)。在这个领域,用户将 LLM 用作结构化的角色扮演或角色引擎,通常用于交互式小说和场景生成。在 Deepseek 的 OpenRouter 中,角色扮演的使用量占比高达 80%。





这完全不足为奇——幻觉不是关键或可控的领域(编程)或者幻觉不是问题而是特色的领域(角色扮演和营销)——幻觉的接受度最高。

值得注意的是,根据 OpenRouter 和 Anthropic 的数据,Anthropic 在编码类别中占据主导地位:



按成本和价值进行工作负载细分

OpenRouter 分析根据总使用量与单位成本绘制 LLM 用例图,揭示了不同的市场细分。

用户类型(Archetype)

特征(Characteristics)

示例类别(行业/领域)

高端工作负载(高成本、高使用量)(Premium Workloads (High Cost, High Usage))

用户愿意为专业能力或高性能支付溢价。

技术(Technology)在此象限中显著突出,每单位成本最高,但保持较高的使用率,表明用户对系统架构或高级技术问题解决有很强的付费意愿。

大众市场高用量驱动者(低成本、高使用量)(Mass-Market Volume Drivers (Low Cost, High Usage))

使用量大,由优化效率 和广泛采用的应用驱动。

编程(Programming)角色扮演(Roleplay)科学(Science)聚集于此。其中,编程因使用量极高且单价中等,被标记为“杀手级专业人士”类别。

专业专家(高成本、低使用量)(Specialized Experts (High Cost, Low Usage))

总体使用量较低,但用户愿意为特定高风险专业领域的准确性与可靠性支付溢价。

金融(Finance)学术(Academia)医疗(Health)营销(Marketing)属于此类。其中,医疗类查询多样性最高,是这些类别中最碎片化的。

小众工具(低成本、低使用量)(Niche Utilities (Low Cost, Low Usage))

高度优化、通常为标准化任务,基础功能即可满足需求。

翻译(Translation)法律(Legal)常识问答(Trivia)位于此区域。其中,翻译在该低成本组中使用量最高。

推理模型的快速普及、更长的序列长度以及工具调用行为的增加表明,LLM 的使用正从单轮请求转向智能推理。这一转变体现在,目前通过推理优化模型路由的令牌总数占比已超过 50%。这种变化正在从根本上重塑市场,因为模型越来越多地用于复杂的、多步骤的操作,例如调用外部 API(工具调用行为)和结构化问题解决(推理),这些操作通常集中在编码工作流程中。

四 地域分布

1.企业采用

与传统的技术采纳周期相反,新兴经济体在企业部署方面正超越西方国家。印度(59%)、阿联酋(58%)和俄罗斯(大型企业占比71%)的实施率领先,显著高于美国(33%)和英国(37%)。

这一激增主要是由各国积极的政策推动的,例如阿联酋的目标是到 2027 年成为第一个完全由人工智能驱动的政府,以及印度对人工智能公共基础设施的大规模投资,但也与美国大型公司的绝对数量明显更多有关,而且其中许多公司并非上市公司,也不公开报告人工智能的使用情况。

2.地理位置对人工智能的使用方式有显著影响。

根据 Anthropic 的数据,在高普及率国家(例如新加坡、加拿大),Claude 的使用非常广泛,涵盖教育、科学和复杂的商业运营等领域。新加坡的人均使用率位居世界前列,是其预期人口比例的 4.6 倍,加拿大则为 2.9 倍。相比之下,新兴经济体,例如印度尼西亚(0.36 倍)、印度(0.27 倍)和尼日利亚(0.2 倍),使用 Claude 的比例较低。

新兴市场(例如印度、越南):人工智能的应用主要集中在编码和软件开发领域。在印度,编码应用占人工智能总应用量的50%以上,而全球平均水平约为三分之一。

美国:该软件的使用已深度融入家庭管理、求职和医疗指导等领域。在美国,华盛顿特区和犹他州的人均使用量领先,超过了加利福尼亚州。

3.基础设施

人工智能的物理“骨干”存在巨大差异:

到 2025 年中期,高收入国家拥有全球 77% 的数据中心容量。

低收入国家仅占这一产能的不到 0.1%。

4.语言使用

根据 OpenRouter 进行的 100 万亿代币研究,人工智能交互中使用的语言分布高度集中在几个关键领域,其中英语是绝对的主导语言。

按语言划分的词元数量具体明细如下:

英语:82.87%

简体中文:4.95%

俄语:2.47%

西班牙语:1.43%

泰语:1.03%

其他(合计):7.25%

资料显示,英语的绝对主导地位并非仅仅是一种偏好,而是反映了两个结构性因素:一是英语中心模式的普遍存在,二是OpenRouter用户群体中开发者比例过高。由于编程是该平台上增长最快、对上下文依赖性最强的类别(占近期总流量的50%以上),因此,使用英语作为代码和文档的主要语言自然会推高其占比。
五 2025年的主要趋势

1. 从辅助工具到自主智能的过渡

在所有来源中,最显著的技术变革是智能体人工智能的兴起,它从单次文本生成发展到能够自主推理、规划和执行多步骤任务,且只需极少人工干预的系统。随着企业从随意查询转向集成化、可重复的流程,推理令牌的消耗量同比增长了320倍,标志着这一演进的标志。这些“智能体”正被部署在高风险环境中,例如自主物流谈判和金融决策,这开启了运营风险的新时代,并对现代化治理提出了更高的要求。

2. 氛围编码浪潮

人工智能原生开发工具开启了“直觉式编码”时代,人们只需极少的技术指导,即可根据自然语言提示构建完整的应用程序。这一趋势已经催生出一些突破性的成功案例,例如,初创公司Lovable在成立仅八个月后就成为独角兽企业,其约 95% 的代码都是由人工智能编写的。然而,这种快速迭代也带来了新的安全漏洞;例如,恶意攻击者已经开始劫持人工智能集成开发环境 (IDE) 扩展程序,窃取凭证并在开发者的计算机上挖掘加密货币。

3. 地域划分与人工智能主权

全球人工智能应用的一个显著特征是领导地位的转变;尽管美国仍然是投资领域的领头羊,但印度和阿联酋等新兴经济体如今在运营部署速度方面领先全球。这引发了全球范围内对“主权人工智能”的推动,各国和企业优先将敏感数据、模型和计算资源保留在本国境内,以遵守区域法规并确保技术独立性。这一趋势得到了大规模国家主导投资的支持,例如印度超过1030亿卢比的人工智能计划、阿联酋力争在2027年成为完全人工智能原生政府的目标,以及中国致力于实现硬件独立并生产自主GPU的努力。

4. “影子人工智能”的使用

尽管官方的企业级系统往往进展缓慢——只有5%的定制企业级人工智能工具最终投入生产——但员工们正在以个人方式跨越价值鸿沟。我们的消息来源发现,一个蓬勃发展的“影子人工智能”经济正在形成,90%的员工表示他们在工作中使用个人人工智能工具,而他们所在的公司中只有40%购买了官方订阅服务。

5. 中国模式的崛起

开源生态系统已经从少数西方或早期中国模式主导的近乎垄断的状态,转变为竞争激烈的环境。

中国开发的模型(如 DeepSeek、Qwen 和 Kimi)已经从微不足道的基础发展到在某些时期占每周代币总交易量的约 13% 至 30%。

在Hugging Face平台上,阿里巴巴的Qwen已经超越Meta的Llama,成为开发者的首选,占每月新增模型衍生品的40%以上,而Llama的份额则从大约50%下降到15%。

为了与“美国优先人工智能”的利益保持一致并对抗国际竞争,OpenAI 发布了自 GPT-2 以来的首个开放模型,于 2025 年 8 月推出了 gpt-oss 系列(120b 和 20b 变 体)。

6. 视频生成从片段到世界模型的演变

视频生成已经从生成固定序列的“剪辑模型”发展到能够根据状态和用户行为预测未来帧的“世界模型”。业界正朝着扩散变换器(DiT)的方向发展,它取代了传统的卷积U-Net,能够更好地模拟帧和像素之间的依赖关系。

新一代模型(Sora 2、veo3)引入了对话和声音同步、更强大的物理引擎,以及插入真人“客串”的功能,并能以真人的声音和形象呈现。中国实验室发展迅速,例如Kling 2.1和Vidu 2.0等模型专注于速度和真实感,而腾讯的混元视频则构建了一个开放的生态系统,据报道,其性能优于一些西方专有模型。

Google DeepMind 的 Genie 3 可以根据文本提示以 24 帧/秒的速度生成可探索的 3D 环境,支持天气变化等可提示事件以及持久对象。

Synthesia 终于实现了真正的盈利,其年度经常性收入 (ARR) 突破 1 亿美元,并为财富 100 强企业中的 70% 创造了超过 3000 万分钟的虚拟形象视频观看时长。AMC Networks 已正式采用 Runway AI 进行电视制作。

消息人士预测,到2026年,实时生成式视频游戏将成为Twitch等平台上最受关注的内容之一。此外,人工智能制作的短片预计将赢得观众的广泛赞誉,但同时也会引发业界的强烈反弹。

六 未来预测

1. 市场出现重大调整

专家预测,人工智能市场将在2026年出现回调,主要原因是供应商夸大的承诺与实际为企业带来的价值之间的差距日益扩大。投资者预计将从“不惜一切代价追求增长”转向严格要求切实回报,从而导致资金从投机性科技股中撤出。

2. 全球人工智能支出大幅增长

尽管有所调整,预计2025年全球人工智能支出将接近1.5万亿美元,并在2026年突破2万亿美元。这一增长将主要得益于人工智能在智能手机和个人电脑等消费产品中的应用,以及对数据中心基础设施的持续大规模投资。

3. 15.7万亿美元的经济贡献

预计到2030年,人工智能将为全球经济贡献高达15.7万亿美元。在印度等特定地区,预计到2035年,人工智能将为国民经济贡献1.7万亿美元。

4. 端到端自主科学发现

其中一项最大胆的研究预测是,开放式人工智能代理将能够独立完成一项有意义的科学发现,从最初的假设和实验到最终的迭代和论文发表,全程掌控。

5. 如上文所述,预计到2026年,实时生成式视频游戏——即由人工智能动态生成环境和叙事的游戏——将成为流媒体平台Twitch上观看人数最多的游戏。

6. 关于智能体攻击的全球辩论

消息人士预测,深度伪造或人工智能代理驱动的网络攻击最终将引发联合国首次专门针对人工智能安全的紧急辩论。此前有观察指出,网络攻击型人工智能的能力每五个月就会翻一番。

7.目前,用于网络攻击的攻击性人工智能能力每五个月就会翻一番,远远超过防御措施。这种快速增长导致了“网络入侵”(vibe hacking)的兴起犯罪分子利用人工智能策划多阶段欺诈行动,包括朝 鲜特工利用人工智能通过技术面试,渗透到财富500强企业中。

8. 代理型商务与价值 50 亿美元的广告市场

消息人士预测,人工智能代理很快将独立处理消费者交易,代理结账将占所有在线销售额的5%以上。与此同时,直接面向人工智能代理的广告支出预计将达到50亿美元。

9. 为4.9亿劳动者提供优先发声权

印度设想,到 2035 年,语音优先的人工智能界面将消除该国 4.9 亿非正式劳动者的所有读写和语言障碍。

10. 中型模型正成为行业标准

开源市场正在分化,小型模型(参数低于 150 亿)逐渐失宠,而中型模型(参数在 150 亿到 700 亿之间)则成为模型与市场契合度的最佳选择。这些模型越来越受欢迎,因为它们兼具强大的功能和高效的运行性能。

11. 电力和能源是主要的规模化瓶颈

到2028年,人工智能规模化发展的主要制约因素将从芯片供应转向电网容量。预计到2030年,领先的超级计算机将需要9吉瓦的电力(相当于9座核反应堆),届时电力供应而非资金将成为制约其发展的主要因素。

12. 选择性而非大规模的就业岗位流失

尽管人工智能预计到2025年将取代8500万个工作岗位,但同时也将创造9700万个新的就业岗位。这些岗位的更替可能主要集中在非核心业务活动,例如客户支持、行政处理和标准化开发,而不是导致整个经济领域的大规模裁员。

13. 将人工智能发展视为国家使命

主权人工智能将成为各国政府和企业的首要战略重点,以确保数据、模型和计算资源始终处于本地管辖之下。这主要是出于遵守区域数据本地化法律以及减少对少数几家 外国超大规模服务提供商依赖的需要。


来源:36kr

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-12-31 00:20 , Processed in 0.299988 second(s), 16 queries , Gzip On.

Copyright © 1999-2025 C114 All Rights Reserved

Discuz Licensed

回顶部