第二,极致的实时交互。很多场景对延迟的要求是毫秒级的。比如部署了 Yan 架构的无人机,用户喊一声「在我跳起来的时候抓拍」,模型就必须瞬间响应。这种场景,任何一次网络波动都可能是致命的,你不可能依赖云端。再比如未来的机器人,它需要根据自己独特的臂长、传感器参数来做出精准的动作,这种与硬件高度绑定的实时控制,必须由本地的」大脑」来完成。
第三,成本问题。云端 API 的价格看起来在不断下降,甚至免费,但仍然是有成本的。以摄像头为例,出货量是以亿为单位。在这种海量规模下,云端再便宜,乘以亿,也是一笔天文数字。而走向离线智能,硬件成本是已经付出的,后续的使用几乎不产生额外费用。从商业逻辑上,海量设备,本地部署一定是成本最优解。
第一,是根植于文化的「隐私执念」。在欧美市场,用户对于个人数据隐私的重视程度,是写进法律、深入人心的。我们目前也在和一家头部玩具 IP 公司谈合作,他们之所以对我们的方案产生浓厚兴趣,一个核心前提就是:他们不希望用户的隐私上云。他们的内容 IP 和用户数据是最高级别的资产,必须在设备端处理。
第二,是客观存在的「网络鸿沟」。我们很容易被国内一线城市无处不在的 5G 网络所「蒙蔽」,认为网络无所不能。但放眼全球,对于我们的出海伙伴来说,他们的用户可能在非洲的原野,也可能在东南亚的岛屿,这些地方的网络环境,让依赖云端的 AI 体验变得极不可靠。一个能在弱网、无网环境下稳定运行的离线模型,是他们的「救命稻草」。
首先,关于硬件变强。我们认为这是一个对我们有利的趋势。第一,任何高端硬件的普及,都至少需要两到三年的窗口期,在这个窗口期内,我们是解决海量存量和中端设备 AI 化问题的最优解。第二,当硬件底座变强,它能容纳的不仅仅是更大的 Transformer,也能容纳我们从小长到大的 Yan 架构大模型。我们同样可以做 10B 甚至更大的模型,而我们独特的自主学习、低功耗特性等优势,依然会存在。
另一个问题,可能更触及我们这家公司的灵魂,回答了我们真正的护城河是什么。
我们的团队基因,其实源于一个始于 2015 年的、未完成的梦。那时候,我们几个创始人就想做真正的智能硬件,当时的形态类似于小爱同学,但当时就因为 AI 技术不成熟而失败了。直到我们看到了 Transformer 的潜力,觉得时机到了,才再次聚到一起创业。