从《Small Language Models are the Future of Agentic AI》研究来看,这种趋势已经在大量开源Agent项目中得到了验证。数据显示,在MetaGPT、Open Operato、Cradler等案例中,高达40%-70%的调用,其实只需要SLM就可以顺利完成。
海外厂商也动作频频,微软Phi-3发布时,不仅提供模型,还提供完整推理工具和端到端调试流程;英伟达的TensorRT-LLM+NIM服务,提供模型压缩、LoRA微调、部署封装一条龙服务,客户只需选择场景即可配置;Hugging Face Transformers Agents项目,直接把SLM变成微服务化的“任务组件”,让小模型成为模块化智能的原子单元。