通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  少校

注册:2010-4-2811
跳转到指定楼层
1#
发表于 2025-4-19 14:36:49 |只看该作者 |倒序浏览

4月18日消息,为更强势抗衡谷歌等人工智能公司的竞争,OpenAI宣布推出“弹性处理”(Flex processing)服务。这一新选项通过牺牲响应速度并接受“偶发性资源不可用”,将模型使用成本降低50%。

OpenAI表示,弹性处理服务目前以测试版形式向新发布的o3和o4-mini推理模型开放,主要适用于模型评估、数据富化和异步任务等低优先级“非生产”场景。

根据定价方案,o3模型在弹性处理模式下,每百万输入token(约75万字)费用从标准模式的10美元降至5美元,每百万输出token从40美元降至20美元;o4-mini模型的每百万输入token价格则从1.1美元降至0.55美元,每百万输出token价格从4.40美元降至2.20美元。

在高端人工智能模型成本持续攀升、竞争对手纷纷推出更廉价高效的“经济型”模型之际,OpenAI推出弹性处理服务可谓恰逢其时。本周四,谷歌发布了Gemini 2.5 Flash推理模型,性能相当或超越DeepSeek R1模型,且单位输入token成本更低。

OpenAI在发给客户的电子邮件中提到,OpenAI使用层级体系中的第1至第3层用户(层级由用户在OpenAI服务上的消费金额决定)若要调用o3,必须完成新增的身份验证流程。此外,o3及其他模型的推理摘要功能和流式API支持功能也需通过身份验证后方可使用。

OpenAI先前表示,身份验证旨在防止恶意用户滥用使用政策。(辰辰)





来源:网易

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-5-2 08:50 , Processed in 0.084485 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部