通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  二级通信军士

注册:2017-8-14163
跳转到指定楼层
1#
发表于 2023-9-1 09:30:27 |只看该作者 |倒序浏览
S2小伙伴 S2微沙龙

ChatGPT的前生今生

    2022年11月30日, OpenAI(一家在美国成立的人工智能研究公司)发布了一款名为ChatGPT的智能对话系统产品,该产品上线5天就获得了100万用户注册,相比之下,Instagram用时2.5个月,Facebook花费了10个月时间。更厉害的是ChatGPT上线2个月用户数量破亿,日活用户数高达千万人次,成为史上用户增长最快的消费者应用。这惊人现象背后是源于它能像人一样和用户进行流畅、合理且有意义的对话,此外不经人类干预ChatGPT还通过了美国医学执照的考试、律师资格考试、SAT考试等。

  那么ChatGPT到底是什么?

    通俗来说ChatGPT就是通过大数据训练出来的对话机器人,它不仅仅是简单的信息解锁,更重要的是它有独立的信息整合、理解和解决问题的能力。本质上ChatGPT是一种人工智能技术驱动的自然语言处理工具。

    ChatGPT全称Chat Generative Pre-trained Transformer,其核心技术来源于最初的2017年谷歌推出的Transformer模型。  

GPT-1

    2018年敏锐的OpenAI根据Transformer的decoder部分推出GPT(GPT-1)模型,该模型具有1.17亿参数、训练文本数据大约5GB左右,并提出名为结合有标签数据和无标签数据的半监督算法,可以说是在自然语言处理NLP领域的预训练模型finetune的早期先行者。

GPT-2

    2019年OpenAI公布了GPT-2模型,该模型具有15亿个参数,训练文本数据约共计40GB。相比GPT-1,GPT-2技术上改动不大,仅对模型结构进行了微调,且使用了更多的更干净的训练数据。

GPT-3

    2020年OpenAI继续发布了GPT-3模型,该模型具有1750亿参数,训练数据估计在45TB量级,训练软硬件成本估计在千万美元,导致在GPT-3的论文中作者表明在训练模型的过程中发现了一个bug,但是他们已经没有资金支持进行重新训练了。GPT-3作为当时最大的大语言模型LLM,其在故事生成、语言翻译等领域已经做出相对惊人的表现,这也导致OpenAI宣称由于GPT-3的强大能力,为了防止不法人员随意使用产生严重后果,没有开源模型文件而仅提供了试用通道。

GPT-3.5

    在2020-2021年间,OpenAI 投入了大量的精力通过代码数据训练和指令微调来增强GPT-3,包括使用code文本数据进行增强代码生成能力微调、使用小规模人类打标数据进行微调、使用基于人类反馈的强化学习(RLHF)进行对齐人类意图的微调训练等,这一系列模型都可以统称为GPT-3.5系列模型。

InstructGPT

   InstructGPT严格意义上来讲是属于GPT-3.5系列模型,其包含在OpenAI的模型索引文档中(https://platform.openai.com/docs/model-index-for-researchers)。

    InstructGPT使用基于人类反馈的强化学习(RLHF)进行对齐人类意图的微调训练,让模型能够更好地理解人类的命令并按照指令含义进行规范回答,该模型的方案正是ChatGPT的技术框架。

Chat-GPT

    2022年11月OpenAI正式推出ChatGPT,根据其官网介绍,ChatGPT技术上沿用InstructGPT模型框架,并基于GPT3.5预训练模型并在训练数据上做了一些调整。由于InstructGPT为了对齐人类意图牺牲了部分语言模型基础任务的性能,因此小编推断ChatGPT可能会额外再提升语言模型基础任务的相关能力。

GPT-4

    2023年3月14日,OpenAI趁热打铁发布GPT-4,GPT-4的回答准确性不仅大幅提高,还具备更高水平的识图能力,且能够生成歌词、创意文本,实现风格变化。此外,GPT-4的文字输入限制也提升至2.5万字,且支持更多英语以外的语言。在OpenAI公开文档中显示,GPT-4为多模态模型,同时支持文本和图像输入功能。

    由于Open AI并未公布GPT-4的技术细节,目前我们无法得知GPT-4的相关的架构(包括模型大小)、硬件、数据集构建、训练方法等,不过根据爆料信息,GPT-4使用约25000块A100卡训练3个月,模型参数量约有1.8w亿个(人脑的神经元约为100亿个),训练成本大约在6500w美元,其中人工打标费用就约有百万美元之多。当然消息真实性有待商榷,不过可以肯定的是生成式AI(AIGC)需要很高投入成本(硬件、人才、人力),且该赛道的竞争尤为激烈。

举报本楼

您需要登录后才可以回帖 登录 | 注册 |

手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2024-6-3 06:19 , Processed in 0.268926 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部