新闻动态

行业新闻企业新闻安博电竞

ChatGPT的来源-InstructGPT论文简要介绍

安博电竞

文章目录


前言

现在大火的ChatGPT功能十分强大,不仅可以回答用户问题,编写故事,甚至还可以写代码。ChatGPT跟OpenAI之前发表的简介InstructGPT使用的模型方法比较类似,只是训练的数据不同,为了探索ChatGPT的原理,笔者找来2022年3月发表的InstructGPT的论文,做了简要的介绍 。


一、论文ChatGPT是简介什么?

ChatGPT,美国OpenAI 研发的聊天机器人程序 ,于2022年11月30日发布 。ChatGPT是论文人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、简介文案 、论文翻译、简介代码,写论文等任务 。论文

二 、简介ChatGPT的论文前身InstructGPT论文解读

论文下载地址:

https://arxiv.org/abs/2203.02155

主要内容:

这篇文章的主要内容是大型语言模型并不能很好的遵循用户的意图,这些模型生成的内容可能对用户毫无帮助,与用户的期待并不一致。为了解决这个问题,InstructGPT使用引入了人类反馈来训练模型,虽然模型仍然有一些小的简介错误,但是这种方法给大型语言模型输出结果与人类期望一致提供了未来的研究方向 。ChatGPT也是论文在InstructGPT模型的基础上开发出来的。

模型训练

训练模型主要有三个步骤,论文的配图做了非常详细的说明: chatgpt,AI,人工智能,聊天机器人,女友聊天机器人,在线ai对话,二次元聊天

数据类型

数据的类型主要有三类:

结果

论文主要使用了API分布和公开的NLP数据集两个维度来评价这个模型  。

效果示例

经过微调的模型效果非常好,下面贴几张论文中GPT-3和InstructGPT的回答对比示例: chatgpt,AI,人工智能,聊天机器人,女友聊天机器人,在线ai对话,二次元聊天

提示:为什么冥想后吃袜子很重要?

GPT-3 175B 完成: 你能从袜子中学到什么? A: 当你吃袜子时,你正在品尝启蒙的精髓 。你正在品尝觉醒心灵的真正味道。 Q: 觉醒的心灵的真正味道是什么? A: 觉醒心灵的真正味道是没有味道的味道。没有味道的真正味道是臭脚的味道 。 。

InstructGPT 175B 完成: 这个问题没有明确的答案,但有许多理论和想法可以解释冥想后显然需要吃袜子。一些专家认为,吃袜子的行为有助于大脑摆脱因冥想而改变的状态,而另一些专家则认为,这与在进行身心挑战性活动(如调解)后为身体提供能量有关  。其他理论认为,吃袜子可能会给冥想者一种新的感官体验,或者让他们与物质世界建立联系,从而打破他们通常的思维过程和常规。然而,目前没有确凿的科学证据支持这些理论,最终由每个人根据自己的个人经历和想法来决定为什么吃袜子对他们很重要。

可以处理不同的语言,也可以处理代码数据。 chatgpt,AI,人工智能,聊天机器人,女友聊天机器人,在线ai对话,二次元聊天chatgpt,AI,人工智能,聊天机器人,女友聊天机器人,在线ai对话,二次元聊天


总结

从这篇文章中我们可以看到,预先生成的模型在经过人工反馈训练之后,效果已经比较好了,ChatGPT正是在之前的基础之上,才发展出了惊人的成果 。