分享
✅ChatGPT基础知识
输入“/”快速插入内容
✅
ChatGPT
基础知识
飞书用户6848
2023年6月12日修改
学习地址:
https://space.bilibili.com/431850986/channel/collectiondetail?sid=1315092
ChatGPT
的定义
ChatGPT
是一种语言模型,当您向它提供提示或问题时,它会生成文本。它擅长自然语言处理 (
NLP
),这意味着它可以像人类一样进行自然对话。ChatGPT 由总部位于旧金山的
初创公司
OpenAI
创建,该公司吸引了微软等科技巨头的资金。
虽然您可能已经与数十个
聊天机器人
进行过交互,但其中大多数的工作效果不如
ChatGPT
。例如,传统的客户服务聊天机器人只能用它学到的信息做出回应。输入任何它不知道的内容,它可能会以类似“对不起,我不明白”的方式回应。即使使用 Siri 和Google Assistant等更复杂的虚拟助手,这样令人沮丧的情况也经常出现,尽管发生的次数较少。
ChatGPT
没有传统
聊天机器人
那样令人沮丧的限制。
另一方面,
ChatGPT
很少承认失败——它可以处理开放式问题并且不会以通用的回复来回应。而且我们很快就会看到,它还可以总结长文档、编写简单的计算机程序以及简化难以理解的概念。这一切都源于 ChatGPT 的预测单词和造句能力。
ChatGPT
基于
OpenAI
的第三代语言模型 GPT-3。
GPT
一词代表生成式预训练变压器。当然,这对
AI
行业以外的大多数人来说意义不大,所以让我们进一步分解一下。
与任何
机器学习
项目一样,构建语言模型始于数据收集。根据斯坦福大学发布的一份报告,
OpenAI
从各种来源收集了 570 GB 的文本。这包括新闻文章、书籍,甚至是基于互联网的 Reddit 和维基百科。这确保了训练机器学习模型所必需的多样化和多样化的数据集。
在训练阶段,
OpenAI
团队使用了一种称为 transformer 架构的深度学习模型。简而言之,该模型查看数据集并形成单词和句子之间的关系。它通过计算一个词出现在另一个词旁边的概率,然后利用这些知识来预测它自己的句子中下一个有意义的词来做到这一点。该模型可以单独使用此预测策略生成整个句子和段落。
但
OpenAI
的研究人员意识到,机器训练不足以让
ChatGPT
听起来像人。为了解决这个问题,该公司聘请了几十个人来执行两种类型的培训:
监督学习
和通过人类反馈进行
强化学习
(RLHF)。
OpenAI
聘请了人类培训师来生成自然响应并微调
ChatGPT
。
在
监督学习
中,
OpenAI
的员工扮演对话的双方——他们会写一个提示,并从
聊天机器人
的角度提供理想的回应。有了成千上万个这样的例子,学习到的模型可以针对对话进行微调。
然后,在强化训练阶段,训练员收集了一些
聊天机器人
生成的回复,并根据它们的质量对它们进行评分。最终,该模型可以预测哪些词和回答对人类最有吸引力。
ChatGPT
可以做什么
以下是您可以输入 ChatGPT 的一些示例提示。
起草一封电子邮件给重要的人