“万字长文教你如何做出ChatGPT“学习总结

news/2024/4/20 22:32:47/文章来源:https://blog.csdn.net/gao1738/article/details/129103448

最近chatgpt太火了,对它的原理很是好奇,翻到一篇牛人大作“万字长文教你如何做出ChatGPT”,拜读后记录一个自己理解的内容。

1. GPT或者说GPT1.0是什么

GPT(Generative Pre-trained Transformer),其实是Generative Pre Training of a language model,可以简单地把语言模型理解为“给定一些字或者词,预测下一个字或者词的模型”。

类似我们使用搜索引擎写入部分查询内容后输入框自动给出的后续输入的预测。这个是已经较为成熟且大量使用的技术。

它的训练简单描述为P(output/input),即输入和输出。

2. GPT2.0

2.0在1.0基础上引入了task的概念,训练模型为P(output/input,task)。任务还可以带描述token

  • 翻译任务
    input:Today is a [翻译为中文]
    output:今天是一个

  • 问答任务
    input:我是小明 [问题] 我是谁 [答案]
    output:小明
    上面例子中 [翻译为中文]、[问题] 、[答案] 这些就是用于告诉模型执行什么任务的token。

这样2.0的模型就可以尝试去理解提问中的“任务”描述了,以做出更符合预期更精准的输出预测。

3. GPT3.0

3.0 除了模型比2.0更大外,引入了情景学习概念,比如翻译任务可以采用输入:请把以下英文翻译为中文:Today is a good day。这样模型就能够基于这一场景做出回答了,其实跟GPT2中不同任务的token有异曲同工之妙,只是表达更加完善、更加丰富了。

4. ChatGPT

chatgpt的制作过程可抽象为3个步骤:

1. 使用清洗后的大量互联网语料训练GPT3.5模型,然后用有监督学习精调GPT3.5模型,使用人工写答案的方式对训练好的GPT模型进行精调。这里的GPT模型可以认为是一个生成模型,即用于生成问答结果的模型。

2. 训练一个奖励模型,这里的奖励模型是对GPT输出结果进行打分。chatgpt的奖励模型是雇佣大量人工进行打分,并将这个打分结果作为输入用于训练奖励模型。

3. 使用奖励模型,基于PPO算法,对GPT生成模型进行持续训练。

总结来说,chatgpt就是有2个模型,一个生成模型用于基于输入产生输出,一个奖励模型用于对生成模型的结果打分。持续用奖励模型对生成模型进行持续训练。

chatgpt的成功有不小的因素在于大量的资金投入得以雇佣大量的人工人肉参与了生成模型的精调以及训练模型的训练。

引用原文的一句话:人工智能就是需要“人工”才能走向“智能”。

转载请注明转自高孝鑫的博客!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_202.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT Prompt工程:设计、实践与思考

作者 | 太子长琴 整理 | NewBeeNLP大家好,这里是 NEewBeeNLP。ChatGPT 火爆出圈了,有些人惊叹于它的能力,当然也有部分人觉得也就那样。这就不得不提 Prompt 了,据说【相关文献1】,ChatGPT 效果好不好完全取决于你的 P…

如何使用ChatGPT开发Unity小游戏

写在前面 首先我们需要知道ChatGpt的语料学习机制,所以为了让它更加“精准扶贫”,钥匙君建议大家在提问之前先引导它进入你想要它成为的角色,ChatGpt在国外已经被“玩坏”,在游戏领域也切实提高了不少码农的工作效率,…

漫画科普ChatGPT:绝不欺负文科生

图文原创:亲爱的数据 你所热爱的,都值得拥有一个名字。 世界上里程碑式计算机,问世之时大多拥有自己的名字。 我认为,假如计算机的诞生是元年,下一个元年将会是“奇点”。 不是比特币,不是虚拟现实&…

【ChatGPT】基于GO语言实现的微信聊天和图片生成机器人

ChatGPT-DreamStudio WeChat Robot 🎨基于GO语言实现的微信聊天和图片生成机器人🎨 个人微信接入ChatGPT,实现和GPT机器人互动聊天,同时支持基于文本生成图像。支持私聊回复和群聊艾特回复。 GitHub源代码地址 实现功能 GPT机…

微软发布ChatGPT 版必应 用的是 .NET 技术

微软在今天在Redmond 线下举办媒体一场活动,发布了新版的微软必应,在桌面上推出了测试版,移动版也即将推出。微软首席执行官纳德拉称Al-powered搜索为公司自云15年以来最大的事情。2023年1月初,微软已经在讨论将OpenAI的技术纳入W…

python 调用 chatgpt

1. 安装 openai 的包: 我们在 pycharm 中安装包 pip3 install openai 2. 我们查找 chatgpt 账户的 api 的 key 1. 首先我们进入到官网: OpenAI 2. 接下来我们点击 api 即可: 3. 查找自己账户的 key: 我们依次点击 Personal &…

在Matlab上用API调用chatgpt模型

在这个快节奏的数字时代 深度学习技术正逐渐成为大家的热门话题 如果你也是一名程序员或者科研工作者 那么你一定听说过GPT模型 是一种非常流行的自然语言处理模型 各大平台都已经接入了ChatGpt模型 将其应用各行对应的领域 下面介绍如何在Matlab中使用API调用chtgpt模型…

ChatGPT|一文读懂GPT-4!

前言 大家好,我是小满同学,感谢各位的点赞、收藏、评论 今天早上一早醒来,发现各大科技圈公众号平台开始刷屏OpenAI发布的新模型GPT4.0,看这个版本号就已经知道又是一大波特性的更新 于是立马起来开始学习! GPT-4 发…

ChatGPT为什么可以取代那么多职位?

最近的ChatGPT段子满天飞,以至于,不聊ChatGPT咱都不好意思在社交媒体上发言了。 这种力度的出圈,各种长期离线好友,甚至我妈都来问我,这是啥玩意啊? “十年老友,不请自来”?这架势&…

ChatGPT快速开始 (Node版本)

近期公司大佬让我调研一下ChatGPT,虽然网络上已经热火朝天了,感觉很多人都在应用它,但是ChatGPT 对大多数人来说依旧是一个很陌生的东西,对我来说也是。只能一点点的去了解去学习,浅显的先从账号注册、接口调用来看一看…

抱抱脸:ChatGPT背后的算法——RLHF | 附12篇RLHF必刷论文

文 | 卖萌酱大家好,我是卖萌酱。前几天,抱抱脸公司(HuggingFace)发表了一篇博客[1],详细讲解了ChatGPT背后的技术原理——RLHF。笔者读过之后,觉得讲解的还是蛮清晰的,因此提炼了一下核心脉络&a…

工具 | VSCode+ChatGPT 编程利器

本文首发微信公众号:全副武装的大师兄(一个分享前沿技术,生活感受的公众号,关注我,率先了解好玩的工具) 托了GPT同学的福,最近编程时,常会在ChatGPT中说明自己的需求以生成代码&…

Java调用ChatGPT(基于SpringBoot),实现可连续对话和流式输出的ChatGPT API(可自定义实现AI助手)

目录1. 配置阶段1.1 依赖引入1.2 配置application.yml文件1.3 注解添加2 使用2.1 生成回答2.1.1 测试2.2 生成图片2.2.1 测试2.3 下载图片2.3.1 测试2.4 生成流式回答2.4.1 流式回答输出到IDEA控制台2.4.2 流式回答输出到浏览器页面3 AI助手展示本文Demo地址:https:…

奇舞周刊第486期:ChatGPT 的狂飙之路

记得点击文章末尾的“ 阅读原文 ”查看哟~下面先一起看下本期周刊 摘要 吧~奇舞推荐■ ■ ■ChatGPT 的狂飙之路最近随着 ChatGPT 爆火出圈,网络上各种关于 ChatGPT 的争论声也不断;有些人把它当成一个更高级的聊天机器人,有人兴奋地看到了创…

阿里巴巴达摩院通义千问【附申请链接】阿里版ChatGPT

🥑 Welcome to Aedream同学 s blog! 🥑 文章目录报名测试实际体验效果阿里云作为数一数二的全球云平台,阿里的大语言模型通义千问还是值得期待的,凭借强大的算力支持还是有机会赶上人工智能发展浪潮。 早前阿里巴巴达摩院关于人工…

如何在QQ群中接入ChatGPT机器人

最近ChatGPT很火,但是每次要在浏览器上输入显得很麻烦。那么能不能在我们日常使用的软件中接入它让我们能方便的使用它呢?下面为你介绍如何在QQ群中接入chatgpt。环境介绍今天我们的分享主要围绕着大部分用户Windows电脑。基于nodejs。所需工具nodejs(版…

InstructGPT论文详解(学习ChatGPT必看论文)

InstructGPT论文详解(Training language models to follow instructions with human feedback,学习ChatGPT必看论文)返回论文和资料目录 1.导读 继ChatGPT大火后,越来越多人想了解ChatGPT相关技术。OpenAI官网虽然没有给出ChatG…

解放生产力!chatGPT接入Excel与Word教程(需要魔法上网,不用的都是骗人的)

解放生产力!chatGPT接入Excel与Word教程(需要魔法上网,不用的都是骗人的)!!!默认你注册过openAI账号了并使用过chatGPT了,本文就不教如何注册GPT啦,网上全是教程&#xf…

已获得百度文心一言内测资格,和ChatGPT3.5简单对比测评

今日获得了百度刚发布的文心一言的内测资格。整体感觉还不错哟。 闲来无事,使用同样的问题,用文心一言和我们基于ChatGPT的GPT-3.5-Turbo接口开发的免费镜像网站作了一下对比。给各位同学提前做一下参考。 传送门:https://ai.bo-e.com/ 接口…

ChatGPT技术与市场动态

ChatGPT服务器,深度拆解(2023)ChatGPT发布之后,引发了全球范围的关注和讨论,国内各大厂商相继宣布GPT模型开发计划。据各公司官网,2023年2月7日,百度宣布将推出ChatGPT类似产品“文心一言”&…