「ChatGPT」爆火背后的大语言模型到底是什么?

news/2024/4/29 16:46:54/文章来源:https://blog.csdn.net/androidstarjack/article/details/129153081

点击上方关注 “终端研发部

设为“星标”,和你一起掌握更多数据库知识

本文首发于我的知乎,终端研发部!

链接:https://www.zhihu.com/question/585248111/answer/2903130554

说起chatGPT,我们都知道非常的火爆,作为程序员,我们更要知其然,知其所以然!

而在这个领域,最为重要的核心技术之一就是大语言模型。而在大语言模型中,ChatGPT就是备受关注的代表之一,几天我就给大家说说chatGPT背后的那些事情。

其实它是由开放人工智能研究院(OpenAI)开发的一种大型自然语言生成模型。其前身为GPT,经过不断的迭代和升级,已经发展成为了目前最为先进的自然语言处理技术之一。

0a895c686d32a804ce133088262a3f8c.png

ChatGPT主要是针对智能客服、聊天机器人等领域的人机交互应用而设计的。该模型不仅可以实现对话交互,还可以根据输入的信息进行推理,生成符合语义逻辑的文本,从而大大提高了对话的质量和效率。

so,我来补充一下什么是 语言模型

语言模型(language model):把语言输出看作一个符号序列,通过定义在词序列上的概率模型,计算一个词序列的概率。
c85abb598e99848cc05477fd498cd62e.jpeg

2020年5月,OpenAI推出GPT-3模型(generative pre-trained transformer-3),其参数大小175亿参数,是上图第二大参数的 10 倍。

2022年11 月 30 日,OpenAI 发布了针对对话进行优化的语言模型 ChatGPT,该模型采用对话模式进行交互,不仅能回答问题,还能承认错误、质疑不正确的前提和拒绝不恰当的请求。

作为一款先进的大语言模型,ChatGPT拥有着很强的文本生成能力,可以模拟人类的思维过程,理解和处理自然语言。该模型使用了Transformer网络结构,并且训练了数百亿个单词级别的语言模型参数,从而可以对多种任务进行预测和生成。同时,该模型还集成了对话管理、情感识别、知识图谱等多种先进技术,使其更加智能化、人性化。

然而我不得不说一下大语言模型(LLM)的技术的重要性!

简单说,它的思路就是把尽可能大量大量大量大量的数据通过 Transformer 架构做机器学习,就能从数据中学到很多很多很多很多能力,多到超出原始设计者的想象。

比方说,它在翻译方面的能力,不输于,甚至超过了专业的机器翻译系统。

本文开头机翻的比尔盖茨的话,我觉得 ChatGPT 就比 Google 翻译得要好上一个层次。唯一瑕疵是用了比较生僻「元界」,而不是更常用的「元宇宙」。但当我告诉它「元宇宙」更常用后,它立刻就能修正翻译:

13b967bdbd2fad4a3616a4ea885efb74.jpeg

这个LLM模型规模必然非常巨大,ChatGPT是目前最接近理想LLM的技术方案,而理想中的LLM应该是以一个几乎无所不能的基础通用大模型作为依托,来支持各种各样的上层任务类型。目前看,支持越来越多的任务类型,主要是通过增加LLM预训练数据的多样性来达成的,数据多样性越好,LLM能够支持的任务类型就越丰富。所以,应该重视通过增加数据多样性来增加LLM新能力的思路。

6c382863a0c0d29a2768bd1d5d7e07f2.jpeg

这要以大模型成功的四个核心要素来分析。这四个要素是:

  1. 算法

  2. 数据

  3. 工程技巧

  4. 大量的钱买来的算力和人工反馈

像国内的阿里,百度,和腾讯也加入了这方面技术的研究。百度在人工智能领域从事了十多年,在深度学习算法与框架、人工智能赋能芯片、语言训练模型等技术方面积累了优势。

与此同时,微软表示,它计划在前几天发布自己的人工智能。

现在亚马逊、谷歌,思科、IBM、英特尔、英伟达等公司,都已经在开始布局CPO相关技术了。

同事也说一下,ChatGPT向GPT 3.5模型注入了新知识,方便LLM理解人的命令, 对于什么是好的回答,什么是不好的回答,人类有自己的标准,例如比较详细的回答是好的,带有歧视内容的回答是不好的,诸如此类。这是人类自身对回答质量好坏的偏好。人通过Reward Model反馈给LLM的数据里,包含这类信息。总体而言,ChatGPT把人类偏好知识注入GPT 3.5,以此来获得一个听得懂人话、也比较礼貌的LLM。

随着人工智能技术的不断发展和创新,ChatGPT未来还将发挥更大的作用,带给我们更多惊喜和便捷的体验!

ae44feab5d3b12283f7a3fca8ff9479e.jpeg

回复 【idea激活】即可获得idea的激活方式

回复 【Java】获取java相关的视频教程和资料

回复 【SpringCloud】获取SpringCloud相关多的学习资料

回复 【python】获取全套0基础Python知识手册

回复 【2020】获取2020java相关面试题教程

回复 【加群】即可加入终端研发部相关的技术交流群

用 Spring 的 BeanUtils 前,建议你先了解这几个坑!

lazy-mock ,一个生成后端模拟数据的懒人工具

在华为鸿蒙 OS 上尝鲜,我的第一个“hello world”,起飞!

字节跳动一面:i++ 是线程安全的吗?

一条 SQL 引发的事故,同事直接被开除!!

太扎心!排查阿里云 ECS 的 CPU 居然达100%

一款vue编写的功能强大的swagger-ui,有点秀(附开源地址)

相信自己,没有做不到的,只有想不到的

在这里获得的不仅仅是技术!

7e00e16f14ca4e77331988f08dde4118.png

04c2d1465b17a7e4e48821955770f5e8.gif

喜欢就给个“在看885ac08b7e0431542eb1c116c64c5f10.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_21.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南+最全提示词/咒语

在这篇文章中,我将分享如何利用ChatGPT 4.0辅助论文写作的技巧,并根据网上的资料和最新的研究补充更多好用的咒语技巧。 本篇文章持续更新,祝大家写作顺利,如果对你有帮助,记得三连! 欢迎大家在评论区补充…

ChatGPT兴起,这20种职业将迎来失业潮

OpenAI新近推出的ChatGPT已经爆火出圈,它的回答之智能之流畅让众人惊艳。据媒体报道,ChatGPT还通过了美国部分高校的法律、医学考试,并顺利通过了谷歌软件工程师入职测试,岗位年薪18万美元。当全球科技圈被 ChatGPT牵动&#xff0…

使用 ChatGPT 启发游戏创意|基于 AI 5 天创建一个农场游戏,第 2 天

欢迎使用 AI 进行游戏开发! 在本系列中,我们将使用各种 AI 工具,在 5 天内创建一个功能完备的农场游戏。到本系列结束时,你将了解到如何将多种 AI 工具整合到游戏开发流程中。本系列文章将向你展示如何将 AI 工具用于:美术风格游戏…

ChatGPT与Discord无缝接入指南,创建自己的聊天机器人(保姆级教程)

ChatGPT和Discord都非常流行,而在Discord内使用AI绘画也很受欢迎。如何将ChatGPT与Discord对接,在Discord内实现一个聊天机器人。 第一步:获取OpenAI API密钥。请按照以下步骤操作: 打开此链接 https://platform.openai.com/acco…

基础入门-ChatGPT结合安全融入技术高效赋能拓展需求

文章目录Chatgpt科普利用:安全开发逆向免杀代码审计蓝队应急APT社工学其他相关:Chatgpt科普 ChatGPT是什么? ChatGPT–可能很多人被这个缩写的名字搞糊涂了,第一眼无法看出到底什么意思,GPT 的英文原文是 Generative Pre-trainin…

基于Docker如何快速部署自己的ChatGPT

背景 随着OpenAI在2022年底发布的LLM模型-ChatGPT展现出的强大效果,ChatGPT无疑成为了当下炙手可热的明星模型。 现有的基于GPT的开源项目已经非常多,本文以现有的高热度github开源项目chatgpt-web为例,教大家简单快速地搭建属于自己的Chat…

windows-中科院学术ChatGPT优化安装记录

搭建中科院学术专业版 ChatGPT记录 1、git仓库获取 > git clone https://github.com/binary-husky/chatgpt_academic.git(在git bash 中打开输入就行) 打开后输入命令即可 然后你便得到了它,进入该文件夹 打开命令终端,为他配…

基于ChatGPT搭建公司内部ChatGPT服务器

一、前言 我是ChatGPT,一个由OpenAI训练的大型语言模型。我被设计用于回答各种问题并生成文本,可以处理多种自然语言任务,例如问答、摘要和翻译等。在我的学习过程中,我阅读了数百万篇文本,并使用这些文本来提高我的理…

赶上ChatGPT的车,百度文心一言和阿里通义千问上线

百度“文心一言”,地址:https://yiyan.baidu.com 阿里“通义千问”,地址:https://tongyi.aliyun.com 以下介绍来自官方: 一、“文心一言”介绍: 你好,我是文心一言 ERNIE Bot 作为一个人工…

ChatGPT火了,将给网络安全行业带来什么影响?

一、简介 作为全新的人工智能(AI)聊天机器人,ChatGPT被认为正在“掀起新一轮AI革命”。在股市上甚至出现了“ChatGPT概念股”的当下,ChatGPT究竟对于网络安全行业会产生怎样的影响,是值得思考的一个问题。 ChatGPT由…

你的 ChatGPT Not available in your country?教你如何解决

ChatGPT Not available 文章目录ChatGPT Not available问题描述解决方法一解决方法二教程图示方法一方法二相关文章问题描述 如果你使用科学上网却发现自己的页面上显示 OpenAIs services are not available in your country.,你可能会换其他地区,但是换…

一键免费部署你的私人 ChatGPT 网站

Hello,大家好,我是程序员树先生。今天手把手教大家如何“免费”部署一个私人专属的 ChatGPT 网站,即使你不懂编程,跟着本文也可以完成搭建,非常简单。 为什么要部署私人 ChatGPT 网站 ? 国内市场上已经有…

ChatGPT国内镜像站,轻松访问

镜像站网址:https://444.chat/ ChatGPT介绍 ChatGPT,全称聊天生成型预训练变换模型(英语:Chat Generative Pre-trained Transformer),是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。…

【AIGC】Notion AI 从注册到体验:如何免费使用

欢迎关注【youcans的AGI学习笔记】原创作品,火热更新中 【AIGC】Notion AI 从注册到体验1. Notion AI 介绍1.1 Notion AI 简介1.2 Notion AI 的核心能力1.3 Notion AI 与 ChatGPT 的比较2. Notion AI 国内用户注册2.1 PC 端用户注册2.2 移动端用户注册3. Notion AI …