人工智能发展到GPT4经历了什么,从专家系统到机器学习再到深度学习,从大模型到现在的GPT4

news/2024/5/10 3:11:39/文章来源:https://blog.csdn.net/weixin_42878111/article/details/130137377

大家好,我是微学AI,今天给大家讲一下人工智能的发展,从专家系统到机器学习再到深度学习,从大模型到现在的GPT4,讲这个的目的是让每个人都懂得人工智能,每个人都懂得人工智能的发展,未来人工智能是大方向,会贴近我们的生活,每个人都离不开它。

人工智能的发展

自20世纪40年代以来,人工智能(Artificial Intelligence, AI)就一直是计算机科学最有趣和最具挑战性的研究领域之一。起初是为了解决复杂问题而模拟人类智能思维,但随着技术的发展,人工智能已经广泛应用于图像识别、语音识别、自然语言处理、机器人等诸多领域。在这个漫长的发展历程中,数学知识在很大程度上成为了实现智能算法的基石。

早期的人工智能算法主要包括基于规则的专家系统、机器学习等。专家系统是一套通过硬编码问题解决方案的程序,通常用于解决特定问题。这种方法相对受限,不具备泛化能力,此外,通过人工设定规则的方式需要耗费大量时间、精力。而机器学习作为一个重要分支,从数据中提取知识,是推动人工智能发展的关键技术。这里涉及到的数学知识主要有线性代数、概率与统计、优化等。

初代的人工神经网络(ANN),是基于大脑神经元的结构和功能搭建的简单模型,通过输入层、输出层以及若干隐藏层以实现各种功能。在这里,我们用到了矩阵计算、激活函数、模型参数更新等多种数学工具。

机器学习中重要的模型:支持向量机(SVM),他是一类常用的监督学习算法,它旨在找到一个最优超平面将样本正确分类,主要思想是最大化类别间距离。SVM算法中涉及诸如向量空间(VSM)、凸优化(与拉格朗日对偶、KKT条件相关)等多种数学原理。支持向量机广泛应用于图像识别、文本分类等领域。

faadc86b3ff648ccb7c1c838261cb932.png

后面研究人员发现,通过随机森林(Random Forests)等多个弱分类器的组合,能提高模型的准确性。这一发现促成了集成学习(Ensemble Learning)的诞生,其中包括Bagging、Boosting等策略,涉及的数学知识有投票原则、模型误差计算等。

随着研究的深入,神经网络模型得到了拓展,产生了卷积神经网络(CNN)、循环神经网络(RNN)等。卷积神经网络是用于解决图像分类等问题的一种有效算法,它利用卷积操作在局部区域内提取特征,降低维度。RNN由于在时间序列数据处理上的优势,被广泛应用于自然语言处理、语音识别等场景。

深度学习(Deep Learning)则是基于多层神经网络模型发展而来,模型有着更深的层数、更复杂的结构。深度学习通过优化算法以自动学习深层次的信息表达和特征。但随之而来的问题是梯度消失和梯度爆炸。为了解决这一难题,引入了梯度裁剪、权值正则化等技术。
49bdf91c34724be7ac095c802d776702.png
另一方面,LSTM(长短时记忆网络)是一种为解决长序列问题所设计的循环神经网络结构。它引入了一种叫做“门”的结构来控制信息在不同时间步的流动。该网络在自然语言处理、语音识别等领域取得了巨大成功。

BERT(Bidirectional Encoder Representations from Transformers)是一种基于 Transformer 架构的预训练模型,通过大量语料数据预训练得到了丰富的词向量表示。Transformer 架构是一种自注意力机制(self-attention)构建的深层网络结构,用于解决序列数据的问题。BERT 提供了一个强大的预训练模型,可以通过微调应用于各种自然语言处理任务,如问答、机器翻译等。
2f7e17b43d0a45d897aa4376b3e02f46.png

生成式预训练模型 (GPT) 则是一种基于 Transformer 架构的自回归模型,通过调整模型参数使生成结果最小化预定义代价函数。GPT 的一个重要特点是可以生成自然的文本,最初的 GPT 只能生成相对简短的文本,随着模型发展,GPT-2 可以生成更加流畅、丰富的文本。进一步发展的 GPT-3 已经具备强大的预训练模型,可以生成更长、更精确的文本,甚至用于编程、学术论文写作等领域。e94732dbf7534776bbcb375e7b9bdcd0.png 

GPT的发展历程

GPT-1: 发表于 2018 年,在迭代过程中加入了 softmax 层,实现了有趣的生成任务,如创作歌词和文章。但受限于模型参数,效果并不理想。
GPT-2: 发表于 2019 年,以 1.54 亿参数量为特点,已实现生成高质量文本,但可能出现信息偏差,甚至有安全隐患。
GPT-3: 发表于 2020 年,参数量高达 1750 亿,但计算成本极高,影响了模型的应用。

ChatGPT: 发表于 2022 年11月,ChatGPT是一种基于GPT模型的AI聊天机器人,可以用于各种任务,包括文本生成、问答和对话系统等。用户可以输入问题或对话内容,并通过ChatGPT获得回复。
GPT-4: 发表于 2023年3月,GPT-4在参数量上达到了100万亿个参数、生成能力、计算性能以及安全方面有更进一步的提升,支持多模态的输入,可以读懂图片信息,功能更加强大。

从专家系统到深度学习,再到 GPT 系列模型的发展中,我们目睹了一系列令人惊叹的技术进步。在这个过程中,数学知识包括线性代数、概率统计、优化等方向发挥了巨大作用。未来,我们有理由相信,GPT-4 及其他先进人工智能模型将为我们的生活带来更多便捷、美好的改变。但与此同时,伴随着这些技术的普及和应用,也面临着更多的挑战与问题,例如数据安全、隐私保护、算法歧视等。

8c2bac5dd2be46f7ab6fe14bbe4d5558.png

 人工智能数据安全性

在数据安全方面,GPT-4 及其他自然语言处理模型的训练过程需要大量的样本数据作为输入。然而,在现实应用场景中,数据来源可能存在安全风险。诸如窃取、篡改数据等行为可能导致模型训练出现偏差,甚至被用于恶意攻击。因此,加强数据安全意识,建立严格监管制度,确保训练数据的合法性、合规性以及有效性,是未来应对挑战的重要方向。

在隐私保护方面,随着人工智能技术在诸如金融、医疗等领域的应用,涉及大量个人隐私数据(如身份证号、住址、病例等)。然而,过度依赖这些信息作为训练数据,可能导致个人隐私被泄露、滥用。未来,可以借鉴差分隐私(Differential Privacy)、同态加密等技术,实现在保护个人隐私的前提下,实现对数据的有效处理和利用。

在算法歧视方面,由于训练数据中可能包含有潜在偏见,导致算法结果对特定人群或企业产生歧视。为了解决这个问题,研究人员可以在训练数据预处理阶段剔除掉与歧视相关的信息,或者在模型验证阶段采用公平性评估(Fairness Evaluation)等方法检测模型是否存有歧视行为,并进行针对性的调整和优化。

在模型的可解释性方面,由于模型参数和网络结构越来越复杂,其预测过程变得难以理解,甚至被称为“黑盒子”。未来,研究人员可以从改善模型结构、选择更适合解释的参数,提高模型的解释性能。此外,可视化技术也可以在很大程度上帮助用户直观地理解模型预测的机理。

人工智能的未来

从专家系统发展到GPT-4模型等人工智能技术的演进,展现了计算机科学和数学领域无穷尽的创新能力。面临诸多挑战,我们需要依靠科研人员的努力与合作,找到关键解决方案,确保人工智能在各行各业得到健康、可持续的发展。同时,我们也相信,在不远的将来,人工智能技术将会为我们的生活带来更大的便利和价值,而我们也将拥有更智慧、更高效的未来世界。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_286170.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

openpnp - 顶部相机辅助光的选择

文章目录openpnp - 顶部相机辅助光的选择概述折腾的过程简易灯板市售的环形灯(不带漫射板)市售的环形灯(不带漫射板) LED单色光调光控制器.市售的环形灯(带漫射板)市售的环形灯(带漫射板) 自己拆解(降低LED灯路数)ENDopenpnp - 顶部相机辅助光的选择 概述 终于将顶部相机辅…

数值区间的模糊匹配,二分查找的应用

先看图: 需求很明确,要根据左边的值,显示右边的值。 比如,现在拿到的值是 17.12,那么应该显示成 15;拿到 17.599 ,那么应该显示成 20. 先找规律: 为了便于说明,暂且将左边的值设为 x, 右边的值设为 y. 第一行和最后一行可以写死成 0 与 1500;余下的每行,x 的区间是…

【华为机试真题详解JAVA实现】—学英语

目录 一、题目描述 二、解题代码 一、题目描述 Jessi初学英语,为了快速读出一串数字,编写程序将数字转换成英文: 具体规则如下: 1.在英语读法中三位数字看成一整体,后面再加一个计数单位。从最右边往左数,三位一单位,例如12,345 等 2.每三位数后记得带上计数单位 分别是…

四、数组、切片,映射

一、一维数组 //声明一个包含5个元素的整型数组 var array [5]int //具体数值填充数组 array : [5]int{1, 2, 3, 4, 5} //容量由初始化值的数量决定 array : [...]int{1, 2, 3, 4, 5) //只初始化索引为1和2的元素 array : [5]int{1: 10, 2: 20} //修改索引为2的元素的值 array…

Spring学习(五):一篇讲清楚动态代理(jdk和cglib)的使用、原理和源码

目录 一、jdk动态代理的基本使用 二、cglib动态代理的基本使用 2.1 方法一:method.invoke() 方法反射调用 2.2 方法二(spring使用的这个方法): methodProxy.invoke() 2.3 方法三:methodProxy.invokeSuper() 三、…

ABP vNext电商项目落地实战(一)

一、落地条件: 1. .NET5版本 2. DDD 3. ABP vNext 4.ABP CLI (ABP的命令行工具,包括ABP的各种模板) 5.SQL Server 写在前面:我觉得这个框架的文件分层很凌乱,在企业的实际业务场景中,一般…

RHCSA练习作业(二)

目录 题目一 题目二 题目三 第四题 第五题 题目一 文件查看:查看/opt/passwd文件的第六行(使用head和tail指令) 代码如下: head -6 /opt/passwd | tail -1 题目二 在/etc及其子目录中,查找host开头的文件&#x…

虚拟机Ubuntu 18.04安装dpdk18.11

1 虚拟机用了2个核,2G内存,3个网卡 2 去http://core.dpdk.org/download/下载了18.11 3 安装apt-get install libnuma-dev 4 运行ifconfig down ***停掉2个网卡,方便后面添加到dpdk 5 解压后,进入usertools,运行dpd…

用AI帮我写一篇关于FPGA的文章,并推荐最热门的FPGA开源项目

FPGA定义 FPGA(Field Programmable Gate Array)是一种可编程逻辑器件,可以在硬件电路中实现各种不同的逻辑功能。与ASIC(Application Specific Integrated Circuit,特定应用集成电路)相比,FPGA…

SQL 条件函数 日期函数 文本函数 窗口函数

玩了几天,劳逸结合,继续复习刷题sql 一、条件函数 1.题目:现在运营想要将用户划分为25岁以下和25岁及以上两个年龄段,分别查看这两个年龄段用户数量(age为null 也记为 25岁以下) user_profile 期望结果&…

由浅入深掌握Python多线程原理与编程步骤

由浅入深掌握Python多线程编程一、 Python多线程编程原理1. 什么是线程2. 线程工作原理3. Python全局锁与线程关系4. Python 支持多线程的模块二、由简单的示例初步了解多线程编程步骤三、标准库 threading 模块介绍1. threading 模块的主要属性、方法,以及公共函数…

C++ [图论算法详解] 欧拉路欧拉回路

蒟蒻还在上课,所以文章更新的实在慢了点 那今天就来写一篇这周刚学的欧拉路和欧拉回路吧 讲故事环节: 在 一个风雪交加的夜晚 18世纪初普鲁士的哥尼斯堡,有一条河穿过,河上有两个小岛,有七座桥把两个岛与河岸联系…

Python手写板 画图板 签名工具

程序示例精选 Python手写板 画图板 签名工具 如需安装运行环境或远程调试&#xff0c;见文章底部个人QQ名片&#xff0c;由专业技术人员远程协助&#xff01; 前言 这篇博客针对<<Python手写板 画图板 签名工具>>编写代码&#xff0c;代码整洁&#xff0c;规则&am…

Diffusion模型系列文章

DDPM 论文 扩散模型包括两个过程&#xff1a;前向过程&#xff08;forward process&#xff09;和反向过程&#xff08;reverse process&#xff09;&#xff0c;其中前向过程又称为扩散过程&#xff08;diffusion process&#xff09;&#xff0c;如下图所示&#xff0c;从x…

如何定位Spark数据倾斜问题,解决方案

文章目录前言一、数据倾斜和数据过量二、 数据倾斜的表现三、定位数据倾斜问题定位思路&#xff1a;查看任务-》查看Stage-》查看代码四、7种典型的数据倾斜场景解决方案一&#xff1a;聚合元数据解决方案二&#xff1a;过滤导致倾斜的key解决方案三&#xff1a;提高shuffle操作…

1.docker-安装及使用

1.安装步骤 Install Docker Engine on CentOS 1. 确定CenOS7及以上版本 cat /etc/redhat-release2.卸载旧版本 yum remove docker \docker-client \docker-client-latest \docker-common \docker-latest \docker-latest-logrotate \docker-logrotate \docker-engine3.yum安…

Spimes x5.0主题模板全开源源码/Typecho主题模板

☑️ 品牌&#xff1a;Typecho ☑️ 语言&#xff1a;PHP ☑️ 类型&#xff1a;主题模板 ☑️ 支持&#xff1a;PCWAP &#x1f389;有需要的朋友记得关赞评&#xff0c;底部分享获取&#xff01;&#xff01;&#xff01; &#x1f389; ✨ 源码介绍 Spimes x5.0主题模板全开…

基于overleaf 的美国大学生数学建模竞赛(美赛)latex 格式模板(含信件和附件)

可能是最后一次打美赛了&#xff0c;感觉有的东西不整理整理有点对不起自己的经历。感觉为这个比赛付出过挺多的&#xff0c;这几次参赛的经历也从各种方面提升了我的能力&#xff0c;相信未来的自己也还会怀念这段时光。 个人认为美赛的难点之一就是优质资源难得&#xff0c;…

Pytorch深度学习笔记(三)线性模型

目录 1.机械学习的过程 2.线性模型 1.机械学习的过程 机械学习的过程&#xff1a; 1.准备数据集DataSet——>2.选择模型Model——>3.训练Training——>4.推理Infering 监督学习&#xff1a;用已知标签的训练样本训练模型&#xff0c;用来预测未来输入样本的标签&#…

Android---内存泄漏检测核心原理

目录 LeakCanary 核心原理 LeakCanary 检测对象的类型 ReferenceQueue 与 WeakReference LeakCanary 里的监控列表与保留列表 常见内存泄漏案例 1. 单例导致内存泄漏 2. 静态变量导致内存泄漏 3. 非静态内部类导致内存泄漏 4. 未取消注册或回调导致内存泄漏 5. Timer…