深度学习常见概念字典(感知机、全连接层、激活函数、损失函数、反向传播、过拟合等)

news/2024/5/6 11:06:48/文章来源:https://blog.csdn.net/smileyan9/article/details/126882313

这一章的所有内容均是为了进入深度学习具体的某某网络而准备的,简单但是非常有必要。

1. 神经网络(neural networks)的基本组成

1.1 神经元(neuron)

神经元(neuron) 是神经网络(neural networks)中最基本的单位。神经网络与神经元的概念均是借鉴于生物学,可以简单理解为:如果某神经元的点位超过了“阈值(threshold)”,那么它就会被激活,将 “兴奋” 的状态以电位信息的方式发送给其他神经元或输出。

1.2 感知机(Perceptron)

感知机(Perceptron) 由两层神经元组成(输入层与输出层),感知机模型的结构如图所示:

在这里插入图片描述
对应的公式为:

z=w1x1+w2x2+⋯+wnxn+b(1.2.1)z = w_1x_1 + w_2x_2 +\cdots+w_nx_n + b \tag{1.2.1} z=w1x1+w2x2++wnxn+b(1.2.1)

对应的表示为向量的形式为:

z=wTx+b(1.2.2)z = \textbf{w}^\text{T} \textbf{x} + b \tag{1.2.2} z=wTx+b(1.2.2)

摘录自 《Tensorflow 深度学习》 龙良曲 著 清华大学出版社

1.3 全连接层(fully connected layers,FC)

全连接层(fully connected layers,FC),是每一个结点都与上一层的所有结点相连,用来把前边提取到的特征综合起来。由于其全相连的特性,一般全连接层的参数也是最多的。

如下图所示,我们把左边部分看作输入特征向量,右边的部分则是神经网络中的一个全连接层。
在这里插入图片描述

1.4 前馈神经网络(feedforward neural network,FNN)

前馈神经网络(feedforward neural network,FNN),是一种最简单的神经网络,各神经元分层排列,每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层,各层间没有反馈。

前馈神经网络采用一种单向多层结构。其中每一层包含若干个神经元。在此种神经网络中,各神经元可以接收前一层神经元的信号,并产生输出到下一层。

前馈神经网络例图

摘录自 百度百科

2. 神经元之间的数据传播

2.1 激活函数(Activation functions)

激活函数(Activation functions) :建立神经元的输入与输出之间映射关系的函数。

为什么要用激活函数

  • 不使用激活函数时,每一层输出都是上层输入的线性函数,无论神经网络有多少层,输出都是输入的线性组合,这种情况就是最原始的感知机(Perceptron)。
  • 使用激活函数给神经元引入了非线性因子,使得神经网络可以任意逼近任何非线性函数,这样神经网络就可以应用到众多的非线性模型中。

参考 百度百科-激活函数

2.2 正向传播算法(Forward propagation algorithm)

正向传播算法(Forward propagation algorithm):沿着从输入层到输出层的顺序,依次计算并存储神经网络的中间变量。

2.3 损失函数(loss function)

损失函数(loss function)别称代价函数(coss function):在神经网络中,损失函数一般是指用来计算模型的预测值与真实值之间的差异的计算方法。由于不同算法模型的数学原理不同,对应的损失函数也可能存在一定程度的差异。

2.4 logits 是什么

logits 指的是分类模型生成的原始(非标准化)预测向量,通常传递给标准化函数。如果模型正在解决多类分类问题,则 logit 通常会成为softmax函数的输入。然后,softmax函数生成(归一化)概率向量,每个可能的类具有一个值。

不少论文、视频常常提到 logit 的使用,这里也记录一下 logit 是什么。
参考 logit | 博客 1 | 博客 2

2.5 反向传播(Backpropagation, BP)算法

反向传播算法,简称BP算法,适合于多层神经元网络的一种学习算法,它建立在梯度下降法的基础上。BP网络的输入输出关系实质上是一种映射关系:一个n输入m输出的BP神经网络所完成的功能是从n维欧氏空间向m维欧氏空间中一有限域的连续映射,这一映射具有高度非线性。它的信息处理能力来源于简单非线性函数的多次复合,因此具有很强的函数复现能力。这是BP算法得以应用的基础。

摘录自百度百科 反向传播算法

参考 深度学习——反向传播(Backpropagation)

2.6 导数(Derivative)与梯度

导数在高中的时候便开始学习,大学的时候也继续深入学习,这里不再介绍,推荐参考 百度百科导数。

梯度的概念可以参考 百度百科 梯度。

总结

更多的概念性内容会在后面继续整理,主要目的是用来回答 “什么是什么” 以及 “什么的作用是什么” 这类的问题。保证自己有一个初步的了解对今后的学习很有必要。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_240098.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Djiango实现用户管理增删改成功能实战

1.0定义 前后端不分离模式 前后端分离是指前端页面看到的效果都是由后端控制,即后端渲染HTML页面,前端与后端的耦合度比较高 前后端分离模式 后端仅返回前端所需要的数据,不在渲染HTML页面,不在控制前端的效果,至…

CodeQL代码静态污点分析引擎排查漏洞模式

文章目录前言环境搭建1.1 codeql基础1.2 vscode插件1.3 生成数据库1.4 HelloWorldcodeql语法2.1 语法结构2.2 常用类库2.3 谓词介绍2.4 污点分析漏洞检测3.1 初步结果3.2 解决误报总结前言 对于代码审计的工作,最早期的安全人员会以人工审计的方式来审计项目代码&a…

RabbitMQ 第二天 高级 7 RabbitMQ 高级特性 7.1 消息的可靠投递 7.1.1 confirm【确认模式】

RabbitMQ 【黑马程序员RabbitMQ全套教程,rabbitmq消息中间件到实战】 文章目录RabbitMQ第二天 高级7 RabbitMQ 高级特性7.1 消息的可靠投递7.1.1 confirm【确认模式】第二天 高级 7 RabbitMQ 高级特性 7.1 消息的可靠投递 7.1.1 confirm【确认模式】 在使用 Ra…

【数据预处理】基于Pandas的数据预处理技术【california_housing加州房价数据集】_后9个任务

文章目录一.需求分析二.需求解决2.1 对第一个特征(收入中位数)排序后画散点图2.2 对第一个特征(收入中位数)画分位数图并分析2.3 【选做】对所有特征画分位数图并进行分析2.4 使用线性回归方法拟合第一个特征(收入中位…

【C语言进阶】指针练习题

写在前面 这是指有关指针的小题 正文 练习一 int main() {int a[5][5];int (*p)[4];pa;printf("%p,%d", &p[4][2]-&a[4][2], &p[4][2]-&a[4][2] );return 0; } 解析: a[4][2]为如图粉色部分,p[4][2]为如图蓝色部分。a的…

Java项目:springboot药品管理系统

作者主页:源码空间站2022 简介:Java领域优质创作者、Java项目、学习资料、技术互助 文末获取源码 项目介绍 本项目属于前后端分离的项目,分为两个角色药品管理员和取药处人员 药品管理员: 登录、退出、药品信息录入、药厂信息录入…

买不到的数目(蓝桥杯C/C++A组真题详解)

题目详细: 题目思路: 对于这个题有一个定理 如果 a,b 均是正整数且互质,那么由 axby,x≥0,y≥0 不能凑出的最大数是 : a*b-a-b 具体的证明过程这里就不赘述 感兴趣的同学可以自行查找 这里就提供一种思…

RabbitMQ 第二天 高级 7 RabbitMQ 高级特性 7.2 Consumer Ack

RabbitMQ 【黑马程序员RabbitMQ全套教程,rabbitmq消息中间件到实战】 文章目录RabbitMQ第二天 高级7 RabbitMQ 高级特性7.2 Consumer Ack7.2.1 Consumer Ack7.2.2 Consumer Ack 小结7.2.3 消息可靠性总结第二天 高级 7 RabbitMQ 高级特性 7.2 Consumer Ack 7.2.…

C#语言实例源码系列-伪装文件

专栏分享点击跳转>Unity3D特效百例点击跳转>案例项目实战源码点击跳转>游戏脚本-辅助自动化点击跳转>Android控件全解手册 👉关于作者 众所周知,人生是一个漫长的流程,不断克服困难,不断反思前进的过程。在这个过程中…

matlab神经网络求解最优化,matlab神经网络训练数据

1、神经网络的准确率是怎么计算的? 其实神经网络的准确率的标准是自己定义的。 我把你的例子赋予某种意义讲解: 1,期望输出[1 0 0 1],每个元素代表一个属性是否存在。像着4个元素分别表示:是否肺炎,是否肝…

你可能不知道的DOM断点调试技巧

前言 作为一个前端,DOM断点应该是我们非常熟悉的,也是我们日常工作中经常要用到的一种调试技巧;但是下面这些DOM断点调试技巧你可能不知道,且听我一一道来。 监听元素 有这样一种场景,当DOM中某个元素移除或者元素属…

数据结构---图

(一) 相关知识点 图(graph):图是由顶点的有穷非空集合和顶点之间边的集合组成,通常表示为:G(V,E),其中,G表示一个图,V是图G中的顶点的集合,E是图G…

从模型到服务——iDesktopX处理自动化工具实现BIM模型到三维服务发布

目录前言一、 处理自动化模型二、 算子参数设置1、 使用迭代数据集打开导出后的BIM模型2、 移除重复点、重复面和重复子对象3、 模型生成缓存4、 三维切片缓存发布5、 执行结果前言 BIM模型在SuperMap实际使用的业务流程中常常需要在桌面产品中生成缓存,然后通过iS…

QT多窗口编程与文件IO编程

目录 一、消息对话框 QMessageBox(掌握) 二、常用窗口类(掌握) 三、主窗口类 QMainWindow(重点) 四、parent参数(掌握) 五、窗口传参 5.1 成员函数/构造函数 5.2 信号槽传参 六、事件…

Android开发进阶——binder通讯学习

什么是binder 通常意义下,binder指的是一种通信机制对Server端来说,Binder指的是Binder本地对象,对于Client端来说,Binder指的是Binder代理对象对于传输过程而言,binder是可以跨进程传输的对象 Binder的基本原理 Bi…

MySQL 管理

文章目录启动及关闭 MySQL 服务器MySQL 用户设置/etc/my.cnf 文件配置管理MySQL的命令启动及关闭 MySQL 服务器 首先,我们需要通过以下命令来检查MySQL服务器是否启动: ps -ef | grep mysqld如果MySql已经启动,以上命令将输出mysql进程列表…

node.js+uni计算机毕设项目基于微信小程序的美甲预约系统(程序+小程序+LW)

该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流 项目运行 环境配置: Node.js Vscode Mysql5.7 HBuilderXNavicat11VueExpress。 项目技术: Express框架 Node.js Vue 等等组成,B/S模式 Vscode管理前后端分离等…

Docker安装Zookeeper教程(超详细)

生命无罪,健康万岁,我是laity。 我曾七次鄙视自己的灵魂: 第一次,当它本可进取时,却故作谦卑; 第二次,当它在空虚时,用爱欲来填充; 第三次,在困难和容易之…

【Linux】进程间通信之共享内存

目录🌈前言🌸1、System V共享内存🍡1.1、概念🍢1.2、原理🌺2、共享内存相关函数和指令🍡2.1、shmget函数(创建)🍢2.2、shmctl函数(控制)&#x1f…

【自然语言处理】【ChatGPT系列】ChatGPT的智能来自哪里?

相关博客 【自然语言处理】【ChatGPT系列】ChatGPT的智能来自哪里? 【自然语言处理】【ChatGPT系列】Chain of Thought:从大模型中引导出推理能力 【自然语言处理】【ChatGPT系列】InstructGPT:遵循人类反馈指令来训练语言模型 【自然语言处理…