Bert模型学习笔记

news/2024/6/16 6:30:50/文章来源:https://blog.csdn.net/qq_36160277/article/details/127200086

Bert模型学习笔记

From https://www.bilibili.com/video/BV1Ey4y1874y emmm 讲实话这个视频太简单了,不建议看。

可以看看李沐的视频:https://www.bilibili.com/video/BV1PL411M7eQ

这篇文章主要是四个部分:

  1. bert的整体架构
  2. 如何做预训练 mlm + nsp
  3. 如何微调bert(没看)
  4. 代码解析(没看)

Bert架构

  1. 基础架构是Transformer

    image-20221003034515779
  2. bert-base

    1. 6 个encoder在一起变成了编码端
    2. 6个decoder在一起变成了解码端

在Transformer中使用了位置编码作为输入,但是在bert中使用的是:
input=tokenemb+segment+positionembinput = token emb + segment + position emb input=tokenemb+segment+positionemb
image-20221003040645013

二、如何做预训练任务

两种目标函数:

AR:其实就是类似GPT中的预训练任务,预测下一个单词。

AE:将某个位置的词语mask掉,然后进行预训练。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_19777.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【极客时间】HTTP 专栏课-罗剑锋

HTTP 专栏课-罗剑锋 🐶 趁毕业之前,系统把计算机知识补充一下。从计算机网络开始,后面会扩展到数据结构、算法设计、设计模式、数据库、软件工程、中间件相关内容。这次先根据罗老师课程补一把计算机网络吧!! 破冰篇之…

神经网络训练的一般步骤,神经网络是怎么训练的

1、什么神经网络训练学习?学习有哪几种方式? 神经网络的学习,也就是训练过程,指的是输入层神经元接收输入信息,传递给中间层神经元,最后传递到输出层神经元,由输出层输出信息处理结果的过程。 …

文件操作(上)

文件操作(上) 文章目录文件操作(上)前言一、文件的概述1.什么是文件?1.1程序文件1.2数据文件1.3文件名二、文件的打开和关闭2.1文件指针2.1.1创建一个FILE*指针变量2.2文件的打开三、文件的顺序读写3.1.fputc函数3.2.fgetc函数3.3fputs函数3.…

TypeScript算法题实战——哈希表篇

哈希表可以用来快速判断一个元素是否出现集合里。常见的哈希表有三种形式:数组、set (集合)、map(映射) 本系列博文将通过一些力扣算法题目,边学习TypeScipt边实战算法,这篇将通过一些经典算法题熟悉TS语言哈希表的一…

Redis设计与实现(四)跳跃表

1. 概述 跳跃表(skiplist)是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的。 跳跃表支持平均O(logN)、最坏O(N)复杂度的节点查找&…

五、使用Python操作数据库

(六)使用Python操作数据 程序运行时,数据是在内存中。当程序终止时,通常需将数据保存在磁盘上。为了便于程序保存和读取数据,并能直接通过条件快速查询到指定数据,数据库(Database)这…

adb命令

ADB 全名Android Debug Bridge,是⼀个调试⼯具。adb ⼯具可以在电脑通过终端命令操作安卓⼿机/模拟器。adb 包含三个部分: 1、 Client端:运⾏在开发机器中,即你的开发电脑,⽤来发送adb 命令; 2、 Daemon 守…

【JavaDS】队列与集合Queue,Deque的理解和使用

✨博客主页: XIN-XIANG荣 ✨系列专栏:【Java实现数据结构】 ✨一句短话: 难在坚持,贵在坚持,成在坚持! 文章目录一. 什么是队列1. 队列的特点2. 队列的模拟实现3. 循环队列4. 双端队列二. 集合-Queue,Deque1. 结构介绍2. 方法介绍一. 什么是队列 1. 队列的特点 队列也是一种组…

代码随想录17——二叉树:110平衡二叉树、257二叉树的所有路径、404左叶子之和

文章目录1.110平衡二叉树1.1.题目1.2.解答1.2.1.概念区分1.2.2.求深度和求高度的遍历顺序问题1.2.3.本题解答:使用后序遍历求高度2.257二叉树的所有路径2.1.题目2.2.解答3.404左叶子之和3.1.题目3.2.解答3.2.1.迭代法(层序遍历)3.2.2.递归法&…

玩转华为ENSP模拟器系列 | 总部与分支结构之间建立IPSec VdPdNd(总部采用固定IP)

素材来源:华为防火墙配置指南 一边学习一边整理试验笔记,并与大家分享,侵权即删,谢谢支持! 附上汇总贴:玩转华为ENSP模拟器系列 | 合集_COCOgsta的博客-CSDN博客_华为模拟器实验 目标 在实际的应用中&am…

SECS/GEM之SECS Driver开发源代码

1 简介 1. Secs Driver 由金南瓜科技提供,适用于半导体、光伏、面板、PCB等行业 支持C、C、C#等编程语言(C#对应C#DLL库) 2. SECS Driver集成E5,E37的功能。支持主动或者被动模式通讯,实时接收数据和反馈通讯状态给上层应用。 3…

第一次软件技术基础作业

这个作业属于哪个课程 https://edu.cnblogs.com/campus/zjlg/22rjjc?page=2这个作业的目标 自我认知和课程展望姓名-学号 陈宇扬-2020330301069自我认知和课程展望 个人信息土生土长的杭州市本地人,出生于2001年的冬季。 大概是个很平凡的人,兴趣爱好也是同龄男性老生常谈的…

ubuntu 18.04 安装conda环境 及 创建虚拟环境

1 下载 Anaconda2 安装3 激活3 常用命令及设置4 创建虚拟环境1 创建虚拟环境2 激活5 换源1 下载 Anaconda 下载 Anaconda3-5.2.0-Linux-x86_64.sh (Ubuntu18.04的对应的Anaconda版本): ubuntu 32/64版本查看 sudo uname --mx86是32位,x86_64是64位。 …

Spring 永远的神,这绝对是目前最全面的 spring 全家桶学习笔记

Spring 这个技术栈,想必大家都知道,这玩意面试必考工作必用,对于每位 Java 程序员来说都是至关重要的;俗话说 Java 开发不学习 Spring 就像士兵上战场不带枪,我认为这个比喻很形象。Spring 几乎占据了 Java web 的半壁…

【jupyter使用】在Anaconda虚拟环境中使用Jupyter

1. 安装anaconda并创建虚拟环境 anaconda下载地址:https://www.anaconda.com/products/distribution 按照提示一步步安装即可,此处略 2. 在电脑“开始”找到Anaconda文件夹,选择命令行窗口 使用conda env list命令查看已有的虚拟环境&#…

vue-echarts封装组件

vue-echarts封装组件 1.安装&使用 npm install echarts vue-echarts2.配置项说明 这里用饼状图pie演示。 myChart01.vue <template><v-chart class"chart" :option"option" /> </template><script> // 导入相关组件 impo…

雷达回波识别:非降水气象回波和非气象回波

一、非降水气象回波 1. 云回波 云由悬浮在空中的小水滴和冰晶所组成云粒子后向散射产生回波云粒子较小&#xff0c;回波强度弱&#xff0c;一般使用波长更短的云雷达(毫米波段)对云进行观测。 因为雷达接收的回波功率与波长平方成反比&#xff0c;因此探测云时&#xff0c;通…

OSS服务器(MinIO)的搭建和应用

本文主要分享了如何搭建一个类似阿里云OSS的对象存储服务器。以windows环境下MinIO的搭建举例说明&#xff0c;linux环境下的搭建网上也有很多教程&#xff0c;请自行搜索相关资料。一、下载 地址&#xff1a;MinIO | Code and downloads to create high performance object st…

Windows下安装Oracle数据库

Windows下安装Oracle用图形化界面无脑下一步就行&#xff0c;反正个人开发够用就行&#xff0c;不用考虑太多。 下载地址&#xff1a;https://blog.csdn.net/dudadudadd/article/details/127186705 解压安装包&#xff0c;双击setup&#xff0c;会闪一个黑窗口进程&#xff0…

pytorch-实现天气识别

&#x1f368; 本文为&#x1f517;365天深度学习训练营 中的学习记录博客&#x1f366; 参考文章&#xff1a;[365天深度学习训练营-第P3周&#xff1a;天气识别](365天深度学习训练营-第P3周&#xff1a;天气识别 语雀 (yuque.com))**&#x1f356; 原作者&#xff1a;K同学…