基于Tree-LSTM网络语义表示模型

news/2024/4/27 0:45:43/文章来源:https://blog.csdn.net/kuxingseng123/article/details/128100670

TC;DR

目前的LSTM仅能对序列信息进行建模, 但是自然语言中通常由词组成的短语形成了句法依存的语义树。为了学习到树结构的语义信息。论文中提出了两种Tree-LSTM模型Child-Sum、Tree-LSTM、和N-ary Tree LSTMs。实验部分的Tree-LSTM、对比多种LSTMs的变体,在语义相似性计算和情感分类任务超过有bselilnes

Model

LSTM

首先简单介绍下 LSTM提供的后续论文改进对比,主要模型结构如下所示:
在这里插入图片描述
每个门电路的计算方式如下:
ft=σ(Wfxt+Ufht−1+bf)f_t = \sigma(W^{f}x_t + U^{f}h_{t - 1} + b^{f})ft=σ(Wfxt+Ufht1+bf)
it=σ(Wixt+Uiht−1+bi)i_t = \sigma(W^{i}x_t + U^{i}h_{t -1} + b^{i})it=σ(Wixt+Uiht1+bi)
ct=it⊙ut+ft⊙ct−1c_t =i_t \odot u_t + f_t \odot c_{t-1}ct=itut+ftct1
0t=σ(W0xt+U0ht−1+b0)0_t = \sigma(W^{0}x_{t} + U^{0} h_{t - 1} + b^{0})0t=σ(W0xt+U0ht1+b0)
ht=ot⊙tanh(ct)h_t = o_t\odot tanh(c_t)ht=ottanh(ct)

总结

通过不断的门控单元和门控细胞,复杂的计算并一层一层的传递,。
此部分不再阐述,详细可以参考另一篇文章全部都将其搞定都行啦的样子与打算。
LSTM能够处理序列信息,但是无法处理带有树结构的数据,例如,下图所示的依存句法分析树。成分句法分析树等。
带有树结构的信息带有树结构的信息

在这里插入图片描述
在这里插入图片描述
以上仅表示两种自然语言分析中的两种语义表示格式,但是模型可以类推到其他树结构数据

Tree-LSTM

为了将树结构的数据作为输入训练RNN,论文提出了两种结构:
Tree−StructuredLSTMTree-Structured LSTMTreeStructuredLSTM

  • Child-SUM Tree-LSTMS(Dependency Tree-LSTMs)
  • 适用于子节点个数不定或子节点乱序的树结构
  • N-ary Tree-LSTM(Constituency Tree-LSTMs)
  • 适用于每个单元子单元的个数最多是N,且子单元之间是有序的
    在这里插入图片描述
    与标准的LSTM结构类似,Tree-LSTM中的每个cell ,都包括类似的输入门iti_tit,输出门oto_tot,cell state ctc_tct和隐藏输出hth_tht.

不同的是Tree-LSTM单元中门向量和细胞状态更新依赖于所有与子相关的子单元的状态。另外, 相比较于标准的LSTM的单个遗忘门,Tree-LSTM拥有多个遗忘门fjkf_{jk}fjk,分别对应当前单元的每个子单元kkk,因此,Tree-LSTM可以选择地从子节点中获取信息,例如再情感分类中,去保**存语义信息更加丰富的子节点信息

**。
与标准的LSTM不同,每个Tree-LSTM单元会有一个输入向量xJx_JxJ

xjx_jxj可以表示一个句子中单词的向量表示,每个节点的input word取决于网络的树结构,例如要处理的Dependency tree 的Tree-LSTM,那么Tree-LSTM树中的每个节点,将[head word],对应的向量当做输入,而在[constituency tree]中,将对应的词向量当做输入。
考虑到目前需要处理的数据类似于 Dependency Tree.因此,本文中仅介绍下**: Child-Sum Tree-LSTMs**。

Child-Sum Tree-LSTMs

给定树且另C(j)C(j)C(j)表示节点jjj的子节点集合。那么Child-SUM Tree-LSTMs的计算公式如下:
在这里插入图片描述
从上述计算公式即可:Tree-LSTM与LSTM间的区别包含两点:

  • LSTM只用到了上一步神经元的隐藏输出ht−1h_{t - 1}ht1,而Tree-LSTM用了所有子节点的隐藏输出hj~=∑k∈Cjhk\widetilde{h_j} = \sum_{k \in C_{j}}h_khj=kCjhk
  • Tree-LSTM使用多个遗忘门fjkf_{jk}fjk来控制多个子节点:cell state candidateckc_kck

由于Child_Tree Tree-LSTMs将其子节点的状态hkh_khk进行累加,因此适合(多分枝、子节点无序的树。)例如:dependency tree, 一个 head 的 dependent 数量是高度可变的,因此我们将应用在dependency tree上的 Child-Sum Tree-LSTM称为 Dependency Tree-LSTM

介绍完Child-Sum Tree-LSTMS后即可将其应用于下游任务,论文中用于情感分类和语义相似性的计算任务中。

实验

即不同实验中模型参数如下所示:
在这里插入图片描述
情感分类任务:
在这里插入图片描述
语义相似性计算任务中:
在这里插入图片描述

总结

慢慢的将各种树结构,啥的全部都将其搞定,会自己学习各种树结构。
慢慢的整理即可,全部将其搞定都行啦的样子于打算。
还有都是慢慢的将自己的树结构啥的全部都将其搞定。学习各种树模型。慢慢的全部将其掌握都行啦的回事与打算。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_39102.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

nuxtjs中asyncData异步数据请求、代理配置、fetch网络请求、vuex的使用、中间件处理

文章目录1. asyncData异步数据请求2. 代理配置3. fetch网络请求4. vuex4.1 state中的数据展示4.2 同步方法与异步方法4.3 数据持久化处理5. 中间件处理1. asyncData异步数据请求 Nuxt.js 扩展了 Vue.js,增加了一个叫 asyncData 和 fetch 的方法,使得我们…

这或许是全网最详细的介绍预言机赛道的视频课程,通俗易通,有趣有料!

图片来源:由无界版图 AI 绘画工具生成有一句话在创业者中很流行:Web3创业三大坑,隐私、跨链、预言机……搞塌加密市场的DK和SBF还在豪华度假酒店里思考人生搞隐私,一毛钱没赚到的Tornado cash开发者却在吃牢饭……加密圈前十大资产…

力扣(LeetCode)895. 最大频率栈(C++)

设计 ①维护最大频率,②维护每个数的出现次数,③维护出现次数对应的栈。 压栈时,新数压入出现次数对应的栈,每次压入新数,维护最大频率(所有出现次数中的最大出现次数)。 弹栈时,找最大频率对应的栈&…

拖死项目的不是团队,可能是失败的管理

项目中的活动,归根结底是由人来完成的,如何发挥项目成员的能力,对于项目的成败起着至关重要的作用。如何充分地发挥团队成员的能力,对项目经理也是一个挑战。 在团队管理者我们会遇见这些难题: 1、团队凝聚力不足&a…

【MySQL 18】Docker 安装 MySQL8 .0.30

1、查看可用的 MySQL 版本 访问 MySQL 镜像库地址: https://hub.docker.com/_/mysql?tabtags 。2、拉取 MySQL 8.0.30 镜像 拉取官方的指定版本的镜像: docker pull mysql:8.0.30[rootlocalhost deploy]# docker pull mysql:8.0.30 8.0.30: Pulling…

云小课|云小课教您如何选择Redis实例类型

阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击此处。 摘要:购买Redis实例时,实例类型有单机、主备、Pr…

公司新来一个同事,把网关系统设计的炉火纯青,万能通用,稳的一批。。

本文准备围绕七个点来讲网关,分别是网关的基本概念、网关设计思路、网关设计重点、流量网关、业务网关、常见网关对比,对基础概念熟悉的朋友可以根据目录查看自己感兴趣的部分。 什么是网关 网关,很多地方将网关比如成门, 没什么…

Casein-PEG-Rhodamine B 络蛋白-聚乙二醇-罗丹明B Casein-RB

产品名称:络蛋白-聚乙二醇-罗丹明B 英文名称:Casein-PEG-Rhodamine B 质量控制:95% 原料分散系数PDI:≤1.05 存储条件:-20C,避光,避湿 用 途:仅供科研实验使用,不用于诊…

全波形反演的深度学习方法: 第三章 常规反演

本章介绍反演的基础知识, 以及工程中的常规反演. 仅供内部培训. 3.1 地震数据采集 地震勘探中常使用人工激发的振动进行数据采集. 相应装置包括: 激发器是产生震动的装置, 如炸药, 地震车 (撞击地面). 在城市道路等具有车辆会产生振动的地方, 也可以不安装这类装置;地震检波…

【Linux】高频指令及简单的vim使用(0基础带你快速入门)

目录 一、目录操作指令 1.1、ls 1.2、pwd 1.3、cd 1.4、touch 1.5、cat 1.6、echo 1.7、mkdir 1.8、rm 1.9、mv 1.10、cp 二、Linux中如何手动安装插件 三、vim 3.1、打开文件 3.2、编辑文件 3.3、保存退出 一、目录操作指令 1.1、ls 语法: 第一种&#…

Android中简单使用aspectj

Android中简单使用aspectj 前言: 面向切面编程(AOP是Aspect Oriented Program的首字母缩写),这种在运行时,动态地将代码切入到类的指定方法、指定位置上的编程思想就是面向切面的编程. 1.简介: 在Android中使用注解…

onnx删除无用属性

这里写自定义目录标题在推理onnx模型时,报了一个错,如下:InvalidGraph: [ONNXRuntimeError] : 10 : INVALID_GRAPH : This is an invalid model. In Node, ("Conv_0", Conv, "", -1) : ("x": tensor(float),&q…

xxljob

分为调度中心 执行器 调度中心:提供可视化界面,配置定时任务,定时去调用执行器 调度中心执行器管理:每个springboot作为执行器, 也就是执行器的标识 任务管理:选中执行器,创建改该执行器下的任…

c++ - 第15节 - 二叉树进阶

1. 二叉搜索树 1.1.二叉搜索树概念 二叉搜索树又称二叉排序树,它或者是一棵空树,或者是具有以下性质的二叉树: 若它的左子树不为空,则左子树上所有节点的值都小于根节点的值若它的右子树不为空,则右子树上所有节点的值都大于根节…

iphone怎么传数据到另一个手机,苹果如何转移数据到新手机,两台iphone怎么同步所有数据

换新手机后,需要迁移旧苹果手机的数据到新苹果手机里面,那么,iphone怎么传数据到另一个手机?本篇文章带您深度了解苹果手机的数据传输技巧。 方法一、通过“快速开始”传输数据 苹果手机如何数据传输?我记得之前换 iP…

沉睡者IT - Web3的未来在哪里?

欢迎关注沉睡者IT,点上面关注我 ↑ ↑ 专家说,web3将颠覆现在的互联网 今天我们来讨论一下,web3会颠覆现在的互联网呢? 看了小编往期的作品你应该知道,如果同样的作品发在web3平台上,你将获取到收益。 那…

Codeforces Round #290 (Div. 2) C. Fox And Names

翻译: Fox Ciel将发表一篇关于FOCS (Fox操作的计算机系统,发音:“Fox”)的论文。她听到一个谣言:报纸上的作者名单总是按照词典顺序排列的。 在查看了一些例子后,她发现有时这不是真的。在一些论文中,作者的名字没有按照正常意义…

干货 | 提前在开发阶段暴露代码问题,携程Alchemy代码质量平台

作者简介Lyan,携程资深后端开发工程师,负责自动化测试框架及平台类工具开发,关注Devops、研发效能领域。一、背景随着敏捷开发,DevOps开发模式的流行,代码质量分析作为研发质量保证体系的重要组成部分,不仅…

DCDC--Burst Mode和Pulse Skipping Mode

1、Burst Mode和Pulse Skipping Mode(PSM)的区别 Burst Mode ≠ Pulse Skipping Mode,论坛有人认为Burst Mode就是Pulse Skipping Mode,这是不对的。 以LTC3624为例: Burst Mode operation provides the highest ef…

(一)DepthAI-python相关接口:OAK Device

消息快播:OpenCV众筹了一款ROS2机器人rae,开源、功能强、上手简单。来瞅瞅~ 编辑:OAK中国 首发:oakchina.cn 喜欢的话,请多多👍⭐️✍ 内容可能会不定期更新,官网内容都是最新的,请查…