基于因果关系知识库的因果事件图谱构建、文本预处理、因果事件抽取、事件融合等

news/2024/3/29 23:46:51/文章来源:https://blog.csdn.net/sinat_39620217/article/details/131933118

在这里插入图片描述

项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域):汇总有意义的项目设计集合,助力新人快速实战掌握技能,助力用户更好利用 CSDN 平台,自主完成项目设计升级,提升自身的硬实力。

在这里插入图片描述

  1. 专栏订阅:项目大全提升自身的硬实力

  2. [专栏详细介绍:项目设计集合(人工智能方向):助力新人快速实战掌握技能、自主完成项目设计升级,提升自身的硬实力(不仅限NLP、知识图谱、计算机视觉等领域)

基于因果关系知识库的因果事件图谱构建

1.项目介绍

现实社会是个逻辑社会,大量的逻辑即逻辑经验存在于我们的脑海中,而这些逻辑经验是无法穷举出来的,靠大量人工的总结,显然不切实际。然而,幸好人类将这种逻辑用文字表达出来了,这为我们利用自然语言处理技术实现这种因果逻辑的抽取提供了可能性。不过,受限于自己的技术水平,目前还无法将深度学习这套高端的打发应用于因果事件抽取当中,而以构造和总结因果模板,结合中文语言特点,构建因果语言知识库的方式代替。
本项目是对因果事件抽取以及因果知识图谱构建的一种尝试。

2.技术路线

因果事件图谱技术流程上遵循以下流程:

主要包括以下几个步骤:
1、因果知识库的构建。因果知识库的构建包括因果连词库,结果词库、因果模式库等。
2、。这个包括对文本进行噪声移除,非关键信息去除等。
3、因果事件抽取。这个包括基于因果模式库的因果对抽取。
4、事件表示。这是整个因果图谱构建的核心问题,因为事件图谱本质上是联通的,如何选择一种恰当(短语、短句、句子主干)等方式很重要。
5、事件融合。事件融合跟知识图谱中的实体对齐任务很像
6、事件存储。事件存储是最后步骤,基于业务需求,可以用相应的数据库进行存储,比如图数据库等。

3.最终效果

经过以上几个流程之后,可以支持各类查询,比如已知原因找结果,已知结果找原因等,这都很有事情,总之,数据库有了,我们可以做的事情有很多,接下来就是我们脑洞的事情了。
接下来以以下几个事件在因果知识库中查询一把:
以上几个图展示了输入既定事件在数据库中相似的事件(一度),相似事件导致的结果(二度节点)。

3.1偷税漏税事件

3.2 美国攻打伊拉克事件

3.3 寿光发生洪水事件

4.代码展示

部分代码展示:

 '''1由果溯因配套式'''def ruler1(self, sentence):'''conm2:〈[之]所以,因为〉、〈[之]所以,由于〉、 <[之]所以,缘于〉conm2_model:<Conj>{Effect},<Conj>{Cause}'''datas = list()word_pairs =[['之?所以', '因为'], ['之?所以', '由于'], ['之?所以', '缘于']]for word in word_pairs:pattern = re.compile(r'\s?(%s)/[p|c]+\s(.*)(%s)/[p|c]+\s(.*)' % (word[0], word[1]))result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][0] + '-' + result[0][2]data['cause'] = result[0][3]data['effect'] = result[0][1]datas.append(data)if datas:return datas[0]else:return {}'''2由因到果配套式'''def ruler2(self, sentence):'''conm1:〈因为,从而〉、〈因为,为此〉、〈既[然],所以〉、〈因为,为此〉、〈由于,为此〉、〈只有|除非,才〉、〈由于,以至[于]>、〈既[然],却>、〈如果,那么|则〉、<由于,从而〉、<既[然],就〉、〈既[然],因此〉、〈如果,就〉、〈只要,就〉〈因为,所以〉、 <由于,于是〉、〈因为,因此〉、<由于,故〉、 〈因为,以致[于]〉、〈因为,因而〉、〈由于,因此〉、<因为,于是〉、〈由于,致使〉、〈因为,致使〉、〈由于,以致[于] >〈因为,故〉、〈因[为],以至[于]>,〈由于,所以〉、〈因为,故而〉、〈由于,因而〉conm1_model:<Conj>{Cause}, <Conj>{Effect}'''datas = list()word_pairs =[['因为', '从而'], ['因为', '为此'], ['既然?', '所以'],['因为', '为此'], ['由于', '为此'], ['除非', '才'],['只有', '才'], ['由于', '以至于?'], ['既然?', '却'],['如果', '那么'], ['如果', '则'], ['由于', '从而'],['既然?', '就'], ['既然?', '因此'], ['如果', '就'],['只要', '就'], ['因为', '所以'], ['由于', '于是'],['因为', '因此'], ['由于', '故'], ['因为', '以致于?'],['因为', '以致'], ['因为', '因而'], ['由于', '因此'],['因为', '于是'], ['由于', '致使'], ['因为', '致使'],['由于', '以致于?'], ['因为', '故'], ['因为?', '以至于?'],['由于', '所以'], ['因为', '故而'], ['由于', '因而']]for word in word_pairs:pattern = re.compile(r'\s?(%s)/[p|c]+\s(.*)(%s)/[p|c]+\s(.*)' % (word[0], word[1]))result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][0] + '-' + result[0][2]data['cause'] = result[0][1]data['effect'] = result[0][3]datas.append(data)if datas:return datas[0]else:return {}'''3由因到果居中式明确'''def ruler3(self, sentence):'''cons2:于是、所以、故、致使、以致[于]、因此、以至[于]、从而、因而cons2_model:{Cause},<Conj...>{Effect}'''pattern = re.compile(r'(.*)[,,]+.*(于是|所以|故|致使|以致于?|因此|以至于?|从而|因而)/[p|c]+\s(.*)')result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][1]data['cause'] = result[0][0]data['effect'] = result[0][2]return data'''4由因到果居中式精确'''def ruler4(self, sentence):'''verb1:牵动、导向、使动、导致、勾起、引入、指引、使、予以、产生、促成、造成、引导、造就、促使、酿成、引发、渗透、促进、引起、诱导、引来、促发、引致、诱发、推进、诱致、推动、招致、影响、致使、滋生、归于、作用、使得、决定、攸关、令人、引出、浸染、带来、挟带、触发、关系、渗入、诱惑、波及、诱使verb1_model:{Cause},<Verb|Adverb...>{Effect}'''pattern = re.compile(r'(.*)\s+(牵动|已致|导向|使动|导致|勾起|引入|指引|使|予以|产生|促成|造成|引导|造就|促使|酿成|引发|渗透|促进|引起|诱导|引来|促发|引致|诱发|推进|诱致|推动|招致|影响|致使|滋生|归于|作用|使得|决定|攸关|令人|引出|浸染|带来|挟带|触发|关系|渗入|诱惑|波及|诱使)/[d|v]+\s(.*)')result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][1]data['cause'] = result[0][0]data['effect'] = result[0][2]return data'''5由因到果前端式模糊'''def ruler5(self, sentence):'''prep:为了、依据、为、按照、因[为]、按、依赖、照、比、凭借、由于prep_model:<Prep...>{Cause},{Effect}'''pattern = re.compile(r'\s?(为了|依据|按照|因为|因|按|依赖|凭借|由于)/[p|c]+\s(.*)[,,]+(.*)')result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][0]data['cause'] = result[0][1]data['effect'] = result[0][2]return data'''6由因到果居中式模糊'''def ruler6(self, sentence):'''adverb:以免、以便、为此、才adverb_model:{Cause},<Verb|Adverb...>{Effect}'''pattern = re.compile(r'(.*)(以免|以便|为此|才)\s(.*)')result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][1]data['cause'] = result[0][0]data['effect'] = result[0][2]return data'''7由因到果前端式精确'''def ruler7(self, sentence):'''cons1:既[然]、因[为]、如果、由于、只要cons1_model:<Conj...>{Cause},{Effect}'''pattern = re.compile(r'\s?(既然?|因|因为|如果|由于|只要)/[p|c]+\s(.*)[,,]+(.*)')result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][0]data['cause'] = result[0][1]data['effect'] = result[0][2]return data'''8由果溯因居中式模糊'''def ruler8(self, sentence):'''3verb2:根源于、取决、来源于、出于、取决于、缘于、在于、出自、起源于、来自、发源于、发自、源于、根源于、立足[于]verb2_model:{Effect}<Prep...>{Cause}'''pattern = re.compile(r'(.*)(根源于|取决|来源于|出于|取决于|缘于|在于|出自|起源于|来自|发源于|发自|源于|根源于|立足|立足于)/[p|c]+\s(.*)')result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][1]data['cause'] = result[0][2]data['effect'] = result[0][0]return data'''9由果溯因居端式精确'''def ruler9(self, sentence):'''cons3:因为、由于cons3_model:{Effect}<Conj...>{Cause}'''pattern = re.compile(r'(.*)是?\s(因为|由于)/[p|c]+\s(.*)')result = pattern.findall(sentence)data = dict()if result:data['tag'] = result[0][1]data['cause'] = result[0][2]data['effect'] = result[0][0]return data

总结

1)基于规则这套,很实用,但问题不少,规则维护比较多
2)事件表示这块一定要好好想想啊
3)事件融合这块,利用各种相似度度量进行计算,都有一定缺陷

码源见文章顶部or文末

https://download.csdn.net/download/sinat_39620217/88000940

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_337260.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

IntersectionObserver实现小程序长列表优化

IntersectionObserver实现小程序长列表优化 关于 IntersectionObserver 思路 这里以一屏数据为单位【一个分页的10条数据&#xff0c;最好大于视口高度】&#xff0c; 监听每一屏数据和视口的相交比例&#xff0c;即用户能不能看到它 只将可视范围的数据渲染到页面上&#x…

基于注解的 SpringMVC

SpringMVC SpringMVC使用SpringMVC的两个配置EnableWebMVC 和 ACWACSpringMVC执行流程接收请求参数Postman 发包工具&#xff08;&#xff09;get 请求---简单类型数据&#xff08;基本数据类型和String&#xff09;get 请求---对象类型数据get 请求---数组类型get 请求 --- 集…

Codeforces Round 886 (Div. 4)F题解

文章目录 [We Were Both Children](https://codeforces.com/contest/1850/problem/F)问题建模问题分析1.分析到达的点与跳跃距离的关系2.方法1倍数法累计每个点所能达到的青蛙数代码 方法2试除法累计每个点能到达的青蛙数代码 We Were Both Children 问题建模 给定n个青蛙每次…

自动驾驶感知系统--惯性导航定位系统

惯性导航定位 惯性是所有质量体本身的基本属性&#xff0c;所以建立在牛顿定律基础上的惯性导航系统&#xff08;Inertial Navigation System,INS&#xff09;(简称惯导系统)不与外界发生任何光电联系&#xff0c;仅靠系统本身就能对车辆进行连续的三维定位和三维定向。卫星导…

前端框架学习-Vue(二)

最近在学习Vue框架&#xff0c;Vue中的内容很多。相当于把之前后端的MVC&#xff0c;V层转移到前端来编写和部署。下面是学习Vue时的大纲。 Vue生命周期是Vue应用的生命周期Vue脚手架&#xff0c;即vue-cli&#xff0c;使用node.js 来创建和启动vue项目Vue组件知识&#xff0c;…

Linux - PostgreSQL 适用于9.x 以上的 tar.gz 源码安装与理解 - 报错集锦

这里写目录标题 序言主要内容bash 配置文件个人理解关于初始化 PostgreSQL 数据库的理解 启动方法检查服务器是否在PostgreSQL中运行关闭 postgresql 数据库方法参考链接 序言 PostgreSQL 9.x 以下版本笔者没用过&#xff0c;具体操作看参考链接&#xff0c;笔者就不记录重复操…

深入解析Linux进程内存:VSS、RSS、PSS、USS及查看方式

VSS 虚拟耗用内存大小&#xff0c;是进程可以访问的所有虚拟内存的总量&#xff0c;包括进程独自占用的物理内存、和其他进程共享的内存、分配但未使用的内存。 RSS 驻留内存大小&#xff0c;是进程当前实际占用的物理内存大小&#xff0c;包括进程独自占用的物理内存、和其…

android app控制ros机器人三(android登录界面)

接下来是二次开发的具体环节了&#xff0c;由于存在用户需求&#xff0c;用到ros-mobile不多&#xff0c;更偏向于android开发。 用ppt画了简单的展示界面&#xff0c;与用后交流界面的功能布局。先开发一代简易版本的app&#xff0c;后续可以丰富完善。ctrlcv上线。 登录界面…

RK3566 android代码编译

一、搭建环境 所用的ubuntu系统之前已编译过linux代码&#xff0c;所以只需安装编译android所需的环境。 安装jdk-8 如果之前系统没有安装则执行以下命令安装&#xff1a; sudo apt-get install openjdk-8-jdk 查看当前系统是否有jdk-8 $ sudo update-alternatives --conf…

吃透《西瓜书》第三章 线性模型:对数几率回归

&#x1f349; 吃瓜系列 教材&#xff1a;《机器学习》 周志华著 &#x1f552;时间&#xff1a;2023/7/26 目录 一、对数几率回归 1.1 定义和基本思想 1.2 对数记录回归建模 1.3 广义线性模型 1.3.1 指数族分布 1.3.2 广义线性模型的三条假设 1.4 对数几率回归的广义线…

HTML一些基础知识

1、Web标准&#xff1a;主要包含结构、表现、行为。结构用于对网页元素进行整理和分类&#xff0c;主要指HTML。表现用于设置网页元素的板式、颜色、大小等外观样式&#xff0c;主要指的是CSS。行为主要指的是网页模型的定义以及交互的编写&#xff0c;主要是js文件。 Html相当…

kali Linux 工具 BurpSuite-暴力破解

关于渗透的实验&#xff0c;我们大多数能在kali的工具集找到&#xff0c;其中关于抓包工具BurpSuite的使用&#xff0c;我做一个比较简单的实验————————暴力破解—————————— 暴力破解&#xff0c;顾名思义&#xff0c;就是我们把密码一个个尝试&#xff0c;只…

【MySQL】索引特性

​&#x1f320; 作者&#xff1a;阿亮joy. &#x1f386;专栏&#xff1a;《零基础入门MySQL》 &#x1f387; 座右铭&#xff1a;每个优秀的人都有一段沉默的时光&#xff0c;那段时光是付出了很多努力却得不到结果的日子&#xff0c;我们把它叫做扎根 目录 &#x1f449;没…

ReID网络:MGN网络(1) - 概述

Start MGN 1. 序言 现代基于感知的信息中&#xff0c;视觉信息占了80~85%。基于视觉信息的处理和分析被应用到诸如安防、电力、汽车等领域。 以安防市场为例&#xff0c;早在2017年&#xff0c;行业咨询公司IHS Market&#xff0c;我国在公共和私人领域安装有摄像头约1.76亿…

docker启动容器报错

报错信息 [rootDream soft]# docker run -it -d -p 8080:8080 tomcat eec9fab6b9ca06d2bbf1467aef05d8020ee60448978e10ac20c38888934f0a0b docker: Error response from daemon: driver failed programming external connectivity on endpoint hungry_euclid (163242f0079e72…

数值分析第五章节 用Python实现解线性方程组的直接解法

参考书籍&#xff1a;数值分析 第五版 李庆杨 王能超 易大义编 第5章 解线性方程组的直接解法 文章声明&#xff1a;如有发现错误&#xff0c;欢迎批评指正 文章目录 引言与预备知识高斯消去法列主元消去法 矩阵三角分解法杜利特尔分解法平方根法 向量和矩阵的范数误差分析 引言…

Python 进阶(五):os 模块

❤️ 博客主页&#xff1a;水滴技术 &#x1f338; 订阅专栏&#xff1a;Python 入门核心技术 &#x1f680; 支持水滴&#xff1a;点赞&#x1f44d; 收藏⭐ 留言&#x1f4ac; 文章目录 1. 文件和目录的基本操作1.1 获取当前工作目录1.2 更改当前工作目录1.3 获取目录下所有…

qssh使用

到官网下载qssh的源码QSsh-botan-1&#xff0c;使用qtcreator打开后&#xff0c;直接编译&#xff0c;即可得到qssh的库 头文件将QSsh-botan-1\src\libs\ssh目录下的.h文件拷到include文件夹下&#xff0c;即为库头文件。 qssh有个问题&#xff0c;如果你将qssh的类放在子线程…

致敬图灵!HashData拥抱数据智能新时代!

图1&#xff1a;2023ACM中国图灵大会现场 生于1912年的艾伦图灵被称为“计算机科学之父”、“人工智能之父”。1966年&#xff0c;国际计算机协会&#xff08;ACM&#xff09;为了纪念这位卓越的科学家&#xff0c;设立了以其名字命名的ACM图灵奖&#xff0c;以表彰在计算机领…

MySQL | 常用命令示例

MySQL | 常用命令示例 一、启停MySQL数据库服务二、连接MySQL数据库三、创建和管理数据库四、创建和管理数据表五、数据备份和恢复六、查询与优化 MySQL是一款常用的关系型数据库管理系统&#xff0c;广泛应用于各个领域。在使用MySQL时&#xff0c;我们经常需要编写一些常用脚…