Python实现基于用户投诉信息的知识图谱构建

news/2024/4/20 17:12:27/文章来源:https://blog.csdn.net/newlw/article/details/127150262

目录
摘要 1
Abstract 2
前言 3
第一章 概述 4
1.1引言 4
1.2 课题的主要任务和目标 4
1.3本文的组织 4
第二章 相关技术背景 6
2.1 知识图谱 6
2.2文本情感分析 6
第三章 数据整理和算法设计 8
3.1数据的清洗 8
3.2中文分词 9
3.3停用词处理 10
3.4知识图谱提取设计 10
3.5本章小结 11
第四章 实验设计分析和评估 12
4.1实验设计 12
4.2实验结果分析 20
4.3实验评估 25
4.4本章小结 25
第五章 总结和展望 27
5.1课题总结 27
5.2课题展望 27
参考文献 29
致谢 30

本文首先介绍课题的内容,任务,以及目标。接着,本文介绍课题的技术背景:第一是知识图谱的技术背景;第二是文本情感分析的技术背景。随后本文介绍搭建基于投诉文本的知识图谱的数据整理算法以及知识图谱提取算法。接下来,根据这些算法,并且结合诸如Beautiful Soup、jieba分词、matplotlib等等工具进行具体的实验,取得了预期的实验效果。
文本情感分析又被称为意见挖掘[5],是指对存在主观情感倾向的文本进行情感分析和提取的过程。文本情感分析技术一般被用来做网络营销、企业舆情监控、政府舆论监控等等用途。一般来讲,文本情感分析技术可以划分成几个子任务,首先是提取给定文本的主题。接着是确定陈述者主体,然后是提取该主体的陈述的主观性语句,过滤那些客观性语句。最后是对他的情感倾向进行判断分析。根据给定文本的粒度不同,可以将文本情感分析划分为词汇级,语句级,篇章级,以及海量数据级。本文转载自http://www.biyezuopin.vip/onews.asp?id=14606针对海量数据级,随着互联网的发展,网络的各个平台都存在“网络水军”,他们所陈述的意见往往都是不真实的,可能会对最终结果造成较大影响。因此需要首先根据噪声的特征进行数据清洗。
常见的文本情感分析方法有:(1)基于机器学习的技术,比如支持向量机等等。(2)基于词典的方法,即对一个新出现的词,根据词典中相似词对其进行情感倾向推理。目前,中文的文本情感分析还存在一些挑战,具体在:(1),效果良好的英文文本情感分析技术无法在中文文本上获得相同效果。(2),不同语境下的情感分析技术效果不佳,等等。随着智能手机的火热以及诸如微博这类信息发布和分享平台的发展,短文本的情感分析将会越来越受到人们的重视。

import tkinter as tk
from tkinter import *
file=open("../text/实体关联排序.txt",'r',encoding='UTF-8')
dic={}#存放数据的字典
line=file.readline()
while(line):text=line.strip('\n')dic[(text.split()[0],text.split()[1])]=text.split()[2]line=file.readline()
print(len(dic))
delete=['客户']
def searchEntity(text):for i in dic:if text==str(i[0]) and str(i[1]) not in delete:print(str(i[1]))strvar.set(str(i[1]))returnelif text==str(i[1]) and str(i[0]) not in delete:print(str(i[0]))strvar.set(str(i[0]))return;print("NONE")strvar.set("NONE")
def button():t=search.get()searchEntity(t)
def labelClear():t=search.get()gui=tk.Tk()
gui.title('基于投诉文本的知识图谱')
gui.geometry('500x300+700+300')
search=tk.Entry(gui)
go=tk.Button(gui,text='GO',command=button)
clear=tk.Button(gui,text='CLEAR',command=labelClear)
strvar=StringVar()
strvar.set("")
label=tk.Label(gui,textvariable=strvar)
search.pack()
go.pack()
label.pack(padx=5, pady=80)
gui.mainloop()
file.close()#物业 :没人  机动车:机动车道  交警:交管

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_395769.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

树莓派cm4 ioboard配置虚拟网卡、静态ip、dhcp服务

文章目录1、虚拟网卡配置2、Windows PC 连接测试3、静态ip配置4、dhcp服务树莓派cm4 iobard,可经过配置将树莓派当作一个usb网卡设备,使用usb即可与树莓派进行网络通信。 1、虚拟网卡配置 修改配置文件,将树莓派usb slave配置为网卡设备lin…

TEE OS中断篇(三):中断的向量表

REE侧、TEE侧以及Monitor模式或EL3都可接收中断信号。 在系统中存在两个VBAR寄存器和一个MVBAR寄存器,REE侧的VBAR寄存器中存放的是Linux内核的异常向量表基地址,OP-TEE中的VBAR寄存器存放的是OP-TEE系统的中断向量表基地址,而Monitor或者EL…

android 项目编译报错 符号: 类 shape 位置: 程序包 android.widget

错误 android 项目编译报错 符号: 类 shape 位置: 程序包 android.widget 详细错误 Compiling with JDK Java compiler API. D:\AndroidProjects\ElectronicMall\app\build\generated\data_binding_base_class_source_out\debug\out\com\example\electronicmall\databinding…

keystone变换

文章目录 前言 一、信号模型 1.1 接收信号 1.2 距离脉压 1.3 脉压信号的距离频域方位时域表示 1.4 keystone变换 二、仿真分析 2.1 仿真参数 2.2 仿真结果 总结 前言 在对运动目标进行一维距离成像时 ,目标的运动会造成距离脉压后的距离曲线发生徙动现象&#xff0c…

[C++11 多线程同步] --- 线程同步概述

1 线程调度的几个基本知识点 多线程并发执行时有很多同学捋不清楚调度的随机性会导致哪些问题,要知道如果访问临界资源不加锁会导致一些突发情况发生甚至死锁。 关于线程调度,需要深刻了解以下几个基础知识点: 调度的最小单位是轻量级进程…

移动接入及核心网与移动回传网无信息交互,造成资源浪费

芯片处理能力、终端能力增强 随着智能终端的普及和用户需求的不断发掘,终端芯片和能力都有了飞 速的发展。从 3GPP 的标准化历程来看,终端可以支持的频带数组合增多、 物理层功能不断增强、支持的特性极速增长,当然也伴随着计算存储资源的 叠…

网络规划与部署—ACL命名实验

作者简介:一名在校计算机学生、每天分享网络运维的学习经验、和学习笔记。 座右铭:低头赶路,敬事如仪 个人主页:网络豆的主页​​​​​​ 目录 前言 一.命名ACL 二.标准命名的配置命令 三.ACL命名实验 1.实验要求 2.配置…

部署Apache Flink伪集群

一、准备Apache Flink运行环境 为了运行Flink,只需提前安装好 Java 11。你可以通过以下命令来检查 Java 是否已经安装正确。 1.1 Java 11下载 下载地址:https://www.oracle.com/java/technologies/downloads/#java11 1.2 Java 11安装 sudo rpm -i jdk-11.0.16.1_linux-x6…

大厂SQL题2-多表关联、转化率、打标签

一、红包流向 1.1 某表数据中不在另一个表中出现过的比例 红包发送方用户的基本信息缺失率有多高?(即有多少红包发送方用户无法在用户基本信息表中匹配?) 筛选出相关字段–左连接–不出现的即会为空—用count(1&…

Codeforces Round #785 (Div. 2)

A. Subtle Substring Subtraction 题目链接:Problem - A - Codeforces 样例输入: 5 aba abc cba n codeforces样例输出: Alice 2 Alice 4 Alice 4 Bob 14 Alice 93题意:给定一个长度为n的字符串,然后Alice和Bob轮流…

【JavaDS】浅谈集合LinkedList的使用

✨博客主页: XIN-XIANG荣 ✨系列专栏:【Java实现数据结构】 ✨一句短话: 难在坚持,贵在坚持,成在坚持! 文章目录一. 什么是LinkedList?二. LinkedList的使用1. 构造方法2. 常用方法3. LinkedList的遍历三. ArrayList和LinkedList的区别一. 什么是LinkedList? LinkedList的底…

什么是虚拟计算机集群

这个问题来自近期几位网友的私信,他们不约而同问到一个问题:什么是虚拟计算机集群?Laxcus分布式操作系统是如何做的?下面就正式回答一下这个问题。 在我们传统的认知里,或者大家平常比较多接触的,都…

Linux基本使用

文章目录一.Linux的安装1.Linux系统的安装方式2.网卡设置3.安装SSH连接工具4.Linux和Windows目录对比二.Linux命令1.Linux常用命令2.文件目录操作命令三.软件安装1.软件安装方式一.Linux的安装 1.Linux系统的安装方式 (1)物理机安装:直接将…

NVMe系列专题之六:电源管理

NVMe协议其中有一项优势,就是低功耗!为了达成这个目标,NVMe中加入了自动电源状态转换和动态电源管理机制。 先来看一下NVMe Spec中对动态电源管理的描述图: 1. Host设定性能和功耗: Power Objective和Performance Objective。 2. Host通知Controller更改设备的power state。…

tf.pad()

参考 tf.pad - 云社区 - 腾讯云 tf.pad(tensor,paddings,modeCONSTANT,nameNone,constant_values0 )pad一个张量。 这个操作根据指定的paddings填充一个tensor。padding是一个形状为[n, 2]的整数张量,其中n是张量的秩。对于输入的每个维度D,paddings[D, …

Python数据分析之单变量分析

0 引言 在数据分析或者机器学习过程中,我们需要对变量或者特征进行分析,在分析过程中,一般都会分为两种:单变量分析、双变量分析。今天,土豆简单介绍一下单变量分析,单变量分析主要对单个变量或者特征进行…

基金入门笔记

什么是基金 基金概念【fund】为了某种目的设立的具有一定规模的资金(保险金、公积金也可以理解为其中的一种)但是平常说的指的是证券投资基金。证券包含债券 股票和期货。而证券投资基金是由基金公司 保险工资或者银行推出的 从众多投资者处募集巨额资金…

【易购管理系统】导航折叠效果

在el-menu中添加 v-model“isCollapse” <el-menu router"true"default-active"/"class"el-menu-vertical-demo"background-color"#545c64"text-color"#fff"active-text-color"#ffd04b"v-model"isCollap…

[Java]通过反射获取运行时类的对象及其内部结构

文章目录1. 创建运行时类的对象2. 体会反射的动态性3. 通过反射获取运行时类的结构3.1 用于测试的类的准备3.2 获取运行时类的属性3.2.1 getFields()3.2.2 getDeclaredField()3.2.3 获取属性的结构3.3 获取运行时类的方法3.3.1 getMethods()3.3.2 getDeclaredMethods()3.3.3 获…

美食篇:大闸蟹与梭子蟹的区别

文章目录大闸蟹梭子蟹区别总结吃蟹子的季节大闸蟹 梭子蟹 区别总结 大闸蟹香&#xff0c;小&#xff0c;有黄 梭子蟹鲜&#xff0c;大&#xff0c;无黄 小的梭子蟹也有黄&#xff0c;小的便宜 总结&#xff1a;浓缩的都是精华&#xff01;个头大的不一定好吃&#xff0c;但一…