京东网站爬取 华为手机的 评论 以词云的方式运行

news/2024/5/14 9:06:01/文章来源:https://blog.csdn.net/qhy521qhy/article/details/86095719

相关的包

import pymysql
import pymysql
from wordcloud import WordCloud
import jieba
import pygal

1 从数据库把所有用户评论查出

def get_comments():
# 连接数据库
# 读表 连接的mysql 数据库,
mysql_con= pymysql.connect(host=‘127.0.0.1’,
port=3306,
user=‘root’,
password=‘密码’,
db=‘表名’,
charset=‘utf8mb4’,
cursorclass=pymysql.cursors.DictCursor
)
cursor = mysql_con.cursor()
sql=""“select content,product_color from jd.comment”""
cursor.execute(sql)
result = cursor.fetchall()
print(result)
# process_comments(result)
color_r(result)

# select content from
# return [{},{}]

def process_comments(result):
# 所有用户评论拼成一个长字符串
word_list=[]
for re in result:
res = re[‘content’]
# print(res)
word_list.append(res)
comment = ’ '.join(word_list)
# print(comment)
list = jieba.cut(comment, cut_all=False)
req = ‘/’.join(list)
# print(req)
word_cloud(req)
# return ‘’

def color_r(result):
list = [ ]
for color in result:
color_s = color[‘product_color’]
list.append(color_s)
list_color = ‘/’.join(list)
# print(list_color)
content(list_color)

def content(list_color):
s = list_color
golden = s.count(‘金色’)/2
gray = s.count(‘深空灰色’)/2
silver = s.count(‘银色’)/2
s = golden + gray + silver
print(s)
print(golden,gray,silver)
gen_pei(golden,gray,silver)
# print(golden)

def cut_word(string):
# 分词 ,返回wordcloud包使用的格式

# string
# ['手机', '好', '质量', '手机']# return '手机 好 质量 手机'
print('正在计算分词,可能需要秒数。。。。')

def word_cloud(rep):
# 生成词云,保存到本地
string=rep
font = ‘C:\Windows\Fonts\msyhbd.ttc’
wc = WordCloud(
font_path=font,
background_color=‘white’,
width=1920,
height=1080,
).generate(string)
wc.to_file(‘京东评价.png’)
# gen_pei()
# return None

def gen_pei(golden,gray,silver):
# 生成饼状图
# select count() group by
# 本地生成饼状图
pie_chart = pygal.Pie()
pie_chart.title = ‘京东华为手机销售颜色数量’
pie_chart.add(‘金色’, golden)
pie_chart.add(‘深空灰色’, gray)
pie_chart.add(‘银色’, silver)
pie_chart.render_to_file(‘1bar.svg’)
if name == ‘main’:
get_comments()

运行出来的词云。 在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_884152.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

不得不看的五个堪称神器的在线网站工具

需求多了,要下载的软件也就变多了。对于内存不多的人儿来说,用一个工具就下一个软件真的是很难。好在有一些好用的网页工具,为低内存的人解决一世纪难题。本文整理了5个在线神器,快来get! MindMaster在线思维导图 在线…

html页面中调用指定浏览器并访问指定网站(或者调用指定exe程序【类似于网页版百度网盘启用本地百度网盘终端程序】)

html页面中调用指定浏览器并访问指定网站(或者调用指定exe程序【类似于网页版百度网盘启用本地百度网盘终端程序】 一、业务需求二、思路扩展三、实现过程 一、业务需求 在某个页面中点播视频,因为兼容性问题必须由IE浏览器点播,因此当用户通…

淘宝网站的架构演进

基本概念 在介绍架构之前,为了避免部分读者对架构设计中的一些概念不了解,下面对几个最基础的概念进行介绍。 1)什么是分布式? 系统中的多个模块在不同服务器上部署,即可称为分布式系统,如Tomcat和数据库分…

推荐一个不错的在线文档分享网站-Scribd,陆续分享我的电子藏书

无意中发现一个不错的网站,和大家分享。网址是www.scribd.com,界面是英文的。Scribd 是一个在线文档上传以及分享的社区;它允许用户上传 .pdf, .doc, .ppt, .xls, .txt 等多种格式的文档文件,并以Slideshow的形式展示给用户&#…

网站架构之缓存应用(1)概念篇

网站缓存这个话题并不新颖,但是能否将它用好,可是一门学问,同一件工具在不同人的手中会做出不同的事情来。这里我来分享总结下我对于网站架构中缓存应用的一些看法和经验,大家有好的想法可以补充。 第一:缓存…

大型网站架构演变和知识体系

之前也有一些介绍大型网站架构演变的文章,例如LiveJournal的、ebay的,都是非常值得参考的,不过感觉他们讲的更多的是每次演变的结果,而没有很详细的讲为什么需要做这样的演变,再加上近来感觉有不少同学都很难明白为什么…

Asp.Net 网站优化 数据库优化措施 使用主从库(上)

网站规模到了一定程度之后,该分的也分了,该优化的也做了优化,但是还是不能满足业务上对性能的要求;这时候我们可以考虑使用主从库。 主从库是两台服务器上的两个数据库,主库以最快的速度做增删改操作最新数据的查询操…

51la网站计数器

时间没有等我,可是我发现我自己在等自己 不知什么时候,我突然发现,最近我好像一直在停滞不前,我不能这样了 要找到从前的我,慢慢的静下心来开始学习吧。 弄了一个网站计数的东东放在下面,也计数一下自己的博…

网站优化:测试网站速度的8款免费工具推荐

网站的加载速度是决定网站成败的重要因素,值得站长特别关注。原因很简单,没有人愿意为了打开一个网页而等老半天,换句话说,如果你的网站打开速度很慢,将流失大量的访客,甚至出现多米诺效应的不良影响&#…

快速用Discuz搭建论坛网站教程

Discuz! 是全球成熟度最高、覆盖率最大的论坛软件系统之一。自 2001 年 6 月面世以来,Discuz! 已拥有 15 年以上的应用历史和 200 多万网站用户案例。目前,Discuz! 已经发展成为一个以社区为基础的专业建站平台,让论坛(BBS&#x…

几个简单步骤可以提高网站浏览体验

STEP 1确定网站定位 你的网站定位是要以企业形象官网为主,或是以单纯贩售商品的购物网站,还是要跟使用者做互动活动的网站? 每个网站的目的都不尽相同,形象官网,可能需要着重于品牌理念、品牌故事、公司介绍等等&#…

中小企业怎么选择适合自己的网站建设公司_企业全网营销怎么做

做营销推广接近8年的时间,在这个过程中,经常会和一些企业站长和老板交流;很多时候老板都是在关注我的网站关键词排名怎么能够快速上首页,有没有好的方法,站长主要关注的是文章内容怎么写,怎么原创&#xff…

【全套攻略】关于建站、服务器、云虚拟主机你想知道的都在这里!

将普惠进行到底!全民云计算,云服务器30/月 共享虚拟主机普惠版,特价6元/年 学生专享 | 云翼计划1折特惠,9.9/月 9款企业免费套餐,最长6个月免费使用 除了特惠大礼包,还为大家准备了建站全套攻略。在建站这条…

一步搭建phpwind网站

首先我们把服务器停止,然后更换系统盘 选择我们的网站phpwind 在安全组配置添加80端口 打开网页安装即可 阅读原文 转载于:https://my.oschina.net/u/3471671/blog/914753

帮程序员减压放松的10个良心网站

阅读全文 程序员们工作之余,不妨放下微博跟朋友圈,今天推荐的网站,利用代入感强的图片与音频,迅速帮你抹平焦虑,获得平和心态,特别献需求改千遍的程序员们。 1.Calm 这是同类型中最火的网站了,站…

真材实料的分布式资料-试读《大型分布式网站架构设计与实践》有感

读后感 逐字逐句看完《大型分布式网站架构设计与实践》第2章,意犹未尽!如标题所言,这是一本“真材实料的分布式资料”,它与我看过的分布式书籍(如《大型网站系统与Java中间件实践》)不同,本书重…

我的V360i手机软件、游戏以及手机网站等

我的V360i手机软件、游戏以及手机网站等 作者:辛晶晶 日期:2006-11-27 字体大小: 小 中 大 在手机论坛下载了几个软件和游戏移动英汉双向词典、列车时刻表;打砖块、极品飞车2、雷电、泡泡龙、连连看。下载地址http://xjj.name/download/打砖块.rar http://xjj.name…

网站性能优化实战—从12.67s到1.06s的故事

本文是对之前同名文章的修正,将所有webpack3的内容更新为webpack4,以及加入了笔者近期在公司工作中学习到的自动化思想,对文章内容作了进一步提升。 0.引言 作为互联网项目,最重要的便是用户体验。在举国“互联网”的热潮中&…

一些实用的前端框架网站分享

使用前端web框架以及插件说明 2.1选择前端web框架,我找了很多框架,以前学过自学过bootstrap觉得对于没有前端web设计经验的我来说很方便,就在极客学院自学了前端,然后找了一些相关的前端免费教程看了一下,慕课网也有部…

为什么有的网站需要做CDN加速呢?

现在,越来越多的用户建站购买云服务器时,都会额外的购买CDN加速,网站使用CDN加速已经逐渐成为一种新的趋势。那么,为什么有的网站要使用CDN加速?CDN加速有什么作用呢?解决这个问题,我们需要先了…