【实践】python 提取网站里面的汉字

news/2024/5/10 4:41:43/文章来源:https://blog.csdn.net/TaiBai_435_/article/details/122096537

提取网站里面的汉字

 1、引入模块 requests(用于获取网站上的数据);json(用于解析json数据)

# coding=utf-8
import requests as r
import json

2、写入到txt  a+作为追加,不清空之前的数据

txt = open("data.txt", 'a+')

3、提取地址里面的数据到列表中

url = #url
_json = json.loads(r.get(url).text)
data = _json['data']
text = data['text']

4、之所以分到两个列表,是因为text这个列表是有规律的,可以循环输入

5、输入到txt中

print(data['title'], file=txt)
print(data['abstract'], file=txt)
print(data['sitename'], file=txt)
print(data['author_name'], file=txt)
print(data['key'], file=txt)
print(data['type'], file=txt)
print(data['author_text'], file=txt)
print(data['sitename'], file=txt)
print(data['site_author'], file=txt)for item in range(0,7):print(text[item]['content'],file=txt)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_905359.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Struts,MVC 的一种开放源码实现用这种servlet和JSP框架管理复杂的大型网站

(转载自IBM developerWorks中国网站 java 专区,http://www-900.ibm.com/developerWorks/java/j-struts/index.shtml) Malcolm Davis顾问2001 年 2 月 内容: 简介 JSP 就是 servlet 别在我的 HTML 中使用太多的 Java MVC MVC Model 2 Struts 详细分析 Struts 邮件列表…

Struts,MVC 的一种开放源码实现用这种servlet和JSP框架管理复杂的大型网站

(转载自IBM developerWorks中国网站 java 专区,http://www-900.ibm.com/developerWorks/java/j-struts/index.shtml) Malcolm Davis顾问2001 年 2 月 内容: 简介 JSP 就是 servlet 别在我的 HTML 中使用太多的 Java MVC MVC Model 2 Struts 详细分析 Struts 邮件列表…

Struts,MVC 的一种开放源码实现用这种servlet和JSP框架管理复杂的大型网站

(转载自IBM developerWorks中国网站 java 专区,http://www-900.ibm.com/developerWorks/java/j-struts/index.shtml) Malcolm Davis顾问2001 年 2 月 内容: 简介 JSP 就是 servlet 别在我的 HTML 中使用太多的 Java MVC MVC Model 2 Struts 详细分析 Struts 邮件列表…

哪些权重7权重8的网站怎么做的!我的站就是这么做的!轻量级泛目录无需数据库适合所有网站所有cms只需要放在根目录即可

如题:哪些权重7 权重8的站都是怎么做上来的! 疫情期间大家都不好赚钱,出不了门,我偶尔让朋友看了一下我的站! 他也想做网站了,然后问我要插件!先上图 https://www.bilibili.com/video/BV1me41…

SEO,关键词扩充,文章自动生成,相关说明教程

比如说你的文章标题是:怎么写好一篇作文(好作文怎么写) ​ 编辑切换为居中 添加图片注释,不超过 140 字(可选) 通过插件获取标题然后 获得更多相关词 ​ 编辑切换为居中 添加图片注释,不超…

趋势迷-趋势网-网站源码打包下载源码开源无需数据库qushimi.com

趋势迷 趋势网 网站源码是一个php开发的程序! 全站无需数据库! 添加一点关键词即可甩手! 现 整站打包 开源无加密 无授权! 无论是 学习 还是运营 养站 都适合!!!! 直接服务器 打…

2022个人博客网站搭建笔记

历时11天我的第一个博客网站上线了。作为一个善于“反思”的中国人,当然要给自己来一把复盘和总结了。然后这篇笔记我就鸽了好几天,嘤嘤嘤。 www.ganggangfalcon.xyz 其实说实话,博客网站的搭建难度不大,比较耗时的地方在于网站的…

如何实现“Ipv6网站在线检测工具”

随着IPv6的普及,很多网站已经支持IPv6的访问,我们公司很多客户就要求网站支持IPv6,我们目前是推荐客户使用阿里云的IPv6的产品来实现。但是客户问题就来了,怎么检测网站支持IPv6访问呢,目前我们使用国家IPv6发展检测平…

如何用个人电脑利用ipv6搭建网站

如何用个人电脑利用ipv6搭建网站 需要的工具写在前面的话第一步第二步 需要的工具 一台拥有ipv6地址的个人电脑(Windows版) 没啦 ^ - ^ 写在前面的话 小白文章,请大佬指正 随着现在ipv6技术的普及,越来越多的电脑,…

本地做个注册会员的网站(非网络

做网站,先得有工具.我用的是Adobe DreamWeaver CS6. 做数据库表格,也得有工具,我用的是Microsoft Access 2007 做上面两者的连接,用的是DSP 还有自己的服务器IIS~~好吧不是6.0..系统自带的OJZ 第一步:建表 打开Access. 然后就按下图的1,2,3来操作 创建完之后,在菜单找到【…

2018年最新 Java实战开发今日头条资讯网站

课程目录 第1节 开发工具和Java语言介绍 主要介绍项目所需要的开发工具,并且会简单回顾这个项目所用到的语言-java,语法基础,控制流,数据结构,面向对象,异常,随机数等。 第2节 Spring入门和模板…

游戏网站博客

一、项目简介 1.1项目博客地址 https://blog.csdn.net/qq_16255439/article/details/103550399 1.2 项目完成的功能与特色 基于python语言,通过使用flask框架,pymysql,JS,CSS,html5,定义蓝图,蓝…

利用拼接字符串的方式来写一个简化版的后台网站(推荐初学者进)

今天用一般处理程序ashx做一个如下的效果, 主要是为了实现功能,界面丑就丑把。 先是显示界面DomeHandler.ashx public void ProcessRequest (HttpContext context) {context.Response.ContentType "text/html";StringBuilder sb new Strin…

asp打开网站原理

因为对如何请求网站的有疑问,所以查了一些资料并画了一张图进行分析。 在解释这张图之前,先了解一下以下相关知识: (1)内核模式:也可以叫管理员模式,主要运行底层的驱动和监视程序等&#xff0…

python 破解网站反爬虫的两种简单方法

最近在学爬虫时发现许多网站都有自己的反爬虫机制,这让我们没法直接对想要的数据进行爬取,于是了解这种反爬虫机制就会帮助我们找到解决方法。 常见的反爬虫机制有判别身份和IP限制两种,下面我们将一一来进行介绍。 目录 (一) 判别身份(二) …

python爬虫——通过API爬取动态网站的数据

加粗样式在我前面的博客中,通过利用python的requests库和BeautifulSoup库对静态网站进行爬取,但如果遇到动态网站怎么办呢?接下来我们试着通过API来对动态网站进行爬取想要的数据。 目录 (一) 动态网站和静态网站的区别与robots.txt(二) 爬取…

Android 自动抓取网站图标实现分享样式的定制

分享是一个app产生用户数据的重要来源,也是app宣传拉新的重要途径,所以对于稍微成熟一点的app分享是必不可少的模块。相信稍微接触过分享的人都清楚,分享到外部app很简单,只要接入微信、微博、QQ等提供好的sdk并按照规定好的参数正…

程序员命名必备网站|变量命名

程序员命名必备网站 话不多说,之间上网址 https://unbug.github.io/codelf/点击访问 方便又快捷啊兄弟们

浅谈web网站架构演变过程

前言 我们以 javaweb为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变。 该系统具备的功能: 用户模块:用户注册和管理商品模块:商品展示和管理交易模块:创建交易和管理 阶段一、单机构建网站…

网站行为日志信息统计分析

网站行为日志信息统计分析 一、开发环境二、项目思路三、系统实现(一)、原始数据上传hdfs(二)、数据清洗(第一遍)(三)、数据清洗(第二遍)(三)、通过hive对数据分析 四、总结五、完整代码:(一)、pom.xml文件(二)、初始数…