Python爬虫网站多页电影名和评论

news/2024/5/12 5:58:17/文章来源:https://blog.csdn.net/Swallow_shangtou/article/details/122470564

爬取豆瓣电影的电影数据,具体爬取的是电影名和被评论的内容

import requests
import re
for i in range(1,6):index=(i-1)*20url="https://movie.douban.com/review/best/?start={}".format(index)d={"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/96.0.4664.110 Safari/537.36",}resp=requests.get(url,headers=d)# print(resp.text)obj=re.compile(r'<div data-cid=.*?<h2><a href=.*?>(?P<name>.*?)</a></h2>.*? <p class=.*?剧透</p>(?P<comment>.*?)&nbsp;',re.S)result=obj.finditer(resp.text)for i in result:r=i.groupdict()r["comment"]=r["comment"].strip()print(r)

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_891401.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

互联网网站的架构演进

简单介绍了从单机网站到微服务网站的演进&#xff0c;从概念上讲述了什么是微服务。 资源链接https://www.slidestalk.com/s/internet_architecture_revolution 更多优质资源 (示说网&#xff09;点击登录即可免费下载

【网站可用性自动化监测】python+seleium

【网站可用性自动化监测】pythonseleium 前倾提要&#xff1a;做了网络安全后重保期间需要对用户系统每日进行监测&#xff0c;相关监测脚本网上其实也有很多&#xff0c;但能自己个性化做一下也挺好&#xff0c;太久没做小程序需要写下代码巩固。本次程序开发目的是重保期间每…

快速入门 Codeforces 算法比赛/练习 网站

Codeforces是一家为计算机编程爱好者提供在线评测系统的俄罗斯网站。同时也是广大ACM编程爱好者所喜爱&#xff0c;被使用的网站之一&#xff0c;但是有很多编程小白刚接触此类算法网站&#xff0c;不太熟悉如何使用&#xff0c;这里博主给出快速入门Codeforces的图文教程。 C…

浅谈web网站架构演变过程

前言 我们以javaweb为例&#xff0c;来搭建一个简单的电商系统&#xff0c;看看这个系统可以如何一步步演变。 该系统具备的功能&#xff1a; 用户模块&#xff1a;用户注册和管理商品模块&#xff1a;商品展示和管理交易模块&#xff1a;创建交易和管理 阶段一、单机构建网站…

nodejs 进行网站监听时 不用在cmd停止后重启 网页刷新就能改变页面内容的工具

一、nodejs的软件需求——supervisor 我们使用nodejs开启服务器时&#xff0c;我们会在cmd里输入node xxx.js进行开启服务器。 很多时候我们会根据页面的逻辑和对项目的要求&#xff0c;进行对xxx.js文件内容的修改&#xff0c;但这时如果我们修改内容后保存&#xff0c;我们…

Web2.0网站介绍——个性化主页服务网站

随着Web2.0网站的不断涌现&#xff0c;越来越多的用户希望自己使用的服务具有极高的可定制性&#xff0c;在这种需求下&#xff0c;出现了越来越多的个性化主页服务网站。这些个性化 主页服务具有极高的可定制性&#xff0c;并且提供很多个性化的功能可供选择&#xff0c;这里就…

大型网站架构演变和知识体系

之前也有一些介绍大型网站架构演变的文章&#xff0c;例如LiveJournal的、ebay的&#xff0c;都是非常值得参考的&#xff0c;不过感觉他们讲的更多的是每次演变的结果&#xff0c;而没有很详细的讲为什么需要做这样的演变&#xff0c;再加上近来感觉有不少同学都很难明白为什么…

百度SEO反推软件下载,反推是什么

2020最新百度SEO反推软件下载 使用反推技术&#xff0c;使你的网站秒引蜘蛛秒收录 使用说明&#xff1a; 1.导入链接&#xff0c;开头必须带http://&#xff0c;末尾必须带/&#xff0c;一行一条 2.导入你的百度账号COOKIE&#xff0c;一行一条 3.接入打码平台 4.即刻开启秒收…

百度SEO逆推技术软件下载,引蜘蛛秒收录

2020最新百度SEO逆推软件下载 使用逆推技术&#xff0c;使你的网站秒引蜘蛛秒收录 使用说明&#xff1a; 导入链接&#xff0c;开头必须带http://&#xff0c;末尾必须带/&#xff0c;一行一条导入你的百度账号COOKIE&#xff0c;一行一条接入打码平台即刻开启秒收录 逆推是…

百度SEO主动推送工具软件下载

百度SEO主动推送工具助手分享下载&#xff0c;可以挂机定时推送和生成链接推送 下载地址&#xff1a; 链接&#xff1a;https://www.lanzoui.com/b01horyih 密码&#xff1a;clrf

不是汽车之家太牛,而是其他网站太懒

汽车之家上市了&#xff0c;而且市值高达30亿美金&#xff0c;跌破了很多垂直网站的眼镜。一时之间网络上到处都在讨论汽车之家&#xff0c;不少垂直网站的老大问我&#xff1a;"秦刚&#xff0c;你99年就开始做垂直网站&#xff0c;操盘过太平洋电脑网&#xff0c;太平洋…

用Meta标签代码让360双核浏览器默认极速模式打开网站不是兼容模式(顺带解决很多兼容性问题)

浏览模式 极速模式、兼容模式及IE9高速模式是360浏览器显示网页时使用的三种模式&#xff1a; 表示极速模式 表示兼容模式 表示IE9/IE10模式&#xff08;仅在安装了IE9或IE10后可用&#xff09; 360极速浏览器会自动为您选择使用适合每个网站的浏览模式。所以&#xff0c;…

linux下网站目录权限如何设置?

网站目录权限如何设置不当很容易导致站点被挂马和被篡改&#xff0c;正确的目录权限设置应当遵循最小权限原则。比如对于网站的目录&#xff0c;一般给644权限即可&#xff0c;而文件夹设置为755权限即可。 以nginx服务为例&#xff0c;假设站点用户和用户组为www&…

Win下安装IIS后不能正常浏览asp脚本的网站-解决方法如下

转载&#xff1a; 在新灌的Windows 7中要使用IIS 7環境&#xff0c;並且要撰寫ASP程式&#xff0c;必須要先手動啟動一些設定值&#xff0c;因為Windows 7在安裝時&#xff0c;很多項目是預設沒有開啟的。 1.選取在控制台中的程[程式和功能]中的[開啟和關閉Windows功能]選項。 …

网站首页head区代码规范!

head区是指首页HTML代码的< head>和</ head>之间的内容。 1.公司版权注释 阅读 编辑 运行 复制 保存 <!-- The site is designed by Maketown,Inc 06/2000 --> <!-- The site is designed by Maketown,Inc 06/2000 --> 2.网页显示字符集 简体中文&am…

【特别推荐】学习 Web 开发技术的16个最佳教程网站和博客

【特别推荐】学习 Web 开发技术的16个最佳教程网站和博客 互联网经过这么多年的发展&#xff0c;已经出现了众多的 Web 开发技术&#xff0c;像 .Net/Java/PHP/Python/Ruby 等等。对于 Web 开发人员来说&#xff0c;不管是初学者还是有一定经验的开发人员都需要时刻学习新的开发…

全面介绍网站性能优化之数据库及服务器架构实现负载均衡等实用知识

这篇关于网站性能优化主要从[负载均衡、服务器架构、数据库扩展」的角度&#xff0c;提出一些性能优化的建议&#xff0c;以供有建设中大型网站需求的网友们作为参考。1、Web Server 与 DB Server 分离小型网站或 B/S 项目&#xff0c;因同时在线人数不多&#xff0c;尚可让同一…

说说大型高并发高负载网站的系统架构

鄙人在多年的工作中接触和开发过不少大中型网站的模块&#xff0c;因此在大型网站应对高负载和并发的解决方案上有一些积累和经验&#xff0c;希望和大家一起探讨。 一个小型的网站&#xff0c;比如个人网站&#xff0c;可以使用最简单的html静态页面就实现了&#xff0c;配合…

大型网站系统架构分析

千万级的注册用户&#xff0c;千万级的帖子&#xff0c;nTB级的附件&#xff0c;还有巨大的日访问量&#xff0c;大型网站采用什么系统架构保证性能和稳定性&#xff1f; 首先讨论一下大型网站需要注意和考虑的问题。 数据库海量数据处理&#xff1a;负载量不大的情况下selec…

高性能网站架构之缓存篇—Redis集群搭建

看过 高性能网站架构之缓存篇--Redis安装配置和高性能网站架构之缓存篇--Redis使用配置端口转发 这两篇文章的&#xff0c;相信你已经对redis有一定的了解&#xff0c;并能够安装上&#xff0c;进行简单的使用了&#xff0c;但是在咱们的实际应用中&#xff0c;使用redis肯定不…