Scrapy 简单爬取厨房网站菜谱清单，并将结果保存为csv文件

Scrapy 简单爬取厨房网站菜谱清单，并将结果保存为csv文件

news/2024/5/12 12:29:08/文章来源:https://blog.csdn.net/qq_53817374/article/details/123773505

链接：http://www.xiachufang.com/explore/

from scrapy import Request
from scrapy.spiders import Spiderclass HotSaleSpoider(Spider):name = 'hot'qidian_headers = {"user-agent":'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.74 Safari/537.36 Edg/99.0.1150.46'}def start_requests(self):url = 'https://www.xiachufang.com/explore/'yield Request(url, headers=self.qidian_headers, callback=self.parse)def parse(self, response):list_selector = response.xpath("//div[@class='info pure-u']")for one in list_selector:str1 = "https://www.xiachufang.com/"name = one.xpath("p[@class='name']/a/text()").extract()[0]composition = one.xpath("p[@class='ing ellipsis']/a/text()").extract()url = one.xpath("p[@class='name']/a/@href").extract()[0]url = "".join(url)url = str1+urlprint(url)composition = ",".join(composition)hot_dict = {"菜名": name,"原材料": composition,'url': url}yield hot_dict

效果：

运行命令：scrapy crawl hot -o hot.csv

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_880096.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

保姆级教程之php动态网站开发之第四阶段之项目部署上线并测试监控

保姆级教程之php动态网站开发之第四阶段之项目部署上线并测试监控

保姆级教程之php动态网站开发之第四阶段之项目部署上线并测试监控大家好，我是李大庆，你们的php助教。我来给大家讲一下第四阶段的项目部署部分，然后下周会在电脑上大家使演示如何部署服务器，大家先自己按照下面的教程自行去申请…

阅读更多...

微信开放平台网站应用配置

微信开放平台网站应用配置

微信开放平台网站应用最简单的微信网页授权登录需要注意的是网站应用和微信授权两种登录方式的微信appid 和 appsecret 是不一样的进入查看有一个授权回调域这里不需要像微信授权那样配到路径只要域名就可以了例如 www.baidu.com 后面的其他回调路径 …

阅读更多...

【网站性能指南】（一）概述

【网站性能指南】（一）概述

【概观】什么使我们的网站变慢？Http 协议通过更好的性能省钱和赚钱性能规则【什么使网站变慢】对于大多数现代的网站，仅仅有10%-20%的响应时间是用于生成和加载html document的。那么，其他的时间用于加载什么呢？确切的说&a…

阅读更多...

【网站性能指南】（二）网站性能测量神器

【网站性能指南】（二）网站性能测量神器

上一章我讲了很多关于Fiddler的东西。其实有很多检测工具可以使用，如 Fiddler 、chrome、firebug、Network Monitor、IIS 和一些第三方的service。首先我们还是先继续回顾一下fiddler的功能【fiddler】追踪工具，尤其针对Http 展示完成的request和re…

阅读更多...

【网站性能指南】（三）奠基石-基础建设

【网站性能指南】（三）奠基石-基础建设

【概述】在这一章节，我们的主题聚焦在基础设施建设上。 Http Compression（压缩）Content Expirations (内容过期）Content Distribution Networks - CDN(内容分发网络)Etags （E标签）去掉没必要的Http head…

阅读更多...

【网站性能指南】（四）前端性能-压爆你的文件

【网站性能指南】（四）前端性能-压爆你的文件

【概述】在这一章，我们会聚焦在前端性能: 外部的Css 和 JavascriptCss 和 Javascript 的迷你化与合并图片的最佳化Css 图片拼合器【外部的CSS和Javascript】几乎所有的CSS和Javascript 都应该放在外部文件减少页面的尺寸允许重用允许使其过期可读性更高 …

阅读更多...

unity使用mixamo网站所有动作

unity使用mixamo网站所有动作

//如果模型已经绑定了骨骼可以直接导入网站 //如果会C4D需要看下IMAX插件如何使用的（B站有）---非常简单，基本就是点点点就好了，真的不难（插件可以在魔顿网免费下载）。

阅读更多...

Texture贴图材质资源网站分享

Texture贴图材质资源网站分享

话不多说直接贴： https://www.textures.com/libraryhttps://www.textures.com/library进入之后可以选择搜索查找你要的东西，只能英文免费下载，低清晰度的，512X512，学习使用完全足够说明：如需商用请购…

阅读更多...

大型网站后台架构的Web Server与缓存（转）

大型网站后台架构的Web Server与缓存（转）

1.1 Web server Web server 用来解析HTTP协议。当web服务器接收到一个HTTP请求时，会返回一个HTTP响应，例如送回一个HTML页面。为了处理一个请求，web服务器可以响应一个静态页面或者图片。进行页面跳转，或者把动态响应的产生委托给…

阅读更多...

Java批量检测网站链接是否正常，并生成检测日志文档

Java批量检测网站链接是否正常，并生成检测日志文档

Java批量检测网站链接是否正常，并生成检测日志文档 1.Java代码块 （生成检测日志文档文档为md格式，最好下载typora或markdown进行查看，也可根据自己所需改成txt文档） 文件名：ceshi.java import java.io.B…

阅读更多...

加上快捷键，让你的网站酷起来

加上快捷键，让你的网站酷起来

伟大的程序员都懒。这话是我从《PHP 与 MySQL 程序设计》中看来的，来自于 Larry Wall 的一句话： Most of you are familiar with the virtues of a programmer. There are three, of course: laziness, impatience, and hubris. 懒的程序员的特征是&…

阅读更多...

使用GitLab Pages托管静态网站

使用GitLab Pages托管静态网站

文章目录前言一、GitLab Pages是什么？二、使用步骤1.开通账号，创建Git仓库同步项目2.添加.gitlab-ci.yml文件，开启GitLab Pages3.部署成功之后访问项目总结前言在我们日常的程序员养成过程中，会产生一些产物，自己…

阅读更多...

在12306网站上如何可以选择上中下铺

在12306网站上如何可以选择上中下铺

众所周知，在12306官方购票时无法自己选择上中下铺的，那么如何在12306上买到上中下铺呢，相信大家都会感兴趣，这是一个利用12306的一个web代码来实现的，然后结浏览器的web调式功能，如果你是一个web美工&#…

阅读更多...

pc网站qq互联登录授权php版

pc网站qq互联登录授权php版

首先看下工具类 <?php /*** QQ互联pc网页授权类*/ namespace App\Lib\QQconnect;use App\Lib\Util\Curl;class QQconnect{const err [0 >成功,100000 > 缺少参数response_type或response_type非法,100001 > 缺少参数client_id,100002 > 缺少参数client…

阅读更多...

虚拟机内的homestead环境下的网站项目让局域网内的同事访问

虚拟机内的homestead环境下的网站项目让局域网内的同事访问

# 登录进虚拟机 $ vagrant ssh # 共享本地域名 $ share apitest.cn如图红框圈住的地址就可以访问了，6666

阅读更多...

怎样在织梦dedecms网站上添加漂浮广告

怎样在织梦dedecms网站上添加漂浮广告

在织梦 dedecms的网站上添加漂浮广告其实很简单，这篇文章主要讲的是在织梦网站首页添加漂浮广告。我们用本地搭建的织梦默认模板演示。 1、准备一个广告图片准备一个广告图片，命名为漂浮.gif ，设置好图片大小150*150 ，之后把图片…

阅读更多...

dedecms教程：多款精美分页网站模板pagelist样式

dedecms教程：多款精美分页网站模板pagelist样式

使用dedecms，有时需要自定义分页样式。怎么办呢？ 不急，20几款精美分页样式，总有一款你最喜欢。使用很简单： 步骤：三步即可解决多款精美dede分页样式.zip 1、直接覆盖include/arc.listview.class页 2、把演…

阅读更多...

dedecms教程：网站模板自定义表单制作在线订单详细解说

dedecms教程：网站模板自定义表单制作在线订单详细解说

一步首先你要知道自定义表单的后台界面在哪里截图第二步添加自定义表单我选择完全公开就是说访客提交的时候他们也是可以看到我们的自定义信息的数据表模板根据你的模板自定义即可我们先look下下面就是自定义的内容了我随便举例给大家演示下首先返回界面点击红圈来添加…

阅读更多...

dedecms教程：织梦做中英文(多语言)网站详解

dedecms教程：织梦做中英文(多语言)网站详解

对于多语言网站，可能许多人都想进行制作，可又不明白其中的道理；因为多语言网站不仅仅只是一个网站站点，具有多个而且是不同语言；它也不是站群，就是一个网站的一部分！ 首先实现多语言站点提供两种…

阅读更多...

[原创]DEDE 织梦建站,仿站(包含5套正版建站软件)

[原创]DEDE 织梦建站,仿站(包含5套正版建站软件)

教程包括： 3、dedecms仿站进门教程本教程适用于： 网易博客安全提醒：系统检测到您当前密码的安全性较低，为了您的账号安全，建议您适时修改密码立即修改 | 封闭 5、dedecms综合学习资料汇编； 重要提醒&…

阅读更多...

推荐文章

最新文章