电商网站商品价格获取

news/2024/5/9 13:48:05/文章来源:https://blog.csdn.net/qq_38870183/article/details/103119724

电商网站商品价格获取

本文以苏宁易购,京东,两个电商网站,模仿说明电商网站商品价格的两种获取方法。

json形式存放,京东商品的价格以json形式存放,以以下页面为例
在这里插入图片描述

https://item.jd.com/100000287133.html

明显价格数据并非放在前端页面里,搜索找到以下数据
在这里插入图片描述
查看当前的url
在这里插入图片描述
在浏览器中请求

https://p.3.cn/prices/mgets?callback=jQuery6054119&type=1&area=6_303_36780_0&pdtk=&pduid=1588655612&pdpin=&pin=null&pdbp=0&skuIds=J_100000287133%2CJ_5416604%2CJ_100001477751%2CJ_4741808&ext=11100000&source=item-pc

通常来说call_back包含的内容可以直接去除,将链接处理后得到

https://p.3.cn/prices/mgets?skuIds=J_100000287133
skuIds=J_100000287133 

#分析即可发现j_后的字符串为商品ID,对应商品详情页的链接
请求结果如下:
在这里插入图片描述
接下来,填充主程序。仅作为示例代码,详情数据重新处理

import scrapy
import jsonclass JgSpider(scrapy.Spider):name = 'jg'allowed_domains = ['shouji.jd.com','p.3.cn'] #需说明的是在价格详情内域名发生了变化start_urls = ['https://item.jd.com/100000287133.html']def parse(self, response):item = {}contain= response.xpath("//div[@class='product-intro clearfix']")item["title"] = contain.xpath("./div[@class='itemInfo-wrap']/div[@class='sku-name']/text()").extract_first().strip()item["sku_num"] = contain.xpath(".//a[@class='notice J-notify-sale']/@data-sku").extract_first()item["price_href"]='https://p.3.cn/prices/mgets?&skuIds=J_{}'.format(item["sku_num"])yield scrapy.Request(item["price_href"],callback=self.price_detail,  #获取价格meta={"item":item})def price_detail(self ,response):item = response.meta["item"]item["price"] =json.loads(response.body.decode())[0]["p"] #json数据遍历方法print(item)

需要说明的几点:

allowed_domains = ['shouji.jd.com','p.3.cn'] #需说明的是在价格详情内域名发生了变化
item["price_href"]='https://p.3.cn/prices/mgets?&skuIds=J_{}'.format(item["sku_num"]) #也可直接拼接

代码运行结果如下:
在这里插入图片描述

苏宁易购商品价格获取,与淘宝的逻辑相似存放在主页面但需要正则匹配获取。
在这里插入图片描述
同样以具体的某些页面为例:

https://product.suning.com/0070091633/10717510914.html?safp=d488778a.10038.resultsRblock.12&safc=prd.3.ssdln_502687_pro_pic01-1_0_0_10717510914_0070091633

用同样的方法找到价格
在这里插入图片描述
填充主程序代码:

import scrapy
import reclass SnSpider(scrapy.Spider):name = 'sn'allowed_domains = ['suning.com']start_urls=['https://product.suning.com/0070091633/10717510914.html?safp=d488778a.10038.resultsRblock.12&safc=prd.3.ssdln_502687_pro_pic01-1_0_0_10717510914_0070091633']def parse(self, response):pr=re.findall('"itemPrice":"(.*?)",',response.body.decode())print(pr)

运行结果如下
在这里插入图片描述

以上就是主流电商网站的商品价格获取方法,希望对大家的学习工作有所帮助。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_901536.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2021最新高端HTML前端网站模板下载

努力创建完善、持续更新jQuery插件,网站模板,页面模板,编程代码,网站工具,后台模板,html模板,h5模板,系统模板,js特效等提供在线预览,网站模板jQuery插件下载。 地址:静态模板下载

github搭建个静态网站及绑定域名

github搭建个人网站 1、注册自己的github账户,名为XXX 2、创建一个名为XXX.github.io的库 3、创建仓库如图 4、创建成功创建一个文件 5、点击settings,找到GitHub Pages项,点击choose a theme 6、创建模版 7、提交之后,恭喜你,你的网站可以…

在内网打造可以从外网访问的网站和服务

最近在内网建了一个简单的网站,利用路由器,使网站可以从外网访问。 首先利用appserv套件搭建一个phpmysqlapchephpmyadmin环境,安装十分简单,直接下一步就行了,中途可能要填写网络端口和Mysql数据库密码,网…

Macbook 开发之器,Mac OSX 应用软件,开发工具必备网站推荐

动机 换了 Macbook 做开发已经好长的时间了,系统非常稳定,但是,就是但凡是好一点的开发工具或是应用软件都是收费的,而且价格不菲,相信这也是大多数同行们的痛点;这也就是我为什么写这篇文章的初衷所在了&…

让你的网站支持HTTPS,满足小程序开发接口

每日推荐 HTTP 协议是不加密传输数据的,也就是用户跟你的网站之间传递数据有可能在途中被截获,破解传递的真实内容,所以使用不加密的 HTTP 的网站是不太安全的。所以, Google 的 Chrome 浏览器将在 2017 年 1 月开始,标…

让你的网站支持HTTPS,满足小程序开发接口

每日推荐 HTTP 协议是不加密传输数据的,也就是用户跟你的网站之间传递数据有可能在途中被截获,破解传递的真实内容,所以使用不加密的 HTTP 的网站是不太安全的。所以, Google 的 Chrome 浏览器将在 2017 年 1 月开始,…

下半年,我打算在搞十几个基于thinkphp框架的网站主题模板

gkxz.jpg 大家好,我是独立开发者东东,如今在web方面,每个人都希望能拥有自己的个人博客或者社区也或者是供大家讨论的论坛系统.今天你们再也不用为拥有这些系统发愁找不到简洁大方的前端展示啦.因为今天我终于打算开发各种网站主题模板供大家学习与使用!…

下半年,我打算在搞十几个基于thinkphp框架的网站主题模板

首个thinkphp主题网站 大家好,我是独立开发者东东,如今在web方面,每个人都希望能拥有自己的个人博客或者社区也或者是供大家讨论的论坛系统.今天你们再也不用为拥有这些系统发愁找不到简洁大方的前端展示啦.因为今天我终于打算开发各种网站主题模板供大家…

Vicki告诉你为什么网站SEO要用站群服务器

相信每一个站长朋友都在为网站的优化问题而绞尽脑汁吧,首先考虑的就是在服务器上面做文章,很多站长会选择用站群服务器,因为站群服务器拥有多个独立ip,对网站的优化排名是有比较好的效果的。今天我们一起细数一下站群服务器到底有…

传统网站与Web标准——DIV+CSS布局实例

主要内容&#xff1a; “结构与表现分离”的设计思想纵向导航条与横向导航条的切换 【步骤1】 一、效果 二、HTML <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">…

想开发一套老黄历网站或者APP,Python项目代码

如图&#xff0c;准备开发一套老黄历网站&#xff0c;需要体现出农历、老黄历、万年历&#xff0c;同时返回干支、福神、宜忌、节假日、吉凶、冲煞、分时吉凶等信息&#xff0c;下面直接上代码&#xff0c;用Python # -*- coding: UTF-8 -*- Python 3.x 数据无忧 Created on 20…

网站渗透思路(小白专看,大佬绕道)

渗透测试大体可以分为六大步 1. 信息收集 2.漏洞挖掘 3.漏洞利用 4.提升权限 5.清除测试数据 6. 总结归纳输出报告并提出修复建议 首先在获取书面授权的情况下,才可以进行渗透测试,提前询问有没有敏感操作等,首先进行网站的信息收集 信息收集 1.首先进行域名w…

服务器端网站编程(Django)

服务器端网站编程 Web浏览器使用超文本传输​​协议&#xff08;HTTP&#xff09;与Web服务器进行通信。当您单击网页上的链接&#xff0c;提交表单或运行搜索时&#xff0c;HTTP请求将从浏览器发送到目标服务器。 该请求包括标识受影响资源的URL&#xff0c;定义所需动作&…

chatgpt如何搭建一个自己的网站,请看源码。

找了一套chatgpt搭建的源码&#xff0c;修改自己的key就能使用 效果如下&#xff0c;再也不用去挤外网里&#xff0c;舒服。 源码 ➕ wengjunda 可以拿取&#xff0c;是php的 key的申请 尾声 我们就已经能通过服务器访问刚刚搭建的 ChatGPT 了&#xff0c;记得设置访问密码啥…

MVC UnitOfWork EntityFramework架构,网站速度慢的原因总结!

最近参考使用了郭明峰的一套架构来做新的项目架构&#xff0c;这套架构看起来还是不错的&#xff0c;先向小郭同学的分享精神致敬&#xff01; 项目开发上线后&#xff0c;傻眼了&#xff0c;貌似没有几个人访问的新项目&#xff0c;速度一直慢的跟牛一样&#xff0c;真心没法交…

django入门笔记2- 网站框架搭建

创建一个pydev的工程结构如下: ttt是默认创建的一个包,里面包含整个网站的基本配置 settings.py主要是数据库, 中间件, 一些变量存放的地方 urls.py 跳转的配置一般如下, 把一些url分配到各个二级app中进行解析 urlpatterns patterns(,# Examples:# url(r^$, ttt.views.hom…

爬取网站内的全部小说

爬取网站内的全部小说 我们需要用到的模块有 re BeautifulSoup 首先我们要确定我们爬取的网站:http://www.136book.com/tuijian.php?id=1 一在爬取各个书目录的网址时我选择了用正则表达式来爬取: 选用正则爬取单独的href是比较方便的。爬取后要确定是否为书目录的网站。…

【代码备忘】火狐浏览器插件xpi自动从网站下载安装的代码

欢迎加入我们的QQ群&#xff0c;无论你是否工作&#xff0c;学生&#xff0c;只要有c / vc / c 编程经验&#xff0c;就来吧&#xff01;158427611 【代码备忘】火狐浏览器插件xpi自动从网站下载安装的代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transition…

Centos 下JBoss as7 + jdk+mysql+nginx 网站配置

网站基本框架设计好了&#xff0c;下来就开始搭建服务器框架了 。 服务器组选的是 VPS&#xff0c;为什么选VPS,因为我们除了要使用公共的web服务外&#xff0c;还要定制一些系统的软件和服务&#xff0c;自定义上报端口等。除了自己承包整机服务器外&#xff0c;VPS无疑是最佳…

html5/CSS3进阶——宝贝之家网站首页

学习了一段时间的框架&#xff0c;最近在复习最早学的html5、css3&#xff0c;拿了一个小案例做了一下&#xff0c;整个过程还算顺利&#xff0c;附图&#xff1a; 其实页面整体结构还是很清晰的&#xff0c;这里我也是直接使用了多个div嵌套划分的常规手段&#xff0c;没有用…