python爬取唯品会电商网站数据并保存到csv中

news/2024/5/19 11:45:56/文章来源:https://blog.csdn.net/qq_40235133/article/details/115172630

文章目录

1.目标、思路
2. 获取数据
3.解析数据
4.保存数据

1.目标、思路

目标：本次爬虫爬取的目标是唯品会中口红分类的商品。（url
）
思路：打开网页后点击F12打开抓包工具，找到我们想要的数据包，并分析。
在这里插入图片描述
并且可以发现他是通过提交商品id参数来获取这些商品信息的，所以这不是个静态网页，在网页源代码中是找不到商品信息的。

那我们就获取所有的商品ID并传入到商品的数据包URL地址里面就可以获取商品信息了。

2. 获取数据

构建url，headers，params去请求数据。

import  requests
headers = {'referer':'https://category.vip.com/','user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36'}
url = 'https://mapi.vip.com/vips-mobile/rest/shopping/pc/search/product/rank'
params = {
'app_name': 'shop_pc',
'app_version': '4.0',
'warehouse': 'VIP_HZ',
'fdc_area_id': '104102101',
'client': 'pc',
'mobile_platform': '1',
'province_id': '104102',
'api_key': '70f71280d5d547b2a7bb370a529aeea1',
'user_id': '',
'mars_cid': '1616561542264_dbf891698c85094d527273d671f70e8f',
'wap_consumer': 'a',
'standby_id': 'nature',
'keyword': '口红',
'lv3CatIds': '',
'lv2CatIds': '',
'lv1CatIds': '',
'brandStoreSns': '',
'props': '',
'priceMin': '',
'priceMax': '',
'vipService': '',
'sort': '0',
'pageOffset': '0',
'channelId': '1',
'gPlatform': 'PC',
'batchSize': '120',
'_': '1616566409850'}response = requests.get(url = url ,params= params,headers=headers)print(response.json())

由下图可知获得了我们想要的pid数据。
在这里插入图片描述

3.解析数据

我们获取了商品的pid信息后就可以构建producid参数，并创建一个函数，这个函数的作用就是往里传pid数据，给我们返回商品信息，实现代码如下：
先构建pid：

products = response.json()['data']['products']
listt = []
for index in products:pid = index['pid']listt.append(pid)string_1 = ','.join(listt[0:50])
string_2 = ','.join(listt[50:100])
string_3 = ','.join(listt[100:])

再构建函数：

def get_info(pid):html_url = 'https://mapi.vip.com/vips-mobile/rest/shopping/pc/product/module/list/v2'params_1 = {'app_name': 'shop_pc','app_version': '4.0','warehouse': 'VIP_HZ','fdc_area_id': '104102101','client': 'pc','mobile_platform': '1','province_id': '104102','api_key': '70f71280d5d547b2a7bb370a529aeea1','user_id': '','mars_cid': '1616561542264_dbf891698c85094d527273d671f70e8f','wap_consumer': 'a','productIds': pid,'scene': 'search','standby_id': 'nature','extParams': '{"stdSizeVids":"","preheatTipsVer":"3","couponVer":"v2","exclusivePrice":"1","iconSpec":"2x","ic2label":1}','context': '','_': '1616566409853'}response_1 = requests.get(url = html_url ,params= params_1 ,headers =headers)pprint.pprint(response_1.json())

由下图可知获取了我们想要的数据。
在这里插入图片描述
接下来完善函数，获取各个商品细则，代码如下：

def get_info(pid):html_url = 'https://mapi.vip.com/vips-mobile/rest/shopping/pc/product/module/list/v2'params_1 = {'app_name': 'shop_pc','app_version': '4.0','warehouse': 'VIP_HZ','fdc_area_id': '104102101','client': 'pc','mobile_platform': '1','province_id': '104102','api_key': '70f71280d5d547b2a7bb370a529aeea1','user_id': '','mars_cid': '1616561542264_dbf891698c85094d527273d671f70e8f','wap_consumer': 'a','productIds': pid,'scene': 'search','standby_id': 'nature','extParams': '{"stdSizeVids":"","preheatTipsVer":"3","couponVer":"v2","exclusivePrice":"1","iconSpec":"2x","ic2label":1}','context': '','_': '1616566409853'}response_1 = requests.get(url = html_url ,params= params_1 ,headers =headers)#pprint.pprint(response_1.json())products_list = response_1.json()['data']['products']for i in products_list:# 标题title = i['title']# 品牌show_name = i['brandShowName']# 原价marker_price = i['price']['marketPrice']# 折扣discount = i['price']['saleDiscount']# 现价sale_price = i['price']['salePrice']print(title,show_name,marker_price,discount,sale_price)

右下图可知，得到了我们想要的数据。
在这里插入图片描述

4.保存数据

导入csv模块，将数据写入csv文件中。

f = open('商品数据.csv',mode = 'a',encoding='utf-8',newline='')
csv_writer = csv.DictWriter(f,fieldnames=['标题','品牌','原价','折扣','售价'])
csv_writer.writeheader()

并在函数中添加如下代码以写入数据，

dit = {'标题': title,'品牌': show_name,'原价': marker_price,'折扣': discount,'售价': sale_price}csv_writer.writerow(dit)

右下图可知成功创建了csv文件并获取到了数据。
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_877661.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

python爬取唯品会电商网站数据并保存到csv中

文章目录

1.目标、思路

2. 获取数据

3.解析数据

4.保存数据

相关文章

各大视频网站下载神器

电子商务网站的 10 个易用性规则

基于jquery Stellar.js实现网站视差滚动效果

推荐一个前沿的无线通信网站——定为电子

网站被DDOS攻击，我只用了2招应对

【Python】利用网站API接口获取天气信息

做一个酷网站(2)

用户访问一个网站的整过程

手机网页的设计vs2008开发wap网站(一)

优化网站性能提高网站速度访问速度的14条实践

利用代码托管平台 Pages 搭建静态个人网站

推荐3个网页设计在线配色网站

提高网站设计可用性(有效性)的10条原则

精选31个网站界面设计实践教程

Photoshop 爱好者应该收藏的42个网站

分享20佳极具创意的网站导航菜单设计案例

免费下载精美网站模板的25个网站推荐

学习 Web 开发技术的16个最佳教程网站和博客（留着回家学习）

使用 jQuery Mobile 及 ASP.NET 开发跨行动装置网站 (Mobile Web)

Bootstrap网站页面练习实例