某淘客网站的爬虫数据并写入到excel文件中的源码

news/2024/5/20 14:51:56/文章来源:https://blog.csdn.net/zfs1570/article/details/111249304

def hdktest(url,userid):
    try:
        pcres=urllib.request.urlopen(url)
        pcres=pcres.read().decode()
        return pcres
    #异常处理
    except urllib.error.HTTPError as reason:
        taskinfo=hdktask.objects.get(hdktask_linkuserid=userid)
        taskinfo.hdktask_status=0
        taskinfo.save(update_fields=["hdktask_status"]) 
        print(reason)
        
#执行hdk任务
def runhdktask(uname,userid,url):
    shopnum=re.findall(r'shoptype=(\d+)',url)
    serurl="https:/xxx/allitem/new_get_allitem_list?keyword=&shopsearch=&user_name=&brand_name=&cid=0&min_price=&max_price=&filtrate_type=&min_sale=&min_rate=&min_tkMoney=&min_avg=&min_coupon=&p=1&shoptype="+str(shopnum[0])+"&discount=&favorites_count=&min_itemprice=&max_itemprice=&sort=1"
    res=hdktest(serurl,userid)
    pagenum=re.findall(r'"num_page":(\d+),',str(res))
    hdkexcel=xlwt.Workbook() 
    worksheet=hdkexcel.add_sheet(uname,cell_overwrite_ok=True)
    worksheet.write(0,0,"商品名称")
    worksheet.write(0,1,"券后价格")
    worksheet.write(0,2,"今日销量")
    worksheet.write(0,3,"店铺")
    # 遍历页数 
    for page in range(1,int(pagenum[0])+1):
        pageurl="https://xxx/allitem/new_get_allitem_list?keyword=&shopsearch=&user_name=&brand_name=&cid=0&min_price=&max_price=&filtrate_type=&min_sale=&min_rate=&min_tkMoney=&min_avg=&min_coupon=&p="+str(page)+"&shoptype="+str(shopnum[0])+"&discount=&favorites_count=&min_itemprice=&max_itemprice=&sort=1"
        serres=hdktest(pageurl,userid)
        serlist=re.findall(r'"itemendprice".+?},',serres)
        #遍历每个商品
        for num in range(0,len(serlist)):
            #商品标题
            itemtitle=re.findall(r'"itemtitle":"(.+?)"',str(serlist[num]))
            #获取券后价列表
            itemendprice=re.findall(r'"itemendprice":(\d+[.]{0,1}[\d+]{0,2})',str(serlist[num]))
            #今日销量
            todaysale=re.findall(r'"todaysale":(\d+)',str(serlist[num]))
            #获取店铺名
            shopname=re.findall(r'"shopname":"(.+?)"',str(serlist[num]))
            time.sleep(1)
            worksheet.write(num+1+100*(page-1),0,str(itemtitle[0]))
            worksheet.write(num+1+100*(page-1),1,str(itemendprice[0]))
            worksheet.write(num+1+100*(page-1),2,str(todaysale[0]))
            worksheet.write(num+1+100*(page-1),3,str(shopname[0]))
    
    
    hdkpath=settings.MEDIA_ROOT+"/hdk/"
    hdkexcel.save(hdkpath+"/"+uname+".xlsx")
    taskinfo=hdktask.objects.get(hdktask_linkuserid=userid)
    taskinfo.hdktask_status=0
    taskinfo.save(update_fields=["hdktask_status"])    

爬取数据写入excel效果如下,字段可以对应添加就行了

新手学py编程更多源码分享 技能干货

 


            

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_859764.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用django实现某淘客网站采集功能

原来设计的效果如下 后来根据需求又改了一版效果如下 源码分享&#xff1a; {% load customtag %} <!DOCTYPE html> <html lang"zh-CN"> <head> <meta http-equiv"Content-Type" content"text/html; charsetUTF-8"&…

DEDECMS风水织梦模板带手机站,DEDECMS风水网站

模板介绍&#xff1a; 织梦最新内核开发的模板&#xff0c;该模板属于风水行业&#xff0c;企业通用&#xff0c;企业管理&#xff0c;企业咨询等企业均可以使用该模板&#xff0c;页面简洁简单&#xff0c;容易管理&#xff0c;附带测试数据&#xff01; 模板特点&#xff1a…

ecshop商城自定义URL链接SEO优化排名_ecshop商城自定义URL静态html

简介&#xff1a; ecshop商城优化提高网站排名重要三步缺一不可&#xff1a;ecshop自定义URL链接静态URL,ecshop自定义title标题&#xff0c;ecshop自动内链接。很多ecshop商城站长对商城创建以后感觉就完事了&#xff0c;好像并不在乎网站排名和收录&#xff0c;如果一个商城创…

给ECSHOP每个商品自己设置URL名称地址提高SEO优化插件

插件简介&#xff1a; ecshop商品自定义url和标题&#xff0c;这个是很多人都追求的一个功能。为了让ecshop更加加强SEO优化。我们就不得不对ecshop url进行自定义。本插件适合任何摸板以包括最新ecshop4.1插件内附带有详细安装说明&#xff0c;自己完全可以安装。插件代码不加…

[SEO优化必备]ECSHOP商城全站自定义TITLE标题插件

插件简介 ECSHOP自定义TITLE标题插件 ECSHOP自定义TITLE标题插件演示地址看本插件浏览器上面标题和商品标题显示不一样就明白了&#xff01; ECSHOP商城全站自定义TITLE标题ECSHOP插件&#xff1a;包含 商品页&#xff0c;商品分类页&#xff0c;商品品牌&#xff0c;文章页 &a…

实现ECSHOP商品自定义URL链接地址插件【提高SEO优化必备】

插件说明&#xff1a;本插件给ECSHOP每个商品自定义URL名称地址提高SEO优化插件 功能特色&#xff1a; ECSHOP虽然支持伪静态&#xff0c;但是伪静态的规则稍有死板。如果ECSHOP每个商品都能自定义URL&#xff0c;那对SEO将很有帮助。本店提供的这个"ECSHOP所有商品自定…

2022最新可用网页百度分享按钮安装教程【网站添加百度分享按钮代码】

简介&#xff1a; 2022最新可用百度分享是一个提供网页地址收藏、分享及发送的WEB2.0按钮工具&#xff0c;借助百度分享按钮&#xff0c;网站的浏览者可以方便的分享内容到人人网、开心网、QQ空间、新浪微博等一系列SNS站点。 网站主可以在百度分享网站中获得分享按钮JS代码&a…

ECSHOP优化外链插件【ecshop优化seo插件】提高ECSHOP商城优化,商品页,文章外链优化插件,SEO插件

参考各大电商一些相关经验&#xff0c;把ecshop文章商品内容里的外链加上跳转页面提示&#xff0c;感觉非常使用实用而且对seo优化提升还不错&#xff0c;那么 ECShop 外链默认都是直接跳转的&#xff0c;没有这方面的插件&#xff0c;所以ECSHOP插件网就做了一个类似的插件&am…

ECSHOP网站日志,ECSHOP维护工具,ecshop错误查看,ECSHOP管理员日志,ECSHOP管理员操作记录

插件简介 对于ECSHOP开发者来说&#xff0c;一旦某个产品投入使用&#xff0c;应该立即将display_errors选项关闭&#xff0c;以免因为这些错误所透露的路径、数据库连接、数据表等信息而遭到黑客攻击。但是&#xff0c;任何一个产品在投入使用后&#xff0c;都难免会有错误出现…

ecshop商城SEO优化自动内链接插件,ecshop自动内链接提高搜索引擎排名收录,ECSHOP自动内链插件,ECSHOP商城优化插件,seo优化插件

ecshop商城网站内链优化有什么作用&#xff1f;内链优化技巧&#xff01; 在网站优化中&#xff0c;有一种优化叫做“内链优化”&#xff0c;顾名思义就是对网站站内的链接进行优化&#xff0c;内链优化是SEO站内优化至关重要的的一环&#xff0c;也正是基于这种认识&#xff0…

ecshop网站导航,html导航分类,分类导航,html分类式导航栏,html分类导航页面插件【有利于网站排名seo优化】

网站导航给优化带来的好处 一个靠谱的网站&#xff0c;它必然在各方面对细节都是非常的在意的&#xff0c;而且对于细节的优化也是把控的很到位。而且许多不够老练的优化师往往会忽视一些优化操作&#xff0c;例如说网站导航栏的优化。对此小编就在这里给大家着重说说网站导航对…

ECSHOP商城SEO优化商城更新内容后将页面链接自动推送给百度

ECSHOP商城SEO优化篇:商品新增加内容或者更新内容以后如何快速让搜索引擎收录?这时候就要用到自动推送功能让搜索引擎知道新增加内容了。ECSHOP商城做好需要SEO优化其中优化之一就是将网站新内容通过自动推送给百度搜索引擎&#xff0c;站长只需安装推送插件&#xff0c;在新发…

ECSHOP多语言插件,ECShop外贸网站添加谷歌翻译,ECShop中添加谷歌翻译,ECShop谷歌语言翻译插件

ECSHOP多语言插件,ECShop外贸网站添加谷歌翻译,ECShop中添加谷歌翻译,ECShop谷歌语言翻译插件 我们生活在一个多样化的世界&#xff0c;人们说许多不同的语言。根据语言学家的说法&#xff0c;世界上有6000到7000种不同的语言。虽然很多人都懂英语&#xff0c;但是如果你的网站…

ECTouch多语言插件,ECSHOP手机版多语言翻译,ecshop手机端多国语言翻译切换,ECSHOP网站多语言切换

ecshop使用谷歌翻译的好处 1.首先是在语言支持这块,谷歌翻译支持高达一百多种语言,几乎可以翻译目前大家常见的语种,并且是支持双向翻译的。 2.谷歌翻译软件翻译的准确率也是比较高的,比较谷歌翻译的技术很早也很成熟了。 3.谷歌翻译软件使用起来界面比较的清新,没有一些乱七八…

【问题解决】Chrome浏览器:该网站使用HSTS。网络错误...此页面稍后可能会工作之解决方法

谷歌浏览器打开常用的网站&#xff0c;发现提示以下信息&#xff08;firefox正常打开&#xff09;&#xff1a; 您的连接不是私密连接 攻击者可能会试图从https://www.test.com窃取您的信息&#xff08;例如&#xff1a;密码、通讯内容或信用卡信息&#xff09;。 NET::ERR_CE…

一个很好的开源软件项目管理软件--今天在开源网站上找到的:)

先来两张图看看&#xff0c;其功能已经满足软件项目基本过程了...... Endeavour软件工程管理工具(Endeavour Software Project Management)是一个胖客户端的开源项目项目管理解决方案。它可以通过管理迭代和增量开发帮助用户创建大型企业级系统。 目前Endeavour支持&#xff0…

docker搭建你属于的个人网站-wordpress

docker搭建你属于的个人网站-wordpress 详细安装如下 docker安装参考 step1&#xff1a;拉取mysql&#xff0c;nginx-php-fpm镜像&#xff1b;下载wordproess安装包 docker pull mysql:5.7 #拉取mysql镜像docker pull richarvey/nginx-php-fpm #拉取nginx-php-fpm镜像…

想在网站上实名投票排名第一吗?

只要是网民都知道现在很多网站上都有一些根据实名投票选举出来的一些网络某方面达人等等&#xff0c;往往在看到他们的得票数会望而兴叹&#xff0c;其实这个也不用羡慕&#xff0c;你也可以有他们那样的得票数&#xff01; 现在是一个高科技的时代&#xff0c;很多平常觉得不…

分享一些程序员必备网站

本人呢是个收藏狂&#xff0c;看到过很多很好的学习和工具网站&#xff0c;挑选出一些分享给大家。有些已经很出名的我就不再分享出来了。 1. 中文在线教程书籍 free-programming-books-zh_CN 这是github上的一个开源项目&#xff0c;大量免费的计算机编程类中文书籍。收集了从…

骚操作 Python爬你要的网站数据

引言 介绍下 Python 用 Beautiful Soup 周期性爬取 xxx 网站获取新闻流&#xff1b; 图 1 项目介绍 1. 开发环境 Python&#xff1a;      3.6.3 BeautifulSoup&#xff1a;   4.2.0 , 是一个可以从HTML或XML文件中提取数据的Python库* ( BeautifulSoup 的中文官方文档…