Springboot连接Python爬取网站信息

news/2024/5/13 19:47:49/文章来源:https://blog.csdn.net/TT15751097576/article/details/102618159

Python的requests模块的使用

解决pip更新问题。 You are using pip version 19.0.3, however version 19.1 is available.当直接输入python -m pip install --upgrade pip更新还报错的时候,
输入命令:python -m pip install -U pipCollecting pip
Downloading https://files.pythonhosted.org/packages/f9/fb/863012b13912709c13cf5cfdbfb304fa6c727659d6290438e1a88df9d848/pip-19.1-py2.py3-none-any.whl (1.4MB)
100% |████████████████████████████████| 1.4MB 21kB/s
Installing collected packages: pip
Found existing installation: pip 19.0.3
Uninstalling pip-19.0.3:
Successfully uninstalled pip-19.0.3
Successfully installed pip-19.1//安装requests和lxml	
C:\Users\tt>pip install requests
C:\Users\tt>pip install lxml

Python爬取网站数据(普通网页)

import requests;from lxml import etree;def climb():
#请求urlurl = 'https://nj.5i5j.com/ershoufang/'r = requests.get(url)#return r.contentreturn r.text #获取响应消息def parse(htmlcex):htmlTree = etree.HTML(htmlctx)res = htmlTree.xpath("/html/body/div[1]/div/ul/li[1]/a/taxt()")print(res)if __name__ == '__main__':print(climb())/*
一、获取网页内容分析: res = requests.get(“http://www.baidu.com“) res.text返回的是Unicode型的数据。 使用res.content返回的是bytes型的数据。 也就是说,如果你想取文本,可以通过res.text。 如果想取图片,文件,则可以通过res.content。
*/

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-YGHDtxgX-1571333750929)(C:\Users\tt\AppData\Roaming\Typora\typora-user-images\1571312526195.png)]

打开所有后台进程:services.msc   比如:手动启动,maysql,windows系统里面的mysql在左侧框中手动点开黑界面。

Python爬取网站数据(Ajax网页)

//创建数据库
mysql> create database mydemo;
Query OK, 1 row affected (0.04 sec)mysql> use mydemo
Database changed
mysql> create table userinfos(userid int primary key not null auto_increment,username varchar(20)not null, birthday date not null);
Query OK, 0 rows affected (0.18 sec)mysql> insert into userinfos(username,birthday)values('zs','1999-8-9');
Query OK, 1 row affected (0.34 sec)mysql> insert into userinfos(username,birthday)values('ls','1999-9-9');
Query OK, 1 row affected (0.00 sec)mysql> insert into userinfos(username,birthday)values('ww','1998-9-9');
Query OK, 1 row affected (0.00 sec)mysql>

打开IDEL配置

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-3uToe2pJ-1571333750931)(C:\Users\tt\AppData\Roaming\Typora\typora-user-images\1571322894433.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oSnomGUk-1571333750932)(C:\Users\tt\AppData\Roaming\Typora\typora-user-images\1571322941684.png)]

修改类名快捷键:ALT+Shef+R----把小叶子名点类型改为  .yml
小结:
div.info>table.tab>tr>th{test$}*3按下Table键
展现:<div class="info"><table class="tab" border="1"><tr><th>test1</th><th>test2</th><th>test3</th></tr></table>
</div>

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-xZNhb61Y-1571333750934)(C:\Users\tt\AppData\Roaming\Typora\typora-user-images\1571332945360.png)]

//前端<!DOCTYPE html>
<html lang="en">
<head><meta charset="UTF-8"><title>Title</title>
</head>
<body><div class="info"><table class="tab" border="1"><tr><th>test1</th><th>test2</th><th>test3</th></tr></table>
</div><script type="text/javascript" src="js/jquery-3.4.1.min.js"></script><script type = "text/javascript">$.ajax({url:'init',type:'get',dataType:'JSON',success:function (res) {var tag = '';$.each(res,function (i, v) {tag+='<tr class = "infos"><td>'+v.userId+'</td><td>'+v.username+'</td><td>'+v.birthday+'</td></tr>'})$(".infos").remove();$(".tab").append(tag);}})</script></body>
</html><--还要把jquery配置包导入-->
<--在官网上下载 jquery3.4.1.min.js保存在staric包下面的js包下面-->
//后端
package com.python.python.controller;import com.python.python.entity.Userinfos;
import com.python.python.service.UserService;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;import java.util.List;@RestController
public class InitCtrl {@Autowiredprivate UserService userService;@RequestMapping("/init")public List<Userinfos> init(){return userService.serchAll();}
}package com.python.python.dao;import com.python.python.entity.Userinfos;
import org.apache.ibatis.annotations.Select;import java.util.List;
//接口
public interface UserDAO {@Select("select * from userinfos")List<Userinfos> findAll();}package com.python.python.entity;import java.util.Date;//实体类
public class Userinfos {private int userid;private String username;private Date birthday;@Overridepublic String toString() {return "Userinfos{" +"userid=" + userid +", username='" + username + '\'' +", birthday=" + birthday +'}';}public int getUserid() {return userid;}public void setUserid(int userid) {this.userid = userid;}public String getUsername() {return username;}public void setUsername(String username) {this.username = username;}public Date getBirthday() {return birthday;}public void setBirthday(Date birthday) {this.birthday = birthday;}
}package com.python.python.service;import com.python.python.dao.UserDAO;
import com.python.python.entity.Userinfos;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.stereotype.Service;import java.util.List;@Service
public class UserService {@Autowiredprivate UserDAO userDAO;public List<Userinfos> serchAll(){return userDAO.findAll();}
}package com.python.python;import org.mybatis.spring.annotation.MapperScan;
import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;@SpringBootApplication
//扫描接口文件夹,供应其他类来调用
@MapperScan("com.python.python.dao")public class PythonApplication {public static void main(String[] args) {SpringApplication.run(PythonApplication.class, args);}}

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-8MkgE9mz-1571333750935)(C:\Users\tt\AppData\Roaming\Typora\typora-user-images\1571333521338.png)]

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-IbK9w5kf-1571333750936)(C:\Users\tt\AppData\Roaming\Typora\typora-user-images\1571333487783.png)]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_863406.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C 中使用GDI+制作个性化的网站新闻标题

有时&#xff0c;我们需要让新闻标题更加个性化&#xff0c;例如&#xff1a;网站首页图片大标题&#xff08;新闻头条标题等&#xff09;。如下图&#xff1a; 上面这幅图片是新华网上的今日头条的标题。我们一般的做法可能是&#xff1a;使用Photoshop制作成图片&#xff0c;…

一个在线图形图像处理的网站 萝卜鼠在线图形图像处理 http //www zpxp com

http://www.zpxp.com 萝卜鼠在线图形图像处理: 随心所欲制作各种特色效果&#xff0c;比如&#xff1a; 图片特效&#xff1a;立方体 邮票效果 电影胶片 卷页效果 装饰效果(多种效果&#xff01;) 图章效果 添加水印 条形码 特色按钮等。 年历月历&#xff1a;可以随意生成190…

HTML5在线学习网站推荐

因为HTML5流行及其功能的强大&#xff0c;越来越多的人加入HTML5的学习。当然&#xff0c;目前大部分人学习都是通过网络&#xff0c;HTML5同样有许多教学网站&#xff0c;那么HTML5在线学习网站有哪些?现在请看我为大家推荐的HTML5在线学习网站。 学习HTML5的网站和博客 无论…

在容器中部署静态网站

设置容器的端口映射 run [P] [p]-p,--publish[] containerPortdocker run -p 80 -i -t ubuntu /bin/bash hostPort:containerPortdocker run -p 8080:80 -i -t ubuntu /bin/bash ip::containerPortdocker run -p 0.0.0.0:80 -i -t ubuntu /bin/bash ip:hostPort:containerPort…

网站响应速度变慢问题排查

问题如下&#xff08;突然出现&#xff09;&#xff1a; 访问网站主页&#xff0c;所有接口请求响应超级慢 排查过程&#xff1a; 排查系统是否存在影响网络的外网调用 不存在的 是否接口本身响应过慢呢 记录进入服务开始、离开服务时的时间&#xff0c;并打印响应时间&a…

程序员实用工具网站

目录 1、搜索引擎 2、PPT 3、图片操作 4、文件共享 5、应届生招聘 6、程序员面试题库 7、办公、开发软件 8、高清图片、视频素材网站 9、项目开源 10、在线工具宝典大全 程序员开发需要具备良好的信息检索能力&#xff0c;为了备忘&#xff08;收藏夹真是满了&#x…

一个完全的新人如何搭建自己的个人网站

大家好&#xff0c;我是小俊。今天写这篇文章是为了给一些新人写一个简单的教程&#xff0c;简单的写一写建设个人网站的步骤个方法。 首先&#xff0c;申明下本文所指的新人是指会上网站看网页&#xff0c;会自己聊QQ&#xff0c;会在新浪、网易等平台上写博客的人。当然你要…

使用电脑自带的IIS服务器发布网站

&#xff08;以下是用win10版本演示的,有些版本可能步骤不一样&#xff0c;但原理都差不多&#xff0c;某些系统可能要在internet属性里面启用一下IIS这个功能才行&#xff09; 1.打开你的控制面板&#xff0c;选择管理工具 如果你找不到管理工具呢&#xff0c;在这个地方选择…

自定义公司专属 Power BI 网站品牌外观

在用户登陆Power BI网站查看报表时&#xff0c;默认外观是微软官方样式&#xff0c;在左上角显示“Power BI”的Logo。 某些情况下&#xff0c;用户希望可以更改这个logo和外观样式&#xff0c;使网站看起来更符合企业品牌视觉要求。今天我们就介绍一下如何进行品牌外观设置&am…

阿里云单位网站备案承诺书填写(单位/个人)

阿里云单位网站备案承诺书填写 第一个填写「阿里云计算有限公司」 第二个填写公司所在省份/直辖市「北京市」

自动快捷使用数据采集器采集某网站数据---后裔采集器

测试工作为了方便快捷造真实的数据&#xff0c;朋友推荐了一个工具可以分享给大家&#xff1b;后裔采集器地址如下&#xff1a; http://www.houyicaiji.com/?typepost&pid6421 下载&#xff1a;点击免费下载软件&#xff0c;下载下来一键安装 安装完成进行数据采集&#…

一步步构建大型网站架构

之前我简单向大家介绍了各个知名大型网站的架构&#xff0c;亿万用户网站MySpace的成功秘密、Flickr架构、YouTube网站架构、PlentyOfFish 网站架构学习、WikiPedia技术架构学习笔记。这几个都很典型&#xff0c;我们可以从中获取很多有关网站架构方面的知识&#xff0c;看了之…

前端网站资源精编!!

前端网站资源精编&#xff01;&#xff01; 目录: 1-------- 走进前端 2-------- jQuery 3-------- CSS 4-------- Angularjs 5-------- ES6 6-------- React 7-------- 移动端API 8-------- avalon 9-------- Requriejs 10-------- vue 11-------- Seajs 12-------- Less,sas…

认为值得收藏的一些网站合集(2019.11.4已更新)

程序猿类 1.CSDN 专业IT技术社区&#xff0c;可以在这里学习关于编程的知识也可以写博客&#xff0c;日常网站 2.洛谷 刷题网站&#xff0c;不时会出一些欢乐赛、团队公开赛等等比赛&#xff0c;日常求签&#xff0c;题目还有题解&#xff0c;页面布置很好&#xff08;今日…

如何用色彩制造出具有专业感的网站

如何用色彩制造出具有专业感的网站 来源&#xff1a;yeeyan 作者&#xff1a;译&#xff1a;Srandy 发布时间&#xff1a; 2010-03-19 15:34:50 是什么使得某个设计看起来协调、井然有序并且具有专业感&#xff1f;答案是&#xff1a;“色彩”。并不是所有的项目都需要用保守的…

使用蓝湖UI效果图网站工具下载图标进行压缩

使用蓝湖UI效果图网站工具下载图标进行压缩如下图所示

避免 10 个常见 ASP.NET 缺陷, 使网站平稳运行

ASP.NET 成功的其中一个原因在于它降低了 Web 开发人员的门槛。即便您不是计算机科学博士也可以编写 ASP.NET 代码。我在工作中遇到的许多 ASP.NET 开发人员都是自学成材的&#xff0c;他们在编写 C# 或 Visual Basic 之前都在编写 Microsoft Excel 电子表格。现在&#xff0c;…

Vue项目无需修改任何代码,就可实现SEO优化!

个人博客地址https://gitee.com/baymaxsjj 前言 博客上线也有一段时间了&#xff0c;也在各大搜索引擎上提交了收录信息&#xff0c;但没啥用&#xff0c;闲着无聊就开始搞起seo了&#xff0c;vue 作为一个单页面应用&#xff0c;都是通过js来渲染页面&#xff0c;这就导致了蜘…

商城网站分类导航

分类导航已经成为尤其商城类网站的重要部分 首先服务器端代码可以实现这样的效果&#xff0c;但是一般不建议用&#xff0c;过分占用服务器资源&#xff0c;建议从后台取出数据&#xff0c;用json传给js&#xff0c;用js来实现这样的效果。 传给前台js之前最好先分下组&#xf…

在Azure Storage托管HTTP静态网站

本文演示了在Azure Storage托管HTTP静态网站。 注意&#xff1a;HTTP已经不建议使用。 本案例实战视频请参考&#xff1a; 通过存储托管静态网站http.mp4 创建Azure StorageV2 存储账户 账户类型选择“StorageV2&#xff08;通用版V2&#xff09;”&#xff1b; 本例中&#…