爬虫工作流程、请求与响应原理、requests库讲解

news/2024/4/26 23:44:51/文章来源:https://blog.csdn.net/weixin_55500281/article/details/128120096

爬虫工作流程、请求与响应原理、requests库讲解

爬虫分类主要分为两大板块

  • web爬虫(浏览器爬虫)

  • APP爬虫(手机端爬虫)

在这两大板块中又可以把爬虫归类为聚焦爬虫和通用爬虫

  • 聚焦爬虫:针对某一个接口(url)抓取 -使用requests第三方库

  • 通用爬虫:针对搜索引擎(百度,bing等)-使用scrapy、scrapy-redis框架

网络爬虫的基本工作流程

  • 首先序言去一部分精选挑选的种子url

  • 将这些url放入待抓取的url队列

  • 从待抓取的url队列中取出待抓取的url,解析DNS,并且得到主机的ip,并将url对应的网页下载下来,存储进一下载网页库中。此外,见这些URL放进已抓取url队列

  • 分析已抓取url队列中的URL,分析其中的其他URL,并将URL放入待抓取url队列,进入下一个循环

在这里插入图片描述

📌也可以这么描述四步基础流程:1.请求目标链接;2.获取响应内容;3.解析内容;4.存储数据;下面分别进行简单描述:

1.请求目标链接

发起一个带有header、请求参数等信息的Request,等待服务器响应;

2.获取响应内容

服务器正常响应后,Response的内容即包含所有页面内容(可以是HTML、JSON字符串、二进制数据(图片、视频)等等)

3.解析内容

得到的内容可能是HTML,可以用正则表达式,页面解析库进行解析;可能是Json字符串,可以直接转换为Json对象解析,可能是二进制数据,可以做保存或者进一步的处理……

4.存储数据

存储形式多样,可以存为文本,也可以存储到数据库,或者存为特定格式的文件;

下载安装requests工具包

我们在pycharm的Terminal终端,或者Anaconda终端可以运行

pip install requests

主要下载了一些依赖包

在这里插入图片描述

请求与响应

HTTP由两部分组成:请求与响应

在这里插入图片描述

客户端请求消息

客户端发送一个HTTP请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成。

在这里插入图片描述

📌爬虫中的请求:构造请求头→防止反爬(就是代码 请求失败)

我们要了解其中的请求方式、请求地址、请求头

下面给出一个网址中的请求

在这里插入图片描述

请求头hearder = {
Accept:请求数据类型(浏览器支持格式)
Accept-Encoding:请求数据的编码
Connection:链接方式
Cookie:在浏览器中的用户信息
Host:主机地址
User-Agent:浏览器类型(电脑信息、浏览器信息)
Referer:防盗链接(请求一个网站,验证你是从哪里来的)
}

请求方式:HTTP请求可以使用多种请求方法

在这里插入图片描述

GET和POST方法区别归纳如下几点:

  • GET是从服务器上获取数据,POST是向服务器传送数据。

  • GET请求参数显示,都显示在浏览器网址上,POST请求参数在请求体当中,消息长度没有限制而且以隐式的方式进行发送

  • 尽量避免使用Get方式提交表单,因为有可能会导致安全问题。比如说在登陆表单中用Get方式,用户输入的用户名和密码将在地址栏中暴露无遗。但是在分页程序中,用Get方式就比用Post好。

Http协议定义了很多与服务器交互的方法,最基本的有4种,分别是GET,POST,PUT,DELETE.

一个URL地址用于描述一个网络上的资源.而HTTP中的GET,POST, PUT, DELETE就对应着对这个资源的查,改,增,删4个操作。我们最常见的就是GET和POST了。GET一般用于获取/查询资源信息,而POST一般用于更新资源信息.

服务器的响应

HTTP响应也由四个部分组成,分别是:状态行、消息报头、空行和响应正文

在这里插入图片描述

爬虫中的响应:
数据:HTML、JS、CSS
响应头

响应状态码可以看一下这个blog

响应状态码

requests工具包

使用下面的代码进行导入

#导入requests库
import requests

一些常用的命名

requests.Request()  # 请求类
requests.request()  # 请求函数
requests.get()  # 常用 session.request
session.request(实例) # 实例

最常用的命令是,我们可以通过help查看

#发送一个get请求并得到响应
r = requests.get('https://www.baidu.com')
help(requests.get) 

在这里插入图片描述

在这里插入图片描述

我们可以看到使用get()函数,传递的参数

通过print操作还可以返回状态码,或者一些其他的操作


# ----------------------------------
#发送一个get请求并得到响应
r = requests.get('https://www.baidu.com')
#查看响应对象的类型
print(type(r))
#查看响应状态码
print(r.status_code)
#查看响应内容的类型
print(type(r.text))
#查看响应的内容
print(r.text)
#查看cookies
print(r.cookies)

我们通过解析可以返回的数据:text (返回字符串,不带解码功能)、 content(返回16进制数据) 、 content.decode() 、json,包括状态码、请求头等相关参数的反馈

​这里调用了get( )方法实现urlopen( )相同的操作,结果返回一个响应对象,然后分别输出响应对象类型、状态码、响应体内容的类型、 响应体的内容、Cookies。通过运行结果可以得知:响应对象的类型是requests.models.Response,响应体内容的类型是str,Cookies 的类型是RequestCookieJar。如果要发送其他类型的请求直接调用其对应的方法即可:

  • 返回状态码
url = 'https://www.bilibili.com/'
print(requests.get(url))
# -----------------------
# 运行结果
<Response [200]>
  • 返回响应内容(text、content.decode)
print(requests.get(url).text)
# -----------------------
# 运行结果
<!DOCTYPE html><html lang="zh-CN"><head><meta charset="utf-8"><title>哔哩哔哩 (-)つロ 干杯~-bilibili</title><meta name="description" content="bilibili是国内知名的视频弹幕网站,这里有及时的动漫新番,活跃的ACG氛围,有创意的Up主。大家可以在这里找到许多欢乐。"><meta name="keywords" content="Bilibili,哔哩哔哩,哔哩哔哩动画,哔哩哔哩弹幕网,弹幕视频,B站,弹幕,字幕,AMV,MAD,MTV,ANIME,动漫,动漫音乐,游戏,游戏解说,二次元,游戏视频,ACG,galgame,动画,番组,新番,初音,洛天依,vocaloid,日本动漫,国产动漫,手机游戏,网络游戏,电子竞技,ACG燃曲,ACG神曲,追新番,新番动漫,新番吐槽,巡音,镜音双子,千本樱,初音MIKU,舞蹈MMD,MIKUMIKUDANCE,洛天依原创曲,洛天依翻唱曲,洛天依投食歌,洛天依MMD,vocaloid家族,OST,BGM,动漫歌曲,日本动漫音乐,宫崎骏动漫音乐,动漫音乐推荐,燃系mad,治愈系mad,MAD MOVIE,MAD高燃"><meta name="renderer" content="webkit"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="spm_prefix" content="333.851"><meta name="referrer" content="no-referrer-when-downgrade"><meta name="baidu-site-verification" content="code-qkzzf7NQkQ"><meta name="applicable-device" content="pc"><meta http-equiv="Cache-Control" content="no-transform"><meta http-equiv="Cache-Control" content="no-siteapp"><link rel="canonical" href="https://www.bilibili.com/"><link rel="alternate" media="only screen and(max-width: 640px)" href="https://m.bilibili.com"><link rel="dns-prefetch" href="//s1.hdslb.com"><link rel="apple-touch-icon" href="//static.hdslb.com/mobile/img/512.png"><link rel="shortcut icon" href="/favicon.ico?v=1"><script type="text/javascript">function getIEVersion(){var e=99;if("Microsoft Internet Explorer"==navigator.appName){var t=navigator.userAgent;null!=new RegExp("MSIE ([0-9]{1,}[.0-9]{0,})").exec(t)&&(e=parseFloat(RegExp.$1))}return e}getIEVersion()<11&&(window.location.href="https://www.bilibili.com/blackboard/activity-I7btnS22Z.html")</script><script type="text/javascript">!function(){var i=window.navigator.userAgent,n=["Android","iPhone","SymbianOS","Windows Phone","iPod"],o=!0;if(!/\sVR\s/g.test(i)){for(var e=0,r=n.length;e<r;e++)if(0<i.indexOf(n[e])){o=!1;break}if(!o){var a=window.location.href.replace("www","m");window.location.href=a}}}()</script><script type="text/javascript">function getCookie(e){var o=new RegExp("(^| )"+e+"=([^;]*)(;|$)"),n=document.cookie.match(o);return n?unescape(n[2]):null}function reportfs(){window.performance&&window.performance.timing&&(window.performance.timing.firstscreenfinish=(new Date).getTime())}window.spmReportData={},window.reportConfig={sample:1,scrollTracker:!0,msgObjects:"spmReportData",errorTracker:!0},window.abtest||(window.abtest={}),window.abtest.b_ut=getCookie("b_ut"),window.abtest.i_wanna_go_back=getCookie("i-wanna-go-back"),window.page_load_time=Date.now()</script><link rel="prefetch" as="script" href="//s1.hdslb.com/bfs/static/player/main/video.js?v=20221123"><script type="text/javascript" src="//s1.hdslb.com/bfs/seed/jinkela/short/config/biliconfig.js"></script><script type="text/javascript" src="//www.bilibili.com/gentleman/polyfill.js?features=Promise%2CObject.assign%2CString.prototype.includes%2CNumber.isNaN"></script><script type="text/javascript" src="//s1.hdslb.com/bfs/static/jinkela/long/js/sentry/sentry-5.7.1.min.js"></script><script type="text/javascript" src="//s1.hdslb.com/bfs/static/jinkela/long/js/sentry/sentry-5.7.1.vue.min.js"></script><script type="text/javascript" src="//s1.hdslb.com/bfs/seed/log/report/log-reporter.js" crossorigin></script><link href="//s1.hdslb.com/bfs/static/jinkela/international-home/css/international-home.1.2184757120b051b37234cf788f278baae5395301.css" rel="stylesheet"><link href="//s1.hdslb.com/bfs/static/jinkela/international-home/css/international-home.0.2184757120b051b37234cf788f278baae5395301.css" rel="stylesheet"></head><body><div id="international-home-app"></div><div id="biliMainFooter"></div><script type="text/javascript" src="//s1.hdslb.com/bfs/cm/cm-sdk/static/js/pc.js"></script><div style="display:none"><a href="https://www.bilibili.com/v/game/match/">赛事库</a> <a href="https://www.bilibili.com/cheese/">课堂</a> <a href="https://www.bilibili.com/festival/2021bnj">2021拜年纪</a></div><script type="text/javascript" src="//s1.hdslb.com/bfs/static/jinkela/international-home/1.international-home.2184757120b051b37234cf788f278baae5395301.js"></script><script type="text/javascript" src="//s1.hdslb.com/bfs/static/jinkela/international-home/international-home.2184757120b051b37234cf788f278baae5395301.js"></script></body></html>
print(requests.get(url).content.decode('utf-8')) #这个也能完成相同操作
# -----------------------
# 运行结果
<!DOCTYPE html><html lang="zh-CN"><head><meta charset="utf-8"><title>哔哩哔哩 (-)つロ 干杯~-bilibili</title><meta name="description" content="bilibili是国内知名的视频弹幕网站,这里有及时的动漫新番,活跃的ACG氛围,有创意的Up主。大家可以在这里找到许多欢乐。"><meta name="keywords" content="Bilibili,哔哩哔哩,哔哩哔哩动画,哔哩哔哩弹幕网,弹幕视频,B站,弹幕,字幕,AMV,MAD,MTV,ANIME,动漫,动漫音乐,游戏,游戏解说,二次元,游戏视频,ACG,galgame,动画,番组,新番,初音,洛天依,vocaloid,日本动漫,国产动漫,手机游戏,网络游戏,电子竞技,ACG燃曲,ACG神曲,追新番,新番动漫,新番吐槽,巡音,镜音双子,千本樱,初音MIKU,舞蹈MMD,MIKUMIKUDANCE,洛天依原创曲,洛天依翻唱曲,洛天依投食歌,洛天依MMD,vocaloid家族,OST,BGM,动漫歌曲,日本动漫音乐,宫崎骏动漫音乐,动漫音乐推荐,燃系mad,治愈系mad,MAD MOVIE,MAD高燃"><meta name="renderer" content="webkit"><meta http-equiv="X-UA-Compatible" content="IE=edge"><meta name="spm_prefix" content="333.851"><meta name="referrer" content="no-referrer-when-downgrade"><meta name="baidu-site-verification" content="code-qkzzf7NQkQ"><meta name="applicable-device" content="pc"><meta http-equiv="Cache-Control" content="no-transform"><meta http-equiv="Cache-Control" content="no-siteapp"><link rel="canonical" href="https://www.bilibili.com/"><link rel="alternate" media="only screen and(max-width: 640px)" href="https://m.bilibili.com"><link rel="dns-prefetch" href="//s1.hdslb.com"><link rel="apple-touch-icon" href="//static.hdslb.com/mobile/img/512.png"><link rel="shortcut icon" href="/favicon.ico?v=1"><script type="text/javascript">function getIEVersion(){var e=99;if("Microsoft Internet Explorer"==navigator.appName){var t=navigator.userAgent;null!=new RegExp("MSIE ([0-9]{1,}[.0-9]{0,})").exec(t)&&(e=parseFloat(RegExp.$1))}return e}getIEVersion()<11&&(window.location.href="https://www.bilibili.com/blackboard/activity-I7btnS22Z.html")</script><script type="text/javascript">!function(){var i=window.navigator.userAgent,n=["Android","iPhone","SymbianOS","Windows Phone","iPod"],o=!0;if(!/\sVR\s/g.test(i)){for(var e=0,r=n.length;e<r;e++)if(0<i.indexOf(n[e])){o=!1;break}if(!o){var a=window.location.href.replace("www","m");window.location.href=a}}}()</script><script type="text/javascript">function getCookie(e){var o=new RegExp("(^| )"+e+"=([^;]*)(;|$)"),n=document.cookie.match(o);return n?unescape(n[2]):null}function reportfs(){window.performance&&window.performance.timing&&(window.performance.timing.firstscreenfinish=(new Date).getTime())}window.spmReportData={},window.reportConfig={sample:1,scrollTracker:!0,msgObjects:"spmReportData",errorTracker:!0},window.abtest||(window.abtest={}),window.abtest.b_ut=getCookie("b_ut"),window.abtest.i_wanna_go_back=getCookie("i-wanna-go-back"),window.page_load_time=Date.now()</script><link rel="prefetch" as="script" href="//s1.hdslb.com/bfs/static/player/main/video.js?v=20221123"><script type="text/javascript" src="//s1.hdslb.com/bfs/seed/jinkela/short/config/biliconfig.js"></script><script type="text/javascript" src="//www.bilibili.com/gentleman/polyfill.js?features=Promise%2CObject.assign%2CString.prototype.includes%2CNumber.isNaN"></script><script type="text/javascript" src="//s1.hdslb.com/bfs/static/jinkela/long/js/sentry/sentry-5.7.1.min.js"></script><script type="text/javascript" src="//s1.hdslb.com/bfs/static/jinkela/long/js/sentry/sentry-5.7.1.vue.min.js"></script><script type="text/javascript" src="//s1.hdslb.com/bfs/seed/log/report/log-reporter.js" crossorigin></script><link href="//s1.hdslb.com/bfs/static/jinkela/international-home/css/international-home.1.2184757120b051b37234cf788f278baae5395301.css" rel="stylesheet"><link href="//s1.hdslb.com/bfs/static/jinkela/international-home/css/international-home.0.2184757120b051b37234cf788f278baae5395301.css" rel="stylesheet"></head><body><div id="international-home-app"></div><div id="biliMainFooter"></div><script type="text/javascript" src="//s1.hdslb.com/bfs/cm/cm-sdk/static/js/pc.js"></script><div style="display:none"><a href="https://www.bilibili.com/v/game/match/">赛事库</a> <a href="https://www.bilibili.com/cheese/">课堂</a> <a href="https://www.bilibili.com/festival/2021bnj">2021拜年纪</a></div><script type="text/javascript" src="//s1.hdslb.com/bfs/static/jinkela/international-home/1.international-home.2184757120b051b37234cf788f278baae5395301.js"></script><script type="text/javascript" src="//s1.hdslb.com/bfs/static/jinkela/international-home/international-home.2184757120b051b37234cf788f278baae5395301.js"></script></body></html>
  • 返回图像等响应内容

这里找了一张图像的链接地址,我们可以看到他的返回是一串16进制

url = 'https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fpic1.win4000.com%2Fwallpaper%2F2018-06-27%2F5b3345789ca2c.jpg&refer=http%3A%2F%2Fpic1.win4000.com&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1672394670&t=14a6fb6eea7ec009b16745f4a56bb9ff'
print(requests.get(url,headers=headers).content)

在这里插入图片描述

  • 静态页面的反爬

打开F12,刷新页面之后找到User-Agent,可以对静态页面进行反爬

#  请求头
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36'
}
print(requests.get(url,headers=headers).content.decode('utf-8'))

运用这种方法可以在pycharm中看到较为格式化的参数

在这里插入图片描述

  • request信息的返回

请求对象:requset.headers

print(requests.get(url,headers=headers).request.headers)
# 返回内容如下
{'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/107.0.0.0 Safari/537.36', 'Accept-Encoding': 'gzip, deflate', 'Accept': '*/*', 'Connection': 'keep-alive'}

请求地址:request.url

print(requests.get(url,headers=headers).request.url)
# 返回内容如下
https://gimg2.baidu.com/image_search/src=http%3A%2F%2Fpic1.win4000.com%2Fwallpaper%2F2018-06-27%2F5b3345789ca2c.jpg&refer=http%3A%2F%2Fpic1.win4000.com&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=auto?sec=1672394670&t=14a6fb6eea7ec009b16745f4a56bb9ff

请求方法:request.method

print(requests.get(url,headers=headers).request.method)
# 返回内容如下
GET
  • response信息返回

状态码:status_code

print(requests.get(url,headers=headers).status_code)
# 返回内容如下
200

响应头部:headers (与请求头部区分)

print(requests.get(url,headers=headers).headers)
# 返回内容如下
{'Server': 'JSP3/2.0.14', 'Date': 'Wed, 30 Nov 2022 10:17:49 GMT', 'Content-Type': 'image/jpeg', 'Content-Length': '111412', 'Connection': 'keep-alive', 'Expires': 'Mon, 26 Dec 2022 02:48:20 GMT', 'Last-Modified': 'Wed, 07 Jan 1970 00:00:00 GMT', 'ETag': '829a82d1de66e50d1fe6000f856e5d2f', 'Age': '265527', 'Accept-Ranges': 'bytes', 'Access-Control-Allow-Origin': '*', 'Ohc-Global-Saved-Time': 'Sat, 26 Nov 2022 02:48:20 GMT', 'Ohc-Upstream-Trace': '36.156.185.60', 'Ohc-Cache-HIT': 'sq2cm60 [2], csix73 [2]', 'Ohc-Response-Time': '1 0 0 0 0 0', 'Ohc-File-Size': '111412', 'X-Cache-Status': 'HIT', 'Timing-Allow-Origin': '*'}

浏览器信息:cookies 返回的是一种cookies对象而不是浏览器中的值

print(requests.get(url,headers=headers).cookies)
# 返回内容如下
<RequestsCookieJar[]>

返回请求方法:request

print(requests.get(url,headers=headers).request)
# 返回内容如下
<PreparedRequest [GET]>

返回编码方式:encoding

url = 'https://www.baidu.com/'
print(requests.get(url,headers=headers).encoding)
# 返回内容如下
utf-8

一些关于requests的更具体的应用我们可以看下面的文章

requests应用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_39252.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

使用Conda

0. Anaconda Prompt 命令提示符 0.1 验证conda是否被安装 conda --version0.2 conda管理环境 可以用命令复制和删除环境 参考. 1. Conda管理包 1.1 常用包管理功能 查找包查看包安装包 查找分为精确查找和模糊查找&#xff0c;如下图所示 卸载包更新包 1.2 conda管理环…

三肽Gly-Cys-Gly、88440-55-5

三肽Gly-Cys-Gly 编号&#xff1a;111774 CAS号&#xff1a;88440-55-5 三字母&#xff1a;H2N-Gly-Cys-Gly-COOH 描 述&#xff1a;羧肽酶 U 抑制剂&#xff08;凝血酶可激活的纤维蛋白溶解抑制剂&#xff0c;TAFI&#xff09;&#xff0c;Ki 0.14 μM。编号: 111774 中文名称…

安装 laravel 遇到的错误和解决方案

安装 laravel 遇到的错误和解决方案 纯粹是为了运行下 laravel&#xff0c;遇到了错误记录下&#xff0c;分享给需要的人。 下载 PHP Windows 版 &#xff0c;我选择的版本是 PHP 7.4 (7.4.33)。下载文件以后找个文件夹解压就可以了。Composer 安装&#xff0c;官网 。 勾选以…

C/C++家族族谱管理系统

C/C家族族谱管理系统 课题名称: 家族族谱管理 主要目标: 通过训练&#xff0c;强化学生对树结构、二叉树结构的表示及操作算法的掌握和灵活运用 3.具体要求: 要求设计实现具有下列功能的家谱管理系统: (1) 输入文件以存放最初家谱中各成员的信息&#xff0c;成员的信息中…

WSL Ubuntu20.04安装pycairo指南

环境说明 wsl Ubuntu20.04 走过的一些可能有用的弯路 由于pycairo要求python3.7&#xff0c;但是之前Ubuntu上有个3.6的python环境&#xff0c;所以就安装了python3.8&#xff1a; sudo apt install python3.8然后python3命令还是链接到python3.6&#xff0c;结果就yongln …

iOS15适配 UINavigationBar和UITabBar设置无效,变成黑色

今天更新了xcode13&#xff0c;运行项目发现iOS15以上的手机导航栏和状态栏之前设置的颜色等属性都不起作用了&#xff0c;都变成了黑色&#xff0c;滚动的时候才能变成正常的颜色&#xff0c;经确认得用UINavigationBarAppearance和UITabBarAppearance这两个属性对导航栏和状态…

系统封装制作

工具网址&#xff1a; 镜像下载&#xff1a; Windows 10 22H2 - MSDN - 山己几子木 (sjjzm.com)pe工具&#xff1a;【新提醒】优启通 v3.7.2022.0910&#xff08;2022.10.14 发布&#xff09;_IT天空原创软件_IT天空 (itsk.com)万能驱动&#xff1a;万能驱动 v7.22.0912.2&…

IOC 的底层原理和Bean管理XML方式、xml注入集合属性

目录 什么是IOC IOC底层管理 工厂模式 IOC 的过程 IOC 接口 IOC 操作Bean 原理 Bean 管理操作有两种方式 1. 基于xml 配置方式创建对象 2. 基于xml方式注入属性 第二种使用有参数构造注入 p 名称空间注入 ICO操作Bean管理&#xff08;xml 注入其他类型属性&#xff…

翻转单词序列、按之字形顺序打印二叉树、二叉搜索树的第k个节点

1、翻转单词序列 本题考点&#xff1a;子串划分&#xff0c;子串逆置 牛客链接 题目描述&#xff1a; 牛客最近来了一个新员工Fish&#xff0c;每天早晨总是会拿着一本英文杂志&#xff0c;写些句子在本子上。同事Cat对Fish写的内容颇感兴趣&#xff0c;有一天他向Fish借来翻…

网络安全与IP安全

网络安全 是指网络系统的硬件&#xff0c;软件以及系统中的数据收到的保护。 保护的基本属性为&#xff1a;机密性&#xff0c;身份认证&#xff0c;完整性和可用性&#xff1b; 基本特征&#xff1a;相对性&#xff0c;时效性&#xff0c;相关性&#xff0c;不确定性&#xf…

azkaban表project_flows数据分析

project_flows表中数据是怎么存入进去的呢,其中有个JSON字符串是乱码,怎么设置的呢?搜索插入语句地方如下: 查看压缩类型,2为Gzip压缩 public enum EncodingType {PLAIN(1), GZIP(2); 查看flow.toObject方法,其实返回的是一个MAP,定义如下: 查看convertJsonToBytes方…

YonBuilder开发之后端函数

在前几期的文章中我们已经介绍过如何在YonBuilder中使用前端函数实现数据过滤功能。相对应于前端函数&#xff0c;在YonBuilder中还可以使用后端函数实现对于程序的扩展。通过前端函数实现的更多的是与页面交互相关的功能&#xff0c;而后端函数主要是用于预制按钮功能的扩展开…

自然算法 - AI面试基础补全

手撕BP神经网络手写Bert和Transformer&#xff08;BERT很细节的地方&#xff0c;比如文字标签CLS&#xff0c;par&#xff09;学习pytorch&#xff0c;tensorflow AI算法岗位 可看网站 牛客网站 面经回复 github 项目连接 算法工程师岗位必备知识 问答 ELMO、GPT、…

操作系统_多线程笔记(二)

文章目录1.线程状态2.多线程在的意义是什么?1.线程状态 状态是针对当前线程调度的情况来描述的,因为线程是系统调度的基本单位,所以状态是属于线程的属性 线程的六种状态: 注意: 1.一旦内核里的PCB消亡了,此时代码中创建的thread也就没有用了,即内核里的线程释放的时候无…

信号包络及其提取方法(Matlab)

信号包络及其提取方法 介绍信号包络&#xff0c;以及信号包络的提取方法。 一、信号包络 直观地从时域来讲&#xff0c;信号包络就是信号波形的轮廓。 本质上&#xff0c;信号包络是带通信号的基带部分。 一个实带通信号记为x(t)&#xff0c;将它频谱的中心频点搬移到零频…

Win,M1Mac上安装jupyter的MATLAB支持插件的方法

tags: MATLAB Win Mac Tips 写在前面 11月的最后一天了, 总结一下支持MATLAB的一个jupyter的插件, 有了这个你就可以在jupyter notebook或者jupyter lab上面使用MATLAB语句了, 还是很不错的, 虽然我安装了好久… 下面来说一下我在我的电脑以及朋友的电脑(Win11)上面安装这个…

实例方法(instance method)、类方法、构造方法(三)

实例方法&#xff08;没有static&#xff09;的概念 对象被称为实例。实例相关的有&#xff1a;实例变量、实例方法。实例变量是对象变量。实例方法是对象方法。实例方法没有static。&#xff08;对象方法&#xff0c;对象级别的方法&#xff09; 实例方法的调用需要先new一个…

高维多元时序数据聚类

1. 简介 收集数据的能力不断增强&#xff0c;使我们有可能收集大量的异构数据。在可用的异构数据中&#xff0c;时间序列代表着尚未被充分探索的信息母体。当前的数据挖掘技术在分析时间序列时存在多个缺点&#xff0c;尤其是在应同时分析多个时间序列&#xff08;即多维时间序…

JVM运行时数据 堆

JVM运行时数据 堆快速调试堆参数设置堆分类运行流程Minor GC、Major GC与Full GC分代思想内存分配策略TLAB堆空间参数设置快速调试 一个JVM实例只存在一个堆内存&#xff0c;对也是Java内存管理的核心区域Java 堆区在Jvm启动的时候创建&#xff0c;其空间大小也就确定了。是JV…

[附源码]计算机毕业设计springboot课室预约系统

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…