吃透《西瓜书》第三章 线性模型:对数几率回归

news/2024/4/20 14:45:48/文章来源:https://blog.csdn.net/m0_59334320/article/details/131987125

🍉 吃瓜系列 教材:《机器学习》 周志华著

🕒时间:2023/7/26

目录

一、对数几率回归

1.1 定义和基本思想

1.2 对数记录回归建模 

1.3 广义线性模型

1.3.1 指数族分布

1.3.2 广义线性模型的三条假设

1.4 对数几率回归的广义线性模型推导

1.5 最大似然估计

1.6 对数几率回归的参数估计(公式推导)


一、对数几率回归

1.1 定义和基本思想

定义:

对数几率回归(Logistic Regression)是一种常用的分类算法,主要用于将样本根据特征分成不同的类别。

线性回归模型返回的是一个实值

但是分类问题返回的是一个概率

基本思想是:

通过对数据进行建模,得到一个函数,将输入特征映射到一个概率值,该概率表示样本属于某一类别的概率。

具体来说,对数几率回归首先使用线性函数拟合输入特征,然后对线性函数的输出结果应用一个逻辑函数(sigmoid函数),将输出结果映射到0到1之间的概率值,进而进行分类。

优缺点:

对数几率回归有以下优点:

1. 运算速度快,适用于大规模数据集;
2. 不需要对输入数据做太多假设,表现较为稳定;
3. 输出结果为概率值,能够给出明确的分类结果。

但是,对数几率回归也存在以下缺点:

1. 对于非线性可分的数据,分类效果不佳;
2. 对于特征空间的高维度数据,容易出现“过拟合”情况,需要进行正则化处理;
3. 对噪声比较敏感。

1.2 对数几率回归建模 

因为单位跃迁函数是不连续的函数,在数据处理的时候比较困难

所以在此使用了一个替代函数

在机器学习中,我们通常使用对数几率函数去做一个替代函数

这种方法有很多优点,例如它是直接对分类可能性进行建模无需事先假设数据分布,这样就避免了假设分布不准确所带来的问题

它不是仅预测出“类别”,而是可得到近似概率预测,这对许多需利用概率辅助决策的任务很有用:

此外对率函数是任意阶可导的凸函数,有很好的数学性质,现有的许多数值优化算法都可直接用于求取最优解

对数几率的由来

得到 3.23 3.24 两个式子之后,对数几率回归的建模就算完成了!

 

1.3 广义线性模型

1.3.1 指数族分布

证明伯努利分布属于指数族分布

 

 这里变形的依据是:

 再次拆分成加法 

 

 对比指数分布的一般形式得出对应的参数

 

1.3.2 广义线性模型的三条假设

广义线性模型的三条假设:

1. 在给定 x  的条件下,假设随机变量 y 服从某个指数族分布

2.在给定 x 的条件下,我们的目标是得到一个模型 h(x)能预测出T(y)的期望值

3.假设该指数族分布中的自然参数  n 和 x 呈线性关系

 

 

1.4 对数几率回归的广义线性模型推导

 

使用上面的三个假设

 而 E[ y|x ] = E[ y ]

y 是服从伯努利分布的 所以期望是很好求出来的

 到此处,假设3 还没有用上

1.5 最大似然估计

最大似然估计

 

上面的转化,把累乘转换换成了累加

似然函数就转换成了对数似然函数

这样的话后续的求导会很方便

 

 

 或者

 这个式子相比于 3.26式子更容易进行公式的推导

1.6 对数几率回归的参数估计(公式推导)

  • 先使用 3.26 进行公式推导

 

 综合整理一下

 似然函数是求最大值的

损失函数求最小值,所以加一个负号  得到式子 3.27 

  • 另一种公式推导(更容易推导一点)

 

 似然函数是求最大值的

损失函数求最小值,所以加一个负号  得到式子 3.27 


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_337243.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

HTML一些基础知识

1、Web标准:主要包含结构、表现、行为。结构用于对网页元素进行整理和分类,主要指HTML。表现用于设置网页元素的板式、颜色、大小等外观样式,主要指的是CSS。行为主要指的是网页模型的定义以及交互的编写,主要是js文件。 Html相当…

kali Linux 工具 BurpSuite-暴力破解

关于渗透的实验,我们大多数能在kali的工具集找到,其中关于抓包工具BurpSuite的使用,我做一个比较简单的实验————————暴力破解—————————— 暴力破解,顾名思义,就是我们把密码一个个尝试,只…

【MySQL】索引特性

​🌠 作者:阿亮joy. 🎆专栏:《零基础入门MySQL》 🎇 座右铭:每个优秀的人都有一段沉默的时光,那段时光是付出了很多努力却得不到结果的日子,我们把它叫做扎根 目录 👉没…

ReID网络:MGN网络(1) - 概述

Start MGN 1. 序言 现代基于感知的信息中,视觉信息占了80~85%。基于视觉信息的处理和分析被应用到诸如安防、电力、汽车等领域。 以安防市场为例,早在2017年,行业咨询公司IHS Market,我国在公共和私人领域安装有摄像头约1.76亿…

docker启动容器报错

报错信息 [rootDream soft]# docker run -it -d -p 8080:8080 tomcat eec9fab6b9ca06d2bbf1467aef05d8020ee60448978e10ac20c38888934f0a0b docker: Error response from daemon: driver failed programming external connectivity on endpoint hungry_euclid (163242f0079e72…

数值分析第五章节 用Python实现解线性方程组的直接解法

参考书籍:数值分析 第五版 李庆杨 王能超 易大义编 第5章 解线性方程组的直接解法 文章声明:如有发现错误,欢迎批评指正 文章目录 引言与预备知识高斯消去法列主元消去法 矩阵三角分解法杜利特尔分解法平方根法 向量和矩阵的范数误差分析 引言…

Python 进阶(五):os 模块

❤️ 博客主页:水滴技术 🌸 订阅专栏:Python 入门核心技术 🚀 支持水滴:点赞👍 收藏⭐ 留言💬 文章目录 1. 文件和目录的基本操作1.1 获取当前工作目录1.2 更改当前工作目录1.3 获取目录下所有…

qssh使用

到官网下载qssh的源码QSsh-botan-1,使用qtcreator打开后,直接编译,即可得到qssh的库 头文件将QSsh-botan-1\src\libs\ssh目录下的.h文件拷到include文件夹下,即为库头文件。 qssh有个问题,如果你将qssh的类放在子线程…

致敬图灵!HashData拥抱数据智能新时代!

图1:2023ACM中国图灵大会现场 生于1912年的艾伦图灵被称为“计算机科学之父”、“人工智能之父”。1966年,国际计算机协会(ACM)为了纪念这位卓越的科学家,设立了以其名字命名的ACM图灵奖,以表彰在计算机领…

MySQL | 常用命令示例

MySQL | 常用命令示例 一、启停MySQL数据库服务二、连接MySQL数据库三、创建和管理数据库四、创建和管理数据表五、数据备份和恢复六、查询与优化 MySQL是一款常用的关系型数据库管理系统,广泛应用于各个领域。在使用MySQL时,我们经常需要编写一些常用脚…

【初阶C语言】整数比大小

各位大佬的光临已是上上签 在C语言刷题过程中,一定遇到过很多比大小的题目,那么本节就专门介绍比大小的方法,若大佬们还有更优解,欢迎补充呀! 本节讲解的方法主要有三种:1.条件判断 2.三目操作符 3.函数调…

干翻Dubbo系列第四篇:Dubbo3第一个应用程序细节补充

前言 不从恶人的计谋,不站罪人的道路,不坐亵慢人的座位,惟喜爱耶和华的律法,昼夜思想,这人便为有福!他要像一棵树栽在溪水旁,按时候结果子,叶子也不枯干。凡他所做的尽都顺利。 如…

14 Linux实操篇-进程管理(重点)

14 Linux实操篇-进程管理(重点) 文章目录 14 Linux实操篇-进程管理(重点)14.1 进程的基本操作14.1.1 进程和程序14.1.2 父进程和子进程14.1.3 常见的Linux进程14.1.4 显示系统执行的进程-ps14.1.5 终止进程-kill/killall14.1.6 查…

36.悬浮板

悬浮板 html部分 <div class"container"><div class"square"></div> </div>css部分 *{margin: 0;padding: 0; } body{background-color: #111;height: 100vh;overflow: hidden;display: flex;justify-content: center;align-it…

【小白必看】Python爬虫实战之批量下载女神图片并保存到本地

文章目录 前言运行结果部分图片1. 引入所需库2. 发送请求获取网页内容3. 解析网页内容并提取图片地址和名称4. 下载并保存图片完整代码关键代码讲解 结束语 前言 爬取网络上的图片是一种常见的需求&#xff0c;它可以帮助我们批量下载大量图片并进行后续处理。本文将介绍如何使…

机器学习 | Python实现NARX模型预测控制

机器学习 | Python实现NARX模型预测控制 目录 机器学习 | Python实现NARX模型预测控制效果一览基本介绍研究内容程序设计参考资料效果一览 基本介绍 机器学习 | Python实现NARX模型预测控制 研究内容 贝叶斯黑盒模型预测控制,基于具有外源输入的非线性自回归模型的预期自由能最…

绝美!轮到AI写真爆火了!18种AI视频制作教程;Llama 2微调的极速指南;Nijijourney官方AI绘画课 | ShowMeAI日报

&#x1f440;日报&周刊合集 | &#x1f3a1;生产力工具与行业应用大全 | &#x1f9e1; 点赞关注评论拜托啦&#xff01; &#x1f916; 摄影写真面临AI技术洗牌&#xff0c;一键生成杂志大片的时代来了 软件&#xff1a;midjourney & Stable Diffusion 模型&#xff…

TypeScript基础篇 - TS模块

目录 模块的概念 Export 语法&#xff08;default&#xff09; Export 语法&#xff08;non-default&#xff09; import 别名 Type Export语法【TS】 模块相关配置项&#xff1a;module【tsconfig.json】 模块相关配置项&#xff1a;moduleResolution 小节总结 模块的…

【LLM】大语言模型学习之LLAMA 2:Open Foundation and Fine-Tuned Chat Model

大语言模型学习之LLAMA 2:Open Foundation and Fine-Tuned Chat Model 快速了解预训练预训练模型评估微调有监督微调(SFT)人类反馈的强化学习(RLHF)RLHF结果局限性安全性预训练的安全性安全微调上手就干使用登记代码下载获取模型转换模型搭建Text-Generation-WebUI分发模型…

pytorch的发展历史,与其他框架的联系

我一直是这样以为的&#xff1a;pytorch的底层实现是c(这一点没有问题&#xff0c;见下边的pytorch结构图),然后这个部分顺理成章的被命名为torch,并提供c接口,我们在python中常用的是带有python接口的&#xff0c;所以被称为pytorch。昨天无意中看到Torch是由lua语言写的&…