逻辑回归（解决分类问题）

逻辑回归（解决分类问题）

news/2024/7/27 12:16:52/文章来源:https://blog.csdn.net/m0_65995252/article/details/135579921

定义：逻辑回归是一种用于解决分类问题的统计学习方法。它通过对数据进行建模，预测一个事件发生的概率。逻辑回归通常用于二元分类问题，即将数据分为两个类别。它基于线性回归模型，但使用了逻辑函数（也称为S形函数）来将输出限制在0到1之间，表示事件发生的概率。逻辑回归可以通过最大似然估计或梯度下降等方法来进行参数估计，从而得到一个可以用于分类的模型。

一、逻辑回归入门

在分类肿瘤的例子中，我们将肿瘤分为恶性肿瘤和良性肿瘤。对于恶性肿瘤赋值1（yes），对良性肿瘤赋值0（no）。并在坐标系中表示出其数据集以及对应的拟合曲线如下：

二、逻辑函数（对数几率函数）

沿用上面的例子，假设原始数据集有一个值为0.7，我们应该如何来在坐标系中表示呢？我们需要引用一个逻辑函数来描述这些位于0~1中间的数据。

在所有的二分类问题中，我们需要将实值Z准华为0/1的值，最理想的函数肯定是分段函数（单位阶跃函数）：

$y=\begin{cases} 0& z<0\\ 0.5& z=0 \\ 1& z>0 \end{cases}$

但是分段函数不连续，因此不能单调可微调函数 $g^{-}(\cdot )$ 转化为线性模型。所以我们希望找到一个用于替代分段函数的“近似替代函数”，希望它能够单调可微。逻辑函数（Sigmoid function）正是这样一个函数：

$y=\frac{1}{1+e^{-z}}$ （1）

当我们将逻辑函数作为 $g^{-}(\cdot )$ 带入（1）式中可得：

$y=\frac{1}{1+e^{-(wx^{T}+b)}}$ （2）

经过变换后得到：

$ln\frac{y}{1-y}=w^{T}x+b$ （3）

若将y视作样本x为正例（恶性肿瘤）的可能性，则1-y是其反比的可能性，两者的比值 $\frac{y}{1-y}$ 称为几率（odds），反映了x作为正例的相对可能性。按照通俗的话来说，我们可以视逻辑回归的输出结果为对于给定的输入x情况下输出y=1的概率。

还是以肿瘤的例子说明：其中x为肿瘤尺寸，y为良性肿瘤0和恶性肿瘤1，如果从上述（2）中得到y=0.7，则说明对于x有70%的概率为恶性肿瘤。

逻辑函数常见形式：

$z=\vec{w}\cdot \vec{x}+b$

$f_{\vec{w},b}(\vec{x})=g(\vec{w}\cdot \vec{x}+b)=\frac{1}{1+e^{-(\vec{w}\cdot \vec{x}+b)}}=P(y=1|x;\vec{w},b)$

三、决策边界

在分类问题中，通过逻辑回归得到的输出只会是确定的整数；我们必须找到一个介于0~1之间的阈值flag作为决策边界。

判断的基本形式如下：通过样本值与flag进行比较来分类；

Is $f_{\vec{w},b}(\vec{x})\geq flag?$

Yes: $\hat{y}=1$ No: $\hat{y}=0$

因此，我们需要确定何时 $f_{\vec{w},b}(\vec{x})\geq flag$ 的点；

有逻辑函数的基本变形形式可知在此时必有：

$g(z)\geq flag\Rightarrow z>=flag\Rightarrow \vec{w}\cdot \vec{x}+b>=flag$

因此我们可以将 $z=\vec{w}\cdot \vec{x}+b$ 作为决策边界

非线性的决策边界

分析决策边界的函数我们不难发现，对于非线性的决策边界我们可以综合多项式回归的知识进行求解。如下图中，使用 $w_{1}x_{1}^2+w_{2}x_{2}^2=1$ 作为决策边界。

对于多元线性回归也可以同样推导

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.luyixian.cn/news_show_925704.aspx

如若内容造成侵权/违法违规/事实不符，请联系dt猫网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

MR-GCN

MR-GCN

∘ Φ \circ_Φ ∘Φ denotes a convolution Let b l o c k d i a g blockdiag blockdiag(A) be a n1n3-by-n2n3 block diagonal matrix， f o l d fold fold indicate its inverse operator diagonal degree tensor D \mathcal{D} D 作者未提供代码

阅读更多...

【学习心得】Git深入学习

【学习心得】Git深入学习

若您还未安装Git或是只想简单使用，可以先看看我的文章“Git快速上手”【学习心得】Git快速上手http://t.csdnimg.cn/gsaGj 一、深入学习Git必须熟悉两个概念 （1）【四个区】Git本地有三个区，远程仓库也可以看出成一个区域工作区…

阅读更多...

vtk9.3 + Visual Studio2019 + Cmake3.28 win11 上的环境安装（这个过程网上比较多，自己记录下过程加深下印象）

vtk9.3 + Visual Studio2019 + Cmake3.28 win11 上的环境安装（这个过程网上比较多，自己记录下过程加深下印象）

开始介绍欢迎来到 VTK！我们建议您首先阅读《VTK book》，这是一本全面的 VTK 指南，涵盖了其功能的所有方面。此外，您可能会发现探索 VTK 示例很有帮助，这是一组有用的参考资料，演示了如何使用 VTK 的不同模…

阅读更多...

ASP.NET Core 的 Web Api 实现限流中间件

ASP.NET Core 的 Web Api 实现限流中间件

Microsoft.AspNetCore.RateLimiting 中间件提供速率限制（限流）中间件。它是.NET 7 以上版本才支持的中间件，刚看了一下，确实挺好用，下面给大家简单介绍一下： RateLimiterOptionsExtensions 类提供下列用…

阅读更多...

Elasticsearch 7.8.0从入门到精通

Elasticsearch 7.8.0从入门到精通

安装Elasticsearch 7.8.0 官网：Elasticsearch 7.8.0 | Elastic 大家下载所需要的安装包即可。然后解压缩： Elasticsearch是通过java编写的，所以自带jdk。多好，下载Elasticsearch赠送jdk 0.0，不过一般我们用自己的jdk…

阅读更多...

利用Lambda表达式实现vector中pair/结构体的排序

利用Lambda表达式实现vector中pair/结构体的排序

众所周知，对于vector<pair<int, int> >若直接使用sort排序，会默认按照pair的第一个关键字从小到大进行排序： #include <bits/stdc.h>using namespace std;int main() {vector<pair<int, int> > p;p.push_back…

阅读更多...

select子句简单查询

select子句简单查询

Oracle从入门到总裁:https://blog.csdn.net/weixin_67859959/article/details/135209645 目录数据查询起别名连接编辑去重编辑另外补充几个不常用的命令如果要进行查询,那么需要使用数据操纵语言（Data Manipulation Language，DML&am…

阅读更多...

EChars

EChars

1.引入 Apache ECharts <!DOCTYPE html> <html><head><meta charset"utf-8" /><script src"echarts.js"></script></head> </html> 2. <!-- 为 ECharts 准…

阅读更多...

[自动驾驶算法][从0开始轨迹预测]：二、自动驾驶系统中常用的坐标系及相应的转换关系

[自动驾驶算法][从0开始轨迹预测]：二、自动驾驶系统中常用的坐标系及相应的转换关系

自动驾驶中常见的坐标系与坐标转换 1. 传感器坐标系1.1 相机坐标系统1) 相机相关基础知识2) 相机各坐标系图像/像素坐标系相机坐标系像平面坐标系 3) 相机各坐标系之间的转换像平面坐标系到像素坐标系的转换（平移缩放变换）相机坐标系转像平面坐标系&…

阅读更多...

tcpdump常用参数以及wireshark密文解密

tcpdump常用参数以及wireshark密文解密

tcpdump常用参数以及wireshark密文解密文章目录一、tcpdump命令和常用参数二、在wireshark中协议解析 tcpdump常用参数一、tcpdump命令和常用参数 tcpdump常用命令：tcpdump -i eth0 src host 11.6.224.1 and udp port 161 -s 0 -w 161.pcap （161为sn…

阅读更多...

自学Python，需要注意哪些？

自学Python，需要注意哪些？

为什么要学习Python？ 在学习Python之前，你不要担心自己没基础或“脑子笨”，我始终认为，只要你想学并为之努力，就能学好，就能用Python去做很多事情。在这个喧嚣的时代，很多技术或概念会不断兴起…

阅读更多...

解决BigDecimal序列化科学计数法前端展示问题(大坑)

解决BigDecimal序列化科学计数法前端展示问题(大坑)

解决BigDecimal序列化科学计数法前端展示问题(大坑) 前言：在生产中出现一个问题，就是BigDecimal类型的字段在前端页面展示变成科学计数法，通过排查，发现里面的坑还是挺多的，所以特意记录下处理过程。Json序列化&#x…

阅读更多...

ubuntu设置每天定时关机

ubuntu设置每天定时关机

ubuntu设置每天定时关机终端输入命令： sudo crontab -e输入密码，回车。我这里使用nano作为编辑器，你可以选择vim。在末尾输入以下命令： 59 23 * * * sudo -u root shutdown now设置：每天23:59分，电脑…

阅读更多...

深度强化学习的变道策略：Harmonious Lane Changing via Deep Reinforcement Learning

深度强化学习的变道策略：Harmonious Lane Changing via Deep Reinforcement Learning

偏理论，假设情况不易发生摘要多智能体强化学习的换道策略，不同的智能体在每一轮学习后交换策略，达到零和博弈。和谐驾驶仅依赖于单个车辆有限的感知结果来平衡整体和个体效率，奖励机制结合个人效率和整体效率的和谐。 Ⅰ. 简…

阅读更多...

Visual Studio 2022 成功配置QT5.12.10

Visual Studio 2022 成功配置QT5.12.10

目录下载并安装Visual Studio 2022 Qt5.12.10下载 Qt5.12.10安装 Qt VS Tools for Visual Studio 2022下载 Visual Studio 2022配置测试下载并安装Visual Studio 2022 下载社区版并安装，这个比较快。 Qt5.12.10下载官网下载很慢，还不如百度网…

阅读更多...

论文笔记（四十）Goal-Auxiliary Actor-Critic for 6D Robotic Grasping with Point Clouds

论文笔记（四十）Goal-Auxiliary Actor-Critic for 6D Robotic Grasping with Point Clouds

Goal-Auxiliary Actor-Critic for 6D Robotic Grasping with Point Clouds 文章概括摘要1. 介绍2. 相关工作3. 学习 6D 抓握政策3.1 背景3.2 从点云抓取 6D 策略3.3 联合运动和抓握规划器的演示3.4 行为克隆和 DAGGER3.5 目标--辅助 DDPG3.6 对未知物体进行微调的后视目标 4. 实…

阅读更多...

数据分析-Pandas如何整合多张数据表

数据分析-Pandas如何整合多张数据表

数据分析-Pandas如何整合多张数据表数据表，时间序列数据在数据分析建模中很常见，例如天气预报，空气状态监测，股票交易等金融场景。数据分析过程中重新调整，重塑数据表是很重要的技巧，此处选择Titanic数据…

阅读更多...

Linux命令之服务器的网络配置hostname,sysctl,ifconfig，service,ifdown,ifup,route,ping的使用

Linux命令之服务器的网络配置hostname,sysctl,ifconfig，service,ifdown,ifup,route,ping的使用

1、查看当前主机名称，编辑配置文件修改主机名为你姓名拼音的首字母（如张三，则为zs） 2、查看本机网卡IP地址，编辑/etc/sysconfig/network-scripts/ifcfg-ens33，要求在一块物理网卡上绑定2个IP地址&#xff0…

阅读更多...

【PHP】PHP利用ffmreg获取音频、视频的详细信息

【PHP】PHP利用ffmreg获取音频、视频的详细信息

目录一、目的二、下载并安装ffmreg 三、PHP代码四、运行结果一、目的使用PHP利用ffmreg获取音频、视频的详细信息，音视频总时长、码率、视频分辨率、音频编码、音频采样频率、实际播放时间、文件大小。二、下载并安装ffmreg 1、下载地址：htt…

阅读更多...

探索web技术与低代码开发的融合应用

探索web技术与低代码开发的融合应用

随着物联网、云计算和人工智能等技术的迅猛发展，现代软件开发正面临着日益增长的需求和复杂性。为了应对这一挑战，一种被称为低代码开发的快速、可视化开发方法逐渐崭露头角。本文将探讨低代码开发与web技术的融合应用，以及这种趋势对软件开发…

阅读更多...

推荐文章

最新文章