机器学习中常见性能度量汇总

news/2024/5/19 1:34:00/文章来源:https://blog.csdn.net/qq_41552508/article/details/126982459

前言

如果你对这篇文章可感兴趣,可以点击「【访客必读 - 指引页】一文囊括主页内所有高质量博客」,查看完整博客分类与对应链接。


回归

在回归任务上,目前最常用的性能度量方式是均方误差 (Mean Squared Error, MSE):
MSE=1m∑i=1m(f(xi)−yi)2\text{MSE}=\frac{1}{m}\sum_{i=1}^m (f(\bm{x}_i)-y_i)^2 MSE=m1i=1m(f(xi)yi)2

其余还有均方根误差 (Root Mean Squared Error, RMSE):
RMSE=1m∑i=1m(f(xi)−yi)2\text{RMSE}=\sqrt{\frac{1}{m}\sum_{i=1}^m (f(\bm{x}_i)-y_i)^2} RMSE=m1i=1m(f(xi)yi)2

平均绝对误差 (Mean Absolute Error, MAE):
MAE=1m∑i=1m∣f(xi)−yi∣\text{MAE}=\frac{1}{m}\sum_{i=1}^m \left|f(\bm{x}_i)-y_i\right| MAE=m1i=1mf(xi)yi

平均绝对百分比误差 (Mean Absolute Percentage Error, MAPE):
MAPE=100%m∑i=1m∣f(xi)−yiyi∣\text{MAPE}=\frac{100\%}{m}\sum_{i=1}^m \left|\frac{f(\bm{x}_i)-y_i}{y_i}\right| MAPE=m100%i=1myif(xi)yi

R-squared 又称决定系数 (Coefficient of Determination),在统计学中用于度量因变量的变异中可由自变量解释部分所占的比例,以此来判断回归模型的解释力:
R2=1−MSEVar=1−∑i=1m(f(xi)−yi)2∑i=1m(yˉ−yi)2\text{R}^2=1-\frac{\text{MSE}}{\text{Var}}=1-\frac{\sum_{i=1}^m (f(\bm{x}_i)-y_i)^2}{\sum_{i=1}^m (\bar{y}-y_i)^2} R2=1VarMSE=1i=1m(yˉyi)2i=1m(f(xi)yi)2

该数值越大越好,但当数据分布方差较大时,即使预测不准,R2\text{R}^2R2 依然较大,此时该评价指标效果就不太好。


分类

在分类任务上,最常用的性能度量方式是错误率 (Error Rate, Err) 与精度 (Accuracy, Acc),其同时适用于二分类与多分类:
Err=1m∑i=1mI(f(xi)≠yi)Acc=1−Err=1m∑i=1mI(f(xi)=yi)\begin{gathered} \text{Err} = \frac{1}{m}\sum_{i=1}^m \mathbb{I}(f(\bm{x}_i)\neq y_i) \\ \text{Acc} = 1-\text{Err} = \frac{1}{m}\sum_{i=1}^m \mathbb{I}(f(\bm{x}_i)=y_i) \end{gathered} Err=m1i=1mI(f(xi)=yi)Acc=1Err=m1i=1mI(f(xi)=yi)

二分类

在信息检索、Web 搜索等应用中,我们会更关心查准率、查全率等相关指标,由此引出混淆矩阵 (Confusion Matrix),具体定义如下所示:

在这里插入图片描述
依据混淆矩阵,我们可以定义查准率 (Precision, P)、查全率 (Recall, R):
P=TPTP+FPR=TPTP+FN\begin{gathered} P =\frac{TP}{TP+FP} \\ R =\frac{TP}{TP+FN} \\ \end{gathered} P=TP+FPTPR=TP+FNTP

进而定义 F1-scoreF1\text{-}scoreF1-score (F1F1F1)、FβF_\betaFβ-score (FβF_\betaFβ),其中 β>0\beta>0β>0 度量了查全率对查准率的相对重要性,当 β>1\beta>1β>1 时查全率有更大影响,当 β<1\beta<1β<1 时查准率有更大影响。
F1=2×P×RP+RFβ=(1+β2)×P×R(β2×P)+R\begin{gathered} F1=\frac{2\times P\times R}{P+R} \\ F_\beta = \frac{(1+\beta^2)\times P\times R}{(\beta^2 \times P) + R} \end{gathered} F1=P+R2×P×RFβ=(β2×P)+R(1+β2)×P×R

另外,在许多关注排序本身质量的应用中,AUC (Area Under ROC Curve) 是一种常见的指标,计算方式如引理 1 所示,其对应的 ROC 曲线如下图所示。
在这里插入图片描述

在这里插入图片描述

多分类

在多分类任务上,通常会对应 nnn 个混淆矩阵,此时可以直接对各混淆矩阵求均值,定义宏查准率 (macro-Pmacro\text{-}Pmacro-P)、宏查全率 (macro-Rmacro\text{-}Rmacro-R) 以及宏 F1F1F1 (macro-F1macro\text{-}F1macro-F1):
macro-P=1n∑i=1nPimacro-R=1n∑i=1nRimacro-F1=2×macro-P×macro-Rmacro-P+macro-R\begin{gathered} \text {macro-} P=\frac{1}{n} \sum_{i=1}^{n} P_{i} \\ \text {macro-} R=\frac{1}{n} \sum_{i=1}^{n} R_{i} \\ \text {macro-} F1=\frac{2 \times \text {macro-} P \times \text {macro-} R}{\text {macro-} P+\text {macro-} R} \end{gathered} macro-P=n1i=1nPimacro-R=n1i=1nRimacro-F1=macro-P+macro-R2×macro-P×macro-R

也可以先对混淆矩阵中各元素求平均,得到 TPTPTPFPFPFPTNTNTNFNFNFN 的均值 TP‾\overline{TP}TPFP‾\overline{FP}FPTN‾\overline{TN}TNFN‾\overline{FN}FN,进而定义微查准率 (micro-Pmicro\text{-}Pmicro-P)、微查全率 (micro-Rmicro\text{-}Rmicro-R)、微 F1F1F1 (micro-F1micro\text{-}F1micro-F1):
micro-P=TP‾TP‾+FP‾micro-R=TP‾TP‾+FN‾micro-F1=2×micro-P×micro-Rmicro-P+micro-R\begin{gathered} \text {micro-}P=\frac{\overline{TP}}{\overline{TP}+\overline{FP}} \\ \text {micro-}R=\frac{\overline{TP}}{\overline{TP}+\overline{FN}} \\ \text {micro-}F1=\frac{2 \times \text {micro-}P \times \text {micro-}R}{\text {micro-}P+\text {micro-}R} \end{gathered} micro-P=TP+FPTPmicro-R=TP+FNTPmicro-F1=micro-P+micro-R2×micro-P×micro-R

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_11776.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

flex布局

flex布局 开启flex功能 <html><head><style>.container{border: 1px solid #000;width: 400px;height: 400px;margin-left: 20px;margin-top: 20px;display: flex; // 开启flex布局}.item{width: 100px;height: 100px;color: #fff;text-align: center;line…

kubernetes(2)k8s环境搭建:kubeadm安装、二进制方式安装

环境平台规划 k8s里面之前我们了解过&#xff0c;主要的内容是master和node&#xff0c;所有这里可以划分为 单master集群多master集群 单master集群 缺点&#xff1a;master挂掉后&#xff0c;便不能去管理node节点了 多master集群 与之前的区别便是多了master 服务器硬件…

Prometheus监控进程

Prometheus监控进程 process-export主要用来做进程监控&#xff0c;比如某个服务的进程数、消耗了多少CPU、内存等资源。 一、process-exporter使用 ‍ 1.1 下载 process-exporter process-exporter GibHUB地址 process-exporter 下载地址 process-exporter可以使用命令行…

图解LeetCode——854. 相似度为 K 的字符串(难度:困难)

一、题目 对于某些非负整数 k &#xff0c;如果交换 s1 中两个字母的位置恰好 k 次&#xff0c;能够使结果字符串等于 s2 &#xff0c;则认为字符串 s1 和 s2 的 相似度为 k 。 给你两个字母异位词 s1 和 s2 &#xff0c;返回 s1 和 s2 的相似度 k 的最小值。 二、示例 2.1…

C语言手写HTTPD网站服务器

网站服务器&#xff08;HTTPD&#xff09;已经有很多版本&#xff0c;但是大部分对初学者都非常不友好。适合初学者学习的httpd服务器&#xff0c;最负盛名的当数tinyhttpd, 但是这个版本&#xff0c;是基于Linux系统的&#xff0c;而且配套的CGI也是使用perl语言写的&#xff…

宝塔面板修改secure_file_priv设置

1、secure_file_priv文件作用 mysql读取系统文件权限的设置参数 2、查询secure_file_priv设置 show variables like %secure%; 3、修改secure_file_priv设置 设置 secure_file_priv"/" 需要修改mysql配置文件my.cnf my.cnf文件有两个位置 /etc/my.cnf /www/serv…

线程安全简述

目录 1、线程是否安全 2、出现线程安全的原因如下&#xff1a; 3、原子性问题 4、synchronized关键字 1、锁对象 2、用法&#xff1a; 3、可重入锁 5、内存可见性 6、volatile关键字 7、JMM 1、线程是否安全 线程不安全就是一些代码在多线程的运行状态下&#xff0c…

一个基于.Net Core开发的适合外贸商城系统

今天给大家推荐一个适合外贸的商城系统。 项目简介 这是一个基于.Net Core开发的&#xff0c;兼容PC、平板、移动端的商城系统。被下载次数超过300w&#xff0c;拥有最活跃的成员&#xff0c;由专业团队开发与支持。支持PayPal、信用卡、发票支付。 技术架构 1、跨平台&…

Jmeter电商系统压测实战<二>

目录一、Jmeter优化tips二、Jmeter的使用建议-参数配置1. XX:MaxMataspaceSize&#xff08;jdk8的参数&#xff09;2. -Xmx2048m3. -Xms1g三、Jmeter插件1. 介绍及安装2. 常用插件四、Jmeter日志收集1. 概览2. elk&#xff0c;kibana和es的安装和配置3. Prometheus和Node Expor…

全系标配L2占比首次突破30%,「数据」赛道争夺战一触即发

智能驾驶的进阶战&#xff0c;无论是提升车型产品竞争力&#xff0c;还是为高阶功能和现有功能优化提供闭环数据迭代&#xff0c;全系标配已经成为主流趋势。 如果说智能化1.0阶段&#xff0c;车企拼的是技术的快速落地和高阶能力的标杆效应&#xff0c;那么2.0阶段就是拼规模…

python中validators库用法详解

首先安装validators库&#xff1a; pip install validators validators.between(value, minNone, maxNone) 验证一个数字value是否在最小值min和最大值max之间&#xff0c;value不仅仅可以是整数&#xff0c;也可以是其它数据类型&#xff0c;例如floats, decimals 和 dates。…

Three使用OimoPhysics实现物体相关物理特性实例

基础环境搭建&#xff1a; InstancedMesh()创建的立方体物品集合&#xff1a; boxes new THREE.InstancedMesh(new THREE.BoxGeometry(0.1, 0.1, 0.1),new THREE.MeshLambertMaterial(),100)const matrix new THREE.Matrix4()const color new THREE.Color()for (let i 0; i…

Win11 22H2 22621.521大版本更新!

注意&#xff01;注意&#xff01;Win11 22H2 22621.521大版本更新啦&#xff0c;此次更新带来了不小的优化和改进&#xff0c;包括带有标签的更新文件资源管理器、更丰富的开始菜单和任务栏体验、增强的搜索功能、对改进的安全性和无密码登录的支持等等。 让每个人都能更轻松、…

生成网络论文阅读styleGAN1(一):论文速览

研究什么内容 研究如何把生成图片当中的内容拆分开 研究方法 为了把各种风格分开先得把控制信息分开输入&#xff0c;于是作者就分开输入了&#xff0c;在PGGAN的基础上分开输入&#xff0c;取得了好的效果。 个人理解 1.这里能取得好效果的主要原因是PGGAN的逐渐提升像素…

多模块间通信存在完美的设计么?

一、前言 在 App 的使用中&#xff0c;常常会有一些功能的依赖&#xff0c;比如评论需要用户登录、支付需要用户实名绑定银行卡等。从代码开发角度而言&#xff0c;如果我们的项目使用了多模块&#xff0c;那么也就会出现模块依赖的场景&#xff0c;比如评论模块依赖登录模块提…

企业复杂的数据治理需求,TempoDF让数据开发更简单!

伴随着企业的发展以及信息化建设的不断深入&#xff0c;业务之间不关联、数据之间彼此独立、流程之间相互封闭的现象越来越普遍&#xff0c;“数据孤岛”问题愈发严重&#xff0c;已成为制约企业发展的桎梏。 为了实现企业全局数据的系统化运作管理&#xff0c;不少企业开始着…

PDF转换成PPT后格式混乱,可能这个没做好

PDF转换成PPT后格式混乱怎么处理?这类问题其实对于经常使用PPT的朋友们来说并不陌生。我们有时候需要把一篇PPT演讲稿转换成PDF文档&#xff0c;但在操作过程中常常不仅过程复杂且效果不理想。有时甚至在转化之后出现格式混乱&#xff0c;影响了阅读体验不说&#xff0c;还会让…

WPF 图片头像自由剪切器实时截图细节放大器

本文参考博文&#xff1a;WPF 自定义图片剪切器 - 头像剪切&#xff08;扩展与完善、实时截图&#xff09; 在网上找了好久都找不到合适的截图框架&#xff0c;只能用WPF 自定义图片剪切器 - 头像剪切&#xff08;扩展与完善、实时截图&#xff09;_孤夜一点星的博客-CSDN博客…

《uni-app》表单组件-form表单

本文分享的Form组件为uni-app的内置组件Form&#xff0c;非扩展组件&#xff0c;两者在用法上其实大同小异&#xff0c;只是扩展组件的属性以及事件更多…没有本质上的区别&#xff5e; 《uni-app》表单组件-form表单一. 简介二. 基础用法三. submit事件四. reset事件五. repor…

虚拟机是什么意思?

&#x1f308; 个人主页&#xff1a;python老鸟的博客 &#x1f506; 所属专栏&#xff1a;Python基础教程 ❤️ 刷题 &#x1f449; Python练习题库&#xff0c;不断更新中~~ &#x1f64f; 如果觉得博主文章对你有所帮助的话&#xff0c;还望大家多多支持呀&#xff01;关注 …