机器学习——聚类分析

news/2024/4/20 4:11:34/文章来源:https://blog.csdn.net/qq_57150526/article/details/127619242

文章目录

        • 聚类分析
          • K-means算法
          • K-中心算法
          • DBSCAN算法

聚类分析

K-means算法
  1. 算法简要步骤
    1. 随机选取K个样本点(不一定来自样本数据)作为初始的质心
    2. 第一次迭代,将所有样本分配到这K个类中
      1. 对每个样本计算其到两个聚类中心的欧式距离(一般)将其分配到距离最近中心所在簇中
      2. 重新计算聚类中心,将其更新为该簇所有点的平均值。
      3. 计算本次迭代的准则函数JcJ_cJc为新的簇中心的每个属性与簇中所有点属性距离平方的累加
    3. 重复2步骤的1、2、3步,直到聚类中心不再变化或者达到最大迭代次数或者JcJ_cJc足够小
K-中心算法

算法简要步骤

  1. 随机选取K个中心点,通过距离(一般选用曼氏距离)划分样本

  2. 计算中心点被非中心点代替的总代价

    Cjih=djmin−dj−>原中心点C_{jih} = d_{jmin} - d_{j->原中心点}Cjih=djmindj>原中心点Cjih代表Oi被Oh代替,Oj被重新分配的代价,djmin代表Oi被Oh代替后Oj到所有中心的最小值,dj−>原中心点代表Oj到原来中心点的距离C_{jih}代表O_i被O_h代替,O_j被重新分配的代价,d_{jmin}代表O_i被O_h代替后O_j到所有中心的最小值,d_{j->原中心点}代表O_j到原来中心点的距离Cjih代表OiOh代替,Oj被重新分配的代价,djmin代表OiOh代替后Oj到所有中心的最小值,dj>原中心点代表Oj到原来中心点的距离

    TCih=∑j=1ACjih,TCih是Oi被Oh替代后的总代价TC_{ih} = \displaystyle\sum_{j = 1}^{A}C_{jih},TC_{ih}是O_i被O_h替代后的总代价TCih=j=1ACjihTCihOiOh替代后的总代价

  3. 选取一个最小代价,使Oh替代OiO_h替代O_iOh替代Oi

  4. 重复2,3步骤,直到代价不再减少为止

DBSCAN算法
  1. 相关概念

    • 邻域:对于任意给定样本x和距离ε\varepsilonε,x的邻域是指导样本x的距离不超过ε\varepsilonε的样本集合
    • 核心对象:若样本x的ε\varepsilonε邻域内至少包含特定数目(MinPts)的样本,则x是一个核心对象
    • 密度直达:若样本b在a的ε\varepsilonε邻域内,且a是核心对象,则称样本b由样本a密度直达
    • 密度可达:对于样本a、b,如果存在样例p1,p2,...,pnp_1,p_2,...,p_np1,p2,...,pn,其中,p1=a,pn=bp_1 = a,p_n= bp1=a,pn=b,且序列中每一个样本都与它前一个样本密度直达,则称样本a与b密度可达
    • 密度相连:对于样本a和b,若存在样本k是的a与k密度可达,且k与b密度可达,则a与b密度相连
  2. 相关算法

    image-20221031170015124

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_410086.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2022年12个最佳WordPress备份插件比较

您是否正在寻找可靠的WordPress备份插件来定期备份您的网站? 备份就像您网站的安全网。每当您的网站因任何原因崩溃时,您都可以快速恢复您的网站。但是您需要确保您的备份具有最新的更改,否则您可能会丢失重要数据。一个好的备份插件将确保您…

艾美捷藻红蛋白RPE化学性质文献参考

艾美捷藻红蛋白RPE背景: R-藻红蛋白是从海藻(甘紫菜或高氏肠枝藻)分离的藻胆蛋白家族成员。从红藻中分离得到 R- 藻红蛋白(PE)。其主吸收峰位于565nm,次吸收峰位于496nm 和545nm。次级峰的相对显著性在不同种的 R-PE 中差异显著。…

前端开发学习之【Vue】-下

文章目录Vuex1.概述2.使用3.四个 map 方法4.模块化命名空间Vue Router1.SPA2.路由3.基本使用4.多级路由5.路由传参query参数6.命名路由7.路由传参params参数8.路由的props配置9.路由跳转方式10.缓存路由11. activated deactivated生命周期钩子12.路由守卫13.路由器的两种工作模…

极限多标签算法: FastXML 的解析

文章目录前言1.关于极限多标签 (XML: eXtreme multi-label Classification)1.1 流派1.2 评价指标2.FastXML2.1 FastXML的特点2.2 FastXML的局部性2.3 FastXML的拟合目标2.4 通过代码分析FastXML的拟合细节2.4.1 r\mathbf{r}^{}r的优化与拟合2.4.2 δ\deltaδ的优化与拟合 ---- …

知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3

知识图谱-命名实体-关系-免费标注工具-快速打标签-Python3一、功能介绍1、代码文件夹结构2、运行环境3、自定义命名实体、关系模板4、导入文件5、选择自定义实体和关系文件6、文本标注7、撤销和取消标注8、导出和导出并退出系统9、导出文件后解析10、标注规范和KG规范11、系统提…

SQL学习二十、SQL高级特性

约束(constraint) 管理如何插入或处理数据库数据的规则。 DBMS 通过在数据库表上施加约束来实施引用完整性。 大多数约束是在 表定义中定义的,用 CREATE TABLE 或 ALTER TABLE 语句。 1、主键 (PRIMARY KEY) 主键是…

AMCL代码详解(六)amcl中的重采样

1.重采样判断 上一章讲述了amcl中如何根据激光观测更新粒子权重,当粒子更新完后amcl会需要根据程序判断是否需要进行重采样。这个判断在粒子观测更新权重后进行判断,代码在amcl_node.cpp中: if(!(resample_count_ % resample_interval_)){ p…

[GYCTF2020]Easyphp

尝试了一下万能密码不行,又到处翻了一下,扫目录结果又有www.zip 审计代码好久,序列化和sql结合的题还是第一次见,太菜了呀,花了很久时间才理解这个题 首先看到update.php,这个文件是最亮眼的,…

javascript 原生类 DOMParser 把 字符串格式的HTML文档源码 转换成 document DOM对象

文章目录IntroQADOMParser 在 console 的使用cheerio 在 node 项目中的使用Reference测试sumIntro 有一天我在写爬虫。 其实也说不上是爬虫,就是打开浏览器上网,觉得页面有些数据挺有意思,就打开开发者工具,在 Network/Console 中…

01.初识C语言1

一、前期准备 1.gitee网址(代码托管网站):工作台 - Gitee.com Git教程 - 廖雪峰的官方网站 (liaoxuefeng.com) 用法: 1)新建仓库 2)随意勾选 3)网络仓库构建完成 2.所学知识:计算…

【期末大作业】基于HTML+CSS+JavaScript网上订餐系统(23个页面)

🎉精彩专栏推荐 💭文末获取联系 ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 💂 作者主页: 【主页——🚀获取更多优质源码】 🎓 web前端期末大作业: 【📚毕设项目精品实战案例 (10…

Jetson Orin 平台单进程采集四路独立video调试记录

1. 概述 现在有4个摄像头, 如何捕获4个摄像头(/dev/video0 - video3)在一个进程像这样: 现在只能捕捉一个相机使用gst-launch如下: gst-launch-1.0 v4l2src device=/dev/video0 ! video/x-raw,width=1280,height=720 ! videoconvert ! video/x-raw,format=I420 ! xvimagesi…

《设计模式:可复用面向对象软件的基础》——行为模式(2)(笔记)

文章目录五、行为模式5.5 MEDIATOR(中介者)1.意图补充部分2.动机3.适用性4.结构5.参与者6.协作7.效果8.实现9.代码示例10.相关模式5.6 MEMENTO ( 备忘录)1.意图2.别名3.动机4.适用性5.结构6.参与者7.协作8.效果9.实现10.代码示例11.相关模式5.7 OBSERVER (观察者)1.意图2.别名3…

21.C++11

C11的官网:C11 - cppreference.com 1.C11简介 在2003年C标准委员会曾经提交了一份技术勘误表(简称TC1),使得C03这个名字已经取代了C98称为C11之前的最新C标准名称。不过由于TC1主要是对C98标准中的漏洞进行修复,语言的核心部分则没有改动&am…

Java语言实现猜数字小游戏

之前笔者在学习C语言的初级阶段,就已经实现了用C语言简单实现猜数字小游戏,既然笔者最近在学习Java的初级阶段,那么,也应该写一个Java语言实现的猜数字小游戏!! C语言实现猜数字小游戏:原文链接…

浏览器播放rtsp视频流:4、jsmpeg+go实现局域网下的rtsp视频流web端播放

文章目录1.前言2.资料准备3.兼容性及适用性说明4.jsmpeg架构5.基于以上架构的go方案可行性分析6.编译和结果展示(编译坑点)7.最后1.前言 之前的rtsp转webrtc的方案存在如下缺陷:1.只支持h264;2.受限于webrtc的理解难度以及搭建tu…

Hproxy项目前端

hproxy项目前端使用vue-element-admin框架,页面为hook列表,和一个添加hook页面。 添加路由 编辑src/router/index.js文件,在constantRoutes列表追加如下路由内容 {path: /hproxy,component: Layout,redirect: /hproxy/index,hidden: false,c…

各省市软考准考证打印时间,一起来看!

距离软考还有一周,各个省市的准考证也开始打印了! 各地防疫政策一定要遵守,不然错过,又等一年! 周末也有一些省市因疫情推迟、取消考试的。 一起来看! 考完之后,会在这里讨论一些答案&#x…

UWB室内定位系统铸造智能化企业安全管理系统

进入工业4.0时代以来,数字技术不断成熟、扩散和融合,加速推动工业企业数字化、智能化转型。企业推进数字化转型要整体规划、分布实施,需要考虑企业经营管理活动的全过程、全范围、全层级。各大行业已经开始配备UWB人员定位系统,提…

电脑C盘怎么清理到最干净

如果你的电脑C盘运行内存已经快满了,这个时候你怎么处理?让我们来看看如何清理C盘。 c如何清理盘: 方法一:存储状态 点击电脑win键,在设备左侧弹出提示框,进入系统配置,然后点击系统软件选项…