k邻近算法应用实例(一) 改进约会网站的配对效果

news/2024/4/29 7:13:57/文章来源:https://blog.csdn.net/weixin_34349320/article/details/88960794

k邻近算法实例额(一)

改进约会网站的配对效果

应用背景:

某约会网站收集了一些数据放在datingTestSet.txt中,每个样本数据占据一行,总共有1000行。样本主要包含以下3种特征:
□ 每年获得的飞行常客里程数
□ 玩视频游戏所耗时间百分比
□ 每周消费的冰淇淋公升数
在将上述特征数据输人到分类器之前,必须将待处理数据的格式改变为分类器可以接受的格式 。在kNN.py中创建名为file2matrix的函数,以此来处理输人格式问题。该函数的输人为文件名字符串输出为训练样本矩阵和类标签向量。

转换数据生成数据集

在kNN.py 中添加下面的函数:

def file2matrix(filename): # 打开文件fr = open(filename)# 逐行读取arrayOLines = fr.readlines()# 获取总函数numberOfLines = len(arrayOLines) # 初始化矩阵returnMat = zeros((numberOfLines,3)) # 初始化标签数组classLabelVector = []index = 0for line in arrayOLines:# 头尾部格式化line = line.strip()# 根据tab切分listFromLine = line.split('\t')# 矩阵单行赋予元素returnMat[index, :] = listFromLine[0:3]   # 标签数据赋值  classLabelVector.append(int(listFromLine[-1])) index += 1return returnMat,classLabelVector

进入终端:
图片描述

使用Matplotlib分析数据

使用Matplotlib创建数据集的散点图, 进入终端:
图片描述

得到绘图:
图片描述
如上图散点图使用矩阵的第二、第三列数据,分别表示特征值“玩视频游戏所耗时间百分比”(x轴)和 “每周所消费的冰淇淋公升数”(y轴)

由于没有使用上各组数据等标签, 所以我们很难从上图看出有用的信息,Matplotlib库提供了scatter函数支持个性化标记散点图上的点, 所以我们重新进入终端:
图片描述

获得新的绘图:
图片描述

未完待续·····

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_714224.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新手建站图文教程

目录一、购买域名和空间二、虚拟空间配置三、上传网站源码四、域名绑定五、域名备案一、购买域名和空间1、什么是域名?域名(英语:Domain Name),简称域名、网域,是由一串用点分隔的名字组成的Internet上某一…

Windows下IIS中不能添加网站

1、问题描述 2、解决方案 主要是inetsrv这个文件除了问题,我是在另一台正常的windows系统中复制这个文件,覆盖到出问题的系统中,然后IIS就初始化了

python爬取携程和蚂蜂窝的景点评论数据\python爬取携程评论数据\python旅游网站评论数...

本人长期出售超大量微博数据、旅游网站评论数据,并提供各种指定数据爬取服务,Message to YuboonaZhangYahoo.com。同时欢迎加入社交媒体数据交流群:99918768 前言 为了获取多源数据需要到各个网站获取一些景点的评论信息和图片,首…

部分网站为什么上不去_天机SEO:分析网站收录与排名的重要因素

多年以来、B哥一直奋斗在SEO一线。只有在实战中才可以进步,才能发现问题所在。一些小技巧和小知识、也经常发在公众号中。前段时间听到一些不和谐的声音。因为我的文章末尾都会留下天机平台的广告、许多人说我的文章都是水文,在割韭菜!谁都需…

mdk 加static会被优化吗_网站关键词排名优化你会吗?深圳龙岗网络外包公司讲解...

除了付费推广之外,目前的网络推广方式是搜索引擎优化,效果好,性价比高。SEO优化无非是提高公司网站的关键词排名,这样不仅可以提高网站的权重和排名,还可以给网站带来大量的流量,提高转换率。那么网站关键词…

连锁加盟网站源码_连锁60秒:招商只是开始,养商才最重要

今天是连锁60秒陪伴你的第 175 天作者:连锁服务员(wangning900912)来源:连锁服务员(lsfwy01)加盟商的资源怎么来?传统的方式是一个市场一个市场的去跑,找到利益相关者,找到潜在的加盟商资源,然后进行相关的…

java 沙盒模拟支付_网站对接paypal支付接口记录

注册企业账户,paypal账户必须升级为商户,才能实现回调功能,若使用个人用户也可以实现支付,但是无法回调,技术理论层面,如果要实现个人账户回调,只能实现前端回调。paypal商户账户需要进行设置回…

50 个 jQuery 插件可将你的网站带到另外一个高度 【已翻译100%】

Web领域一直在发生变化并且其边界在过去的每一天都在发生变化(甚至不能以小时为计),随着其边界的扩展取得了许多新发展。在这些进步之中,开发者的不断工作创造了更大和更好的脚本,这些脚本以插件方式带来更好的终端用户…

社交网路Reddit前高管推出新网站挑战前东家

美国知名社区Reddit曾经的二号人物丹麦考玛斯(Dan McComas)希望建设一个更好的Reddit,专注于“健康而积极的社区”。此前,麦考玛斯对Reddit上存在的煽动性群组提出了激烈批评。 麦考玛斯此前与维多利亚泰勒(Victoria T…

iis p访问php密码,访问IIS网站需要输入用户名密码(非匿名登录)问题汇总

无语了,最近不少Windows服务器都出现这个访问网站需要输入的问题,而且每次解决方法还不一样。。。唉,先汇总下解决方法吧,有时间再仔细研究下这些问题是如何导致的。当IIS已启用"允许匿名访问"的情况下,仍出…

大型网站技术架构(六)网站的伸缩性架构

2019独角兽企业重金招聘Python工程师标准>>> 网站系统的伸缩性架构最重要的技术手段就是使用服务器集群功能,通过不断地向集群中添加服务器来增强整个集群的处理能力。“伸”即网站的规模和服务器的规模总是在不断扩大。 1、网站架构的伸缩性设计 网站的…

如何提升网站安全性

建站很容易,但是做好网站的安全维护却是一件不容易的事情,随着逐年增加的网络攻击,网络黑客通过漏洞对网站进行攻击。为了避免网站遭到攻击,需要提升网站的安全性,同时不影响用户的体验。 在实际的运营管理当中&#x…

某网站前端页面性能测试

1页面性能测试概述页面性能测试则是针对于页面性能优化而开展的一种性能测试,目的是对Web系统的页面进行测试以确认系统页面是否会影响系统的性能并为页面的优化提供依据与建议,最终提升系统的整体性能表现,提高用户体验满意度。他的关注点是…

网站点击流数据分析项目

什么是点击流数据 1.1.1 WEB访问日志 即指用户访问网站时的所有访问、浏览、点击行为数据。比如点击了哪一个链接,在哪个网页停留时间最多,采用了哪个搜索项、总体浏览时间等。而所有这些信息都可被保存在网站日志中。通过分析这些数据,可以…

英文论文写作相关实用网站与工具整理

文章目录英文论文写作相关实用网站与工具整理1.文献查找与下载(1) 文献检索通用网站:出版商网站:(2) 文章下载对于中文文章、知网的文章等而对于英文文章2.文献管理Mendelay3.写作与翻译(1) 初步翻译(2) 精确表达a. 专业词汇的准确性对于专业词汇的准确性…

您与此网站建立的连接不安全_CDN加速网站SEO优化,这就是CDN

内容交付网络(CDN)是一种分布式服务器(网络)的系统,该系统基于用户的地理位置,网页的来源和内容交付服务器将页面和其他Web内容交付给用户。此服务可有效加快高流量网站和具有全球影响力的网站的内容交付。…

个人博客网站的设计与实现_使用hexo来搭建个人网站博客(超详细教程)

对于一个程序员来讲,有一个个人博客真的很重要,做项目中的 新知识点的总结,bug总结,还可以 锻炼自己的表达能力,所以百利无一害。今天说一下如何去搭建个人博客①:下载git方式一(官网下载):http…

outlook搜索栏跑到上面去了_南昌搜索引擎seo优化

搜索引擎sl31b10eo优化南昌,SEO排名,它是指搜索引擎优化关键词排名。而影响到seo排名的因素有很多,比如说域名注册的时间,服务器的空间速度和稳定性,或者像是网站整体的结构,网站的内容等等都是影响了seo排…

打不开_网站源码安装后打不开?教你解决打不开

今天花点时间给你们写一篇文章,如何解决安装网站源码后,打不开网站的问题,以免你们在网上下载源码后,也是挺烦的。网站源码安装后打不开的解决方法网站源码安装后要先审查域名是否有正确解析,网站环境是否有配置正确&a…

python django做网页论文_Python Web程序-Django框架搭建网站的简单介绍

安装方法:2.2.4版本pip install django2.2.4安装django,django像一个库一样加入了python库中。创建Django项目1.终端创建项目:#在D盘PythonCodeTest文件夹下创建项目cd D:/cd PythonCodeTest#使用命令 django-admin startproject 创建项目dja…