文章目录
- 教材,考核,软件
- 现在数据是ZB时代
- 数据挖掘公司
- 3类数据挖掘
- 数据挖掘技术(5个)
- 分类:找因变量y
- 无监督
- 聚类
- 数据分析 数据挖掘
教材,考核,软件
教材 考核
软件:jupyter 和spss moduler(一个月试用)
现在数据是ZB时代
1B(Byte字节);
1KB(Kilobyte) = 2^10 B = 1024 B;
1MB(Megabyte) = 2^10 KB = 1024 KB = 2^20 B;
1GB(Gigabyte) = 2^10 MB = 1024 MB = 2^30 B;
1TB(Terabyte) = 2^10 GB = 1024 GB = 2^40 B;
1PB(Petabyte) = 2^10 TB = 1024 TB = 2^50 B;
1EB(Exabyte) = 2^10 PB = 1024 PB = 2^60 B;
1ZB(Zettabyte) = 2^10 EB = 1024 EB = 2^70 B;(现在到ZB时代)
1YB(YottaByte) = 2^10 ZB = 1024 ZB = 2^80 B;
1BB(Brontobyte) = 2^10 YB = 1024 YB = 2^90 B;
1NB(NonaByte) = 2^10 BB = 1024 BB = 2^100 B;
1DB(DoggaByte) = 2^10 NB = 1024 NB = 2^110 B;
1CB(Corydonbyte) = 2^10 DB = 1024 DB = 2^120 B;
1XB(Xerobyte) = 2^10 CB = 1024 CB = 2^130 B;
众筹网站:GoFundMe
什么文本,图片的项目容易成功
抖音背景音乐分析,用什么背景音乐容易火
蝉妈妈
聋哑人手势识别
魔镜-中医看面相,舌苔
数据挖掘公司
SAS 顶级的数据挖掘公司,合作对象包括东航,宝钢等等 有证书可以考
3类数据挖掘
有监督
无监督
强化学习
数据挖掘技术(5个)
分类:找因变量y
是否购房y(是、否)
图片分类y(动物、人类、建筑)
无监督
聚类是探索数据很好的一个方法
聚类
异常检测
数据分析 数据挖掘
数据分析:后见之明,人为驱动,研究数据
数据挖掘:先见之明,发现驱动,数据研究
eg,垃圾邮件识别
数据分析:找特征,用词情况
数据挖掘:数据标注1w条,训练后判断是否垃圾邮件
现在两者在融合。