一、聚类分析
1.方法介绍
系统聚类分析是一种将研究对象分为相对同质的群组的统计分析技术,建立一种分析不同类型玻璃中14种化学成分的HPLC方法,对两种玻璃中的成分含量进行测定,并结合系统聚类分析法对不同种类玻璃的化学成分进行分析。
具体应用实例见机器学习专栏!!!
二、向量机
1.引入实例
基于58个玻璃文物样品的14种化学成分建立高钾玻璃和铅钡玻璃的支持向量机分类判别模型,并利用该模型对独立的8个文物样品进行预报。
2.SVM算法
SVM算法是在vapink创立的统计学习理论基础上,结合Huber稳健回归色谱理论和Wolfe对偶规划理论形成的。该算法采用结构风险最小化代替传统的经验风险最小化,具有全局优化、泛化能力强等优点,克服了神经网络的许多缺点,且在解决小样本、非线性及高维模式识别问题中表现出独有的优势,已被认为是目前针对小样本统计估计和预测学习的最佳理论。
3.建立SVM分类模型
(1)一般从三方面考察模型的泛化能力:a.首先考察对建模训练集SVM模型的建模准确率,b.其次常用“留一法”对SVM模型进行内部交叉验证,考察“留一法”准确率,c.最后利用独立测试样本对建立的SVM模型进行测试,考察其预报准确率。只这3个确率都比较高,得到的SVM分类模型才有比较好的泛化能力,应用价值也比较高。
(2)在建立模型的过程中,核函数和惩罚因子C的选择将显著影响模型准确率。以SVM模型的“留一法”结果准确率()作为选择核函数和惩罚因子C的依据。其中为总样本数,为预报正确的样本数。
4.主成分分析法
在模式识别众多方法中,主成分分析是使用较为广泛的一种线性映射,通过正交变换将一组可能存在相关性的向量转换为一组线性不相关的变量,转换后的这组变量叫主成分。这些重新组合的
变量可以根据实际需要取出几个较少的综合变量,以尽可能多地反映原来变量的信息。主成分分析算法也是数学上用来降维的一种方法。将样本数据投影在由第一主成分和第二主成分构成的二维投影图上,可以直观地观察样品的空间分布。
5.结果讨论
多类SVM分类判别模型的与不同核函数、惩罚因子C的关系以折线图呈现;
eg:
可以看出,当选择多项式核函数且惩罚因子C取10时, 最大。
举一反三 2022高教社杯数学建模c题
以玻璃中的14种化学成分为影响因素,用支持向量机算法建立高钾玻璃和铅钡玻璃的分类判别模型,该模型对高钾玻璃和铅钡玻璃的识别有着比较高的准确率,为玻璃种类识别提供了新方法。结果表明,14种化学成分中,xxx对玻璃种类识别影响最大。