接着上回我们继续第三题
问题 3 对附件表单 3 中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型,并对 分类结果的敏感性进行分析。
我们的分析:
基于问题二的分类模型,计算出每个待测样本点与簇中心的平方欧式距离,与2中得到的变量与簇中心的理想距离范围进行比较,完成分类,通过给模型添加微小扰动,观察样本数据统计规律变化,给出敏感性分析。
结果及分析:
该新模型对问题二的数据判断错误个案数为6,计算准确率为92.5%,原问题二的判断个案准确率为98.6%,即给于10%的扰动,模型的准确率变化6.19% 且均方和显著性分析的结果也印证了分类结果的合理性和准确性,原样本点的情况也与实际分类结果大致符合,因此我们认为该模型稳定性在可控范围内。
题 4 针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系,并比较不同类 别之间的化学成分关联关系的差异性。
我们的分析:
我们需要分别给出两种玻璃类型内部各化学成分之间的相关性,以及在两种玻璃类型之间的比较,我们使用灰色关联分析法,对于各个子系统或者两个系统之间的因素,给出变量或子序列之间的关联性大小的衡量。
在高钾玻璃和铅钡玻璃两种类型的前提下,我们根据题意选定用于比较的参考数列,确定各子序和参考序列的关联度,关联度越高,相关性越大。本题中,我们分别选取各化学成分序列作为参考序列,循环计算所有序列之间的相关关系,并用Python给出最终的可视化结果。通过结果我们比较两个类型之间的差异性。
解题过程:
1.确定比较的对象,我们循环将每一个化学成分变量作为D0主要参考对象,每种类型的样本数量为n,即D0 ={ D0k|k=1,2……n}评价标准为其13个化学成分,即有13个评价对象,Di ={ Dik|k=1,2……n}, i = 1,2……13。
2.对数据进行无量纲化和标准化处理,让数据更加准确和可靠,随后我们根据公式计算子序列之间灰色关联系数:
其中 ξi为参考对象以样本为观测的和评价对象之间的关联系数, ρ为分辨系数,本题我们采用均值来计算关联系数,分辨系数我们一般取0.5,min smin tx0t-xs(t)为我们取差值矩阵的最大值与最小值。
3.我们由(2)中计算的化学成分之间的相关性,利用 Python的 matplotlib和 numpy库对结果进行可视化的预览,分别给出高钾玻璃和铅钡玻璃的热力图结果,使结果更加直观,利于下一步的分析。
结果及分析:
附言:
由于篇幅有限,我只给出了部分的分析和结果图,完整Python代码和完整论文及数据可评论“代码”或者私信领取!希望能和大家一起交流学习!
最后我想说的是这是一次有些遗憾但是充满意义的一次经历,在后续的美赛也会更新和大家交流,预祝各位和我一样的同学取得一个更好的成绩!