C 题古代玻璃制品的成分分析与鉴别

问题 1:对这些玻璃文物的表面风化与其玻璃类型、纹饰和颜色的关系进行分析;结合玻

璃的类型,分析文物样品表面有无风化化学成分含量的统计规律,并根据风化点检测数据,预

测其风化前的化学成分含量。

思路:

分解问题:

问题(1):分析这些玻璃文物纹饰、类型、颜色 、表面风化的关系;
这题很简单,分析关系有相关性分析和差异性分析,需要注意一点,这四个指标都是定类变量,并非连续变量,因此:
对于相关性分析,不能直接使用皮尔逊相关分析,可以采用斯皮尔曼相关系数分析(Spearman相关系数)

对于差异性分析,不能采用方差分析或T检验,应当采用卡方检验

问题(2):基于这些玻璃文物的类型,分析文物样品表面有无风化化学成分含量的统计规律;
对于类型只有两种,一种是高钾,一种是铅钡。在做完缺失值处理之后,我们可以对比文物样本表面有无风化的化学成分的一些统计学规律,这块主要其实也是差异性分析和相关性分析,不过在做这两个分析之前,我们可以做一些数据合或者分类汇总,观察推断出来两种玻璃文物类型的有无风化以及成分的差异或者相关情况,进而推断出来统计规律,形成公式。

问题(3):根据风化点检测数据,预测其风化前的化学成分含量。
根据问题2得到的相关关系形成公式,预测已经风化的文物在风化前的化学成分含量

问题 2:依据附件数据分析高钾玻璃、铅钡玻璃的分类规律;对于每个类别选择合适的化

学成分对其进行亚类划分,给出具体的划分方法及划分结果,并对分类结果的合理性和敏感性

进行分析。

分解问题:
问题(1):分析高钾玻璃、铅钡玻璃的分类规律;

构建一个可解释的机器学习分类模型,例如决策树、逻辑回归,以类型(高钾玻璃、铅钡玻璃)为Y,尽可能构建足够多的特征X,形成可解释的分类规律,得分点关键在于模型寻优做的牛不牛以及可视化效果。

问题(2):对于每个类别选择合适的化学成分对其进行亚类划分,给出具体的划分方法及划分结果;分别对类别进行聚类模型,得分点关键在于亚类划分的可解释性以及划分效果。

问题(3):对分类结果的合理性和敏感性进行分析。
对分类结果的合理性应该是放在问题(2)里面的,直接用一些量化划分聚类效果的评价指标进行评估就ok了,这里重点在于对前面使用的模型参数进行调整,分析模型的敏感性

问题 3对附件表单 3 中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型,并对分类结果的敏感性进行分析。

问题(1):对附件表单 3 中未知类别玻璃文物的化学成分进行分析,鉴别其所属类型;
基于问题2,预测表单3未知类别玻璃文物的类型,至于化学成分分析不分析不是重点
问题(2):对分类结果的敏感性进行分析。

如果我们采用的是机器学习模型,那么这一步就无需进行分析,机器学习只需要在训练时分析敏感性,预测时模型已经固定,无需进行敏感性分析,但是如果我们是通过推断的方式来进行分析的话,那么这里需要复现一下敏感性分析

问题 4针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系,并比较不同类

别之间的化学成分关联关系的差异性。

问题(1):针对不同类别的玻璃文物样品,分析其化学成分之间的关联关系
与问题1的问题(2)类似,只是减少了一个条件——有无风化
问题(2):比较不同类别之间的化学成分关联关系的差异性。