%%学生信息
姓名:夏光敏 学号:2120161064 日期:2017/4/17
%%数据集
horse-colic.xlsx文件
%%分析过程报告
马的疝病分析.docx文件
%%分析程序
data_summary.m %数据摘要,对标称属性和数值属性分别处理 data_visualization.m %数据可视化 data_nanprocess.m %数据缺失值处理 Data_Compare.m %新旧数据对比并可视化输出 correlation_mat_attribute.m %求属性之间的相关关系 similarity_mat_sample.m %计算数据对象之间的相似度
%%生成文件
NanProcessData_1.xlsx %缺失值剔除后生成的新数据集 NanProcessData_2.xlsx %最高频率值填补缺失值后生成的新数据集 NanProcessData_3.xlsx %根据属性相关关系填补缺失值之后的新数据集 NanProcessData_4.xlsx %根据数据对象之间的相似性来填补数据集后的新数据集