前言
科技横飞的时代,大部分实验室管理系统(LIMS)都拥有数十上百的分析仪器设备,一台仪器检测数十个项目,实验室的温度、湿度、压强与实验结果的相关性越来越受人们的关注。国工智能实验室管理系统融合了国工智能数据大脑平台,平台内提供上百中统计学相关算法及机器学习算法,对实验室的数据进行分析、挖掘,提高企业产品附加值及行业竞争力。本次案例就因子分析与实验室LIMS系统相融合进行探讨及应用举例。
READING
含义
因子分析是指根据相关性大小把变量分组,使得同组内的变量之间相关性较高,但不同组的变量不相关或相关性较低,每组变量代表一个基本结构—即公共因子。使用因子分析可通过评估变量之间的相关来评估数据的结构,使用此分析可以将每个原始变量建模为这些底层因子的线性函数。
READING
案例
某企业LIMS实验室想了解温度、湿度、压强、实验结果这四个因子之间的相关性,在不同的温度、湿度、压强下对同一个样品进行测试,得到7次实验结果如表1所示,试分析不同的温度、湿度、压强、实验结果的相关性大小。
表1不同温度、湿度、压强得到的实验结果
要验证温度、湿度、压强、实验结果这四个因子之间是否存在相关性及相关性大小,因此可以采用因子分析进行检验。
READING
分析过程
使用国工数据大脑组件对国工实验室系统数据进行读取,直接访问数据库获取数据集。
图1 RDBMS读取组件
使用集成好算法的因子分析组件进行数据的因子分析处理,对组件参数进行设置,变量字段配置为温度、湿度、压强、实验结果,因为共有4个变量,所以要提取的因子数配置为2,单击运行,从调试面板中查看分析结果。
图2因子分析组件及参数配置
READING
分析结果
图3结果分析
检查载荷模式,以确定对每个变量影响最强的因子。接近于-1或1的载荷表明因子对变量的影响非常强。接近0的载荷表明因子对变量的影响很弱。有些变量可能对多个因子施加高载荷。
非旋转因子载荷通常很难解释,因子旋转简化了载荷结构,并且使因子载荷更容易解释。使用旋转的因子载荷,可以得出如下结论:
湿度(0.998)和结果值(0.986)在因子1上具有较大的正载荷,温度(0.999)、湿度(0.998)、压强(0.999)和结果值(1)在因子3上具有较大的正载荷,所以这两个因子共同解释数据变异的0.999或99.9%。
READING
与LIMS系统相融合
国工数据大脑平台可直接获取实验室LIMS系统中的实验数据,直接将实验数据对接到创建好的因子分析模型中,根据得出的结果分析温度、湿度、压强、实验结果在因子1和因子2的相关性。
READING
参数说明
因子载荷:表示因子对变量的解释程度。载荷范围可以为-1到1,国工数据大脑因子分析组件会计算非旋转因子载荷和旋转因子载荷。
变量:分析研究对象的变量。
要提取的因子数:因子数必须至少为1且不得超过总变量数,为了取得最佳结构,数据中的每3个变量拥有的因子不得超过一个。例如,有12个变量,则最多提前4个因子。
方差贡献率:使用方差贡献率(%Var)可确定因子解释的方差量。保留解释可接受方差水平的因子。
方差(特征值):如果使用主分量提供因子,则方差等于特征值。可使用特征值的大小确定因子数。保留具有最大特征值的因子。
READING
适用范围
不同的变量选择因子数之后,分析因子对变量的是否有影响。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
责任编辑:kj005
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com8月12日,荣耀Magic3重磅上市,全新高端旗舰平板——荣耀平板V7 Pro也同时发布。荣耀平板V7 Pro全球首...