六西格玛统计数据分析的第一原理是什么?

2025-03-31 14:34:29
推荐回答(1个)
回答1:

六西格玛统计数据分析关于正态假设的第一个原理:
这个假设一般不应用于原始的未加工的数据,但用于模型的残差或误差项。如公司的总资产(x1)和分期偿还的年数(x2)的基础上,预测收购的商誉(Y),你可能会使用这个标准回归模型:

Y=b0+β1X1+β2X2+ε,式中,ε代表残差或预测误差(模型预测和你实际观测到的差异);b0 代表常数项;β1,β2代表预测变量X1,X2的系数,在这个模型中,不是对商誉(Y)做正态假设,而是对残差值ε。因此在该情形下衡量正态假设的有效性,不是要衡量商誉的正态性,而是要进行回归分析对残差进行计算,并衡量残差的正态性。这种情况下应该寻求近似正态,而不是完全的正态。原始数据商誉的极端非正态,是残差很可能极端非正态的指示器,这一点成立。不过在很多情况下,原始数据不是近似正态,而残差是。这是因为原始数据包含了X变量的影响,在这里是总资产和分期偿还。。