多元回归要求因变量是y是连续变量,而自变量x可以是连续变量、分类变量或有序变量;连续变量好说,可以直接用原始数据,但是分类变量和等级变量要进入方程就需要对数据取值进行适当处理。如下:
连续变量:可以以原始值形式出现
分类变量:要进行数量化
(1)二分类:赋值0,1或1,-1就可进入方程;
(2)多分类(K-1个哑变量)
有序变量:有两种处理方式
(1)连续变量处理,如轻、中、重,直接赋值为1,2,3或其他
(2)设成K-1个哑变量
logistic回归要求因变量是两分类,名义变量或等级变量,而自变量x可以是连续变量、分类变量或有序变量。但是,对同一资料而言,变量采用不同的形式,参数的含义、量值及符号都有可能变化。所以,连续变量取值时,要考虑参数是否有意义。有时需要将其离散化为几组,如年龄,白细胞数等。其他的的变量取值和处理方式和多元回归差不多。
找本有多元线性回归或logistic回归的统计书看看,很容易理解的。1
忘了提醒一下,注意多元回归和logistic回归的应用条件,符合应用条件再用:
多元线性回归的应用条件有:1.自变量与因变量之间的关系是线性的;
2.自变量取值不同时,因变量的分布是正态且方差齐性;
3.各观察值之间是独立的。
也可以看有关多元回归或logistic的精华贴。
http://www.dxy.cn/bbs/post/view?bid=126&id=1252207&sty=1&tpg=1&age=0
1、正确得做法是把所有变量代如回归方程,逐步回归分析,必要是多用几种筛选变量得技术,同时要考虑因素得交互作用,综合分析”
2、单因素分析的结果和多因素分析的结果不一样是很正常的事情,因为单因素分析往往存在混杂因素的影响
3、要明白在建立多元回归模型之前,单因素分析的主要作用是起到筛选的作用,通常选取p小于0.1或者0.2的因素进入多元回归模型,而多元回归模型中偏回归系数有意义才是真正的有意义;
如果多元回归模型中偏回归系数没有意义,就算单因素有意义也是没有意义的。