如何使用SPSS进行多元回归分析_数据分析师-CDA数据分析师官网

如何使用SPSS进行多元回归分析_数据分析师

2015-01-06

如何使用SPSS进行多元回归分析_数据分析师

在大多数的实际问题中，影响因变量的因素不是一个而是多个，我们称这类回问题为多元回归分析。可以建立因变量y与各自变量xj(j=1,2,3,…,n)之间的多元线性回归模型：

如何使用SPSS进行多元回归分析

其中：b0是回归常数；bk(k=1,2,3,…,n)是回归参数；e是随机误差。

多元回归在病虫预报中的应用实例:

某地区病虫测报站用相关系数法选取了以下4个预报因子；x1为最多连续10天诱蛾量(头)；x2为4月上、中旬百束小谷草把累计落卵量(块)；x3为4月中旬降水量(毫米)，x4为4月中旬雨日(天)；预报一代粘虫幼虫发生量y（头/m2）。分级别数值列成表2-1。

预报量y：每平方米幼虫0~10头为1级，11~20头为2级，21~40头为3级，40头以上为4级。

预报因子：x1诱蛾量0~300头为l级，301~600头为2级，601~1000头为3级，1000头以上为4级；x2卵量0~150块为1级，15l~300块为2级，301~550块为3级，550块以上为4级；x3降水量0~10.0毫米为1级，10.1~13.2毫米为2级，13.3~17.0毫米为3级，17.0毫米以上为4级；x4雨日0~2天为1级，3~4天为2级，5天为3级，6天或6天以上为4级。

表2-1

	x1		x2		x3		x4		y
年	蛾量	级别	卵量	级别	降水量	级别	雨日	级别	幼虫密度	级别
1960	1022	4	112	1	4.3	1	2	1	10	1
1961	300	1	440	3	0.1	1	1	1	4	1
1962	699	3	67	1	7.5	1	1	1	9	1
1963	1876	4	675	4	17.1	4	7	4	55	4
1965	43	1	80	1	1.9	1	2	1	1	1
1966	422	2	20	1	0	1	0	1	3	1
1967	806	3	510	3	11.8	2	3	2	28	3
1976	115	1	240	2	0.6	1	2	1	7	1
1971	718	3	1460	4	18.4	4	4	2	45	4
1972	803	3	630	4	13.4	3	3	2	26	3
1973	572	2	280	2	13.2	2	4	2	16	2
1974	264	1	330	3	42.2	4	3	2	19	2
1975	198	1	165	2	71.8	4	5	3	23	3
1976	461	2	140	1	7.5	1	5	3	28	3
1977	769	3	640	4	44.7	4	3	2	44	4
1978	255	1	65	1	0	1	0	1	11	2

数据保存在“DATA6-5.SAV”文件中。

1）准备分析数据

在SPSS数据编辑窗口中，创建“年份”、“蛾量”、“卵量”、“降水量”、“雨日”和“幼虫密度”变量，并输入数据。再创建蛾量、卵量、降水量、雨日和幼虫密度的分级变量“x1”、“x2”、“x3”、“x4”和“y”，它们对应的分级数值可以在SPSS数据编辑窗口中通过计算产生。编辑后的数据显示如图2-1。

如何使用SPSS进行多元回归分析
图2-1

或者打开已存在的数据文件“DATA6-5.SAV”。

2）启动线性回归过程

单击SPSS主菜单的“Analyze”下的“Regression”中“Linear”项，将打开如图2-2所示的线性回归过程窗口。

如何使用SPSS进行多元回归分析
图2-2 线性回归对话窗口

3) 设置分析变量

设置因变量：用鼠标选中左边变量列表中的“幼虫密度[y]”变量，然后点击“Dependent”栏左边的如何使用SPSS进行多元回归分析向右拉按钮，该变量就移到“Dependent”因变量显示栏里。

设置自变量：将左边变量列表中的“蛾量[x1]”、“卵量[x2]”、“降水量[x3]”、“雨日[x4]”变量，选移到“Independent(S)”自变量显示栏里。

设置控制变量: 本例子中不使用控制变量，所以不选择任何变量。

选择标签变量: 选择“年份”为标签变量。

选择加权变量: 本例子没有加权变量，因此不作任何设置。

4）回归方式

本例子中的4个预报因子变量是经过相关系数法选取出来的，在回归分析时不做筛选。因此在“Method”框中选中“Enter”选项，建立全回归模型。

5）设置输出统计量

单击“Statistics”按钮，将打开如图2-3所示的对话框。该对话框用于设置相关参数。其中各项的意义分别为：

如何使用SPSS进行多元回归分析
图2-3 “Statistics”对话框

①“Regression Coefficients”回归系数选项：

如何使用SPSS进行多元回归分析 “Estimates”输出回归系数和相关统计量。
“Confidence interval”回归系数的95%置信区间。
“Covariance matrix”回归系数的方差-协方差矩阵。

本例子选择“Estimates”输出回归系数和相关统计量。

②“Residuals”残差选项：

如何使用SPSS进行多元回归分析 “Durbin-Watson”Durbin-Watson检验。
     “Casewise diagnostic”输出满足选择条件的观测量的相关信息。选择该项，下面两项处于可选状态：
         “Outliers outside standard deviations”选择标准化残差的绝对值大于输入值的观测量；
          如何使用SPSS进行多元回归分析 “All cases”选择所有观测量。

本例子都不选。

③ 其它输入选项

如何使用SPSS进行多元回归分析 “Model fit”输出相关系数、相关系数平方、调整系数、估计标准误、ANOVA表。
     “R squared change”输出由于加入和剔除变量而引起的复相关系数平方的变化。
     “Descriptives”输出变量矩阵、标准差和相关系数单侧显著性水平矩阵。
     如何使用SPSS进行多元回归分析 “Part and partial correlation”相关系数和偏相关系数。
     “Collinearity diagnostics”显示单个变量和共线性分析的公差。

本例子选择“Model fit”项。

6）绘图选项

在主对话框单击“Plots”按钮，将打开如图2-4所示的对话框窗口。该对话框用于设置要绘制的图形的参数。图中的“X”和“Y”框用于选择X轴和Y轴相应的变量。

如何使用SPSS进行多元回归分析
图2-4“Plots”绘图对话框窗口

左上框中各项的意义分别为：

“DEPENDNT”因变量。
“ZPRED”标准化预测值。
“ZRESID”标准化残差。
“DRESID”删除残差。
“ADJPRED”调节预测值。
“SRESID”学生氏化残差。
“SDRESID”学生氏化删除残差。

“Standardized Residual Plots”设置各变量的标准化残差图形输出。其中共包含两个选项：

如何使用SPSS进行多元回归分析 “Histogram”用直方图显示标准化残差。
“Normal probability plots”比较标准化残差与正态残差的分布示意图。

“Produce all partial plot”偏残差图。对每一个自变量生成其残差对因变量残差的散点图。

本例子不作绘图，不选择。

7) 保存分析数据的选项

在主对话框里单击“Save”按钮，将打开如图2-5所示的对话框。

如何使用SPSS进行多元回归分析
图2-5 “Save”对话框

①“Predicted Values”预测值栏选项：

   如何使用SPSS进行多元回归分析 Unstandardized 非标准化预测值。就会在当前数据文件中新添加一个以字符“PRE_”开头命名的变量，存放根据回
                        归模型拟合的预测值。
       Standardized 标准化预测值。
       如何使用SPSS进行多元回归分析 Adjusted 调整后预测值。
       S.E. of mean predictions 预测值的标准误。

本例选中“Unstandardized”非标准化预测值。

②“Distances”距离栏选项：

   如何使用SPSS进行多元回归分析 Mahalanobis: 距离。
       Cook’s”: Cook距离。
       Leverage values: 杠杆值。

③“Prediction Intervals”预测区间选项：

   如何使用SPSS进行多元回归分析 Mean: 区间的中心位置。
       Individual: 观测量上限和下限的预测区间。在当前数据文件中新添加一个以字符“LICI_”开头命名的变量，存放
                     预测区间下限值；以字符“UICI_”开头命名的变量，存放预测区间上限值。
       如何使用SPSS进行多元回归分析 Confidence Interval：置信度。

本例不选。

④“Save to New File”保存为新文件：

选中“Coefficient statistics”项将回归系数保存到指定的文件中。本例不选。

⑤ “Export model information to XML file” 导出统计过程中的回归模型信息到指定文件。本例不选。

⑥“Residuals” 保存残差选项：

   如何使用SPSS进行多元回归分析 “Unstandardized”非标准化残差。
       “Standardized”标准化残差。
       “Studentized”学生氏化残差。
       “Deleted”删除残差。
       “Studentized deleted”学生氏化删除残差。

本例不选。

⑦“Influence Statistics” 统计量的影响。

   如何使用SPSS进行多元回归分析 “DfBeta(s)”删除一个特定的观测值所引起的回归系数的变化。
       “Standardized DfBeta(s)”标准化的DfBeta值。
       “DiFit” 删除一个特定的观测值所引起的预测值的变化。
       “Standardized DiFit”标准化的DiFit值。
       如何使用SPSS进行多元回归分析 “Covariance ratio”删除一个观测值后的协方差矩隈的行列式和带有全部观测值的协方差矩阵的行列式的比率。

本例子不保存任何分析变量，不选择。

8）其它选项

在主对话框里单击“Options”按钮，将打开如图2-6所示的对话框。

如何使用SPSS进行多元回归分析
图2-6 “Options”设置对话框

①“Stepping Method Crite

线性回归散点图直方图数据分析

数据分析咨询请扫描二维码

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

如何使用SPSS进行多元回归分析_数据分析师

考试指南

报考指南

热门栏目

最新资讯

政府、国央企、科研单位——中国航信-面向测试度量 ...

CDA内训丨深圳迈瑞生物医疗数据分析统计思维培训 ...

CDA数据分析师应合肥阳光新能源科技有限公司邀约开 ...

CDA走进海尔大学

苏州中行&CDA数据分析师开展数据分析师培训 ...

中国银行江苏分行-大数据应用培训

浙江农信数据建模及案例应用培训

华夏银行信用卡中心-机器学习培训

字节跳动-CDA案例实操及行业分析

长沙银行-Python集训营

数据分析在业务中的三大应用场景

AI提示词的使用方法详解及示例

CDA立足未来职场，拓展前沿视野

CDA 塑造未来职涯：构筑未来职业发展的数字基石 ...

随机森林（Random Forest）算法的优点和缺点都有哪 ...

方差分析的基本思想和原理是什么？

发现了一个好用到爆的数据分析利器

自从搞懂了回调函数，我对Python的理解上了一个台阶 ...

2020在学硕士达300万，失去学历光环的新生代何去何 ...

缓解就业焦虑的利器，证书真的越多越有保障吗？ ...