变量之间的相关性,是数据分析中常见的关系,衡量的是变量之间相关的密切程度,比如衡量客流量与销售额的相关性、客单价与销售额的相关性等。检验数据是否具有相关性,常用的......
2023-06-20 202 SPSS检验两变量间相关关系
本文将针对分析过后的数据进行详细解读。在解读过程中,我们需要求得方程式的系数,并判断系数的拟合程度、方程式的统计学意义。
一、使用的数据
本文分析所用的数据是一组包含客流量与销售额的数据,研究的是以客流量为自变量、销售额为因变量的线性关系。
图1:示例数据
二、解读检验结果
1.模型拟合效果
模型摘要中的R方是判定系数,其数值越接近于1,表明方程的拟合优度越好,一般需要大于0.6。
从如图2所示的模型摘看到,求得的一元线性回归方程的R方为0.839,说明本例分析所得的回归方程拟合效果良好。
图2:模型摘要
在判定回归方程拟合优度良好的情况下,查看ANOVA分析中的“回归模型”方差分析。如图3所示,“回归模型”的显著性值为0.00<0.05,说明该“回归模型”具有显著的统计学意义,也就是说,客流量与销售额之间存在着显著的线性回归关系。
图3:ANOVA检验2.构建模型表达式
在判定回归模型具有显著统计学意义的前提下,进一步检验求得的系数是否通过T检验。该T检验的原假设为求得的回归系数不具有统计学意义。
如图4所示,可以看到回归系数(客流量对应的系数)的显著性数值为0.00<0.05,拒绝原假设,也就是说方程的回归系数具有统计学意义,可构建y=12.821x-2644.658的一元线性回归方程。
图4:选择变量
3.残差相关性分析
通过上述的分析,我们已经可以认为构建的一元线性回归方程y=12.821x-2644.658具有统计学意义,但是否可用于预设因变量的值,还需要通过残差相关性分析。如果残差存在自相关的话,模型的预测准确度将会不高。
如图5所示,模型的D-W值(德宾-沃森值)为2.060,查阅德宾-沃森表得到,样本量n=198(采用200样本量D-W值),控制变量数量k=1,其下临界值LD=1.664、上临界值UD=1.684。
根据D-W值的判定规则,本例的D-W值符合“如果UD
图5:D-W检验
另外,再通过残差直方图看到,残差的分布趋近于正态曲线的分布。
图6:残差直方图
再结合正态P-P图分析,可以看到,数值的分布近似于直线,说明残差的正态性良好。
在满足残差无自相关性、服从正态分布的前提下,说明本例构建的一元线性回归方程具有良好的预测性,可通过为自变量代入数值,求得预测的因变量。
图7:残差P-P图
三、小结
综上所述,在使用IBM SPSS Statistics构建一元线性回归方程时,需要通过判定系数R方判断回归方程的拟合优度,并检验回归方程、方程系数的是否具有统计学意义。
标签: SPSS一元线性回归分析
相关文章
变量之间的相关性,是数据分析中常见的关系,衡量的是变量之间相关的密切程度,比如衡量客流量与销售额的相关性、客单价与销售额的相关性等。检验数据是否具有相关性,常用的......
2023-06-20 202 SPSS检验两变量间相关关系
IBM SPSS Statistics探索性分析提供了数据过滤、离群值识别、假设检验等分析功能。在 《应用SPSS探索性分析,快速检查数据异常值》 一文中,我们应用探索性分析检查到数据中存在着极端......
2023-02-05 203 SPSS探索性分析 SPSS检验数据的正态性分布
探索性分析中比较常用的功能是,通过数据过滤的功能,如分析数据中的极值、平均值、方差等,识别数据中的异常值;或使用检验的方法,判断后续使用的统计分析方法是否合适等,......
2023-01-18 213 SPSS快速检查数据异常值 SPSS探索性分析
IBM SPSS Statistics的二项分布检验,属于非参数检验中的一种分析方法,与参数检验不同,非参数检验是在总体方差未知的情况下,利用样本数据对总体分布等进行推断分析的方法。 而二......
2023-01-15 204 SPSS二项分布检验