市场调研中的相关分析与回归分析(9)

来源:中国营销传播网 2005-12-21
阅读量:2571

  (二)回归分析(6) 
  2.多元回归分析

  (2)整体解释力和统计显著性

  在简单线性回归里我们详细的介绍了单个回归总数的显著性检验与回归方程的整体解释力检验,在此不再重复,我们重点对整体解释力的统计显著性检验进行介绍这需要一个不同的过程,即F-统计检验。

  单个系数(bk)的统计显著性检包括一个零假设检验,HO:Bk=0。整体解释力的检验是检验所有的bk是否都等于零。相关的检验统计量,即F-统计量,也是通过计算机软件包自动计算的,没有必要关心它的实际计算过程。但是,简而言之,它被定义为被解释的变化与未被解释的变化之比。回忆一下,解释变量的方差 可以被分解为两部分,一部分通过回归值来解释, 一部分通过残差来解释, 。被解释的变化与未被解释的变化的有关表达式简单地等于,总的被解释和未被解释的方差除以各自的自由度(分别是n-k-l)。

  F-检验在计算了F-统计量之后,(F-检验)的统计显著性检验依照通常的程序进行。这些程序包括着先说明假设检验,然后把计算好的F-统计值与临界值相比,临界值取自在一给定概率水平下F-概率分布的F-统计表。假设可以表述为:H0:B1=B2=Bk=0H1:系数B不全为零

  如果我们拒绝HO,我们就可以断定,在被解释变量和至少一个解释变量之间有显著的关系,回归方程整体来看是显著的。但要注意即使回归整体来看是显著的,某些单个的回归系数可能统计上并不显著。因此检验每一个解释变量的统计显著性是很重要的,不要只依赖于整体解释力的检验。还值得注意的是,在只有一个解释变量时的简单回归分析的情形下,整体解释力的F-检验必然相当于单个回归系数B的t-检验。这时,可以看到,F=t2。


  F-统计表和F-分布

  还需要说明F-统计表的使用和设计。F-分布的形状如下图所示。注意该分布是不对称的,而且F值不可能为负。分布的实际形状决于F-统计量的表达式相应的分子和分母的自由度(分别是K和n-k-l)。F-统计表中概率值(α)有0·05和0·01两种,对应于相应的自由度,分子和分母分别用VI和V2表示,从1到∞。比如,可以查到,在vl=9和v2=12时,F-统计量的临界值(用 表示)在0·05的显著水平下等于2·80,在0·01的显著水产下等于4·39;也就是说,只有5%的可能性得到一个大于2·80的F-统计值,只有1%的可能性超过4·39。注意附录分为两个部分,第一部分对应 =0.05,第二部分对应于 =0·01。这样,回到F-检验中,如果计算的F-统计量超过了临界值,我们拒绝零假设,并断定整个回归在统计上是显著的。

  在使用多元回归中,容易忽略几个问题。为了引起注意,我们简单地予以评论。详细的讨论可以在关于回归分析的专业书籍中找到。主要问题与下面这几点有关:

  ·估计的回归方程选择了不恰当的方程形式(即线性或非线性关系),被称为方程形式的错误识别;

  ·两个或更多的解释变量彼此相关的程度,使得可靠地度量它们各自的影响成为不可能,这个问题被称为多重共线性;

  ·不同时间的被解释变量的观测值自身相关的可能性,被称为自相关或序列相关问题,这影响到局部回归系数显著性检验的可靠性;

  ·预测误差可能不是常数,相反,它可能与解释变量的由于这个原因大小相关,这个问题被称为异方差问题,这也可能影响到估计回归系数的显著性检验的可靠性;

  ·在回归模型中解释变量含有测量误差的可能性,这个问题被称为变量误差,这将导致回归系数的估计不是无偏的和一致的。

举例

下表是某公司在过去的12个月中每月太阳镜的销售量、平均价格、广告费用、平均日照小时数。

  

  使用这些数据:

  ①估计回归方程,使之能够计算三个解释变量(价格、广告费用以及日照小时数)对太阳镜销售量的影响;

  ②对结果进行说明;

  ③在价格为2.5英镑、广告费用为25000英镑以及平均日照数为5小时的情况下,利用回归方程预测太阳镜的销售量。

  解答回归方程

  这里,多元线性回归模型为:

  销售量S=a+b1×(价格P)+b2×(广告费用E)+b3×(日照小时数H)

  用统计软件包,我们可以得到:

  S=120-12.2P+2.32E+13.2H

  说明

  ·为了对回归果进行说明,我们注意以下几个方面:

  ·估的回归系数(b1,b2,b3)的大小及符号。

  ·回归系数的统计显著性。

  ·回归整体的统计显著性。

  ·回归模型的整体解释力。

  ·异常观测值(即所谓的异常点)的出现。

  系数的大小和符号。我们可以事先猜测销售量与价格呈反向变动的关系(即销售量随价格的下降而增加),而与广告费用和日照小时数呈正向变动的关系。也就是说,事先的预计是价格的回归系数(b1)为负,而广告费用的回归系数(b2)和日照时间的回归系数(b3)为正。从上述回归方程来看确实如此。在解释回归系数的大小时,要记住原始数据的度量单位。

  因此有价格每上涨1英镑太阳镜的销售量下降12.2×1000=12200副,广告费用每增加1000英镑销售量增加2320副,日照时间每增加1小时销售量增加13200副。系数的统计显著性。通过统计软件包得到价格P的t-值为-2.77。判断该系数的统计显著性有两种方式。一是与t-统计表中自由度为n-k-l的t的临界值相比较,其中K是自变量的个数。于是对单尾检验(假设H1:BI〈0〉来说,t=-1.86(即8个自由度的T0.05)。因为-2.77〈-1.86,所以我们拒绝假设HO:BI=0并推断BI是显著小于零的。进行假设检验的另一个方法是利用统计软件包计算给出的P-值(概率值)。相应于-2.77的t-值的p-统计值为0.024。这表明-2.77的t-值切断了0.024(即2.4%)的单尾区域。因此如果检验是在5%的显著水平下进行的(=0.05),p-值表明检验统计量的值落入拒绝区域的概率。一般而言,如果P-值小于那么n个检验统计量必然位于拒绝区域,而如果p-值大于或等于那么检验统计量必定位于接受区域。

  解释了P-值的含义以后,我们可以很快地评论其化两个解释变量统计显著性,由统计软件包得到广告费用变量E的P-值为0.036,日照时间变量H的P-值为0.000,都小于0.05,因此可以认为两个变量在5%的显著水平下都是统计上显著的(即B2>0以及B3>0)。注意这里P-值只表述到小数点后第三位。

  整体解释力。用统计软件包计算得到多元决定系数R2=0.988,这表明销售量的变化中有98.8%可以由回归方程来解释(即通过3个解释变量的变化来说明)。调整过的多元决定系数R2=0.983。

  异常观测值。有些统计软件包特别指出残差(观测值减去预测值)相当大的应变量的观测值,以引起注意,它可能是误计了,也可能是一个异常事件。这样异常观测值经常被称为异常点。

  预测得到的回归方程为:

  S=120-12.2P+2.32E+13.2H

  把问题中给定的三个解释变量的值代入方程有:

  预测销售量 =120-12.2×2.5+2.32×25+13.2×5

         =120-30.5+58+66

         =213.5(千副)

责任编辑:NO·023

继续阅读与本文标签相同的文章:

了解更多请移步微信公众号
0条评论
相关推荐资讯
海报
中陶网APP下载