问题标题:
相关分析与回归分析的联系与区别
问题描述:

相关分析与回归分析的联系与区别

董丽君回答:
  满意回答:回归分析与相关分析的联系研究在专业上有一定联系的两个变量之间是否存在直线关系以及如何求得直线回归方程等问题需进行直线相关和回归分析.从研究的目的来说若仅仅为了了解两变量之间呈直线关系的密切程度和方向宜选用线性相关分析若仅仅为了建立由自变量推算因变量的直线回归方程宜选用直线回归分析.   从资料所具备的条件来说作相关分析时要求两变量都是随机变量如人的身长与体重、血硒与发硒作回归分析时要求因变量是随机变量自变量可以是随机的也可以是一般变量(即可以事先指定变量的取值如用药的剂量).   在统计学教科书中习惯把相关与回归分开论述其实在应用时当两变量都是随机变量时常需同时给出这两种方法分析的结果另外若用计算器实现统计分析可用对相关系数的检验取代对回归系数的检验,这样到了化繁为简的目的.   回归分析和相关分析都是研究变量间关系的统计学课题它们的差别主要是   1、在回归分析中y被称为因变量处在被解释的特殊地位而在相关分析中x与y处于平等的地位即研究x与y的密切程度和研究y与x的密切程度是一致的   2、相关分析中x与y都是随机变量而在回归分析中y是随机变量x可以是随机变量也可以是非随机的通常在回归模型中总是假定x是非随机的   3、相关分析的研究主要是两个变量之间的密切程度而回归分析不仅可以揭示x对y的影响大小还可以由回归方程进行数量上的预测和控制.   回归分析和相关分析的区别   回归分析和相关分析是互相补充、密切联系的相关分析需要回归分析来表明现象数量关系的具体形式而回归分析则应该建立在相关分析的基础上.   主要区别有:一,在回归分析中,不仅要根据变量的地位,作用不同区分出自变量和因变量,把因变量置于被解释的特殊地位,而且以因变量为随机变量,同时总假定自变量是非随机的可控变量.在相关分析中,变量间的地位是完全平等的,不仅无自变量和因变量之分,而且相关变量全是随机变量.二,相关分析只限于描述变量间相互依存关系的密切程度,至于相关变量间的定量联系关系则无法明确反映.而回归分析不仅可以定量揭示自变量对应变量的影响大小,还可以通过回归方程对变量值进行预测和控制.   相关分析和回归分析是极为常用的2种数理统计方法在科学研究领域有着广泛的用途.然而由于这2种数理统计方法在计算方面存在很多相似之处且在一些数理统计教科书中没有系统阐明这2种数理统计方法的内在差别从而使一些研究者不能严格区分相关分析与回归分析.   最常见的错误是:用回归分析的结果解释相关性问题.例如作者将“回归直线曲线图”称为“相关性图”或“相关关系图”将回归直线的R2(拟合度或称“可决系数”)错误地称为“相关系数”或“相关系数的平方”根据回归分析的结果宣称2个变量之间存在正的或负的相关关系.   相关分析与回归分析均为研究2个或多个变量间关联性的方法但2种数理统计方法存在本质的差别即它们用于不同的研究目的.相关分析的目的在于检验两个随机变量的共变趋势即共同变化的程度   回归分析的目的则在于试图用自变量来预测因变量的值.在相关分析中两个变量必须同时都是随机变量如果其中的一个变量不是随机变量就不能进行相关分析这是相关分析方法本身所决定的.对于回归分析其中的因变量肯定为随机变量这是回归分析方法本身所决定的而自变量则可以是普通变量有确定的取值也可以是随机变量.如果自变量是普通变量即模型Ⅰ回归分析采用的回归方法就是最为常用的最小二乘法.如果自变量是随机变量即模型Ⅱ回归分析所采用的回归方法与计算者的目的有关.在以预测为目的的情况下仍采用“最小二乘法”但精度下降—最小二乘法是专为模型Ⅰ设计的未考虑自变量的随机误差在以估值为目的如计算可决系数、回归系数等的情况下应使用相对严谨的方法如“主轴法”、“约化主轴法”或“Bartlett法”.显然对于回归分析如果是模型Ⅱ回归分析鉴于两个随机变量客观上存在“相关性”问题只是由于回归分析方法本身不能提供针对自变量和因变量之间相关关系的准确的检验手段因此若以预测为目的最好不提“相关性”问题若以探索两者的“共变趋势”为目的应该改用相关分析.如果是模型Ⅰ回归分析就根本不可能回答变量的“相关性”问题因为普通变量与随机变量之间不存在“相关性”这一概念问题在于大多数的回归分析都是模型Ⅰ回归分析.此时即使作者想描述2个变量间的“共变趋势”而改用相关分析也会因相关分析的前提不存在而使分析结果毫无意义.   需要特别指出的是回归分析中的R2在数学上恰好是Pearson积矩相关系数r的平方.因此这极易使作者们错误地理解R2的含义认为R2就是“相关系数”或“相关系数的平方”.问题在于对于自变量是普通变量即其取值有确定性的变量、因变量为随机变量的模型Ⅰ回归分析2个变量之间的“相关性”概念根本不存在又何谈“相关系数”呢更值得注意的是一些早期的教科书作者不是用R2来描述回归效果拟合程度拟合度的9
查看更多
其它推荐
热门其它推荐