成对样本T检验:实现配对的两个样本(两组样本的样本数必须相同两组样本观测值的先后顺序是一一对应的,不能随意改变)之间均值的显著性差异。比如对于两份调查问卷,给相同的一些人填写,每份调查问卷对应填写得到的相应的分数,现比较这两份所得分数均值是否有差异,即把这两组选为相应的配对组即可
比较独立样本与成对样本检验:注意上述说明的适用条件,如果都可以适用,还需根据已知数据的形式进行选择,其实感觉这两种实现效果都是差不多的。
单因素ANOVA检验:实现多个因子都可以决定某一变量时,他们对变量的影响有无显著性差异,比如投资类型有两种以上,现在需要比较投资类型对应的投资有无显著性差异,此时,运用该检验方法时,因变量列表为投资额度,因子为投资类型。
感觉独立样本检验与单因素检验差不多,只不过独立样本检验的分组变量为两组,而单因素检验的因子至少两个。

一般线性模型
单变量:研究两个及两个以上控制变量是否对观测变量产生显著影响。比如比较工人与机器(其中机器有三种,工人有四种)对于产量的影响。此时因变量为产量,固定因子为工人与机器,根据输出便可比较。
这个时候如果存在工人与机器之外的第三种变量对产量有影响,为了消除这种影响而只是考虑工人与机器对于产量的影响,这个时候只需要将这第三种变量作为协变量既可。

相关
双向量:检验两个变量是否相关:比如检验身高与体重的相关性,这个时候也可以先画一个散点图,点进去之后具体的检验函数什么的都可以自由选择
偏相关:由于其他变量的影响,所以在检验两个变量是否相关的时候,通过相关系数难以得出具体准确的结果,这个时候就需要剔除该变量的影响。比如检验商业投资与地区经济增长相关性时,游客增长会对此产生影响。所以利用偏相关检验时,变量为商业投资与地区经济增长,控制变量为游客增长,这样便可以消除游客增长对于检验的影响。

回归
线性:实现因变量与自变量的线性回归关系,也可以给出具体的线性回归方程。比如得出现在工资与工龄之间的线性关系,这里因变量是工资,自变量是工龄。
当然自变量也可以是多个,比如影响工资的还有职位,当求多个自变量与因变量的关系时,只是在自变量那里填多个自变量即可,不过这里需要把因变量下面的选择有原来的输入改为步进(原来自变量只有一个时选择步进)。
曲线估计:当两个变量之间关系无法用线性表示就可以化为曲线估计,可以先求出这两个变量数据的散点图,然后根据散点图估计大致的曲线关系:比如是二次还是对数关系之类。比如求工资与工龄关系,进去曲线估计后,因变量选择工资,变量时工龄。对于下面的模型就根据散点图选择。输出结果后可以很清楚比较哪种曲线拟合最好之类。
