除极少数情况外,样本的组成都是随机的,也就是说,机会在其构成中起着一定的作用。因此,为了获得上述收益,我们必须接受调查中的一个特定误差,称为抽样误差。事实上,由于可用的信息仅涉及样本,我们不能声称准确测量调查领域中定义的参数:我们试图测量的和我们计算的之间存在数值差异。因此,统计人员必须对这些参数的估计感到满意。
统计理论通过两个概念来平均评估这 美国海外华人数据 种误差,分别是偏差和抽样方差。假设我们通过应用给定的采样方法,连续且独立地抽取大量样本,并计算与获得的不同样本相关的不同估计值的平均值:该平均值与感兴趣的参数之间的数值差异称为采样偏差。 与样本相关的估计值围绕其平均值的变化。这就是抽样方差,它越大,产生数值上远离平均值的估计值的风险就越大。
偏差和方差可以用以下例子(图 1)简单地说明 :当向目标投掷飞镖时,飞镖的撞击部分是由偶然因素引起的。如果投掷的不同飞镖和谐地围绕目标的中心,那么我们就进行了“无偏”射击。如果飞镖大多位于镖盘的右上角(举例来说),则存在偏见。此外,如果射击是成组的,也就是说如果飞镖几乎都位于目标上的同一点附近,则差异就会很小。另一方面,如果我们发现飞镖散布在目标各处,则方差就会很高。调查统计员的主要目标显然是得出偏差和抽样方差尽可能小的估计值。