
1.1 统计的含义
统计是人类认识社会的一种有力武器,在各种实践活动和科学研究领域经常使用。“统计”一词有三种含义,即统计活动、统计资料和统计科学。
(1)统计活动,又称统计工作,是指收集、整理和分析统计数据,并探索数据内在的数量规律性的活动过程。比如,球类比赛时解说员要统计竞赛双方的进攻次数和成功率。
(2)统计资料,或称统计数据,即统计活动过程所获得的各种数字资料和其他资料的总称,如统计年鉴、统计分析报告、政府统计公报等。
(3)统计科学,即统计学,是阐述统计工作基本理论和基本方法的科学,是对统计工作实践的理论概括和经验总结。
统计学究竟是什么,至今没有一个统一的定义。《大不列颠百科全书》对统计学的定义为:统计学是收集、分析、表述和解释数据的科学。《中国百科全书·数学卷》对统计学的定义为:统计学是一门科学,它研究怎样以有效的方式收集、整理、分析带随机性的数据,并在此基础上对所研究的问题做出统计学推断,直至对可做出的决策提供依据或建议。
综合来说,统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。由于统计学是与数据打交道的科学,因此,统计学也被称为“数据的科学”。
统计的三种含义不是孤立存在的,而是有着非常密切联系的。统计工作是统计的最基本含义,是统计资料和统计学的前提和基础,统计资料是统计工作的成果,统计学是统计工作的经验总结和理论升华。对统计学的深入研究又会大大提高统计工作和统计资料的质量。三者的关系如图1-1所示。统计活动、统计资料、统计科学相互依存、相互联系,共同构成了一个整体,这就是通常所说的统计。

图1-1 统计三种含义的关系
那么,什么是数据内在的数量规律性呢?下面用两个简单的例子来说明。
【例子1-1】我们都知道,随机地投掷一次硬币不能事先确定出正面或反面,但经过大量观察,不断重复试验时,就会发现一枚硬币出现正面和反面的概率会大体相同,即0.5 ∶ 0.5。这也就是我们所探索的数量规律性。历史上有多位科学家探索过这一规律性。18世纪法国博物学家布冯伯爵抛一枚硬币4040次,出现2048个正面,正面出现的概率为0.5069;数学家科里奇在二战期间被德国人关进监牢期间,抛硬币10000次,出现正面的次数5067个,正面出现的概率为0.5067;1900年前后,英国生物统计学家皮尔逊抛一枚硬币24000次,正面出现的次数为12012个,正面出现的概率为0.5005。试验次数越多,出现正面和反面的可能性就越接近1/2这一稳定的数值。
【例子1-2】一个家庭新生婴儿的性别可能是男也可能是女,从表面上看,新生婴儿的性别比例似乎没有什么规律可循。但如果对新生婴儿的性别进行大量观察,就会发现性别比例还是有规律的,即婴儿总人数中男孩要多于女孩,大致为每生育100个女孩,就有105个左右的男孩。这个105 ∶ 100就是新生婴儿男女性别的数量规律,它是人类社会长期遗传与发展的结果。有人会问,新生儿男多于女,不是性别不平衡了吗?是的,新生儿男多于女会出现不平衡,但是男婴夭折率高于女婴,到了中青年时,男女人数就大致相同了。进入中老年后,男性的死亡率仍然高于女性,导致男性的平均预期寿命比女性短,长寿的男性要少于女性,中青年男女人数大致相同,老年时女性又略多于男性。这一现象既保证了人类在中青年结婚生育时性别大致平衡,又使得在人口总数上男女也大体相当,有利于人类社会的进化和发展。对人类性别比例的研究是统计学的起源之一,也是统计方法探索的最早的数量规律之一。