统计学概述

Posted by caoyq on May 20, 2022

统计是一种具有悠久历史的社会实践活动。可以说,自从有了国家,就有了统计工作。最初的统计活动是为统治者管理国家的需要而进行的搜集资料的工作,涉及到计算国家的人力、物力和财力等活动。今天,统计已经发展成为各行各业开展活动时必不可少的一项基础工作,所有搜集信息和处理信息的活动,都可以归结为统计工作。古往今来的统计学者对统计学给予了不同的定义。根据美国统计学家David Freedman等著的《统计学》(魏宗舒等译,中国统计出版社,1997年版)中的定义:统计学是对令人困惑的问题作出数字设想的艺术。把统计学称为艺术显然有些夸张,但这一定义的目的正在于提示统计工作者,应当创造性地提出和解决统计问题,不应囿于某些条条框框去理解统计这门科学。

Alt Text

一、统计发展简史 

  统计学的研究方法从根本上说,是从数据出发去研究自然和社会经济规律,这一点与其他科学存在着显著的区别。例如经济学,是通过对各种经济主体行为的理论分析,探讨经济规律,而统计学在研究经济现象时,是从结果出发,去探寻其中的规律。统计学从学科分类上看,可以分为理论统计学和应用统计学两大部分。理论统计学(Theoretical Statistics)是指统计学的基本原理,主要研究统计学的一般理论问题,尤其是各种统计方法的数学理论问题。应用统计学(Applied Statictics)是研究如何应用统计方法去解决实际问题的,应用统计学一般都与特定的领域相联系。例如,统计学在教育领域的应用,称为教育统计学;在经济领域的应用,称为经济统计学;等等。   最古老的统计可以上溯到远古时代人们对于土地和产量的测量,但这一时期的统计方法往往是粗陋的,没有形成完整的科学体系。   统计学者比较认同的现代统计学的源头大致包括三个方面。   1.1676年英国经济学家威廉配弟发表的《政治算术》。在这本书中,配弟用大量的数字分析了英、法、荷等三国的经济实力,开创了利用统计数字进行经济学分析的先河。这一统计学分枝后来发展成了国势学派,今天的国民经济核算体系,就是源于这一学派的理论。   2.1662年英国学者约翰格朗特发表的《关于死亡表的自然观察与政治观察》。在本书中,格朗特分析了英国伦敦的人口死亡情况,成为最早的人口统计学研究。目前,人口统计学是统计学中最有活力的分枝之一。   3.17世纪法国数学家帕斯卡尔和费尔马创立的古典概率论。在这一时期,两位数学家以通信的方式,讨论了赌博中各种具体情况的概率计算问题,发展了概率论理论。   到19世纪末,古典统计学的框架基本形成,其主要的内容主要是今天描述统计学涉及的内容。   进入20世纪以来,随着大工业生产的发展,质量检验的统计理论迅速形成。1908年,英国酒作坊学徒工戈赛特(Gosset)以“Student”的笔名在《生物统计学》杂志上发表了一篇论文《平均数的概差》,提出了基于小样本的t统计量理论,极大地推动了推断统计理论的发展。   20世纪中叶,英国统计学家Ronald Aylmer Fisher(1890-1962)等人分别对F统计量、极大似然估计、方差分析等理论进行了大量的探讨,从而建立起了推断统计学的庞大的学科体系。   在1920年之前,由样本对总体进行估计的概念,一直是直观和模糊的,1925年,Fisher在其著名论文《研究人员用的统计方法》中,阐明和扩展了估计的概念,提出了最优估计概念,以及估计的效率和充分性等问题。在长期从事实验设计的过程中,Fisher还提出了重要的随机化原则,认为这是保证取得无偏估计的有效措施,也是进行可靠的显著性检验的必要基础。   理论界认为,在1920年之前,统计研究属于“资料整理”时期,即描述统计学时期,从Fisher开始,进行了“分析统计”时期,即推断统计学时期。  

二、统计学的分支与进阶

  统计学,就是收集、处理、分析、解释数据并从中得出结论的一个学科。不管你是做什么行业,只要接触到数据,就或多或少地会应用到统计学的知识。所以,统计学是关于数据的学科,学习统计学非常有用。案例:在一个水库中养着许多鱼,管理人员希望了解鱼的大致数量,这就是一个实践中的统计学问题。由于鱼是不听从指挥,会在各处自由游动的,因此,在进行统计时,必须创造性地提出解决方案。一种解决方法是先从水库的不同位置一共捕上来1000条鱼,在每条鱼的尾部作上一个标记,应当保证标记不会影响鱼的自由游动。然后,将鱼全部放回水库。几天后,从水库中再捕上来2000条鱼,检查其中尾巴上有标记的鱼的数量。假定在第二次捕上来的2000条鱼中,有20条尾巴上做了标记,则可以推断,水库中鱼的总数大致为1000/(20/2000)=10万条。   上述这个案例在实践中是经常见到的,对于一个统计工作者来说,作出一个10万条鱼的估计是不够的,他还应当对这一估计的精度作出判断。但这种搜集统计数据的方法,更多地是一种艺术,是很难从书本上学到的。在实践工作中,统计的应用方面是十分复杂的,只有将统计理解为一种艺术,创造性地提出新的方法去解决新的问题,才是真正地掌握了统计的精髓。数据的统计分析主要包括两个方面的内容:一是统计描述,主要是运用一些统计指标诸如均数、标准差以及统计表和统计图等,对数据的数量特征及其分布规律进行客观地描述和表达,不涉及样本推断总体的问题;二是统计推断,即在一定的置信度或概率保证下,根据样本信息去推断总体特征。见下图所示,一个是反映了统计学两个分支;另一个是表明了统计分析过程的两个不同阶段。

统计推断通常包括参数估计和假设检验两个内容:参数估计是指用样本指标推断总体相应的指标,例如根据部分城市人群的原发性高血压患病率去估计整个城市的原发性高血压患病率,参数估计又分为点区间和区间估计。比如:已知样本量为200、均数为100,标准差为5,对总体均数进行估计,如果直接用100作为总体的均数,这种估计方法被称为点估计,由于样本是随机的,抽出一个具体的样本得到的估计值很可能不同于总体真值。所以就有了另一种估计方法区间估计,它是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到;假设检验是指由样本之间的差异推断总体之间是否可能存在差异,例如原发性高血压治疗药物在两组的疗效存在一定差别,假设检验回答这种差别是机会造成的,还是真实存在的。总结计一下更清晰:

三、统计学的基本概念

总体:要研究的全部个体的集合 样本:总体中的部分元素的集合 参数:描述总体特征的数字度量 统计量:描述样本特征的数字度量 如在全市200万个使用某wifi的用户中随机抽取2000个用户,推断全市用户对wifi的满意度情况。这里的总体是:200万个使用某wifi的用户;样本:2000个用户;参数:200万个用户的满意度情况;统计量:2000个用户的满意度情况;这里用到的统计方法就是推断统计了。

总结

 学习统计学原理课程,主要应达到三个方面的目的:   1.运用统计思想进行分析的能力。在实践工作中,要善于利用统计的思维方式进行思考,在纷繁复杂的社会实践中,要学会发现数字、分析数字,并使用数字说话。   2.掌握基本的统计方法。要掌握统计工作中涉及到基本统计概念和基本统计计算方法,能够阅读常规的统计报告,了解统计指标的含义。同时,能够自己处理常见的统计问题。   3.锻炼统计计算的能力。在掌握统计方法的基础上,要培养动手计算的能力。其中涉及到运用数学公式和使用计算机进行计算的有关技能。   其中,第一个方面是学习本课程最为重要的目的,为达此目的,在学习过程中,要积极地结合社会实践,分析统计问题。第二个方面是对课程知识的掌握问题,课程中涉及到的统计方法都是最常用的,要牢固掌握。第三个方面则涉及到日常的自我训练,要学会自己运用计算机等工具,处理统计计算问题。  

参考文献

1.(统计学:统计学概述(一))[https://blog.csdn.net/u010608296/article/details/111577891] 2.(简单地聊聊统计学)[https://blog.csdn.net/data_cola/article/details/107623099]

3.https://huaweicloud.csdn.net/637f7cc3dacf622b8df860c1.html?spm=1001.2101.3001.6650.2&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Eactivity-2-123774572-blog-128132180.235%5Ev38%5Epc_relevant_anti_t3&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Eactivity-2-123774572-blog-128132180.235%5Ev38%5Epc_relevant_anti_t3&utm_relevant_index=5)