天顺娱乐-天顺平台注册站
 
 
学习统计学,有哪些推荐的入门书籍?为什么?
来源:网络 时间:2024-03-12 11:39

"相关问题:学习博弈论,从入门、进阶到精通,如何列书单?"

强悍书单:概率与测度论+数理统计+随机过程+金融 - 爱问频道 - 经管之家(原人大经济论坛)

-----------------------------

2017.11.11更新部分书目

-----------------------------


入门我觉得有两种:

  • 想把统计当成专业来学的
  • 想作为知识的补充,为了今后更好的发展

先讲第二种。那荐书单的一个标准是:适合没有太多统计训练,同时对实践有需求的人

思想类:

@熊猫背影杀 提到的《统计学》即可作为统计思想入门。入门前务必了解数学和统计是天差地别的两门学科。初步了解统计是怎么一回事,对入门非常重要!

调查类:

软件类:


如果你是第一种...那我把我们学校的本科生培养计划放出来给你参考吧~每本书都有仔细看过....虽然没学好.....

你唯一需要注意的是,开始学习的时候,数理基础很重要!但到后来,统计思想方法更重要。

数学类:

软件类:

统计必修类:

统计选修类:

  • 100202 贝叶斯决策
  • 100937 属性数据分析
  • 103294 非参数统计
  • 100188 金融建模
  • 103213 计量经济学
  • 103277 试验设计
  • 103287 质量控制与可靠性分析
  • 102109 广义线性模型
  • 102111 统计文献选读

1.《统计学》

2.《统计学》

3.统计学习方法

4.《统计学》


5.《统计推断》

6.《数理统计与数据分析》

----------------------------------------------------------------------

码字不易, 求个赞哈, 更多干货书籍欢迎关注个人公众号【渔好学】


不说书了,本回答末尾直接分享20本数据分析、统计学的电子书给你,经典书籍都在里面了,这次主要说知识,顺着我给你整理的这个思维导图去学习就行了。

我经常在文章中讲,做数据分析离不开统计学知识,它为我们的数据分析提供理论基础,然而很多数据分析师在学习统计学知识时感到头疼,看了很多统计学的书籍,里面讲了很多复杂的数学公式和推导,让人记不住也难理解。

其实,市面上大部分的书籍都是面向高校教育的统计学书籍,专业性较强,对于数据分析师来说,我们并不需要掌握那么细。

因此,本文我就为大家列罗列了数据分析中需要掌握的统计学知识,让大家了解统计学有哪几大块,每一类分别用于什么样的分析场景,由于文章篇幅原因,仅为大家梳理知识点,具体的知识点讲解不详细展开。

稍微关注过统计学的人,可能会这么一个疑问。为什么大学里会有这样两门课,《概率论与数理统计》,《统计学》,它们有什么区别?

我的理解,《概率论与数理统计》更专业一些,偏理工科,会有大量公式的推导,知其然,知其所以然;而统计学这本书更基础,侧重于概念现象的解释,一般会直接给出结论,而不要求掌握结论的数理推导过程,文理科皆可用。

但不管是哪门课程,前期都是先讲概率和概率分布。概率论是统计学的基础,而随机事件的概率是概率论研究的基本内容。

我们的世界是一个充满不确定性的环境,整个世界并非严格按照某个制定好的路线运行的。多数事物之间也并非有因必有果,万物之间充满了不可控的随机事件,我们不会因为今天努力了明天就一定会成功。

不确定性事件唯一的规律就是概率,独立随机事件我们没办法预测或控制它在某个时刻一定会发生,但却可以用概率来描述它发生的可能性。以概率论作为理论基础,为我们提供了认识不确定世界的方法。

这一章节,需要大家掌握几个核心概念:

  • 随机事件
  • 概率
  • 概率分布
  • 数字特征

今年疫情期间,待在家里除了陪伴家人以外,每天讨论最多、关注最高的事件莫过于疫情的新动态,这些动态的展现形式大家有没有注意到,各种专业、好看、直观的图表和数据图,让数据呈现得一目了然。

工作中,一名数据分析师拿到了数据后,第一步要做的是数据初步探索,这也叫数据的预处理,这个时候,更多的就是利用各种图表探索数据。图表的好处是它可以很直观的看到数据的分布以及趋势,更有效的观察数据。

这一章节,需要大家掌握几个核心概念:

  • 数据类型
  • 统计表
  • 统计图

利用上面所讲的图表展示,我们可以对数据分布的形状和特征有一个大致的了解,但要全面把握数据分布就要反映数据分布特征的代表值。通常包含分布的集中趋势、分布的离散程度、分布的形状。

数据分析中,最常见的场景,就是你手上拿到一组,一批或者一坨数据。不懂统计学的人,可能会不知所措,或者说,你不做些加工和处理,你不知道这些数据有啥用。这个时候,就需要通过这些概括性的度量指标,来帮我们从宏观上把握数据中的初步信息。

这一章节,需要大家掌握几个核心概念:

  • 众数/平均数
  • 方差/标准差
  • 偏度/峰度

抽样好懂,抽样分布不好懂。

抽样,就是从研究的总体中抽取一部分个体作为我们真正的研究对象,可以简单把样本理解为总体的一个子集,通过样本的结果来推测总体情况。比如我们想知道中国成年男性的平均身高,理论上最准确的办法是调查中国所有成年男性的身高,然后计算平均数。很显然,没人这样做。实际的做法总是抽取一部分人,然后计算这部分人的平均身高,由这个平均身高来大致估计总体的平均身高。

理解了抽样,再来理解抽样分布。抽样分布说的是对谁的分布?答案是样本统计量,比如样本均数或者样本比例。以样本均数为例,一般说样本均数的抽样分布如何如何,这里,样本均数被当成了一个随机变量来看待。我们最希望大家记住的要点:样本均数是一个随机变量,但对于初学者,这确实是比较反直觉的。

为何样本均数可以被当做一个随机变量?因为样本均数是依赖样本计算得出的:每抽取一组样本都可以计算出一个样本均数,而且这些样本均数或多或少都会有些差异。由此,样本均数会随着抽样的不同而随机变动。只是现实生活中我们一般只抽取一组样本,计算一个样本均数,因此,会觉得样本均数不变。

这一章节,需要大家掌握几个核心概念:

  • 统计量
  • 抽样
  • 抽样分布

当初大学里,学数理统计的时候,到了这块就感觉越来越难了,学习的过程中可以说就是囫囵吞枣,似懂非懂。但现在,经过漫长的实践过程,对统计学的知识有了更深一步的理解。

统计推断,说白了,就两件事。第一个,参数估计。第二个,各类假设检验。学习到这里,假如你是做数据挖掘,机器学习的,你就会强烈意识到,数据挖掘和统计学之间是存在千丝万缕的联系。

参数估计,顾名思义就是对参数进行估计,那什么是参数呢?就是你假设分布的参数就是说你认为或者知道某个随机过程服从什么分布,但是不确定他的参数是什么,那怎么办?你采样、采很多样本(实际值),通过这些样本的值去估计分布的参数就是参数估计。

这一章节,需要大家掌握几个核心概念:

  • 参数
  • 点估计
  • 区间估计

上面讲到,统计推断就需要明白两件事,一件是参数估计,另外一件是假设检验。

假设检验是什么?说白了,假设检验就是先对总体猜一个参数值,然后利用样本的数据检验这个参数值准不准。

互联网生产实践中的ABTEST方法,就经常会应用到假设检验的思想。

举一个简单的例子:

学而思网校App进行了改版迭代,现在有以下两个版本

版本1:首页为一屏课程列表

版本2:首页为信息流

如果我们想区分两个版本,哪个版本用户更喜欢,转化率会更高。我们就需要对总体(全部用户)进行评估,但是并不是全部存量用户都会访问App,并且每天还会新增很多用户,所以我们无法对总体(全部用户)进行评估,我们只能从总体的用户中随机抽取样本(访问App)的用户进行分析,用样本数据表现情况来充当总体数据表现情况,以此来评估哪个版本转化率更高。

这一章节,需要大家掌握几个核心概念:

  • 假设检验
  • P值

大学里学习统计学的时候,最喜欢学回归分析,也是学的最明白的一部分。

因为它的易懂性,也因为它的实用性。但随着自己数据分析经验的积累,对回归分析的理解也越来越深,它不是简单的回归模型求解那么简单,它更是一种日常工作中解决问题的思路和方法论。

数据挖掘中使用的各种高深的模型,任何模型都可理解成回归模型,包含因变量Y和自变量X,求解参数。

在我看来,回归分析由两部分组成:业务分析和技术分析。

其中,业务分析属于“道”的层面,而技术分析属于“术”的层面。从“道”的层面来看,回归分析是业务分析,其分析的不是数据,而是业务,是业务中的不确定性。通过业务分析,获得对业务不确定性的理解,进而将抽象的不确定性业务问题转换成一个具体的数据可分析问题。

什么是数据可分析问题?

一个业务问题,只要有清晰定义的因变量Y(不管是看得见的,还是看不见的)和清晰定义的自变量X,这就是一个数据可分析问题。

一旦把业务问题规范成一个具体的数据可分析问题(有清晰定义的Y和X),那么接下来就是技术分析,属于回归分析“术”的层面。

在这个层面,人们关心对于一个既定的Y和X,要研究其中的不确定性,应该选择什么样的模型设定,线性模型还是非线性模型,一元模型还是多元模型,简单的决策树还是随机森林,普通的神经网络还是深度学习。模型设定确定下来后,还需思考应该用什么方法估计,如何调优,等等。

以上是对回归分析的一种广义上的理解,狭义上理解回归分析,需要理解以下几个核心概念:

  • 相关系数
  • 回归分析
  • 最小二乘法
  • 显著性检验
  • 多重共线性
  • 拟合优度

当然,统计学的知识还包含很多,比如方差分析,时间序列分析,统计指数等等,这些知识在特定的应用场合,也有着广泛的应用,只是相比以上的知识点,应用范围更小点。

我是做数据分析的老李 @李启方

数据分析必看的养成书单!附20本书的PDF下载

这里有一份适合不同基础,不同用途的比较全的书单推荐。

不论你是0基础,还是大学本科读完统计学想要深造的水平,不论是想要快速通过统计学考试,还是在工作中需要用到统计学的相关知识来提高工作效率,这里总有一本书适合你。

在此之外,先要和大家聊一下统计学入门的一些小tips。

统计学的应用可高可低,各行各业都要用,但是统计学的自学门槛比较高,主要是数学根基,所以很容易劝退大部分人口,尤其是非理工专业出身的同学们。

所以,自学建议先明确学习目标,学习统计学的目的是什么:是工作需要还是考试需要。

有一点要强调,统计学是为数不多的毕业有用的大学课程,所以如果你是学生,建议好好把统计学学习好,将来很多岗位需要用到。

统计学不好学,尤其是自学,一定要找对学习路线图。

自学统计学最困难的地方:

1,入门知识点复杂且关联性强,学术专业名词繁多。

学习的视角需要忽高忽低,既要站在高处看宏观结构,也要落到地上精研技术点,还要注意不能迷路。

调整心态,避免看到生词就崩溃,而这个生词前面没多远才刚碰到过。

快速了解众多专业名词的意义及其作用,不行就背下来。

学习过程可以在纸上涂鸦,描述知识点之间的结构图。

2,大部分理论知识和实际操作脱节,容易产生“学完了不会用”的情况。

第一步没有把你劝退,其实成功了一半了。大学统计学课程中尤其常见,书本和老师的讲解重点在理论知识部分,对学生的实际操作重视不够,常出现会学不会用的应用难情况。这个问题对于考试倒不是什么大问题,不挂就行,但是对于工作,真的是白学。无论数据分析、可视化、甚至算法设计都需要与实践挂钩。很多人虽然科班出身,统计学高分过,但到工作岗位还是无法上手。

个人更建议大家学习一门知识之后能利用与其关联度高的工具能学以致用,结合SPSS等统计分析工具操练起来,这是这又带来的新问题——还得学习工具使用,而且不同作者编写的图书结构不一致,要花时间匹配。

下面推荐几本入门相对容易的书,排名不分先后,各有对口读者。

适合有一定英文基础的人看,因为这本书我暂时还没有看到中文版。

这是我目前为止看统计学教材阅读最轻松的一本书,它的特点是针对一个概念,或者一个统计学的应用技巧会引入大量的例题和场景,让你通过引用场景的带入来切身理解这个概念在实际生活中的用途。

大多数例题都是针对美国大学生的生活数据,如食物,运动,网络等数据,配上校园生活照片,不仅和教材的概念吻合度极高,而且读起来也是十分有趣的,没有在美国留学但却能体会到在美大学生活,这本书也是很多美国大学在用的统计学教材。

对于快速理解统计学概念,知识点,以及通过考试来说这本书一定是你的不二之选。

只可惜没有中文的版本,大家有看到翻译版一定要分享!

译文版。这里说一下哈,大家买国外教材,如果英语好能看原文尽量看原文。

这本书虽然以管理和经济的统计知识切入,但是很好入门。

主要有两个点值得推荐:

有系统分类及流程图,对初学者来说能系统得了解统计学的系统和概念,先对统计学有一个比较完整的概念。

第二是早期版本配套免费的英文版统计工具,是Excel的加载项,用起来很顺手,可以直接操练,比再去啃SPSS学习成本低廉,但是因Office版本升级,沒有更新软件。

如果你是需要通过考试,这本书不错,之前版本偏向教科书,现在越来越偏向通过考试和考研了,例子不错,很多结合SPSS或EXCEL有具体实操,习题很多,配套很全。

要说缺点,知识点都讲到了,但随着版本更迭,貌似成为一本考试书了,对统计学本身的宏观视角感觉不够,虽然入门也还相对容易,但是是我推荐的四本入门书里面最难的了。

这本书是这四本里面最年轻的一个,新版全彩印刷,颜值甚至比美国那本《应用统计学》还高几分。

国内的技术书通常都很朴素,大学的教材基本都是冗长的概念解释+复杂的公式,比如大学数学,行列式开始讲起,没有线性变换,又没有例子解释,只能靠智商自己悟,对初学者来说不友好。但这本书还挺令人意外的,作者陈文贤是加州大学伯克利分校的工程博士,在编书的时候大约是参考了国外教材的编撰方式。

最直观的一点,在不同的概念,知识点后面都加了很多现实场景中的案例辅助理解,从最底层的统计定义,样本统计方式和统计数据收集,不同统计表格的特点等开始讲起,而且一个知识点恨不得有好几个具体的例子给你理解,非常好懂。起码不会让人生啃名词解释。

另外,不知道是不是现在写书编书的方式更新潮了,这本随书附赠了大量资料,截个图给大家看看:

可以看到里面有加载工具,R语言还有大量的例题,习题和补充教材,案例解释,习题之类的也有小几万字。就案例补充和解释而言,相比第一本推荐的《应用统计学》应该是伯仲之间。

案例贴一个附加教材的,都是现实中出现过的统计学案例,比较值得讨论:

高智商的孩子长大之后吃素概率高?

离谱吗?挺离谱的!但数据也会骗人,学好统计学就知道在数据收集和测算的过程中出现了什么猫腻。

在学习路径上,这本书就是我开始讲的:视角忽高忽低。

在“低处”就如上所言,具体的概念解析,详细的案例。在高处的宏观视角上,学习地图,知识点的脑图,分支图很多,随手拍一张脑图。

这种脑图学习方式最大的好处是能快速累计起一个系统的知识学习框架,有一个比较科学的学习顺序,不管事找到当前学习位置,还是后期查漏补缺,以及知识之间的互链,一目了然。

高低结合的学习方式对学生,需要考统计学的人来说学习效率是最高的,能快速突破过考试。

实践部分也是错落有致,小知识点用原创的EXCEL加载项工具实现,大点的案例用R语言实现。

很多晦涩难懂的名词在实际统计工作中的应用,例如贝叶斯定理和公式,相信很多在读统计学的读者都了解过但具体怎么操作就不知道了。用这本书的表格加载工具差不多还是可以即插即用的,也算能帮助你了解实操作用。

在工作中需要用到编程和统计的读者,这本书其实也还是适合直接拿来用,解决很多问题的,起码这里面的很多编码和对不同需求,不同样本的统计工作能给你一些启发,当成工具书来用也还可以。

最后就是作者文学素养很高,引用了很多中国古典著作的名言。仔细琢磨一下还挺有道理的。

图多,案例多,实践多,思维导图,学习地图感觉几页一个,想迷路也挺不容易的。

基本上,我感觉学习统计学的痛点,这本书一次性干掉的最多,入门门槛最低,配套资源最实在。

《统计学习基础》:

这本书是由 Trevor Hastie、Robert Tibshirani 和 Jerome Friedman 合著的,是对统计学习的全面而权威的介绍,涵盖了广泛的统计和机器学习方法。

《时代教育?国外高校优秀教材精选?统计推断 (翻译版?原书第2版)》 George Casella, Roger L.Berger, 张忠占, 傅莺莺【摘要 书评 试读】图书.

《统计学》

统计学(第7版)》共12章,包括统计、数据和计算机、用图表展示数据、用统计量描述数据、概率分布、参数估计、假设检验、类别变量的推断、方差分析与实验设计、一元线性回归多元线性回归、时间序列预测、非参数检验

《概率论与数理统计》

《概率论与数理统计教程》是2019年高等教育出版社出版的图书,作者是茆诗松,程依明,濮晓龙,本书为普通高等教育“十二五”国家级规划教材。全书八章,前四章为概率论部分,主要叙述各种概率分布及其性质,后四章为数理统计部分,主要叙述各种参数估计与假设检验。
  • 国家统计局

建议可以先从国家统计局的统计知识库开始学习。其包括了统计理论知识、统计实务知识、统计历史知识等方面的内容。

  • 中国大学MOOC

中国大学MOOC(慕课)上有很多关于统计学的课程,可以根据自己的需求选择适合自己的课程。或者可以先从《统计学》基础开始学习。统计学的发展简史、统计学的内容,以及统计学的基本方法和应用等等 。

  • Coursera

Coursera:Coursera是一个在线学习平台,提供了大量的数据科学课程,适合初学者和进阶者

统计之都(Capital of Statistics, COS):这是一个自由探讨统计学和数据科学的平台,欢迎对统计学、机器学习、数据分析、统计软件、可视化等领域感兴趣的朋友在此交流切磋。

CSDN:CSDN是一个技术社区,提供了大量的编程、人工智能、大数据等方面的学习资源。在CSDN上,您可以找到很多关于统计学的学习资料和教程,例如《机器学习中的统计学》、《统计学基础》等。此外,CSDN还有一个数学板块,提供了丰富的数据挖掘以及统计学基础。

经管之家:经管之家是一个经济、管理、金融、统计在线教育和咨询网站,提供了丰富的统计学学习资源。在经管之家上,您可以找到很多关于统计学的学习资料和教程,例如《计量经济学》、《时间序列分析》等。此外,经管之家还有一个统计年鉴版块,拥有大量的最新统计年鉴以及稀缺统计年鉴可供免费下载。

SAS:SAS和SPSS类似,也是用于统计分析的软件。同样,包括了围绕统计学知识的基本应用。

R语言:R语言是一种免费且开源的编程语言,用于数据管理和图形表示。它也是一种非常流行的统计学软件,因为它具有强大的数据分析功能和可视化功能。

Minitab:这是一款免费的统计软件,功能非常强大,提供了丰富的统计分析功能,非常适合统计学习。

JASP:这是一款免费的统计学习软件,提供了丰富的统计分析功能,非常适合统计学习。

SPSSAU:SPSSAU是一个智能化在线统计分析平台,提供约300类分析方法,包括回归分析,相关分析,信度分析,效度分析,因子分析,聚类分析,方差分析,t检验等。

厦门大学-统计学(国家级精品课):这是一门由厦门大学提供的国家级精品课程。它涵盖了概率论、数理统计、应用回归分析等方面的内容,适合初学者和进阶者。

初级专业知识和统计实务(快班课程合集):这是一门由北京师范大学提供的课程,涵盖了初级专业知识和统计实务等方面的内容,适合初学者和进阶者。

中国大学MOOC:国家精品统计学教程


SPSSAU


 

联系我们

400-123-4567 仅限中国 9:00-20:00
微信二维码
Copyright © 2002-2022 天顺娱乐-天顺平台注册站 版权所有    粤IP********    

平台注册入口