首页
好价
精选好价
全部好价
优惠券
白菜
社区
好文
资讯
众测
笔记
海淘
海淘导航
淘遍世界
攻略文章
百科
商品百科
品牌导航
商家导航
更多
值友福利
金融
汽车
旅游
品类导航
专题汇总
招聘专区
集团官网
商业合作
爆料投稿
好价爆料
写篇文章
视频上传
提报百科
创作活动
条新消息
条新评论
登录
注册
个人中心
我的关注
我的文章
我的爆料
我的笔记
我的视频
我的百科
我的评论
我的众测
我的消息
我的收藏
退出登录
个人主页
dazhidazhidazhi
+
关注
Ta好神秘,什么都没有留下。
注册8周年
・
签到3243天
IP属地:辽宁
芝麻信用评估
授权
后可查看具体分数
芝麻信用评分是合法独立的信用评估及信用管理机构,授权后得到分数越高,代表信用越好
首页
爆料 318
笔记 10
评论 450
#21天读书挑战赛,就问你敢不敢来挑战?# 读书打卡第10天,《赤裸裸的统计学》读书心得 今天读的是第10章《统计推断与假设检验》 统计推断是让数据说话,让有价值的结论浮出水面的过程。统计推断是数据和概率的合体。在作出推断时会有一些假设为前提,亦或是引入过多的方法论。一旦理解了统计推断的工作原理,复杂问题也可以轻松对待了。 任何统计推断都是由或含蓄或直接的零假设开始的。先假设一个结论,然后通过统计分析对其进行支持或反驳。 零假设和对立假设在逻辑方面是互补的,也就是说,如果其中一个假设为真,则另一个假设为假;如果我们推翻了其中一个假设,那就必须承认另一个假设。
+1
0
0
0
2019-04-18
#21天读书挑战赛,就问你敢不敢来挑战?# 读书打卡第9天,《赤裸裸的统计学》读书心得 今天读的是第9章《中心极限定理》 中心极限定理的核心要义是: 一个大型样本的正确抽样与其所代表的群体存在相似关系。 通过运用中心极限定理,我们能做出如下的推理: 1. 如果我们掌握了某个群体的具体信息,就能推理出从这个群体中正确抽取的随机样本的情况; 2. 如果我们掌握了某个正确抽取的样本的具体信息,就能对其所代表群体做出令人惊讶的精确推理; 3. 如果我们掌握了某个样本,以及某个群体的数据,就能推理出该样本是否是该群体的样本之一; 4. 如果我们已知两个样本的基本特性,就能推理出两个样本是否取自同一个群体。 标准误差:衡量样本平均值的离散性。 标准差:衡量群体中所有个体的离散性。 标准误差就是所有样本平均值的标准差。
+1
0
0
0
2019-04-17
#21天读书挑战赛,就问你敢不敢来挑战?# 读书打卡第8天,《赤裸裸的统计学》读书心得 今天读的是第8章《数据与偏见》 数据是统计学的根本 ,如果说一个统计结果出了问题,那大体上是数据出了问题。也就是说如果基本数据出了问题,在缜密的分析也是徒劳的。 纵向数据集:对需要几年甚至几十年时间去求证的因果关系的探索极具价值。 横向数据集:即在同一时刻收集到的数据。 几种数据偏见: 1. 选择性偏见。以偏概全,选择自己熟知的群体代表更大范围的全体。或者,调查方式的局限性导致只有部分特定人群被选择,而不是随机的在全体样本中做调查。 2.发表性偏见。有的数据因为可能的结论而不被发表。 3.记忆性偏见。我们总是认为现在和过去是由逻辑关系的。 4.幸存者偏见。只有好的那部分被留了下来作为统计的数据,数据有被操纵的嫌疑。 5.健康用户偏见。数据并不是分析结果的直接因素,可能还有背后的原因没有被发掘。 收集到优质的数据要比我们想象的难得多。
+1
0
0
0
2019-04-16
#21天读书挑战赛,就问你敢不敢来挑战?# 读书打卡第7天,《赤裸裸的统计学》读书心得 今天看的是第7章《黑天鹅事件》 黑天鹅事件(英文:"Black swan" incidents)指非常难以预测,且不寻常的事件,通常会引起市场连锁负面反应甚至颠覆。 2008年金融危机华尔街因为过于信任VaR模型而没有估计到1%的概率所造成的巨大损失。数量分析专家们犯了三个最基本的错误: 1. 混淆了“准确”与“精确”的概念。“精确”会让我们误以为我们掌握了一切,其实一切都是错的。 2.对基础概率的计算错误。 3.忽略了“尾部风险”。貌似不可能的事件,往往就会发生且带来不可估量的后果。 请记住下面这段话: “最大的风险从来就不是那些你能看得见、算得出的,而是那些你看不见从而无从估量的,那些看上去似乎永远不在正常概率范围内、远远超出你的想象、你认为一辈子都不可能发生的风险,事实上,它们的确会发生,而且比你所能想到的要频繁的多。” “概率学本身不会犯错,犯错的是使用它的人。” 常见的与概率有关的错误,误解和道德困境: 1.想当然地认为事件之间不存在联系。原因是对事物独立性的错误理解。 2.对两个事件的统计独立一无所知。人们的直观感受与事实往往存在差距。 3.自认为看到的规律,实际或许根本不存在规律。 4.统计背景被忽视。 5.回归平均数。在大数定律的概念下,数量越多越趋于平均。 6.统计性歧视。面对一个问题,不能仅仅停留在统计学的层面,一个数字不能取代人的思考。
+1
2
0
0
2019-04-14
#21天读书挑战赛,就问你敢不敢来挑战?# 读书打卡第6天,《赤裸裸的统计学》读书心得 今天读的是第6章《蒙提·霍尔悖论》 先说一下本章的结论:你对概率的本能理解有时候会将你引入歧途。 本章所说的“蒙提·霍尔悖论”其实是一个游戏,也是一个著名的概率难题。假设有三扇门,只有一扇门后有大奖,那在你选择了一扇门后,主持人打来了另外两扇门其中的一扇,打开的门没有大奖。然后主持人会像你提问:是非要更换最开始选择的那扇门。 你的答案是什么呢?坚持自己的直觉,还是相信概率?如果你选择相信概率的话,你应该坚决的换一扇门。因为这样你获得大奖的概率就从1/3增加到了2/3。 这有可能是一件很反直觉的事情。当主持人打开了那一扇没有大奖的门后,他其实做了一件大好事。换一扇门后你相当于是在三个里面选择两个门打开,而且已知一扇门没有奖。获奖概率翻倍了。大量的实验经验也告诉我们,那些改变选择并获得大奖的人数是坚持最初选择并中奖的参与人数的两倍。
+1
0
0
0
2019-04-13
#21天读书挑战赛,就问你敢不敢来挑战?# 读书打卡第5天,《赤裸裸的统计学》读书心得 今天读的是第5章《概率与期望值》 本章开始作者就用一个经典的啤酒营销活动证明了一件事情:概率是一个非常强力的统计学工具。 有一些事件的概率是确定的,有一些是需要从以往的数据中推导出来的。概率不会准确的告诉我们一定会发生什么;它只会告诉我们很有可能发生什么和不太可能发生什么。 两个独立事件同时发生的概率取决于两个事件各自的概率。两个相互独立事件同时发生的概率等于两个事件各自发生概率的乘积。同一事件两个结果的概率等于分别发生某一结果的概率相加。 期望值是基础概率学的升级版,它是一个非常有用的参考数据。 大数定律:随着试验次数多增多,结果的平均值会越来越接近期望值。
+1
0
0
0
2019-04-12
#21天读书挑战赛,就问你敢不敢来挑战?# 读书打卡第4天,《赤裸裸的统计学》读书心得 今天读的是第4章《相关性与相关系数》 两个事物或者现象或者说是变量之间存在相互的关联,这就是书里所说的相关性的体现。相关性有有时会是正相关,也有负相关,就比如说体重和锻炼,锻炼越多体重就会相对变轻。 对于相关性的一个描述性数据叫做:相关系数。 相关系数有两个吸引人的优势: 一是体现在数学表达上,相关系数是一个区间为-1到1到常数。1为完全相关,-1则为完全负相关,而0意味着不存在有意义的联系。相关系数越趋近于1或者-1,则代表相关性越强。 二是相关系数不受变量单位的限制。在计算两个变量的相关性的时候单位完全不在考虑因素之中。 在看待相关性的同时要牢记一点:相关关系并不等于因果关系。两个变量成正相关或者负相关并不代表其中一个变量的变化是由另外一个变量引起的。 相关系数的运算公式如图所示:
+1
0
0
1
2019-04-11
#21天读书挑战赛,就问你敢不敢来挑战?# 读书笔记格式:读书打卡第3天,《赤裸裸的统计学》读书笔心得 今天读的是第三章《统计数字会撒谎》 在读本书之前,看过的基本关于统计学的书籍中都有提及相似的话题。统计学作为与数学息息相关的一门学科却又时常背离数学准确性这一特征。同样的一件事或者一组数据,解读的角度不同便会将读者误导。 最常见的莫过于对“平均数”和“中位数”的使用。中位数对于异常值不敏感,这有利于去除异常值的干扰,然而同样是这一特征,异常值的重要性往往也被忽略了。这时候就要看数据分布中的异常值对于事实的判断是起到了扭曲作用还是其重要的组成部分。 对于描述性的结论,是否有强有力的参考依据是极其关键的。是否是“苹果与苹果”的比较。我想原文应该是“apple to apple”指的是同一类事物,在同等条件下的比较。 统计学在衡量和管理某项事物的时候,起到了方便快捷的作用,但有时候统计学往往只是让结论显得更好看了而已。比如衡量一个医院心脏科医生的“救治率”,本来是想激励大家更好的救人治病,最后为了得到更好的数字,医生可能会预先评估患者的病情状况然后再决定救治与否,以提高救治的成功率。这与初衷背道而驰。 作者还引用了其他统计学家对大学排名嗤之以鼻的例子说明排名往往没有考虑到关键因素而是为了排名而排名。 哪怕再精确的计算也会被无良的人拿来混淆视听。我们能做的是守住自我的底线,明辨统计数据中的是非,不被骗也不去骗人。
+1
2
0
0
2019-04-09
#21天读书挑战赛,就问你敢不敢来挑战?# 读书打卡第2天,《赤裸裸的统计学》读书心得。 第二章《描述统计学》 描述性的数据为我们提供了一个针对某一现象的可操作、有意义的概括。但是,任何一种简化都会面临被滥用的危险。 平均数容易受到“异常值”的误导,这时中位数提供了更好的解决方案。用平均数还是中位数,关键在于根据具体的情况确定哪一个“中间位置”可以更好的反映问题的实质。 “绝对值”和“相对值”在用描述性统计学做比较时会被用到。关键也在于哪一个更有意义。 标准差用来衡量数据相对于平均值的分散程度。 指数,将一系列复杂的信息浓缩成一个数字,可以让我们对之前无法展开简单比较的事物进行排名。然而,我们用各种各样的方式浓缩信息,每种方式有可能得到不一样的结果。
+1
1
0
0
2019-04-08
读书打卡第1天,《赤裸裸的统计学》读书心得。 统计学本是充斥着数学公式和大量数字说明的一门学科,有时让人感到毫无意义可言。然而本书作者查尔斯·惠伦(Charles Wheelan)利用通俗易懂的语言加以大家熟知的现实情形拨开了统计学枯燥而神秘的外衣,然后读者更加容易理解统计学背后的意义。 在第一章《统计学是大数据时代最炙手可热的学问》中介绍了1.为什么说描述统计学存在的意义就是“简化”,而且对描述统计学的过分依赖会带来误导性的结论或导致不良行为。2.抽样数据的重要作用。3.概率的作用与局限(需要使用者有较强的判断力)。4.回归分析只能确认变量之间的联系,而不一定是因果关系。5.数据信息在不同的人手里会有不同的解读。 分享一下作者在书中提到的瑞典数学家、作家安德烈斯的一句话:用数据说谎容易,但是用数据说出真相却很难。
+1
1
0
0
2019-04-07
85
关注
31
粉丝
社区达人榜
查看更多
1
斑鸠
2
moyya
3
开心最值得
4
科技袋子
5
可爱的小cherry
关注数量超出限制,
请先删除部分内容再尝试