1. 众数,中位数,平均数excel
(一)
1906年,伟大的科学家兼恶心的人种改良倡导者高尔顿(Francis Galton)参加了年度西英格兰家畜展,即兴做了个数学实验。
在集会上闲逛的他碰到了一个猜重量竞赛。人们猜测一只的公牛的重量,猜的最准的人将获得大奖。
高尔顿曾公开鄙视过普通大众的愚笨。他相信只有专业人士才能做出准确的估测。787位猜测者中根本没几个专业人士。为了体现群众的无知,他算出了所有猜测的平均数(而不是当时统计学家常用的中位数):1197磅。得知实际重量后他吓了一跳:1198磅。
在如今的世界里,我们只能见到平均数的身影:纽约4月均温为52华氏度;库里场均拿到30分……只有在某些统计里(美国家庭年收入中位数为51939美金)中位数才会露下头角。
那么,中位数是如何消失的?平均数又是如何成为了当今世界最流行的量数?
(二)
俗称的平均数(average)在数学上的其实是“算数平均数”(arithmetic mean),意为所有数据之和除以数据的个数。算数平均数中的“平均数”(mean)一词源自拉丁语的“中间”(medianus)。Mean这一概念最初由希腊数学家毕达哥拉斯提出。
毕达哥拉斯时代的mean并不具有表征作用,它指的只是三个数字中间的那个数字,那个数字必需与两头的数字呈“相等的关系”。这三个数字可以是等距(如2,4,6),也可以是等比(如1,10,100)。
花了十年时间探寻average和mean起源的统计学家Churchill Eisenhart表示,与现代人依赖于大量数据进行计算不同,早期科学测量非常不准,科学家们需要借助理论来选出多个数据中最好的一个。
正是借助mean这一理论的力量,古希腊天文学家托勒密从极少数的观测中,选择出了31’20作为月球的角直径。如今我们知道根据所在地点的不同,月球的角直径为29’20到34’6不等。
在英语中,average一词在1500年左右开始出现,指代船只或船上货物受损所带来的经济损失。如果因为船只受损,船员们必需扔掉一些货物来减轻重量,那投资者就会用arithmetic mean的方式来计算出总体经济损失。渐渐地,这两个概念融合在了一起,称为了我们通常所说的平均数。
多年之后,科学家才会开始使用一种集中量数来表征一组数据。但首先站上历史舞台的,不是平均数,也不是中位数,而是中列数。
(三)
科学工具往往是为了解决某些学科内特定问题而创造出来的。在集中量数的寻找过程中,人们希望解决的问题是为导航而进行的地理测量。
11世纪波斯知识界巨匠比鲁尼是集中量数已知最早的使用者之一。他尝试测量了古城伽兹尼的经度。那个时代的人们在拿到一组测量数据之后,会去掉两头之间的数据,取最大值和最小值中间的算术平均数。我们今天把这个数称为中列数(midrange)。
Eisenhart发现,17和18世纪时中列数依然盛行。牛顿和其它航海家为了计算地理位置都使用过中列数。但近几百年来,在这被平均数占领的世界中,中列数已经下落不明。
(四)
19世纪早期,算术平均数已经成为了一种常用的集中量数。那个时代最杰出(也最暴躁)的数学家高斯在1809年写道:
如果要在同一情况下用同种方式,从几次直接观测中选出一个数,那这些数的算术平均数便是最接近真值的数。习惯上,这假设已经已经被当成一个公理。
史书上并没有明确的记载。Eisenhart发现,算术平均数可能在地理大发现时代被探索磁偏角(磁北方向与正北方向之间的夹角)数学家们首次采用。
直到16世纪后期,大部分科学家都在使用某种特定的算法来取测量中的最佳值。但在1580年,William Borough用了一种新算法,把8个数据“结合在了一起”,宣称磁偏角在11°15’至11°20’之间。虽没有明确记载,但他可能用了算术平均数。
1635年时,英国天文学家Henry Gellibrand称为了已知最早使用平均数作为集中量数的人。一天早上,他测出磁偏角为11°,当天下午则测出11°32’。然后他写道:
“如果我们取算术平均数,我们或许能确定,正确的测量为11°16’。”
这可能便是人类在使用平均数来估测真值的路上走出的第一步。
(五)
在数学界,中位数几乎是与平均数在同一时间出现。1599年,数学家Edward Wrights首次在记录中推荐了中位数。
“许多支箭射向一个标记,标记被移走,想找出标记原来所在位置的人,或许能想到这样一种方法。他应该找到箭头最集中的地方:在那么多次观测中,最中央的地方离真值最近。”
19世纪时,中位数仍是数据分析中不可或缺的一部分。在较小的数据集中比较容易计算出中位数。而且那个时代的人认为中位数比平均数更具普遍性。
(六)
然而由于平均数独特的统计学性质以及与正态分布的关系,中位数自始至终都被平均数在人气上所压制。
当数据呈正态分布,平均数往往处在钟型曲线的最高点,而绝大部分数据都会处在中位数的旁边。通过标准差,我们还能计算出距离平均数某段距离内数据的个数。
标准差,即数据内数值与平均数之间距离的平方的平均数的平方根,让平均数在分析实验数据和统计推断方面具有突出的价值。没有此类特性的中位数渐渐在科学和统计用上失去了光芒。
计算机的出现也让平均数变得更加普及。编写计算平均数的电脑程序要比编写中位数的程序容易得多。以至于在Excel中,计算某些数据的中位数都要多下一番功夫。渐渐地,平均数成为了最被人熟知,但不一定是最好的代表值。
因为平均数容易受到极端值的影响,所以很多情况下,中位数才是帮助找到分布中心的最好的数值。许多分析师相信,不分黑白地使用平均数损害了我们对定量信息的理解。
回想一下最近读到过的房屋均价、人均收入等数据,你就能发现,中位数才是最能反映普遍性的代表值。最富有的1%能极大地改变平均数所处的位置。正因如此,美国人口普查局决定使用中位数来衡量美国家庭年收入。
中位数同时也很难受到脏数据(dirty data)的影响。随着统计学家需要应对的互联网数据越来越多,当工作人员遇到不准确的数据,或者是打字时多加了一个零,中位数便显现出了自己的优越性。
(七)
随着数据收集和分析在我们的日常生活中的作用不断凸显,我们必需重新审视用来代表这些数字的集中量数。在一个理想的世界里,分析师会同时使用平均数、中位数和众数,配以图像来展现数据。
但我们生活在精力有限、时间仓促的社会里。如果只能选择一个数字,我们应该选择中位数。
中位数还是平均数之间的抉择有着重要的意义。选择了平均数,心理学家容易做出错误的诊断,金融家可能误估市场的发展。平均数已经统治了人类世界数百个春秋,或许是时候让我们做出一些改变了。
2. 众数,中位数,平均数的定义
众数:
一般来说,一组数据中,出现次数最多的数就叫这组数据的众数。
例如:2,3,3,3,4,5的众数是3。
中位数:
把一组数据按从小到大的数序排列,在中间的一个数字(或两个数字的平均值)叫做这组数据的中位数。
如果总数个数是奇数的话,按从小到大的顺序,取中间的那个数。
如果总数个数是偶数个的话,按从小到大的顺序,取中间那两个数的平均数。
扩展资料:
用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。
当数值或被观察者没有明显次序(常发生于非数值性资料)时特别有用,由于可能无法良好定义算术平均数和中位数。
例子:{鸡、鸭、鱼、鱼、鸡、鱼}的众数是鱼。
众数算出来是销售最常用的,代表最多的。
平均数是通过计算得到的,因此它会因每一个数据的变化而变化。
中位数是通过排序得到的,它不受最大、最小两个极端数值的影响。部分数据的变动对中位数没有影响,当一组数据中的个别数据变动较大时,常用它来描述这组数据的集中趋势。
众数也是数据的一种代表数,反映了一组数据的集中程度.日常生活中诸如“最佳”、“最受欢迎”、“最满意”等,都与众数有关系,它反映了一种最普遍的倾向。
3. 众数,中位数,平均数Excel
假如数据在A1:A100平均数=AVERAGE(A1:A100)众数=MODE(A1:A100)中位数=MEDIAN(A1:A100)
4. 众数,中位数,平均数乐乐课堂
平均数是指在一组数据中所有数据之和再除以数据的个数.平均数是表示一组数据集中趋势的量数,它是反映数据集中趋势的一项指标.解答平均数应用题的关键在于确定“总数量”以及和总数量对应的总份数.在统计工作中,平均数(均值)和标准差是描述数据资料集中趋势和离散程度的两个最重要的测度值. 众数(Mode)统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个).修正定义:是一组数据中出现次数最多的数值,叫众数,有时众数在一组数中有好几个.用M表示.简单的说,就是一组数据中占比例最多的那个数. 中位数(Median)统计学名词,是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数,用Me表示.当变量值的项数N为奇数时,处于中间位置的变量值即为中位数;当N为偶数时,中位数则为处于中间位置的2个变量值的平均数.(注意:和众数不同,中位数不一定在这组数据中.)
5. 众数,中位数,平均数带单位吗
答:题目里带单位你就必须带单位,题目里不带单位就不能带单位。
一般说来物理题中都必须带单位,数学中一般不要求带单位。
6. 众数,中位数,平均数计算公式
平均数:用所有数据相加的总和除以数据的个数,需要计算才得求出。
中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数。它的求出不需或只需简单的计算。
众数:一组数据中出现次数最多的那个数,不必计算就可求出。
7. 众数,中位数,平均数是几年级学的
平均数:用所有数据相加的总和除以数据的个数,需要计算才得求出.中位数:将数据按照从小到大或从大到小的顺序排列,如果数据个数是奇数,则处于最中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数是这组数据的中位数.它的求出不需或只需简单的计算.众数:一组数据中出现次数最多的那个数,不必计算就可求出.
8. 众数,中位数,平均数excel公式
我们求单元格数据的众数。在Excel中,我们单击编辑栏中F(X)图标,便会弹出函数对话框。
在弹出的插入函数对话框,我们在搜索函数中,输入众数,在推荐的函数中,选择MODE函数。
在弹出的对话框,单击右侧类似的单元格的按钮,选择A1:D3数据。
数据选择完毕后,单击右下角确定,函数便会求出出现频率最高的数,也就是众数。
9. 众数,中位数,平均数关系
平均数、中位数、众数的特点如下:
平均数:一组数据,用这组数据的总和除以总分数,得出的数就是这组数据的平均数.平均数的大小与一组数据里的每个数据都有关系,任何一个数据的变动都会引起平均数的变动,即平均数受较大数和较小数的影响.
中位数:是一组数据中间位置上的代表值,与数据的排列位置有关,仅需把数据按顺序排列后即可确定,不易受数据中极端数值的影响.众数:通过计数得到,与数据出现的次数有关,着眼于对各数据出现的频率的考察,其大小只与这组数据中的部分数据有关,不受极端值的影响,其缺点是具有不惟一性,一组数据中可能会有一个众数,也可能会有多个或没有。
10. 众数,中位数,平均数的优缺点
算术平均数、中位数、众数三者之间的关系:
1、众数、中位数和平均数是集中趋势的三个主要测度值,只是它们具有不同的特点和应用场合。
2、对于具有单峰分布的大多数数据而言,众数、中位数和平均数之间具有以下数量关系:1)如果数据的分布时对称的,中位数、算术平均数、众数三者完全相等。2)如果数据是左偏分布,说明数据存在极小值,必然拉动平均数向极小值一方偏移,而众数和中位数由于是位置代表值,不受极值的影响,因此三者之间的关系表现为:平均数
- 相关评论
- 我要评论
-