excel2010做箱线图(用EXCEL做箱线图)

Excel表格网 2022-12-04 14:07 编辑:admin 105阅读

1. 用EXCEL做箱线图

1、新建一个EXCEL表格,输入数据。单个箱形图只需要列出单列数据即可。

2、在数据区域点击左键,之后依次点击“插入”—"图表"—"所有图表"—"箱形图"。

3、点击“确定”,可以看到生成一个粗略的箱形图。虽然是简图,但是也可以很明显的看出图中包含了几个重要的点位数据,和K线图有些类似。

4、在图块部分点击右键,添加数据标签。添加数据标签的目的是为了更好地展示图表,一目了然。

5、对箱形图进行美化。可以根据个人喜好决定是否保留网格线,调整标签数值颜色和大小等等。

6、从图中可以看出箱形图是由五部分构成的:最大值、75%值、中位值、25%值、最小值。对应图中数据就是10、8.25、5.5、2.75。说明该旅游小团队有50%的数据集中于2.75-8.25之间。

7、如果数据中有极大值或者极小值的话,那么箱形图中该数据明显会位于箱体外。比如将实例数据中的9改成30,可以30的位置明显超出箱体一大部分。

2. excel做箱线图没有箱形

1.首先在电脑中找到要进行打印的表格文件

2.然后进入到excel表格中,点击菜单栏中的页面布局

3.在页面布局中会出现一个栏目下面有个页面设置右边有个小箭头,如图点击小箭头

4.在弹出的页面设置窗口中,点击工作表

5.打开之后我们可以看到工作表第一栏有一个打印区域,点击后选择

6.最后在表格中序曲需要打印的区域,点击确定

拓展:

Office最初的版本在1989年所推出,最初的运作是在Macintosh平台之上。Office自从推出文字处理、电子表格以及演示稿制作的软件后,直至近年一直居于领导地位。

Excel2020增加了多种图表,如用户可以创建表示相互结构关系的树状图、分析数据层次占比的旭日图、判断生产是否稳定的直方图、显示一组数据分散情况的箱形图和表达数个特定数值之间的数量变化关系的瀑布图等。

在Office 2020中,微软公司强化了Office的跨平台应用,用户可以在很多电子设备上审阅、编辑、分析和演示Office 2020文档。

3. excel做箱线图带散点

1.选中数据区域——点击插入——推荐的图表——散点图。

2.右击——添加趋势线。

3.双击坐标轴——边框——实线——颜色——宽度,效果如图所示。

4.如图所示,设置数据系列格式——标记(数据标记选项)——类型,大小(根据需要设置)。

4. 用excel做箱线图需要哪些值

选取单元格区域A1:D5,单击“图表向导”图标

在弹出的“图表类型”对话框中选中股价图的“开盘-盘高-盘低-收盘图”(第2 个子图表类型),按下一步键。

在图表数据源对话框的数据区域中将“系列产生在”修改为“行”,按下一步键。

在“图表选项”对话框的分类(X)轴下方填入“治疗组”,在数值(Y)轴下方填入“最大呼气量(FEV)”,按完成键。

在绘图区点击右键,选取“数据源→系列→添加”,在“名称”右侧用鼠标选取单元格A6,在“值”右侧用鼠标选取单元格区域B6:D6 按确定键。

在网格线上点击右键,“清除”网格线;在绘图区单击右键“清除”背景色。

在横坐标上单击右键,选取“坐标轴格式→图案”,右上部主要刻度线类型复选“无”,按确定键。

在纵坐标上单击右键,选取“坐标轴格式→数字→数值”,小数位数改为“0”,按确定键。

在箱的中心位置P50 系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取“+”,前景颜色处选黑色,“大小”改为6 磅,按确定键;在箱线图的顶部P100系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6 磅,按确定键;在箱线图的底部P0系列标志上单击右键,选取“数据系列格式→图案”,在界面右侧数据标记的样式处选取长横线“-”,前景颜色处选黑色,“大小”改为6 磅,按确定键。

适当调整绘图区的大小,调整整个图表区域的字体大小,去除图表区的边框等,可获得箱线图。

5. excel做箱线图对比

1、将数据输入到对应表格中,也可以直接从EXCEL表格中直接粘贴。

2、选择“分析”—“描述统计”—“探索”。

3、将数据选择为因变量,输出选择“图”。

4、点击“绘制”,选择”不分组”,点击“确定”。

5、点击左上角的文件-导出,出现如下对话框。

6、调节好需要的图片类型,点击“确定”,最终一幅精美的箱线图就完成了。

6. excel做箱线图没有箱型

  

1.首先在电脑中找到的ET文件,确定好文件所在的位置;  

2.单击鼠标右键--找到打开方式--进入到选择相关程序的界面;  

3.在此选择程序的界面中,选择excel程序,然后点击确定;  

4.点击确定之后,系统会出现一个提示,选择是就可以了;  

5.这样就可以成功的进入此文件,也可进行编辑等;  

6.现在在次找到刚刚的文件,就可以直接点击打开了。

7. excel做箱线图全是叉

本文所演示的的可视化方法

散点图 (Scatterplot)

直方图 (Histogram)

小提琴图 (Violinplot)

特征两两对比图(Pairplot)

安德鲁斯曲线 (Andrews curves)

核密度图 (Kernel density estimation plot)

平行坐标图 (Parallel coordinates)

Radviz (力矩图?)

热力图 (Heatmap)

气泡图 (Bubbleplot)

这里主要使用Python一个流行的作图工具: Seaborn library,同时Pandas和bubbly辅助。为什么Seaborn比较好?

因为很多时候数据分析,建模前,都要清洗数据,清洗后数据的结果总要有个格式,我知道的最容易使用,最方便输入模型, 最好画图的格式叫做"Tidy Data" (Wickham H. Tidy data[J]. Journal of Statistical Software, 2014, 59(10): 1-23.) 其实很简单,Tidy Data格式就是:

每条观察(记录)自己占一行

观察(记录)的每个特征自己占一列

举个例子,我们即将作图的数据集IRIS就是Tidy Data(IRIS(IRIS数据集)_百度百科):

Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据集,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。

该数据集包含了5个属性:

Sepal.Length(花萼长度),单位是cm;

Sepal.Width(花萼宽度),单位是cm;

Petal.Length(花瓣长度),单位是cm;

Petal.Width(花瓣宽度),单位是cm;

种类:Iris Setosa(山鸢尾)、Iris Versicolour(杂色鸢尾),以及Iris Virginica(维吉尼亚鸢尾)。

IRIS数据可以看到,每条观察(ID=0,1,2...)自己占一行,每个特征(四个部位长/宽度,种类)自己占一列。Seaborn就是为Tidy Data设计的,所以方便使用。

所以这个数据集有6列,6个特征,很多时候做可视化就是为了更好的了解数据,比如这里就是想看每个种类的花有什么特点,怎么样根据其他特征把花分为三类。我个人的喜好是首先一张图尽量多的包含数据点,展示数据信息,从中发现规律。我们可以利用以下代码完全展示全部维度和数据这里用的bubbly:

三维图,全局观察

Python做出来,其实是一张可以拖动角度,放大缩小的图,拖一拖看各角度视图会发现三类还是分的挺明显的。Github上这个bubbly还是很厉害的,方便。

接下来开始做一些基础的可视化,没有用任何修饰,代码只有最关键的画图部分,可视化作为比赛的一个基础和开端,个人理解做出的图能看就行,美不美无所谓,不美也不扣分。因为

散点图,可以得到相关性等信息,比如基本上SepalLengthCm越大,SepalWidthCm越大

散点图使用Jointplot, 看两个变量的分布,KDE图,同时展示对应的数据点

就像上一篇说的,比赛中的每个环节都至关重要,很有必要看下这些分布直方图,kde图,根据这些来处理异常值等,这里请教,为什么画了直方图还要画KDE??我理解说的都是差不多的东西。

关于KDE:"由于核密度估计方法不利用有关数据分布的先验知识,对数据分布不附加任何假定,是一种从数据样本本身出发研究数据分布特征的方法,因而,在统计学理论和应用领域均受到高度的重视。"

无论如何,我们先画直方图,再画KDE

直方图

KDE 图这里通过KDE可以说,由于Setosa的KDE与其他两种没有交集,直接可以用Petailength线性区分Setosa与其他两个物种。

Pairplot箱线图,显示一组数据分散情况的统计图。形状如箱子。主要用于反映原始数据分布的特征,关键的5个黑线是最大值、最小值、中位数和两个四分位数。在判断异常值,处理异常值时候有用。

BoxPlot小提琴图

Violinplot

这个Andrews curves很有趣,它是把所有特征组合起来,计算个值,展示该值,可以用来确认这三个物种到底好不好区分,维基百科的说法是“If there is structure in the data, it may be visible in the Andrews' curves of the data.”(Andrews plot - Wikipedia)

Andrews' curves

radvizRadviz可视化原理是将一系列多维空间的点通过非线性方法映射到二维空间的可视化技术,是基于圆形平行坐标系的设计思想而提出的多维可视化方法。圆形的m条半径表示m维空间,使用坐标系中的一点代表多为信息对象,其实现原理参照物理学中物体受力平衡定理。 多维空间的点映射到二维可视空间的位置由弹簧引力分析模型确定。 (Radviz可视化原理 - CSDN博客) ,能展示一些数据的可区分规律。

数值是皮尔森相关系数,浅颜色表示相关性高,比如Petal.Length(花瓣长度)与 Petal.Width(花瓣宽度)相关性0.96,也就是花瓣长的花,花瓣宽度也大,也就是个大花。

不过,现在做可视化基本上不用python了,具体为什么可以去看我的写的文章,我拿python做了爬虫,BI做了可视化,效果和速度都很好。

finereport

可视化的一大应用就是数据报表,而FineReport可以自由编写整合所需要的报表字段进行报表输出,支持定时刷新和监控邮件提醒,是大部分互联网公司会用到的日常报表平台。

尤其是公司体系内经营报表,我们用的是商业报表工具,就是finereport。推荐他是因为有两个高效率的点:①可以完成从数据库取数(有整合数据功能)—设计报表模板—数据展示的过程。②类似excel做报表,一张模板配合参数查询可以代替几十张报表。

FineBI

简洁明了的数据分析工具,也是我个人最喜欢的可视化工具,优点是零代码可视化、可视化图表丰富,只需要拖拖拽拽就可以完成十分炫酷的可视化效果,拥有数据整合、可视化数据处理、探索性分析、数据挖掘、可视化分析报告等功能,更重要的是个人版免费。

主要优点是可以实现自助式分析,而且学习成本极低,几乎不需要太深奥的编程基础,比起很多国外的工具都比较易用上手,非常适合经常业务人员和运营人员。在综合性方面,FineBI的表现比较突出,不需要编程而且简单易做,能够实现平台展示,比较适合企业用户和个人用户,在数据可视化方面是一个不错的选择;

这些是我见过比较常用的,对数据探索有帮助的可视化方法。

8. 怎么用excel绘制箱线图

不同幅面的工程图纸应统一折叠成A4幅面(297mm×210mm),横向按手风琴式折叠,竖向按顺时针方向向内折,图标栏露在外面(按《技术制图复制图的折叠方法》)(GB/10609.3――-89)最后按项目把图纸放进专门的A4纸大小的档案盒里,做好目录(如果没有专门的软件就写在EXCEL里面,方便查找),在档案盒上面写上盒的流水号,并注明里面内容。

9. excel做箱线图加柱状图

操作方法:

1、首先选中需要进行分析的两列数据,在插入选项中点击柱形图,插入二维柱形图的第一个图。

2、然后右击要设置折线图类型的那列数据,选中更改图表类型,点击折线图的第四个。

3、这时候,就可以将上面改过的数据,改回去了。选择折线图,点击右键,设置数据系列格式。

4、根据实际,可以调整纵坐标刻度大小,达到美观效果。在加标题等,修饰下。即为最好方法。

Microsoft Office:是一套由微软公司开发的办公软件套装,它可以在Microsoft Windows、Windows Phone、Mac系列、iOS和Android等系统上运行。与其他办公室应用程序一样,它包括联合的服务器和基于互联网的服务。从2007版的Office被称为“Office System”而不叫“Office Suite”,反映出它们包括服务器的事实。Office最初是一个推广名称,出现于1990年代早期,指一些以前曾单独发售的软件的合集。当时主要的推广重点是:购买合集比单独购买要省很多钱。最初的Office版本包含Word、Excel和PowerPoint。“专业版”包含Microsoft Access,Microsoft Outlook 当时不存在。随着时间的改变,Office应用程序逐渐集成,共享特性,例如:拼写和语法检查、OLE数据集成和VBA脚本语言。微软将Office延伸作为一个开发平台,可以借由专用商店下载第三方软件搭配使用。

10. excel做箱线图为啥成了一条线

四分位数的定义

四分位数(Quartile)是指在统计学中把所有数值由小到大排列并分成四等份,处于三个分割点位置的数值。多应用于统计学中的箱线图绘制。第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。第二四分位数 (Q2),又称“中位数”,等于该样本中所有数值由小到大排列后第50%的数字。 第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。第三四分位数与第一四分位数的差距又称四分位距

顶一下
(0)
0%
踩一下
(0)
0%
相关评论
我要评论
点击我更换图片