首页 > 分享 > Stata基础绘图教程

Stata基础绘图教程

目录

引言

数据的导入与观察

单变量作图

单连续变量作图

1.箱图

2.直方图

单分类变量作图

1.饼图

2.柱状图

多变量作图

分类变量 X 分类变量

1.交叉表

分类变量 X 连续变量

1.柱状图:over 与 by

连续变量 X 连续变量

1.散点图

2.散点图与拟合线(图层概念)

3.折线图

连续变量 X 连续变量 X 连续变量

1.矩阵图

图形组合

教程索引

引言

这是一份Stata作图的入门级别教程,附带一些简单的可视化心得。

我在工作中学到了不少 Stata 的知识,已经迫不及待想分享给你们啦!当然,我试图把这份教程写得好玩,希望对各位能有所帮助 :)

数据的导入与观察

在 stata 里输入这行命令,你会获得一份 Stata 为你准备好的数据:

sysuse auto, clear //调用Stata的系统数据:auto

观察这组数据,你会发现一些变量是分类的(例如 rep78, foreign),另一些变量是连续的(例如price, mpg)。

在进行 stata 绘图时,我们需要考虑两个问题:

我们是针对一个变量还是多个变量作图? 变量(们)是分类的还是连续的?

我们将一一来看这些情况。

值得一提的是,我建议各位在作图时都采用 #delimit;的分行形式,这一命令表示 stata 只有遇到分号才会换行,其他情况都不会换行。而 #delimit cr 则表示取消这种分行形式。

采用这一分行形式作图的最大优点在于,我们可以将负责不同模块的命令按行分类,同时也便利给每行加上注释,使画图命令更加容易被读者理解。

在下面作图命令的示例中,也将一并演示这一分行方法的应用。

单变量作图

单变量作图被广泛运用在描述统计中。但很多时候必须仔细考量,因为单变量作图有时并不是可视化的好选择,甚至一些情景还不如直接摆上数据直观。

单连续变量作图

1.箱图

现在,我们想了解一下汽车的价格(price)是什么样的。一般而言,箱图(box)是单连续变量作图最广泛的应用。一起动手画一个吧:

graph box price

你将收获你的第一个(?)Stata 图形(好耶!),它长这样:

当然,你也可以罗列一些变量,来看看每个变量的分布如何。不过,为了保持可读性,这些变量的分布(第一四分位、中位数等等)不应该差太多。

现在,假如我们想了解汽车里程数(mpg)、行李箱空间(trunk)的分布,并且要稍微美化一下箱型图。

下面的图形会涉及这些知识点:风格设置、线型设置、颜色设置、标记点设置、去网格线、保存

别担心,我在每行命令后面都加上了注释:

#delimit ;

graph box mpg trunk,

scheme(s1mono)

medline(lcolor(black) lwidth(thin))

box(1, lcolor(black) fcolor("232 69 69"))

box(2, lcolor(black) fcolor("43 46 74 % 70"))

marker(1, msymbol(oh))

ylabel(, nogrid)

saving(haoye!!, replace);

#delimit cr

你会获得一张看起来有内味儿了的图片:

输入命令 help graph box 可以查看更多自定义选项。

2.直方图

箱图展示的是比较宏观的分布。但如果我们想了解微观的内容,例如在这份样本中,每个价格区间有多少车呢?显然,箱图无法展示这个结果,这时用直方图(histogram)会清楚很多:

histogram price, freq //price的直方图,纵坐标是频次

默认图形看得真是让人脑阔疼,但别着急,我们有魔法。

接下来有这些知识点:标题设置、直方图起始点、直方图宽度与间距、直方图填充颜色、直方图线条颜色、直方图线条宽度

#delimit ;

histogram price,

scheme(s1mono)

title("hist price")

frequency

start(3000)

width(1000) gap(5)

fcolor("155 164 180")

lcolor("120 122 145")

lwidth(medthin);

#delimit cr

经过修饰之后的直方图长这样,它可以很好地展示每千元区间内有多少汽车:

 输入命令 help histogram 可以查看更多自定义选项。

单分类变量作图

1.饼图

在类别不多的时候,饼图(pie)是个不错的选择。

这里我们还会开始接触作图的条件命令。比如说,我们想了解变量“1978年维修记录”(rep78),同时我们还想排除缺失值(缺失值被记为“.”)尝试输入这个命令:

graph pie if rep78 != ., over(rep78) //over(rep78)表示根据rep78的取值做切片

将会得到这样的图形:

请注意,饼图命令基本上都要通过 over 把变量括起来,关于 over 命令我们会在 分类变量 X 连续变量 那一部分更详细介绍。

如果直接写 graph pie rep78,将只能得到一个(发霉的蓝莓蛋糕)漂亮的蓝色圆。

 现在,我们例行装饰饼图,我们会开始接触知识点:副标题的设置、图例位置和排布的自定义、添加饼图标签、标签大小设置、更改不同饼块的颜色

#delimit;

graph pie if rep78 != .,

over(rep78)

scheme(s1mono)

title("pie reg78")

subtitle("a nice pie chart", size(*0.7))

相关知识

Stata绘图与统计分析结合:数据洞察力提升的关键
Stata绘图高级技巧:掌握创建复杂统计与交互式图表的专家秘籍
ChatGPT助力Stata:学术研究的新革命性工具
【小花经济学术】如何用Stata进行地图数据可视化
小型广场景观设计手绘图 景观设计树木手绘图
AI科研绘图(一):零基础入门和基本图形绘制
“医”笔生花——基础医学院举办解剖绘图大赛
AI绘图生成器有哪些?好用工具推荐
零基础绘画教程
随时随地画:7款在线绘图工具让创作更自由

网址: Stata基础绘图教程 https://m.huajiangbk.com/newsview1946728.html

所属分类:花卉
上一篇: 如何在 Markdown 里绘制
下一篇: 除了Excel,还能如何高效地完