ggplot2是什么_r语言ggplot2

ggplot2是什么_r语言ggplot2ggplot2是R语言最为强大的作图软件包,强于其自成一派的数据可视化理念。当熟悉了ggplot2的基本套路后,数据可视化工作将变得非常轻松而有条理。本文主要对ggplot2的可视化理念及开发套路做

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE使用 1年只要46元 售后保障 童叟无欺

      ggplot2是R语言最为强大的作图软件包,强于其自成一派的数据可视化理念。当熟悉了ggplot2的基本套路后,数据可视化工作将变得非常轻松而有条理。

        本文主要对ggplot2的可视化理念及开发套路做一个总体介绍,具体绘图方法(如折线图,柱状图,箱线图等)将在后面的文章中分别进行讲解。

核心理念

        1. 将数据,数据相关绘图,数据无关绘图分离

        这点可以说是ggplot2最为吸引人的一点。众所周知,数据可视化就是将我们从数据中探索的信息与图形要素对应起来的过程。

        ggplot2将数据,数据到图形要素的映射,以及和数据无关的图形要素绘制分离,有点类似java的MVC框架思想。这让ggplot2的使用者能清楚分明的感受到一张数据分析图真正的组成部分,有针对性的进行开发,调整。

        2. 图层式的开发逻辑

        在ggplot2中,图形的绘制是一个个图层添加上去的。举个例子来说,我们首先决定探索一下身高与体重之间的关系;然后画了一个简单的散点图;然后决定最好区分性别,图中点的色彩对应于不同的性别;然后决定最好区分地区,拆成东中西三幅小图;最后决定加入回归直线,直观地看出趋势。这是一个层层推进的结构过程,在每一个推进中,都有额外的信息被加入进来。在使用ggplot2的过程中,上述的每一步都是一个图层,并能够叠加到上一步并可视化展示出来。

        3. 各种图形要素的自由组合

        由于ggplot2的图层式开发逻辑,我们可以自由组合各种图形要素,充分自由发挥想象力。

基本开发步骤

       ggplot2是什么_r语言ggplot2

        1. 初始化 – ggplot()

        这一步需要设定的是图的x轴,y轴和”美学特征”。基本形式如下:

1
p <- 
ggplot
(data = , 
aes
(x = , y = ))

        这一步里,设置x轴和设置y轴很好理解。那么”美学特征”又是什么呢?

        举个例子来说,下面这张散点图里,x轴表示年龄,y轴表示身高,很好理解:

ggplot2是什么_r语言ggplot2

        但这张图除了展示年龄和身高的关系,还展示出每个样本点的体重:颜色越深表示体重越大。因此体重信息和年龄身高一样,也需要绑定到一个具体的列。这一列就是散点图中的”美学特征”。

        来看看R语言绘制代码:

1
ggplot
(heightweight, 
aes
(x=ageYear, y=heightIn, colour=weightLb))+
geom_point
()

        其中的colour参数就是该图的”美学特征”。

        再比如,下面这张柱状图中,x轴表示日期,y轴表示权重,很好理解:

ggplot2是什么_r语言ggplot2

        但这张图中每个日期对应了两个不同的权重并采用两个柱状来对比,那么这个划分依据也是另一个“美学特征”。

        再看看绘制代码:

1
ggplot
(cabbage_exp, 
aes
(x=Date, y=Weight, fill=Cultivar))+
geom_bar
(position=
"dodge"
, stat=
"identity"
)

        其中的fill参数就是该图的”美学特征”。

        综上所述,图中的每个样本点除了通过它的坐标位置,还可以以其他形式展示信息,比如大小,色深,分组等。而这些新形式需要绑定的列,便叫做”美学特征”。

        “美学特征”的形式和x,y轴一样是以列的形式给出,且列中元素个数和x,y轴列必然相等。它的设置也和x,y轴一样在ggplot()函数的aes参数括号内进行。

        2.  绘制图层 – geom_bar()/geom_line()等等

        上一步的主要工作是为数据可视化配置好了数据,接下来便可根据业务的需要来绘制不同的图,如折线图/柱状图/散点图等等。具体的实现方法在后面的文章中会细致讲解,这里重点提一下绘图函数里的stat参数。这个参数是表示对样本点做统计的方式,默认为identity,表示一个x对应一个y,同时还可以是bin,表示一个x对应落到该x的样本数。

        3. 调整数据相关图形元素 – scale系列函数、某些专有函数

        在ggplot2中,scale标尺机制专门负责完成数据到图像元素的映射。也许你会问,”美学特征”不是已经定义好了这个映射吗?然而事实是”美学特征”只是选定了映射前的数据,并没有说明具体映射到什么图形元素。

        举个例子,假如某张表记录了不同种类水池的长,宽,深信息。现在需要绘制不同种类下水池长和宽关系的柱状图,那么初始化完成的是这个映射:

        ggplot2是什么_r语言ggplot2

        而scale函数完成的是这个映射:

        ggplot2是什么_r语言ggplot2

        显然a映射为了红色,b映射为了蓝色。

        也许你还会问,我的代码不用scale,那么映射是如何完成的呢?答曰系统有默认映射的,就像绘图函数都有默认参数stat=identity这样。

        4. 调整数据无关图形元素 – theme()、某些专有函数

        这部分包括设置图片标题格式,文字字体这类和数据本身无关的图像元素。只需调用theme()函数或者某些专有函数(如annovate函数可为图片添加注释)便可实现。

        一个图层绘制好后便可观察调整,然后开始下一个图层的制作,直到整幅图绘制完毕。

小结

        本文作为该系列博客的开篇,从总体、抽象的角度介绍了R语言的数据可视化包ggplot2。读者如果觉得有些概念抽象难以理解,不必纠结,待看完该系列其他文章后再回过头来看本文,相信会有新的收获。

        接下来的文章将从具体、细致的角度讲解如何使用R语言的ggplot2软件包进行各种数据可视化。

        最后,欣赏一些使用ggplot2制作的成品图吧:

       

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/167275.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • android系统的官网下载地址,Android安卓10.0系统官方正式版

    android系统的官网下载地址,Android安卓10.0系统官方正式版Android安卓10.0系统官方正式版:这是一款关于安卓的系统,没错就在今天,谷歌更新了关于安卓10.0的系统更新,相信很多的小伙伴都应该是不清楚的,应为感觉还是有很多的用户在等着系统自己的更新,没有操心这一方面的事情。Android安卓10.0系统官方正式版更新了什么功能?1、目前来看的话,更新功能还是蛮多的,但是用户能够看的上的就不言而喻;2、毕竟以前放出来的消息就是这一次更新将会有可能安卓…

  • 【18】进大厂必须掌握的面试题-15个Kafka面试

    点击上方“全栈程序员社区”,星标公众号 重磅干货,第一时间送达 1.什么是kafka? Apache Kafka是由Apache开发的一种发布订阅消息系统。 2.kafka的3个关…

  • 每个程序员都曾犯过的10大经典错误!

       作者 | Daan 策划 | 万佳 在程序员的职业生涯中,你都犯过哪些经典错误? 人非圣贤,孰能无过。对于犯错,你不用太困扰,因为对开发者而言,犯错太正常…

  • 回归分析模型推广_案例分析的意义

    回归分析模型推广_案例分析的意义这个项目呢,就不需要我们做很多的数据清洗的工作了,因为我们手里的数据基本已经做好数据清洗了,我们主要需要做的就是数据可视化和文本挖掘工作。下面我们来一一介绍一下。目录1业务背景1.1分析流程概述1.2市场分类1.3产品生命周期1.4产品结构-波士顿矩阵(BCGMatrix)1.5处理项目需求的基本思路1.6项目需求例子1.7项目背景&产品架构1.8数据说明2驱虫市场的潜力分析2.1分析目的&加载数据2.1.1分析目的2.1.2加载数据2.2清洗&补全数

  • map.containsKey方法的运用「建议收藏」

    map.containsKey方法的运用「建议收藏」map之containsKey方法例如:List<HashMap<String,Object>>pt=mapperDao.query(param1,param2);for(HashMap<String,Object>map:pt){if(!map.containsKey(“age”)||null==map.get(“age”))c…

  • centos7.4安装docker_pythondocker

    centos7.4安装docker_pythondocker前言当我们在一台电脑上搭建了python3.6的环境,下次换台电脑,又得重新搭建一次,设置环境变量等操作。好不容易安装好,一会提示pip不是内部或外部命令,一会又提示pip:commandno

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号