r语言ggplot回归分析图_R如何导入数据

r语言ggplot回归分析图_R如何导入数据#第一章R基础install.packages(c("ggplot2","gcookbook"))library(ggplot2)library(gcookbook)#加载分隔符式的文本文件#data<-read.csv("datafile.csv")#data<-read.csv("datafile.csv",header=FALSE)#手动为列名赋值#name…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用
# 第一章 R基础

install.packages(c(“ggplot2″,”gcookbook”))

library(ggplot2)

library(gcookbook)

# 加载分隔符式的文本文件

# data <- read.csv(“datafile.csv”)

# data <- read.csv(“datafile.csv”,header=FALSE)

# 手动为列名赋值

# names(data) <- c(“Column1″,”Column2″,”Column3”)

# 用sep参数来设置分割符号,如果为空格分割,使用sep=” “;如果是制表符分割,使用\t

# data <- read.csv(“datafile.csv”,sep=”\t”)

# 默认情况下数据集中的字符串(string)会被视为因子(factor)处理

# data <- read.csv(“datafile.csv”,stringsAsFactors=FALSE)

# 转换为因子

# data$Sex <- factor(data$Sex)

# str(data)

# read.csv()是对read.table()一个便捷的封装函数

# 从Excel文件中加载数据

# 只需要安装一次

install.packages(“xlsx”)

library(xlsx)

library(rJava)

# 读取xlsx格式文件

# data <- read.xlsx(“datafile.xlsx”,1)

# 读取老版本的xls格式文件

install.packages(“gdata”)

library(gdata)

# data <- read.xls(“datafile.xls”)

# 使用read.xlsx()加载工作表时,既可以用序数参数sheetIndex来指定,也可以用工作表名参数sheetName来指定

# data <- read.xlsx(“datafile.xlsx”,sheetIndex=2)

# data <- read.xlsx(“datafile.xlsx”,sheetName=”Revenues”)

# 使用read.xls()加载工作表时,可以用序数参数sheet来指定

# data <- read.xls(“datafile.xls”,sheet=2)

# 对于xlsx包,需要安装Java,对于gdata包,需要安装Perl

# 从SPSS文件中加载数据

# foreign包中的函数read.spss()可以读取SPSS文件。若要读取SPSS文件中的第一张表:

install.packages(“foreign”)

library(foreign)

# data <- read.spss(“datafile.sav”)

# foreign包中还有以下几种读取其他格式文件的函数:

# read.octave():Octave和MATLAB

# read.systat():SYSTAT

# read.xport():SAS XPORT

# read.dta():Stata

# 快速探索数据
# 2.1 绘制散点图
# 使用plot()函数可以绘制散点图
plot(mtcars$wt,mtcars$mpg)
# 对于ggplot2()系统,可用qplot()函数
library(ggplot2)
qplot(mtcars$wt,mtcars$mpg)
# 如果绘图所用的两个参数包含在同一个数据框内,则可以运行下面的命令
qplot(wt,mpg,data = mtcars)
# 或者
ggplot(mtcars,aes(x=wt,y=mpg))+geom_point()

# 2.2 绘制折线图
# 使用plot()函数绘制折线图时需向其传递一个包含x值的向量和一个包含y值的向量,并使用参数type=”l”
plot(pressure$temperature,pressure$pressure,type = “l”)
# 如果要向图形中添加数据点或者多条折线,则需先用plot()函数绘制第一条折线,再通过points()函数和lines()函数分别添加数据点和更多折线
plot(pressure$temperature,pressure$pressure,type = “l”)
points(pressure$temperature,pressure$pressure)

lines(pressure$temperature,pressure$pressure/2,col=”red”)
points(pressure$temperature,pressure$pressure/2,col=”red”)
# 在ggplot2中,可以使用qplot()函数并将参数设定为geom=”line”
library(ggplot2)
qplot(pressure$temperature,pressure$pressure,geom = “line”)
qplot(temperature,pressure,data = pressure,geom = “line”)
ggplot(pressure,aes(x=temperature,y=pressure))+geom_line()

# 添加数据点
qplot(temperature,pressure,data = pressure,geom = c(“line”,”point”))
ggplot(pressure,aes(x=temperature,y=pressure))+geom_line()+geom_point()

# 2.3 绘制条形图
# 对变量的值绘制条形图,使用barplot()函数,并向其传递两个向量作为参数,第一个向量用来设定条形的高度,第二个向量用来设定每个条形对应的标签(可选)
# 如果向量中的元素已被命名,则系统会自动使用元素的名字作为条形标签
barplot(BOD$demand,names.arg = BOD$Time)
# 要计算向量中各个类别的频数,可以使用table()函数
table(mtcars$cyl)
# 生成频数表
barplot(table(mtcars$cyl))
# 对于ggplot2系统,使用qplot()函数,绘制变量值的条形图时需将参数设定为geom=”bar”和stat=”identity”
library(ggplot2)
# qplot(BOD$Time,BOD$demand,geom = “bar”, stat = “identity”) 报错!!!
# qplot(factor(BOD$Time),BOD$demand,geom = “bar”,stat = “identity”)
# 注意变量x分别为连续取值和离散取值时输出结果的差异
qplot(mtcars$cyl)
qplot(factor(mtcars$cyl))
# 如果参数向量包含在同一个数据框内
# qplot(Time,demand,data = BOD,geom = “bar”,stat = “identity”)
ggplot(BOD,aes(x=Time,y=demand))+geom_bar(stat = “identity”)
# 频数条形图
qplot(factor(cyl),data = mtcars)
ggplot(mtcars,aes(x=factor(cyl)))+geom_bar()

# 2.4 绘制直方图
# 使用hist()函数绘制直方图
hist(mtcars$mpg)
# 通过breaks参数指定大致组距
hist(mtcars$mpg,breaks = 10)
# 对于ggplot2系统,使用qplot()函数
qplot(mtcars$mpg)
library(ggplot2)
qplot(mpg,data = mtcars,binwidth=4)
ggplot(mtcars,aes(x=mpg))+geom_histogram(binwidth = 4)

# 2.5绘制箱线图
# 使用plot()函数绘制箱线图时向其传递两个向量:x和y。当x为因子型变量时,默认绘制箱线图
plot(ToothGrowth$supp,ToothGrowth$len)
# 公式语法
boxplot(len~supp,data = ToothGrowth)
# 在x轴上引入两变量的交互
boxplot(len~supp+dose,data = ToothGrowth)
# 对于ggplot2包,使用qplot()函数,参数设定为geom=”boxplot”
library(ggplot2)
qplot(ToothGrowth$supp,ToothGrowth$len,geom = “boxplot”)
qplot(supp,len,data = ToothGrowth,geom = “boxplot”)
ggplot(ToothGrowth,aes(x=supp,y=len))+geom_boxplot()
# 使用interaction()函数将分组变量组合在一起也可以绘制基于多组变量的箱线图
# 使用三个独立的向量参数
qplot(interaction(ToothGrowth$supp,ToothGrowth$dose),ToothGrowth$len,geom = “boxplot”)
# 也可以以数据框中的列作为参数
qplot(interaction(supp,dose),len,data=ToothGrowth,geom = “boxplot”)
ggplot(ToothGrowth,aes(x=interaction(supp,dose),y=len))+geom_boxplot()

# 2.6 绘制函数图像
# 使用curve()函数绘制函数图像,使用时需向其传递一个关于变量x的表达式
curve(x^3-5*x,from = -4,to=4)
# 将参数设置为add=TRUE可以向已有图形添加函数图像
# 绘制用户自定义的函数图像
myfun <- function(xvar){

  1/(1+exp(-xvar+10))
}
curve(myfun(x),from = 0,to=20)
# 添加直线
curve(1-myfun(x),add = TRUE,col=”red”)
# 对于ggplot2,使用qplot()函数。使用时需设定stat=”function”和geom=”line”,并向其传递一个输入和输出皆为数值型向量的函数
library(ggplot2)
# 将x轴的取值范围设定为0到20
qplot(c(0,20),fun=myfun,stat = “function”,geom = “line”)
ggplot(data.frame(x=c(0,20)),aes(x=x))+stat_function(fun = myfun,geom = “line”)

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/186523.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 三层架构 银行管理系统

    三层架构 银行管理系统

  • JS 面试题 大全

    JS 面试题 大全1、介绍一下js的数据类型有哪些,值是如何存储的?2、说一下js的数据类型的转换都有哪些?3、如何去判断js数据类型?4、介绍js有哪些内置对象?5、javascript创建对象的几种方式?6、js获取原型的方法?7、什么是闭包,为什么要用它?8、三种事件模型是什么?9、哪些操作会造成内存泄漏?10、简述javascript中this的指向?![在这里插入图片描述](https://img-blog.csdnimg.cn/2021032219142296.png

  • load average 计算「建议收藏」

    load average 计算「建议收藏」平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均活跃进程数。对于Ubuntu获取cpu数和cpu核数more/proc/cpuinfo|grep”physicalid”|uniq|wc-l#=>1more/proc/cpuinfo|grep”physicalid”|grep”0″|wc-l#=>16则1*…

  • HandlerSocket_handlermapping原理

    HandlerSocket_handlermapping原理HandlerSocket的应用场景:MySQL自身的局限性,很多站点都采用了MySQL+Memcached的经典架构,甚至一些网站放弃MySQL而采用NoSQL产品,比如Redis/MongoDB等。不可否认,在做一些简单查询(尤其是PK查询)的时候,很多NoSQL产品比MySQL要快很多,而且前台网站上的80%以上查询都是简洁的查询业务。MySQL通过HandlerSock…

  • 线性规划

    线性规划1、线性规划1.1线性规划的定义线性规划的标准形式:其中的c和x均为n维列向量,A、Aeq为适当维数的矩阵,b、beq为适当维数的列向量。例如:x1和x2称为决策变

  • python 内建模块_simulink常用模块

    python 内建模块_simulink常用模块Python常用内建模块datetime处理日期和时间的标准库。注意到datetime是模块,datetime模块还包含一个datetime类,通过fromdatetimeimportdatetime导入的才是datetime这个类。如果仅导入importdatetime,则必须引用全名datetime.datetime。datetime.now()返回当前日期和时间,其类型是…

    2022年10月28日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号