支持的数据类型:character:字符型
numeric:数值型,实数或小数
numeric:数值型,实数或小数
integer:整数
complex:复数
logical:逻辑型
基本数据结构向量、因子——一维
向量适用于数值类变量,因子适用于分类变量矩阵、数据框——二维
矩阵中所有的数据类型都必须一样;数据框由向量组成,只要保证每个向量内部的数据类型一致就可,向量之间的类型可以不同。数据框更贴近日常需要处理的数据表格。数组、列表——多维
数组用的不多;列表表面上看像是一位的数据结构,但是每个元素中可以包含向量,矩阵,数组等。
向量一行/一列;每一个元素的类型必须相同
创建向量的方法c()x=c(10,11,13,14)
ps:批量执行可以选择编辑页面右上角的run或者source;一条命令执行,让光标放在改行命令上,然后按 ctrl+enter
(x=c(10,11,13,14))在外面加上一层括号表示先执行括号里面的,然后再把X的内容打印出来
冒号操作符 :步长为1(x=1:10)表示生成步长为1的1-10之间的数
seq(from,to,by,length.out,along.with)From:从哪个数字开始;to从哪个数字结束;by是步长;length.out和along.with 定义向量有多长,有多少个元素。 to,length.out,along.with选其一就可(x=seq(5,by=2,length=8))表示生成一个以5开头,间隔为2,总共有8个数的向量
(y=seq(10,by=3,along.with=x))along.with=5表示 于X向量的长度一致
使用向量提取子集数字下标(正数、负数)使用的是方括号 "[]" R语言的下标操作符是向量,可以一次提取多个数出来例:+2 表示想要第二个元素;-2 表示不想要第二个元素,想要除了第二个之外的元素
(x[1:5])表示提取x中前1-5个数
(x[c(1,2,3,4,5)])同上
(x[seq(1,5,1)])同上
(y[-5:-1])表示不要y中前5个元素,把剩下的取出来
which()函数(which(y>5))表示把y中大于5的筛选出来,注意:which返回的是满足条件的数的下标
(y[which(y>5)])
因子
因子是特殊的向量,因此对向量的要求,对因子同样适用,应用于分类变量。类别叫做因子的水平,或者因子的分类,一定要有文本标签。
例:血型:A B AB O 这些成为levels,而A或者B。。这些是labels,这些labels都是用数字储存的创建因子的方法factor()(x=c('a','a','b','o','ab'