第一部分 导入数据(Importing Data)
在我们平时的研究工作中,经常使用的是逗号分隔文件(.csv文件)、制表符分隔文件(.tsv文件)和空格分隔文件(.txt文件)。当然对于一些基因组文件或者其它格式的文件,各自有各自的特点,原则上R语言可以读取任何格式的文件,只需掌握基本的读取文件方法后按照不同特点调整参数即可。
1. 使用一般方法读取文件(也即文件名以.csv为后缀的文件)
(1)读取逗号分隔文件
#通常文件第一行是题头(也称列名),逗号是文件内容的分隔符
#尤其需要注意的是在windows操作系统中文件路径需用‘/‘来分隔
#第一个参数是读入的文件(由文件所在路径及其文件名构成)
#第二个参数是指定是否将第一行作为列名,TRUE表示第一行即为列名
#第三个参数是指定分隔符
#第四个是指定行名所在的列,指定列名为“id”这一列的数据为行名
mydata
sep=",", row.names="id")
(2)读取制表符分隔文件
制表符其实就是指键盘上的Tab键,正常情况下一个制表符长度等于四个空格的长度。
#读取制表符分隔文件和读取逗号分隔文件的方法很类似
#唯一不同可能就在与sep这个参数后边的值是\t,实际上\t就是指制表符
mydata
sep="\t", row.names="id")
(3)读取普通的txt文件
#因为read.table()这个函数sep的默认值是空格,所以读取txt文件一般不需要设置sep的参数值
mydata
另外如果想读取csv文件&#x