Bootstrap

Shell脚本逐行处理文本文件技巧

Shell脚本逐行处理文本文件技巧

经常会对文体文件进行逐行处理,在Shell里面如何获取每行数据,然后处理该行数据,最后读取下一行数据,循环处理.有多种解决方法如下:

一、通过 read 命令完成

read 命令从标准输入中读取一行,并把输入行的每个字段的值指定给 shell 变量,用 IFS(内部字段分隔符)变量中的字符作为分隔符。VariableName (变量名)参数指定给每一个字段的值,由 VariableName (变量名)参数指定的以此类推,直到最后一个字段。

read命令接收标准输入,或其他文件描述符的输入,得到输入后,read命令将数据放入一个标准变量中。

利用read读取文件时,每次调用read命令都会读取文件中的"一行"文本。

当文件没有可读的行时,read命令将以非零状态退出。

cat data.dat | while read line
do
 echo "File:${line}"
done

while read line
do
 echo "File:${line}"
done < data.dat

二、使用awk命令完成

awk是一种优良的文本处理工具,提供了极其强大的功能。

语法格式:awk [选项] '指令' 操作文件

常用选项:-F指定分隔符,分隔符用""引起来

-v:var=value在awk程序开始之前指定一个值valu给变量var,这些变量值用于awk程序的BEGIN块

-f:后面跟一个保存了awk程序的文件,代替在命令行指定awk程序

利用awk读取文件中的每行数据,并且可以对每行数据做一些处理,还可以单独处理每行数据里的每列数据。

cat data.dat | awk '{print $0}'
cat data.dat | awk 'for(i=2;i<NF;i++) {printf $i} printf "\n"}'

第1行代码输出data.dat里的每行数据,第2代码输出每行中从第2列之后的数据。

如果是单纯的数据或文本文件的按行读取和显示的话,使用awk命令比较方便。

三、使用 for var in file 命令完成

for var in file 表示变量varfile中循环取值.取值的分隔符由$IFS确定。

for line in $(cat data.dat)
do
 echo "File:${line}"
done
 
for line in `cat data.dat`
do
 echo "File:${line}"
done

如果输入文本每行中没有空格,则 line 在输入文本中按换行符分隔符循环取值。

如果输入文本中包括空格或制表符,则不是换行读取,line在输入文本中按空格分隔符或制表符或换行符循环取值。可以通过把IFS设置为换行符来达到逐行读取的功能。

IFS的默认值为:空白(包括:空格,制表符,换行符)。

;