Shell脚本逐行处理文本文件技巧
经常会对文体文件进行逐行处理,在Shell里面如何获取每行数据,然后处理该行数据,最后读取下一行数据,循环处理.有多种解决方法如下:
一、通过 read 命令完成
read 命令从标准输入中读取一行,并把输入行的每个字段的值指定给 shell 变量,用 IFS(内部字段分隔符)变量中的字符作为分隔符。VariableName (变量名)参数指定给每一个字段的值,由 VariableName (变量名)参数指定的以此类推,直到最后一个字段。
read命令接收标准输入,或其他文件描述符的输入,得到输入后,read命令将数据放入一个标准变量中。
利用read读取文件时,每次调用read命令都会读取文件中的"一行"文本。
当文件没有可读的行时,read命令将以非零状态退出。
cat data.dat | while read line
do
echo "File:${line}"
done
while read line
do
echo "File:${line}"
done < data.dat
二、使用awk命令完成
awk是一种优良的文本处理工具,提供了极其强大的功能。
语法格式:awk [选项] '指令' 操作文件
常用选项:-F
指定分隔符,分隔符用""
引起来
-v
:var=value在awk程序开始之前指定一个值valu给变量var,这些变量值用于awk程序的BEGIN块
-f
:后面跟一个保存了awk程序的文件,代替在命令行指定awk程序
利用awk读取文件中的每行数据,并且可以对每行数据做一些处理,还可以单独处理每行数据里的每列数据。
cat data.dat | awk '{print $0}'
cat data.dat | awk 'for(i=2;i<NF;i++) {printf $i} printf "\n"}'
第1行代码输出data.dat里的每行数据,第2代码输出每行中从第2列之后的数据。
如果是单纯的数据或文本文件的按行读取和显示的话,使用awk命令比较方便。
三、使用 for var in file
命令完成
for var in file
表示变量var
在file
中循环取值.取值的分隔符由$IFS
确定。
for line in $(cat data.dat)
do
echo "File:${line}"
done
for line in `cat data.dat`
do
echo "File:${line}"
done
如果输入文本每行中没有空格,则 line
在输入文本中按换行符分隔符循环取值。
如果输入文本中包括空格或制表符,则不是换行读取,line
在输入文本中按空格分隔符或制表符或换行符循环取值。可以通过把IFS
设置为换行符来达到逐行读取的功能。
IFS
的默认值为:空白(包括:空格,制表符,换行符)。