Shell脚本逐行处理文本文件技巧

经常会对文体文件进行逐行处理，在Shell里面如何获取每行数据，然后处理该行数据，最后读取下一行数据，循环处理．有多种解决方法如下：

read 命令从标准输入中读取一行，并把输入行的每个字段的值指定给 shell 变量，用 IFS（内部字段分隔符）变量中的字符作为分隔符。VariableName （变量名）参数指定给每一个字段的值，由 VariableName （变量名）参数指定的以此类推，直到最后一个字段。

read命令接收标准输入，或其他文件描述符的输入，得到输入后，read命令将数据放入一个标准变量中。

利用read读取文件时，每次调用read命令都会读取文件中的"一行"文本。

当文件没有可读的行时，read命令将以非零状态退出。

cat data.dat | while read line
do
 echo "File:${line}"
done

while read line
do
 echo "File:${line}"
done < data.dat

awk是一种优良的文本处理工具，提供了极其强大的功能。

语法格式：awk [选项] '指令' 操作文件

常用选项：-F指定分隔符，分隔符用""引起来

-v：var=value在awk程序开始之前指定一个值valu给变量var，这些变量值用于awk程序的BEGIN块

-f：后面跟一个保存了awk程序的文件，代替在命令行指定awk程序

利用awk读取文件中的每行数据，并且可以对每行数据做一些处理，还可以单独处理每行数据里的每列数据。

cat data.dat | awk '{print $0}'
cat data.dat | awk 'for(i=2;i<NF;i++) {printf $i} printf "\n"}'

第1行代码输出data.dat里的每行数据，第2代码输出每行中从第2列之后的数据。

如果是单纯的数据或文本文件的按行读取和显示的话，使用awk命令比较方便。

for var in file 表示变量var在file中循环取值．取值的分隔符由$IFS确定。

for line in $(cat data.dat)
do
 echo "File:${line}"
done
 
for line in `cat data.dat`
do
 echo "File:${line}"
done

如果输入文本每行中没有空格，则 line 在输入文本中按换行符分隔符循环取值。

如果输入文本中包括空格或制表符，则不是换行读取，line在输入文本中按空格分隔符或制表符或换行符循环取值。可以通过把IFS设置为换行符来达到逐行读取的功能。

IFS的默认值为：空白(包括：空格，制表符，换行符)。