高效而轻松的sed命令

本文由LinuxProbe.Com团队成员魏丽猿整理发布,点此查看最新Linux资讯

sed(stream editor)是一款高效的流编辑器,它一次只处理一行内容,处理时,把当前处理的行存储在临时缓冲区中,称为“模式空间”(pattern space),接着用sed命令处理缓冲区中的内容,处理完成后把缓冲区的内容送往屏幕,接着处理下一行,这样不断重复,直到文件末尾。sed处理过的文件内容并没有改变,除非你使用重定向存储输出。

sed命令的使用规则

命令格式如下:

sed [option] 'command' input_file

其中option是可选的,常用的option有如下几种:

-n 使用安静(silent)模式,只列出经过sed特殊处理的那一行(或者动作)内容;
-e 直接在指令列模式上进行 sed 的动作编辑;
-f 直接将 sed 的动作写在一个文件内, -f filename 则可以执行filename内的sed命令;
-r 让sed命令支持扩展的正则表达式(默认是基础正则表达式);
-i 直接修改读取的文件内容,而不是由屏幕输出;

常用的命令有以下几种:

a \: 即append追加字符串,可将其后的字符加在所选择内容的后面
c \: 取代/替换字符串,可将其后内容替换至所选内容
d  : 即delete删除,该命令会将当前选中的行删除
i \: 即insert插入字符串,可将其后内容插入至所选内容前
p  : print即打印,该命令会打印当前选择的行到屏幕上
s  : 替换,通常s命令的用法是这样的:1,2s/old/new/g,将old字符串替换成new字符串

命令示例

假设有一个本地文件test.txt,文件内容如下:

[root@linuxprobe ~]$ cat test.txt
this is first line
this is second line
this is third line
this is fourth line
this fifth line
happy everyday
end

本节将使用该文件详细演示每一个命令的用法。

a命令
[root@linuxprobe ~]$ sed '1a \add one' test.txt
this is first line
add one
this is secondline
this is third line
this is fourth line
this is fifth line
happy everyday
end

本例命令部分中的1表示第一行,同样的第二行写成2,第一行到第三行写成1,3,用$表示最后一行,比如2,$表示第二行到最后一行中间所有的行(包含第二行和最后一行)。
本例的作用是在第一行之后增加字符串”add one”,从输出可以看到具体效果。

[root@linuxprobe ~]$ sed '1,$a \add one' test.txt
this is first line
add one
this is second line
add one
this is third line
add one
this is fourth line
add one
this is fifth line
add one
happy everyday
add one
end
add one

本例表示在第一行和最后一行所有的行后面都加上”add one”字符串,从输出可以看到效果。

[root@linuxprobe ~]$ sed '/first/a \add one' test.txt
this is first line
add one
this is secondline
this is third line
this is fourth line
this is fifth line
happy everyday
end

本例表示在包含”first”字符串的行的后面加上字符串”add one”,从输出可以看到第一行包含first,所以第一行之后增加了”add one”

[root@linuxprobe ~]$ sed '/^ha.*day$/a \add one' test.txt
this is first line
this is secondline
this is third line
this is fourth line
this is fifth line
happy everyday
add one
end

本例使用正则表达式匹配行,^ha.*day$表示以ha开头,以day结尾的行,则可以匹配到文件的”happy everyday”这样,所以在该行后面增加了”add one”字符串。

i命令

i命令使用方法和a命令一样的,只不过是在匹配的行的前面插入字符串,所以直接将上面a命令的示例的a替换成i即可,在此就不啰嗦了。

c命令
[root@linuxprobe ~]$ sed '$c \add one' test.txt
this is first line
this is secondline
this is third line
this is fourth line
this is     fifth line
happy everyday
add one

本例表示将最后一行替换成字符串”add one”,从输出可以看到效果。

[root@linuxprobe ~]$ sed '4,$c \add one' test.txt
this is first line
this is secondline
this is third line
add one

本例将第四行到最后一行的内容替换成字符串”add one”。

[root@linuxprobe ~]$ sed '/^ha.*day$/c \replace line' test.txt
this is first line
this is secondline
this is third line
this is fourth line
this is fifth line
replace line
end

本例将以ha开头,以day结尾的行替换成”replace line”。

d命令
[root@linuxprobe ~]$ sed '/^ha.*day$/d' test.txt
this isfirst line
this issecond line
this isthird line
this isfourth line
this isfifth line
end

本例删除以ha开头,以day结尾的行。

[root@linuxprobe ~]$ sed '4,$d' test.txt
thisis first line
thisis second line
thisis third line

本例删除第四行到最后一行中的内容。

p命令
[root@linuxprobe ~]$ sed -n '4,$p' test.txt
thisis fourth line
thisis fifth line
happy everyday
end

本例在屏幕上打印第四行到最后一行的内容,p命令一般和-n选项一起使用。

[root@linuxprobe ~]$ sed -n '/^ha.*day$/p' test.txt
happy everyday

本例打印以ha开始,以day结尾的行。

s命令

实际运用中s命令式最常使用到的。

[root@linuxprobe ~]$ sed 's/line/text/g' test.txt
this isfirst text
this issecond text
this isthird text
this isfourth text
this isfifth text
happy everyday
end

本例将文件中的所有line替换成text,最后的g是global的意思,也就是全局替换,如果不加g,则只会替换本行的第一个line。

[root@linuxprobe ~]$ sed '/^ha.*day$/s/happy/very happy/g' test.txt
this isfirst line
this issecond line
this isthird line
this isfourth line
this isfifth line
very happy everyday
end

本例首先匹配以ha开始,以day结尾的行,本例中匹配到的行是”happy everyday”这样,然后再将该行中的happy替换成very happy。

[root@linuxprobe ~]$ sed 's/\(.*\)line$/\1/g' test.txt
thisis first
thisis second
thisis third
thisis fourth
thisis fifth
happy everyday
end

这个例子有点复杂,先分解一下。首先s命令的模式是s/old/new/g这样的,所以本例的old部分即\(.*\)line$,sed命令中使用\(\)包裹的内容表示正则表达式的第n部分,序号从1开始计算,本例中只有一个\(\)所以\(.*\)表示正则表达式的第一部分,这部分匹配任意字符串,所以\(.*\)line$匹配的就是以line结尾的任何行。然后将匹配到的行替换成正则表达式的第一部分(本例中相当于删除line部分),使用\1表示匹配到的第一部分,同样\2表示第二部分,\3表示第三部分,可以依次这样引用。比如下面的例子:

[root@linuxprobe ~]$ sed 's/\(.*\)is\(.*\)line/\1\2/g' test.txt
this  first
this  second
this  third
this  fourth
this  fifth
happy everyday
end

正则表达式中is两边的部分可以用\1和\2表示,该例子的作用其实就是删除中间部分的is。

以上是高效而轻松的sed命令的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>