关于正则表达式第四篇(r3笔记第53天)

时间:2022-05-04
本文章向大家介绍关于正则表达式第四篇(r3笔记第53天),主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

正则表达式,林林总总说了几篇,还是有不少的内容需要补充。 -->星号 字符出现0次或者多次

$ echo "ik"|sed -n  '/e*/p'
ik
$ echo "ieek"|sed -n '/e*/p'
ieek
$ echo "This is a color  TV"|sed -n '/colou*r/p'  --colour中的u可以出现0次或者多次。出现0次的时候color就符合条件
This is a color TV
$ echo  "This is a colour TV"|sed -n '/colou*r/p'    --colour中的u可以出现0次或者多次。出现1次的时候colour就符合条件
This  is a colour  TV

-->星号+点字符 星号和点字符的结合

$ echo  "This is a nice hat"|sed -n '/a.*hat/p'  
This is a nice  hat

-->星号+字符组

$ cat  c.txt
bt
bat
bet
btt
batt
baaeeat
bakeat
$ sed -n  '/b[ae]*t/p'  c.txt
bt
bat
bet
btt
batt
baaeeat

扩展表达式有以下几种,在linux中对于grep,awk都是支持的。 问号 花括号 管道符号 聚合表达式 -->问号 字符出现0次或者1次

$  cat c.txt
bt
bat
bet
btt
batt
baaeeat
bakeat

$ sed -n '/b[ae]*t/p'  c.txt
bt
bat
bet
btt
batt
Baaeeat
$ awk '/b[ae]?t/{print  $0}' c.txt  --匹配0次或者1次的时候,Baaeeat  怎么也匹配不到[ae]相关的组合。
bt
bat
bet
btt
batt

-->加号 字符出现1次或者多次,这个和问号有些类似。但是对于出现的频率会有不同。问号是0次或者一次,星号是0次或者多次。

$  awk '/b[ae]+t/{print $0}' c.txt
bat
bet
batt
baaeeat

-->花括号 m 正则表达式准确出现m次 m,n 正则表达式至少出现m次,至多n次 默认awk不会识别正则表达式区间,需要指定--re-interval 选项

$ echo "bat"|awk '/b[ae]{1}t/{print $0}'
echo "bat"|awk --re-interval  '/b[ae]{1}t/{print $0}'
 bat

$ cat c.txt
bt
bat
bet
btt
batt
baaeeat
bakeat
$ awk  --re-interval '/b[ae]{1,2}t/{print $0}' c.txt
bat
bet
batt

$ cat d.txt
the cat is asleep
the dog is asleep
the sheep is  asleep
$ awk '/cat|dog/{print $0}' d.txt
the cat is asleep
the dog is  asleep

-->聚合表达式

$ echo "Sat"|awk  '/Sat(urday)?$/{print $0}'
Sat
$ echo "Satx"|awk '/Sat(urday)?$/{print  $0}'
$ echo "Saturday"|awk '/Sat(urday)?$/{print $0}'
Saturday
$ echo  "Saturdayurday"|awk '/Sat(urday)?$/{print $0}'
 $ echo "cat"|awk  '/(c|b)a(b|t)/{print $0}'
cat
 $ echo "tab"|awk '/(c|b)a(b|t)/{print  $0}‘
 $ echo "tac"|awk '/(c|b)a(b|t)/{print $0}'