Bash的字符串匹配共有6种形式:

  1. {variable#pattern}

如果pattern匹配variable的开始部分,从variable的开始处删除字符直到第一个匹配的位置,包括匹配部分,返回剩余部分。

  1. {variable##pattern}

如果pattern匹配variable的开始部分,从variable的开始处删除字符直到最后一个匹配的位置,包括匹配部分,返回剩余部分。

  1. {variable%pattern}

如果pattern匹配variable的结尾部分,从variable的结尾处删除字符直到第一个匹配的位置,包括匹配部分,返回剩余部分。

  1. {variable%%pattern}

如果pattern匹配variable的结尾部分,从variable的结尾处删除字符直到最后一个匹配的位置,包括匹配部分,返回剩余部分。

  1. {variable/pattern/string}

  2. {variable//pattern/string}

最后这两种用法用于匹配替换。因为我没用到,先不说了。(busybox 1.0.1 不支持最后这两种语法。)

举例:

str=tftp://hostname.com/onepath/anotherpath

echo {str#_/}

输出:/hostname.com/onepath/anotherpath

echo {str##/}

输出:anotherpath

echo {str%/*}

输出:tftp://hostname.com/onepath

echo {str%%/}

输出:tftp:/

——————– 下面说一说具体怎么用。

假设在某个系统中没有sed和awk, 只有grep,tr和cut。 如果要取得网卡的mac地址,可以:

mac_addr=(ifconfig eth0 | grep HWaddr | cut -d’ ‘ -f11 | tr -d : )
echo mac_addr

输出:0150BF9886BF

后面再说为什么我要把冒号去掉。这种方式在cut时要经过实验才知道我们要的是第11个field。现在换另一种方式:

mac_addr=(ifconfig eth0 | grep HWaddr | tr -d ‘ :’)
echo mac_addr

输出:eth0LinkencapEthernetHWa

ddr0150BF9886BF

然后:

mac_addr={mac_addr#_HWaddr}
echo mac_addr

输出:0150BF9886BF

现在要求写一个程序,接受命令行给定一个网址去下载一个文件,要求根据网址的协议的不同,采用不同的程序下载。如果给定的网址以.xml结尾,则认为要下载的文件已经在给定的网址中指定,否则要下载的文件名为本机的mac地址加.xml扩展名,不包括mac中的冒号。

例如给定 tftp://host/file.xml,则要用tftp命令下载host上的file.xml文件。 如果给定 http://host/path,则要用wget命令下载host/path上的0150BF9886BF.xml文件。

先取网址的协议,采用从右向左最大匹配”://”:

url=1
proto={url%%://}

再判断文件名是否已经给定, 采用从左向右最大匹配”.xml”:

[ -z “{url##_.xml}] || url=url/mac_addr.xml

如果 proto = “http” 或者 “ftp” 则执行 wget url -O local_file

如果 proto = “tftp”,这个有点麻烦,因为tftp的用法是:

tftp -g -r remote_file -l local_file host

所以还要把remote_file和host从url中提取出来。

先把url中的tftp://去掉: tmp={url#*://}

再从右向左最大匹配”/”得到host: host={tmp%%/}

再从左向右最小匹配”/”得到路径和文件名: remote_file=${tmp#/}