【Linux命令二】文本处理命令awk
linux  /  管理员 发布于 4年前   419
awk是Linux用来进行文本处理的命令,在日常工作中,广泛应用于日志分析。awk是一门解释型编程语言,包含变量,数组,循环控制结构,条件控制结构等。它的语法采用类C语言的语法。
1.awk适用于具有一定结构的文本行,对其中的列进行提取信息
2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理,然后把直接结构返回给awk
3.awk实际工作中,广泛应用与日志分析
ID Name Salary BonusA000 Tom 9900 3212A001 Jack 9999 2801A002 Alex 8221 2003
针对这个数据,基本的需求可能是
1.查看某个人的BaseSalary,Bonus
2.列出所有人的BaseSalary和Bonus之和
3.列出所有人的Bonus(只显示Name和Bonus)
通过awk,可以很容易的实现这些需求
awk命令包括三部分:pattern,action,input-file(可以是文件,可以是其它命令的管道)
awk对输入的文本,逐行进行处理以提取每行中各个字段值,为了达到这个目的,awk需要知道如下信息:
1. 行结尾符
awk使用内置变量RS(Record )来设置行结尾符,默认是文本结束符\n,可以通过为RS赋值来设置结尾符(这适用于没有整个文本只有一行)。比如RS=end,表示使用end来把文本切割为多行
2. 字段分割符
awk使用内置变量FS(Field)来设置字段分隔符,默认是一个空格或者一个制表符\t。可以通过FS赋值来设置字段分隔符,例如FS=" ",使用两个空格作为分隔符。awk可以使用-F参数来设置字段分割符
3.$0, $1..$n
使用awk对一行文本按照给定的字段分割符进行处理后,如何引用各个字段的值。比如在示例数据中分割为多列后,如何取出每一列的值,这就是用到了$0..$n。其中$0表示当前处理的全文本行,$1表示第一列,$2表示第二列,。。$n表示第n列
1.打印四行完整数据
awk '{print}' data.txt
awk -F " " '{print $0}'
awk 'FS=" " {print}'
awk 'BEGIN{FS=" "} {print}'
输出结果:四行完整的数据
2.打印用户名
awk 'BEGIN{FS=" " ; print "用户名"} /^A/ {print $2}' data.txt
注意:
输出结果:
用户名
Tom
Jack
Alex
3.计算每个人的总工资
awk 'BEGIN{FS=" " ; print "用户名\t月收入"} /^A/ {total = $3 + $4; print $2 , total}' data.txt
输出结果:
用户名 月收入
Tom 13112
Jack 9999
Alex 8221
4.输出Salary在9000以上的用户名和工资
awk 'BEGIN{FS=" " ; print "用户名\t月收入"} /^A/ {if ($3 >= 9000) print $2,$3} ' data.txt
123 在
Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..原梓番博客 在
在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..博主 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..1111 在
佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..路人 在
php中使用hyperf框架调用讯飞星火大模型实现国内版chatgpt功能示例中评论 教程很详细,如果加个前端chatgpt对话页面就完美了..Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号