Linux文本处理三剑客:awk(内置函数详解笔记)

news/2024/7/27 11:08:06/文章来源:https://blog.csdn.net/TiYong/article/details/136452549

Linux系统中,AWK 是一个非常强大的文本处理工具,它的内置函数使得对文本数据进行处理更加高效和便捷。

本文将介绍 AWK 内置函数的几种主要类型:

  • 算数函数
  • 字符串函数
  • 时间函数
  • 位操作函数
  • 其他常用函数

我们将使用一个示例文本文件来演示这些函数的用法,并提供详细的注释说明,继续分享。

基础学习,可以回头查看:Linux文本处理三剑客:awk(结构化命令)

1.算数函数

函数名功能参数示例输出
atan2(y,x)返回正切值 y/x 的角度值,角度以弧度为单位y, xatan2(10, -10) * 180 / PI135
cos(expr)返回 expr 的余弦值,输入参数以弧度为单位exprcos(60 * PI / 180.0)0.5
exp(expr)返回自然数 e 的 expr 次幂exprexp(5)148.413159
int(expr)返回数值 expr 的整数部分exprint(5.12345)5
log(expr)计算 expr 自然对数exprlog(5.5)1.704748
rand返回一个大于等于 0 小于 1 的随机数-rand()0.237788
sin(expr)返回角度 expr 的正弦值,角度以弧度为单位exprsin(30 * PI / 180)0.5
sqrt(expr)计算 expr 的平方根exprsqrt(1024.0)32
srand([expr])使用种子值生成随机数exprsrand(10)1417959587

注释:

  • 以上表格仅列出了 AWK 提供的内置算术函数。
  • 算术函数的参数必须是数值。
  • 算术函数的返回值是数值。
# 反正切函数
awk 'BEGIN {PI = 3.14159265x = -10y = 10result = atan2 (y,x) * 180 / PI;printf "对于 (x=%f, y=%f),反正切值为 %f 度\n", x, y, result
}'# 余弦函数
awk 'BEGIN {PI = 3.14159265param = 60result = cos(param * PI / 180.0);printf "%f 度的余弦值为 %f\n", param, result
}'# 自然指数函数
awk 'BEGIN {param = 5result = exp(param);printf "%f 的自然指数值为 %f\n", param, result
}'# 取整函数
awk 'BEGIN {param = 5.12345result = int(param)print "Truncated value =", result
}'# 自然对数函数
awk 'BEGIN {param = 5.5result = log (param)printf "log(%f) = %f\n", param, result
}'# 随机数函数
awk 'BEGIN {print "Random num1 =" , rand()print "Random num2 =" , rand()print "Random num3 =" , rand()
}'#正弦函数
awk 'BEGIN {PI = 3.14159265param = 30.0result = sin(param * PI /180)printf "The sine of %f degrees is %f.\n", param, result
}'# 平方根函数
awk 'BEGIN {param = 1024.0result = sqrt(param)printf "sqrt(%f) = %f\n", param, result
}'# 设置随机数种子
awk 'BEGIN {param = 10printf "srand() = %d\n", srand()printf "srand(%d) = %d\n", param, srand(param)
}'

2.字符串函数

函数名功能参数示例输出
asort(arr, [d [, how]])使用 GAWK 值比较的一般规则排序 arr 中的内容arr, d, howasort(arr)-
asorti(arr, [d [, how]])对数组的索引排序arr, d, howasorti(arr)-
gsub(regexp, replacement [, target])全局替换子串regexp, replacement, targetgsub("World", "Jerry", str)Hello, Jerry
index(str, sub)检测子串是否存在str, subindex(str, subs)5
length(str)返回字符串长度strlength(str)16
match(str, regex)搜索与正则表达式匹配的子串str, regexmatch(str, subs)5
split(str, arr, regex)分割字符串str, arr, regexsplit(str, arr, ",")One, Two, Three, Four
sprintf(format, expr-list)按指定格式构造字符串format, expr-listsprintf("%s", "Hello, World !!!")Hello, World !!!
strtonum(str)将字符串转换为数值strstrtonum("123")123
sub(regex, sub, string)执行一次子串替换regex, sub, stringsub("World", "Jerry", str)Hello, Jerry
substr(str, start, l)返回子串str, start, lsubstr(str, 1, 5)Hello
tolower(str)将所有大写字母转换为小写字母strtolower(str)hello, world !!!
toupper(str)将所有小写字母转换为大写字母strtoupper(str)HELLO, WORLD !!!

注释:

  • 以上表格仅列出了 AWK 提供的内置字符串函数。
  • 字符串函数的参数可以是字符串或变量。
  • 字符串函数的返回值是字符串。
# 按字母顺序排列数组元素
$ awk 'BEGIN {arr[0] = "Three"arr[1] = "One"arr[2] = "Two"print "排序前数组元素:"for (i in arr) {print arr[i]}asort(arr)print "排序后数组元素:"for (i in arr) {print arr[i]}
}'# 按索引顺序排列数组元素
awk 'BEGIN {arr["Two"] = 1arr["One"] = 2arr["Three"] = 3asorti(arr)print "排序后数组索引:"for (i in arr) {print arr[i]}
}'# 替换字符串
awk 'BEGIN {str = "Hello, World"print "替换前字符串 = " strgsub("World", "Jerry", str)print "替换后字符串 = " str
}'# 查找子串的位置
awk 'BEGIN {str = "One Two Three"subs = "Two"ret = index(str, subs)printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
}'# 获取字符串长度
awk 'BEGIN {str = "Hello, World !!!"print "长度 = ", length(str)
}'# 使用正则表达式匹配子串
awk 'BEGIN {str = "One Two Three"subs = "Two"ret = match(str, subs)printf "子串 \"%s\" 在第 %d 个位置找到.\n", subs, ret
}'# 将字符串分割为数组
awk 'BEGIN {str = "One,Two,Three,Four"split(str, arr, ",")print "数组包含以下元素:"for (i in arr) {print arr[i]}
}'# 使用 sprintf() 格式化字符串
awk 'BEGIN {str = sprintf("%s", "Hello, World !!!")print str
}'# 将字符串转换为数字
awk 'BEGIN {print "Decimal num = " strtonum("123")print "Octal num = " strtonum("0123")print "Hexadecimal num = " strtonum("0x123")
}'# 使用 sub() 替换字符串
awk 'BEGIN {str = "Hello, World"print "替换前字符串 = " strsub("World", "Jerry", str)print "替换后字符串 = " str
}'# 获取子字符串
awk 'BEGIN {str = "Hello, World !!!"subs = substr(str, 1, 5)print "Substring = " subs
}'# 小写转换
awk 'BEGIN {str = "HELLO, WORLD !!!"print "Lowercase string = " tolower(str)
}'# 大写转换
awk 'BEGIN {str = "hello, world !!!"print "Uppercase string = " toupper(str)
}'

3.时间函数

函数名功能参数示例输出
systime返回从 Epoch 以来到当前时间的秒数-systime()1418574432
mktime(datespec)将字符串转换为时间戳datespecmktime("2014 12 14 30 20 10")1418604610
strftime([format [, timestamp[, utc-flag]]])格式化时间戳format, timestamp, utc-flagstrftime("Time = %m/%d/%Y %H:%M:%S", systime())Time = 12/14/2014 22:08:42

注释:

  • 以上表格仅列出了 AWK 提供的内置时间函数。
  • 时间戳是一个数值,表示从 Epoch 以来经过的秒数。
  • Epoch 是 Unix 时间的起点,为 1970 年 1 月 1 日 00:00:00 UTC。
# 获取当前时间戳
awk 'BEGIN {print "Number of seconds since the Epoch = " systime()
}'
# 将字符串转换为时间戳
awk 'BEGIN {print "Number of seconds since the Epoch = " mktime("2014 12 14 30 20 10")
}'# 格式化时间戳
awk 'BEGIN {print strftime("Time = %m/%d/%Y %H:%M:%S", systime())
}'# 打印当前星期几
awk 'BEGIN {print strftime("%A")
}'

4.位操作函数

函数名功能参数示例输出
and执行位与操作num1, num2and(10, 6)2
compl按位求补num1compl(10)9.0072E+15
lshift左移位操作num1, shiftlshift(10, 1)20
rshift向右移位操作num1, shiftrshift(10, 1)5
or按位或操作num1, num2or(10, 6)14
xor按位异或操作num1, num2xor(10, 6)12

注释:

  • 以上表格仅列出了 AWK 提供的内置位操作函数。
  • 位操作函数的参数必须是整数。
  • 位操作函数的返回值是整数。
# 位与操作
awk 'BEGIN {num1 = 10num2 = 6printf "(%d AND %d) = %d\n", num1, num2, and(num1, num2)
}'# 按位求补
awk 'BEGIN {num1 = 10printf "compl(%d) = %d\n", num1, compl(num1)
}'# 左移位操作
awk 'BEGIN {num1 = 10printf "lshift(%d) by 1 = %d\n", num1, lshift(num1, 1)
}'# 向右移位操作。
awk 'BEGIN {num1 = 10printf "rshift(%d) by 1 = %d\n", num1, rshift(num1, 1)
}'# 按位或操作。
awk 'BEGIN {num1 = 10num2 = 6printf "(%d OR %d) = %d\n", num1, num2, or(num1, num2)
}'# 按位异或操作
[jerry]$ awk 'BEGIN {num1 = 10num2 = 6printf "(%d XOR %d) = %d\n", num1, num2, xor(num1, num2)
}'

5.其他常用函数

函数名功能参数示例输出
close(expr)关闭管道的文件exprclose(cmd, "to")-
delete从数组中删除元素数组索引delete arr[0]-
exit([expr])终止脚本执行exprexit 10-
fflush([output-expr])刷新打开文件或管道的缓冲区output-exprfflush()-
getline读入下一行-getline < file-
next停止处理当前记录,进入下一条记录的处理过程-if ($0 ~/Shyam/) next-
nextfile停止处理当前文件,从下一个文件第一个记录开始处理-if ($0 ~ /file1:str2/) nextfile-
return([expr])从用户自定义的函数中返回值exprreturn result-
system(cmd)执行特定的命令cmdsystem("date")0

释:

  • 以上表格仅列出了 AWK 提供的其它内置函数。
  • 每个函数的具体使用方法请参考 AWK 官方文档。
# 关闭管道
awk 'BEGIN {cmd = "tr [a-z] [A-Z]"print "hello, world !!!" |& cmdclose(cmd, "to")cmd |& getline outprint out;close(cmd);
}'# 从数组中删除元素
awk 'BEGIN {arr[0] = "One"arr[1] = "Two"arr[2] = "Three"arr[3] = "Four"print "删除前:"for (i in arr) {print arr[i]}delete arr[0]delete arr[1]print "删除后:"for (i in arr) {print arr[i]}
}'# 终止脚本执行
awk 'BEGIN {print "Hello, World !!!"exit 10print "AWK never executes this statement."
}'# 刷新打开文件或管道的缓冲区
fflush([output-expr])# 读入下一行
awk '{getline; print $0}' file.txt # 执行特定的命令然后返回其退出状态。返回值为 0 表示命令执行成功;非 0 表示命令执行失败。
awk 'BEGIN { ret = system("date"); print "Return value = " ret }'

如果您觉得有些用处,熟练操作这些代码后,相信你会有一些收获。

欢迎在评论区留言,关注。谢谢您的阅读!

敬请关注!

往期学习笔记:

Windows系统开启Linux子系统(Ubuntu)

Linux常用命令(目录操作命令)

Linux常用命令:文件的创建、复制、移动、查找和删除命令

Linux常用命令:文本文件的查看与编辑

Linux常用命令:文本文件的拼接与分割

Linux常用命令:文件的权限管理

Linux常用命令:文件的下载、压缩与解压

Linux常用命令:常见的操作符

Linux常用命令:系统操作命令
 

 Linux文本处理三剑客:grep

Linux文本处理三剑客:sed

Linux文本处理三剑客:awk

Linux文本处理三剑客:awk(常用匹配模式)

Linux文本处理三剑客:awk(结构化命令)

Linux文本处理三剑客:awk(对具体文本的示例代码)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.luyixian.cn/news_show_997292.aspx

如若内容造成侵权/违法违规/事实不符,请联系dt猫网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vue3的基本使用(1)

Vue3的基本使用&#xff08;1&#xff09; 初识vue31. vue3简介2. 性能提升3. 源码升级 Vue3的创建1. vue-cli创建2. vite创建 Composition API的区别&#xff08;组合式&#xff09;setup函数响应式数据1. ref响应式2. reactive响应式 toRefs与toRef简单介绍 初识vue3 1. vue…

Easticsearch性能优化之索引优化

Easticsearch性能优化之索引优化 一、合理的索引设计二、合理的分片和副本三、合理的索引设置 对于性能优化&#xff0c;Elasticsearch&#xff08;以下简称ES&#xff09;的索引优化是提高性能的关键因素之一。合理的设计索引&#xff0c;合理的分片和副本以及合理的缓存设置等…

Matlab 机器人工具箱 例程:运动学+动力学+路径规划+可视化

文章目录 1 创建机器人2 机器人显示3 机器人示教4 机器人路径规划&#xff1a;给定关节角路径5 机器人路径规划&#xff1a;给定末端位姿&#xff0c;求关节角路径6 工作空间可视化参考链接 1 创建机器人 clc;clear;close all; deg pi/180;L1 Revolute(d, 0, a, 0, alpha, 0,…

sudo command not found

文章目录 一句话Intro其他操作 一句话 sudo 某命令 改成 sudo -i 某命令 试试。 -i 会把当前用户的环境变量带过去&#xff0c;这样在sudo的时候&#xff0c;有更高的权限&#xff0c;有本用户的环境变量(下的程序命令)。 -i, --login run login shell as the target user; a …

蓝桥杯嵌入式模板构建——RCT时钟

在CubeMX里的RTC模块启用RTC时钟和日历功能 输入到RTC的时钟要配置成1HZ,这样的话RTC每经过1s走时一次 由于RTC时钟默认配置为32Khz 所以我们需要将异步分频值与同步分频值的乘积调整为32K分频即可一秒走时一次 频率&#xff1a;32000hz / 32000hz 1hz 必须是31和999&#…

数字化转型导师坚鹏:如何制定证券公司数字化转型年度培训规划

如何制定与实施证券公司数字化转型年度培训规划 ——以推动证券公司数字化转型战略落地为核心&#xff0c;实现知行果合一 课程背景&#xff1a; 很多证券公司都在开展数字化转型培训工作&#xff0c;目前存在以下问题急需解决&#xff1a; 缺少针对性的证券公司数字化转型…

Java定时调度

在Java应用程序中&#xff0c;定时调度是一项重要的任务。它允许你安排代码执行的时间&#xff0c;以便在将来的某个时刻自动执行任务。Java提供了多种方式来实现定时调度&#xff0c;其中最常用的是Java的Timer和ScheduledExecutorService。 在本教程中&#xff0c;我们将学习…

力扣新思路:改变字符串进行返回操作

我们在对字符串进行判断操作和返回操作时&#xff0c;可以增加\0来简化返回操作 char* longestCommonPrefix(char** strs, int strsSize) {if(strsSize0){return"";}for(int i0;i<strlen(strs[0]);i){for(int j1;j<strsSize;j){if(strs[0][i]!strs[j][i]) {s…

自动化测试之web自动化(Selenium)

&#x1f525; 交流讨论&#xff1a;欢迎加入我们一起学习&#xff01; &#x1f525; 资源分享&#xff1a;耗时200小时精选的「软件测试」资料包 &#x1f525; 教程推荐&#xff1a;火遍全网的《软件测试》教程 &#x1f4e2;欢迎点赞 &#x1f44d; 收藏 ⭐留言 &#x1…

【JavaEE初阶】 JVM 运行时数据区简介

文章目录 &#x1f343;前言&#x1f332;堆&#xff08;线程共享&#xff09;&#x1f384;Java虚拟机栈&#xff08;线程私有&#xff09;&#x1f38b;本地方法栈&#xff08;线程私有&#xff09;&#x1f333;程序计数器&#xff08;线程私有&#xff09;&#x1f334;方法…

尤雨溪:Vue 未来展望新的一轮

十年&#xff0c;一个既漫长又短暂的时光跨度&#xff0c;对于技术世界来说&#xff0c;更是沧海桑田的瞬间。在这十年里&#xff0c;Vue.js 从无到有&#xff0c;从默默无闻到蜚声全球&#xff0c;不仅改变了前端开发的面貌&#xff0c;更成为了无数开发者手中的得力工具。 在…

【漏洞复现】-用友CRM 任意文件读取漏洞

免责声明&#xff1a; 本文内容为学习笔记分享&#xff0c;仅供技术学习参考&#xff0c;请勿用作违法用途&#xff0c;未授权的攻击属于非法行为&#xff01;文章中敏感信息均已做多层打马处理。任何个人和组织利用此文所提供的信息而造成的直接或间接后果和损失&#xff0c;…

MySQL面试题纯享版

基础内容 1、MySQL的架构分层 2、一条 SQL 查询语句的执行流程 3、如何查看 MySQL 服务被多少个客户端连接了&#xff1f; 4、 空闲连接会一直占用着吗&#xff1f; 5、MySQL 的连接数有限制吗&#xff1f; 6、 怎么解决长连接占用内存的问题&#xff1f; 7、执行器与存储引擎…

Java输入和输出处理

一、Java I/O 文件、内存、键盘--->程序--->文件、内存、控制台 二、文件 相关记录或放在一起的数据的集合 思考&#xff1a; Java程序如何访问文件属性&#xff1f; 解答&#xff1a; Java API:java.io.File类 三、File类 File类的常用方法 方法名称说明boole…

el-dialog封装组件

父页面 <template><div><el-button type"primary" click"visible true">展示弹窗</el-button><!-- 弹窗组件 --><PlayVideo v-if"visible" :visible.syncvisible /></div> </template><sc…

Hive的性能优化

1.调优概述 Hive 作为大数据领域常用的数据仓库组件&#xff0c;在设计和查询时要特别注意效率。影响 Hive 效率的几乎从不是数据量过大&#xff0c;而是数据倾斜、数据冗余、Job或I/O过多、MapReduce分配不合理等等。对 Hive 的调优既包含 Hive 的建表设计方面&#xff0c;对H…

12.WEB渗透测试-Linux系统管理、安全加固(下)

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 内容参考于&#xff1a; 易锦网校会员专享课 上一个内容&#xff1a;11.WEB渗透测试-Linux系统管理、安全加固&#xff08;上&#xff09;-CSDN博客 Linux任务…

安卓玩机工具推荐----高通芯片9008端口读写分区 备份分区 恢复分区 制作线刷包 工具操作解析

上期解析了下adb端口备份分区的有关操作 安卓玩机工具推荐----ADB状态读写分区 备份分区 恢复分区 查看分区号 工具操作解析 在以往的博文中对于高通芯片机型的分区读写已经分享了很多。相关类似博文 安卓备份分区----手动查询安卓系统分区信息 导出系统分区的一些基本操作 …

策略梯度网络

策略梯度网络是强化学习中的一类算法,它们直接学习一个策略,该策略可以映射从环境状态到采取的动作。与值函数方法(如Q学习和深度Q网络)不同,策略梯度方法通过优化策略本身来实现目标,即直接调整其输出动作的概率,以最大化累积奖励。这类方法的核心优势在于它们能够自然…

专治Java底子差,线程操作篇(1)

&#x1f497;推荐阅读文章&#x1f497; &#x1f338;JavaSE系列&#x1f338;&#x1f449;1️⃣《JavaSE系列教程》&#x1f33a;MySQL系列&#x1f33a;&#x1f449;2️⃣《MySQL系列教程》&#x1f340;JavaWeb系列&#x1f340;&#x1f449;3️⃣《JavaWeb系列教程》…