溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Linux系統的awk命令怎么用

發布時間：2022-01-24 10:11:30 來源：億速云閱讀：174 作者：iii 欄目：開發技術

# Linux系統的awk命令怎么用

## 一、awk命令概述

### 1.1 什么是awk
awk是一種強大的文本處理工具，由Alfred Aho、Peter Weinberger和Brian Kernighan三位創始人姓氏首字母命名（Aho-Weinberger-Kernighan）。它不僅是Linux/Unix系統中的標準組件，更是一門功能完備的文本處理編程語言。

### 1.2 awk的核心特性
- **模式掃描與處理語言**：自動掃描文件中的每一行，匹配指定模式后執行相應動作
- **字段處理能力**：自動將輸入行分割為多個字段（默認以空白字符分隔）
- **編程語言特性**：支持變量、條件判斷、循環、數組等編程元素
- **內置函數庫**：提供字符串操作、數學運算、時間處理等豐富函數
- **報表生成能力**：可輕松格式化輸出復雜報表

## 二、awk基本語法結構

### 2.1 命令格式
```bash
awk [選項] '模式 {動作}' 輸入文件

2.2 常用命令行選項

選項	說明
-F	指定字段分隔符（默認是空白字符）
-v	定義變量并賦值
-f	從腳本文件中讀取awk命令
-W	指定兼容模式或開啟擴展功能

2.3 處理流程模型

自動讀取輸入文件的一行
將行內容賦給$0，分割為$1到$n個字段
依次檢查每個模式是否匹配
執行匹配模式對應的動作
重復上述過程直到文件結束

三、awk程序結構詳解

3.1 BEGIN與END塊

BEGIN { 
    # 預處理操作（文件讀取前執行）
    print "=== 開始處理 ==="
}

{
    # 主處理塊（每行都會處理）
}

END {
    # 后處理操作（文件處理完后執行）
    print "=== 處理完成 ==="
}

3.2 模式匹配類型

正則表達式匹配：/pattern/
```
/error/ { print "發現錯誤:", $0 }
```
關系表達式：$1 > 100
```
$3 >= 5000 { print "高收入:", $1 }
```

范圍模式：pattern1, pattern2


/START/, /END/ { print "范圍內容:", $0 }

3.3 常用內置變量

變量	說明	示例
NR	當前記錄號（行號）	`NR % 2 == 0`
NF	當前行的字段數量	`{ print $NF }`
FS	輸入字段分隔符	`BEGIN { FS=":" }`
OFS	輸出字段分隔符	`BEGIN { OFS="\t" }`
RS	輸入記錄分隔符（默認\n）	`BEGIN { RS="\n\n" }`
ORS	輸出記錄分隔符	`BEGIN { ORS="\r\n"}`
FILENAME	當前輸入文件名	`{ print FILENAME }`

四、awk字段處理實戰

4.1 基礎字段操作

# 打印第一列和最后一列
awk '{print $1, $NF}' access.log

# 交換第一列和第二列
awk '{temp=$1; $1=$2; $2=temp; print}' data.txt

# 統計每行字段數
awk '{print NF " fields: " $0}' text.txt

4.2 高級字段處理

# 處理CSV文件（需考慮帶逗號的引用字段）
awk -v FPAT='([^,]+)|("[^"]+")' '{print $3}' data.csv

# 重組字段生成新格式
awk '{printf "用戶%-8s 年齡%2d\n", $1, $2}' users.txt

# 多字符分隔符處理
awk -F'[:=]' '{print $2, $4}' config.ini

五、awk流程控制與運算

5.1 條件語句

{
    if ($3 > 1000) {
        print "VIP:", $1
    } else if ($3 > 500) {
        print "高級:", $1
    } else {
        print "普通:", $1
    }
}

5.2 循環結構

# for循環示例
{
    sum = 0
    for (i=1; i<=NF; i++) {
        sum += $i
    }
    print "總和:", sum
}

# while循環處理字段
{
    i = 1
    while (i <= NF) {
        printf "%s ", toupper($i)
        i++
    }
    print ""
}

5.3 數組應用

# 統計詞頻
{
    for (i=1; i<=NF; i++) 
        words[$i]++
}

END {
    for (w in words)
        print w, words[w] | "sort -nrk2"
}

# 多維度數組
{
    dept[$2]++
    total[$2] += $3
}

END {
    for (d in dept)
        printf "%s: 人數%d 總工資%.2f\n", d, dept[d], total[d]
}

六、awk內置函數大全

6.1 字符串函數

函數	說明	示例
length(str)	返回字符串長度	`length($1)`
substr(str, start, len)	提取子串	`substr($1, 1, 3)`
split(str, arr, sep)	分割字符串到數組	`split($0, arr, ",")`
gsub(r, s, t)	全局替換	`gsub(/foo/, "bar", $0)`
match(str, regex)	返回匹配位置	`match($0, /[0-9]+/))`

6.2 數學函數

{
    print "平方根:", sqrt($1)
    print "隨機數:", int(rand()*100)
    print "對數:", log($2)
    print "正弦值:", sin($3)
}

6.3 時間函數

BEGIN {
    print "當前時間戳:", systime()
    print "格式化時間:", strftime("%Y-%m-%d %H:%M:%S")
}

{
    # 計算時間差（假設$1是時間戳）
    diff = systime() - $1
    print "已過去", diff/3600, "小時"
}

七、高級awk編程技巧

7.1 自定義函數

# 定義函數計算平均值
function avg(arr, size,    i, sum) {
    sum = 0
    for (i=1; i<=size; i++)
        sum += arr[i]
    return sum/size
}

{
    # 使用自定義函數
    values[NR] = $3
}

END {
    print "平均值:", avg(values, NR)
}

7.2 包含外部腳本

# math.awk
function square(x) { return x*x }

# 主程序
awk -f math.awk -f main.awk data.txt

7.3 系統命令交互

{
    # 將結果通過管道傳遞給外部命令
    print $1 | "sort | uniq -c"
    
    # 從命令讀取輸入
    "date" | getline current_date
    print "報告生成于:", current_date
    close("date")
}

八、實戰案例集錦

8.1 日志分析

# 分析Nginx訪問日志
awk '$9 == 404 {print $7}' access.log | sort | uniq -c | sort -nr

# 統計每小時訪問量
awk -F'[:[]' '{hits[$2]++} END {for (h in hits) print h, hits[h]}' access.log

8.2 系統監控

# 監控內存使用
free -m | awk '/Mem/{printf "使用率: %.2f%%\n", $3/$2*100}'

# 找出CPU占用前10的進程
ps aux | awk 'NR>1 {print $3, $11}' | sort -k1 -nr | head

8.3 數據轉換

# CSV轉JSON
awk -F, 'BEGIN{print "["} NR>1{printf "  {\"name\":\"%s\",\"age\":%d}%s\n", $1, $2, (NR==FNR?"":",")} END{print "]"}' data.csv

# 生成Markdown表格
awk -F'\t' 'BEGIN{print "| 名稱 | 數值 |\n|------|------|"} {printf "| %s | %s |\n", $1, $2}' data.txt

九、性能優化建議

減少IO操作：合并多個print語句
使用內置函數：避免調用外部命令
合理使用數組：處理大數據時注意內存消耗
預編譯模式：對固定模式使用~運算符
處理大文件：使用next語句跳過不必要處理

十、學習資源推薦

官方文檔：man awk、info gawk
經典書籍：
- 《The AWK Programming Language》
- 《Effective AWK Programming》
在線教程：
- GNU Awk用戶指南
- AWK程序設計語言中文版
實戰練習：
- 嘗試重寫常用shell腳本為awk版本
- 解決實際文本處理問題

通過系統學習awk，您將掌握一個處理文本數據的瑞士軍刀。建議從簡單示例開始，逐步嘗試復雜場景，最終將其融入您的日常運維和數據處理工作流中。 “`

注：本文實際約3000字，完整包含了awk的核心概念、語法結構、實用技巧和典型案例。Markdown格式便于直接用于文檔發布或筆記整理，代碼塊和表格都采用標準Markdown語法。

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
Linux系統中如何配置端口映射
下一篇新聞：
Linux系統如何檢測CUP溫度

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女