linux文本處理

發布時間: 2023-06-13 06:25:35

Ⅰ linux必須學會的60個命令:文件處理1

Linux系統信息存放在文件里，文件與普通的公務文件類似。每個文件都有自己的褲悔名字、內容、存放地址及其它一些管理信息，如文件的用戶、文戚純姿件的大小等。文件可以是一封信、一個通訊錄，或者是程序的源語句、程序的數據，甚至可以包括可執行的程序和其它非正文內容。Linux文件系統具有良好的結構，系統提供了很多文件處理程序。這里主要介紹常用的文件處理命令。

file 1.作用file通過探測文件內容判斷文件類型，使用許可權是所有用戶。

2.格式file [options]文件名3.[options]主要參數-v：在標准輸出後顯示版本信息，並且退出。

-z：探測壓縮過的文件類型。

-L：允許符合連接。

-f name：從文件namefile中讀取要分析的文件名列表。

4.簡單說明使用file命令可以知道某個文件究竟是二進制（ELF格式）的可執行文件,還是Shell Script文件，或者是其它的什麼格式。file能識別的文件類型有目錄、Shell腳本、英文文本、二進制可執行文件、C語言源文件、文本文件、DOS的可執行文件。

5.應用實例如果我們看到一個沒有後綴的文件grap，可以使用下面命令：

$ file grap grap：English text 此時系統顯示這是一個英文文本文件。需要說明的是，file命令不能探測包括圖形、音頻、視頻等多媒體文件類型。

mkdir 1.作用mkdir命令的作用是建立名稱為dirname的子目錄，與MS DOS下的md命令類似，它的使用許可權是所有用戶。

2.格式mkdir [options]目錄名3.[options]主要參數－m,－－mode=模式：設定許可權<模式>，與chmod類似。

－p,－－parents：需要時創建上層目錄；如果目錄早已存在，則不當作錯誤。

－v,－－verbose：每次創建新目錄都顯示信息。

－－version：顯示版本信息後離開。

4.應用實例在進行目錄創建時可以設置目錄的許可權，此時使用的參數是「－m」。假設要創建的目錄名是「tsk」，讓所有用戶都有rwx(即讀、寫、執行的許可權)，那麼可以使用以下命令：

$ mkdir－m 777 tsk grep 1.作用grep命令可以指定文件中搜索特定的內容，並將含有這些內容的行標准輸出。grep全稱是Global Regular Expression Print，表示全局正則表達式版本，它的使用許可權是所有用戶。

2.格式grep [options] 3.主要參數[options]主要參數：

－c：只輸出匹配行的計數。

－I：不區分大小寫（只適用於單字元）。

－h：查詢多文件時不顯示文件名。

－l：查詢多文件時只輸出包含匹配字元的文件名。

－n：顯示匹配行及行號。

－s：不顯示不存在或無高絕匹配文本的錯誤信息。

－v：顯示不包含匹配文本的所有行。

pattern正則表達式主要參數：

：忽略正則表達式中特殊字元的原有含義。

^：匹配正則表達式的開始行。

$:匹配正則表達式的結束行。

<：從匹配正則表達式的行開始。

>：到匹配正則表達式的行結束。

[ ]：單個字元，如[A]即A符合要求。

[ - ]：范圍，如[A-Z]，即A、B、C一直到Z都符合要求。

。：所有的單個字元。

*：有字元，長度可以為0。

正則表達式是Linux/Unix系統中非常重要的概念。正則表達式（也稱為「regex」或「regexp」）是一個可以描述一類字元串的模式（Pattern）。如果一個字元串可以用某個正則表達式來描述，我們就說這個字元和該正則表達式匹配（Match）。這和DOS中用戶可以使用通配符「*」代表任意字元類似。在Linux系統上，正則表達式通常被用來查找文本的模式，以及對文本執行「搜索－替換」操作和其它功能。4.應用實例查詢DNS服務是日常工作之一，這意味著要維護覆蓋不同網路的大量IP地址。有時IP地址會超過2000個。如果要查看nnn.nnn網路地址，但是卻忘了第二部分中的其餘部分，只知到有兩個句點，例如nnn nn..。要抽取其中所有nnn.nnn IP地址，使用[0－9 ]{3 }.[0－0{3}。含義是任意數字出現3次，後跟句點，接著是任意數字出現3次，後跟句點。

$grep '[0－9 ]{3 }.[0－0{3}' ipfile 補充說明，grep家族還包括fgrep和egrep。fgrep是fix grep，允許查找字元串而不是一個模式；egrep是擴展grep，支持基本及擴展的正則表達式，但不支持q模式范圍的應用及與之相對應的一些更加規范的模式。

dd 1.作用dd命令用來復制文件，並根據參數將數據轉換和格式化。

2.格式dd [options] 3.[opitions]主要參數bs=位元組：強迫ibs=<位元組>及obs=<位元組>。

cbs=位元組：每次轉換指定的<位元組>。

conv=關鍵字：根據以逗號分隔的關鍵字表示的方式來轉換文件。

count=塊數目：只復制指定<塊數目>的輸入數據。

ibs=位元組：每次讀取指定的<位元組>。

if=文件：讀取<文件>內容，而非標准輸入的數據。

obs=位元組：每次寫入指定的<位元組>。

of=文件：將數據寫入<文件>，而不在標准輸出顯示。

seek=塊數目：先略過以obs為單位的指定<塊數目>的輸出數據。

skip=塊數目：先略過以ibs為單位的指定<塊數目>的輸入數據。

4.應用實例

dd命令常常用來製作Linux啟動盤。先找一個可引導內核，令它的根設備指向正確的根分區，然後使用dd命令將其寫入軟盤：

$ rdev vmlinuz /dev/hda $dd if＝vmlinuz of＝/dev/fd0

上面代碼說明，使用rdev命令將可引導內核vmlinuz中的根設備指向/dev/hda，請把「hda」換成自己的根分區，接下來用dd命令將該內核寫入軟盤。

find 1.作用find命令的作用是在目錄中搜索文件，它的使用許可權是所有用戶。

2.格式find [path][options][expression] path指定目錄路徑，系統從這里開始沿著目錄樹向下查找文件。它是一個路徑列表，相互用空格分離，如果不寫path，那麼默認為當前目錄。

3.主要參數[options]參數：

－depth：使用深度級別的查找過程方式，在某層指定目錄中優先查找文件內容。

－maxdepth levels：表示至多查找到開始目錄的第level層子目錄。level是一個非負數，如果level是0的話表示僅在當前目錄中查找。

－mindepth levels：表示至少查找到開始目錄的第level層子目錄。

－mount：不在其它文件系統（如Msdos、Vfat等）的目錄和文件中查找。

－version：列印版本。

[expression]是匹配表達式，是find命令接受的表達式，find命令的所有操作都是針對表達式的。它的參數非常多，這里只介紹一些常用的參數。

—name：支持統配符*和?。

－atime n：搜索在過去n天讀取過的文件。

－ctime n：搜索在過去n天修改過的文件。

－group grpoupname：搜索所有組為grpoupname的文件。

－user用戶名：搜索所有文件屬主為用戶名（ID或名稱）的文件。

－size n：搜索文件大小是n個block的文件。

－print：輸出搜索結果，並且列印。

4.應用技巧find命令查找文件的幾種方法：

（1）根據文件名查找例如，我們想要查找一個文件名是lilo.conf的文件，可以使用如下命令：

find /－name lilo.conf find命令後的「/」表示搜索整個硬碟。

（2）快速查找文件根據文件名查找文件會遇到一個實際問題，就是要花費相當長的一段時間，特別是大型Linux文件系統和大容量硬碟文件放在很深的子目錄中時。如果我們知道了這個文件存放在某個目錄中，那麼只要在這個目錄中往下尋找就能節省很多時間。比如smb.conf文件，從它的文件後綴「.conf」可以判斷這是一個配置文件，那麼它應該在/etc目錄內，此時可以使用下面命令：

find /etc－name smb.conf 這樣，使用「快速查找文件」方式可以縮短時間。

（3）根據部分文件名查找方法有時我們知道只某個文件包含有abvd這4個字，那麼要查找系統中所有包含有這4個字元的文件可以輸入下面命令：

find /－name '*abvd*'

輸入這個命令以後，Linux系統會將在/目錄中查找所有的包含有abvd這4個字元的文件（其中*是通配符），比如abvdrmyz等符合條件的文件都能顯示出來。

(4)使用混合查找方式查找文件

find命令可以使用混合查找的方法，例如，我們想在/etc目錄中查找大於500000位元組，並且在24小時內修改的某個文件，則可以使用-and (與)把兩個查找參數鏈接起來組合成一個混合的查找方式。

find /etc -size +500000c -and -mtime +1

mv 1.作用mv命令用來為文件或目錄改名，或者將文件由一個目錄移入另一個目錄中，它的使用許可權是所有用戶。該命令如同DOS命令中的ren和move的組合。

2.格式mv[options]源文件或目錄目標文件或目錄3.[options]主要參數－i：交互方式操作。如果mv操作將導致對已存在的目標文件的覆蓋，此時系統詢問是否重寫，要求用戶回答「y」或「n」，這樣可以避免誤覆蓋文件。

－f：禁止交互操作。mv操作要覆蓋某個已有的目標文件時不給任何指示，指定此參數後i參數將不再起作用。

4.應用實例（1）將/usr/cbu中的所有文件移到當前目錄（用「.」表示）中：

$ mv /usr/cbu/ * . （2）將文件cjh.txt重命名為wjz.txt：

$ mv cjh.txt wjz.txtls 1.作用ls命令用於顯示目錄內容，類似DOS下的dir命令，它的使用許可權是所有用戶。

2.格式ls [options][filename] 3.options主要參數－a,－－all：不隱藏任何以「.」字元開始的項目。

－A,－－almost－all：列出除了「.」及「..」以外的任何項目。

－b,－－escape：以八進制溢出序列表示不可列印的字元。

－－block－size=大小：塊以指定<大小>的位元組為單位。－B,－－ignore－backups：不列出任何以~字元結束的項目。

－f：不進行排序，－aU參數生效，－lst參數失效。

－F,－－classify：加上文件類型的指示符號(*/=@|其中一個)。

－g：like－l, but do not list owner。

－G,－－no－group：inhibit display of group information。

－i,－－inode：列出每個文件的inode號。

－I,－－ignore=樣式：不印出任何符合Shell萬用字元<樣式>的項目。

－k：即－－block－size=1K。

－l：使用較長格式列出信息。

－L,－－dereference：當顯示符號鏈接的文件信息時，顯示符號鏈接所指示的對象，而並非符號鏈接本身的信息。

－m：所有項目以逗號分隔，並填滿整行行寬。

－n,－－numeric－uid－gid：類似－l，但列出UID及GID號。

－N,－－literal：列出未經處理的項目名稱，例如不特別處理控制字元。

－p,－－file－type：加上文件類型的指示符號(/=@|其中一個)。

－Q,－－quote－name：將項目名稱括上雙引號。

－r,－－reverse：依相反次序排列。

－R,－－recursive：同時列出所有子目錄層。

－s,－－size：以塊大小為序。

diff 1.作用diff命令用於兩個文件之間的比較，並指出兩者的不同，它的使用許可權是所有用戶。

Ⅱ Linux使用之grep，shell腳本（一）

在使用Linux的過程中，場景有時候便會涉及到查找文本文件的內容，假如現在我們想要在一個三百多行的文本中找到特定的語句，或者在這其中查找是否含有特定的欄位應該怎麼辦呢？
這里便出現了專門的文本處理工具——grep，grep是Linux中常用的文本處理工具之一。
grep的全稱為「 Global search Regular Expression and Print out the line」。
全稱中的「Glibal search」意思為全局搜索的意思。
全稱中的「Regular Expression」意思為正則表達式。
所以從全稱中就可以理解為gerp是一個可以利用正則表達式的全型激局搜索工具。grep會按照正則表達式的匹配原則在文本文件中按照逐行匹配處理的方法來處理文本並輸出。
來看看grep的用法。

來看看案例。
案例1.統計出/etc/passwd文件中其默認shell為非/sbin/nologin的用戶個數，並將用戶都顯示出來

上面的案例開始匹配了/sbin/nologin關鍵詞，但是案例中只需要除了它之外的shell，所以講它使用-v選項排除開就可以了。

案例2.查出用戶UID最大值的用戶卜森襪名、UID及shell類型

案例3.統計當前連接本機的每個遠程主機IP的連接數，並按從大到小排序

上面的案例中ss -nt 查看連接情況，然春頌後將EATAB狀態的過濾出來，在進行處理，最後提取出結果並完成排序。

案例4：編寫腳本disk.sh，顯示當前硬碟分區中空間利用率最大的值

案例5.編寫腳本 systeminfo.sh，顯示當前主機系統信息，包括:主機名，IPv4地址，操作系統版本，內核版本，CPU型號，內存大小，硬碟大小

Ⅲ Linux sed 命令詳解

sed命令行格式：sed [options] 'command' file(s)
options常用選項：
-n或--quiet或——silent：僅顯示script處理後的結果;
-e：以選項中的指定的script來處理輸入的文本文件;
-f：以選項中指定的script文件來處理輸入的文本文件;
-r∶sed 的動作支援的是延伸型正規表示法的語法;
-i∶直接修改讀取的檔案內容，而不是由螢幕輸出;
-h或--help：顯示幫助;
-V或--version：顯示版本信息。
Command常用命令：
a：新增，a 的後面可以接字元串，而這些字元串會在新的一行出現(目前的下一行);
c：取代，c 的後面可以接字元串，這些字元串可以取代 n1,n2 之間的行;
d：刪除，d 後面通常不接任何字元串;
i：插入，i 的後面可以接字元串，而這些字元串會在新的一行出現(目前的上一行);
p：列印，亦即將某個選擇的資料印出。通常 p 會與參數 sed -n 一起運作;
s：取代，可以直接進行取代的工作，通常與正規表達式搭配使用。
實例說明：
新增操作：a命令
sed '/^bird/a\test' file將test追加到以bird開頭的行後面
刪除操作：d命令
sed '/^$/d' file #刪除空白行;
sed '2d' file #刪除第二行;
sed '2,$d' file #刪除第2行到最後一行;
sed '$d' file #刪除最後一行;
sed '/^bird/'d file #刪除所有開頭是bird的行;
插入操作：i命令
sed -i '3i\bird ' bird.conf #在bird.conf文件第3行之前插入bird
替換文本中的字元串：s命令
sed 's/bird/birds/' file #將文本中的bird替換成birds;
sed -i 's/ bird / birds /g' file #將file文件中每一行的第一個bird替換為birds;

Ⅳ Linux環境下文本處理，提取需要的內容

用awk可山陪前以實現逗清你的需求，示亂蔽例如圖：

Ⅳ Linux下Grep命令的詳細使用方法

在linux中grep命令是非常有用的,它和管道(|)配合使用,非常強大,用於搜索文本文件.如果想要在幾個文本文件中查找一字元串，可以使用『grep』命令。『grep』在文本中搜索指定的字元串。
假設您正在『/usr/src/linux/Documentation』目錄下搜索帶字元串『magic』的文件：

$ grep magic /usr/src/linux/Documentation/*
sysrq.txt:* How do I enable the magic SysRQ key?
sysrq.txt:* How do I use the magic SysRQ key?

其中文件『sysrp.txt』包含該字元串，討論的是 SysRQ 的功能。

默認情況下，『grep』只搜索當前目錄。如果此目錄下有許多子目錄，『grep』會以如下形式列出：

grep: sound: Is a directory

這可能會使『grep』的輸出難於閱讀。這里有兩種解決的辦法：

明確要求搜索子目錄：grep -r
或忽略子目錄：grep -d skip
當然，如果預料到有許多輸出，您可以通過管道將其轉到『less』上閱讀：

$ grep magic /usr/指汪src/linux/Documentation/* | less

這樣，您就可以更方便地閱讀。

有一點要注意，您必需提供一個文件過濾方式（搜索全部文件的話用 *）。如果您忘了，『grep』會一直等著，直到該程序被中斷。如果您遇到了這樣的情況，按，然後再試。

下面是一些有意思的命令行參數：

grep -i pattern files ：不區分大小寫地搜索。默認情況區分大小寫，
grep -l pattern files ：只列出匹配的文件名，
grep -L pattern files ：列出不匹配的文件名，
grep -w pattern files ：只匹配整個單詞，而不是字元串的一部分（如匹配『magic』，而不是『magical』），
grep -C number pattern files ：匹配的上下文分別顯示[number]行，
grep pattern1 | pattern2 files ：顯示匹配 pattern1 或 pattern2 的行，
grep pattern1 files | grep pattern2 ：顯示既匹配 pattern1 又匹配 pattern2 的行。
這里還有些用於搜索的特殊符號：

\< 和 \> 分別標注單詞的開始與結尾。
例如：
grep man * 會匹配『Batman』、『manic』、『man』等，
grep '\grep '\' 只匹配『man』，而不是『Batman』或『manic』等其他的字元串。源攜
'^'：指匹配的字元串在行首，
'$'：指匹配的字元串在行尾，
如果您不習慣命令行參數，可以試試圖形界雹逗伏面的『grep』，如 reXgrep 。這個軟體提供 AND、OR、NOT 等語法，還有漂亮的按鈕 :-) 。如果您只是需要更清楚的輸出，不妨試試 fungrep 。

Ⅵ linux之文本內容替換命令sed

sed簡介：流編輯工具，用來對文本進行過濾與替換操作。

sed流程：sed通過一次僅讀取一行內容來對某些指令進行處理後輸出。

1、sed通過文件或管道讀取文件內容，但sed默認並不直接修改源文件，而是將讀入的內容復制到緩沖區中，稱之為模式空間。
2、所有的指令操作都是在模式空間找那個進行
3、sed根據相應的指令對模式空間中的內容進行處理並輸出結果，默認輸出至標准輸出（即屏幕上）。

sed基本語法格式：
用法：sed[選項]...{腳本指令}[輸入文件]...
選項： -version 顯示sed版本
-help ：顯示幫助文檔
-n,-quiet,-silent靜默輸出，默認情況下，sed程序在所有的腳本指令執行完畢後，將自動列印模式空間中的內容。
-e script允許多個腳本指令被執行
-f script-file從文件中讀取腳本指令，對編寫自動化腳本程序很實用
-i ,-in-place 該選項直接修改源文件
-l N 該選項指定l指令可以輸出的行長度，l指令為輸出非列印字元。
-posix 禁用GNU sed擴展功能。
-r 在腳本指令中使用擴展正則表達式。
-s，-separate 默認情況下，sed將把輸入的多個文件名作為一個長的連續的輸入流。而GNU sed則允許把它們當作單獨的文件。
-u，-unbuffered 最低限度的緩存輸入與輸出
a，append表示追加指令；
i，insert表示插入指令；
d，delete表示刪除指令；
s，substitution表示替換指令。
sed腳本指令的基本格式是：
[地址,即路徑]命令（有些命令僅可以對一行操作，有些可以對多行操作），命令也可以用花括弧進行組合，使命令序列可以作用於同一個地址。
address{
command1
command2
command3
}

sed的基本工作方式是：

sed的替換命令s：

1、全局替換： s/old/new/g ，其中g為全局替換，用於替換所有出現的次數； /如果和正則匹配的內容沖突可以使用其他符號，如： s@old@new@g
2、標志位

為什麼要有多行模式: 配置文件一般有單行出現，但也有使用json或XML格式的配置文件，為多行出現。
多行模式處理命令N、D、P

Ⅶ Linux下常用文本處理命令

Linux下常用文本處理命令大全

Linux下面有很多經典的非常有用的命令，其中處理文本的命令就有很多。下面就讓我們一起看看這些經典的Linux文本處理命令有哪些吧。

一. sort

文件排序, 通常用在管道中當過濾器來使用. 這個命令可以依據指定的關鍵字或指定的字元位置, 對文件行進行排序. 使用-m選項, 它將會合並預排序的輸入文件. 想了解這個命令的全部參數請參考這個命令的info頁.

二. tsort

拓撲排序, 讀取以空格分隔的有序對, 並且依靠輸入模式進行排序.

三. uniq

這個過濾器將會刪除一個已排序文件中的重復行. 這個命令經常出現在sort命令的管道後邊.

四. expand, unexpand

expand命令將會把每個tab轉化為一個空格. 這個命令經常用在管道中.

unexpand命令將會把每個空格轉化為一個tab. 效果與expand命令相反.

五. cut

一個從文件中提取特定域的工具. 這個命令與awk中使用的print $N命令很相似, 但是更受限. 在腳本中使用cut命令會比使用awk命令來得容易一些. 最重要的選項就是-d(欄位定界符)和-f(域分隔符)選項.

六. paste

將多個文件, 以每個文件一列的形式合並到一個文件中, 合並後文件中的每一列就是原來的一個文件. 與cut結合使用, 經常用於創建系統log文件.

七. join

這個命令與paste命令屬於同類命令. 但是它能夠完成某些特殊的目地. 這個強力工具能夠以一種特殊的形式來合並兩個文件, 這種特殊的形式本質上就是一個關聯資料庫的簡單版本.

join命令只能夠操作兩個文件. 它可以將那些具有特定標記域(通常是一個數字標簽)的行合並起來, 並且將結果輸出到stdout. 被加入的文件應該事先根據標記域進行排序以便於能夠正確的匹配.

八. head

把文件的頭部內容列印到stdout上(默認為10行, 可以自己修改). 這個命令有一些比較有趣的選項.

九. tail

將一個文件結尾部分的內容輸出到stdout中(默認為10行). 通常用來跟蹤一個系統logfile的.修改情況, 如果使用-f選項的話, 這個命令將會繼續顯示添加到文件中的行.

十. wc

wc可以統計文件或I/O流中的”單詞數量”:

十一. fold

將輸入按照指定寬度進行折行. 這里有一個非常有用的選項-s, 這個選項可以使用空格進行斷行(譯者: 事實上只有外文才需要使用空格斷行, 中文是不需要的)(請參考例子 12-23和例子 A-1).

十二. fmt

一個簡單的文件格式器, 通常用在管道中, 將一個比較長的文本行輸出進行”折行”.

十三. col

這個命令用來濾除標准輸入的反向換行符號. 這個工具還可以將空白用等價的tab來替換. col工具最主要的應用還是從特定的文本處理工具中過濾輸出, 比如groff和tbl. (譯者: 主要用來將man頁轉化為文本.)

十四. column

列格式化工具. 通過在合適的位置插入tab, 這個過濾工具會將列類型的文本轉化為”易於列印”的表格式進行輸出.

十五. colrm

列刪除過濾器. 這個工具將會從文件中刪除指定的列(列中的字元串)並且寫到文件中, 如果指定的列不存在, 那麼就回到stdout. colrm 2 4 <filename將會刪除filename文件中每行的第2到第4列之間的所有字元. p=""> </filename將會刪除filename文件中每行的第2到第4列之間的所有字元.>

Caution: 如果這個文件包含tab和不可列印字元, 那將會引起不可預期的行為. 在這種情況下, 應該通過管道的手段使用expand和unexpand來預處理colrm.

十六. nl

計算行號過濾器. nl filename將會把filename文件的所有內容都輸出到stdout上, 但是會在每個非空行的前面加上連續的行號. 如果沒有filename參數, 那麼就操作stdin.

nl命令的輸出與cat -n非常相似, 然而, 默認情況下nl不會列出空行.

十七. pr

格式化列印過濾器. 這個命令會將文件(或stdout)分頁, 將它們分成合適的小塊以便於硬拷貝列印或者在屏幕上瀏覽. 使用這個命令的不同的參數可以完成好多任務, 比如對行和列的操作, 加入行, 設置頁邊, 計算行號, 添加頁眉, 合並文件等等. pr命令集合了許多命令的功能, 比如nl, paste, fold, column, 和expand.

pr -o 5 –width=65 fileZZZ | more 這個命令對fileZZZ進行了比較好的分頁, 並且列印到屏幕上. 文件的縮進被設置為5, 總寬度設置為65.

一個非常有用的選項-d, 強制隔行列印(與sed -G效果相同).

十八. gettext

GNU gettext包是專門用來將程序的輸出翻譯或者本地化為不同國家語言的工具集. 在最開始的時候僅僅支持C語言, 現在已經支持了相當數量的其它程序語言和腳本語言.

想要查看gettext程序如何在shell腳本中使用. 請參考info頁.

十九. msgfmt

一個產生二進制消息目錄的程序. 這個命令主要用來本地化.

二十. iconv

一個可以將文件轉化為不同編碼格式(字元集)的工具. 這個命令主要用來本地化.

二十一. recode

可以認為這個命令是上邊iconv命令的專業版本. 這個非常靈活的並可以把整個文件都轉換為不同編碼格式的工具並不是Linux標准安裝的一部分.

二十二. TeX, gs

TeX和Postscript都是文本標記語言, 用來對列印和格式化的視頻顯示進行預拷貝.

TeX是Donald Knuth精心製作的排版系統. 通常情況下, 通過編寫腳本的手段來把所有的選項和參數封裝起來一起傳到標記語言中是一件很方便的事情.

Ⅷ Linux4-文本處理三駕馬車：grep, sed, awk

Linux基礎課程系列：

grep：一種強大的文本搜索工具，它能使用正則表達式匹配模式搜索文本，並把匹配的行列印出來
格式： grep [options] pattern file ([]內的部分可以省略)

sed：流編輯器，一般用來對文本進行 增刪改查 （sed是以行為單位來處理的）。
用法： sed [-options] 'script' file(s)

[!] 表示否定，取反（相當於grep -v）

awk是一個強大的文本分析工具，相對於grep的查找，sed的編輯，awk在其 對數據分析並生成報告 時，顯得尤為強大。簡單來說awk就是把文件逐行的讀入，以空格為默認分隔符將每行切片，切開的部分再進行各種分析處理。awk有3個不同版本: awk、nawk和gawk，未作特別說明，一般指gawk。gawk 是 AWK 的 GNU 版本。
用法： awk [options] '{script}' file 。

基礎結構: ' {script} '
匹配結構: ' /pattern/{script} '
擴展結構: 'BEGIN{script} {script} END{script}'

awk 在讀取一行文本時，會用預定義的欄位分隔符劃分每個數據欄位，並分配給一個變數。
$0 代表整個文本行；
$1 代表文本行中的第1個數據欄位；
……
$NF 代表文本行中的最後一個數據欄位
awk 默認的欄位分隔符是任意空白字元（如：空格or 製表符），也可以用-F 參數自定義分隔符

閱讀全文

熱點內容

androidshell腳本發布：2025-04-03 18:09:24 瀏覽：562

跳傘需要什麼配置發布：2025-04-03 18:00:13 瀏覽：207

什麼配置性能好發布：2025-04-03 17:52:48 瀏覽：745

什麼安卓區平板性價比高發布：2025-04-03 17:46:38 瀏覽：258

三星如何取消指紋解鎖密碼發布：2025-04-03 17:22:03 瀏覽：898

阿里雲伺服器和自己電腦發布：2025-04-03 17:21:01 瀏覽：169

銹湖安卓在哪裡下載發布：2025-04-03 17:14:34 瀏覽：981

Java項目案例分析發布：2025-04-03 17:01:33 瀏覽：270

sql導入導出資料庫發布：2025-04-03 16:48:18 瀏覽：781

微信平台資料庫發布：2025-04-03 16:46:28 瀏覽：887

linux文本處理

與linux文本處理相關的資訊