當前位置:首頁 » 操作系統 » linux命令sort

linux命令sort

發布時間: 2023-08-07 13:11:04

『壹』 每天一個linux命令(1)sort

sort 是將文件的每一行作為一個單位,相互比較,比較原則是從首字元向後,依次按照ASCII碼值進行比較,默認將他們按照升序輸出

降序

在輸出中去重

將排序結果輸出到原文件
sort的默認輸出是輸出到標准輸出,如果想把結果輸出到文件,需要 sort file > newfile,但是如果想把結果輸出到原文件這樣就不行了,這時就需要 使用sort -o

以數值來排序
sort 默認是按照字元串排序的,這樣就會出現10比3小的情況,sort -n 就可以告訴sort 以整數排序

-t 後面跟 分隔符
-k 後面跟數字,表示用第幾列排序
如 sort -t : -k 2 表示把每行 以:號分割,按照第二列排序

banana:30:5.5
orange:20:3.4
apple:10:2.5

我們可以看到,當 和soho都是100的時候,排在前面,當當前域按照默認規矩,是從第一個域開始進行升序排序,因此排在了sohu前面。

sort 支持 -k 2 -k3這種模式,如果你需要,你可以繼續這么寫下去

你仔細看看,在-k 3後面偷偷加上了一個小寫字母r,r和-r的作用是一樣,你也可以把前面的-n去掉 在r後面加上n,如下

其實-k 選項 功能很強大,語法[ FStart [ .CStart ] ] [ Modifier ] [ , [ FEnd [ .CEnd ] ][ Modifier ] ]
從逗號前後 分為兩大部分,即-k 2,2,是嚴格使用第一個域排序,如果只設置-k 2 其實是按照從第一個域到行尾。逗號分開的每部分又有一個點表示子域,即-k 1.2表示 按照第一個域的第二個字元排序,Modifiers就是我們用到的n和r 如 -k 1.2nr 具體我們看下面的例子。

我們使用了-k 1.2,這就表示對第一個域的第二個字元開始到本域的最後一個字元為止的字元串進行排序。你會發現因為第二個字母是a而名列榜首。sohu和 google第二個字元都是o,但sohu的h在google的o前面,所以兩者分別排在第二和第三。這和之前說到的按照默認的排序規則 是不同的,當第一個域的第二個字元相同時,他不會去按照第一個字元排序,而是按照後面的字元排序,這是因為-k 1.2是對第一個域的第二個字元開始到本域的最後一個字元為止的字元串進行排序。而之前的誇域其實是一種假象。

-u只識別用-k設定的域,發現相同,就將後續相同的行都刪除

但是這時候,卻一行也沒有刪除。原來-u是會權衡所有-k選項,將都相同的才會刪除,只要其中有一級不同都不會輕易刪除的

可以用到b、d、f、i、n 或 r。

其中n和r你肯定已經很熟悉了。

b表示忽略本域的簽到空白符號。

d表示對本域按照字典順序排序(即,只考慮空白和字母)。

f表示對本域忽略大小寫進行排序。

i表示忽略「不可列印字元」,只針對可列印字元進行排序。(有些ASCII就是不可列印字元,比如\a是報警,\b是退格,\n是換行,\r是回車等等)

『貳』 linux sort命令參數及用法詳解

Linux sort命令用於將文本文件內容加以排序,sort可針對文本文件的內容,以行為單位來排序。
sort命令的語法格式:sort[參數][文件]
Linux sort命令參數:
-b:忽略每行前面開始出的空格符號。
-c:檢查文件是否已經按照順序排序。
-d:排序時,處理英文字母、數字及空格字元外,忽略其他的字元。
-f:排序時,將小寫字母視為大寫字母。
-i:排序時,除了040至176之間的ASCII字元外,忽略其他的字元。
-m:將幾個排序好的文件進行合並。
-M:將前面三個字母依照月份的縮寫進行排序。
-n:依照數值的大小排序。
-u:意味著是唯一的,輸出的結果是去完重了的。
-o:<輸出文件>將排序後的結果存入指定的文件。
-r:以相反的順序來排序。
-t:<分隔字元>指定排序時所用的欄位分隔字元。

『叄』 Linux裡面sort -M file3命令作用是什麼

sort的-M是將前面3個字母依照月份的縮寫進行排序,但是用的很少。

sort常用參數:

-n 依照數值的大小排序。

-u 意味著是唯一的(unique),輸出的結果是去完重了的。

-r 以相反的順序來排序。

-t<分隔字元> 指定排序時所用的欄位分隔字元。

sort企業案例見連接

網頁鏈接

『肆』 Linux文本處理命令的Sort命令

sort命令的功能是對文件中的各行進行排序。sort命令有許多非常實用的選項,這些選項最初是用來對資料庫格式的文件內容進行各種排序操作的。實際上,sort命令可以被認為是一個非常強大的數據管理工具,用來管理內容類似資料庫記錄的文件。
Sort命令將逐行對文件中的內容進行排序,如果兩行的首字元相同,該命令將繼續比較這兩行的下一字元,如果還相同,將繼續進行比較。
語法:
sort [選項] 文件
說明:sort命令對指定文件中所有的行進行排序,並將結果顯示在標准輸出上。如不指定輸入文件或使用「- 」,則表示排序內容來自標准輸入。
sort排序是根據從輸入行抽取的一個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字元序列。預設情況下以整行為關鍵字按ASCII字元順序進行排序。
改變預設設置的選項主要有:
- m 若給定文件已排好序,合並文件。
- c 檢查給定文件是否已排好序,如果它們沒有都排好序,則列印一個出錯信息,並以狀態值1退出。
- u 對排序後認為相同的行只留其中一行。
- o 輸出文件 將排序輸出寫到輸出文件中而不是標准輸出,如果輸出文件是輸入文件之一,sort先將該文件的內容寫入一個臨時文件,然後再排序和寫輸出結果。
改變預設排序規則的選項主要有:
- d 按字典順序排序,比較時僅字母、數字、空格和製表符有意義。
- f 將小寫字母與大寫字母同等對待。
- I 忽略非列印字元。
- M 作為月份比較:「JAN」<「FEB」 p>
- r 按逆序輸出排序結果。
+posl - pos2 指定一個或幾個欄位作為排序關鍵字,欄位位置從posl開始,到pos2為止(包括posl,不包括pos2)。如不指定pos2,則關鍵字為從posl到行尾。欄位和字元的位置從0開始。
- b 在每行中尋找排序關鍵字時忽略前導的空白(空格和製表符)。
- t separator 指定字元separator作為欄位分隔符。
下面通過幾個例子來講述sort的使用。
用sort命令對text文件中各行排序後輸出其結果。請注意,在原文件的第二、三行上的第一個單詞完全相同,該命令將從它們的第二個單詞vegetables與fruit的首字元處繼續進行比較。
$ cat text
vegetable soup
fresh vegetables
fresh fruit
lowfat milk
$ sort text
fresh fruit
fresh vegetables
lowfat milk
vegetable soup
用戶可以保存排序後的文件內容,或把排序後的文件內容輸出至列印機。下例中用戶把排序後的文件內容保存到名為result的文件中。
$ sort text>result
以第2個欄位作為排序關鍵字對文件example的內容進行排序。
$ sort +1-2 example
對於file1和file2文件內容反向排序,結果放在outfile中,利用第2個欄位的第一個字元作為排序關鍵字。
$ sort -r -o outfile +1.0 -1.1 example
sort排序常用於在管道中與其他命令連用,組合完成比較復雜的功能,如利用管道將當前工作目錄中的文件送給sort進行排序,排序關鍵字是第6個至第8個欄位。
$ ls - l | sort +5 - 7
sort命令也可以對標准輸入進行操作。例如,如果您想把幾個文件文本行合並,並對合並後的文本行進行排序,您可以首先用命令cat把多個文件合並,然後用管道操作把合並後的文本行輸入給命令sort,sort命令將輸出這些合並及排序後的文本行。在下面的例子中,文件veglist與文件fruitlist的文本行經過合並與排序後被保存到文件clist中。
$ cat veglist fruitlist | sort > clist

『伍』 linux sort 命令整理

無論是工作中使用還是應付各種面試,linux sort 都是必須要掌握的 linux 基本命令之一。尤其是 linux sort -k 命令,經常會被搞暈,索性好好研究一下 sort 命令

語法:

選項:

參數就不一一介紹了,直接上例子,首先先看下原始的排序數據
cat sort.log

1、列印從哪列開始是亂序
sort -c sort.log; echo $?

sort -C sort.log; echo $?

其中,返回結果 1,表示文件不是已經排序好的文件
2、默認排序( 整行進行ASCII字元升序)
sort sort.log

3、高能來了,讓人迷糊的 k 語法,首先看下 k 的語法格式

這個語法格式可以被其中的逗號(」,」)分為兩大部分,Start部分和End部分
Start和End部分都由三部分組成,其中的Modifier部分就是類似n和r的選項部分,可省略
FStart、Fend,表示使用的域,而CStart則表示在FStart域中從第幾個字元開始算"排序首字元",同理,CEnd表示結尾的第幾個字元是排序末尾字元,.CStart、.CEnd是可以省略的,分別表示從本域的開頭部分開始、到本域的域尾結束,CEnd設定為0,也是表示結尾到域尾。口說無憑,上幾個例子吧

3.1 對第三列進行排序,如果不加n,按照 ASCII字元排序
sort -t $' ' -k 3 sort.log

3.2 加n後,按照數值排序
sort -t $' ' -k 3n sort.log

3.3 不指定 FEnd 時,多個 -k 從前往後排序可以,從後往前不行
從後往前,多個 -k,數據符合預期
sort -t $' ' -k 3n -k 1 sort.log

從後往前,多個 -k ,第三列相同時,按照第一列降序排列,數據符合預期
sort -t $' ' -k 3n -k 1r sort.log

更換成從前往後
sort -t $' ' -k 1 -k 3n sort.log

sort -t $' ' -k 1 -k 3nr sort.log

通過 sort -t $' ' -k 1 -k 3n sort.log 和 sort -t $' ' -k 1 -k 3nr sort.log 返回的結果發現,在第一列相等時,無論其三列是正序排列,還是逆序排列,結果都一樣,說明後邊的 -k 未生效
當指定 FEend 後
sort -t $' ' -k 1,1 -k 3nr sort.log

3.4 作用域
緊跟在欄位後的選項(如"-k3n"的"n"和"-k2nr"的"n","r")稱為私有選項,使用短橫線寫在欄位外的選項(如"-n"、"-r")為全局選項。當沒有為欄位分配私有選項時,該排序欄位將繼承全局選項,所有選項包括但不限於"bfnrhM"
除了"b"選項外,其餘選項無論是指定在FStart還是FEnd中都是等價的,對於"b"選項,指定在FStart則作用於FStart,指定在FEnd則作用於FEnd
sort -t $' ' -k1r,2 sort.log ,可以看出一、二列都是倒敘排列

3.5 注意
指定n選項按數值排序時, 由於"n"選項只能識別數字和負號"-",當排序時遇到無法識別字元時,將導致該key的排序立即結束,n選項絕對不會跨域進行比較
默認情況下,sort會進行一次 "最後的排序" ,按照默認規則對整行進行一次排序,這次排序稱為"最後的排序"

sort -t $' ' -k3n sort.log ,在第三列相等時,整行會按照 ASCII 進行最後的升序排列

sort -t $' ' -k3,4n -s sort.log ,加了 -s 後,不會進行最後的排序(1000相同時,e在b的前邊了),而是保留原排序

3.6 按照某個域中的第n個字元進行排序
sort -t $' ' -k2.3,2.3 sort.log ,按第二列第三個字元進行排序

4、 -h 使用易讀性數字(例如:2K、1G)
sort -t $' ' -k5h sort.log

sort -t $' ' -k2,2 sort.log|uniq

sort -t $' ' -k2,2 -u sort.log 會對第二列進行去重,而 sort -t $' ' -k2,2 sort.log|uniq 會對整行進行去重(當然uniq也可以按照第二列進行去重)

sort整理完了,歡迎大牛指教

熱點內容
qq啟動腳本 發布:2025-03-12 19:59:00 瀏覽:893
電腦配置有ssd是什麼意思 發布:2025-03-12 19:57:50 瀏覽:730
米思齊編譯失敗怎麼看 發布:2025-03-12 19:26:27 瀏覽:848
sql語句notexists 發布:2025-03-12 19:16:11 瀏覽:60
快手安卓版如何玩 發布:2025-03-12 19:15:26 瀏覽:36
scott資料庫 發布:2025-03-12 19:15:19 瀏覽:873
rom伺服器是什麼 發布:2025-03-12 19:10:27 瀏覽:62
我給你改個密碼叫什麼 發布:2025-03-12 19:09:32 瀏覽:674
寬頻密碼在手機上如何更改 發布:2025-03-12 19:07:52 瀏覽:116
python離線安裝pip 發布:2025-03-12 19:06:18 瀏覽:29