在Linux中,去重命令通常是有效的
uniq
命令:uniq
命令用于從輸入中刪除或報告相鄰的重復行。它通常與sort
命令一起使用,以便首先對輸入進行排序,然后刪除重復的行。例如:sort input_file.txt | uniq > output_file.txt
這將創建一個新文件,其中包含排序后的唯一行。
awk
命令:awk
是一種強大的文本處理工具,可用于刪除重復行。例如,以下命令將僅輸出不重復的行:awk '!seen[$0]++' input_file.txt > output_file.txt
這將創建一個新文件,其中包含不重復的行。
grep
命令:grep
命令可用于過濾文件中的行。要刪除重復行,可以使用正則表達式匹配所有行,然后使用-v
選項僅輸出不匹配的行。例如:grep -vx '' input_file.txt > output_file.txt
這將創建一個新文件,其中包含不重復的行。
請注意,這些命令在處理大型文件時可能會消耗大量內存和CPU資源。在這種情況下,您可以考慮使用其他工具,如sort
和uniq
的替代品awk
,或者使用編程語言(如Python、Perl或Go)編寫自定義腳本。