Skip to content

cut處理文件

可藉由 bash 指令 + pipeline 高效率的處理文件

cut

剪出每一行所需要的資訊片段

剪出字串

cut -c 指定位置 檔案
取出每行第一個字
比如 test.txt內含

this is a book  
i`m a boy  

woof woof woof  

格式1: 給出第幾個字

所有字串以1開始編號,如下例,1代表第一個字

EX:
cut -c 1 test.txt
結果

t
i

w

格式2: 給出範圍

可以以起點-終點進行範圍指定
注意,範圍同時包含終點與起點

EX:
cut -c 2-4 test.txt
結果

his  
`m   
  
oof  

格式3: 同時指定

可以以逗號同時指定範圍

EX: cut -c 1-3,7 test.txt
結果

this    
i`mb    
wooo   

反向選擇

cut --complement 選取方式
可以進行選取指定方式以外的字串

EX:
cut --complement -c 1-3,7 test.txt
結果

s i a book
 a oy   

f wof woof

處理固定pattern欄位

cut -d “分隔符” -f 欄位

EX: test.csv

A,100,test
B,10,dev
C,1,train

cut -d “,” -f 3 test.csv 結果:

test
dev
train