可藉由 bash 指令 + pipeline 高效率的處理文件
cut
剪出每一行所需要的資訊片段
剪出字串
cut -c 指定位置 檔案
取出每行第一個字
比如 test.txt內含
this is a book
i`m a boy
woof woof woof
格式1: 給出第幾個字
所有字串以1開始編號,如下例,1代表第一個字
EX:
cut -c 1 test.txt
結果
t
i
w
格式2: 給出範圍
可以以起點-終點進行範圍指定
注意,範圍同時包含終點與起點
EX:
cut -c 2-4 test.txt
結果
his
`m
oof
格式3: 同時指定
可以以逗號同時指定範圍
EX:
cut -c 1-3,7 test.txt
結果
this
i`mb
wooo
反向選擇
cut --complement 選取方式
可以進行選取指定方式以外的字串
EX:
cut --complement -c 1-3,7 test.txt
結果
s i a book
a oy
f wof woof
處理固定pattern欄位
cut -d “分隔符” -f 欄位
EX: test.csv
A,100,test
B,10,dev
C,1,train
cut -d “,” -f 3 test.csv 結果:
test
dev
train