IT

フィルタを使用してのテキスト処理【LPIC level1】

目次

  • テキストフィルタコマンド
  • catコマンド
  • nlコマンド
  • odコマンド
  • headコマンド
  • tailコマンド
  • cutコマンド
  • pasteコマンド
  • trコマンド
  • sortコマンド
  • splitコマンド
  • uniqコマンド
  • wcコマンド
  • xargsコマンド
  • ファイルのチェックサム

テキスト処理フィルタ

テキストフィルタコマンド

catコマンド

ファイルの内容を表示します。

正確には、ファイルの内容を楊淳出力します。

オプション説明
-n各行の左端に行番号を付加する。

nlコマンド

テキストの一部または全部に行番号を付けて表示します。

オプション説明
-b 形式指定した形式で本文に行番号を付加する。
-h 形式 指定した形式でヘッダに行番号を付加する。
-f 形式 指定した形式でフッタに行番号を付加する。
形式説明
aすべての行
t空白以外の行
n行番号の付加を中止

odコマンド

バイナリの内容を8進数や16進数で表示します。

オプション説明
-t 出力タイプ出力するフォーマットを指定します。
出力タイプ説明
cASCⅡ文字
o8進数(デフォルト)
x16進数

headコマンド

ファイルの先頭部分を表示します。

オプション説明
-n 行数先頭から指定された行数分だけ表示する(デフォルト10行)
-行数先頭から指定された行数分だけ表示する(非推奨)
-c バイト数出力するバイト数を指定する。

tailコマンド

ファイルの末尾部分を表示します。

オプション説明
-n 行数指定された行数分だけ表示します。(デフォルトは10行)
-行数指定された行数分だけ表示します。
-c バイト数末尾から指定されたバイト数だけ表示します。
-fファイルの末尾に追加された行を表示し続けます。

cutコマンド

ファイルの各行から指定されたフィールドを取り出します。

オプション説明
-c 文字列取り出す文字位置を指定します。
-d 区切り文字フィールドの区切り文字を指定する。(デフォルトはタブ)
-f フィールド取り出すフィールドを指定します。

pasteコマンド

一つ以上のファイルを読み込んで行ごとに水平方向に連結します。

trコマンド

標準出力から読み込まれた文字列を変換したり、削除したりします。

オプション説明
-d文字列1でマッチした文字列を削除します。
-s連続するパターン文字列を1文字として処理します。
クラス説明
[:alpha:]英字
[:lower:]英小文字
[:upper:]英大文字
[:digit:]数字
[:alnum:]英数字
[:space:]スペース

sortコマンド

行単位でファイルの内容をソートします。

オプション説明
-b行頭の空白は無視します。
-f大文字小文字の区別を無視します。
-r降順にソートします。
-n数字を文字ではなく数値として処理します。

splitコマンド

指定されたサイズでファイルを分割します。

デフォルトでは、1000行ごとに複数ファイルに分割します。

uniqコマンド

入力されたテキストストリームの中で重複している行を調べて、重複している行は1行にまとめて入力します。

オプション説明
-d重複している行のみ出力します。
-u重複していない行のみ出力します。

wcコマンド

ファイルの行数、単語数、文字数を表示します。

オプション説明
-c文字数を表示します。
-l行数を表示します。
-w単語数を表示します。

xargsコマンド

標準入力から受け取った文字列を引数に指定して、与えられたコマンドを実行します。

ファイルのチェックサム

ハッシュ関数を使うと、ファイルを一方向に暗号化し、一定の長さの文字列にすることが出来ます。

ハッシュ値は、ファイルサイズの大小にかかわらず同じ長さであり、元のファイルを少しでも変更すると全体が大きく変化します。

この性質により、ファイルのチェックサム、つまりファイルが改ざんされたり破損したりしていないかの確認に利用されます。

コマンド説明
md5sumMD5によるハッシュ値を出力します。
sha1sumSHA1によるハッシュ値を出力します。
sha256sumSHA256によるハッシュ値を出力します。
sha512sumSHA512によるハッシュ値を出力します。

最後まで読んで頂き、ありがとうございました。

他の分野へ移動できる全体ページへは下記リンクから移動できます。