正規式


 任意の文字

ドット(.)は任意の文字を表す。

 

 行のはじめ語を探索

^(Caret)は行のはじめの語を探索するとき使う。

(例)
 ^Theは行のはじめがTheである行を探索する。

 

 行の終わりの語を探索

$は行の最後の語を探索するとき使う。

(例)
 .cpp$は行の最後が.cpp(C++の拡張子)である行を探索する。

 

 文字選択

[ ]はその中に含まれる文字を含む語を探索する。

(例)
 [tT]heはtheまたはTheを探索する。
 [a-z]は英小文字を探索する。
 [A-Z,0-9]は英大文字または数字を探索する。

 

 0または1個以上の文字

*は0個以上の文字を探索する。

(例)
 X*は0,1,2,3・・・個(つまり、''、X, XX, XXX, ・・・)の'X'を探索する。

+は1個以上の文字を探索する。

(例)
 X+は1,2,3・・・個(つまり、X, XX, XXX, ・・・)の'X'を探索する。

 

 正確な文字数とのマッチング

\{min,max\}を使用すると連続した文字の個数を指定できる。

(例)
 X\{1,10\}は1個以上10個以下のXとのマッチングを探索する。

 

マッチングした文字数の保持

\(・・・\)はカッコ内でマッチングした文字をレジスタ(1〜9)に格納する。

(例)
  ^\(.\)は行の最初の文字をレジスタ1に格納する。