正規式
任意の文字
ドット(.)は任意の文字を表す。
行のはじめ語を探索
^(Caret)は行のはじめの語を探索するとき使う。
(例)
^Theは行のはじめがTheである行を探索する。
行の終わりの語を探索
$は行の最後の語を探索するとき使う。
(例)
.cpp$は行の最後が.cpp(C++の拡張子)である行を探索する。
文字選択
[ ]はその中に含まれる文字を含む語を探索する。
(例)
[tT]heはtheまたはTheを探索する。
[a-z]は英小文字を探索する。
[A-Z,0-9]は英大文字または数字を探索する。
0または1個以上の文字
*は0個以上の文字を探索する。
(例)
X*は0,1,2,3・・・個(つまり、''、X, XX, XXX, ・・・)の'X'を探索する。
+は1個以上の文字を探索する。
(例)
X+は1,2,3・・・個(つまり、X, XX, XXX, ・・・)の'X'を探索する。
正確な文字数とのマッチング
\{min,max\}を使用すると連続した文字の個数を指定できる。
(例)
X\{1,10\}は1個以上10個以下のXとのマッチングを探索する。
マッチングした文字数の保持
\(・・・\)はカッコ内でマッチングした文字をレジスタ(1〜9)に格納する。
(例)
^\(.\)は行の最初の文字をレジスタ1に格納する。