●正規表現について 以下コピペです 1: 文字そのもの。 メタキャラクタ以外の文字は通常の文字を表します。 abc 文字列 'abc' にマッチします。 2: '\'によるメタキャラクタの意味打ち消し。 \+, \|, \\ それぞれ文字'+', '|', '\' にマッチします。 3: '\'によるエスケープシーケンス。 エスケープシーケンス 意味 対応するキャラクターコード \b Back space $08 \r Carriage return $0A \n Line feed $0D \t Tab $09 \xhhhh hは16進数。1〜4桁まで、2バイト文字も指定可能 \oooooo oは8進数。 1〜6桁まで、2バイト文字も指定可能。 4: '.'によって任意の一文字(2バイト文字含む)を表す。 ※ 復帰(CR)$0d、改行(LF)$0a にはマッチしません。 例 正規表現 'a.b' は、 'aab', 'azb', 'abb', 'a全b' ... などにマッチします。 5: 文頭を表すメタキャラクタ '^' 検索対象テキストの文頭にマッチします。 ※1文字目のキャラクタを表す位置以外では、通常のキャラクタ'^'として扱われます。 例 ○ ^abc 文頭の'abc'にマッチします。 ○ '(xyz|^ABC)' 'xyz'または、文頭の'ABC'にマッチします。 × 'A^BC 'A^BC'にマッチします。文頭を表すメタキャラクタとしては解釈されません。 6: 文尾を表すメタキャラクタ '$' 検索対象テキストの文尾にマッチします。 ※最後尾のキャラクタを表す位置以外では、通常のキャラクタ'$' として扱われます。 例 ○ abc$ 文尾の'abc'にマッチします。 ○ '(xyz$|^ABC)' 文尾の'xyz'または、文頭の'ABC'にマッチします。 × 'A$BC 'A$BC'にマッチします。文尾を表すメタキャラクタとしては解釈されません。 7: キャラクタクラス '[' と ']'に挟まれた文字のどれか1文字にマッチします。 [abc] 'a' 又は 'b' 又は 'c' にマッチします。 '-'による範囲指定も可能です。 [0-90−9] 半角、全角の数字1文字にマッチします。 8: 補キャラクタクラス '[' と ']'に挟まれた文字以外の文字1字にマッチします。 [^いろは] 'い', 'ろ', 'は' 以外の1文字にマッチします。 '-'による範囲指定も可能です。 [^a-zA-Z] 半角アルファベット以外の一文字にマッチします。 ※ キャラクタクラスの中では、'['の次の'^', メタキャラクタ '\', 範囲指定の '-'以外の文字は文字そのものとして扱われる。 [.()\\^] 文字 '.', '(', ')', '\', '^' のどれか一文字にマッ チします。 ※ キャラクタクラスの中で両側にキャラクタの無い'-'は文字そのものとして 扱われます。 [+-] 文字 '+', '-' のどちらか1つにマッチします。 [-+] 同上 9: 連結 Concatonation XY 連続している正規表現XYにマッチします。 10: 選択 Union X|Y 正規表現 X 又は 正規表現 Y にマッチします。 11: 0回以上の繰り返し(閉包)Closure X* a* は '', 'a', 'aa', 'aaa', ... にマッチします。 12: 1回以上の繰り返し (正閉包)Positive Closure X+ a+ は 'a', 'aa', 'aaa', 'aaaa', ... にマッチします。 13: 「ある」か「ない」かの指定 X? a? は '', 'a' にマッチします。 14: 括弧による解釈の優先順位指定 (X) (abc)+ は 'abc', 'abcabc', ... にマッチします。 15: ヌル正規表現 () (X|) は X?と等価の意味を持つ。 ※ 置換文字列中の'&'はマッチした部分文字列に置き換わります。'&'そのものを使いたいときは、'\&'と書いてください。