このレッスンでは、いくつかの追加のメタ文字と、キャプチャされたグループの結果について説明します。
\d を使用して数字、 \s を使用して空白、 \w を使用して英数字をキャプチャするための最も一般的なメタ文字については既に学習しましたが、正規表現では、大文字を使用してこれらのメタ文字のそれぞれの反対のセットを指定する方法も提供しています。たとえば、 \D は 数字以外の 文字、 \S は 空白以外の 文字、 \W は 英数字以外の 文字(句読点など)を表します。正規表現の作成方法によっては、一方または他方を使用する方が簡単な場合があります。
さらに、単語と単語以外の文字の境界に一致する特殊なメタ文字 \b があります。これは、単語全体をキャプチャする場合に最も役立ちます(たとえば、パターン \w+\b を使用します)。
これらのレッスンでは詳しく説明しない概念の1つは、 後方参照 です。これは主に実装によって異なるためです。ただし、多くのシステムでは、 \0 (通常は完全に一致したテキスト)、 \1 (グループ1)、 \2 (グループ2)などを使用して、キャプチャされたグループを参照できます。これは、たとえば、テキストエディタで正規表現を使用して検索と置換を行い、2つの数値を入れ替える場合に役立ちます。「(\d+)-(\d+)」を検索し、「\2-\1」に置き換えて、キャプチャされた2番目の数値を最初に、キャプチャされた最初の数値を2番目に配置できます。
以下に、さまざまな文字列を示します。さまざまなタイプのメタ文字または前のレッスンで学習したことを試してみて、準備ができたら続けてください。