REGEXEXTRACT関数 – 正規表現に一致した文字列を抽出する関数
1. 使い方と活用例
REGEXEXTRACT関数は、文字列の中から正規表現に一致する部分を抽出するための関数です。
強力なパターンマッチ機能を持ち、複雑な形式のデータから特定のパターンを抜き出す際に非常に有効です。
※この関数はGoogleスプレッドシート限定であり、Microsoft Excelでは使用できません。
2. 基本の書式
=REGEXEXTRACT(文字列, 正規表現)
3. 引数の説明
- 文字列 – 正規表現を適用する対象となる文字列。
- 正規表現 – 抽出したいパターンを表す正規表現文字列。
4. 使用シーン
- メールアドレスやURLなど特定の形式を抽出したいとき
- 数値、記号、日付、カタカナなどの特定パターンを抜き出したいとき
- テキストデータの自動整形やデータクレンジングに
5. 応用のポイント
REGEXEXTRACT関数は、正規表現で最初に一致した部分だけを返します。
複数一致する部分をすべて抽出したい場合は REGEXEXTRACT
ではなく REGEXREPLACE
などと組み合わせが必要です。
また、正規表現の構文に関する基本的な理解があると、柔軟な抽出が可能になります。
6. 具体例とその解説
=REGEXEXTRACT("商品コード:ABC-1234", "ABC-[0-9]+")
文字列の中から「ABC-数字」の形式に一致する部分(ABC-1234)を抽出します。
=REGEXEXTRACT("メール:info@example.com", "[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}")
メールアドレスの形式に一致する部分を取り出す例。
結果は info@example.com。
=REGEXEXTRACT("2024年4月1日", "[0-9]{4}年")
「2024年4月1日」から「2024年」の部分だけを抽出します。
7. 関連関数の紹介
- REGEXREPLACE関数 – 正規表現に一致する部分を置換する関数
- REGEXMATCH関数 – 正規表現に一致するかどうかをTRUE/FALSEで返す関数
- SPLIT関数 – 指定した文字や正規表現で文字列を分割する関数
- SEARCH関数(Excel) – Excelでの部分一致検索用の関数(正規表現は非対応)
8. まとめ
REGEXEXTRACT関数は、正規表現を活用して柔軟かつ強力な文字列抽出を可能にするGoogleスプレッドシート専用関数です。
形式がバラバラなデータから規則的なパターンを抜き出す処理に最適で、データ整形や自動化の効率を大きく向上させます。
9. 対応バージョン
REGEXEXTRACT関数は、Googleスプレッドシートでのみ使用可能です。
Microsoft Excelではこの関数は利用できません(正規表現対応は VBA または Office Script 経由で対応可能)。