テキストにパターンが存在する正規表現を使用した文字列分割

michal111

カンマで分割する必要のある文字列がたくさんあります。例:

myString = r'test,Test,NEAR(this,that,DISTANCE=4),test again,"another test"'
myString = r'test,Test,FOLLOWEDBY(this,that,DISTANCE=4),test again,"another test"'

私の希望する出力は次のとおりです。

["test", "Test", "NEAR(this,that,DISTANCE=4)", "test again", """another test"""] #list length = 5

1つの項目で「this、that、DISTANCE」の間にコンマを入れる方法がわかりません。私はこれを試しました:

l = re.compile(r',').split(myString) # matches all commas
l = re.compile(r'(?<!\(),(?=\))').split(myString) # (negative lookback/lookforward) - no matches at all

何か案は?許可された「関数」のリストが次のように定義されているとしましょう。

f = ["NEAR","FOLLOWEDBY","AND","OR","MAX"]
WiktorStribiżew

あなたは使用することができます

(?:\([^()]*\)|[^,])+

正規表現のデモを参照してください

この(?:\([^()]*\)|[^,])+パターンは、括弧内にno(とが含ま)れる部分文字列、または,以外の文字が1つ以上出現する場合に一致します

Pythonデモを参照してください

import re
rx = r"(?:\([^()]*\)|[^,])+"
s = 'test,Test,NEAR(this,that,DISTANCE=4),test again,"another test"'
print(re.findall(rx, s))
# => ['test', 'Test', 'NEAR(this,that,DISTANCE=4)', 'test again', '"another test"']

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

またはステートメントで正規表現を使用して文字列を分割する

正規表現パターンを使用して文字列を分割する方法

ネストされた括弧の外側に配置されたANDで文字列を分割するための正規表現パターンが必要ですか?

正規表現を使用してPython文字列からハイパーリンクテキストを抽出する

パターンを無視した文字列分割正規表現

正規表現を使用して特殊なパターンで文字列を分割し、Pythonでリストに保存する方法

正規表現を使用したpostgres部分文字列分割テキスト

正規表現を使用してテキストを分割する方法はありますが、分割された単語は引き続き正規表現のセパレータを維持しますか?

テキスト列の正規表現パターンマッチングに基づいて、テーブルを関連テーブルに分割します

文字列をパターンで分割するOracleSQL正規表現

文字列を分割する正規表現パターン

正規表現-`: `で文字列を分割しますが、ifステートメント内では分割しません

指定されたテキスト文字列のhtmlを置き換える正規表現パターン

Pythonで正規表現パターンの文字列をテストする

正規表現パターンを使用して、アイテムがリストに存在するかどうかを確認します

正規表現パターンに基づいて文字列を分割する

指定されたパターンの最後の出現を使用する正規表現を使用してJavaで文字列のリストを分割するにはどうすればよいですか?

BEM文字列をパーツに分割するための正規表現パターン(PHP)

正規表現を使用してテキストを選択すると、単語またはパターンの後のすべてに一致します(同様のトピックですが、テキストは1文字を除いてパターンを修正しません)

PHP正規表現-プレーンテキストを文字列オブジェクトで分割する

パーセンテージなしでCPU使用率の文字列を分割する正規表現

スプリッターを配列に保持したまま、正規表現で文字列を分割する方法

Pythonで正規表現を使用してテキストを文に分割する

識別子を使用して文字列内の単語を分割する正規表現パターン

可変パターンで正規表現を使用して文字列を分割する

正規表現と文字列/ファイルの操作を組み合わせたPythonを使用してテキストファイル内のパターンを検索し、パターンのインスタンスを保存するにはどうすればよいですか?

パターンの最後のインスタンスが見つかった後にテキストをキャプチャする正規表現

パラメータ化されたテキストファイルを分割するPython正規表現

正規表現を使用して文字列からテキストを抽出する

TOP 一覧

  1. 1

    PyCharmリモートインタープリターはプロジェクトタブにサイトパッケージのコンテンツを表示しません

  2. 2

    <p:fieldset>の凡例に<h1>、<h2>タグを配置するにはどうすればよいですか?

  3. 3

    セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか?

  4. 4

    パンダは異なる名前の列に追加します

  5. 5

    Railsで宝石のレイアウトを使用するにはどうすればよいですか?

  6. 6

    Java文字列の仕組み

  7. 7

    Chromeウェブアプリのウェブビューの高さの問題

  8. 8

    CSSのみを使用して三角形のアニメーションを作成する方法

  9. 9

    httpListenerコールバックが2回呼び出されます

  10. 10

    Windows 10 Pro 1709を1803、1809、または1903に更新しますか?

  11. 11

    初期化時にextern / static変数のタイプを指定する必要があるのはなぜですか?

  12. 12

    ファイルがgitlfsに正しくアップロードされるかどうかを確認するにはどうすればよいですか?

  13. 13

    Grouping data with datatable with ASP.NET

  14. 14

    Ecto - migrate table column into its own join table (shifting the DATA to the new tables)

  15. 15

    Crashlytics:コンパイラー生成とはどういう意味ですか?

  16. 16

    Python / SciPyのピーク検出アルゴリズム

  17. 17

    PictureBoxで画像のブレンドを無効にする

  18. 18

    ディスパッチ不可能なハンドルが64ビットプラットフォームでptrを使用するのはなぜですか?

  19. 19

    アクティブな管理者で関連するモデルのドロップダウンメニューの問題を解決する方法

  20. 20

    Windows 7では、一部のプログラムは「ビジュアルテーマを無効にする」レジストリ設定を行いませんか?

  21. 21

    文字列内のすべての単語に一致する正規表現

ホットタグ

アーカイブ