Pythonは2つの大きなファイルのワードリストを比較し、一致する場合は出力します

ため息をついた

2つの大きなファイルがあるとしましょう。1つはmd5_db.txtハッシュリストで、もう1つはハッシュリストhash.txtです。

md5_db.txt ハッシュとパスが含まれています:

accfa1212a61b379ba0b009549113863:11150
12fd5b2b866858281404434d1b9a0284:111968
cd418b51dc28d28a239d0658cdd3bca6:111983
e0c10f451217b93f76c2654b2b729b85:111aaa

hash.txt

cd418b51dc28d28a239d0658cdd3bca6
e0c10f451217b93f76c2654b2b729b85

次に、それらを比較してハッシュを見つけ、両方のファイルで一致する場合は、パスワードを使用してハッシュを出力します。私は最も効果的な解決策を見つけようとしてきましたが、近づいてしまい、思ったように機能しません。私が持っているコードは非常に単純で、パスワードからハッシュを分割しない限り、まだ機能していません。一致するものが見つかります。基本的に一言で言えば、私はそれをつかんhash.txtで比較しmd5_db.txt、一致する場合は印刷するためのスクリプトが必要です。

with open('md5_db.txt', 'r') as file1:
    with open('hash.txt', 'r') as file2:
        same = set(line.strip() for line in file1)
        same = "\n".join(same)

        for line in file2:
            word = line
            if word in same:
                print(word)
orlp

md5_db.txt辞書にロードする必要があります

with open('md5_db.txt') as md5_db_file:
    md5_db = dict(line.strip().split(":", 1)
                  for line in md5_db_file
                  if line.strip())

そして、ループしてhash.txt一致するものを印刷するのは簡単です。

with open('hash.txt') as hash_file:
    for line in hash_file:
        h = line.strip()
        if h in md5_db:
            print(h, md5_db[h])

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

2つのファイルを比較し、一致しない場合は空の行を出力しますか?

2つのファイルの2つのフィールドを比較し、一致しない場合は印刷します

perl / pythonの2つのファイルを比較し、一致するエントリを出力します

文字列が一致する場合は「+」または「-」のみを出力します(2つのファイル)

2つのファイルを比較し、IDが一致する場合は、すべての値を水平方向に出力しますか?

Python csvは2つのファイルを比較し、2つの値が一致する場合は値を更新します

2つの大きなファイルを比較し、一致する情報を組み合わせる

2つのファイルを比較して一致し、重複する一致が見つかった場合は1つだけ印刷します

一致する場合は2つのテキストファイルを最初の列と比較し、一致しない場合は同じように印刷し、ゼロを入力する方法は?

awkは2つのファイルを比較し、一致する行と一致しない行を出力します

2つの大きなファイルの行を比較し、一致する行を保持しようとしていますが、一致しません

2つのJSONファイルを比較し、値が一致する場合は新しいキーを作成します

Curl / Grepは、一致する場合にのみ、出力をURL付きのファイルに保存します

両方のファイルの最初の列に基づいて2つのタブ区切りファイルを比較し、出力ファイルに一致するエントリと一致しないエントリを出力します

2つのテキストファイルの2番目の列を比較し、一致する場合は両方のファイルの最初の列を印刷します

同じcsvファイルのヘッダーがない2つの列を比較し、Python3.8を使用して一致する値を出力します

Azureタスク:ファイルのコピー@ 2一致するファイルがない場合は、エラーをスローします

異なるファイルの2つの列を比較し、列のレコード間の差が0.001以下の場合、印刷が一致する

2つのcsvファイルを比較して、一致するPythonを出力します

2つのファイルの1列目と2列目を比較し、一致する場合は2番目のファイルの行を出力します

テーブルの2つの列を比較し、一致しない場合はoraclesqlで更新します

Python: 2 つのテキスト ファイルの文字列を比較し、一致した場合に 1 行を追加取得する方法

2つのファイルを比較し、一致を出力します

パターンが一致する場合は、異なるファイルの行を結合します

2つのファイルを比較し、不一致の列とともに不一致の行を書き込みます。不一致の列を指摘することが私の主な問題ステートメントです

2つのcsvファイルを読み取り、すべての行を比較します。行が一致する場合は両方の行を印刷し、類似していない場合は無効な印刷

タイムスタンプが一致する場合は、2つのファイルを解析し、行をマージします

共通のファイル名を持つ2つのファイルを比較しますが、一致した場合は両方からの出力が必要ですが、awkをどのように使用しますか?

cmd findstrを使用している場合、テキストファイルに実際に一致するものが見つからないときに「一致するものが見つかりません」を出力するにはどうすればよいですか?

TOP 一覧

  1. 1

    Python / SciPyのピーク検出アルゴリズム

  2. 2

    セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか?

  3. 3

    tkinterウィンドウを閉じてもPythonプログラムが終了しない

  4. 4

    androidsoongビルドシステムによるネイティブコードカバレッジ

  5. 5

    ZScalerと証明書の問題により、Dockerを使用できません

  6. 6

    Reactでclsxを使用する方法

  7. 7

    VisualStudioコードの特異点/ドッカー画像でPythonインタープリターを使用するにはどうすればよいですか?

  8. 8

    二次導関数を数値計算するときの大きな誤差

  9. 9

    Ansibleで複数行のシェルスクリプトを実行する方法

  10. 10

    STSでループプロセス「クラスパス通知の送信」のループを停止する方法

  11. 11

    ビュー用にサイズ変更した後の画像の高さと幅を取得する方法

  12. 12

    Three.js indexed BufferGeometry vs. InstancedBufferGeometry

  13. 13

    __init__。pyファイルの整理中に循環インポートエラーが発生しました

  14. 14

    三項演算子良い練習の代わりとしてOptional.ofNullableを使用していますか?

  15. 15

    エンティティIDを含む@RequestBody属性をSpringの対応するエンティティに変換します

  16. 16

    Spring Boot Filter is not getting invoked if remove @component in fitler class

  17. 17

    値間の一致を見つける最も簡単な方法は何ですか

  18. 18

    reCAPTCHA-エラーコード:ユーザーの応答を検証するときの「missing-input-response」、「missing-input-secret」(POSTの詳細がない)

  19. 19

    Rパッケージ「AppliedPredictiveModeling」のインストール中にエラーが発生しました

  20. 20

    画像変更コードを実行してもボタンの画像が変更されない

  21. 21

    好き/愛の関係のためのデータベース設計

ホットタグ

アーカイブ