Python:任意のサイズのデータセットから同じサイズのリストを作成する

スモゼリー

.csvをループし、ファイル内の各行を辞書として格納し、その辞書を1次元リストのAPIに起動する小さなスクリプトを作成しています。

import csv
import requests

with open('csv.csv', 'rU') as f:
    reader = csv.reader(f, skipinitialspace=True)
    header = next(reader)
    for row in reader:
        request = [dict(zip(header, map(str, row)))]
        r = requests.post(url, headers = i_headers, json = request)
        print str(reader.line_num) + "-" + str(r)

requestリストは次のようになります。

[
    {
        "id": "1", 
        "col_1": "A",
        "col_2": "B",
        "col_3": "C"
    }
]

このスクリプトは機能しますが、800万行の.csvをループしているため、この方法は遅すぎます。API呼び出しごとに複数の行を送信することで、このプロセスを高速化したいと思います。私が使用しているAPIを使用すると、呼び出しごとに最大100行を送信できます。

このスクリプトを変更して、100個の辞書を含むリストを段階的に作成し、それをAPIに投稿して、繰り返すにはどうすればよいですか。このAPIに送信するもののサンプルは次のようになります。

[
    {
        "id": "1", 
        "col_1": "A",
        "col_2": "B",
        "col_3": "C"
    },
    {
        "id": "2", 
        "col_1": "A",
        "col_2": "B",
        "col_3": "C"
    },
...
...
...
    {
        "id": "100", 
        "col_1": "A",
        "col_2": "B",
        "col_3": "C"
    }
]

うまくいかないことの1つは、大規模なリストを作成し、それをサイズ100のn個のリストに分割することです。その理由は、私のマシンが常にそのデータのすべてをメモリに保持できないためです。

あいまい

range(100)andを使用してこれを行うことは可能ですexcept StopIteration:が、あまりきれいではありません。代わりに、ジェネレーターは、CSVファイルから一度に100行のチャンクを取得するのに最適です。実際の反復やリクエストロジックが乱雑にならないため、かなりエレガントなコードになります。それを確認してください:

import csv
import requests
from itertools import islice

def chunks(iterator, size):
    iterator = iter(iterator)
    chunk = tuple(islice(iterator, size))
    while chunk:
        yield chunk
        chunk = tuple(islice(iterator, size))

with open('csv.csv', 'rU') as f:
    reader = csv.reader(f, skipinitialspace=True)
    header = next(reader)
    for rows in chunks(reader, 100):
        rows = [dict(zip(header, map(str, row))) for row in rows]
        r = requests.post(url, headers=i_headers, json=rows)
        print str(reader.line_num) + "-" + str(r)

どこi_headersから来ているのか完全にはわかりませんが、実際のコードでそれを理解していると思います。

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

可変サイズのリストからPythonでデータフレームを作成する

MySqlからインデックスを削除する-同じサイズのデータベース

同じデータのリストのサイズが異なるのはなぜですか?

同じサイズの2つの別々のリストから辞書にキーと値を追加する

2つの異なるサイズのデータセットをマージし、同じ行を小さいデータセットから大きいデータセットの複数の行に条件付きでコピーします

「サイズ」が同じファイルのセットではないのに、「ディスク上のサイズ」が異なるのはなぜですか?

時系列データセットは、データを同じサイズのチャンクに分割します

イオングリッドに同じサイズのイオンカードをセットする

matlabで2つの同じサイズのマトリックスをサーフィンする

liサイズをテキストのサイズと同じにする

Rのデータフレームの異なるサイズの基層から同じサイズのサンプルを描画する

異なるデバイスタイプで同じアプリのインストールサイズ

Pythonは2つの異なるサイズのリストを同じ順序で並べ替えますか?

これらのリスト要素を同じサイズにする方法はありますか?

レスポンシブブートストラップWebサイトのデータベースからの動的画像のサイズを変更する方法

Python:ターゲットマトリックスのサイズに応じてマトリックスサイズを変更します

SortedSetからJavaで特定のサイズのリストを作成する

データセットをN個の同じサイズのグループに分割し、それらに番号を割り当てる方法

HighchartsPyramid-同じサイズのセグメント-データ値にもかかわらず

リスト - タプルのリストを特定のセット サイズに分割しますが、セットのサイズは同じである必要はありません

同じスタイルタグを持つこれらのページが異なるフォントサイズを生成するのはなぜですか?

可変サイズのマトリックスを作成する

リストの同じサイズのチャンクを逆にする

2つの異なるフォントサイズのテキストの子を下から同じレベルにフラッターで配置したい

任意のサイズの入力ストリームを処理する

メッセージリストの作成者名のフォントサイズを変更する

異なるサイズのデータを使用しながら、同じプロットに線と点をプロットする方法

Pythonで同じサイズのインデックスのグループを生成する

同じサイズを許可するベクトルサイズ順に並べられたベクトルのセット

TOP 一覧

  1. 1

    グラフからテーブルに条件付き書式を適用するにはどうすればよいですか?

  2. 2

    ソートされた検索、ターゲット値未満の数をカウント

  3. 3

    Unity:未知のスクリプトをGameObject(カスタムエディター)に動的にアタッチする方法

  4. 4

    セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか?

  5. 5

    Ansibleで複数行のシェルスクリプトを実行する方法

  6. 6

    Reactでclsxを使用する方法

  7. 7

    tkinterウィンドウを閉じてもPythonプログラムが終了しない

  8. 8

    Windows 10 Pro 1709を1803、1809、または1903に更新しますか?

  9. 9

    Pythonを使用して同じ列の同じ値の間の時差を取得する方法

  10. 10

    PowerShellの分割ファイルへのヘッダーの追加

  11. 11

    Chromeウェブアプリのウェブビューの高さの問題

  12. 12

    BLOBストレージからデータを読み取り、Azure関数アプリを使用してデータにアクセスする方法

  13. 13

    Crashlytics:コンパイラー生成とはどういう意味ですか?

  14. 14

    GoDaddyでのCKEditorとKCfinderの画像プレビュー

  15. 15

    Windows 10の起動時間:以前は20秒でしたが、現在は6〜8倍になっています

  16. 16

    MLでのデータ前処理の背後にある直感

  17. 17

    モーダルダイアログを自動的に閉じる-サーバーコードが完了したら、Googleスプレッドシートのダイアログを閉じます

  18. 18

    reCAPTCHA-エラーコード:ユーザーの応答を検証するときの「missing-input-response」、「missing-input-secret」(POSTの詳細がない)

  19. 19

    STSでループプロセス「クラスパス通知の送信」のループを停止する方法

  20. 20

    ファイル内の2つのマーカー間のテキストを、別のファイルのテキストのセクションに置き換えるにはどうすればよいですか?

  21. 21

    ネットワークグラフで、ネットワークコンポーネントにカーソルを合わせたときに、それらを強調表示するにはどうすればよいですか?

ホットタグ

アーカイブ