データサイズよりも多くの反復のために小さなデータセットをサンプリングする方法は？

リーファン

私は1つの小さなデータセットと1つの大きなデータセットを持っており、それらは2つの別々のクラスを意味します。私がトレーニングしているネットワークはスタイル転送であるため、トレーニングを継続するには、クラスごとに1つの画像が必要です。ただし、小さいデータセットがなくなるとすぐにトレーニングは停止します。小さなデータセットからそのサイズを超えてランダムにサンプリングを続けるにはどうすればよいですか？

試しましたRandomSampler()が、うまくいきませんでした。小さなデータセットのコードは次のとおりです。

sampler = RandomSampler(self)
dataloader = DataLoader(self, batch_size=26, shuffle=False, sampler=sampler)
while True:
    for data in dataloader:
        yield data

私も試しましたiterator.cycleが、それも役に立ちませんでした。

loader = iter(cycle(self.dataset.gen(attribute_id, True)))
A, y_A = next(loader)
B, y_B = next(self.dataset.gen(attribute_id, False))

マクローレンス

でのあなたのアイデアRandomSamplerはそう遠くはありませんでした。と呼ばれるサンプラーがありSubsetRandomSamplerます。通常、サブセットはセット全体よりも小さいですが、そうである必要はありません。

小さいデータセットにAエントリがあり、2番目のデータセットにがあるとしますB。インデックスを定義できます。

indices = np.random.randint(0, A, B)   
sampler = torch.utils.data.sampler.SubsetRandomSampler(indices)

これによりB、小さいデータセットに有効な範囲のインデックスが生成されます。

テスト：

loader = torch.utils.data.DataLoader(set_A, batch_size=1, sampler=sampler)
print(len(loader)) # B

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集2020-12-3

コメントを追加

サインイン

前の投稿：分割文字列IF区切り文字が見つかりました

TOP 一覧

記事

データサイズよりも多くの反復のために小さなデータセットをサンプリングする方法は？

データサイズよりも多くの反復のために小さなデータセットをサンプリングする方法は？

グラフからテーブルに条件付き書式を適用するにはどうすればよいですか？

ソートされた検索、ターゲット値未満の数をカウント

Unity：未知のスクリプトをGameObject（カスタムエディター）に動的にアタッチする方法

セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか？

Ansibleで複数行のシェルスクリプトを実行する方法

Reactでclsxを使用する方法

tkinterウィンドウを閉じてもPythonプログラムが終了しない

Windows 10 Pro 1709を1803、1809、または1903に更新しますか？

Pythonを使用して同じ列の同じ値の間の時差を取得する方法

PowerShellの分割ファイルへのヘッダーの追加

Chromeウェブアプリのウェブビューの高さの問題

BLOBストレージからデータを読み取り、Azure関数アプリを使用してデータにアクセスする方法

Crashlytics：コンパイラー生成とはどういう意味ですか？

GoDaddyでのCKEditorとKCfinderの画像プレビュー

Windows 10の起動時間：以前は20秒でしたが、現在は6〜8倍になっています

MLでのデータ前処理の背後にある直感

モーダルダイアログを自動的に閉じる-サーバーコードが完了したら、Googleスプレッドシートのダイアログを閉じます

reCAPTCHA-エラーコード：ユーザーの応答を検証するときの「missing-input-response」、「missing-input-secret」（POSTの詳細がない）

STSでループプロセス「クラスパス通知の送信」のループを停止する方法

ファイル内の2つのマーカー間のテキストを、別のファイルのテキストのセクションに置き換えるにはどうすればよいですか？

ネットワークグラフで、ネットワークコンポーネントにカーソルを合わせたときに、それらを強調表示するにはどうすればよいですか？