BallTreeは、不規則なデータを使用したカスタマイズされたメトリックをサポートしていますか?

楊趙

次の形式でいくつかのトレースを説明するデータセットがあります。

traceId1: event1 time1 event2 time2 ... eventN timeN
traceId2: event1 time1 event2 time2 ... eventM-1 timeM-1 eventM timeM
.
.
.

つまり、このファイルにはいくつかのトレースが含まれています。各トレースは、いくつかのイベントとこれらのイベントが発生する時刻で構成されます。各トレースの長さは異なる場合があります。したがって、データを行列に変換することはできません。

各トレースをオブジェクトとして保持するクラスPointを作成しました。また、トレースの各ペア間の距離を計算するためのカスタマイズされた関数を作成しました。メトリックを使用してBallTreeを構築しようとすると、次のようになります。

  File "/home/yangzhao/anaconda3/lib/python3.5/site-packages/numpy/core/numeric.py", line 474, in asarray
    return array(a, dtype, copy=False, order=order)

TypeError: float() argument must be a string or a number, not 'Point'

この投稿基づくと、BallTreeはfloatに変換できるデータ型のみを受け入れるようです。これは2013年に投稿されたので、現在回避策はありますか?たとえば、クラス定義にfloatメソッドを記述しますか?

PS:PythonでBallTreeを自分で書くことはできますが、最適化されていないため、動作が遅くなります。また、システムは再帰の最大深度を制限しているため、完全なデータセットでは機能しません。BallTreeもC ++で実装しましたが、代わりにPythonでその関数を呼び出すことをお勧めしますか?

jakevdp

ボールツリーは、2D浮動小数点配列に形成できるデータでのみ機能します。これは、ソースコードのオブジェクトの初期化で確認できますカスタムオブジェクトの配列をサポートするようにコードベースが変更されるとは思いません。

いずれにせよ、使用されるPythonコールバックの制限により、カスタム距離メトリックはあまりパフォーマンスが高くありません。問題に対応する他のC ++コードがある場合は、たとえばcythonを使用してPythonで使用するためにラップするのは比較的簡単です

この記事はインターネットから収集されたものであり、転載の際にはソースを示してください。

侵害の場合は、連絡してください[email protected]

編集
0

コメントを追加

0

関連記事

カスタマイズされたインデックスを使用して、同じPandasシリーズ列のさまざまな部分をさまざまな色でプロットするにはどうすればよいですか?

キャレットパッケージを使用して実行されるGBMで、パフォーマンス測定値としてAUPRCを使用したいと思います。auprcなどのカスタマイズされたメトリックを使用するにはどうすればよいですか?

forループで作成されたC ++ポリモーフィックポインターは同じものを参照しますが、これはスマートポインターを使用していないためですか?

Terraformを使用して作成されたCWAgentメトリックアラームは、収集されたデータポイントを取得しません(不十分なデータにとどまります)

カスタムデータベースを使用したAWSAppSyncはサブスクリプションをサポートしていますか?

小道具を介してカスタマイズされたマットグリッドコンポーネントにデータを渡す

ジョブブックマークを使用したAWSGlueは、「データソースは空またはネストされた空のスキーマの書き込みをサポートしていません」で失敗します

さまざまなグリッド列とブレークポイントに対してSASSを使用してBootstrap4をカスタマイズするにはどうすればよいですか?

要求されたリソースは、マルチパート形式データの送信時に http メソッド 'POST' をサポートしていません

Primefacesでカスタマイズされたデータエクスポーターを使用してExcelでフォントを設定するにはどうすればよいですか?

Builderパターンを使用して作成されたオブジェクトは不変であるという規則はありますか?

Rマトリックスの列名を失うことなく、RDataとして保存されたRからパンダデータフレームにマトリックスをインポートするにはどうすればよいですか?

sklearn BallTreeは、メトリックに渡されるデータを変更します

PL / SQLからWebサービスを呼び出すときに、サポートされていないメディアタイプを取得しました

AspectJのパラメーター化されたタイプはターゲットポイントカットをサポートしていません

トリガーの制約をチェックして、カスタマイズされたメッセージを Oracle に記録したい

カスタマイズされたスタイルをサポートするVimフォーマッタープラグインはありますか?

ボタンクリックで色とテキストを変更するためにngClassを使用しています。データはデータテーブルを使用してリモートサーバーからフェッチされます

リンクされたサービスは、Azureデータファクトリで動的jsonをサポートしていますか?

kommunicate.ioを使用してDialogflowボットからカスタマイズされたウェルカムメッセージをトリガーするにはどうすればよいですか?

WebSocketを使用してFastAPIからデータのライブストリームを取得しようとしたときのエラーを修正するにはどうすればよいですか(サポートされていないアップグレードリクエスト)。

Azure Applications Insightsでトレースやリクエストなどではなく、新しい列を使用してカスタマイズされたログを作成するにはどうすればよいですか?

415のサポートされていないメディアタイプRESTクライアントの応答ステータスを返しました

ODataクエリは、AND / OR演算子を使用したネストされたフィルターをサポートしていますか?

Python-ポイントのリストを使用して、forループなしでグリッド化されたNetCDFからデータを抽出します

Swagger 2.0はマトリックスパラメーターをサポートしていますか?

Dartはパラメーター化された単体テストをサポートしていますか?

Rで不規則な時系列データをどのようにインクリメントしますか

イーサネットインターフェイスを介して大きなデータをアップロードまたはダウンロードするときに、Linuxカーネルがフリーズしていないことを確認するにはどうすればよいですか?

TOP 一覧

  1. 1

    グラフからテーブルに条件付き書式を適用するにはどうすればよいですか?

  2. 2

    ソートされた検索、ターゲット値未満の数をカウント

  3. 3

    Unity:未知のスクリプトをGameObject(カスタムエディター)に動的にアタッチする方法

  4. 4

    セレンのモデルダイアログからテキストを抽出するにはどうすればよいですか?

  5. 5

    Ansibleで複数行のシェルスクリプトを実行する方法

  6. 6

    Reactでclsxを使用する方法

  7. 7

    tkinterウィンドウを閉じてもPythonプログラムが終了しない

  8. 8

    Windows 10 Pro 1709を1803、1809、または1903に更新しますか?

  9. 9

    Pythonを使用して同じ列の同じ値の間の時差を取得する方法

  10. 10

    PowerShellの分割ファイルへのヘッダーの追加

  11. 11

    Chromeウェブアプリのウェブビューの高さの問題

  12. 12

    BLOBストレージからデータを読み取り、Azure関数アプリを使用してデータにアクセスする方法

  13. 13

    Crashlytics:コンパイラー生成とはどういう意味ですか?

  14. 14

    GoDaddyでのCKEditorとKCfinderの画像プレビュー

  15. 15

    Windows 10の起動時間:以前は20秒でしたが、現在は6〜8倍になっています

  16. 16

    MLでのデータ前処理の背後にある直感

  17. 17

    モーダルダイアログを自動的に閉じる-サーバーコードが完了したら、Googleスプレッドシートのダイアログを閉じます

  18. 18

    reCAPTCHA-エラーコード:ユーザーの応答を検証するときの「missing-input-response」、「missing-input-secret」(POSTの詳細がない)

  19. 19

    STSでループプロセス「クラスパス通知の送信」のループを停止する方法

  20. 20

    ファイル内の2つのマーカー間のテキストを、別のファイルのテキストのセクションに置き換えるにはどうすればよいですか?

  21. 21

    ネットワークグラフで、ネットワークコンポーネントにカーソルを合わせたときに、それらを強調表示するにはどうすればよいですか?

ホットタグ

アーカイブ