Sample (Kennard-Stone)
概要
この演算子は、Kennard-Stoneアルゴリズムを使用して、指定されたExampleSetからサンプルを作成します。サンプルのサイズは、絶対ベースおよび相対ベースで指定できます。
詳細
サンプル(ケナードストーン)演算子は、ケナードストーンサンプリングを実行します。このサンプリングアルゴリズムは次のように機能します。
- ExampleSetで最も離れた2つのポイントを見つけます。
- 候補点ごとに、既に選択されているオブジェクトまでの最短距離を見つけます。
- これらの最小距離の最大値を持つポイントを選択します。
2つの開始点は常に同じであるため、このアルゴリズムは常に同じ結果をもたらします。この実装は、最大の最小距離の候補を持つリストを保持することにより、反復回数を減らします。サンプル内の例の数は、このアルゴリズムが機能する方法のために、指定された数と正確に一致しない場合があることに注意してください。
サンプリング演算子は、入力としてExampleSetを取得し、出力としてExampleSetのサブセットを提供するという原則で、Filter Examples演算子に似ています。違いは、例のフィルター演算子が、指定された条件に基づいて例をフィルターすることです。しかし、サンプル演算子は、結果のサンプルの例の数とクラス分布に焦点を当てています。さらに、サンプルはランダムに生成されます。サンプルのサンプルの数は、 サンプルパラメータの設定に応じて、絶対ベースおよび相対ベースで指定できます。
入力
- サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。
出力
- 設定出力の例(IOObject)Kennard-Stoneアルゴリズムが適用され、入力ExampleSetの結果のサンプルがこのポートの出力になります。
- オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- sampleこのパラメーターは、データ量の指定方法を決定します。
- absolute:サンプルパラメータが ‘absolute’に設定されている場合、サンプルは正確に指定された数のサンプルで作成されます。必要な例の数は、サンプルサイズパラメーターで指定されます。
- 相対:サンプルパラメータが ‘relative’に設定されている場合、サンプルは入力ExampleSetのサンプルの総数の一部として作成されます。サンプルの必要な比率は、サンプル比率パラメーターで指定されます。
範囲:選択
- sample_sizeこのパラメーターは、サンプリングするサンプルの正確な数を指定します。このパラメーターは、 sampleパラメーターが「absolute」に設定されている場合にのみ使用可能です。 範囲:整数
- sample_ratioこのパラメーターは、サンプリングするサンプルの割合を指定します。このパラメーターは、 sampleパラメーターが「relative」に設定されている場合にのみ使用可能です。 範囲:実数
チュートリアルプロセス
アイリスデータセットのケナードストーンサンプリング
「アイリス」データセットは、Retrieve演算子を使用してロードされます。 ExampleSetを表示できるように、ブレークポイントがここに挿入されます。 ExampleSetには150の例があることがわかります。 Sample(Kennard-Stone)演算子がExampleSetに適用されます。サンプルパラメータは「絶対」に設定され、サンプルサイズパラメータは15に設定されます。したがって、結果のサンプルには15の例しかありません。 15個のサンプルを含む結果のExampleSetは、結果ワークスペースに表示されます。