k-NN
概要
この演算子は、分類または回帰に使用されるk-Nearest Neighborモデルを生成します。
詳細
k-Nearest Neighborアルゴリズムは、未知の例と、未知の例の最近傍であるkトレーニング例との比較に基づいています。
新しい例にk-Nearest Neighborアルゴリズムを適用する最初のステップは、k個の最近傍トレーニングの例を見つけることです。 「近さ」は、トレーニングExampleSetのn個の属性によって定義される、n次元空間の距離の観点から定義されます。
ユークリッド距離などのさまざまなメトリックを使用して、未知の例とトレーニング例の間の距離を計算できます。距離はしばしば絶対値に依存するという事実により、k-Nearest Neighborアルゴリズムをトレーニングおよび適用する前にデータを正規化することをお勧めします。使用されるメトリックとその正確な構成は、オペレーターのパラメーターによって定義されます。
2番目のステップでは、k-Nearest Neighborアルゴリズムが、検出された近傍の多数決によって未知の例を分類します。回帰の場合、予測値は、検出された近傍の値の平均です。
近隣の貢献度に重みを付けて、より近い近隣の人がより遠くの近隣の人よりも平均に貢献するようにすると便利です。