K-Means (Kernel)
概要
この演算子は、カーネルk-meansアルゴリズムを使用してクラスタリングを実行します。クラスタリングは、互いに類似しており、他のクラスターに属するオブジェクトとは異なるオブジェクトをグループ化することに関係しています。カーネルk-meansは、カーネルを使用してオブジェクトとクラスター間の距離を推定します。 K-meansは排他的なクラスタリングアルゴリズムです。
詳細
この演算子は、カーネルk-meansアルゴリズムを使用してクラスタリングを実行します。 k-meansは排他的なクラスタリングアルゴリズムです。つまり、各オブジェクトはクラスターセットの1つに正確に割り当てられます。 1つのクラスター内のオブジェクトは互いに似ています。オブジェクト間の類似性は、オブジェクト間の距離の尺度に基づいています。カーネルk-meansは、カーネルを使用してオブジェクトとクラスター間の距離を推定します。カーネルの性質上、1つの距離を計算するには、クラスターのすべての要素を合計する必要があります。そのため、このアルゴリズムは多くの例で2次関数であり、K-Means演算子に反して重心クラスターモデルを返しません。この演算子は、クラスター属性の追加パラメーターがtrueに設定されている場合、結果のExampleSetにクラスター属性を作成します。
クラスタリングは、互いに類似しており、他のクラスターに属するオブジェクトとは異なるオブジェクトをグループ化することに関係しています。クラスタリングは、ラベル付けされていないデータから情報を抽出する手法です。クラスタリングは、多くの異なるシナリオで非常に役立ちます。たとえば、マーケティングアプリケーションで、同様の購入行動を持つ顧客のクラスターを見つけることに関心がある場合があります。