RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Self-Organizing Map

概要

この演算子は、自己組織化マップ(SOM)に基づいて、指定されたExampleSetの次元削減を実行します。ユーザーは、必要な次元数を指定できます。

詳細

自己組織化マップ(SOM)または自己組織化機能マップ(SOFM)は、教師なし学習を使用して訓練され、入力空間の低次元(通常は2次元)の離散表現を生成する人工ニューラルネットワークの一種です。マップと呼ばれるトレーニングサンプル。自己組織化マップは、近隣関数を使用して入力空間のトポロジ特性を保持するという意味で、他の人工ニューラルネットワークとは異なります。これにより、SOMは、多次元スケーリングと同様に、高次元データの低次元ビューを視覚化するのに役立ちます。このモデルは、Teuvo Kohonenによって人工ニューラルネットワークとして最初に記述され、Kohonenマップとも呼ばれます。

ほとんどの人工ニ​​ューラルネットワークと同様に、SOMはトレーニングとマッピングの2つのモードで動作します。トレーニングでは、入力例を使用してマップを作成します。マッピングにより、新しい入力ベクトルが自動的に分類されます。自己組織化マップは、ノードまたはニューロンと呼ばれるコンポーネントで構成されます。各ノードには、入力データベクトルと同じ次元の重みベクトルとマップ空間内の位置が関連付けられています。ノードの通常の配置は、六角形または長方形のグリッドの規則的な間隔です。自己組織化マップは、高次元の入力スペースから低次元のマップスペースへのマッピングを記述します。データ空間からマップにベクトルを配置する手順は、まずデータ空間から取得したベクトルに最も近い重みベクトルを持つノードを見つけることです。最も近いノードが見つかると、データ空間から取得したベクトルの値が割り当てられます。

このタイプのネットワーク構造は、ノードが接続されていると視覚化されるフィードフォワードネットワークに関連するものと考えるのが一般的ですが、このタイプのアーキテクチャは配置と動機が根本的に異なります。

入力

  • サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。 Retrieveオペレーターは、データとともにメタデータを提供します。この演算子は公称属性を処理できないことに注意してください。数値属性で機能します。

出力

  • 設定出力の例(IOObject)指定されたExampleSetの次元削減は、自己組織化マップに基づいて実行され、結果のExampleSetはこのポートを介して配信されます。
  • オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
  • 前処理モデル(前処理モデル)このポートは、現在のプロセスにおけるこのオペレーターのパラメーターに関する情報を含む前処理モデルを提供します。

パラメーター

  • return_preprocessing_modelこのパラメーターは、前処理モデルを返すかどうかを示します。 範囲:ブール
  • number_of_dimensionsこのパラメーターは、保持する次元の数、つまり結果のExampleSetの属性の数を指定します。 範囲:整数
  • net_sizeこのパラメーターは、ネットのすべてのエッジの長さを設定することにより、SOMネットのサイズを指定します。合計すると、ネット内の次元ノードの数の ネットサイズになります。 範囲:整数
  • training_roundsこのパラメーターは、トレーニングラウンドの数を指定します。 範囲:整数
  • learning_rate_startこのパラメーターは、最初のラウンドでの適応の強さを指定します。強度は、最後のラウンドで学習率の終わりに達するまで、ラウンドごとに低下します。 範囲:実数
  • learning_rate_endこのパラメーターは、最終ラウンドの適応の強さを指定します。強度は、最初のラウンドで学習率の開始から始まり、最後のラウンドでこの値まで減少します。 範囲:実数
  • adaption_radius_startこのパラメータは、最初のラウンドでの刺激の周りの球の半径を指定します。この半径は、最初のラウンドの適応半径の開始から最後のラウンドの適応半径の終了まで 、ラウンドごとに減少します。 範囲:実数
  • adaption_radius_endこのパラメータは、最後のラウンドでの刺激の周りの球体の半径を指定します。この半径は、最初のラウンドでの適応半径の開始から最後のラウンドでの適応半径の終了まで 、ラウンドごとに減少します。 範囲:実数

チュートリアルプロセス

自己組織化マップ演算子を使用したソナーデータセットの次元削減

「ソナー」データセットは、検索演算子を使用してロードされます。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。 ExampleSetには60個の属性があることがわかります。自己組織化マップ演算子は、「ソナー」データセットに適用されます。次元数パラメーターは2に設定されます。したがって、結果のExampleSetは2次元(人工属性)で構成されます。結果ワークスペースで結果のExampleSetを確認し、2つの属性しかないことを確認できます。これらの属性は、「ソナー」データセットの元の属性ではないことに注意してください。これらの属性は、SOMプロシージャを使用して作成されました。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル