Independent Component Analysis

概要

この演算子は、HyvärinenおよびOjaのFastICAアルゴリズムを使用して、指定されたExampleSetの独立成分分析（ICA）を実行します。

詳細

独立成分分析（ICA）は、観測されたランダムデータを相互に最大限独立した成分に線形変換し、同時に「興味深い」分布を持つ非常に汎用的な統計手法です。このような表現は、特徴抽出を含む多くのアプリケーションのデータの本質的な構造をキャプチャしているようです。 ICAは、一連のランダム変数または測定の基礎となる隠れた要因を明らかにするために使用されます。 ICAは、表面的に主成分分析（PCA）と因子分析に関連しています。 ICAははるかに強力な手法ですが、これらの古典的な方法が完全に失敗した場合、基礎となる要因またはソースを見つけることができます。この演算子は、A。HyvärinenとE. OjaのFastICAアルゴリズムを実装します。 FastICAアルゴリズムには、ニューラルアルゴリズムの利点のほとんどがあります。それは、並列で、分散型で、計算が単純であり、メモリスペースをほとんど必要としません。

入力

サンプル入力（IOObject）この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。 Retrieveオペレーターは、データとともにメタデータを提供します。この演算子は公称属性を処理できないことに注意してください。数値属性で機能します。

出力

設定出力の例（IOObject）独立成分分析は入力ExampleSetで実行され、結果のExampleSetはこのポートを介して配信されます。
オリジナル（IOObject）入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
前処理モデル（前処理モデル）このポートは、現在のプロセスにおけるこのオペレーターのパラメーターに関する情報を含む前処理モデルを提供します。

パラメーター

dimensionality_reductionこのパラメーターは、どのタイプの次元削減（属性数の削減）を適用する必要があるかを示します。
- なし：このオプションを選択すると、次元の削減は実行されません。
- fixed_number：このオプションを選択すると、一定数のコンポーネントのみが保持されます。保持するコンポーネントの数は、number of componentsパラメーターによって指定されます。
範囲：選択
number_of_componentsこのパラメーターは、 次元削減パラメーターが「固定数」に設定されている場合にのみ使用できます。保持するコンポーネントの数は、 number of componentsパラメーターによって指定されます。範囲：整数
algorithm_typeこのパラメーターは、使用するアルゴリズムのタイプを指定します。
- 並列：並列オプションが選択されている場合、コンポーネントは同時に抽出されます。
- デフレーション：デフレーションオプションが選択されている場合、コンポーネントは1つずつ抽出されます。
範囲：選択
functionこのパラメーターは、負エントロピーの近似に使用されるG関数の関数形式を指定します。範囲：選択
alphaこのパラメーターは、範囲[1、2]のアルファ定数を指定します。これは、ネガティブエントロピーの近似に使用されます。範囲：実数
row_normこのパラメーターは、データ行列の行を事前に標準化する必要があるかどうかを示します。範囲：ブール
max_iterationこのパラメーターは、実行する反復の最大数を指定します。範囲：整数
toleranceこのパラメータは、非混合行列が収束したと見なされる許容値を与える正のスカラーを指定します。範囲：実数
use_local_random_seedこのパラメーターは、ランダム化にローカルランダムシードを使用する必要があるかどうかを示します。同じ値のローカルランダムシードを使用すると、同じランダム化が生成されます。範囲：ブール
local_random_seedこのパラメータは、 ローカルランダムシードを指定します。このパラメーターは、 ローカルシードの使用パラメーターがtrueに設定されている場合にのみ使用できます。範囲：整数

チュートリアルプロセス

独立成分分析演算子を使用したソナーデータセットの次元削減

「ソナー」データセットは、検索演算子を使用してロードされます。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。 ExampleSetには60個の属性があることがわかります。独立成分分析演算子は、「ソナー」データセットに適用されます。次元削減パラメーターは「固定数」に設定され、number_of_componentsパラメーターは10に設定されます。したがって、結果のExampleSetは10個のコンポーネント（人工属性）で構成されます。結果ワークスペースで結果のExampleSetを確認し、属性が10個しかないことを確認できます。これらの属性は、「ソナー」データセットの元の属性ではないことに注意してください。これらの属性は、ICAプロシージャを使用して作成されました。