RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

ANOVA Matrix

概要

この演算子は、すべての名義属性によって定義されたグループに基づいて、すべての数値属性に対してANOVA有意性検定を実行します。 ANOVAは、サンプリングされた母集団が正規分布しているという仮定の下で、2つ以上のグループ間の平均が等しいという仮説をテストするために使用できる一般的な手法です。

詳細

ANalysis of VAriance(ANOVA)は、特定の変数で観測された分散が、さまざまな変動源に起因するコンポーネントに分割される統計モデルです。最も単純な形式では、ANOVAはいくつかのグループの平均がすべて等しいかどうかの統計的検定を提供するため、t検定を3つ以上のグループに一般化します。複数の2標本t検定を行うと、タイプIエラーが発生する可能性が高くなります。このため、ANOVAは2つ、3つ、またはそれ以上の手段を比較するのに役立ちます。 「偽陽性」またはタイプIエラーは、帰無仮説を拒否する決定が実際に真実であり、拒否されるべきではないときに行われる確率として定義されます。 ANOVAの典型的なアプリケーションでは、帰無仮説は、すべてのグループが同じ母集団のランダムサンプルであるというものです。これは、すべての治療が同じ効果を持っていることを意味します(おそらくない)。帰無仮説を棄却することは、異なる治療が結果の変化をもたらすことを意味します。

分化

グループ化された分散分析

Grouped ANOVAオペレーターは、ユーザー指定の属性(名義)で定義されたグループに基づいて、ユーザー指定のanova属性(数値)のANOVA有意性検定を実行します。

入力

  • example set (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。この演算子は、すべての名義属性によって定義されたグループに基づいて、すべての数値属性に対してANOVA有意性検定を実行するため、ExampleSetには名義属性と数値属性の両方が必要です。

出力

  • example set(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
  •  anova (ANOVAマトリックス)すべての数値属性のANOVA有意性検定は、すべての名義属性によって定義されたグループに基づいて実行されます。結果のANOVAマトリックスがこのポートから返されます。

パラメーター

  • severity_levelこのパラメーターは、ANOVA計算の有意水準を指定します。 範囲:実数
  • only_distinctこのパラメーターは、集約関数の計算に、集約属性の個別の値を持つ行のみを使用する必要があるかどうかを示します。 範囲:ブール

チュートリアルプロセス

GolfデータセットのANOVAマトリックス

「ゴルフ」データセットは、検索演算子を使用してロードされます。 ExampleSetを表示できるように、ブレークポイントがここに挿入されます。 ExampleSetには、名義属性と数値属性の両方があることがわかります。 ANOVAマトリックス演算子は、このExampleSetに適用されます。この演算子は、すべての名義属性によって定義されたグループに基づいて、すべての数値属性に対してANOVA有意性検定を実行します。結果のANOVAマトリックスは、結果ワークスペースで表示できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル