RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Grouped ANOVA

概要

この演算子は、ユーザー指定の属性(名義)で定義されたグループに基づいて、ユーザー指定の属性(数値)のANOVA有意性検定を実行します。 ANOVAは、サンプリングされた母集団が正規分布しているという仮定の下で、2つ以上のグループ間の平均が等しいという仮説をテストするために使用できる一般的な手法です。

詳細

Grouped ANOVAオペレーターは、 group by attributeパラメーターで指定されたグループ化属性に基づいて、入力ExampleSetのグループを作成します。グループごとに、anova属性の平均と分散が計算され、分散分析(ANOVA)が実行されます。 anova属性は、 anova属性パラメーターによって指定されます。グループ化属性は名義であり、anova属性は数値でなければならないことに注意することが重要です。この演算子の結果は、グループ化属性で定義されたグループ間で属性の値が大幅に異なるかどうかを示す、指定された重要度レベル( 重要度レベルパラメーターで指定)の重要度テスト結果です。

ANalysis Of VAriance(ANOVA)は、特定の変数で観測された分散が、さまざまな変動源に起因するコンポーネントに分割される統計モデルです。最も単純な形式では、ANOVAはいくつかのグループの平均がすべて等しいかどうかの統計的検定を提供するため、t検定を3つ以上のグループに一般化します。複数の2サンプルt検定を行うと、タイプIエラーが発生する可能性が高くなります。このため、ANOVAは2つ、3つ、またはそれ以上の手段を比較するのに役立ちます。 「False positive」またはタイプIエラーは、帰無仮説を拒否する決定が実際に真実であり、拒否されるべきではないときに行われる確率として定義されます。 ANOVAの典型的なアプリケーションでは、帰無仮説は、すべてのグループが同じ母集団のランダムサンプルであるというものです。これは、すべての治療が同じ効果を持っていることを意味します(おそらくない)。帰無仮説を棄却することは、異なる治療が結果の変化をもたらすことを意味します。

分化

ANOVAマトリックス

ANOVAマトリックス演算子は、すべての名義属性で定義されたグループに基づいて、すべての数値属性に対してANOVA有意性検定を実行します。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。この演算子は、指定された名義属性によって定義されたグループに基づいて、指定された数値属性に対してANOVA有意性検定を実行するため、ExampleSetには名義属性と数値属性の両方が必要です。

出力

  • 有意性(ANOVA有意性)ANOVAテストが実行され、ANOVA有意性テストの結果がこのポートから返されます。
  • サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • anova_attribute ANOVAは、 group by attributeパラメーターで定義されたグループに基づいて、このパラメーターで指定された属性に対して計算されます。この属性は数値でなければなりません。 範囲:文字列
  • group_by_attributeグループ化は、このパラメーターで指定された属性の値によって実行されます。この属性はノミナルでなければなりません。 範囲:文字列
  • severity_levelこのパラメーターは、ANOVA計算の有意水準を指定します。 範囲:実数
  • only_distinctこのパラメーターは、集約関数の計算に、集約属性の個別の値を持つ行のみを使用する必要があるかどうかを示します。 範囲:ブール

チュートリアルプロセス

ゴルフデータセットのグループ化されたANOVA

「ゴルフ」データセットは、検索演算子を使用してロードされます。 ExampleSetを表示できるように、ブレークポイントがここに挿入されます。 ExampleSetには、名義属性と数値属性の両方があることがわかります。 Grouped ANOVA演算子は、このExampleSetに適用されます。 anova属性とgroup by attributeパラメーターは、それぞれ「湿度」と「再生」に設定されます。この演算子は、「Play」属性で定義されたグループに基づいて、「Humidity」属性のANOVA有意性テストを実行します。 ANOVA有意性検定の結果は、結果ワークスペースで表示できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル