RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Create Lift Chart

概要

この演算子は、離散化された信頼度とパレートチャートに基づいて、指定されたモデルとExampleSetのリフトチャートを生成します。

詳細

Create Lift Chartオペレーターは、指定されたExampleSetとモデルの離散化された信頼値のパレートプロットに基づいてリフトチャートを作成します。モデルがExampleSetに適用され、その後リフトチャートが生成されます。指定されたExampleSetの予測ラベルは、この演算子の適用中に削除されることに注意してください。信頼できる結果を得るためには、モデルの構築に使用されていないデータにこの演算子を適用する必要があります。適用しないと、結果のプロットが楽観的になりすぎます。

リフトチャートは、モデルで得られた結果とモデルなしで得られた結果の比率を計算することにより、モデルの有効性を測定します。モデルなしで得られた結果は、ランダムに選択されたレコードに基づいています。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のダイレクトメーリングデータの生成演算子の出力です。他の演算子の出力も入力として使用できます。
  • モデル (モデル)この入力ポートにはモデルが必要です。添付のサンプルプロセスのNaive Bayes演算子の出力です。他の演算子の出力も入力として使用できます。

出力

  • サンプルセット(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
  • モデル(モデル)入力として与えられたモデルは、このポートを介して出力に変更されることなく渡されます。これは通常、同じモデルを他の演算子で再利用したり、結果ワークスペースでモデルを表示したりするために使用されます。
  • リフトパレートチャート (リフトパレートチャート 与えられたモデルとExampleSetについて、離散化された信頼度とパレート図に基づいてリフト図が生成されます。このリフトチャートは、このポートから配送されます。

パラメーター

  • target_classこのパラメーターは、リフトチャートを作成するターゲットクラスを示します。 範囲:文字列
  • binning_typeこのパラメーターは、信頼度のビニングタイプを示します。 範囲:選択
  • number_of_binsこのパラメーターは、信頼度を離散化するビンの数を指定します。このパラメーターは、 ビニングタイプパラメーターが ‘simple’または ‘frequency’に設定されている場合にのみ使用できます。 範囲:整数
  • size_of_binsこのパラメーターは、信頼度が離散化されるときに各ビンに含まれるサンプルの数を指定します。このパラメーターは、 ビニングタイプパラメーターが「絶対」に設定されている場合にのみ使用できます。 範囲:整数
  • automatic_number_of_digitsこのパラメーターは、範囲名の桁数を自動的に決定する必要があるかどうかを示します。 範囲:ブール
  • number_of_digitsこのパラメーターは、間隔名に使用される最小桁数を指定します。このパラメーターを-1に設定すると、最小数が自動的に決定されます。このパラメーターは、 自動桁数パラメーターがfalseに設定されている場合にのみ使用できます。 範囲:整数
  • show_bar_labelsこのパラメーターは、バーがビンのサイズと対応するビンのターゲットクラスの量を表示するかどうかを示します。 範囲:ブール
  • show_cumulative_labelsこのパラメーターは、累積折れ線グラフがビンの累積サイズを、対応するビンのターゲットクラスの累積量とともに表示するかどうかを示します。 範囲:ブール
  • rotate_labelsこのパラメーターは、ビンのラベルを回転させるかどうかを示します。 範囲:ブール

チュートリアルプロセス

ダイレクトメーリングデータのリフトチャートの作成

DirectMailing Data演算子は、10000個のサンプルを含むExampleSetを生成するために使用されます。スプリット検証演算子は、このExampleSetに適用されます。分割比パラメーターは0.7に設定され、サンプリングタイプパラメーターは「シャッフルサンプリング」に設定されます。以下に、スプリット検証演算子の内部で何が起こるかを説明します。

Split Validationオペレーターは、トレーニングサブプロセスのトレーニングポートを通じてトレーニングデータセットを提供します。このトレーニングデータセットは、Naive Bayesオペレーターの入力として使用されます。したがって、Naive Bayes分類モデルは、このトレーニングデータセットでトレーニングされます。 Naive Bayesオペレーターは、出力としてNaive Bayes分類モデルを提供します。このモデルは、トレーニングサブプロセスのモデルポートに接続されています。トレーニングサブプロセスのモデルポートで提供されたNaive Bayesモデルは、テストサブプロセスのモデルポートでSplit Validationオペレーターによって配信されます。このモデルは、リフトチャートの作成演算子のモデルポートでの入力として提供されます。分割検証演算子は、テストサブプロセスのテストセットポートを介してテストデータセットを提供します。このテストデータセットは、リフトチャートの作成オペレータへの入力として提供されます。 Create Lift Chartオペレーターは、離散化された信頼度とパレートチャートに基づいて、指定されたモデルとExampleSetのリフトチャートを生成します。リフトチャートは、Rememberオペレーターに提供されてオブジェクトストアに格納されます。モデルの適用演算子には、テストデータセットとモデルが用意されています。モデルの適用演算子は、テストデータセットにモデルを適用し、結果のラベル付きデータセットが出力として配信されます。このラベル付きデータセットは、パフォーマンスオペレータへの入力として提供されます。パフォーマンス演算子は、指定されたラベル付きデータセットを通じてモデルの統計的パフォーマンスを評価し、さまざまなパフォーマンス基準に関する情報を保持するパフォーマンスベクトルを生成します。

スプリット検証演算子の外部では、リコール演算子はオブジェクトストアからリフトチャートを取得するために使用されます。リフトチャートは出力に配信され、結果ワークスペースで確認できます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル