RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Multi Label Modeling

概要

この演算子は、入力ExampleSetでマルチラベルモデルをトレーニングします。

詳細

マルチラベルモデルは、複数のラベル属性を一度に予測できるメタモデルです。各ラベル属性について、マルチラベルモデルには予測モデルが含まれます。ラベル属性は、 属性フィルターによって選択できます。

演算子の内部サブプロセスは、選択したラベル属性ごとに実行されます。現在のラベル属性がラベルロールに設定された入力トレーニングデータは、内部トレーニングセットポートで提供されます。対応するラベル属性の予測モデルをトレーニングするために使用できます。予測モデルは、内部サブプロセスのモデルポートに提供する必要があります。予測モデルは収集され、オペレーターのモデル出力ポートでマルチラベルモデルとして提供されます。追加のオブジェクトは、 入力および出力ポートエクステンダーを介してサブプロセスに出入りできます。

タイプや特別な役割に関係なく、任意の属性をラベル属性として選択できます。内部サブプロセスでトレーニングされた予測モデルが、選択されたすべてのラベル属性を処理できることのみが保証されています。定義された動作を保証するために、入力ExampleSetには通常の ‘Label’属性を含めることはできません。入力データにそのような属性がある場合、その役割をSet Roleオペレーターで別の役割に設定する必要があります。他のすべての属性の役割は変更されないことに注意してください。したがって、通常の属性がラベル属性として選択された場合、他のラベル属性のトレーニング反復では通常の属性のままであり、他のラベル属性の予測モデルの入力属性として使用されます。パラメーター追加マクロが選択されている場合、サブプロセスの現在のラベル属性の名前とタイプをマクロとして追加できます

モデル適用演算子を使用して)MultiLabelモデルがExampleSetに適用される場合、メタモデルの予測モデルを使用して、すべてのラベル属性の「予測」属性が作成されます。 ‘Prediction’属性の名前はpredict(<label name>の名前)に設定され、 ‘Prediction’属性の特別な役割はpredict_ <label name>の名前に設定されます 。予測モデルが ‘Confidence’属性も作成する場合(ラベルがノミナルの場合)、 ‘Confidence’属性の名前はConfidence (<label name> = <value>)になります。 ‘Confidence’属性の役割は、 confidence_ <ラベル属性の名前> _ <値>に設定されます

複数の予測のパフォーマンスは、オペレーターMulti Label Performanceによって評価できます。

入力

  • トレーニングセット (IOObject)マルチラベルモデルが構築される入力ExampleSet。
  • 入力 (IOObject)このポートはポートエクステンダーです。つまり、ポートが接続されると、新しい入力ポートが作成されます。 IOObjectはポートに接続でき、各反復で対応する内部入力ポートに渡されます。

出力

  • モデル(モデル)選択した各ラベル属性の予測モデルを含むマルチラベルモデル。
  • 出力(IOObject)このポートはポートエクステンダーです。つまり、ポートが接続されると、新しい出力ポートが作成されます。ポートは、内部プロセスによって提供されるすべての結果を収集し、すべての反復のコレクションを返します。

パラメーター

  • attribute_filter_typeこのパラメーターを使用すると、ラベル属性選択用のフィルターを選択できます。予測モデルがトレーニングされる属性を選択する方法。フィルターは、その特別な役割に関係のないすべての属性に適用されることに注意してください(パラメーターを含むパラメーター 、この属性選択に対してtrueに設定され、変更できません)。さまざまなフィルタータイプは次のとおりです。
    • all:このオプションは、ExampleSetのすべての属性をラベル属性として選択します。これがデフォルトのオプションです。
    • single:このオプションを使用すると、単一のラベル属性を選択できます。必須の属性は、属性パラメーターによって選択されます。
    • subset:このオプションを使用すると、リストから複数のラベル属性を選択できます(パラメーター属性を参照)。 ExampleSetのメタデータがわかっている場合、すべての属性がリストに存在し、必要な属性を簡単に選択できます。
    • regular_expression:このオプションにより、ラベル属性選択用の正規表現を指定できます。正規表現フィルターは、正規表現パラメーターによって構成されます。excessexpressionおよびexcept expressionを使用します。
    • value_type:このオプションを使用すると、特定のタイプのすべての属性を選択してラベル属性にすることができます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。値タイプフィルターは、パラメーター値タイプによって構成されます。値タイプを除く値タイプ例外を使用します。
    • block_type:このオプションを使用すると、特定のブロックタイプのすべての属性を選択してラベル属性にすることができます。ブロックタイプは階層的であることに注意する必要があります。たとえば、value_series_startおよびvalue_series_endブロックタイプは両方ともvalue_seriesブロックタイプに属します。ブロックタイプフィルターは、パラメーターブロックタイプによって構成され、ブロックタイプを除くブロックタイプ例外を使用します。
    • no_missing_values:このオプションは、ExampleSetのすべての属性を、どの例でも欠損値を含まないラベル属性として選択します。欠損値が1つでもある属性は選択されません。
    • numeric_value_filter:例がすべて特定の数値条件に一致するすべての数値属性が、ラベル属性として選択されます。条件は、数値条件パラメーターによって指定されます。

    範囲:

  • attribute 必要な属性は、このオプションから選択できます。メタデータがわかっている場合は、パラメーターのドロップダウンボックスから属性名を選択できます。範囲:
  • attributes 必要な属性は、このオプションから選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性が左側のリストにあります。それらは、選択したラベル属性のリストである右側のリストに移動できます。範囲:
  • regular_expression この式に名前が一致する属性が選択されます。式は、 正規表現の編集およびプレビューメニューで指定できます。このメニューは、正規表現の良いアイデアを提供します。また、異なる表現を試して結果を同時にプレビューすることもできます。範囲:
  • use_except_expression有効にすると、最初の正規表現の例外を指定できます。この例外は、 except regular expressionパラメーターによって指定されます。範囲:
  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この式に一致する属性は、最初の式( 正規表現パラメーターで指定された )に一致しても選択されません。範囲:
  • value_typeこのオプションにより、属性のタイプを選択できます。範囲:
  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。この例外は、 except value typeパラメーターによって指定されます。範囲:
  • except_value_typeこのタイプに一致する属性は、 value typeパラメーターで指定された前に選択されたタイプに一致した場合でも選択されません。範囲:
  • block_typeこのオプションを使用すると、属性のブロックタイプを選択できます。範囲:
  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。この例外は、 except block typeパラメーターによって指定されます。範囲:
  • except_block_typeこのブロックタイプに一致する属性は、 ブロックタイプパラメーターによって選択された前のタイプと一致した場合でも選択されません。範囲:
  • numeric_condition数値条件フィルタータイプで使用される数値条件。すべての例がこの属性に指定された条件に一致する場合、数値属性が選択されます。たとえば、数値条件「> 6」は、すべての例で6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。範囲:
  • invert_selectionこのパラメーターをtrueに設定すると、選択が逆になります。その場合、指定された条件に一致しないすべての属性がラベル属性として選択されます。範囲:
  • add_macros選択した場合、現在のラベル属性の名前と値タイプを含むマクロがサブプロセスの各反復で追加されます。範囲:
  • current_label_name_macroマクロの追加がtrueの場合、このパラメーターは、現在のラベル属性名を保持するマクロの名前を定義します。範囲:
  • current_label_type_macroマクロの追加がtrueの場合、このパラメーターは、現在のラベル属性タイプを保持するマクロの名前を定義します。範囲:
  • enable_parallel_executionこのパラメーターは、内部プロセスの並列実行を有効にします。メモリの問題が発生した場合は、並列実行を無効にしてください。範囲:

チュートリアルプロセス

タイタニックデータセットのマルチラベルモデリング

このチュートリアルプロセスでは、Titanicサンプルデータセットの「Survived」、「Port of Embarkation」、および「Age」の属性に対してマルチラベルモデルをトレーニングすることにより、マルチラベルモデリングオペレーターの基本的な使用方法を示します。

さまざまなタイプのラベル属性のさまざまなモデルのトレーニングこのチュートリアルプロセスでは、マルチラベルモデリングオペレーターを使用して、チュートリアル1と同様のタイタニックサンプルデータセットの属性「Survived」、「Port of Embarkation」、および「Age」のマルチラベルモデルをトレーニングします。すべてのラベル属性の種類のモデル、ラベル属性の種類ごとに異なるモデルが使用されます。名義ラベル属性については決定木が構築され、非名義ラベル属性については一般化線形モデルが構築されます。詳細については、プロセスのコメントを参照してください。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル