RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Numerical to Polynominal

概要

この演算子は、選択された数値属性のタイプを多項式タイプに変更します。また、これらの属性のすべての値を対応する多項式値にマップします。この演算子は、選択した属性のタイプを変更するだけです。より高度な正規化方法が必要な場合は、離散化演算子を使用してください。

詳細

数値から多項式への演算子は、数値属性のタイプを多項式タイプに変更するために使用されます。この演算子は、選択した属性のタイプを変更するだけでなく、これらの属性のすべての値を対応する多項式値にマップします。選択した属性のタイプを変更するだけです。つまり、新しい数値はすべて、多項式属性の別の可能な値と見なされます。つまり、各数値は、新しい属性の名目値として単に使用されます。数値属性は、小さい範囲でも膨大な数の異なる値を持つことができるため、そのような数値属性を多項式形式に変換すると、新しい属性の膨大な数の可能な値が生成されます。このような多項式属性はあまり有用ではなく、メモリ使用量が大幅に増加する可能性があります。より高度な正規化方法が必要な場合は、離散化演算子を使用してください。離散化演算子は、「データ変換/型変換/離散化」にあります。

入力

  • サンプルセット (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。メタデータで属性が指定されているため、入力用のデータにメタデータを添付する必要があります。 Retrieveオペレーターは、メタデータとデータを提供します。 ExampleSetには、少なくとも1つの数値属性が必要です。そのような属性がない場合、この演算子の使用は意味をなさないためです。

出力

  • サンプルセット(IOObject)選択された数値属性がノミナルタイプに変換されたExampleSetは、このポートの出力です。
  • オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • attribute_filter_typeこのパラメーターを使用すると、属性選択フィルターを選択できます。多項式形式に変換する属性を選択するために使用する方法。次のオプションがあります。
    • all:このオプションは、単にExampleSetのすべての属性を選択します。これがデフォルトのオプションです。
    • single:このオプションでは、単一の属性を選択できます。このオプションを選択すると、別のパラメーター(属性)がパラメーターパネルに表示されます。 (RapidMiner 6.0.4以降、選択された属性がExampleSetにない場合、オペレーターは失敗します)
    • サブセット:このオプションを使用すると、リストから複数の属性を選択できます。 ExampleSetのすべての属性がリストに存在します。必要な属性は簡単に選択できます。メタデータが不明な場合、このオプションは機能しません。このオプションを選択すると、別のパラメーターがパラメーターパネルに表示されます。 (RapidMiner 6.0.4以降、選択された属性がExampleSetにない場合、オペレーターは失敗します)
    • regular_expression:このオプションを使用すると、属性選択用の正規表現を指定できます。このオプションを選択すると、他のパラメーター(正規表現、式以外の使用)がパラメーターパネルに表示されます。
    • value_type:このオプションを使用すると、特定のタイプのすべての属性を選択できます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。このオプションを使用して属性を選択する場合、ユーザーは型階層の基本的な理解が必要です。このオプションを選択すると、他のパラメーター(値の型、値の型の例外を使用)がパラメーターパネルに表示されます。
    • block_type:このオプションは、value_typeオプションと同様に機能します。このオプションにより、特定のブロックタイプのすべての属性を選択できます。ブロックタイプは階層的であることに注意する必要があります。たとえば、value_series_startおよびvalue_series_endブロックタイプは両方ともvalue_seriesブロックタイプに属します。このオプションを選択すると、他のいくつかのパラメーター(ブロックタイプ、ブロックタイプの例外を使用)がパラメーターパネルに表示されます。
    • no_missing_values:このオプションは、どの例でも欠損値を含まないExampleSetのすべての属性を選択するだけです。欠損値が1つでもある属性は選択されません。
    • numeric_value_filter:このオプションを選択すると、別のパラメーター(数値条件)がパラメーターパネルに表示されます。例がすべて上記の数値条件を満たす数値属性がすべて選択されます。指定された数値条件に関係なく、すべての名義属性も選択されることに注意してください。

    範囲:選択

  • attributeこのオプションから必要な属性を選択できます。メタデータがわかっている場合、 パラメータ属性のドロップダウンボックスから属性名を選択できます。 範囲:文字列
  • attributesこのオプションから必要な属性を選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性が左側のリストにあります。属性は、名義から多項式への変換が行われる選択された属性のリストである右リストにシフトできます。他のすべての属性は変更されません。 範囲:文字列
  • regular_expressionこの式に名前が一致する属性が選択されます。正規表現は非常に強力なツールですが、初心者には詳細な説明が必要です。正規表現の編集およびプレビューメニューから正規表現を指定することは常に有効です。このメニューは、正規表現の良いアイデアを提供します。また、異なる表現を試して結果を同時にプレビューすることもできます。これにより、正規表現の概念が強化されます。 範囲:文字列
  • use_except_expression有効にすると、最初の正規表現の例外を指定できます。このオプションを選択すると、別のパラメーター( 正規表現を除く )がパラメーターパネルに表示されます。 範囲:ブール
  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この式に一致する属性は、最初の式( 正規表現パラメーターで指定された )に一致する場合でも除外されます。 範囲:文字列
  • value_type選択する属性のタイプは、ドロップダウンリストから選択できます。 範囲:選択
  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。このオプションを選択すると、別のパラメーター( 値タイプを除く)がパラメーターパネルに表示されます。 範囲:ブール
  • except_value_typeこの型に一致する属性は、前述の型、つまり値型パラメーターの値に一致した場合でも、最終出力から削除されます。 範囲:選択
  • block_type選択する属性のブロックタイプは、ドロップダウンリストから選択できます。 範囲:選択
  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。このオプションを選択すると、別のパラメーター( ブロックタイプを除く )がパラメーターパネルに表示されます。 範囲:ブール
  • except_block_typeこのブロックタイプに一致する属性は、前述のブロックタイプに一致した場合でも、最終出力から削除されます。 範囲:選択
  • numeric_condition数値属性の例をテストするための数値条件をここで指定します。たとえば、数値条件「> 6」は、すべての例ですべての名義属性と6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。 「>」、「=」、「<」の後に空白を使用します。たとえば、「<5」は機能しないため、代わりに「<5」を使用します。 範囲:文字列
  • include_special_attributes特別な属性は、例を識別する特別な役割を持つ属性です。対照的に、通常の属性は単に例を示しています。特別な属性は、id、ラベル、予測、クラスター、重量、およびバッチです。デフォルトでは、すべての特別な属性は、名義から多項式への演算子の条件に関係なく選択されます。このパラメーターがtrueに設定されている場合、特殊属性は、ノミナルから多項式への演算子で指定された条件に対してもテストされ、条件を満たす属性のみが選択されます。 範囲:ブール
  • invert_selectionこのパラメーターがtrueに設定されている場合、NOTゲートとして機能し、選択を反転します。その場合、選択された属性はすべて選択解除され、以前に選択されていなかった属性が選択されます。たとえば、属性「att1」が選択され、属性「att2」がこのパラメーターの選択前に削除された場合。このパラメーターを選択すると、「att1」が削除され、「att2」が選択されます。 範囲:ブール

チュートリアルプロセス

Sonarデータセットの数値属性を多項式属性に変換する

このサンプルプロセスは、主にこの演算子の動作に焦点を当てています。この演算子のすべてのパラメーターは、主に属性を選択するためのものです。属性の選択演算子には、属性を選択するための多くの同様のパラメーターもあります。これらのパラメーターを理解する必要がある場合は、属性の選択演算子のプロセス例について学習できます。

「ソナー」データセットは、検索演算子を使用してロードされます。数値から多項式への演算子が適用されます。すべてのパラメーターはデフォルト値で使用されます。属性フィルタータイプパラメーターは「all」に設定されているため、「Sonar」データセットのすべての数値属性は名義型に変換されます。結果ワークスペースで確認できるように、数値から多項式への演算子を適用する前は、すべての属性は実数型でした。この演算子の適用後、それらはすべてノミナルタイプに変更されます。しかし、例を見ると、それらはまったく同じです。つまり、実際の値ではなく、値のタイプだけが変更されています。すべての新しい数値は、多項式属性の別の可能な値と見なされます。つまり、各数値は、新しい属性の名目値として単に使用されます。 「ソナー」データセットのほとんどすべての属性には非常に多くの異なる値があるため、これらの属性を多項式形式に変換すると、新しい属性に膨大な数の可能な値が生成されます。これらの新しい多項式属性はあまり有用ではなく、メモリ使用量を大幅に増加させる可能性があります。このようなシナリオでは、より洗練された正規化手法、つまり離散化演算子を使用することを常にお勧めします。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル