RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Select Attributes

概要

この演算子は、ExampleSetの属性のサブセットを選択し、他の属性を削除します。

詳細

オペレーターは、属性の選択を容易にするさまざまなフィルタータイプを提供します。可能性は、たとえば次のとおりです。属性の直接選択。正規表現による選択、または欠損値のない属性のみの選択。さまざまなフィルタータイプの詳細な説明については、パラメーター属性フィルタータイプを参照してください。

選択を反転パラメータは、選択を逆にします。特別な属性(id、label、weightなどの役割を持つ属性)は、デフォルトでは選択で無視されます。それらは、結果の出力ExampleSetに常に残ります。パラメータが特別な属性を含むと、これが変わります。

選択した属性のみが出力ポートに配信されます。残りはExampleSetから削除されます。

分化

<…>演算子による選択

さまざまな入力に応じて属性を選択する演算子がいくつかあります。たとえば、重みで選択は、指定された基準に一致する重みを持つ属性を選択します。ランダム選択演算子は、属性のランダムなサブセットを選択します。属性範囲の削除は、属性のインデックスに従って属性の範囲を削除します。役に立たない属性の削除演算子は、指定されたいくつかの基準に従って役に立たないと考えられる属性を削除します。相関属性の削除演算子は、相互に関連付けられている属性を削除します。

Work on Subset

この演算子は、属性の選択演算子とサブプロセス演算子の組み合わせです。属性フィルタータイプによって選択された属性のみを持つExampleSetに、内部プロセスのオペレーターを適用します。内部結果は、入力ExampleSet全体にマージされます。

Forward Selection

これは、前方選択機能の選択方法の実装です。オペレーター内でトレーニングされたモデルに従って、最も関連性の高い属性を選択します。詳細については、Forward Selection Operatorのドキュメントを参照してください。

Backward Elimination

これは、後方除去機能の選択方法の実装です。オペレーター内でトレーニングされたモデルに従って、最も関連性の高い属性を選択します。詳細については、Forward Selection Operatorのドキュメントを参照してください。

Filter Examples

この演算子は属性を選択しませんが、例をフィルタリング(または選択)します。したがって、これは属性の選択と同様の操作ですが、属性ではなく例に適用されます。

入力

  • サンプルセット (IOObject)この入力ポートには、属性を選択するExampleSetが必要です。

出力

  • サンプルセット(IOObject)選択した属性のみを含むExampleSetがこの出力ポートに配信されます。
  • オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。

パラメーター

  • attribute_filter_typeこのパラメーターを使用すると、属性選択フィルターを選択できます。属性の選択に使用する方法。次のオプションがあります。
    • all:このオプションは、ExampleSetのすべての属性を選択します。属性は削除されません。これがデフォルトのオプションです。
    • single:このオプションでは、単一の属性を選択できます。必須の属性は、属性パラメーターによって選択されます。
    • サブセット:このオプションを使用すると、リストから複数の属性を選択できます(パラメーター属性を参照)。 ExampleSetのメタデータがわかっている場合、すべての属性がリストに存在し、必要な属性を簡単に選択できます。
    • regular_expression:このオプションにより、属性選択の正規表現を指定できます。正規表現フィルターは、正規表現パラメーターによって構成されます。excessexpressionおよびexcept expressionを使用します。
    • value_type:このオプションにより、特定のタイプのすべての属性を選択できます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。値タイプフィルターは、パラメーター値タイプによって構成されます。値タイプを除く値タイプ例外を使用します。
    • block_type:このオプションを使用すると、特定のブロックタイプのすべての属性を選択できます。ブロックタイプは階層的であることに注意する必要があります。たとえば、value_series_startおよびvalue_series_endブロックタイプは両方ともvalue_seriesブロックタイプに属します。ブロックタイプフィルターは、パラメーターブロックタイプによって構成され、ブロックタイプを除くブロックタイプ例外を使用します。
    • no_missing_values:このオプションは、例に欠損値を含まないExampleSetのすべての属性を選択します。欠損値が1つでもある属性は削除されます。
    • numeric_value_filter:例がすべて所定の数値条件に一致するすべての数値属性が選択されます。条件は、数値条件パラメーターによって指定されます。すべての名目上の属性も、指定された数値条件に関係なく選択されることに注意してください。

    範囲:

  • attribute必要な属性は、このオプションから選択できます。メタデータがわかっている場合、パラメータのドロップダウンボックスから属性名を選択できます。範囲:
  • attributesこのオプションから必要な属性を選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性が左側のリストにあります。それらは、出力ポートに到達する選択された属性のリストである右リストにシフトできます。範囲:
  • regular_expressionこの式に名前が一致する属性が選択されます。式は、 正規表現の編集およびプレビューメニューで指定できます。このメニューは、正規表現の良いアイデアを提供します。また、異なる表現を試して結果を同時にプレビューすることもできます。範囲:
  • use_except_expression有効にすると、最初の正規表現の例外を指定できます。この例外は、 except regular expressionパラメーターによって指定されます。範囲:
  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この表現に一致する属性は、最初の表現( 正規表現パラメーターで指定された表現 )に一致する場合でも除外されます。範囲:
  • value_typeこのオプションにより、属性のタイプを選択できます。次のタイプのいずれかを選択できます:名義、数値、整数、実数、テキスト、二項、多項式、file_path、date_time、date、time。範囲:
  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。この例外は、 except value typeパラメーターによって指定されます。範囲:
  • except_value_typeこのタイプに一致する属性は、 値タイプパラメーターで指定された前に選択されたタイプと一致した場合でも、最終出力から削除されます。ここでは、名義、数値、整数、実数、テキスト、二項、多項式、file_path、date_time、date、timeのいずれかのタイプを選択できます。範囲:
  • block_typeこのオプションにより、属性のブロックタイプを選択できます。次のタイプのいずれかを選択できます:single_value、value_series、value_series_start、value_series_end、value_matrix、value_matrix_start、value_matrix_end、value_matrix_row_start。範囲:
  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。この例外は、 except block typeパラメーターによって指定されます。範囲:
  • except_block_typeこのブロックタイプに一致する属性は、 ブロックタイプパラメーターによって選択された前のタイプと一致した場合でも、最終出力から削除されます。ここでは、single_value、value_series、value_series_start、value_series_end、value_matrix、value_matrix_start、value_matrix_end、value_matrix_row_startのいずれかのブロックタイプを選択できます。範囲:
  • numeric_condition数値条件フィルタータイプで使用される数値条件。すべての例がこの属性に指定された条件に一致する場合、数値属性が保持されます。たとえば、数値条件「> 6」は、すべての例で6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。指定された数値条件に関係なく、公称属性は常に保持されます。範囲:
  • include_special_attributes特別な属性は、特別な役割を持つ属性です。これらは、ID、ラベル、予測、クラスター、重量、バッチです。また、カスタムロールを属性に割り当てることができます。デフォルトでは、属性の選択演算子の条件に関係なく、すべての特別な属性が出力ポートに配信されます。このパラメーターがtrueに設定されている場合、特別な属性も属性選択演算子で指定された条件に対してテストされ、条件に一致する属性のみが選択されます。範囲:
  • invert_selectionこのパラメーターをtrueに設定すると、選択が逆になります。その場合、指定された条件に一致するすべての属性が削除され、他の属性は出力ExampleSetに残ります。特別な属性は、特別な属性を含めるパラメーターがtrueに設定されていないため、 反転選択パラメーターとは無関係に保持されます。その場合、条件は特別な属性にも適用され、このパラメーターがチェックされている場合は選択が逆になります。範囲:

チュートリアルプロセス

タイタニックデータサンプルからの属性の選択

このチュートリアルプロセスでは、属性の選択演算子の基本的な使用方法を示します。最初に、「Titanic」データがSamplesフォルダーから取得されます。最初の属性選択演算子は、属性のサブセットを選択します。サブセットは、attributesパラメーターによって指定されます。

元の出力ポートは、2番目の属性選択演算子の入力ポートに接続されます。名目上の属性のみが選択されています。

属性選択演算子のさまざまな使用法

このチュートリアルのプロセスは、属性選択演算子のさまざまな使用法を示しています。デモExampleSetは、サブプロセスOeprator内に作成されます。 3つの特別な属性(id、label、weight)と5つの通常の属性(att1、att2、att3、att4、att5)があります。また、さまざまな属性タイプが使用されます(数値:id、二項:ラベル、数値:重量、実数:att1、att2、att4、att5、名義:att3)。サブプロセス演算子の後にブレークポイントが挿入され、デモのExampleSetを調査します。

次に、いくつかの属性選択演算子を使用して、さまざまな属性フィルタータイプとパラメーターとの組み合わせを表示し、選択を反転し、特別な属性を含めます。

詳細については、プロセスのコメントを参照してください。

正規表現を使用して属性を選択する

このチュートリアルのプロセスでは、正規表現を使用して、労使交渉データサンプルから属性を選択する方法を説明します。指定される正規表現は次のとおりです。w。* |。* y。*

これは、「w」で始まるすべての属性(w。*)または(|)名前に「y」が含まれるすべての属性(。* y。*)が式と一致することを意味します。労働交渉データセットの次の属性は、この式に一致します。

賃金-inc-1st、賃金-inc-2nd、賃金-inc-3rd、労働時間、スタンバイペイ、法定休日、長期障害者支援。

式パラメータ以外の使用もtrueに設定されます。したがって、except regular expressionパラメータの条件に一致する属性は削除されます。正規表現を除いて指定されるのは、。* \ [0-9 \]。*です。これは、名前に数字が含まれるすべての属性が削除されることを意味します。

最後に、次の4つの属性が選択されます:勤務時間、スタンバイペイ、法定休日、長期障害者支援。特別なAttributeクラスも保持されます。

正規表現の詳細については、正規表現パラメーターの構成を参照してください。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル