RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Filter Examples

概要

この演算子は、ExampleSetのどの例を保持し、どの例を削除するかを選択します。

詳細

演算子は、指定された条件に一致する例を返します。条件はユーザーが定義します。高度なオプションとして、いくつかの事前定義された条件も存在します。

分化

Select Attributes

フィルタの例は、ExampleSetの例の数を減らすことができますが、属性の数には影響しません。属性の選択には、属性の選択演算子を使用します。

Filter Example Range

Filter Example Range演算子を使用して、指定したインデックス範囲(行数など)にある例を選択できます。

入力

  • サンプル入力 (IOObject)この入力ポートには、定義済みフィルターが適用されるExampleSetが必要です。

出力

  • 設定出力の例(IOObject)このポートは、指定された条件を満たす例のみを含むExampleSetを出力します。
  • オリジナル(IOObject)入力として与えられたExampleSetは、変更なしでパススルーされます。
  • 一致しないサンプルセット (IOObject)指定された条件を満たさなかったサンプルのみを含むExampleSet。

パラメーター

  • filtersこれは、[フィルターの追加…]ダイアログウィンドウでフィルター条件を定義するためのデフォルトのパラメーターです。 「custom_filters」 条件クラスが選択されている場合にも使用できます。このオプションを使用すると、カスタムフィルター条件を定義できます。条件は、属性、比較関数、および一致する値で構成されます。 [エントリの追加]ボタンを使用して、さらに条件を追加できます。複数のフィルターは、「すべて一致」または「すべて一致」のいずれかで結合できます。

    範囲:

  • condition_classこのパラメーターは、「show advanced parameters」がアクティブになっている場合にのみ表示されます。それ以外の場合、デフォルトの選択「custom_filters」が表示されます。例のフィルタリングには、さまざまな事前定義された条件を使用できます。選択した条件に一致する例は出力ポートに渡され、その他は削除されます。利用可能な条件は次のとおりです。
    • all:このオプションを選択すると、例は削除されません。
    • correct_predictions:このオプションを選択すると、予測が正しい例のみが返されます。このオプションでは、ExampleSetに特別なロールLabelおよびPredictionを持つ2つの属性が必要です。次に、ラベル属性と予測属性の値が同じである例のみが返されます。
    • wrong predictions:このオプションは、correct_predictionsオプションと同じですが、結果が逆になります。これらの例は一致しています。予測はラベルと同じではありません。
    • no_missing_attributes:このオプションを選択すると、欠損値のない例のみが一致します。欠損値またはヌル値は「?」として表示されますRapidMinerで。
    • missing_attributes:このオプションを選択すると、欠損値を持つ例のみが一致します。欠損値は「?」として表示されますRapidMinerで。
    • no_missing_labels:このオプションが選択された場合、ラベルロールを持つ特別な属性に欠損値がない、それらの例のみが一致します。
    • missing_labels:このオプションを選択すると、ラベルロールを持つ特別な属性に欠損値がある例のみが一致します。
    • attribute_value_filter:このオプションを選択すると、パラメーター文字列のフィールドに条件を入力できます。このオプションはデフォルトのフィルターに似ています。詳細については、パラメーター文字列の説明で以下で説明します。フィルターステートメントを文字列として宣言する利点は、マクロを使用する柔軟性が向上することです。
    • 式:このオプションを使用すると、一致条件を書き込むためのより多くの関数を提供する式を定義できます。式を使用して例をフィルタリングする方法については、パラメーター式の説明で以下で説明します。
    • custom_filters:このオプションは、デフォルトのフィルターパラメーターと同じです。

    範囲:

  • parameter_stringこのパラメーターは、パラメーター「attribute_value_filter」が条件クラスとして選択されている場合に使用可能です。条件の形式は属性名で、その後に比較関数と一致する値が続きます。数値属性の場合、比較関数は>、<、<=、> =、および=ですが、一致する値は数値でなければなりません。ノミナル属性は、=および!=によって、正規表現を含むことができる任意の文字列と比較できます。複数の条件は、論理OR(||)または論理AND(&&)でリンクできます。欠損値は「?」と書くことができます数値属性の場合は「\?」名義属性用。

    範囲:

  • parameter_expressionこのパラメーターは、パラメーター「式」が条件クラスとして選択されている場合に使用可能です。式は文字列として、または式ビルダーダイアログで入力できます。式はブール値に評価する必要があり、1つ以上の属性を含める必要があります。このオプションは、より複雑な一致条件を作成するのに役立ちます。たとえば、数学的な計算やテキスト操作が含まれます。

    範囲:

  • invert_filterこのパラメーターをtrueに設定すると、選択した条件が反転します。一致するすべての例は出力から削除され、条件に一致しない例は出力に含まれます。

    範囲:

チュートリアルプロセス

カスタムフィルターを使用したフィルターの例

このチュートリアルプロセスでは、2つのフィルター条件を組み合わせてGolf ExampleSetをフィルター処理する方法を示します。

属性値フィルターを使用したフィルターの例

このチュートリアルプロセスでは、高度なパラメーターattribute_filterを使用して条件文字列を定義します。正規表現。* n。*を使用して、Outlook属性の値に文字「n」が含まれるすべての例をフィルタリングします。 2番目のステートメントは、温度属性が70を超える例をフィルタリングします。両方の条件はORステートメント(||)で結合されます

式を使用したフィルター例

このチュートリアルプロセスでは、タイタニックデータを読み込み、式文字列を使用して、名前に「Miss」が含まれるすべての乗客を選択します。 30歳未満の男性とすべての男性の乗客。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル