Filter Example Range
概要
この演算子は、ExampleSetのどの例(行)を保持し、どの例を削除するかを選択します。指定されたインデックス範囲内の例は保持され、残りの例は削除されます。
詳細
この演算子は、入力としてExampleSetを取り、指定されたインデックス範囲内にあるサンプルのみを含む新しいExampleSetを返します。インデックス範囲の下限と上限は、 最初の例と最後の例のパラメーターを使用して指定されます。この演算子は、ExampleSetの例の数を減らすことができますが、属性の数には影響しません。属性の選択演算子は、必要な属性を選択するために使用されます。
インデックス範囲以外のオプションでサンプルをフィルターする場合は、フィルターサンプル演算子を使用できます。 ExampleSetを入力として受け取り、指定された条件を満たす例のみを含む新しいExampleSetを返します。いくつかの事前定義された条件が提供されます。ユーザーはそれらのいずれかを選択できます。ユーザーは独自の条件を定義して、例をフィルタリングすることもできます。 Filter Examples演算子は、欠損値を持つ(または持たない)サンプルをフィルタリングするために頻繁に使用されます。また、(通常は学習したモデルをテストした後に)正しい予測または間違った予測を使用して例をフィルタリングするためにも頻繁に使用されます。
入力
- サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。添付のプロセス例のRetrieveオペレーターの出力です。
出力
- 設定出力の例(IOObject)指定されたインデックス範囲内にあるサンプルのみを含む新しいExampleSetは、このポートの出力です。
- オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
パラメーター
- first_exampleこのパラメーターは、インデックス範囲の下限を設定するために使用されます。 最後の例のパラメーターは、インデックス範囲の上限を設定するために使用されます。このインデックス範囲内の例は、出力ポートに配信されます。このインデックス範囲外の例は破棄されます。 範囲:整数
- last_exampleこのパラメーターは、インデックス範囲の上限を設定するために使用されます。 最初のパラメータ例は、インデックス範囲の下限を設定するために使用されます。このインデックス範囲内の例は、出力ポートに配信されます。このインデックス範囲外の例は破棄されます。 範囲:整数
- invert_filterこのパラメーターがtrueに設定されている場合、NOTゲートとして機能し、選択を反転します。その場合、選択されたすべての例が削除され、以前に削除された例が選択されます。つまり、インデックス範囲を反転させます。たとえば、 最初のサンプルパラメータが1に設定され、 最後のサンプルパラメータが10に設定されている場合、出力ポートは最初の10個のサンプル以外のすべてのサンプルを含むExampleSetを配信します。 範囲:ブール
チュートリアルプロセス
反転フィルターパラメーターを使用したフィルターの例
「ゴルフ」データセットは、検索演算子を使用してロードされます。 Generate ID演算子は、オフセットを0に設定して適用されます。したがって、すべての例には1〜14の一意のIDが割り当てられます。これは、例を簡単に区別できるようにするためです。ここにブレークポイントが挿入されるため、「範囲のフィルターの例」演算子を適用する前にデータセットを確認できます。 Filter Example Range演算子では、最初のサンプルパラメーターが5に設定され、最後のサンプルパラメーターが10に設定されます。invertフィルターパラメーターもtrueに設定されます。したがって、インデックス範囲5〜10の例以外のすべての例は、出力ポートを介して配信されます。 IDを使用して行を明確に識別できます。 IDが1〜4および11〜14の行は、出力ポートに到達します。