RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Replace (Dictionary)

概要

この演算子は、2番目のExampleSetで指定された辞書を使用して、最初のExampleSetの選択された名義属性のサブストリング(値)を置換します。

詳細

この演算子は、入力として2つのExampleSetを取ります。 2番目のExampleSetで定義された値マッピングを使用して、最初のExampleSetの選択された名義属性のサブストリング(値)を置換します。この演算子は、2番目のExampleSetを辞書として使用します。 2番目のExampleSetには、値マッピングの2つの公称属性、つまり「from」属性(つまりfrom属性パラメーターで指定)と「to」属性(つまりto属性パラメーターで指定)が必要です。 2番目のExampleSetのすべての例では、「from属性」値と「to属性」値を一致させる辞書エントリが作成されます。最後に、このディクショナリは、最初のExampleSetのサブストリングを置き換えるために使用されます。最初のExampleSetの選択された名義属性に2番目のExampleSetの「from」属性の値が(全体または部分文字列として)見つかった場合、「to」属性の対応する値が最初のExampleSetのサブストリング。理解を深めるために、添付のプロセス例をご覧ください。

入力

  • サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のRetrieveオペレーターの出力です。他の演算子の出力も入力として使用できます。 ExampleSetには、少なくとも1つの名義属性が必要です。そのような属性がない場合、この演算子の使用は意味をなさないためです。このExampleSetのサブストリングは、2番目のExampleSetを使用して置き換えられます。
  • 辞書 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のサブプロセス演算子の出力です。他の演算子の出力も入力として使用できます。このExampleSetには、この演算子の説明で指定されている「属性から」および「属性へ」が必要です。これらの属性は、最初のExampleSetのサブストリング置換に使用されます。

出力

  • 設定出力の例(IOObject)最初のExampleSetの選択された名義属性のサブストリングが置き換えられ、結果のExampleSetがこのポートを介して配信されます。
  • オリジナル(IOObject)入力として指定された最初のExampleSetは、このポートを介して出力に変更されることなく渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。
  • 前処理モデル(前処理モデル)このポートは、現在のプロセスにおけるこの演算子のパラメーターに関する情報を含む前処理モデルを提供します。

パラメーター

  • create_view基礎となるデータを変更する代わりに、ビューを作成することが可能です。このパラメータを選択して、このオプションを有効にします。通常、データに対して直接実行される変換は、値が要求されるたびに計算され、データを変更せずに結果が返されます。 範囲:ブール
  • attribute_filter_typeこのパラメーターを使用すると、属性選択フィルターを選択できます。必要な属性を選択するために使用する方法。次のオプションがあります。
    • all:このオプションは、単にExampleSetのすべての属性を選択します。これがデフォルトのオプションです。
    • single:このオプションでは、単一の属性を選択できます。このオプションを選択すると、別のパラメーター(属性)がパラメーターパネルに表示されます。
    • サブセット:このオプションを使用すると、リストから複数の属性を選択できます。 ExampleSetのすべての属性がリストに存在します。必要な属性は簡単に選択できます。メタデータが不明な場合、このオプションは機能しません。このオプションを選択すると、別のパラメーターがパラメーターパネルに表示されます。
    • regular_expression:このオプションを使用すると、属性選択用の正規表現を指定できます。このオプションを選択すると、他のパラメーター(正規表現、式以外の使用)がパラメーターパネルに表示されます。
    • value_type:このオプションを使用すると、特定のタイプのすべての属性を選択できます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。このオプションを使用して属性を選択する場合、ユーザーはタイプ階層の基本を理解している必要があります。選択すると、他のパラメーター(値タイプ、値タイプの例外を使用)がパラメーターパネルに表示されます。
    • block_type:このオプションは、値タイプのオプションと機能が似ています。このオプションにより、特定のブロックタイプのすべての属性を選択できます。このオプションを選択すると、他のいくつかのパラメーター(ブロックタイプ、ブロックタイプの例外を使用)がパラメーターパネルに表示されます。
    • no_missing_values:このオプションは、どの例でも欠損値を含まないExampleSetのすべての属性を選択するだけです。欠損値が1つでもある属性は削除されます。
    • 数値フィルター:このオプションを選択すると、パラメーターパネルに別のパラメーター(数値条件)が表示されます。例がすべて上記の数値条件を満たす数値属性がすべて選択されます。指定された数値条件に関係なく、すべての名義属性も選択されることに注意してください。

    範囲:選択

  • attributeこのオプションから目的の属性を選択できます。メタデータがわかっている場合は、 属性パラメーターのドロップダウンボックスから属性名を選択できます。 範囲:文字列
  • attributesこのオプションから必要な属性を選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性は左側のリストに存在し、右側のリストにシフトできます。右側のリストは、名義から数値への変換が行われる選択された属性のリストです。他のすべての属性は変更されません。 範囲:文字列
  • regular_expressionこの式と名前が一致する属性が選択されます。正規表現は非常に強力なツールですが、初心者には詳細な説明が必要です。正規表現の編集およびプレビューメニューから正規表現を指定することは常に有効です。このメニューは、正規表現の良いアイデアを提供します。このメニューでは、異なる表現を試して、結果を同時にプレビューすることもできます。これにより、正規表現の概念が強化されます。 範囲:文字列
  • use_except_expression有効にすると、選択したタイプの例外を指定できます。このオプションを選択すると、別のパラメーター( 値のタイプを除く )がパラメーターパネルに表示されます。 範囲:ブール
  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この式に一致する属性は、最初の式( 正規表現パラメーターで指定された )に一致する場合でも除外されます。 範囲:文字列
  • value_type選択する属性のタイプは、ドロップダウンリストから選択できます。次のタイプのいずれかを選択できます:名義、テキスト、二項、多項式、ファイルパス。 範囲:選択
  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。このオプションを選択すると、別のパラメーター( 値のタイプを除く )がパラメーターパネルに表示されます。 範囲:ブール
  • except_value_typeこの型に一致する属性は、前述の型、つまり値型パラメーターの値に一致した場合でも、最終出力から削除されます。ここでは、nominal、text、binominal、polynominal、file_pathのいずれかのタイプを選択できます。 範囲:選択
  • block_type選択する属性のブロックタイプは、ドロップダウンリストから選択できます。ここで可能な値は「single_value」のみです。範囲:選択
  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。このオプションを選択すると、別のパラメーター( ブロックタイプを除く )がパラメーターパネルに表示されます。 範囲:ブール
  • except_block_typeこのブロックタイプに一致する属性は、前述のブロックタイプに一致した場合でも、最終出力から削除されます。 範囲:選択
  • numeric_condition数値属性の例をテストするための数値条件をここで指定します。たとえば、数値条件「> 6」は、すべての例ですべての名義属性と6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし、&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。 「>」、「=」、「<」の後に空白を使用します。たとえば、「<5」は機能しないため、代わりに「<5」を使用します。 範囲:文字列
  • include_special_attributes特別な属性は、例を識別する特別な役割を持つ属性です。対照的に、通常の属性は単に例を示しています。特別な属性は、id、ラベル、予測、クラスター、重量、およびバッチです。 範囲:ブール
  • invert_selectionこのパラメーターがtrueに設定されている場合、NOTゲートとして機能し、選択を反転します。その場合、選択された属性はすべて選択解除され、以前に選択されていなかった属性が選択されます。たとえば、属性「att1」が選択され、このパラメーターのチェック前に属性「att2」が選択されていない場合。このパラメーターを確認すると、「att1」が選択解除され、「att2」が選択されます。 範囲:ブール
  • from_attributeこのパラメーターは、置換されるサブストリングを指定する2番目のExampleSetの属性の名前を指定します。 範囲:文字列
  • to_attributeこのパラメーターは、サブストリングの置換を指定する2番目のExampleSetの属性の名前を指定します。 範囲:文字列
  • use_regular_expressionsこのパラメーターは、置換を正規表現として扱うかどうかを指定します。 範囲:ブール
  • convert_to_lowercaseこのパラメーターは、文字列を小文字に変換するかどうかを指定します。 範囲:ブール
  • first_match_onlyこのパラメーターは、辞書の最初の一致のみを考慮するかどうかを指定します。 falseに設定すると、以降の一致が繰り返し適用されます。 範囲:ブール

チュートリアルプロセス

辞書を使用して部分文字列を置き換える

「ゴルフ」データセットは、検索演算子を使用してロードされます。このExampleSetを見ることができるように、ブレークポイントがここに挿入されます。このExampleSetは、Replace(Dictionary)演算子の最初のExampleSetとして使用されます。したがって、このExampleSetでは部分文字列の置換が行われます。 2番目のExampleSetは、サブプロセス演算子によって提供されます。 Subprocess演算子内の演算子チェーンは、このプロセスの辞書ExampleSetを生成します。この演算子の内部チェーンの説明はここでは関係ありません。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。このExampleSetには、2つの公称属性「att1」と「att2」があることがわかります。 Replace(Dictionary)演算子は、これら2つのExampleSetを入力として受け取り、2番目のExampleSetを使用して、最初のExampleSetのサブストリング置換を行います。 Replace(Dictionary)演算子のパラメーターをご覧ください。属性フィルタータイプパラメーターは ‘all’に設定されているため、最初のExampleSetのすべての属性でサブストリング置換が行われます。 from属性およびto属性パラメーターは、それぞれ「att1」および「att2」に設定されます。したがって、 ‘att1’属性の値(つまり ‘true’および ‘false’)が最初のExampleSetのいずれかの属性で見つかった場合、対応する ‘att2’属性値(つまり ‘YES’および ‘NO’に置き換えられます) ‘それぞれ)。他のすべてのパラメーターはデフォルト値で使用されます。プロセスを実行し、結果のExampleSetを元のExampleSetと比較します。 Wind属性で、サブストリング「true」と「false」がそれぞれ「YES」と「NO」に置き換えられていることがはっきりとわかります。この演算子はサブストリング置換ツールであることに注意してください。ただし、このプロセスでは値の置換に使用されました。 「att1」属性の値が「true」ではなく「tr」だった場合。この部分文字列のすべての出現は「YES」に置き換えられます。その場合、Wind属性の「true」値は「YESue」に変更されます。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル