RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Format Numbers

概要

この演算子は、指定した形式に従って選択した数値属性を再フォーマットし、属性を名義に変更します。

詳細

この演算子は、数値を解析し、指定された形式にフォーマットします。形式は、 format typeパラメーターで指定されます。整数(123など)、固定小数点数(123.4など)、科学表記法(1.23E4など)、パーセンテージ(12%など)、通貨額(123ドルなど)を含むさまざまな種類の数値形式をサポートします。この演算子は数値属性でのみ機能し、結果の形式が再解析可能な数値であっても、結果はいずれの場合も名目上の属性になることに注意してください。

フォーマットタイプパラメータが「パターン」に設定されている場合、 パターンパラメータはフォーマットの定義に使用されます。正数と負数の2つの異なる形式を使用する必要がある場合、それらの形式はセミコロン「;」で区切って定義できます。 パターンパラメーターは、パターンを定義するための柔軟性を提供します。パターンの定義に使用できる重要な構造を以下にリストします。括弧内の構造はオプションです。

  • パターン:=サブパターン{;サブパターン}
  • サブパターン:= {prefix} integer {.fraction} {suffix}
  • prefix:=空白を含む任意の文字の組み合わせ
  • サフィックス:=空白を含む任意の文字の組み合わせ
  • 整数:=#* 0 * 0
  • 分数:= 0 *#*

0 *および#*は、それぞれ複数の0または#を表します。 0および#は同様の機能を実行しますが、0はすべての数字の長さが同じであることを保証します。つまり、数字が欠落している場合は0に置き換えられます。たとえば、54はパターン「0000」で0054 「####」。

次のプレースホルダーは、 パターンパラメーター内で使用できます。

  • . 小数点のプレースホルダー。
  • , グループ化セパレーターのプレースホルダー。
  • Eは、指数形式の仮数と指数を分離します。
  • – デフォルトの負のプレフィックス。
  • % 100で乗算し、パーセンテージで表示します。
  • ‘ プレフィックスまたはサフィックスの特殊文字を引用するために使用されます。

format typeパラメーターが「pattern」に設定されている場合、 localeパラメーターは無視されます 。他の場合には、その役割を果たします。たとえば、 フォーマットタイプパラメータが「通貨」に設定されている場合、 ロケールパラメータはその通貨(ドル、ユーロなど)の表記を指定します

入力

  • サンプル入力 (IOObject)この入力ポートには、ExampleSetが必要です。これは、添付のプロセス例のデータ生成演算子の出力です。他の演算子の出力も入力として使用できます。 ExampleSetには、少なくとも1つの数値属性が必要です。そのような属性がない場合、この演算子の使用は意味をなさないためです。

出力

  • サンプル出力(IOObject)選択された数値属性は再フォーマットされ、名義に変換され、結果のExampleSetがこのポートを介して配信されます。
  • オリジナル(IOObject)入力として指定されたExampleSetは、このポートを介して出力に変更せずに渡されます。これは通常、別の演算子で同じExampleSetを再利用するため、または結果ワークスペースでExampleSetを表示するために使用されます。

パラメーター

  • attribute_filter_typeこのパラメーターを使用すると、属性選択フィルターを選択できます。必要な属性を選択するために使用する方法。次のオプションがあります。
    • all:このオプションは、単にExampleSetのすべての属性を選択します。これがデフォルトのオプションです。
    • single:このオプションでは、単一の属性を選択できます。このオプションを選択すると、別のパラメーター(属性)がパラメーターパネルに表示されます。 (RapidMiner 6.0.4以降、選択された属性がExampleSetにない場合、オペレーターは失敗します)
    • subset:このオプションを使用すると、リストから複数の属性を選択できます。 ExampleSetのすべての属性がリストに存在します。必要な属性は簡単に選択できます。メタデータが不明な場合、このオプションは機能しません。このオプションを選択すると、別のパラメーターがパラメーターパネルに表示されます。 (RapidMiner 6.0.4以降、選択された属性がExampleSetにない場合、オペレーターは失敗します)
    • regular_expression:このオプションを使用すると、属性選択用の正規表現を指定できます。このオプションを選択すると、他のパラメーター(正規表現、式以外の使用)がパラメーターパネルに表示されます。
    • value_type:このオプションを使用すると、特定のタイプのすべての属性を選択できます。型は階層的であることに注意してください。たとえば、実数型と整数型は両方とも数値型に属します。このオプションを使用して属性を選択する場合、ユーザーはタイプ階層の基本を理解している必要があります。このオプションを選択すると、他のパラメーター(値タイプ、値タイプの例外を使用)がパラメーターパネルに表示されます。
    • block_type:このオプションは、値タイプのオプションと機能が似ています。このオプションにより、特定のブロックタイプのすべての属性を選択できます。このオプションを選択すると、他のいくつかのパラメーター(ブロックタイプ、ブロックタイプの例外を使用)がパラメーターパネルに表示されます。
    • no_missing_values:このオプションは、どの例でも欠損値を含まないExampleSetのすべての属性を選択するだけです。欠損値が1つでもある属性は削除されます。
    • numeric value filter:このオプションを選択すると、パラメーターパネルに別のパラメーター(数値条件)が表示されます。例がすべて上記の数値条件を満たす数値属性がすべて選択されます。指定された数値条件に関係なく、すべての名義属性も選択されることに注意してください。

    範囲:選択

  • attributeこのオプションから目的の属性を選択できます。メタデータがわかっている場合は、 属性パラメーターのドロップダウンボックスから属性名を選択できます。 範囲:文字列
  • attributesこのオプションから必要な属性を選択できます。これにより、2つのリストを含む新しいウィンドウが開きます。すべての属性は左側のリストにあり、右側のリストに移動できます。右側のリストは、名義から数値への変換が行われる選択された属性のリストです。他のすべての属性は変更されません。 範囲:文字列
  • regular_expressionこの式と名前が一致する属性が選択されます。正規表現は非常に強力なツールですが、初心者には詳細な説明が必要です。正規表現の編集およびプレビューメニューから正規表現を指定することは常に有効です。このメニューは、正規表現の良いアイデアを提供します。このメニューでは、異なる表現を試して、結果を同時にプレビューすることもできます。これにより、正規表現の概念が強化されます。 範囲:文字列
  • use_except_expression有効にすると、選択したタイプの例外を指定できます。このオプションを選択すると、別のパラメーター( 値のタイプを除く )がパラメーターパネルに表示されます。 範囲:ブール
  • except_regular_expressionこのオプションを使用すると、正規表現を指定できます。この式に一致する属性は、最初の式( 正規表現パラメーターで指定された )に一致する場合でも除外されます。 範囲:文字列
  • value_type選択する属性のタイプは、ドロップダウンリストから選択できます。次のタイプのいずれかを選択できます:名義、テキスト、二項、多項式、ファイルパス。 範囲:選択
  • use_value_type_exception有効にすると、選択したタイプの例外を指定できます。このオプションを選択すると、別のパラメーター( 値のタイプを除く )がパラメーターパネルに表示されます。 範囲:ブール
  • except_value_typeこの型に一致する属性は、前述の型、つまり値型パラメーターの値に一致した場合でも、最終出力から削除されます。ここでは、nominal、text、binominal、polynominal、file_pathのいずれかのタイプを選択できます。 範囲:選択
  • block_type選択する属性のブロックタイプは、ドロップダウンリストから選択できます。ここで可能な値は「single_value」のみです。範囲:選択
  • use_block_type_exception有効にすると、選択したブロックタイプの例外を指定できます。このオプションを選択すると、別のパラメーター( ブロックタイプを除く )がパラメーターパネルに表示されます。 範囲:ブール
  • except_block_typeこのブロックタイプに一致する属性は、前述のブロックタイプに一致した場合でも、最終出力から削除されます。 範囲:選択
  • numeric_condition数値属性の例をテストするための数値条件をここで指定します。たとえば、数値条件「> 6」は、すべての例ですべての名義属性と6より大きい値を持つすべての数値属性を保持します。条件の組み合わせが可能です: ‘> 6 && <11’または ‘<= 5 || <0 ‘。しかし&&および|| 1つの数値条件で一緒に使用することはできません。 ‘(> 0 && <2)のような条件|| (> 10 && <12) ‘は、&&と||の両方を使用するため許可されません。 「>」、「=」、「<」の後に空白を使用します。たとえば、「<5」は機能しないため、代わりに「<5」を使用します。 範囲:文字列
  • include_special_attributes特別な属性は、例を識別する特別な役割を持つ属性です。対照的に、通常の属性は単に例を示しています。特別な属性は、id、ラベル、予測、クラスター、重量、およびバッチです。 範囲:ブール
  • invert_selectionこのパラメーターがtrueに設定されている場合、NOTゲートとして機能し、選択を反転します。その場合、選択された属性はすべて選択解除され、以前に選択されていなかった属性が選択されます。たとえば、属性「att1」が選択され、このパラメーターのチェック前に属性「att2」が選択されていない場合。このパラメーターを確認すると、「att1」が選択解除され、「att2」が選択されます。 範囲:ブール
  • format_typeこのパラメーターは、選択した数値属性に対して実行するフォーマットのタイプを指定します。 範囲:選択
  • patternこのパラメーターは、 format typeパラメーターが「pattern」に設定されている場合にのみ使用可能です。このパラメーターは、数値をフォーマットするためのパターンを指定します。このパラメータのさまざまな構造と置換パターンは、この演算子の説明で説明されています。 範囲:文字列
  • localeこれはエキスパートパラメータです。ロケールの長いリストが提供されます。ユーザーはそれらのいずれかを選択できます。 範囲:選択
  • use_groupingこのパラメーターは、大きな数字にグループ化文字を使用する必要があるかどうかを示します。 範囲:ブール

チュートリアルプロセス

数値を通貨形式に変更する

このプロセスは、「att1」という名前の数値属性を持つランダムなExampleSetを生成するデータの生成演算子から始まります。 ExampleSetを見ることができるように、ブレークポイントがここに挿入されます。この属性の形式を通貨形式に変更するために、Format Numbers演算子が適用されます。属性フィルタータイプパラメーターは「single」に設定され、属性パラメーターは「att1」に設定されて、必要な属性が選択されます。形式タイプのパラメーターは「通貨」に設定されます。プロセスを実行し、結果ワークスペースに切り替えます。 「att1」属性が数値から名義型に変更されており、その値は通貨形式に変換されているため、先頭に「$」記号が付いていることがわかります。ロケールパラメータは、必要な通貨を指定します。このプロセスでは、ロケールパラメータは「英語(米国)」に設定されていたため、数値は米国の通貨(ドル)に変換されました。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル