Write Special Format
(RapidMiner Studio Core)
概要
この演算子は、特別なユーザー定義形式でExampleSetまたはExampleSetのサブセットを書き込みます。
詳細
ファイルのパスは、set fileパラメータの例で指定されます。特別な形式パラメータは、正確な形式を指定するために使用されます。 $文字に続く文字は、コマンドを導入します。このコマンドの追加の引数は、角かっこで囲むことで指定できます。次のコマンドは、特別な形式のパラメータで使用できます。
o$ a:このコマンドは、デフォルトの区切り文字で区切られたすべての属性を書き込みます。
o$ a [separator]:このコマンドは、区切り文字で区切られたすべての属性を書き込みます(区切り文字は括弧で囲まれた引数として指定されます)。
o$ s [separator] [indexSeparator]:このコマンドはスパース形式で書き込みます。 separatorとindexSeparatorは、それぞれ第1引数と第2引数として提供されます。すべてのゼロ以外の属性の場合、次の文字列が連結されます:列インデックス、indexSeparatorの値、属性値。属性は、指定された区切り文字で区切られます。
o$ v [name]:このコマンドは、単一の属性の値を書き込みます。属性名は引数として指定されます。このコマンドは、通常の属性と特殊な属性の両方を書き込むために使用できます。
o$ k [index]:このコマンドは、単一の属性の値を書き込みます。属性インデックスは引数として指定されます。インデックスは0から始まります。このコマンドは、通常の属性のみを書き込むために使用できます。
o$ l:このコマンドは、ラベル属性の値を書き込みます。
o$ p:このコマンドは、予測ラベル属性の値を書き込みます。
o$ d:このコマンドは、すべてのクラスのすべての予測信頼度を ‘conf(class)= value’の形式で書き込みます
o$ d [class]:このコマンドは、定義されたクラスの予測信頼度を単純な数値として書き込みます。必要なクラスは引数として提供されます。
o$ i:このコマンドは、id属性の値を書き込みます。
o$ w:このコマンドは、サンプルの重みを書き込みます。
o$ b:このコマンドはバッチ番号を書き込みます。
o$ n:このコマンドは、改行文字を書き込みます。つまり、この文字に到達すると改行が挿入されます。
o$ t:このコマンドは、タブ文字を書き込みます。つまり、この文字に到達するとタブが挿入されます。
o$$:このコマンドはドル記号を書き込みます。
o$ [:このコマンドは、「[」文字、つまり開き角括弧を書き込みます。
o$]:このコマンドは、 ‘]’文字、つまり閉じ角括弧を書き込みます。
例を改行で区切る場合は、フォーマット文字列が$ nで終わるか、行区切り記号の追加パラメータがtrueに設定されていることを確認してください。
入力
input (IOObject)
この入力ポートには、ExampleSetが必要です。 これは、添付のプロセス例のモデルの適用演算子の出力です。 他の演算子の出力も入力として使用できます。
出力
through (IOObject)
入力ポートで提供されたExampleSetは、変更なしでこの出力ポートを介して配信されます。 これは通常、プロセスのさらに別の演算子で同じExampleSetを再利用するために使用されます。
パラメータ
example_set_file
ExampleSetは、このパラメータで指定されたファイルに書き込まれます。
レンジ:filename
special_format
このパラメータは、ファイルの正確な形式を指定します。形式を指定するための多くのコマンドが利用可能です。これらのコマンドについては、この演算子の説明で説明しています。
レンジ:string
fraction_digits
このパラメータは、出力ファイルの小数桁数を指定します。このパラメータは、実数を四捨五入するために使用されます。このパラメータを-1に設定すると、可能なすべての数字が書き込まれます。つまり、丸めは行われません。
レンジ:integer
quote_nominal_values
このパラメータは、名目値を二重引用符で囲む必要があるかどうかを示します。
レンジ:boolean
add_line_separator
このパラメータは、各例の後に改行が必要かどうかを示します。 trueに設定すると、各例の後に自動的に改行が続きます。
レンジ:boolean
zipped
このパラメータは、データファイルのコンテンツを圧縮するかどうかを示します。
レンジ:boolean
overwrite_mode
このパラメータは、既存のファイルを上書きするか、データを追加するかを示します。
レンジ:selection
encoding
これはエキスパートパラメータです。さまざまなオプションがあり、ユーザーはそれらのいずれかを選択できます
レンジ:selection
チュートリアルプロセス
ユーザー定義形式でラベル付きデータセットを書き込む
k-NN分類モデルは、「ゴルフ」データセットでトレーニングされます。 その後、モデルの適用演算子を使用して、トレーニングされたモデルが「Golf-Testset」データセットに適用されます。 結果のラベル付きデータセットは、特別な形式の書き込み演算子を使用してファイルに書き込まれます。 Write Special Formatオペレータのパラメータをご覧ください。 ExampleSetが「special」という名前のファイルに書き込まれていることがわかります。 特別なフォーマットパラメータは ‘$ [$ l $] $ t $ p $ t $ d [yes] $ t $ d [no]’に設定されます。 このフォーマット文字列は多数のコマンドで構成され、「[label] predicted_label Confidence(yes)Confidence(no)」と解釈できます。 このフォーマット文字列は、ファイルに4つの属性、つまり「ラベル」、「予測ラベル」、「信頼性(はい)」、および「信頼性(いいえ)」が書き込まれることを示しています。 各属性はタブで区切る必要があります。 ラベル属性は角括弧で囲む必要があります。 プロセスを実行し、確認のために書き込まれたファイルを確認します。