RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Read XRFF

(Advanced File Connectors)

概要

この演算子は、XRFF(eXtensible attribute-Relation File Format)ファイルの読み取りに使用されます。

 

詳細

このオペレータは、Wekaから既知のXRFFファイルを読み取ることができます。 XRFF(eXtensible attribute-Relation File Format)は、属性記述ファイル(.aml)の元のRapidMinerファイル形式に何らかの意味でARFF形式のXMLベースの拡張機能です。サンプルのXRFFファイルは、添付のプロセス例で確認できます。

データはXMLタグにラップされるため、XML表現はかなり多くのスペースを占有するため、gzipを使用してデータを圧縮することもできます。ファイルの拡張子が.xrffではなく.xrff.gzの場合、RapidMinerはgzip圧縮されているファイルを自動的に認識します。

XRFFファイルは、ヘッダーと本文の2つの部分に分かれています。ヘッダーにはメタデータの説明があり、本文にはインスタンスがあります。ヘッダーの属性仕様のclass = “yes”属性を使用して、予測ラベル属性として使用する属性を定義できます。そのようなクラスのRapidMinerの用語は「クラス」ではなく「ラベル」ですが、元のXRFFファイルとの互換性を持たせるために用語クラスをサポートしています。

 

入力

file (File)
このオプションのポートは、ファイルオブジェクトを想定しています。

 

出力

output (IOObject)
XRFFファイルは指定されたパスから読み取られ、結果のExampleSetはこのポートを介して配信されます。

 

パラメータ

data_file
このパラメータは、XRFFファイルのパスを指定します。ファイルの選択ボタンを使用して選択できます。
レンジ:filename

id_attribute
このパラメータは、id属性の名前を指定します。このフィールドでは大文字と小文字が区別されることに注意してください。
レンジ:string

datamanagement
このパラメータは、データが内部的にどのように表されるかを決定します。これはエキスパートパラメータです。さまざまなオプションがあり、ユーザーはそれらのいずれかを選択できます。
レンジ:selection

decimal_point_character
このパラメータは、小数点として使用される文字を指定します。
レンジ:string

sample_ratio
このパラメータは、読み取る必要があるデータセットの割合を指定します。 1に設定されている場合、完全なデータセットが読み取られます。 -1に設定されている場合、サンプルサイズパラメータは、読み取るデータのサイズを決定するために使用されます。
レンジ:real

sample_size
このパラメータは、読み取る必要があるサンプルの正確な数を指定します。 -1に設定されている場合、サンプル比率パラメータは、読み取るデータのサイズを決定するために使用されます。両方が-1に設定されている場合、完全なデータセットが読み取られます。
レンジ:integer

use_local_random_seed
このパラメータは、ローカルランダムシードをランダム化に使用する必要があるかどうかを示します。同じ値のローカルランダムシードを使用すると、同じランダム化が生成されます。
レンジ:boolean

local_random_seed
このパラメータは、ローカルランダムシードを指定します。このパラメータは、ローカルシードの使用パラメータがtrueに設定されている場合にのみ使用できます。
レンジ:integer

 

チュートリアルプロセス

XRFFファイルの書き込みと読み取り
このサンプルプロセスは、それぞれXRFFの書き込みおよびXRFFの読み取り演算子の使用方法を示しています。 このサンプルプロセスでは、これらの演算子を使用して、ExampleSetを読み書きする方法を示します。 「ゴルフ」データセットは、検索演算子を使用してロードされます。 このExampleSetは、Write XRFFオペレータへの入力として提供されます。 ファイル設定パラメータの例は「%{tempdir} /golf.xrff」に設定されているため、「golf.xrff」という名前のファイルがコンピューターの一時フォルダーに作成されます(存在しない場合)。 書き込まれたファイルを開いて、変更することができます(必要な場合)。 次にXRFF読み取り演算子が適用されます。 データファイルパラメータは ‘%{tempdir} /golf.xrff’に設定され、Write XRFFオペレータを使用して書き込まれたファイルを読み取ります。 残りのパラメータはデフォルト値で使用されます。 結果のExampleSetは、結果ワークスペースで確認できます。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル