RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Read Sparse

(Advanced File Connectors)

概要

この演算子は、スパース形式で記述されたファイルを読み取るために使用されます。

 

詳細

この演算子は、スパース形式のファイルを読み取ります。 スパースファイルの行の形式は次のとおりです。

label index:value index:value index:value…

ここで、indexは、通常の属性またはプレフィックスマップパラメータで指定されたプレフィックスのいずれかの整数(1から始まる)になります。 次の形式がサポートされています。

o xy形式:ラベルは各行の最後のトークンです。
o yx形式:ラベルは各行の最初のトークンです。
o 接頭辞形式:ラベルの接頭辞は「l:」です
o 個別ファイル形式:ラベルは、label fileパラメータで指定された個別ファイルから読み取られます。
o ラベルなし:ExampleSetはラベル付けされていません。

 

出力

output (IOObject)
このポートは、メタデータとともに表形式で必要なファイルを提供します。 この出力は、Retrieveオペレータの出力に似ています。

 

パラメータ

format
このパラメータは、スパースデータファイルの形式を指定します。
レンジ:selection

attribute_description_file
属性記述ファイルの名前はここで指定されます。 ExampleSetのメタデータを取得するには、属性記述ファイル(拡張子:.aml)が必要です。このファイルは、属性のプロパティ(名前や範囲など)およびソースファイルを定義する単純なXMLドキュメントです。データは複数のファイルに分散している場合があります。このファイルには、データを読み取るファイルの名前も含まれています。したがって、実際のデータファイルをこの演算子のパラメータとして指定する必要はありません。
レンジ:filename

data_file
このパラメータは、データファイルの名前を指定します。属性記述ファイルで指定されていない場合に必要です。
レンジ:filename

label_file
このパラメータは、ラベルを含むファイルの名前を指定します。 formatパラメータが「format Separate file」に設定されている場合に必要です
レンジ:filename

dimension
このパラメータは、サンプルスペースの次元を指定します。属性記述ファイルのパラメータが設定されていない場合に必要です。
レンジ:integer

sample_size
このパラメータは、読み取る必要があるサンプルの最大数を指定します。 -1に設定されている場合、すべての例が読み込まれます。
レンジ:integer

use_quotes
このパラメータは、引用符を考慮するかどうかを示します。このオプションをtrueに設定すると、引用符文字パラメータを使用して引用符文字を指定できます。
レンジ:boolean

quotes_character
このパラメータは、引用符文字を定義します。
レンジ:char

datamanagement
このパラメータは、データが内部的にどのように表されるかを決定します。これはエキスパートパラメータです。さまざまなオプションがあり、ユーザーはそれらのいずれかを選択できます。
レンジ:selection

decimal_point_character
この文字は、小数点文字として使用されます。
レンジ:string

prefix_map
このパラメータは、プレフィックスを特別な属性の名前にマップします。
レンジ:list

encoding
これはエキスパートパラメータです。 エンコードの長いリストが提供されます。 ユーザーはいずれかを選択できます。
レンジ:selection

 

チュートリアルプロセス

スパースファイルの書き込みと読み取り
このプロセス例では、スパースファイルの書き込みにAML書き込み演算子を使用できることと、スパースファイルの読み取りにスパース読み取り演算子を使用する方法を示しています。 「ゴルフ」データセットは、検索演算子を使用してロードされます。このExampleSetは、Write AMLオペレータへの入力として提供されます。ファイル設定パラメータの例は「%{tempdir} / golf_data」に設定されているため、「golf_data」という名前のファイルがコンピューターの一時フォルダーに作成されます(まだ存在しない場合)。書き込まれたファイルを開いて、変更することができます(必要な場合)。このファイルには、ExampleSetのインスタンスが含まれています。属性記述ファイルのパラメータは「%{tempdir} / golf_att」に設定されているため、コンピューターの一時フォルダーに「golf_att」という名前のファイルが作成されます(まだ存在しない場合)。書き込まれたファイルを開いて、変更することができます(必要な場合)。このファイルには、ExampleSetのメタデータが含まれています。 formatパラメータは ‘sparse_xy’に設定され、ファイルをxyスパース形式で書き込みます。次に、ファイルからExampleSetを読み取るために、読み取りスパース演算子が適用されます。属性記述ファイルとデータファイルのパラメータは、それぞれ ‘%{tempdir} / golf_att’と ‘%{tempdir} / golf_data’に設定されます。ファイルがxy形式で書き込まれたため、formatパラメータは「xy」に設定されます。他のすべてのパラメータはデフォルト値で使用されます。結果のExampleSetは、結果ワークスペースで確認できます。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル