RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Read XML

(Advanced File Connectors)

概要

この演算子は、XMLファイルの読み取りに使用されます。

 

詳細

この演算子はXMLファイルを読み取ることができます。例は、特定のXPathに一致する要素で表され、機能は各要素とそのサブ要素の属性とテキストコンテンツです。

この演算子は、最初のいくつかの要素を読み取り、発生する値をチェックすることにより、適切なタイプの属性を決定しようとします。 すべての値が整数である場合、属性は整数になり、実数が発生する場合、属性は実数型になります。 数値として解釈できない値を含む列は、日付形式パラメータの日付と時刻のパターンと一致しない限り、名目上なります。 存在する場合、この属性は自動的に日付として解析され、対応する機能は日付型になります。

 

入力

file
XMLファイルは、Read Fileオペレータのようなファイル出力ポートを持つ他のオペレータで作成できるファイルオブジェクトとして期待されています。

 

出力

output (IOObject)
このポートは、メタデータとともに表形式のXMLファイルを配信します。 この出力は、Retrieveオペレータの出力に似ています。

 

パラメータ

parse_numbers
数値を解析するかどうかを指定します。
レンジ:boolean

decimal_character
この文字は、小数点文字として使用されます。
レンジ:char

grouped_digits
このオプションは、グループ化された数字を解析するかどうかを決定します。 このオプションがtrueに設定されている場合、グループ化文字パラメーターを指定する必要があります。
レンジ:boolean

grouping_character
この文字はグループ化文字として使用されます。 この文字が数字の間にある場合、数字は結合され、この文字は無視されます。 たとえば、CSVファイルに「22-14」が存在し、グループ化文字として「-」が設定されている場合、「2214」が保存されます。
レンジ:char

infinity_string
このパラメーターは、特定の無限大表現(「Infinity」など)を解析するように設定できます。 設定されていない場合、ローカル固有の無限大表現が使用されます。
レンジ:string

date_format
日付と時刻の形式はここで指定されます。多くの事前定義オプションが存在します。ユーザーは新しい形式を指定することもできます。 CSVファイル列のテキストがこの日付形式と一致する場合、その列は自動的に日付タイプに変換されます。一部の修正は、日付タイプの値で自動的に行われます。たとえば、値「32-March」は自動的に「1-April」に変換されます。数値として解釈できない値を含む列は、日付形式パラメーターの日付と時刻のパターンと一致しない限り、名義として解釈されます。その場合、CSVファイルのこの列は自動的に日付として解析され、対応する属性は日付型になります。
レンジ:string

first_row_as_names
このオプションがtrueに設定されている場合、CSVファイルの最初の行に属性の名前があると見なされます。その後、属性には自動的に名前が付けられ、CSVファイルの最初の行はデータ行として扱われません。
レンジ:boolean

annotations
名前としての最初の行がtrueに設定されていない場合は、このパラメーターの[リストの編集]ボタンを使用して注釈を追加し、新しいメニューを開きます。このメニューを使用すると、任意の行を選択して注釈を割り当てることができます。名前、コメント、ユニットの注釈を割り当てることができます。行0にName注釈が割り当てられている場合、名前パラメーターとして最初の行をtrueに設定することと同じです。行を無視する場合は、コメントとして注釈を付けることができます。このメニューの行番号はコメント行をカウントしないことに注意してください。
レンジ:menu

time_zone
これはエキスパートパラメータです。タイムゾーンの長いリストが提供されます。ユーザーはそれらのいずれかを選択できます。
レンジ:selection

locale
これはエキスパートパラメータです。ロケールの長いリストが提供されます。ユーザーはそれらのいずれかを選択できます。
レンジ:selection

read_all_values_as_polynominal
このオプションを使用すると、この演算子の型処​​理を無効にできます。すべてのxpathエントリは多項式属性として読み取られます。
レンジ:boolean

data_set_meta_data_information
このオプションは重要です。 CSVファイルのメタデータを調整できます。列のインデックス、名前、タイプ、およびロールはここで指定できます。 Read CSVオペレーターは、最初の数行を読み取り、発生する値をチェックすることにより、適切なタイプの属性を判別しようとします。すべての値が整数の場合、属性は整数になります。同様に、すべての値が実数である場合、属性は実数型になります。数値として解釈できない値を含む列は、日付形式パラメーターの日付と時刻のパターンと一致しない限り、名義として解釈されます。その場合、CSVファイルのこの列は自動的に日付として解析され、対応する属性は日付型になります。自動的に決定されたタイプは、このパラメーターを使用してオーバーライドできます。
レンジ:menu

read_not_matching_values_as_missings
この値がtrueに設定されている場合、期待される値のタイプと一致しない値は欠損値と見なされ、「?」に置き換えられます。たとえば、「abc」が整数列に書き込まれている場合、欠損値として扱われます。 CSVファイルの疑問符(?)も欠損値として読み取られます。
レンジ:boolean

datamanagement
これはエキスパートパラメータです。長いリストが提供されます。ユーザーはこのリストから任意のオプションを選択できます。
レンジ:selection

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル