RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Read SPSS

(Advanced File Connectors)

概要

この演算子は、SPSSファイルの読み取りに使用されます。

 

詳細

Read SPSSオペレータは、統計分析に使用されるアプリケーションであるSPSS(社会科学用統計パッケージ)によって作成されたデータファイルを読み取ることができます。 SPSSファイルは独自のバイナリ形式で保存され、データセットとデータセットを説明する辞書が含まれています。 これらのファイルは、「ケース」(行)および「変数」(列)によってデータを保存します。

これらのファイルの拡張子は「.SAV」です。 SAVファイルは、データベースおよびMicrosoft Excelスプレッドシートから抽出されたデータセットを保存するためによく使用されます。 SPSSデータセットはさまざまな方法で操作できますが、最も一般的に使用されるのは、回帰分析、分散分析、因子分析などの統計分析テストの実行です。

 

入力

file (File)
このオプションのポートは、ファイルオブジェクトを想定しています。

 

出力

output (IOObject)
SPSSファイルからのデータは、主にExampleSetの形式でこのポートを介して配信されます。

 

パラメータ

filename
このパラメータは、SPSSファイルのパスを指定します。 ファイルの選択ボタンを使用して選択できます。
レンジ:filename

datamanagement
このパラメータは、データが内部的にどのように表されるかを決定します。 これはエキスパートパラメータです。 さまざまなオプションがあり、ユーザーはそれらのいずれかを選択できます。
レンジ:selection

attribute_naming_mode
このパラメータは、属性の名前付けに使用するSPSS変数プロパティを決定します。
レンジ:selection

use_value_labels
このパラメータは、SPSS値ラベルを値として使用する必要があるかどうかを指定します。
レンジ:boolean

recode_user_missings
このパラメータは、SPSSユーザーの欠落を欠落値に再コーディングする必要があるかどうかを指定します。
レンジ:boolean

sample_ratio
このパラメータは、読み取る必要があるデータセットの割合を指定します。 1に設定されている場合、完全なデータセットが読み取られます。 -1に設定されている場合、サンプルサイズパラメータは、読み取るデータのサイズを決定するために使用されます。
レンジ:real

sample_size
このパラメータは、読み取る必要があるサンプルの正確な数を指定します。 -1に設定されている場合、サンプル比率パラメータは、読み取るデータのサイズを決定するために使用されます。 両方が-1に設定されている場合、完全なデータセットが読み取られます。
レンジ:integer

use_local_random_seed
このパラメータは、ローカルランダムシードをランダム化に使用する必要があるかどうかを示します。 同じ値のローカルランダムシードを使用すると、同じランダム化が生成されます。
レンジ:boolean

local_random_seed
このパラメータは、ローカルランダムシードを指定します。 このパラメータは、ローカルシードの使用パラメータがtrueに設定されている場合にのみ使用できます。
レンジ:integer

 

チュートリアルプロセス

SPSSファイルの読み取り
このプロセスにはSPSSファイルが必要です。 このプロセスでは、SPSSファイルの名前はAirlines_passengers.savであり、コンピューターのDドライブに配置されます。 ファイルは、SPSS読み取りオペレータを使用して読み取られます。 すべてのパラメータはデフォルト値で使用されます。 プロセスの実行後、結果ワークスペースで結果のExampleSetを確認できます。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル