RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Read Database

(JDBC Connectors)

概要

この演算子は、SQLデータベースからExampleSetを読み取ります。

 

詳細

Read Databaseオペレータは、指定されたSQLデータベースからExampleSetを読み取るために使用されます。この演算子を適切に使用するには、少なくともデータベース、データベース接続、およびクエリの基本的な理解が必要です。この演算子のフローを理解するには、パラメータとサンプルプロセスを確認してください。

この演算子が実行されると、クエリによって配信されたテーブルがコンピューターのメモリにコピーされます。これにより、後続のすべてのオペレータがデータにすばやくアクセスできます。ランダムアクセスの数が多いサポートベクターマシンのような学習スキームでさえ、高速に実行されます。

java ResultSetMetaDataインターフェースは、名義属性の可能な値に関する情報を提供しません。ノミナル値がマップされる内部インデックスは、テーブルに表示される順序に依存します。これは、プロセスがトレーニングプロセスとテストプロセスに分割されている場合にのみ問題を引き起こす可能性があります。これは、名目上の属性を処理できる学習スキームの問題ではありません。 SVMなどの学習スキームがノミナルデータで使用される場合、RapidMinerはノミナル属性が数値であると見なし、ノミナル値のインデックスを数値として使用します。可能な値が2つしかない場合、SVMはうまく機能する可能性があります。テストセットが別のプロセスで読み取られると、公称値に異なるインデックスが割り当てられる可能性があるため、トレーニングされたSVMは役に立たなくなります。これは、classsパラメータを使用してクラスを指定できるため、ラベル属性の問題ではありません。したがって、ノミナルデータで使用することを目的としたすべての学習スキームは安全に使用できます。最初にAppend演算子を使用して両方のExampleSetを組み合わせ、次に2つのFilter Examples演算子を使用して再度分割する場合、この問題を回避できます。

 

他オペレータとの相違点

SQLを実行
Read Databaseオペレータは、データベースからRapidMinerにデータをロードするために使用されます。 SQLの実行演算子は、データベースからのデータのロードには使用できません。 データベースでCREATEやADDなどのSQLステートメントを実行するために使用できます。

 

入力

connection (Connection)
この入力ポートは、Connectionオブジェクトがあればそれを想定しています。 詳細については、パラメータ接続エントリを参照してください。

 

出力

output (IOObject
このポートは、メタデータとともに表形式でデータベースに対するクエリの結果を提供します。 この出力は、Retrieveオペレータの出力に似ています。

connection (Connection)
この出力ポートは、入力ポートから接続オブジェクトを配信します。 入力ポートが接続されていない場合、ポートは何も配信しません。

 

パラメータ

define_connection
このパラメータは、データベース接続の指定方法を示します。リポジトリ、事前定義、url、jndiの4つのオプションがあります。接続入力ポートが接続されている場合、パラメータは表示されません。
レンジ:selection

connection_entry
このパラメータは、接続定義パラメータがリポジトリーに設定されている場合にのみ使用可能です。このパラメータは、接続エントリを表すリポジトリの場所を指定するために使用されます。接続は、接続入力ポートを使用して提供することもできます。
レンジ:string

connection
このパラメータは、接続定義パラメータが事前定義に設定されている場合にのみ使用可能です。このパラメータは、事前定義された接続を使用してデータベースに接続するために使用されます。多くの定義済み接続を使用できます。ドロップダウンボックスを使用して、いずれかを選択できます。ドロップダウンボックスの横にあるボタンを使用して、新しい接続を追加したり、以前の接続を変更したりできます。メインウィンドウの[ツール]メニューから[データベース接続の管理…]をクリックして、これを実行することもできます。新しいウィンドウが表示されます。このウィンドウはいくつかの詳細を要求します。ホスト、ポート、データベースシステム、スキーマ、ユーザー名、パスワード。この新しいウィンドウの[テスト]ボタンを使用すると、接続を確立できるかどうかを確認できます。テストが成功したら、接続を保存します。新しい接続を保存した後、接続パラメータのドロップダウンボックスから選択できます。接続を設定するには、データベースの基本的な理解が必要です。
レンジ:string

database_system
このパラメータは、接続定義パラメータがurlに設定されている場合にのみ使用可能です。このパラメータは、使用中のデータベースシステムを選択するために使用されます。 MySQL、PostgreSQL、Sybase、HSQLDB、ODBC Bridge(例:Access)、Microsoft SQL Server(JTDS)、Ingres、Oracleのいずれかの値を持つことができます。
レンジ:selection

database_url
このパラメータは、接続定義パラメータがurlに設定されている場合にのみ使用可能です。このパラメータは、データベースのURL接続文字列を定義するために使用されます。 「jdbc:mysql://foo.bar:portnr / database」。
レンジ:string

username
このパラメータは、接続定義パラメータがurlに設定されている場合にのみ使用可能です。このパラメータは、データベースのユーザー名を指定するために使用されます。
レンジ:string

password
このパラメータは、接続定義パラメータがurlに設定されている場合にのみ使用可能です。このパラメータは、データベースのパスワードを指定するために使用されます。
レンジ:string

jndi_name
このパラメータは、接続定義パラメータがjndiに設定されている場合にのみ使用可能です。このパラメータは、JNDIにデータソースの名前を付けるために使用されます。
レンジ:string

define_query
クエリは、データベースから必要なデータを選択するために使用されるステートメントです。このパラメータは、データベースクエリを直接定義するか、ファイルを介して定義するか、特定のテーブル名で暗黙的に定義するかを指定します。 SQLクエリは、テーブル名を指定して自動生成され、パラメータを介してRapidMinerに渡されるか、長いSQLステートメントの場合は別のファイルで渡されます。クエリの定義パラメータを使用して、目的の動作を選択できます。多くの場合、列名では大文字と小文字が区別され、引用符が必要になる場合があります。
レンジ:selection

query
このパラメータは、クエリの定義パラメータがqueryに設定されている場合にのみ使用できます。このパラメータは、指定したデータベースから目的のデータを選択するためのSQLクエリを定義するために使用されます。
レンジ:string

query_file
このパラメータは、クエリ定義パラメータがクエリファイルに設定されている場合にのみ使用できます。このパラメータは、指定したデータベースから目的のデータを選択するためのSQLクエリを含むファイルを選択するために使用されます。通常、長いクエリはファイルに保存されます。クエリをファイルに保存すると、再利用性も向上します。
レンジ:filename

table_name
このパラメータは、クエリ定義パラメータがテーブル名に設定されている場合にのみ使用できます。このパラメータは、指定されたデータベースから必要なテーブルを選択するために使用されます。
レンジ:string

prepare_statement
チェックすると、ステートメントが準備され、「?」 parametersパラメータを使用して入力できます。
レンジ:boolean

parameters
「?」に挿入するパラメータステートメントが準備されるときのプレースホルダー。
レンジ:enumeration

 

チュートリアルプロセス

mySQLデータベースからのExampleSetの読み取り
Read Databaseオペレータは、mySQLデータベースを読み取るために使用されます。接続定義パラメータは事前定義に設定されます。接続定義パラメータは、ドロップダウンボックスの横にあるボタンを使用して構成されました。接続の名前は「mySQLconn」に設定されました。次の値は、接続パラメータのウィザードで設定されました。データベースシステムは「mySQL」に設定されました。ホストは「localhost」に設定されました。ポートは「3306」に設定されました。データベーススキームは「ゴルフ」に設定されました。これはデータベースの名前です。ユーザーは「root」に設定されました。パスワードが提供されませんでした。データベースがパスワードで保護されている場合、パスワードが必要です。すべての値を設定し、接続をテストします。接続が機能することを確認してください。

クエリ定義パラメータが「テーブル名」に設定されました。テーブル名パラメータは「golf_table」に設定されました。これは「golf」データベース内の必須テーブルの名前です。プロセスを実行すると、結果ワークスペースに「golf_table」全体が表示されます。データベースからテーブル全体を読み取る場合、クエリ定義パラメータは「テーブル名」に設定されます。クエリを使用して、データベースの選択した部分を読み取ることもできます。クエリ定義パラメータを「クエリ」に設定し、クエリパラメータでクエリを指定します。この例では、1つのサンプルクエリが既に定義されています。このクエリは、「Outlook」属性の値が「sunny」である「golf_table」からの例のみを読み取ります。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル