RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

MongoDBコネクタの使用

このガイドでは、RapidMiner Studio 9.3で導入された新しい接続管理を対象としています。

レガシーなMongoDB接続については9.2のドキュメントを参照してください。

MongoDBコネクタを使用すると、RapidMiner Studioから直接NoSQLデータベースのMongoDBのインスタンスに接続することができます。これはすべてのCRUD操作(Create、Read、Update、Delete)をサポートし、より洗練されたデータベースコマンドを実行します。このドキュメントでは、以下の方法について説明します。

NoSQLコネクタエクステンションのインストール

まず、NoSQLエクステンションをインストールする必要があります。

NoSQL Extension StudioにNoSQL Extensionをインストール

RapidMinerマーケットプレイス

エクステンションのインストール方法

MongoDBインスタンスの接続

MongoDBコネクタを使用する前に、新しいMongoDB接続を設定する必要があります。接続の設定には、データベースの接続詳細(ホスト名、ポート、データベース名)が必要です。MongoDBのインストールで認証が必要な場合は、有効な認証情報も必要です。

  1. RapidMiner StudioでMongoDB接続を保存するリポジトリを右クリックして、 New Connection IconCreate Connectionを選択します。

また、Connections >  New Connection IconCreate Connectionをクリックし、以下のダイアログのドロップダウンからRepositoryを選択します。

  1. 新しい接続の名前を入力し、Connection TypeCassandra IconMongoDBに設定します。

  1. Create IconCreateをクリックし、Edit connectionダイアログのSetupタブに切り替えます。
  2. MongoDBサーバーの接続詳細を入力します。

事前に設定されているポートは、MongoDBによって使用されるデフォルトのポートです。MongoDBはデフォルトではユーザー認証は必要ないことに注意してください。

必須ではありませんが、 Connection Test IconTest connectionボタンをクリックして、新しいMongoDB接続をテストすることをお勧めします。テストに失敗した場合は、接続詳細が正しいかどうかを確認してください。

  1. Save IconSaveをクリックして接続を保存し、Edit connectionダイアログを閉じます。

これで、新しく作成した接続をすべてのMongoDBオペレータで使用することができます。

MongoDBからの読み込み

Read MongoDBオペレータを使用すると、MongoDBコレクションからデータを読み込むことができます。MongoDBはJSON形式でデータを表現し、データベースのスキーマは使用しません。このデータ形式はJSON to Dataオペレータを使用してRapidMiner Studioの形式に変換できます。逆の場合は、Data to JSONオペレータを使用します。

まずは、変換せずに生のJSONデータを読み込むことから始めてみましょう。

  1. RapidMiner Studioで New Process Icon から空のプロセスを開きます。Read MongoDBオペレータをプロセスにドラッグし、その出力ポートをプロセスの結果ポートに接続します。connection entryパラメータの横にある repository chooser icon ボタンをクリックして、保存先のリポジトリのConnectionsフォルダからMongoDB接続を選択します。

または、リポジトリからプロセスにMongoDB接続をドラッグして、オペレータの出力をRead MongoDBオペレータに接続することもできます。

  1. オペレータのパラメータのmongodbインスタンスのドロップダウンメニューからMongoDB接続を選択します。
  2. collectionのドロップダウンメニューからMongoDB接続を選択します。設定したMongoDBデータベースで利用できるコレクションが表示されているはずです。

  1. Run Process をクリックしてプロセスを実行します。結果画面には、JSONドキュメントの単一コレクションが表示されます(選択したコレクションが空でない場合)。この例では、コレクションにはRapidMiner StudioのDealsサンプルデータセットが含まれています。

単一のExample Setに変換

次に、このJSONドキュメントのコレクションを1つのExample Setに変換するようプロセスを加工して、RapidMiner Studioのコアオペレータと互換性のある形式に変換してみましょう。

  1. デザイン画面に移動し、Read MongoDBオペレータと結果ポートの間にJSON to Dataオペレータを追加します。

  1. 再度、 Run Process をクリックしてプロセスを実行します。結果画面には、前の実行と同じデータを含む1つのExample Setが表示されます。

これで、他のデータソースからの操作と同じように、このExample Setを使用できるようになりました。しかし、MongoDBコレクションの特定のサブセットをどのようにクエリするのか疑問に思われるかもしれません。今のところ、常にコレクション全体をクエリしています。

MongoDBのクエリ構文の紹介はこのガイドの範囲外です。MongoDBの詳細な紹介はMongoDBの公式ドキュメントを参照してください。本解説では参考として、最後にもう一度プロセスを修正してみましょう。

この例では、MongoDBコレクションのJSONドキュメントにFuture Customerという名前のフィールドが含まれています。単純なクエリ条件を指定して、このフィールドの値をyesにすることができます(自身のデータに一致するように次の例を変更するのは簡単です)。

  1. デザイン画面に移動して、Read MongoDBオペレータを選択し、criteriaパラメータを編集します。
  2. 次の短いJSONドキュメント(クエリ条件)を入力します。

  1. 再度、 Run Process をクリックしてプロセスを実行します。結果画面には、Future Customer属性の値がyesのExampleだけが表示されます。

MongoDBへの書き込み

Example SetをMongoDBコレクションに書き込むのは簡単です。Example Setをロードして、JSONドキュメントのコレクションに変換し、MongoDBに書き込むだけです。以下の例は、RapidMiner Studioのサンプルデータセットの1つを新しいMongoDBコレクションに書き込む方法を示しています。

  1. RapidMiner Studioで New Process Icon から空のプロセスを開きます。
  2. IrisサンプルデータセットとData to JSONオペレータ、Write MongoDBオペレータをプロセスにドラッグし、以下のスクリーンショットのようにオペレータを接続します。MongoDB接続を選択し、新しいcollectionの名前を入力します。

既存のコレクションを選択することもできます。MongoDBは、ドキュメントの構造に関係なく、新しいJSONドキュメントをこのコレクションに追加します(MongoDBコレクションには静的なスキーマがないことを覚えておいてください)。

  1. Run Process をクリックしてプロセスを実行します。結果画面には、指定したMongoDBコレクションに追加されたJSONドキュメントのコレクションが表示されます。

MongoDBは新しく追加されたドキュメントに一意のIDを自動的に割り当てます。結果として、このプロセスを複数回実行すると、エントリが重複することになります。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル