Dropboxコネクタの使用
このガイドでは、RapidMiner Studio 9.3で導入された新しい接続管理を対象としています。
古いレガシーDropbox接続については9.2のドキュメントを参照してください。
Dropboxコネクタを使用すると、RapidMiner Studioから直接Dropboxアカウントのファイルを読み書きすることができます。Dropboxデスクトップクライアントをマシンにインストールする必要はありません。このドキュメントでは、以下の方法について説明します。
DropboxコネクタはOAuth 2.0と呼ばれる認証メカニズムを使用します。RapidMinerにユーザー名とパスワードを渡す代わりに、RapidMiner StudioがDropboxアカウントに接続するために使用できるアクセストークンを生成します。このトークンは他のアプリケーションでは使用できず、Dropboxの認証情報を安全に保つのに役立ちます。
RapidMiner StudioをDropboxに接続するには、次の手順に従います。
Dropboxアカウントの接続
- RapidMiner StudioでDropbox接続を保存するリポジトリを右クリックして、 Create Connectionを選択します。
または、Connections > Create Connectionをクリックし、以下のダイアログのドロップダウンからリポジトリを選択することも可能です。
- 新しい接続の名前を入力し、Connection Typeを Dropboxに設定します。
- Createをクリックし、Edit connectionダイアログのSetupタブに切り替えます。
- Access Tokenフィールドの右側にある Idボタンをクリックして、アクセストークンを要求します。
- Request access tokenをクリックすると、ブラウザでDropboxのウェブサイトが開きます。Dropboxアカウントにログインしていない場合は、ここでログインする必要があります。Show URL insteadをクリックして、URLを手動でコピーできます。
- Allowボタンをクリックして、RapidMinerにDropboxアカウントへのアクセスを許可し、トークンを生成します。
- アクセストークンをコピーします。
- RapidMiner Studioに戻り、アクセストークンを入力し、 Completeをクリックします。
- 必須ではありませんが、Edit connectionウィンドウの下部にある Test connectionボタンをクリックして、新しいDropbox接続をテストすることをお勧めします。
テストに失敗した場合は、接続詳細が正しいかどうかを確認してください。
- Saveをクリックして接続を保存し、Edit connectionダイアログを閉じます。
これで、RapidMiner StudioをDropboxアカウントに正常に接続しました。次のセクションでは、このコネクタを使用してファイルを読み書きする方法を説明します。
ファイルの閲覧と読み込み
Dropboxコネクタを使用すると、Dropboxからのファイルの読み込みが非常に簡単になります。
- Read Dropboxオペレータをプロセスにドラッグします。connection entryパラメータの横にある ボタンをクリックして、保存先のリポジトリのConnectionsフォルダからDropbox接続を選択します。
または、リポジトリからプロセスにDropbox接続をドラッグして、オペレータの出力をRead Dropboxオペレータに接続することもできます。
- ファイル選択ボタンをクリックして、Dropboxアカウント内のファイルを確認します。ロードするファイルを選択し、 開くをクリックします。
- Read Dropboxオペレータの出力を適切なオペレータに接続します。今回は.xlsファイルを選択したので、出力をRead Excelオペレータに接続します。
この例からわかるように、Read Dropboxオペレータは Read Fileオペレータと同様に機能します。このオペレータは選択したファイルをロードするだけで、ファイルの処理は行いません。データの実際の処理は、Read Excel、Read CSV、Read XMLなどの追加オペレータで行われます。
Dropboxアカウントへの書き込み
Write Dropboxオペレータは、Write Fileオペレータと同様に機能します。このオペレータは入力にファイルを想定し、そのファイルをDropboxアカウントの指定した場所に保存します(入力は別のオペレータから提供されます)。Write Dropboxオペレータでは、オプションで2番目のポートにDropbox接続を指定することができます。
Write Dropboxオペレータを使用する最も簡単な例は、Read Dropboxの出力と接続することです。この設定では、ファイル自体を変更せずに Dropboxアカウントのある場所から別の場所にファイルをコピーするだけです。
前のセクションの終わりから、Write Dropboxオペレータを設定します。
- Write Dropboxオペレータをクリックし、パラメータでDropbox接続を選択し、 ファイル選択で新しいファイルの場所を選択します。デフォルトでは、Write Dropboxオペレータは既存のファイルを上書きしません。代わりに、番号がファイル名に追加されます。例えば、Analysis_Results.xlsがすでに存在する場合、新しいファイルはAnalysis_Results (1).xlsとして保存されます。(Expert Modeで表示される)overwriteパラメータにチェックを入れることで、この機能を無効にすることができます。
- をクリックしてプロセスを実行し、指定した場所に移動します。Dropboxのオンラインビューで、Analysis_Results.xlsが数秒前に正常に更新されたことを確認できます!