Azure Blob Storageコネクタの使用
Azure Blob Storageコネクタを使用すると、RapidMiner Studioから直接Azure Blob Storageにアクセスすることができます。読み込みと書き込みの両方の操作がサポートされています。このドキュメントでは、以下の方法について説明します。
Azure Blob Storageアカウントの接続
新しいAzure Blob Storage接続を設定するには、Azure Blob Storageアカウントの接続詳細(最低でもアクセスキーとシークレットキー)が必要です。
- RapidMiner StudioでAzure Blob Storage接続を保存するリポジトリを右クリックして、 Create Connectionを選択します。
または、Connections > Create Connectionをクリックし、以下のダイアログのドロップダウンからリポジトリを選択することも可能です。
- 新しい接続の名前を入力し、Connection Typeを Azure Blob Storageに設定します。
- Createをクリックし、Edit connectionダイアログのSetupタブに切り替えます。
- Azure Blob Storageアカウントの接続詳細を入力します。
必須ではありませんが、 Test connectionボタンをクリックして、新しいAzure Blob Storage接続をテストすることを推奨します。テストに失敗した場合は、接続詳細が正しいかどうかを確認してください。
- Saveをクリックして接続を保存し、Edit connectionダイアログを閉じます。これで、Azure Blob Storageオペレータを使用することができます。
Azure Blob Storageからの読み込み
Read Azure Blob StorageオペレータはAzure Blob Storageアカウントからデータを読み込みます。このオペレータはファイルをダウンロードするのみでファイルを処理できないので、任意のファイル形式をロードするのに使用されます。ファイルを処理するには、Read Document、Read Excel、Read XMLなどの追加オペレータを使用する必要があります。
まずは、Azure Blob Storageから簡単なログファイルを読み込むことから始めてみましょう。
- Read Azure Blob Storageオペレータをプロセスパネルにドラッグします。connection entryパラメータの横にある ボタンをクリックして、保存先のリポジトリのConnectionsフォルダからAzure Blob Storage接続を選択します。
または、リポジトリからプロセスにAzure Blob Storage接続をドラッグして、オペレータの出力をRead Azure Blob Storageオペレータに接続することもできます。
- ファイル選択ボタンをクリックして、Azure Blob Storageアカウント内のファイルを確認します。ロードするファイルを選択し、 開くをクリックします。
前述のように、Read Azure Blob Storageオペレータは指定したファイルの内容を処理しません。この例では、ログファイル(プレーンテキストファイル)を選択しています。このファイルタイプはRapidMiner StudioのText Processingエクステンションの一部であるRead Documentオペレータで処理することができます。
- RapidMiner StudioのText Processingエクステンションをまだインストールしていない場合は、マーケットプレイスでインストールしてください。その後、Read Azure Blob Storageオペレータと結果ポートの間にRead Documentオペレータを追加します。
- をクリックしてプロセスを実行します。結果画面には、ログファイルの内容を含む1つのドキュメントが表示されます。
これで、さらにテキスト処理オペレータを使用して、特定のイベントの共通性を判断するなど、このドキュメントを操作できるようになりました。結果をAzure Blob Storageに書き戻すには、Write Azure Blob Storageオペレータを使用できます。このオペレータはRead Azure Blob Storageオペレータと同じ接続タイプを使用し、同様のインタフェースを備えています。また、Loop Azure Blob Storageオペレータを使用して、Azure Blob Storageディレクトリ内の一連のファイルを読み込むこともできます。これを行うには、connection entryと処理するフォルダ、および入れ子内にオペレータを追加して、ループ処理のステップを設定する必要があります。詳細については、Loop Azure Blob Storageオペレータのヘルプをご覧ください。