RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Azure Blob Storageコネクタの使用

Azure Blob Storageコネクタを使用すると、RapidMiner Studioから直接Azure Blob Storageにアクセスすることができます。読み込みと書き込みの両方の操作がサポートされています。このドキュメントでは、以下の方法について説明します。

Azure Blob Storageアカウントの接続

新しいAzure Blob Storage接続を設定するには、Azure Blob Storageアカウントの接続詳細(最低でもアクセスキーとシークレットキー)が必要です。

  1. RapidMiner StudioでAzure Blob Storage接続を保存するリポジトリを右クリックして、 New Connection IconCreate Connectionを選択します。

または、Connections >  New Connection Icon Create Connectionをクリックし、以下のダイアログのドロップダウンからリポジトリを選択することも可能です。

  1. 新しい接続の名前を入力し、Connection TypeAzure Blob Storage IconAzure Blob Storageに設定します。

  1. Create IconCreateをクリックし、Edit connectionダイアログのSetupタブに切り替えます。
  2. Azure Blob Storageアカウントの接続詳細を入力します。

必須ではありませんが、 Connection Test IconTest connectionボタンをクリックして、新しいAzure Blob Storage接続をテストすることを推奨します。テストに失敗した場合は、接続詳細が正しいかどうかを確認してください。

  1. Save IconSaveをクリックして接続を保存し、Edit connectionダイアログを閉じます。これで、Azure Blob Storageオペレータを使用することができます!

Azure Blob Storageからの読み込み

Read Azure Blob StorageオペレータはAzure Blob Storageアカウントからデータを読み込みます。このオペレータはファイルをダウンロードするのみでファイルを処理できないので、任意のファイル形式をロードするのに使用されます。ファイルを処理するには、Read DocumentRead ExcelRead XMLなどの追加オペレータを使用する必要があります。

まずは、Azure Blob Storageから簡単なログファイルを読み込むことから始めてみましょう。

  1. Read Azure Blob Storageオペレータをプロセスにドラッグします。connection entryパラメータの横にある repository chooser icon ボタンをクリックして、保存先のリポジトリのConnectionsフォルダからAzure Blob Storage接続を選択します。

または、リポジトリからプロセスにAzure Blob Storage接続をドラッグして、オペレータの出力をRead Azure Blob Storageオペレータに接続することもできます。

  1. file chooser iconファイル選択ボタンをクリックして、Azure Blob Storageアカウント内のファイルを確認します。ロードするファイルを選択し、 File Chooser Icon開くをクリックします。

前述のように、Read Azure Blob Storageオペレータは指定したファイルの内容を処理しません。この例では、ログファイル(プレーンテキストファイル)を選択しています。このファイルタイプはRapidMiner StudioのText Processingエクステンションの一部であるRead Documentオペレータで処理することができます。

  1. RapidMiner StudioのText Processingエクステンションをまだインストールしていない場合は、マーケットプレイスでインストールしてください。その後、Read Azure Blob Storageオペレータと結果ポートの間にRead Documentオペレータを追加します。

  1. Run Process をクリックしてプロセスを実行します。結果画面には、ログファイルの内容を含む1つのドキュメントが表示されます。

これで、さらにテキスト処理オペレータを使用して、特定のイベントの共通性を判断するなど、このドキュメントを操作できるようになりました。結果をAzure Blob Storageに書き戻すには、Write Azure Blob Storageオペレータを使用できます。このオペレータはRead Azure Blob Storageオペレータと同じ接続タイプを使用し、同様のインタフェースを備えています。また、Loop Azure Blob Storageオペレータを使用して、Azure Blob Storageディレクトリ内の一連のファイルを読み込むこともできます。これを行うには、connection entryと処理するフォルダ、および入れ子内にオペレータを追加して、ループ処理のステップを設定する必要があります。詳細については、Loop Azure Blob Storageオペレータのヘルプをご覧ください。

 

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル