RapidMiner Studioのガイド付きのアプローチ
あなたの仕事を加速させるために、RapidMinerはデータの前処理、モデルの構築、モデルのデプロイのガイド付きツールを提供します。
- インタラクティブなデータの前処理なら、 ターボプレップ(Turbo Prep)
- AutoML(自動機械学習)なら、 オートモデル(Auto Model)
- ワンクリックなモデルのデプロイなら、 デプロイメント(Deployments)
これらのツールを使用することで、SME(内容領域専門家)はシンプルさを手に入れ、新人のデータサイエンティストはベストプラクティスを学び、データサイエンスの専門家は生産性を上げることができます。
ターボプレップ: データの前処理
ターボプレップ はデータの前処理が簡単になるよう設計されたものです。ターボプレップはいつでも中心にデータが見えるインタフェースを提供しています。そこにはモデルの構築・プレゼン用にデータを準備するあらゆる機能が備わっており、データを見ながらデータをステップバイステップで変更し、すぐに結果を確認することができます。
オートモデル: モデルの構築
オートモデルはモデルの構築と検証のプロセスを加速させます。オートモデルは大きく三つの問題を扱います:
- Prediction(予測)
- Clustering(クラスタリング)
- Outliers(外れ値)
予測のカテゴリでは、分類と回帰の両方の問題を解くことができます。オートモデルはデータを評価し、問題解決に向け関連するモデルを提供します。また計算が終われば、モデルの結果の比較に役立ちます。
オートモデルは結果を得るのに役立つだけでなく、 結果を理解することにも役立ちます。たとえ内部のロジックが理解しづらいディープラーニングのようなモデルでさえも、です。
デプロイメント: モデルのデプロイ
モデルの全ての価値を理解するには、運用を開始する必要があります。オートモデル内から、一回のクリックでモデルのデプロイが可能です。
デプロイメントは同じ入力データを説明するモデルの集合です。最もシンプルな形では、デプロイメントはリポジトリ内に存在し、データにスコアをつけます(例えば、予測を行います)が、デプロイメントはこれ以上のことが可能です!
- デプロイメントはモデルを整理し、重要なデータを一つの場所に保管します(例えば、 GDPRなどの規則を遵守するため)。
- デプロイメントはモデルのパフォーマンスを経時的に追跡し、ドリフトやバイアスを警告します。
- デプロイメントは共通のプロジェクトで協力しているグループで共有することが可能です。
- デプロイメントはwebサービスを提供しているため、他のソフトウェアと統合することが可能です。
基本的な考え方は、運用するモデルが多いほど良くなるというものです。したがって、デプロイはできるだけ簡単に行える必要があります。モデルを無駄にするのをやめませんか?