RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

オペレータの二重線

投稿日: 2020年12月17日
OS: Windows 10
バージョン: RapidMiner 9.8

オペレータから出ている二重線は、「コレクション」というExampleSetの集合を表しています。
コレクションは、Collectオペレータや、ループ系のオペレータを使用したときなどに作成されます。

コレクションの中には複数のExampleSetが含まれており、上記の例だとGolfデータセットとGolf-Testsetの二つが含まれています。

二重線をなくす方法

コレクションの状態では扱いにくいため、二重線をなくす方法が2通りあります。

  1. 一つのExampleSetのみ取り出す
  2. ExampleSetを結合し、一つのExampleSetにする

一つのExampleSetのみ取り出す

コレクションからExampleSetを取り出すには、Selectオペレータを用います。indexパラメータに取り出したいデータセットの番号を指定します。

Selectオペレータから出力されるのは一つのExampleSetなので、二重線ではなくなっています。

 

indexに1を選択したときは、1番目に格納されていたGolfデータセットが結果画面に表示されます。

ExampleSetを結合し、一つのExampleSetにする

ExampleSetの結合には、結合するデータセットの形によって様々なものが考えられます。その中でも多く使用されるものが、データセットを縦に結合することです。

縦の結合にはAppendオペレータを用います。

二重線が出ているオペレータの後ろ側にAppendオペレータを配置します。

 

この状態で実行すると、GolfデータセットとGolf-Testsetが縦に結合されて、一つのExampleSetの形になります。

 

※注意

Appendオペレータは結合させるデータの名前や型が一致していないと、エラーが出て結合できません。Appnedオペレータを用いる際は、結合するデータの名前や型が一致するように調整してください。

例えばGolf-TestsetからTitanicデータに変更すると、GolfデータセットとTitanicデータセットの属性名や型が一致しないため、エラーが出て結合できません。


API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル