オペレータの二重線
投稿日: 2020年12月17日
OS: Windows 10
バージョン: RapidMiner 9.8
オペレータから出ている二重線は、「コレクション」というExampleSetの集合を表しています。
コレクションは、Collectオペレータや、ループ系のオペレータを使用したときなどに作成されます。
コレクションの中には複数のExampleSetが含まれており、上記の例だとGolfデータセットとGolf-Testsetの二つが含まれています。
二重線をなくす方法
コレクションの状態では扱いにくいため、二重線をなくす方法が2通りあります。
- 一つのExampleSetのみ取り出す
- ExampleSetを結合し、一つのExampleSetにする
一つのExampleSetのみ取り出す
コレクションからExampleSetを取り出すには、Selectオペレータを用います。indexパラメータに取り出したいデータセットの番号を指定します。
Selectオペレータから出力されるのは一つのExampleSetなので、二重線ではなくなっています。
indexに1を選択したときは、1番目に格納されていたGolfデータセットが結果画面に表示されます。
ExampleSetを結合し、一つのExampleSetにする
ExampleSetの結合には、結合するデータセットの形によって様々なものが考えられます。その中でも多く使用されるものが、データセットを縦に結合することです。
縦の結合にはAppendオペレータを用います。
二重線が出ているオペレータの後ろ側にAppendオペレータを配置します。
この状態で実行すると、GolfデータセットとGolf-Testsetが縦に結合されて、一つのExampleSetの形になります。
※注意
Appendオペレータは結合させるデータの名前や型が一致していないと、エラーが出て結合できません。Appnedオペレータを用いる際は、結合するデータの名前や型が一致するように調整してください。
例えばGolf-TestsetからTitanicデータに変更すると、GolfデータセットとTitanicデータセットの属性名や型が一致しないため、エラーが出て結合できません。