RapidMiner(ラピッドマイナー)はデータ可視化、データ加工、モデル作成、評価、運用まで一括サポートする機械学習プラットフォームです。KSKアナリティクスはRapidMinerの正規販売代理店です。

Read Excelオペレーターでフリガナが取り込まれる時の対処法

投稿日: 2022年6月8日

OS: MacOS Monterey

バージョン: RapidMiner 9.10

 
(Excelファイル)

 
(Read Excelオペレーター)


 
Excelの機能で、漢字にフリガナ(ルビ)が振られている場合があります。
現在のところRead ExcelオペレーターでそのExcelファイル(.xlsxファイル)を取り込むとフリガナまで取り込まれます。
RapidMiner社に機能追加の要望は出しておりますが、修正時期はRapidMiner社の判断となりますため、修正時期は未定となっております。

 
回避策としまして、取り込む前に手動で.csvファイルまたは、.xlsファイルに拡張子を変更するとフリガナが取り込まれません。
フリガナを使用しているエクセルファイルを取り込む場合は、お手数ですが、取り込む前に手動で.csvファイルまたは、.xlsファイルに拡張子を変更していただけますでしょうか。

 
 
また、以下の様な方法もございます。
.xlsxファイルのままフリガナを取り込んだ後で、
Rename by replacingオペレーターを使用して、”replace what”に正規表現で
[ア-ン]*\b
を指定すると、末尾のカタカナを除外することができます。

末尾としているのは、
例えば”ページ数スウ”の様に漢字の前にカタカナがある場合、そのカタカナを除外しない様にしております。

よろしければお試しいただけますでしょうか。

API認証に失敗しました メールまたはパスワードが正しくありません メールアドレスは必須です パスワードは必須です
キャンセル