Read Excelオペレーターでフリガナが取り込まれる時の対処法
投稿日: 2022年6月8日
OS: MacOS Monterey
バージョン: RapidMiner 9.10
(Excelファイル)
(Read Excelオペレーター)
Excelの機能で、漢字にフリガナ(ルビ)が振られている場合があります。
現在のところRead ExcelオペレーターでそのExcelファイル(.xlsxファイル)を取り込むとフリガナまで取り込まれます。
RapidMiner社に機能追加の要望は出しておりますが、修正時期はRapidMiner社の判断となりますため、修正時期は未定となっております。
回避策としまして、取り込む前に手動で.csvファイルまたは、.xlsファイルに拡張子を変更するとフリガナが取り込まれません。
フリガナを使用しているエクセルファイルを取り込む場合は、お手数ですが、取り込む前に手動で.csvファイルまたは、.xlsファイルに拡張子を変更していただけますでしょうか。
また、以下の様な方法もございます。
.xlsxファイルのままフリガナを取り込んだ後で、
Rename by replacingオペレーターを使用して、”replace what”に正規表現で
[ア-ン]*\b
を指定すると、末尾のカタカナを除外することができます。
末尾としているのは、
例えば”ページ数スウ”の様に漢字の前にカタカナがある場合、そのカタカナを除外しない様にしております。
よろしければお試しいただけますでしょうか。