かな文字表記を ローマ字表記に 変換 する VBA の プログラムです.お好みで 改造 して おつかい ください.
ローマ字 変換 プログラム
RÔMAZI HENKAN PUROGURAMU
はじめに
Hazime ni
ふりがなは ローマ字に 変換 できない
Hurigana wa Rômazi ni henkan dekinai
ふりがなを ローマ字に 変換 する 処理は 完全に 自動では できません.ローマ字は ふりがなを ラテン文字(ABC)に 変換 した ものでは ないからです.
ふりがなと ローマ字の 関係
日本語の 音声を かな文字で かいた ものが ふりがなで,ラテン文字で かいた ものが ローマ字です.ふりがなと ローマ字の あいだに 直接の つながりは ありません.しかも,音声を 文字列に 変換 する ルールが ちがうので,一般に ふりがなの つづりと ローマ字の つづりは 対応 しません.
それでも,ふりがなを いったん もとの 音声に もどして,その 音声を ローマ字に 変換 すると いう 2段階の 処理で ふりがなを ローマ字に 変換 できると おもうかも しれません.しかし,それが できません.ふりがなは もとの 音声に もどせない ばあいが あり,そのとき ローマ字の つづりが きめられないからです.くわしくは「なぜ ふりがなでは ダメなのか?」を およみ ください.
よみかたは ローマ字に 変換 できる
Yomikata wa Rômazi ni henkan dekiru
ふりがなは すこし 改造 する だけで もとの 音声に もどせる ように なります.まず,〈ー〉を つかって 長音を かきます.それから,助詞の〈は〉〈へ〉〈を〉を 発音どおりに【わ】【え】【お】と かきます.このような かな文字表記を ここでは よみかたと よんで います本当は,発音が わかる ように するには もう ひとつ あらためないと いけない ところが あります.それは 漢語の「エ段+い」です.「映画」の 発音は【エーガ】に ちかいのに,ふりがなは〈エイガ〉でしょう.けれども,ふりがなを ローマ字に 変換 する ことが 目的なら,ここは そのままに して おいても かまいません.「映画」の ローマ字表記が eiga だからです.「もっと 日本語らしい かきかた」も およみ ください..
コウシ(子牛)コーシ(講師)
タロー(太郎)ユーコ(優子)
ギューニュー(牛乳)コージョー(工場)
オハヨー(おはよう)コンバンワ(こんばんは)
この よみかたは 完全に 自動で ローマ字に 変換 できます.ここに あるのは その 処理を おこなう プログラムです.
VBA関数
VBA kansû
ローマ字の 方式に 対応 した 7種類の 関数が あります.じっさいに つかう ときは 関数の 名前を わかりやすい ものに かえて おくと いいでしょう.
ローマ字の 方式 | 関数 |
---|---|
日本式 | KatakanaToRoomaziN |
訓令式 | KatakanaToRoomaziK |
訓令式(拡張版) | KatakanaToRoomaziKx |
ヘボン式 | KatakanaToRoomaziH |
「英語式」 | KatakanaToRoomaziE |
「パスポート式」 | KatakanaToRoomaziP |
「パスポートむけ訓令式」 | KatakanaToRoomaziQ |
つかいかた
Tukaikata
関数は 全角カタカナの よみかたを ローマ字に 変換 します.関数の コードを「標準モジュール」に コピー&ペースト して おつかい ください.
参考:標準モジュールを 挿入 する 方法 .
KatakanaToRoomaziK("イチロー") → itirô
KatakanaToRoomaziH("イチロー") → ichirō
KatakanaToRoomaziE("イチロー") → ichiro
関数の つかいかた
単語を ローマ字に したい ときは よみかたを 入力 する ことに だけ 気を つければ いいのですが,文を 処理 したい ときは ほかにも 気を つけないと いけない ことが あります.くわしくは「気を つける こと」を およみ ください.
ローマ字 変換 プログラム
Rômazi henkan puroguramu
日本式
Nipponsiki
訓令式の 前身に あたる ふるい 方式です.一部の 特殊音に 対応 して います.
訓令式
Kunreisiki
学校の「国語」で おしえる ローマ字です.特別な 事情が なければ 訓令式を つかうのが ローマ字の ルールです.一部の 特殊音に 対応 して います.
訓令式(拡張版)
Kunreisiki (kakutyôban)
訓令式を すこし 拡張 した 方式です.特殊音に 対応 して います.
ヘボン式
Hebonsiki
学校の「国語」で おしえる ヘボン式です.英語風の つづりに しなければ ならない 特別な 事情が ある ときに つかいます.学校の「英語」で おしえる ヘボン式や パスポートの ヘボン式とは ちがいますから,まちがえない ように して ください.特殊音に 対応 して いません.
「英語式」
"Eigosiki"
学校の「英語」で おしえる ヘボン式です.もっとも よく つかわれて いる ローマ字で,一般に ヘボン式と よばれて いるのは この かきかたです.ただし,これは 英語の かきかたです.日本語から 英語に なった ことばは 基本的に この つづりに なりますが,英語に なって いない 日本語を この つづりに しても 意味が ありません.特殊音に 対応 して いません.
「パスポート式」
"Pasupôtosiki"
パスポートの 名前を かく ヘボン式です.「外務省ヘボン式」と よばれる ことも あります.「英語式」と ほぼ おなじ ものです.一部の 特殊音に 対応 して います.すべて 大文字に なります.
「パスポートむけ訓令式」
"Pasupôto-muke Kunreisiki"
パスポートの 名前を かく 訓令式です.この サイトは この かきかたを すすめて います.訓令式(拡張版)と ほぼ おなじ ものです.特殊音に 対応 して います.すべて 大文字に なります.
気を つける こと
Ki o tukeru koto
長音が ない ときの よみかたは ふりがなと おなじです.
デンワ(電話)
ジテンシャ(自転車)
長音が ある ときの よみかたは ふりがなと ちがいます.
デンポー(電報)
ジドーシャ(自動車)
よみかたは 発音どおりに かいた かな文字表記ですが,漢字の 音よみで ふりがなが〈えい〉〈けい〉〈せい〉などに なる ものは 例外です.これらの 発音は【エー】【ケー】【セー】などに ちかいですが,よみかたは ふりがなと おなじ【エイ】【ケイ】【セイ】などです.
エイガ(映画)
セイメイ(生命)
ふつう,よみかたの【ー】は ふたつの 漢字を またぎません.【ー】に するのか しないのか まよったら,漢字と 漢字の あいだに【・】を いれて かんがえて ください.まよう 部分が【・】を またいで いたら【ー】に しません.たとえば,「子牛」は【コ・ウシ】なので【コウシ】,「講師」は【コウ・シ】なので【コーシ】です.「小売り」は【コ・ウリ】なので【コウリ】,「高利」は【コウ・リ】なので【コーリ】です.
ローマ字は ことばの あいだに 空白を いれる 分かち書きに しなければ なりませんが,この ツールに ことばを きりはなす はたらきは ありません.そのため,入力の 段階で あらかじめ きりはなして おく 必要が あります.
クーソー カガク ショーセツ(空想科学小説)
セカイ イッシュー リョコー(世界一周旅行)
助詞の〈は〉〈へ〉〈を〉は【ワ】【エ】【オ】と かきます.
ワタシ ワ(私は)
ソレ オ(それを)
日本式を つかう ときは,【ジ/ヂ】【ズ/ヅ】などを つかいわけて ください.
メイヂ(明治)
アヅキ(小豆)
ローマ字の かきかたには 規則が あり,それに あわせて よみかたを 入力 しないと ただしく 変換 できません.【エイ】【ケイ】【セイ】なども そんな 規則の ひとつで,このほかにも 規則が たくさん あります.たとえば,「聞いた」「大きい」は,じっさいには【キータ】【オーキー】に ちかい 発音ですが,【キイタ】【オーキイ】と 入力 しなければ なりません.「~である」「~ですか」は【~デ アル】【~デス カ】と 入力 しなければ なりません.けっきょく,この ツールを つかいこなすには ローマ字の 勉強が 必要です.
確実に 変換 できる 文字列を 入力 して ください.
おぎない
Oginai
- ふりがなを ローマ字に 変換 する ツールは たくさん ありますが,それらの ほとんどは ローマ字の 方式が「ワープロ式」か「英語式」で,本物の ローマ字では ありません.「ワープロ式」に 変換 する ツールは transliterator と 解説 されて いる ことも ありますが,ローマ字は ふりがなの transliteration では ありません.くわしくは「字訳」を およみ ください.一方,「英語式」に 変換 する ツールは ときどき まちがった 結果を 出力 します.確実に ただしい 結果を 出力 できる ものは ひとつも ありません.(「松浦」「横内」「広尾」 などの 名前を しらべて みれば,すぐに わかります.)ふりがなの〈こう〉を kou に 変換 するか ko に 変換 するか 指定 できる ツールも ありますが,それでも「城之内」を ただしく 変換 できません.
- 形態素解析ツールの 中にも ローマ字を 出力 できる ものが あります.しかし,その 出力は 大抵「ワープロ式」で,ローマ字の ルールに のっとった 分かち書きにも されて いませんMeCab は 辞書に よみかたの データを もって います.これを 応用 すれば,漢字かな表記の 単語を ある 程度 ただしく ローマ字に 変換 できます.品詞の 情報を つかって 分かち書きを うまく コントロール できれば,実用的な ツールも つくれるでしょう..
- 大文字と 小文字の 変換には VBAの Ucase(), Lcase(), StrConv() や Excelワークシート関数の UPPER(), LOWER(), PROPER() が つかえます.文字列に 長音符号つき文字(û, ô など)が ふくまれて いても 問題なく はたらきます.ただし,PROPER() などは きる印(') などの つぎの 文字が 大文字に なって しまう ようです.
- くせの ある コードですが,「ローマ字表」が ほぼ そのままの 形で うめこんで ありますから,VBAの プログラミングが よく わからない 人でも かんたんに 改造 できるでしょう.