220

漢字→広東語発音記号 変換ツール(ピンイン/拼音) ユーザーオリジナル変換辞書の使用方法

「ユーザーオリジナル変換辞書」とは

本ページは「こちら」にて公開している”漢字 → 広東語発音記号(ピンイン/拼音)変換ツール”の機能の一つである「ユーザーオリジナル変換辞書」機能の使い方について説明となります。

「ユーザーオリジナル変換辞書」機能を使用することで、ユーザーにて指定した漢字の単語を、指定した発音記号(ピンイン)へ設定できるようになります。

広東語において漢字には複数の読み方があるものが多くあります。そのため”漢字 → 広東語発音記号(ピンイン/拼音)変換ツール”にて漢字文章の変換を行うと、複数の読み方が表示される場合が多くあります。以下の理由により特定の漢字・単語の読みをユーザーにて固定して表示したい場合が想定されます。

  • ・複数読み方があるが特殊な場合を除き、通常は特定の1つの発音しか使わないことが多い漢字であり、毎回複数の読みを表示したくない。
  • ・複数の漢字から成る単語の場合は漢字の発音記号(ピンイン)が確定可能なので、事前に漢字とその発音記号を登録しておきたい。

そのためユーザーにて自由に変換パターンを設定できるようにし利便性の向上を目的とした機能として実装しています。

「ユーザーオリジナル変換辞書」を使用した場合の実行例

※ここでは”漢字 → 広東語発音記号(ピンイン/拼音)変換ツール”の機能である「(1) 広東語単語辞書を使用し変換精度を向上させる(推奨)」を無効(チェックを外した状態)にした状態で利用した例を説明します。
※「(1) 広東語単語辞書を使用し変換精度を向上させる(推奨)」と「ユーザーオリジナル変換辞書」の機能は併用可能です。

以下のような広東語の漢字文章を変換をする場合を例に説明したいと思います。

呢度冇電話呢?
你加油吖!

「ユーザーオリジナル変換辞書」機能を利用しない場合は変換結果は以下のようになります。「呢」や「油」等の漢字は複数の読みがあるため、複数の読みが変換結果(太字部分)に表示されます。

ni1/ne1 dou6 mou5 din6 wa6/wa2 ni1/ne1?
nei5 ga1 yau4/yau2 a1!

「ユーザーオリジナル変換辞書」を適切に設定し変換すると、以下のように変換結果(太字部分)に単一の読みだけを表示させることができます。

ni1 dou6 mou5 din6 wa2 ne1?
nei5 ga1 yau2 a1!

太字の部分が変換の対象となった発音記号です。上記のように複数読みのある漢字や、特殊な読みの漢字をユーザー指定の発音記号(ピンイン)に変換することが可能です。

補足としてこの例の変換に用いたユーザーオリジナル変換辞書は以下の記述を使用しています。記述方法については以降で詳細の説明を記載します。

呢[EOS],ne1
呢,ni1
電話,din6 wa2
加油,ga1 yau2

「ユーザーオリジナル変換辞書」記述方法

「ユーザーオリジナル変換辞書」記述方法と仕様

以下のように1行に「[漢字],[発音記号]」という形式で入力してください。

[漢字],[発音記号]

以下は記述例です。

呢[EOS],ne1
喎[EOS],wo3
呢,ni1
嚟,lei4
樂器,ngok6 hei3
音樂,yam1 ngok6
樂,lok6

  • ・[漢字]と[発音記号]の間は必ず半角カンマで区切ってください。
  • ・[漢字]の部分に変換対象の漢字を記述してください。文字は1文字以上の入力が必要となります。
  • ・[発音記号]には発音記号(ピンイン)を入力してください。複数の音節から成る場合は「樂器,ngok6 hei3」のようにピンインとピンインの間に半角スペースを入力してください。
  • ・発音記号の入力方式は「本リスト内に記述した発音記号(ピンイン)の方式」で指定してください。
  • ・リストが2行以上から成る場合は同じ漢字や、一部漢字が重複している単語が登録された場合は、リストの上に記述された漢字・単語を優先度高として変換を行います。

ユーザーオリジナル変換辞書の優先順位

ユーザーオリジナル変換辞書内の上位に記載された単語を優先して変換の対象とします。

左右,jo2 yau6
左右,jo2 yau2

上記のように同じ単語が記載された場合は、上位に記載されている「左右,jo2 yau6」が変換の対象となります。

音樂,yam1 ngok6
樂,lok6

上記のように一部同じ漢字が登録された場合はも、上位に記載されている単語を優先して変換します。
例えば以下のように「音樂」や「樂」を含む文章を変換した場合は、リストの上位に記載した「音樂」が優先して変換されます。

音樂,樂趣,樂觀。

yam1 ngok6, lok6 cheui3, lok6 gun1.

[EOS]を記述した際の仕様

特別な仕様として[EOS]と入力した場合、該当漢字が文章の区切りの最後の文字だった場合にのみ変換を実行します。以下の符号・記号がある場合に文章の区切りと判断します。

,



.

?

!

例えば漢字「呢」は「ni1」と「ne1」の二つの読み方があります。ただ、通常は「ni1」と読みますが文章の区切り位置直前にある際は「ne1」と読みます。このように文章の区切り文字の直前にある漢字だけを変換対象とする場合に[EOS]を利用すると便利です。この場合の変換リストは以下のように記述してください。

呢[EOS],ne1
呢,ni1

上記は通常「呢」は「ni1」へ変換を行い、文章の区切り文字の直前にある「呢」を「ne1」と変換する設定となります。

上記のユーザーオリジナル変換辞書記述例を用いて以下の文章を変換した場合、以降のような変換結果(太字部分)となります。

呢度冇電話呢?

ni1 dou6 mou5 din6 wa6/wa2 ne1?

その他の仕様・注意事項

  • ※本機能はブラウザのクッキーを利用しています。ユーザーのブラウザに設定が保存されるため、長期に渡りご利用にならない場合や、ブラウザの設定を初期化した場合などは「ユーザーオリジナル変換辞書」の設定が消える場合があります。ユーザーのほうにて別途保存をすることをお勧めします。
  • ※「ユーザーオリジナル変換辞書」に1行当たりの文字数の制限はありませんが、リスト全体で約4000byteの入力までを許容します。(ご使用のブラウザに依存します)
  • ※仕様として「嚟,lei4/lai4」など1つの漢字に複数の発音記号を割り当てることも可能です。その場合は「/」を用いて区切ってください。
  • ※ピンインは必ずしも正確なピンインを入力する必要はありません。「覺得,a1 yi1」のように本来の読みとは異なる発音記号やオリジナルの発音記号なども入力可能です。
  • ※「ユーザーオリジナル変換辞書」の[漢字]フィールドは漢字の入力のみ許容していますので、漢字以外は入力しないでください。
  • ※入力された発音記号をシステムが発音記号として認識できなかった場合や、「本リスト内に記述した発音記号(ピンイン)の方式」にて「入力内容をそのまま使用する」を選択した場合はそのまま変換結果欄に表示されます。
  • ※ユーザーオリジナル変換辞書の[漢字]フィールドに記述する漢字の文字数と、[発音記号]フィールドに記述する音節数が一致するように記述してください。漢字の文字数が音節数より多い場合漢字の文字数分の音節のみ変換され残りは無視されます。漢字の文字数が音節数より少なかった場合、[発音記号]が記述されていない漢字についてはシステムより漢字に該当する音声記号(ピンイン)を取得して変換します。
ページ上部へ戻る