サンスクリット語の一部の特殊な文字コード (utf-8)
ホームページに、ローマナイズドされた「サンスクリット語」を表示するにはいろいろな方法があります。文字の入力の方法も難しいですがいろいろあります。
たとえば、「KH方法」、「TH方法」、「LaTeX2e」方法などです。それぞれ一長一短があります。
ここでは、文字化けを避けるために、全ページを、国際標準のひとつ、utf-8 コードに統一していますので、この場合の、非常に単純な、表示方法および入力方法の一つをご紹介します。
HTML文(HTML4.0、XML1.0)では、1文字単位の特殊文字は、一般文字の間に、&#x と ; とで括(くく)られた間に、十六進表示の4桁の数値を挿入して、HTML文法用語で言う、「数値文字参照」 を実現します。
日本語主体で作られていて、日本では多くの方が利用されている、ホームページ作成用のソフトのひとつである、日本IBM社製のIBMホームページビルダー(テストではVer13.0)では、サンスクリット語の特殊文字が、「プレビュー」や、「HTMLソース」や、「ページ編集」では正確に表示されない(黒点表示、文字化け、バグ、ソフトウェア障害?)場合があります。(「プレビュー」では表示されている場合が多いです)。しかし、ほぼ最新版のブラウザ(IE8.0とか、Google Chromeなど)では、ちゃんと表示できています。海外主体のDreamWeaverなどは多国語対応が進んでいるような気がしています。
サンスクリット語を表示できるフォントはいくつかありますが、「utf-8」 文字コードで、できるだけ見やすい文字を試みようとしても、各「ブラウザ」(IE8.0、Firefox、GoogleChrome、Safari、Opera、このほか、Macなど、およびそれらのバージョンごと)によっても、 また、フォントのサイズの指定によっても、見え方が異なり、多国語文字が混在するホームページにとっては、フォントの問題は、非常に悩ましい問題であり、たえず、試行錯誤している状況です。
ブラウザで下記サンスクリット語の文字を見るとき、サイズを、「中」よりも大きい「大」などのサイズでご覧くださいませ。ただ、本文中に下記文字が混在して表出するときはホームページで使用中のフォントと同じままでいいかと思います。
小文字 大文字
01) ā = ā Ā = Ā
02) ī = ī Ī = Ī
03) ū = ū Ū = Ū
04) ṛ = ṛ Ṛ = Ṛ
05) ṝ = ṝ Ṝ = Ṝ
06) ṅ = ṅ Ṅ = Ṅ
07) ñ = ñ
08) ṭ = ṭ Ṭ = Ṭ
09) ḍ = ḍ Ḍ = Ḍ
10) ṇ = ṇ Ṇ = Ṇ
11) ś = ś Ś = Ś
12) ṣ = ṣ Ṣ = Ṣ
13) ḥ = ḥ Ḥ = Ḥ
14) ṃ = ṃ Ṃ = Ṃ
15) ḷ = ḷ Ḷ = Ḷ
一例) nirvāṇa = nirvāṅa
上記の各々の特殊文字30個をご自身が覚えやすいように単語登録しておけば、少しは楽でいいかと思います。
上記文字コードで大体間に合うと思われますが、残りの、r と l の字の下の、白抜き○、が付いた特殊の文字コードが、utf-8 で探しきれないので、現在下記 utf-8 コード表の中から調査中です。
出拠:文字コードの出拠は、下記のURLです。このURLの厖大な量のコード表のなかの、
1)Basic Latin、 (U+0000....U+007F)
2)Latin Extended- A、 (U+0100....U+017F)
3)Latin Extended Additional、(U+1E00....U+1EFF)
から、該当の文字コードを参照します。
http://www.utf8-chartable.de/unicode-utf8-table.pl
下図は、一例です。
今日も、一日、ありがとうございます。
ゆったりした気分でご覧下さい
。
***************