つれづれなる技術屋日記

しがない技術屋。専門は情報工学で、「つれづれ技術屋」って呼んで。

「Σ」は漢字? 「ゔ」はひらがな?

とある勉強会で、用語集なるものを作成/メンテナンスしている。用語の並び順の見直しをした際に、「Σ計画」(しぐまけいかく)の位置が気になってきた。なお実際は、Σを先頭とするΣ計画に関連した文言。

 

その用語集では数字、英字など、そして「あ」の段、、、、と続けている。以前あまり気にもせず、Σを英字の後(つまり「あ」段の前)にしてた。ところが、このようなギリシャ文字を含む英語などの用語は、国語辞書なら読み方で個所を定めて、Σなら「し」の段にしてるようだ。なお、今回のΣはギリシャ文字なので、業界用語辞典の類では英数字、記号の方に含めている場合もありそう。

 

Σは読み方は明確だが、「凸」のように(音訓読みのある漢字と定められているが)漢字なのか記号なのか悩むケースがある。そしてこれも用語集に含める可能性は皆無だが、若者表現というかネットでは「☆彡」のように意味は持つものの読み方が定まってないものもある。そのため、用語の登録時に悩まないように、ルール化してみようと思った次第。

そこで、”ASCIIコードでの数字、英字と記号”と、”音訓読みのはっきりしているひらがな・カタカナ・漢字”を別格として、1バイト系の文字や記号と2バイト系の記号や読み方の分らない文字を、ASCII記号の後に並べるようにルール案とした。

1バイト系の文字や記号には、ドイツ語とかフランス語の文字、そしてギリシャ文字などがある。記号に関してはいっぱい。2バイト系の読み方の分らない文字には、簡体字繁体字、ハングル文字辺りも含める考え。一般的にΣはJIS漢字コードの文字だが、ここでは1バイト系としている。unicodeでΣなどが漢字よりも前に位置してるというと、イメージが分りやすいかと思う。

 

ASCIIコードでの英数字と記号としてるのは、ASCIIコードでもunicodeでも同じだが、英数字記号を1まとめにしていて、コード順を文字並び順に出来ない。例えば、”[”は”Z”の後で”a”の前に位置する。そのためASCIIコードでの英数字以外を記号として、その中での並び順は、unicodeの並びで良いとしたわけだ。

 

なお、「☆彡」は読みようがない(確定して無い)ので、記号扱いで「あ」段の前。もちろん今作業している用語集に掲載するかは別であるが。

 

今回の勉強?で気づいたが、「ゔ」は一般的に使われずJISには無いが、unicodeにはある文字。ただしJISには無いと書いたが、JIS X 0213(拡張漢字)には含まれてはいる。JIS X 0213の普及度や他の一般に使われない字(記号?)の並び順を考える場合に、複数版のあるJISで考えるよりもunicodeの方が良さそうとの意図もあって、そう表現した。今作業している用語集に掲載するなら、ヴと発音するなら、ひらがな文字扱いという考え。

また、用語順が国語辞書でも微妙に違うのは以前から知っていたが、国語辞典でのアルファベット用語というかアルファベット略号の扱いも色々のようだ。広辞苑だと(第6版から?)付録として別冊にしてある。ふと今回問題視した記号的な用語の扱いが、近い将来どうなるか、ちょっと興味が出てきた。

 

 

 

 

©2005-2022 ほんだ事務所(honda-jimusyo) All rights reserved.