いやぁ、面倒くさい話ですよ。
前提知識
「〜」(波ダッシュ:U+301C)は、○から○まで、のような範囲を表現するときに使用する記号です。
「~」(全角チルダ:U+FF5E)は、スペイン語やポルトガル語で ñ とか ã など文字の上に乗せる発音記号の全角文字です。
厚労省が作成した成分名一覧
さて、医薬品や医薬部外品の製造販売承認申請で使用する成分名は厚労省の「FD申請 電子様式定義書」をダウンロードした中にある「成分コード(CODE106)_202406.xls」というEXCELファイルで確認することができる。
https://web.fd-shinsei.mhlw.go.jp/download/style/index.html
全角チルダが使われている
この成分名一覧のEXCELファイルで『アルキル(8〜16)グルコシド』とか『ポリオキシエチレンアルキル(12〜15)エーテルリン酸』とか『安息香酸アルキル(C12〜C15)』とか名称の中に範囲を表す記号を含んでいる成分を波ダッシュで検索してもまったく該当しないという問題がある。
なんと、厚労省が作成している医薬品等新申請・審査システムのコード定義表「CODE106 成分コード」で記載されている成分名では、範囲を示す「波ダッシュ」であるべき文字が、すべて発音記号の「全角チルダ」で作成されているのだ。だから「8〜16(はち波ダッシュじゅうろく)」だと検索しても見つからず「8~16(はち全角チルダじゅうろく)」で検索すれば見つかる。これは厚労省が配布している「医薬部外品原料規格2021」のPDFファイルでも同じだ。
「〜」も「~」も見た目が同じだから画面や印刷で見るにはあまり問題にならないが、データをデータとして取り扱うようになったこの情報化社会では、見た目が同じならどっちの文字で書いてもいいじゃん、にはならない。
なぜ全角チルダ?
しかし、なぜ厚労省は医薬部外品の成分名で、範囲を表す記号に波ダッシュを使わずに発音記号の全角チルダを使ってるのだろうか。
古今東西ありとあらゆる文字という文字を全てひとつのコード体系に統合する「ユニコード」。1990年代から始まったユニコードコンソーシアムによる統合作業の初期段階において、波ダッシュは左から右に向かって「下がってから上がる」という上下逆の間違った字形で登録されてしまったのがおそらくこの問題の元凶だと思う。欧米企業が主導するユニコードコンソーシアムでは、いわゆる「中華フォント問題」に代表されるように非英語圏の文字の形状に対する感覚が極めて鈍い。波ダッシュも日本語文字(英語圏で範囲を示す記号は「–」である)だからおそらく欧米人にとっては興味の範疇外だったのだろう。ようやく波ダッシュの形状が訂正されたのは 2014年のユニコードver.7 からだ。
さて、パソコンに搭載される標準フォントは当然のようにユニコードコンソーシアムが定めた形状をもとにデザインが作られる。ユニコードコンソーシアムが波ダッシュを間違った形状で定義してしまった結果、Windows XP に代表される 2000年代初頭のパソコンにインストールされている標準フォントで波ダッシュは、画面表示も印刷も左から右に向かって「下がってから上がる」形状でデザインされてしまっていた。欧米人にとってはどうでもいいことかもしれないが、日本人にとっては極めて違和感のある。
このころ日本では主に下記の3つのどれかで対応していた
ユニコードコンソーシアムが定めた文字形状に準じて波ダッシュが「下がってから上がる」形状でデザインされたフォントをなんか変だなぁと思いつつも使う。
ユニコードコンソーシアムが定めた文字形状に反して波ダッシュが「上がってから下がる」形状でデザインされたフォントをインストールして使う。
本来の波ダッシュと形状がそっくりな全角チルダを使う。
1.や2.で対応していれば、パソコンやスマホに搭載されている標準フォントのデザインがいずれ訂正されれば自然と問題は解決できたのだけど、世の中の多くの人はそもそも原因がわからないのでこういう結論には辿り着けず、3.の対応をしていた人が非常に多かった。
しかも、Windows XP に標準搭載されている日本語IME(かな漢字変換)が、波ダッシュを使おうとする入力に対して積極的に全角チルダに変換して出力しようとすることも問題を増強してしまい、波ダッシュであるべき場所に全角チルダが入力されている日本語が大量に生成されてしまうこととなった。いまも、Windows 10 に標準搭載されている日本語IMEで「から」と入力するとデフォルトでは「~」(全角チルダ)が先に出てきてしまう。
「IMEパッド – 手書き」を使ってニョロっと書くと「〜」(波ダッシュ)が出てくるので、こうやって何度か波ダッシュを出していると、そのうち「から」を変換したときに「~」も「〜」も変換候補に出てくるようになる
「IMEパッド – 手書き」だと波ダッシュが出る
変換候補として両方出てくるようになるのはいいんだけど、どちらも見た目がそっくりすぎて区別がつかない。[全] と書いてあるのが全角チルダで、[環境依存] と書いてあるのが波ダッシュだ。
[全] が全角チルダ、[環境依存] が波ダッシュ
波ダッシュには [環境依存] というラベルが付いているが、これはフォントデザインが古い環境だと上下逆さまになるかもしれないという話であって、環境によって「③」が「㈫」になってしまうような文字の表す意味そのものが変わってしまう環境依存とはまったく違う。なので、範囲を表す場合は [環境依存] のラベルに恐れることなく積極的に波ダッシュを使うべきなんだけど、[環境依存] なんてラベルつけられるとどうしても使っちゃいけない文字って感じがしちゃうよな。
いまも全角チルダを使う厚労省
厚労省が作成している医薬部外品の成分名も、波ダッシュの形状が変だった時代に、見た目重視で全角チルダを使っていたのだろうか。もしかしたら Windows XPの標準IMEが「から」を変換すると全角チルダを出してくるから何も考えず全角チルダを入力してたのかもしれない。しかし、これは明らかに範囲を示す文字なのだから、本質的には波ダッシュを使わなければいけない。
波ダッシュの形状問題はとっくに解決されているのだから、できるだけ早急に本来の正しい意味を持った文字に置換すべきだけど厚労省の担当者はこのことに気づいてないのだろうか? いまもって全角チルダを使い続けている。Cosmetic-Info.jp では悩みに悩んだ挙句、厚労省が作成している成分名データとのデータ突合性を重視して全角チルダで合わせているけど、正直言って恥ずかしい。
早ければ早いほど傷は浅い。いまならシレッと書き直したってバレないよ(気づく人はこの問題を理解している人だから即応できるし)。とにかく早く書き直しちゃってくれよ>厚労省
気づかずに全角チルダを使っている
Windows の標準かな漢字変換プログラムが「から」を全角チルダに変換しようとする。
波ダッシュが出てくるように学習させても、波ダッシュには [環境依存] というラベルが付いてしまっているので、[全] と書いてある全角チルダを選択してしまいがちである。
Windows のこの挙動が変わらない限り、今後も範囲を示す記号に間違って全角チルダが使われてしまう文書が作られ続けるのだろう。そして、ちゃんと波ダッシュで作られた文書が「検索できない!」「変な文字を使うな!」といういわれのない罪を着せられ続けるのだろう。マイクロソフトは罪だなあ。