Unicode コンソーシアム公式サイトこの団体がUnicodeの収録文字などを策定している。

あまねく世界で一つのフォントを ~AdobeとGoogle、協力して新書体を開発~

  • このエントリーをはてなブックマークに追加

by [2014年7月22日]

皆さんは中国などの漢字文化圏に属する国外Webサイトを閲覧して、そこに表示される漢字に違和感を覚えたことはありませんか?

Source Han Sans 書体見本

このたび、PostScriptやPDFフォーマットなどを開発し、文字の扱いに特に関わりの強いソフトハウスであるAdobeと、Google、それに各国のフォントメーカーの共同開発により、同一書体ファミリーで日中韓の3カ国で用いられている漢字に対応する、画期的な新書体が誕生しました。

Adobeが「Source Han Sans」、Googleが自社の汎Unicodeフォントファミリーの一環として「Noto Sans CJK」と呼び、サンセリフ体を基礎として全く新規にデザインされたこのフォントファミリーは、7種のウェイト(文字の太さ)を提供するその規模のあまりの巨大さと、それが無償提供され、しかも改変が自由である、という点で特筆に値するものです。

今回はこの新書体を中心に、文字コードと書体について考えてみたいと思います。

各国で結構異なる漢字

Unicode コンソーシアム公式サイト
この団体がUnicodeの収録文字などを策定している。

現在、Webの世界で広く使用されている文字コードはUnicodeです。

「単一のコード」つまり、一つの文字セットに全ての言語・全ての文字種を収録したこの文字コード体系では、各国で用いられている漢字について、網羅的に文字コード割り当てがなされています。

しかし、実際には各国で用いられる文字の範囲が異なる(※注1)ことや、Unicodeに採録されているだけでも異字体を含め最大でおよそ7万5千種ほどに達するその文字種数のあまりの多さ(※注2)などから、これまで日本・中国・韓国の3国全てで用いられる漢字(中国の簡体字を含む)を網羅する統一された書体で、しかも入手の容易なフォントセットは事実上存在しませんでした。

 ※注1:例えば日本では中国の簡体字は通常扱われず、逆に中国では日本で作られた国字(約2,200文字程度存在します)は用いられません。
 ※注2:実際には約10万種以上の文字種があると考えられていますが、既に実用されていない文字も少なくありません。ちなみに、現在日本で用いられているJISの第1水準から第4水準までの範囲(JIS X0213 2004など)の文字種約1万3千に対応するフォントセットですら、Unicode対応で先鞭を付けたジャストシステムの「JS平成明朝体W3」を筆頭に、その数が限られています。

そのため、例えば「MS Pゴシック」がデフォルトの基本フォントとなっている日本語Windows環境のWebブラウザ上で日本語圏外の漢字言語圏で作られたWebページを閲覧した場合、書体が変わってデザイン的にも違和感を覚えることになります。

また、環境によってはその文字コードに対応するフォントがそのブラウザのインストールされているOS環境に用意されていないために、文字として表示できず通称「豆腐」、つまり文字種非対応を示す四角形が文字の代わりに表示されるという悲しいケースも少なからず存在します。

統一書体の不在

こうした網羅的かつ統一された書体のフォントの不在が一番問題となるのは、多国語表示を行いたい場合です。

例えば最近の東京の地下鉄では車内の液晶ディスプレイを用いて各国語での案内が表示されるようになってきているのですが、その書体が言語ごとにバラバラで、デザイン的にあまり美しくない状態のものが少なくありません。

Webページ上での多国語表示の場合も同様で、アルファベットを使用する各言語ごとの表記であれば比較的容易に書体を揃えることができるのに、漢字の場合は統一された書体でUnicodeに登録された全文字種を網羅的にサポートするフォントが存在しなかったが故に、各国表記ごとに全く違う書体が混在せざるを得ない状況となっています。

これは、これまで長らく3国の漢字を並べて表示させる必要が薄かった、という事情もありますが、それ以上にそのあまりの規模故に思いついてもおいそれと実現に移せない、フォント作成の工数的にも費用的にも大変難しい事業であった、ということによるものです。

手間のかかるフォント設計

AdobeのTypekitブログで紹介されている、Source Han Sansの書体作成作業
ご覧の通り数万もの文字種について、1文字ずつこのように手作業でデザインを行わねばならない。

各国の漢字を網羅するフォントセットを作成する上で最大の障壁、それは、なんと言っても漢字の文字種の極端な多さです。

先にも述べたように漢字についてはUnicodeで現在正式に割り当てられているだけでも最大で約7万5千、実用的な範囲に絞っても約6万弱程度の文字種があるため、それらを網羅したい場合、単純に文字種一つ一つについて十分な視認性を備えたフォント設計を行うだけでは済まず、各国での文字使用状況を考慮しつつ書体デザインについて一定の整合性を持たせてフォント設計の調整を行わねばなりません。

しかも、今回のAdobeとGoogleの共同プロジェクトでは、漢字だけでなく組み合わされるアルファベットの書体との整合・バランスについても十分な配慮を行う必要があり、厄介なことにはAdobeが併用を想定していたアルファベットの書体(Source Sans:サンセリフ体)だけでなく、Google側のフォントファミリーとしてAndroidでおなじみのRobotおよび同社がUnicodeでの統一フォントとして開発中のNoto Sans(サンセリフ体:※注3)との整合・バランスについても配慮する必要があったため、そのフォント設計の難度は非常に高いものとなりました。

 ※注3:「Noto Sans」の「Noto」は「ノー豆腐」、つまり該当フォントが存在しない場合に表示される「豆腐」を表示しないぞ、ということから名付けられた、汎Unicodeフォントファミリーのファミリー名です。

というのもアウトラインフォントの場合、通常のデスクトップパソコンなどで大きなディスプレイ上で表示して利用する場合と、小さな画面のスマートフォンで使用する場合とでは文字の拡大縮小の倍率が異なっていて、設計された一つの基本となる書体に対し、倍率によって適宜線の太さなどのバランス調整を行わねば視覚的に同一書体としての統一感を得るのが難しい、という問題があるためです。

このバランスを調整するための補正情報のことをヒント情報と呼ぶのですが、単に拡大縮小時のバランスだけでなく、各国の漢字を混在表示した場合のバランス、さらにはアルファベットなどの異種文字との混在時のバランスまでこのヒント情報で調整し整合性を持たせるとなると、その難度は指数関数的に跳ね上がってしまうのです。

実際、この問題はAdobeとGoogleだけでは手に余り、よほど解決が困難であったらしく、このプロジェクトでは最終的に日本(イワタ)・韓国(Sandoll Communication)・中国(Changzhou Sinotype)の有力フォントメーカー3社の協力を得て、こうした書体デザインの調整や、漢字からは外れるものの韓国での利用を考えると不可欠のハングル文字の設計などが行われています。

なお、今回の「Source Han Sans」については一部で「ヒント情報の設計が甘い」という指摘があるようですが、前述のとおりこれが漢字内での整合性調整に加えて異なる3つのアルファベット書体との整合性も取らねばならなかったことを考慮すると、あえてヒント情報の設計を甘くすることで各書体間のデザイン的な整合性が特定条件で破綻するのを防いでいる可能性があります。

本当は高価なフォント

現在のAndroidやWindowsなどでは基本的な書体が標準で添付され、さらにいわゆるOfficeなどのオフィススイート製品にもバンドルされていることが多いため、またそうした標準添付/バンドルのフォントがあれば大概の用途で事足りるため、最近ではほとんど意識されなくなっていますが、本来アウトラインフォントは非常に高価な製品でした。

例えばWindowsでアウトラインフォント(TrueTypeフォント)が標準サポートされていなかったWindows 3.0の頃(1993年以前)にはジャギーのない綺麗な書体で印刷したい場合、レーザープリンターなどに内蔵のアウトラインフォント書体を利用するか、さもなくば別途アウトラインフォントを購入・インストールして利用する必要がありました。

SX-Window 3.1
シャープ X680x0シリーズのために提供されたGUI環境の最終バージョン。「シャーペン.x」と名付けられたテキストエディタ(標準添付)などの対応アプリ上でベジエ曲線を用いた(高価な)アウトラインフォントが利用可能であった。

ちなみに当時シャープのX68030という独自規格の国産パソコンを使用していた筆者は、その専用GUI環境であるSX-Window上で利用するため、今は無き某社の販売していた独自規格フォーマットの明朝体セット(JIS第一水準および第二水準の文字種をサポート。太さの違いで3種の明朝体が存在)を購入したのですが、たった6,300種ほどの漢字+αしか収録されていないのにおよそ5万円近い値段が付いていたことを今でもよく覚えています。もっともアウトラインフォントの設計と製作には膨大なマンパワーが必要で、試しに自分でドローツール(EasyDraw)を用いてベジエ曲線による文字データを作成してみた筆者は1文字作るだけでもあまりの手間と時間がかかることに絶句し、その値段に納得の上で件のフォントを購入したものでありました。

実際、今回の「Source Han Sans」でもプロジェクトの開始から今回の公開までには実に3年以上もの時間(※注4)を要しており、その工数の膨大さを物語っています。

 ※注4:通常よりも多くの文字種の新規設計を行い、さらに3つの欧文書体とのバランス調整を必要としたことを考慮すると、むしろ短期間で完成したと言えます。

現在でも、PostScript対応フォントなど出版業務等で利用されるフォントには非常に高価なプライスタグと厳しい使用条件制限が付けられていますし、WindowsやMac OS X用のフォントであっても特別な書体については相応の値段で市販されているのですが、そうしてみると、これまでにない多数の文字種を7つのウェイトでサポートする今回の新フォントが無償で提供され、しかも自由な改変利用が許可されるというのがいかに破格の措置かが理解できるかと思います。

もちろん、その措置を支える資金提供を行ったGoogleには自社の利益につながる一定の意図があってそのような決定を行ったものと思いますが、それはそれとしても賞賛に値する決定であると言えるでしょう。

どうやって使うのか

さて、以上のような経緯で非常に多くの文字種をサポートするフォントが無償提供されるようになったわけですが、問題はその利用方法です。

表示だけであれば、Unicodeでの文字表示に対応するOSと、そのOSの上で動作し、なおかつUnicode表示に対応するWebブラウザなどのアプリがあればそれで事足ります。

具体的に言えば、Microsoft WindowsはWindows 2000以降(※注5)でUnicodeをサポートしていますから、事実上Windows XP以降が大半を占める現在の状況ではUnicodeが利用できないWindowsを利用しているのは、そのOSでないと動作しない古いパソコンを使用して昔のゲームを楽しむなど、よほど特殊な環境に限られるでしょう。

 ※注5:ただし、Windows 95などのいわゆる9x系でも「Microsoft Layer for Unicode」と呼ばれる特別なライブラリを利用すればUnicode対応アプリの使用が可能でした。

Mac OSでもOS X以降でUnicodeの実装の一つであるUTF-8の独自拡張バージョンを使用しており、他のOSでも大なり小なり似たような状況で、少なくともWebブラウザ上でUTF-8でエンコードされた文字列を表示する分には現行のどのOSでも問題ありません。

最新の一太郎2014とATOK 2014で約58,000の文字種を扱えるようになったことを誇示するジャストシステムのWebページ
ここでも対応の鍵がフォントにあったことがさりげなく示されている。

問題は、入力です。

例外的に今年2月に発売された最新版(ATOK 2014)でUnicodeのIVS文字(異字体文字)に対応し58,000種の文字をサポートしていることを公表しているジャストシステムのATOK(※Windows版)を別にすれば、「Source Han Sans」に含まれる漢字群を日本語OS環境で有効活用できるIMEは現時点では事実上存在していないようです。

恐らく、Googleが開発中の次期Android “L”ではこうした対応が当然に行われるものと思いますが、それ以外の環境では当分の間、それぞれの言語環境で入力したテキストを合成する、あるいは往古のごとく文字コード表を片手に直接コード入力する、などの大変原始的な手段を用いる必要がありそうです。

そのため、文字変換の基礎となる辞書作成も簡単では無いのですが、IMEを開発している各社、およびOSメーカー各社にはぜひ「Source Han Sans」あるいは「Noto Sans CJK」で利用可能な全文字種を入力できるよう、早期の対応をお願いしたいところです。

▼参考リンク
アドビ、Googleと協力し、画期的なデジタル書体を発表 | Adobe
The Typekit Blog | Source Han Sansの紹介:オープンソースのPan-CJK書体
Unicode Consortium
日本語ワープロソフト 一太郎2014 徹

コメントは受け付けていません。

タグ:
PageTopへ