古代文字の解読にコンピューターを活用

聖書時代の文字が新しいコンピュータープログラムによって短時間で解読された。すでに“失われてしまった”古代のテキストが復活するかもしれない。

 解読プログラムはマサチューセッツ工科大学のチームによって開発され、粘土板に尖筆で刻んだ点や楔形の印からなる「ウガリット語」の文章の自動翻訳に成功した。ウガリット語はシリア西部で紀元前1200年頃まで使われていた言語だ。

 この“失われた言語”が刻まれた粘土板は1920年代後半にシリアの港町ウガリットを発掘していた考古学者チームが発見し、1932年には言語学者が文字の解読を完了している。それ以来、古代イスラエル文化や聖書のテキストの解明に役立ってきた。

 高性能ノートパソコン程度の処理能力があれば実行できる今回のプログラムは、ウガリット語の記号や単語が出現する頻度とパターンを、密接な関係のある既知の言語「ヘブライ語」と比較した。

 ウガリット語の文字や単語を繰り返し分析し、対応するヘブライ語に関連付けていくという方法で、数時間のうちに文字の解読をほぼ完了できたという。

 また、ウガリット語とヘブライ語の単語の語源が同じ場合は、60%の確率で単語を識別できた。良く知られた例として、フランス語の「homme」とスペイン語の「hombre」は、「男性」を意味するラテン語を共通の語源としている。

 解読作業につきものの“直観力”に欠けるという指摘もあったが、コンピューター科学者のレジナ・バージレイ(Regina Barzilay)教授率いるチームは、消滅した言語をコンピューター解析する有効性を初めて示すことができた。

「古代言語は専門家が推理力を駆使して解読するもので、コンピューターが役に立つとはだれも考えなかった。私たちの目的は、解読作業にハイテク技術の学習機能や統計能力をフル活用することだ」。

 この方法を未解明の古代文字解読に適用できなければ意味がない。その1つであるエトルリア語は、紀元前700年頃にイタリア北・中部で使われていたが、西暦100年頃までにラテン語にその座を奪われた。エトルリア語で書かれた遺物はほとんど残っておらず他の言語との関連も不明で、解読のめどが立っていない。

 オレゴン健康科学大学の計算言語学者リチャード・スプロート氏は今回の研究に対し、「ウガリット語の場合は文字体系が小さく単純で、密接に関連する言語もあった。3種類の文字が併記され、ギリシャ語から解読が進んだロゼッタストーンのような幸運は滅多にない」と指摘する。

 だが、研究責任者のバージレイ氏は、複数の言語を一度に検索し、文脈情報も考慮するようにプログラムを改良すれば、そのハードルは乗り越えられると考えている。改良によって、既知の言語との類似性やつながりが予期せず発見できる可能性もある。

 新しいコンピュータープログラムに関する論文は、スウェーデンのウプサラで7月11〜16日に開催された国際計算言語学会(Association for Computational Linguistics)第48回年次大会で発表された。