人類共有の知的財産・古文書をデジタル画像化
歴史愛好家から専門家までをリンク
人文学研究、ことに歴史学的分野において欠かせないのは「一次史料」の文献 に触れることだ。京都大文学研究科の林晋教授は一次史料をデジタル画像として取り込み、検索やリンク機能を搭載し、研究メモまで蓄積できるシステム 「SMART-GS」を開発。このシステムは、歴史愛好家から専門家までをもつなぐ、ワールドワイドな古文書ネットワークに発展する可能性も秘めているという。

SMART-GSではイメージ検索機能を用いて語の検索ができる。図は、ヒルベルトの「数学手帳」全ページから、「Gruppe」(ドイツ語でグループ、集団の意、数学用語では「群」)という語を検索し、似た字形の候補がいくつかヒットしたところ。
SMART-GS
HCPの構想のもととなったツール。すでにいくつかの歴史研究や京大文学研究科・文学部での教育に使われている。
研究手法を変えた史料のデジタル画像化
「史料を解読し、思考をめぐらせることが、研究の土台。しかし世界各地に 保管される史料の現物に触れたり、それを用いて研究することは、これまでは物理的にも経済的にも困難でした。しかしここ数年で状況は激変している。史料のデジタルアーカイブ化やデジカメの高性能化が進んでいるからです」。世界の主な大学図書館や、日本の国会図書館・国立公文書館などで貴重史料の多くがデジタル画像で公開されている。また大量の史料映像を歴史家自身がデジカメで低廉に撮影できるようになった。今や貴重な一次史料といえ ども、パソコンで閲覧・研究することが容易になっているのだ。
ただ画像デジタル史料を市販のソフトで扱うことは難しい。まず画像史料は市販ソフトでは検索ができない。また、画像用のリンク・メモ機能を持つ市販ソフトは珍しくないが、「重く、使い勝手も悪い」ため、研究の実用には耐えないとい う。もともと情報工学者でソフトウエア開発も行っていた林教授。二十世紀数学の父と言われるダーフィット・ヒルベルトの手書きの「数学手帳」を研究する際 に、工学者時代に学生とともに開発したシステム「SMART」がその解読に役立つことに気付き、文献研究用ツールとして改造したという。北海道大学・田中譲教授の研究室によ る画像検索エンジンを使い、共同研究で誕生した「読めないものを読む」ための新システム「SMART-GS」は、画像検索が特徴だ。

検索結果が求めていた語に合致していると判断するなら、□Yes にチェック、非合致なら □No、保留とするなら □Suspend にチェックをつける。この操作で、正解とした語(画像)がバケットに格納され、さらに検索をかけるとこの格納された複数画像がクエリー(検索対象)とな り、それらに似た姿の語が探し出せる。これを数回繰り返すと、わずか5~10分で100頁以上の文書からでも該当の語の殆どが探し出せるという。このように、検索結 果の正否を検索している人間が判断し、さらに検索の精度を高めていけるところが、実用的な研究ツールたり得る由縁だ。
現在、林教授が研究対象にしているのは、京都学派の哲学者・田邊元の手稿。西田幾多郎に招かれ、京都帝国大学の教壇に立った田邊の思想の社会的影響力は大きく、昭和初期の軍国主義的傾向に棹差したとも言われる。その田邊の哲学理論「種の論理」が形成される過程で綴られた手書きの講義ノートを読み解き、その思想の系譜をたどってい る。田邊の独特の崩し字は弟子達でも読めなかったというが、手稿の多くをデジタルカメラで撮影、その画像を「SMART-GS」に取り込み、今まで誰も読めなかった講義メモや手帳も解読しているという。
まず画像化した文書を、マウスを使って適当な固まりを囲む「行切り出し」を行い、その後、画像を検索可能にする自動の前処理を行う。読めない字が含まれる語をモニター画面上でマークし、文書全体に対して検 索をかけるとそれに似た字形の語がヒットする。似た姿の字を探して検討しながら解読するのは文献研究で行う「翻刻」の古典的な手法で、これまでは人が膨大な 時間・労力をかけて行うのが常だった。しかし、この「SMART-GS」を使えば、田邊の手稿からでもターゲットの語が検索できると いう。ヒットした語を読みとともに登録する「辞書機能」もある。また、田邊の思考を形作るキーワードを、文書全体から探し出すことも可能だ。
翻刻
くずし字などで書かれた古文書・板本などを楷書に直し、一般に読める形式にすること。活字化を指す場合も多い。
人文学研究の新ツールは、原典から研究ノートまで格納
「SMART- GS」では、画像化文書上でマークした部分にリンクして、新たなウインドウ上で翻刻や注釈を記録したり、別のウインドウで研究メモを記すこともできる。ま たさらに別のウインドウを開いてキーワードを時系列に並べて図示することができ、クリックすれば関連の原典部分に戻ることも簡単だ。「これまでは研究対象 の原典と研究メモなどが別々に存在するため、参照に手間取ることが悩みの種でしたが、今ではパソコン1台で事足りる。『SMART-GS』では自分 の思考の軌跡がかんたんにたどれ、論文執筆まで一元化できるのです」と笑みを見せる。

SMART-GSはリンク機能に優れている。右上のウィンドウは田辺元の1934(昭和9)年の講義ノートの画像で、右下にはその翻刻が表示されている。@は読めない文字をあらわし、@@@が赤くなっているのは、そこにリンクがあることを表す。そのリンク先 は中央下のウィンドウの*の部分で、@@@の部分についての所見が書かれている。また、手書き文字の辞書機能を随時使うこともできる。左中のウィンドウは、右上ウィンドウの赤枠の文字に似た文字を辞書で検索し、それが「内」であることを示すもの。左上のウィンドウはその辞書の該当箇所。
「SMART-GS」は自身のHP上に設けたHCP(Humanities Cyber Platform )のサイトで公開、配布中だ。近現代史学者の永井和教授(京都大文学研究科)はこのツールを歴史学研究の手法を劇的に変えるものとして注目し、「倉富勇三 郎日記」研究に活用、また未解読の文字である契丹大字や、チベット仏典の研究者なども興味を持っており、人文学研究の新ツールとして、少しずつ普及が始まっている。
HCP
Humanities Cyber Platformは林教授の造語で、人文学、特に文献研究を行う人文学の研究をサポートするための情報技術群のこと。ワープロや電子メールの文書のような「コード化」された文書ではなく、手書き文書、古印刷物などの電子画像を基本情報とする「画像化主義」をとること、徹底して実用を志向することをニ大特徴としている。
倉富勇三郎
明治から昭和にかけて活躍した官僚。大正末期には枢密院議長も務めた。
歴史愛好家も専門研究者も、同じ土俵で議論できるツール
「SMART-GS」はデジタル画像化さえすれば、手書きの文書だけでなく、活字文書での利用も可能だ。近い将来には、編集権限のないWebアーカイブ文書に、マーキング・書き込み・ リンクが自由自在のブラウザを作る予定で、これが実現すると、注釈を付けた文書を自分の作品としてWeb上で公開し、それに対して他者がコメントを加えるといった使い方も可 能になるという。これを利用して、一般家庭や企業・役所に眠る古文書や、印刷初期の刊行物で目にすることが容易でない貴重図書を画像化し、誰もがアクセスできるようになれば、 とも。

上のウィンドウでは、田辺元の書籍への書き込みの画像データが、下のウインドウにはその部分の翻刻が示されている。SMART-GSでは図のように、重要箇所を四角で囲ってマーキングすることもできる。
「古文書はパブリックな知的財産です。ある個人が取り込むのは論外で、公開するのが原則でしょう。Web上にアップされた古文書に、歴史愛好家から専門家までもが自由にアクセスしてコメントを付けるーーそんな古文書のワールド・ワイド・ウエブの構築が夢ですね」。開かれた知のネットワークの実現に向けて、林教授は胸をふくらませている。

SMART-GSで書かれた、林教授の特殊講義用の資料。史料画像は田辺元の「手帳(日記)」。林教授はこのようにSMART-GS上で、研究対象の史料とリンクさせた講義ノートを日々作成している。

http://www.shayashi.jp/HCP/SMART-GS/FromHayashisResearch.avi (7.5MB)
SMART-GSには、ある史料についての考察・推論を記述し、その全体像がグラフィカルに鳥瞰できる「Reasoning Web」機能がある。図は、林教授がヒルベルトの日記研究で使用したもので、左の棒はページを、右の棒は年代を表し、あるページに現れた記述とそれが書かれた年代との連関が示されている。クリックすると、該当の記述の史料の元画像やコメントが表示される。
(永野香、2009年12月11日)









