人文学のためのテキストデータ構築入門 TEIガイドラインに準拠した取り組みにむけて
一般財団法人人文情報学研究所/石田友梨/大向一輝/小風綾乃/永崎研宣/宮川 創/渡邉要一郎
より効果的にテキストデータを蓄積・共有し、広く世界につなげるために、人文学研究においてテキストデータはこれからどう作っていけばいいのか。
私たちの読みを残し、共有し、たどれるようにする、あるいはどう読んだかを次世代に継承するためには、どういう処理や方法が必要なのか。
今後の人文学研究にとって必須のテキストデータ構築の方法を、丁寧に解説、紹介していく書です。
欧米ではすでに、こういったことに1980年代から取り組んできており、TEI(Text Encoding Initiative)ガイドラインという形でルールを共有してきましたが、日本では文字の扱いなどで難しい部分もあり、導入が遅れていました。しかし近年状況が劇的に変化しつつあります。
本書では、今後の人文学のための、より広い世界につながっていけるようにするためのテキストデータの構築手法を、全4部構成でレクチャーします。第1部ではテキストデータの構築に関する概要とこれまでの日本での動向、第2部は、テキストデータ構築のための実践、第3部、4部はテキストデータ構築やその利活用に関する事例を紹介します。
特に実践編では、実際使用するソフトウェアについての紹介とチュートリアルを提供するなど、具体的に紹介し実践的に作られています。ぜひ本書をガイドに、自身のテキストデータを扱ってみて下さい。現時点で考え得る実現可能かつ有用性の高いテキストデータ構築の手法を提示しています。実践演習として「漱石書簡を用いたTEIによるテキスト構造化入門」も掲載。
事例も豊富に紹介しています。古代から近代、日本や中国、中東、欧州までと、広範囲におよぶうえ、仏典の一大叢書である大正新脩大藏経に対するTEIガイドライン準拠のための構造化を組織的に推進しているSAT大蔵経データベース研究会の取り組みも紹介しました。
これからの人文学研究のために、必携の書です。 3,300円