fc2ブログ

マップルラボ「MAPPLE法務局地図ビューア」の公開を受けて

2月14日に、マップルから「MAPPLE法務局地図ビューア」(以下「地図ビューア」)を公開した旨のプレスリリースが出されました。


この地図ビューアに最初にアクセスした時に表示されるダイアログでは次の様に説明されています。

「MAPPLE法務局地図ビューア」はG空間情報センターで公開されている登記所備付地図データを「MAPPLEのベクトルタイル」に重ねた地図です。MAPPLEの地図と重ねることにより、不動産鑑定や土地家屋調査などの不動産関連業務、公共サービス、農業、林業、災害対応など街づくりに関する業務のDXや効率化につながります。詳しくはプレスリリースをご覧ください。


現状では地籍調査は全国的に見てもあまり進んではおらず、地図データ化出来ている地域は更に少ないのが実情の様で、神奈川県下では地籍調査の進捗率が10%に満たない市町村も数多く存在しています。このため、残念ながら神奈川県下ではこの地図ビューアでも「ベクトルタイル」が全く表示されない地域の方がかなり多くなってしまっています。とりわけ、新旧の東海道筋で地籍調査が進んでいない地域が多く、こうした地域ではこのビューアで得られる新たな情報は期待できません。

但し、比較的早い時期に地籍調査を完了して地図データが存在する地域では、その後の開発前の状況を現在の地図と重ねて見ることが出来ます。それによって、古い時代の街道や河道の位置関係をより高い精度で把握することが可能な箇所が存在しているのも事実です。

今回はそうした地域の中から、中原街道の地図データを見てみたいと思います。横浜市緑区の鶴見川に架かる落合橋から瀬谷区の新道大橋手前までの区間では地図データが揃っており、現在の様に片側2車線の道路へ拡幅される前の街道の位置関係がかなり見て取れます。

「MAPPLE法務局地図ビューア」中「道-33」
八王子バイパス下川井インター付近の地図データ
マーカーの指し示す先が旧中原街道の区画「道-33」(「MAPPLE法務局地図ビューア」をスクリーンキャプチャ)

八王子バイパス下川井インター付近の1960年代の空中写真と地形図との合成(「地理院地図」より)

とりわけ興味深いのが、現在は八王子バイパスの下川井インターの建設に際して大きく台地を削ったために消滅してしまった区間が、地図データ上に残っていることです。「道-33」という名称になっている区画がかつての中原街道で、現在の下川井インター交差点のやや南側を登る坂道であったことがわかります。

「地理院地図」の1960年代の写真でも、かつての中原街道の道筋を現在の地形図と重ねて見ることが可能ですが、写真では周辺の建物や生垣の樹木の影になって判別が難しかったり、現在の地形図との測地のズレもあって精度という点では課題が残ります。今回の地図ビューアの持つ精度については更に検証は必要ですが、基本的には公図としての精度は保っていると考えられますので、空中写真と比較すると現在の道路等との位置関係が明確になりやすい特徴はあると思います。

「MAPPLE法務局地図ビューア」中「道-537」
「梛の木石碑前」バス停付近の地図データ
マーカーの指し示す先が旧中原街道の区画「道-537」(「MAPPLE法務局地図ビューア」をスクリーンキャプチャ)


上記箇所付近の1960年代の空中写真と地形図との合成(「地理院地図」)

下川井インターから中原街道をもう少し西へ進んだ辺りでは、現在の県道の脇の細い路地と、「道-537」と名付けられた区画が重なっていることがわかります。この路地が旧中原街道の名残です。1960年代の空中写真では、南側の林の陰が街道に被ってしまっているため、道筋を判読するのが困難になってしまっています。

中原街道は江戸へほぼ直線的に向かう道であると、江戸時代の文書などに記されていることが多いのですが、実際の街道は僅かながらS字状のうねりがあったことが、地図データに残る街道の区画から読み取れます。その大半は道路の拡幅によって消滅しているのですが、ごく一部にこの様な旧道の「名残」が残った箇所があります。この地点については、街道の北側が崖になっていたことによって道路拡幅後に旧道を残して崖の上からの道筋との接続を確保する必要があったのでしょう。結果的に旧道と拡幅後の県道との間にごく細長い敷地が残りました。

また、地籍調査時点での中原街道の道幅が、後の拡幅工事によって獲得した道幅と比較して、数分の1程度の幅しかなかったことも見て取れます。但し残念ながら、この記事執筆時点では地図ビューアに縮尺が表示されていないため、「道-33」で示される「道幅」がどの程度のものであったかを地図上で計測することが困難です。現在の地形図で計測できる道幅との比較で類推するしかありません。

更に、地籍調査もそこまで時代を遡るものではありませんので、これを元に該当する公図を取り寄せて計測を行ったとしても、その道幅が何処まで時代を遡って適用可能なものと言えるか、特に江戸時代当時の記録との比較に耐え得るものであるかは、他の史料などと照らして考える必要があります。

「MAPPLE法務局地図ビューア」中「道-12」
「動物園入口」交差点付近の地図データ
マーカーの指し示す先が旧中原街道の区画「道-12」

「MAPPLE法務局地図ビューア」中「1449-110」
同じ位置の地図データに旧中原街道の区画と考えられる「1449-110」も見える
(どちらも「MAPPLE法務局地図ビューア」をスクリーンキャプチャ)


同じ位置の「今昔マップ on the web

実際、下川井インターの北東側の「動物園入口」交差点付近には、「道-12」という区画が見えています。この区画がかつての中原街道の位置にあることは確かですが、道としての幅はかなり拡がっていることがわかります。1960年代の空中写真と比較すると、必ずしもこの区画全体が道として使われていた様には見えていませんが、地籍調査の時点で既に拡幅のための用地が取得されていたのかも知れません。実際、この交差点の南西側でかつての中原街道は小高い丘を迂回する道筋が付けられていましたが、その道筋は「1449-110」と名付けられた区画として存在するものの、現在の県道に位置する区画も既に複数に分かれて存在しており、拡幅に向けての動きが地籍調査の結果に反映していることが窺えます。

上で記した通り、神奈川県下では地籍調査の実施率が低いことから、今回の様な検討を行い得る地域は限られています。しかし、古い時代に調査が実施された地域では、この様な区画の変遷を辿れる可能性が秘められており、その点では今回の地図ビューアはこうした変遷を捉えやすく表示してくれるツールとなり得る存在であると言えます。まだ実験的な公開という段階ですが、今後の展開を見守りたいと思います。
  • にほんブログ村 歴史ブログ 地方・郷土史へ
  • にほんブログ村 地域生活(街) 関東ブログ 神奈川県情報へ
  • にほんブログ村 アウトドアブログ 自然観察へ

↑「にほんブログ村」ランキングに参加中です。
ご関心のあるジャンルのリンクをどれか1つクリックしていただければ幸いです(1日1クリック分が反映します)。

地誌のはざまに - にほんブログ村

「【動画】多摩川台公園〜古墳と多摩川遊覧と浄水場〜」補足

これも先日来の「国立国会図書館デジタルコレクション」(以下「デジタルコレクション」)のリニューアルによって実現したことの一環ではあるのですが、当初アップする予定だった「その3」がまだ仕上がっていないため、こちらの短い記事を先に出します。

かなり前の記事で、現在の多摩川台公園内に位置する古墳群を、将軍就任前の徳川家定がそれとは知らずに訪れていたことを動画にして公開しました。その際に典拠とした史料について、その名前はわかっていたものの、それが収録されている史料集の名前を書き留めそこねていることを記しましたが、それから10年以上そのままになってしまっていました。

「デジタルコレクション」のリニューアルで全文検索が可能になったこと、また対象となった資料が大幅に増えたことから、あるいはこの資料も検索できるかも知れないと思い立ち、試しに史料の名称「玉川辺亀ノ甲山江右大将様御成記録」で全文検索してみました。

その結果、該当する資料集が1件ヒットし、「国立国会図書館内/図書館・個人送信限定」資料として登録さえ出来ればインターネット経由でも閲覧できることがわかりました。件の資料は

大田区史 資料編 北川家文書 1」(大田区史編さん委員会 編 1984年 東京都大田区刊)

でした。当該の史料は312ページから325ページにかけて掲載されており、かなり長大なものになっています。

この史料中の「御成御場所()絵図」は318ページ〜319ページの見開きに掲載されています。複数の小さな古墳が連なる様子が現在の地形とも大筋で合致するものとなっており、その上にどの様に道などを配置したのかがこの絵図によって良く理解できます。

なお、「玉川辺亀ノ甲山江右大将様御成記録」の後続に掲載されている
  • 18 御成御用人足幷諸雑用取調帳
  • 19 亀ノ甲山御成諸人馬諸入用記録
も家貞の御成に関連する資料で、御成に際して働いた人や馬の動きが事細かく記録されているのがわかります。

何れにせよ、こうした市町村などの資料集も全文検索で探し出せる可能性が拡がった点は、郷土資料の使い勝手を飛躍的に向上させるものになったと言えそうです。勿論、これまで繰り返し書いてきたことですが、現状ではOCRの精度に制約がある以上、検索結果のみに頼った調査は慎むべきではあります。しかしそれでも、「デジタルコレクション」に収められている資料集であれば、居住地の最寄りの図書館では閲覧できない遠隔地の資料もこの様に探し出して閲覧できる可能性が拡がったのは大きいものがあります。
  • にほんブログ村 歴史ブログ 地方・郷土史へ
  • にほんブログ村 地域生活(街) 関東ブログ 神奈川県情報へ
  • にほんブログ村 アウトドアブログ 自然観察へ

↑「にほんブログ村」ランキングに参加中です。
ご関心のあるジャンルのリンクをどれか1つクリックしていただければ幸いです(1日1クリック分が反映します)。

地誌のはざまに - にほんブログ村

「国立国会図書館デジタルコレクション」のリニューアルを受けて(その2)

前回の記事に引き続いて、先月21日にリニューアルされた「国立国会図書館デジタルコレクション」(以下「デジタルコレクション」)の全文検索で新たにヒットする資料をもとに、何か新たな発見があるかどうかを試してみます。

今回は前回の「馬入橋」を受けて、「酒匂橋」を取り上げることにしました。酒匂橋につては馬入橋ほどに落橋を繰り返した記録は残っていないものの、明治から大正にかけての経緯については更に探すべき史料が存在する可能性も感じているからです。


酒匂橋酒勾橋馬入橋
明治1〜10年
(1868~77年)
0件0件0件
明治11〜20年
(1878~87年)
0件0件4件
明治21〜30年
(1888~97年)
5件5件7件
明治31〜40年
(1898~1907年)
19件7件23件
明治41〜大正6年
(1908~1917年)
29件7件9件
大正7〜昭和2年
(1918~1927年)
42件23件37件
ひとまず「デジタルコレクション」上で「酒匂橋」と入力して検索すると441件の資料がヒットします。結果を絞り込むため、明治元年から10年区切りで分類すると、右の表の様になります。比較のために馬入橋のヒット件数も併せて表にしてみます。更に、「新編相模国風土記稿」で「酒匂」の表記は「酒勾」の誤りであるとするなど、「酒勾橋」の表記に拘った資料も存在するため(全体で91件)、こちらについても同様にヒット件数を一覧化しました。

ヒットした資料の出版年が早いのは馬入橋の方ですが、その後の件数の伸びという点では、「酒匂橋」と「酒勾橋」を足した件数の方が多くなっています。OCR精度の課題はありますので、この件数も多少の誤差はあると考えられますが、それぞれの検索キーワードに対して誤差が同じ様に出ると考えると、件数の分布の傾向については大筋でその通りに読み取って良いのではないかと思います。

ヒットした資料を点検して見えた傾向からは、「酒匂橋」や「酒勾橋」のヒット件数が「馬入橋」より増えた最大の要因は、文芸作品での登場回数が意外に多いという点にある様です。中には単に酒匂橋を通過したことを記す程度のものもあります(「千歳之鉢(ちとせのはち)」泉鏡花著 「柳筥」所収 明治42年 春陽堂、「箱根撮影記」田山花袋著 「花袋紀行集 第1輯」所収 大正11年 博文館 など)。しかし、酒匂橋周辺の景観を愛でるものも少なからず見つかります。こうした事例から数点引用してみます。

電車(でんしや)(うご)()した。停車場(すていしょん)(わき)から大迂廻(おほまはり)して國府津(こふづ)(くわん)(まへ)()ると、それからは(のき)(ひく)(ちひ)さな(いへ)ばかり(なら)むだ狹苦(せまくる)しい(まち)(とほ)ッて、二條(にでう)軌道(れいる)(はし)ッて()く。酒匂橋(さかはばし)(ところ)まで()ると、(きふ)四邊(あたり)(ひら)けた。(ひだり)には相模(さがみ)(うみ)眞近(まぢか)(たゞよ)ふて()る、(みぎ)には箱根(はこね)連山(れんざん)畑田(はたけ)(へだ)てゝ(そび)えて()る。(さむ)(はず)だ、孖山(ふたごやま)(いたゞき)には(ゆき)化粧(けはひ)して、それより(たか)山々(やまやま)凍雲(とううん)(つゝ)まれて()る。

(「唯一人」柴田流星 著 明治42年 左久良書房 243ページ)

春月や歩めば長き酒匂橋  ルイ笑

(「春月(募集俳句其一)※」から 「ホトトギス」第12巻第7号 明治42年 ホトトギス社 所収 74ページ上段後ろから4行目。なお、「袖珍新俳句※」(有田風蕩之 (利雄) 編 明治44年 博文館)に同じ句が掲載されている(52ページ後ろから8行目)。)

酒匂橋(さかはばし)(ちか)くなりて、相模(さがみ)の山々に(ゆき)(しろ)(つも)りたるを

酒匂橋(さかはばし)わたるたもとにかゝりけり

さがみの山のゆきのしらゆふ

(「()めぐみの(あめ)※」弘田由己子著 「わか竹」第8巻第4号 1915年4月 大日本歌道奨励会  所収 50ページ)

國府津(こふづ)から小田原(おだはら)への一里半(りはん)は、三四の部落(ぶらく)半農半漁(はんのうはんぎょ))と松並木(まつなみき)とが交錯(かうさく)して、(また)(かは)つた(おもむき)()せてゐる。酒匂橋(さかはばし)(うへ)眺望(てうばう)は、すでに定評(ていひやう)があるから()かぬ、月明(げつめい)(まつ)葉越(はご)しに富士(ふじ)(なが)めて、(ほし)漁火(ぎよくわ)との文目(あやめ)もないなどは、興趣油然(きやうしゆいうぜん)たるを(きん)ずることができぬ。(しか)しカメラマンとしては橋上(けうじやう)眺望(てうばう)よりも、()(はし)主人公(しゆじんこう)としての(こうづ) (ママ・「図」欠か)手腕(しゆわん)(ふる)ふべきであらう。それは左岸(さがん)(すなは)酒匂(さかは)(はう)からするが()い、海岸(ルビ判読不能)に三(きやく)()てゝ(やま)背景(バツク)とし、(ある)ひは土手(どて)から(うみ)背景(バツク)として白帆(しらほ)添景(てんけい)する、(いづ)れにしても對岸(むかふぎし)(はし)(すそ)(おほ)きな(まつ)東海道(とうかいだう)並木(なみき))があつて、構圖(こうづ)引立(ひきた)てゝくれる。

(「東京近郊寫眞の一日」松川二郎 著 大正11年 アルス 94〜95ページ、強調及び傍注はブログ主)



松濤園跡地。現在は社会福祉法人施設になっている。
ストリートビュー
また「酒勾の一日※」(菜花野人著 「むさしの」第2巻第9号 1903年 古今文学会 所収 11〜14ページ)や「新婚旅行日記※」(靄霞女史著 「性」第2巻第5号 1921年 天下堂書房 所収 480〜483ページ)では、酒匂橋近くにあった「松濤園」に数日間滞在しながら酒匂周辺や小田原・箱根へ足を伸ばした旅行の様子が描かれています。松濤園は現在は営業は行っていませんが、当時は貸別荘として営業していました。

これらの文芸作品での表現から、この頃には酒匂橋近辺が観光の拠点として機能していた様子が見て取れます。また、「花(二)※」(眞下喜多郎著 「ホトトギス」第27巻第8号 大正13年 ホトトギス社 所収 26〜30ページ)では、松濤園に滞在しながら周辺を散策する中で、ちょうどコンクリート橋に架替工事中だった酒匂橋の様子が伝えられています。

Odawara Gyosho Tokaido.jpg
「行書版東海道」中の「小田原」
歌川広重 - ボストン美術館,
パブリック・ドメイン, Wikimedia Commonsによる)
東海道五十三次 小田原 酒匂川-Odawara MET DP122890.jpg
「隷書版東海道」中の「小田原」
歌川広重 - ウィキメディア・コモンズはこのファイルをメトロポリタン美術館プロジェクトの一環として受贈しました。「画像ならびにデータ情報源に関するオープンアクセス方針」Image and Data Resources Open Access Policyをご参照ください。,
CC0, Wikimedia Commonsによる)

酒匂の周辺が眺望スポットであることを記した江戸時代の紀行文などは、私が知る限りでは見ていません。大磯宿から小田原宿にかけては間が4里と他の区間に比べて距離が長い上に、渡し場で時間を取られる、小田原を箱根越えに備えて宿泊地とするケースが多いことから日没近くにこの区間を通行することが多いなどの要因が重なって、風景を愛でるほどの時間の余裕が乏しいことが理由として考えられそうです。

しかしながら、歌川広重が最初に保永堂版「東海道五十三次」で小田原を描く際には、酒匂川の渡しを俯瞰しながら遠方の箱根方面の山々を描く構図を採用しています。以後広重が東海道を繰り返し描く中で、「行書版」「隷書版」「双筆五十三次 (広重と三代豊国との合作)」「人物東海道」「東海道風景図会」の計6作品で、酒匂川の渡しと箱根の山々を描く構図を採用しています。広重が何故小田原の風景としてこれほどまでに酒匂川の渡し場に拘ったのか、その理由については詳らかにされてはいません。しかし、時代が下って酒匂橋付近からの眺望が愛でられる様になったことと併せて考えると、あるいは広重もこの眺望に惹かれて酒匂川の渡し場の風景を描き続けたのかも知れません。



「酒匂橋」や「酒勾橋」でヒットした資料の中には、「馬入橋」で見られた「官報」が含まれていないことが1つの特徴です。このことは、酒匂橋の損傷や落橋の報告が、馬入橋の様には中央政府に上がっていないことを意味しています。これまで私が調べた範囲でも、酒匂橋は馬入橋ほどの損傷を受けた記録があまり出て来ない傾向がありました。「デジタルコレクション」のヒット結果も、ある程度この傾向を裏付けていると見ることが出来ます。

その主要な要因と考えられるのが、明治20年頃からの箱根登山鉄道の前身に当たる「小田原馬車鉄道」の敷設、更に「小田原電気鉄道」への更新です。委細はこちらの記事で検討しました。継続的な収入を見込める鉄道事業が架橋や修繕の費用を応分に負担していたことが、酒匂橋の維持に少なからず貢献していたのではないかということです。

「日本写真帖」(田山宗尭 編・明治45年)より「酒勾橋」
「日本写真帖」(田山宗尭 編 明治45年刊)より
「酒勾橋」
撮影年は不明だが
小田原電気鉄道開業後の明治33〜44年に絞ることは出来る
写真帖では「勾」表記だが親柱は「匂」である様に見える
(「デジタルコレクション」より該当箇所切り抜き)
その見立てを補強してくれそうな資料が、「デジタルコレクション」上でヒットした中に1点確認できました。「工学会誌」第230巻(明治34年5月 工学会刊行)所収の「論說及報吿 小田原電氣鐵道工事槪要※」(武永 常太郞著)です(261〜297ページ)。それまでの馬車鉄道を電気鉄道に更新する際の工事の内容が仔細に記録されており、その中には酒匂橋を含む全ての橋梁の工事も含まれています。

ここではまず「◯橋梁ノ支持力計算※」(290〜291ページ)の項で10トンと想定されている電車の重量に耐えられる橋桁の太さが見積もられています。続く「◯橋梁の材料」(291ページ)では橋に使用する木として「槻、杉、栗、松」が使われた箇所が具体的に記述され、更に橋台に使用された石材の寸法などが仔細に記されています。そして、「◯橋梁ノ數及小橋架設法一斑※」及び「◯各橋の幅員」(292〜293ページ)で、酒匂川の川幅が「百九拾六間」(約356m)であること、酒匂橋は「長千百七拾六尺杭木三本建四十八枠高水中沼入共貳拾尺橋台鏡通上口拾貳尺高拾八尺敷拾六尺妻手上口四尺高拾八尺敷六尺砂利止石垣妻手共長拾九尺高一尺七寸」と大きさが仔細に記されています。

更に「◯其架設費」(293〜294ページ)で酒匂橋の架橋に「金七千貳百九拾四圓六拾一錢五厘」を要したことが記されていますが、全21橋の架橋に「金三萬貳千八百六拾五圓五拾三錢四厘」を要していますから、酒匂橋がその22%を占めていること、更に「◯增資確定、社名改稱、並ニ工事進行※」(264〜265ページ)で増資額が「四拾壹萬五千圓」とされていることから、橋梁工事全体で増資分の8%ほどを費やしていることになります。

当時はまだ自動車が走っていたのは東京や横浜のごく限られた地域のみでしたから、電車が橋梁に掛ける荷重は当時橋を渡っていく人馬などに比べて桁違いの重さを掛ける唯一の存在であったことになります。更に橋上に鉄路を敷設したり架線柱を設置する必要があるので、その分も橋に掛ける荷重に加わることになります。こうした状況への対処のために、小田原電気鉄道がその敷設に当たって酒匂橋をはじめとする各橋の架設にかなり重点的に労力を割いた実情が、この資料でかなり明らかになると思います。

もっとも、その後も度重なる水害で酒匂橋も損傷を受け、都度修繕に追われていたことはこのブログでも取り上げました。その様子の一端を伝える文章も、「デジタルコレクション」の全文検索で新たに見つかりました。

酒匂橋(さかはばし)の富士、足柄野、箱根(はこね)の山と、眺望は種々(いろいろ)に動く、橋は今夏の洪水(こうずゐ)で危く流失せんとしたのを丸太(まるた)や板で膏藥(つくろ)ひをしたままである。向岸は(なが)れたので架け()へたものの是れも()りに一時と云つた(ふう)である流は淸く石は(しろ)し。

(「東海道名所探訪記※」眞山靑果著 「学生文藝」第二巻第五号 1911年 聚精堂 所収 36ページ、くの字点は適宜展開)


こうしたこともあり、架橋の費用については次第に神奈川県が負担する方向に傾いていきます。こうした動向について記した資料も新たに1点見つけることが出来ました。

彼の酒匂橋も昨年十一月、通常縣會で改修が議决になりましたに付まして、土地の靑年が戌申詔書の御趣意に基き、本縣知事の告諭の下に成立しました、勤儉事業の手始めに河床確定の爲め、土砂を利用して護岸設備に着手するとのことで一千内外の靑年が新年匆々の大活動と申す譯でござりますから幾分の興味もあらうと存じまするし。

(「新譯觀音經㈡※」勿用杜多著 「六大新報」第334号(明治43年2月6日)六大新報社 所収 11ページ)


なお、大正12年(1923年)には関東大震災が起こり、同年7月にコンクリート橋に切り替えられたばかりの酒匂橋も全損してしまいます。「デジタルコレクション」でも、この時期以降には震災報告書の類が急増しています。その中から、次の旅行案内記は震災後も景色の魅力を喪っていないことを記している点を汲んで1点のみ引用します。著者は上記「東京近郊寫眞の一日」と同じ人物です。

酒匂橋(さかはばし)はコンクリート(つく)りの白色(はくしよく)立派(りつぱ)(はし)であつたが、震災(しんさい)(ため)木葉(こつぱ)みぢん破壊(はくわい)せられて、(いま)工兵隊(こうへいたい)()けた木橋(もくけう)()()わせてゐる、(しか)()橋上(けうじやう)風光(ふうくわう)(なほ)()てがたく、月明(つきあかり)(まつ)()()しに富士(ふじ)(なが)めて、海上(かいじやう)(ほし)漁火(ぎよくわ)との文目(あやめ)もないなどは、興趣油然(きやうしうゆぜん)たるを(きん)ずることができない。旅館(りよくわん)松濤園(せうたうゑん)別荘(べつそう)(ふう)()(かた)松風(まつかぜ)(なみ)のひゞきとが(まくら)(かよ)ふのがうれしい。

(「土曜から日曜 改版」松川二郎 著 大正14年 有精堂書店 27ページ、傍点は下線で代用)




ところで、上記で「酒匂橋」と「酒勾橋」のヒット件数を示しました。これだけを見ると、「デジタルコレクション」中ではそれぞれの漢字表記で個別に検索を行っているかの様に見えます。しかし、検索結果を追っていくと、実際は必ずしもその様にはなっていないことがわかります。
「酒匂橋」で検索
「箱根大観」がヒット
「酒匂橋」でヒットした中に「箱根大観」が含まれているが…
ヒットしたのは「酒勾橋」
該当箇所の表記は「酒勾橋」になっている。

その1つの例が「箱根大観」(佐藤善次郎、森丑太郎著 明治42年 林初三郎刊)の中に見られます。ここでは「酒匂橋」で検索を行っており、「箱根大観」の検索結果にはOCRテキストの一部も表示されていることから、確かに「酒匂橋」でヒットしたことがわかります。しかし、該当箇所(6ページ)を見てみると「酒勾橋」の表記が「酒匂橋」と置き換えられたものであることがわかります。

OCRテキスト中で「酒匂橋」「酒勾橋」の表記をそれぞれ堅持すべきなのか、それとも「酒匂橋」に統一すべきなのかは、使い勝手という点では一長一短あることですので、一概に決められることでは必ずしもありません。しかし、蔵書全体をOCRで処理する前にどちらを選択するかをポリシーとして決めておき、そのポリシーに一貫して準拠して処理を進めるべきではあります。他の検索結果を見ると基本的には「酒匂橋」「酒勾橋」それぞれの表記個別に検索が行われている様に見えるものの、一部にそれと異なるポリシーで処理されたものが混ざっている様です。

何故この様な状況が起きているのかはわかりませんが、別の事例では明らかに誤植と思しき箇所を何らかの方法でOCR結果を修正したと思しき箇所も見つかっていることから、あるいはOCR結果をレビューして修正する過程でこの様な事例が紛れ込む結果になったのかも知れません。今のところ要訂正箇所の報告を受け付ける専用の窓口は引き続き設けられていませんが、こうした事例については折を見てOCRの精度向上に努めて欲しいところです。

もっとも、中には資料自体に明らかに誤植があるものを「正しく」直したと思われる例も見つかっており(「大筥根山」井土経重著 明治42年 丸山舎書籍部、「匃」の様な字が使われている)、この様な例も含めてどの様なポリシーを設定すべきなのかは、なかなか悩ましいものがあります。

次回更にもう1回、別の検索事例を紹介したいと考えています。
  • にほんブログ村 歴史ブログ 地方・郷土史へ
  • にほんブログ村 地域生活(街) 関東ブログ 神奈川県情報へ
  • にほんブログ村 アウトドアブログ 自然観察へ

↑「にほんブログ村」ランキングに参加中です。
ご関心のあるジャンルのリンクをどれか1つクリックしていただければ幸いです(1日1クリック分が反映します)。

地誌のはざまに - にほんブログ村

「国立国会図書館デジタルコレクション」のリニューアルを受けて(その1)

前回の記事で紹介した通り、「国立国会図書館デジタルコレクション」が12月21日にリニューアルされました。

具体的なリリース箇所は、プレスリリースのPDFにある通り、
  1. 全文検索可能なデジタル化資料の増加
  2. 閲覧画面の改善
  3. 画像検索機能の追加
  4. シングルサインオンの実現
ですが、この中で最も大きいのは「全文検索可能なデジタル化資料の増加」でしょう。前回の記事で追記した通り、古典籍資料の崩し字のOCR結果は対象外となっているものの、それでも「5 万点から約 247 万点」と大幅に対象となる資料の点数が増えました。

そこで、今回はこれまで私がこのブログで取り上げた項目について、今回のリニューアルで新たな資料を見出すことが出来る様になったかどうかを試してみることにしました。


1つ目は、旧東海道が相模川を渡河する地点に明治時代に入って以降に架橋されては流失を繰り返した「馬入橋」です。その過程についてはまだ充分に史料を集め切れていない状態ですので、今回の全文検索拡充で何か新たな発見がないかに期待して、検索を試みました。

単純に「馬入橋」とだけ検索キーを指定すると630件もの資料がヒットします。これでは全てを確認するのが困難ですので、明治元年から明治45年の間に刊行された資料に絞り込むと、40件の資料がヒットしました。何れもタイトルをはじめ従来の項目を検索したのではヒットし得ない資料です。

これらを1つ1つ見ていく中で、これまで私が気付いていなかったものがかなりの点数見つかりました。但し、「国立国会図書館内限定」資料は閲覧出来ていませんので、今回は「ログインなしで閲覧可能」な資料と「送信サービスで閲覧可能」な資料のみを確認しています。

まず、「神奈川県県治一斑」と題された一連の資料が4件ヒットしています。それぞれ明治19年(1886年)明治20年明治22、3年明治27年のものです。これらの資料は神奈川県内の統計をまとめた資料で、「馬入橋」が登場するページは神奈川県内の主要な橋の名称、所在地、橋の主な材質(鉄か木か)、長さ、幅の各項目が一覧にまとめられており、馬入橋は4件とも「大住郡(須馬村馬入)/木/120間/3間」と記されている点が共通しています。

ここで問題となるのは、該当する馬入橋の架設時期と落橋した時期です。以前の私の記事でも触れた通り、馬入橋は明治16年(1883年)には木造トラス橋として架設されたものの、「明治工業史 土木篇」(工学会・啓明会編  1929年)によれば「架設後八九年にして流失」してしまったとされています。ここから判断すると、馬入橋は明治24~25年には落橋してしまっていたことになります。しかし、上記一覧では明治27年にも現存しているかの様に記されています。つまり、明治27年の「神奈川県県治一斑」と「明治工業史 土木篇」には齟齬があることになります。

この齟齬はどの様に解するべきなのでしょうか。そこを考える上では、ヒットした資料のうち一連の「官報」を見るのが良さそうです。なお、ここでは「馬入橋」の他に「馬入川」で同様に明治期の資料を検索した結果も含めています(以下「…」は中略、強調はブログ主)。

明治18年(1885年)7月7日(官報第604号):

◯水害續報…神奈川縣ノ水害續報ニ據レハ管下相摸川及酒勾川ハ去月廿九日己來强雨ノタメ出水甚シク爲ニ人家數戸流亡溺死者貳人アリ又馬入橋ハ本月二日落失セリ(神奈川縣報告)

明治18年(1885年)7月9日(官報第606号):

◯水害續報…神奈川縣 官報第六百四號ニ掲載セル神奈川縣水害續報中馬入橋落失トアルハ誤󠄁報ニシテ該橋ハ橋臺ノ損傷ニ止マリ一時通行ヲ差止メタルモ其ノ後修繕ヲ加ヘ既ニ開通セリ(神奈川縣報告)

明治25年(1892年)7月28日(官報第2725号):

◯暴風雨水害…神奈川縣ニ於テハ去ル二十一日午後七時ヨリ翌二十三日夜ニ至ルマテ强雨ノタメ…高座郡ニテハ相模川ノ增水殆ト一丈三尺ニ至リ渡船ハ總テ停止シ且ツ東海道筋馬入川架橋墜落ス…(神奈川縣)

明治27年(1894年)8月14日(官報3338号):

◯風雨水害等…神奈川縣…馬入川滿水東海道筋馬入橋六十間餘流失次第ニ減水人畜死傷ナシ本月十一日午後十時十四分神奈川縣發

明治29年(1896年)9月10日(官報3962号):

◯雨水被害…神奈川縣…相模川厚木町ニテ一丈五尺、全町床下マテ浸水馬入橋八十間流失…一昨八日午後九時神奈川縣發


まず、3番めの明治25年の記事には馬入橋が落橋したことが記されています。これは「明治工業史 土木篇」の「架設後八九年にして流失」という表現から考えられる落橋時期と一致するので、木造トラス橋が失われた年月日を特定する記事と考えて良さそうです。しかし、そのわずか2年後と4年後に橋の一部が流失したとの報告が官報に掲載されています。その間に馬入橋は再建されたことになります。

この状況の理解を助けてくれる記事が載った資料が、全文検索でヒットした別の資料の中にありました。明治24年の「一馬曳二輪車試験行軍実施報告写」という資料で、これは当時の軍部が作戦遂行上重要と考えた東海道や大山道といった道路について、馬や車の通行が充分確保できるかどうかを実地で検証したレポートです。

第十日三月二十六日/晴 本日小田原出發藤澤ニ向テ行進ス本日ヨリハ東海道ナルヲ以テ道路平坦土質砂礫ノ硬固ナルモノニシテ車輌ノ運轉容易ナリ…行程中酒匂川馬入川アリト雖トモ堅固ナル橋梁ヲ架設シ唯馬入川橋梁流失セル部分二百五十米突ハ假橋ニシテ幅二米突ナルモ欄杆ヲ付シ車輛ノ通過ニ妨ケナシ

(合略仮名などは適宜カナに分解)


「神奈川県県治一斑」では馬入橋は全長120間(約218m)とされていましたが、この資料の「250m」はそれを超える長さとなっています。このことから、落橋したと考えられる明治25年の1年前の時点で、馬入橋は既に「仮橋」の状態に変わってしまっていたと考えられます。完成当初は3mの幅があったのに対し、仮橋に置き換わってしまった区間は2mに減じていたものの、車両の通行はどうにか可能な状態を維持していたとされていますが、既に木造トラス橋の姿は失われていたことになるでしょう。

更に、官報には明治18年にも馬入橋は橋台の損傷を受けたという報告が上がってきています。明治16年に木造トラス橋が竣工してからわずか2年しか経過していないことになるのですが、これほど近い時期にこの様な報告があったとなると、実際は報告が上がらない程度の小破は明治25年の落橋前までの間しばしばあったのかも知れません。

全文検索でヒットした資料の中には、明治26年に刊行された「凶荒誌」(梅森三郎 編 有隣堂)という書物もありました。日本の歴代の災害を時系列にまとめたものですが、その明治17年の項に

七月一日…神奈川縣多摩川、相摸川、酒勾川、洪水潰家百余戸溺死十一人負傷三十八人馬入橋落墜ス

と記されています。官報は明治16年7月2日から刊行が開始され、同年中には既に風水害によって架橋に損傷があった場合に掲載された事例があったことを考えると、「凶荒誌」の記す明治17年の官報には馬入橋の損傷や落橋に関する報告がヒットしていない点は齟齬である可能性があり、「落墜」という表現が正確かどうかは検証が必要です。しかし、これも多少なりとも馬入橋が損傷を受けた事例ということになるのかも知れません。そうなりますと、明治16年に竣工した木造トラス橋は早くも翌年から損傷を受けていたことになります。


この様に、損傷しては仮橋で通行を確保し続けていた経緯を踏まえて考えれば、馬入橋は明治25年以降も仮橋の状態で通行を何とか確保していたということになるのでしょう。そして、その仮橋も2年毎に大規模な損傷を受けては架設し直すという、極めて脆弱で負担の大きい運用を続けていた様子が浮かび上がってきます。

しかし、飽くまでも「仮橋」であることから、何れは本設の橋を「復旧」させたい意向はあったのかも知れません。それが明治27年の「神奈川県県治一斑」でも従前のデータが維持され続けた理由なのでしょう。その後の馬入橋の本設の経緯についてはまだ充分な資料がないために明確ではない部分が多いのが現状ですが、これほどの頻度で馬入橋の修繕が必要な運用を長期間にわたって続けるのは、その労力や経費負担の面でも過重な状況であったことは想像に難くありません。

因みに、全文検索でヒットした資料には、上記の様な馬入橋の損傷に関するものの他に、馬入橋を経由したことを示すために名前が挙げられているものが数多く含まれていますが、それらの中に少し毛色の違うものがありました。

八月五日…午后一時出發と定む。三人道を大佛坂の切通しにとり、藤澤驛を經て、四時茅が峠(ママ:茅ヶ崎か)に夕食をなし、夕暮馬入橋に到る。時に月出て、天水の如し。今宵(こよい)はこゝに觀月の宴を開かんと、橋の中央に座をかまへ、雑談に時を移すに、吹く河風の涼しさ、骨まで()え渡る心地す。

(「運動界」第1号第5巻 明治30年(1897年)11月 運動界発行所、ルビも同書に従う、傍注はブログ主)


橋の中央に居座って月見がてらに夕涼みに興じるとは、仮橋で2間まで幅を減じていた馬入橋の上ではかなり邪魔になりそうな状況ですが、見方を変えればそのくらいに日没後の通行量は少なかったのでしょう。当時のスポーツ雑誌に記載された富士登山の行程を記した紀行文ですが、この様な思いがけない資料が出てくるのも全文検索ならではと言えるでしょう。

何れにしても、「馬入橋」の検索結果はこれまでにない多くの発見をもたらしてくれました。無論、郷土史の資料は国立国会図書館だけでは充分に網羅されておらず、地方のみに存在するものも数多くありますので、これで全てを発見できた訳ではないことは言うまでもありません。また、OCR精度による制約も引き続き存在しているものと考えられますが、それでもこれだけの大きな成果が得られるという点で、今回の全文検索のリリースは大きな進歩と言えそうです。

今回はひとまず「馬入橋」を検索した結果の分析のみに留め、次回他の検索結果をもとにもう1回レポートをまとめる予定です。

  • にほんブログ村 歴史ブログ 地方・郷土史へ
  • にほんブログ村 地域生活(街) 関東ブログ 神奈川県情報へ
  • にほんブログ村 アウトドアブログ 自然観察へ

↑「にほんブログ村」ランキングに参加中です。
ご関心のあるジャンルのリンクをどれか1つクリックしていただければ幸いです(1日1クリック分が反映します)。

地誌のはざまに - にほんブログ村

末尾追記あり→【動画紹介】古典籍の全文検索はできるのか(前篇・後篇)

前回の記事の続きですが、国立国会図書館の「次世代デジタルライブラリー」のOCRの精度を詳細に検証された方がいらっしゃいましたので、今回はその動画を紹介したいと思います。

【検証】古典籍の全文検索はできるのか(前篇)【くずし字OCR/#次世代デジタルライブラリー/#NDL全文使ってみた】(YouTube上で視聴


【検証】古典籍の全文検索はできるのか(後篇)【くずし字OCR/#次世代デジタルライブラリー/#NDL全文使ってみた】(YouTube上で視聴

この記事上でも直接動画を再生できる状態にしましたが、YouTube上ではタイムスタンプをクリックすることで特定のチャプターからの再生が可能になっています。

私の前回のレポートとは比較にならないくらいに緻密な検証作業の成果です。委細は動画を見ていただくべきと思いますので、ここではこの動画を受けて私なりに考えたことを簡単に記してみようと思います。

燈露(ひつゆ)さんは国文関係の資料から字形や紙面の異なるものを考慮して前篇後篇合わせて20点を選択し、その可読率を算出するという作業をなさっています。現在のOCRはAIを用いて字形などを「学習」することによって可読率を上げる様な仕組みになっていますので、学習の素材が多くなるほど精度が向上すると考えられています。このことから、学習の対象となる資料の分野に偏りがあると、資料の多い分野ほど可読率が上昇しやすい傾向が出るのではないか、と考えたくなります。

しかし、20点の資料の可読率が99%から0%まで極端に分散している結果を見ると、資料の分野以外に可読率の低下に繋がる要因が色々と存在している様に見受けられます。特に、人間の目には明らかに文字行が存在することがわかる資料であるにも拘らず、可読率が0%、つまり全く読めていない資料が存在する点は、資料がどの様なものであっても何らかの文字が存在している箇所をOCRが認識する処理に、まだ課題が多く残っていることになると考えられます。

次に、行自体は認識できていても、その行の並び順が本来とは異なるものになってしまう例もいくつかあった様です。これは私が見た例でも同様の傾向が見られました。行順を認識するアルゴリズム自体に課題があるということなのでしょうが、ルビや返り点の様な存在は行の配置を読み取る際に意外に撹乱要因になりやすい様で、活字のOCRでも行の存在や並び順がおかしくなる例は見ています。その点で、この問題は崩し字OCRに限らず、日本語OCR全般にまだ残っている課題なのかも知れません。

こうした検証のフィードバックは次世代デジタルライブラリーでも必要と思うのですが、前回も触れた通り開発途上という理由で現時点では専用の受付窓口は設けられていません。開発の具体的なプロセスは不明ですが、AIの学習を繰り返しながらOCRをやり直す様な作業を行っている様ですので、それであれば現時点で公開されているOCRの結果も都度変わる可能性が考えられます。そうなると、その都度外部からの報告を受け取って反映させたところで、次に最新の学習成果をもとにOCRをやり直した時に必ずしも正しく読まれるとは限らない以上、また元に戻ったり違う形で誤認識されてしまう可能性も残っています。それでは折角受け取ったフィードバックを活かすことに繋がりません。

ただその一方で、可読率が極端に散らばっている現状を見ると、果たしてこうした実情を充分にフィードバックして次の学習に繋げられているのだろうか、という疑問も残ります。受け取ったフィードバックをどの様に活かせば良いかは開発体制とも照らして検討する必要はあると思いますが、まだ開発途上であることを報告する側にも充分理解してもらった上でフィードバックを受け付ける仕組みを作った方が良さそうです。

「次世代デジタルライブラリー」の話題については今後も何か動きがあれば取り上げてみたいと考えています。



と、ここまでを書いて推敲に寝かせておいた最中、次の様なリリースが発表されました。私がこれを知ったのはこの発表の数日後でした。

このプレスリリースには、

(1)全文検索可能なデジタル化資料の増加

令和 2 年 12 月までにデジタルコレクションに登録された図書・雑誌などのデジタル化資料がテキスト化され、全文検索可能な資料が現行の 5 万点から約 247 万点に増加します。全文検索でヒットした箇所は検索結果一覧に表示され、該当のコマに直接移動できます。

プレスリリースPDFより)

とあり、その件数の大幅な増加から、現在「次世代デジタルライブラリー」で検証されているOCRテキストが「国立国会図書館デジタルコレクション」に移行されることが仄めかされています。

私が前回の記事を書く前にメールで問い合わせた際には、リリースが近いことは触れられていませんでした。まだ十分な完成度に到達はしていないと感じていましたので、近日移行されることになるとは私も思っていませんでした。あるいは識字率の低い古典籍資料の部分を切り離してリリースすることになるのかも知れませんが、その辺りをどの様に公開することになるのかはまだ具体的な情報がありません。

「次世代デジタルライブラリー」のOCR精度の問題点については上記の燈露(ひつゆ)さんの動画や私の前回の記事で指摘した通りですが、このまま、もしくは先日確認した水準からそれほど向上していないOCR識字率のままリリースするのであれば、OCR精度にまだ充分ではない部分があることを周知した上で、誤認識されている文字についてはフィードバックを受け付ける仕組みが必要と思います。より多くの利用者の目、特に崩し字を読める人の目に触れさせて間違っている箇所の指摘を集めた方が、改善が早い面もあるかも知れませんので、早期リリースが必ずしも駄目な訳ではありませんが、いくら情報を受け付けてもそれを捌けるだけの体制が作れなければ無駄になってしまいます。折角の機能ですので、逆効果にならない様に判断をお願いしたいところです。



追記:
  • (2022/12/07):「次世代デジタルライブラリー」の担当者様から直接に連絡を戴きました。今回21日のリリースに際しては活字資料の分のみで、古典籍資料のOCR結果については含まれないとのことです。古典籍資料の分のリリース日については現時点では未定とのことでした。
    開発体制が大きくないためフィードバックにタイムリーに対応する余力はあまりない様ですが、誤認識箇所など気付いた点については一報差し上げる方が良さそうです。
  • にほんブログ村 歴史ブログ 地方・郷土史へ
  • にほんブログ村 地域生活(街) 関東ブログ 神奈川県情報へ
  • にほんブログ村 アウトドアブログ 自然観察へ

↑「にほんブログ村」ランキングに参加中です。
ご関心のあるジャンルのリンクをどれか1つクリックしていただければ幸いです(1日1クリック分が反映します)。

地誌のはざまに - にほんブログ村

NEXT≫