
Research on collection, preservation, arrangement and transmission of disaster and disaster prevention information in the event of a disaster: Research and development for automatic creation of disaster information timeline by disaster prevention Web crawler.

posted on 2021-01-18, 09:26 authored by Shinya MIURA, Sachiko MAEDA, Chiharu IKEDA, Hiroaki SANO, Masachi IKEDA
The content of disaster and disaster prevention information at the time of a disaster changes and is updated from time to time. Therefore, some information cannot be obtained if the timing is missed. The National Research Institute for Earth Science and Disaster Resilience (NIED) started to develop a system to collect, store, organize and disseminate information of disaster prevention and disaster prevention information by visiting each website every four hours. The timing of the collection and storage of disaster information does not necessarily coincide with the timing of the collection and storage of Globally, although the Internet Archive collects website information comprehensively, it is also unable to keep up with the frequently updated disaster and disaster prevention information, and is only partially able to archive disaster and disaster prevention information.
The collection, storage, organization and dissemination of disaster and disaster prevention information at the time of a disaster is intended to create an integrated cross-sectional timeline of disaster and disaster prevention information in the future. This cross-sectional and integrated disaster information timeline also aims to provide an integrated view of all the disaster prevention and disaster-related information that tends to be scattered and lost. The timeline is designed to automate the system as much as possible so that integrated information can be transmitted in near real time.
The first step in the development of the system is to automate the collection of disaster and disaster prevention information. In the future, we plan to increase the number of sites visited (currently 139 organizations and 217 sites) to ensure that no information is missed, to improve the accuracy of the information, to research and develop a system that automatically reflects the collected information in the timeline, and to propose the dissemination of disaster and disaster prevention information on each web site.


災害発生時の災害・防災情報は、時々刻々と発信される情報の内容が変化し更新されていく。そのため、一部にはタイミングを逃すと取得できない情報が出てくる。防災科研では防災・災害情報を発信している各Webサイトを4時間ごとに巡回し、情報を収集・保存・整理・発信するシステムの開発をはじめた。Webサイト情報のアーカイブは、日本国内では国立国会図書館のWARPがあるが、収集間隔が発災時に頻繁に更新される災害・防災情報の収集・保存のタイミングと一致しているわけではない。また、グローバルにみても、Internet ArchiveがWebサイト情報を網羅的に収集しているが、ここも頻繁に更新される災害・防災情報の収集・保存のタイミングに対応できておらず、部分的にしか災害・防災情報をアーカイブできていない状況である。 災害発生時の災害・防災情報の収集・保存・整理・発信は、将来的に防災・災害情報を組織横断で統合したタイムラインとして生成することを目的としている。この横断・統合的災害情報タイムラインは、散逸しがちな防災・災害情報を一元的に俯瞰できることも目的としている。タイムラインの実現にあたっては可能な限りシステムを自動化し、リアルタイムに近い時間で統合した情報を発信できるようにしたいと考えている。 現在、まずは災害・防災情報を自動収集することを目的としたシステムを開発中である。今後、巡回先(現在、139機関、217サイト巡回)を増やし、情報の収集漏れをなくすとともに、情報の精度を高め、さらに収集した情報をタイムラインへ自動反映するための研究開発と各Webサイトの災害・防災情報の発信についての提案を行う予定である。

[A41] 災害発生時の災害・防災情報の収集・保存・整理・発信についての研究:防災Webクローラーによる災害情報タイムラインの自動作成に向けて

三浦 伸也, 前田 佐知子, 池田 千春, 佐野 浩彬, 池田 真幸