| Печать |

002disaster01.07.2025 г.
ИИ-модель ВШЭ автоматизирует сбор данных о природных катастрофах

Новую технологию создания базы данных об опасных природных явлениях разработали на факультете географии и геоинформационных технологий Высшей школы экономики (ВШЭ). В ядре алгоритма – генеративная языковая модель, которая извлекает из новостных сообщений и структурирует информацию о том, что, где и когда произошло, какой ущерб был нанесен и какие меры реагирования принимались. Об этом сообщила пресс-служба факультета. 

Созданный географами ВШЭ алгоритм обрабатывает более тысячи текстов в час. В пилотном применении удалось автоматически извлечь и обработать более 50 000 новостных сообщений в 8 млн исходных текстов с новостных порталов, региональных сайтов МЧС и из пабликов органов власти в социальных сетях. Материалы освещали последствия или предупреждали о почти 30 000 событий, связанных с опасными и неблагоприятными природными явлениями. Сегодня база содержит несколько десятков тысяч публикаций.

При этом крупные природные катастрофы ожидаемо получают в медиаресурсах больше внимания, рассказала соавтор разработки, научный сотрудник риск-офиса Центра геоданных факультета географии и геоинформационных технологий ВШЭ Анна Деркачева.

Например, более 400 публикаций, которые прошли через алгоритм, были посвящены катастрофическому наводнению в Курганской, Оренбургской и Томской областях весной 2024 г. «Но нам был важен именно массовый охват медиа-источников, чтобы собрать сведения и о локальных проблемах», – отметила она, подчеркнув, что попадание в статистику МЧС подразумевает преодоление некоторой планки ущерба. «Если дорогу каждый год засыпает лавинами, но нет, условно, раздавленных машин, эта проблема может не фигурировать в статистике и отчетах, лавинную защиту не финансируют и не прописывают в KPI», – пояснила Деркачева. Сейчас регионы России обновляют свои планы по адаптации к изменению климата, и это удачный момент для сбора фактических данных о собственной территории, чтобы грамотно расставить приоритеты, считает географ.

Результат работы генеративной языковой модели по формированию базы данных об опасных природных явлениях подвергается дополнительной автоматизированной проверке. После нее территории наносятся на карту, а серия текстов об одном и том же происшествии группируется.

Географы отмечают, что новостные публикации уже десятилетиями используются для сбора информации о чрезвычайных ситуациях. Например, так ведется международная база катастроф EM-DAT.

«Однако ручной поиск и обработка новостей делают формирование таких баз данных трудоемким и времязатратным процессом, поэтому они часто охватывают лишь крупные события или ограничиваются небольшими территориями, – добавила Деркачева. – В нашу базу данных попадают разномасштабные опасные природные явления».

Географы ВШЭ создали новую технологию при выполнении проекта «Лучшие практики адаптации к природно-климатическим рискам в России», который получил флагманский грант ВШЭ «ИИ-технологии для человека» в 2024 г. В 2025 г. разработка географов стала финалистом международного конкурса «AI for Good: Innovate for impact» и в июле будет представлена на международном Саммите ООН в Женеве.

https://www.vedomosti.ru/esg/science_and_technology/news/2025/07/01/1121327-ii-model-vshe-avtomatiziruet-sbor-dannih-o-prirodnih-katastrofah

 

Медицинский справочник