«Яндекс» представил нейросеть для расшифровки архивных документов
Рукописные дореволюционные документы расшифровывает нейросеть. Отмечается, что специалисты обучали ее на массиве данных из сотен тысяч рукописных строк реальных текстов XVIII-XIX вв. из Главархива Москвы, а также десятков миллионов сгенерированных примеров. Перед этим они сами разметили и расшифровали исторические материалы .
С помощью технологии пользователи могут найти в базе сервиса нужный документ с упоминанием фамилии, населенного пункта и др. Поиск текстов доступен по каталогу или через строку поиска, также есть фильтры по годам, архивам, фондам и описям. Расшифрованный нейросетью документ отображается справа от оригинала, при наведении курсора на нужный фрагмент, он сразу подсветится на цифровой копии текста, пояснили в пресс-службе.
Помимо документов Главархива Москвы, в базе также можно найти тексты из архивов Оренбургской и Новгородской областей. Разработчики обещают, что в будущем в сервисе станет еще больше доступных документов.
В ноябре 2022 г. «Яндекс» также обучил нейросеть находить места по сложным запросам в «Яндекс.Картах». При обработке запроса она анализирует не только описание и ключевые слова, но и другие параметры — фотографии, отзывы и меню.