В "Поиске по архивам" пользователи теперь могут найти метрические книги из коллекций Государственного исторического архива Чувашии. Эти книги — своего рода предшественники современных актовых записей ЗАГСа, охватывающие период до 1917 года, в которых фиксировались важные события в жизни людей, такие как заключение браков. Для удобства работы с этими документами сервис применяет нейросети Яндекса, которые успешно распознают старинные рукописи и конвертируют их в машинопечатный текст.
Глава Чувашии, Олег Николаев, отметил, что внедрение такой технологии повысит интерес у населения к изучению архивных материалов. В рамках проекта, к октябрю этого года, планируется оцифровать и выложить на платформу свыше 500 тысяч листов генеалогических документов, а в следующем году — ещё 1,5 миллиона листов рукописей.
Ранее между Правительством Чувашии и Яндексом было подписано соглашение о сотрудничестве в архивном деле. В результате, сервис уже содержит первые 60 тысяч рукописных листов от чувашских архивов, что соответствует примерно 100 делам — каждое из них представляет метрическую книгу одной или нескольких церквей за год или более долгий период. В ближайшие два месяца "Поиск по архивам" дополнится до 500 тысяч листов архивных материалов, а планируется добиться объема в 2 млн листов в течение года. Помимо метрических книг, сервис также будет публиковать ревизские сказки и духовные ведомости, которые отражают результаты переписей податного населения и записи о прихожанах, исповедовавшихся и причащавшихся в прошедшем году.
Одна из самых ранних записей в метрических книгах датируется 6 январём 1722 года, в которой упоминается рождение сына Алексея у чебоксарского купца Андрея Саввича Игумнова. Эти книги включают данные не только о жителях Чувашии, но и других регионов современной России, таких как Татарстан и Марий Эл.
Чувашия стала пятнадцатым регионом страны, сотрудничающим с "Поиском по архивам".
"Поиск по архивам" — сервис Яндекса, запущенный в начале 2023 года, который позволяет находить упоминания людей, населённых пунктов и событий в оцифрованных рукописных документах XVIII–XX веков. В базе сервиса хранится более 13 миллионов страниц исторических документов из архивов Москвы, Московской, Оренбургской, Вологодской, Иркутской, Астраханской и других областей, а также нескольких муниципальных архивов.
Процесс оцифровки исторических документов основан на технологии оптического распознавания символов. Нейросеть эффективно идентифицирует устаревшие символы и особенности почерка, преобразовывая трудночитаемые записи в легко читаемый печатный текст за считанные секунды.