Павлов А.В., Сапич Ю.Д., Светлов А.В., Комендантов А.С. О создании веб-сервиса для работы с корпусом архивных документов
- Подробности
- Просмотров: 409
https://doi.org/10.15688/mpcm.jvolsu.2022.1.3
Артур Валерьевич Павлов
Студент института математики и информационных технологий,
Волгоградский государственный университет
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
,
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Юлия Дмитриевна Сапич
Студент института математики и информационных технологий,
Волгоградский государственный университет
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
,
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Андрей Владимирович Светлов
Кандидат физико-математических наук, доцент кафедры математического анализа и
теории функций,
Волгоградский государственный университет
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
,
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
,
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Анатолий Сергеевич Комендантов
Инженер-программист,
ООО «СЭТ»
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
ул. Смолячкова, 4/2, 194044 г. Санкт-Петербург, Российская Федерация
Аннотация. Работа посвящена разработке веб-сервиса лингвистического корпуса документов архивного фонда «Михайловский станичный атаман». Компоненты сервиса позволяют производить автоматизированный морфологический анализ текстов, создавать на основе него документы, формирующие корпус, сохранять их в базе данных, производить поиск по ним и получать созданные другими пользователями документы. Также в программе предусмотрена функция для ручной коррекции ошибок, возникающих при проведении автоматизированного морфологического анализа старославянских текстов, в которых присутствуют устаревшие символы.
Ключевые слова: лингвистический корпус документов, веб-сервис, автоматизация морфологического анализа, утилита MyStem, корпусная лингвистика.
Произведение «О создании веб-сервиса для работы с корпусом архивных документов», созданное авторами по имени Павлов А.В., Сапич Ю.Д., Светлов А.В., Комендантов А.С., публикуется на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Цитата: Математическая физика и компьютерное моделирование. Том 25 № 1 2022, с. 34-48