Комендантов А.С., Матвеев А.Г., Светлов А.В. Автоматизация морфологической разметки архивных документов
- Подробности
- Просмотров: 800
https://doi.org/10.15688/mpcm.jvolsu.2019.4.4
Анатолий Сергеевич Комендантов
Студент института математики и информационных технологий,
Волгоградский государственный университет
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
,
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Александр Георгиевич Матвеев
Студент института математики и информационных технологий,
Волгоградский государственный университет
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
,
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Андрей Владимирович Светлов
Кандидат физико-математических наук, доцент кафедры математического анализа и
теории функций,
Волгоградский государственный университет
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
,
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
,
Этот адрес электронной почты защищен от спам-ботов. У вас должен быть включен JavaScript для просмотра.
https://orcid.org/0000-0002-8764-6132
просп. Университетский, 100, 400062 г. Волгоград, Российская Федерация
Аннотация. Работа посвящена описанию созданной авторами статьи надстройке над утилитой для стемминга MyStem И. Сегаловича. Приложение добавляет к возможностям утилиты удобный графический интерфейс, простой для освоения и интуитивно понятный пользователям, не специализирующимся в информационных технологиях. Оно перехватывает вывод утилиты MyStem, специальным образом переформатирует и анализирует его. Кроме того, приложение имеет функционал для снятии омонии вручную, если автоматическими средствами морфологические характеристики слова определены неверно. Основное назначение данного приложения — подготовка морфологической разметки документов архивного фонда «Михайловский станичный атаман» для создания лингвистического корпуса. В ходе работы над приложением была решена задача корректной обработки текстов, содержащих устаревшие кириллические символы.
Ключевые слова: автоматизация лингвистического анализа, автоматизация морфологического анализа, утилита MyStem, графический интерфейс, программная оболочка, корпусная лингвистика.
Произведение «Автоматизация морфологической разметки архивных документов», созданное авторами по имени Комендантов А.С., Матвеев А.Г., Светлов А.В., публикуется на условиях лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.
Цитата: Математическая физика и компьютерное моделирование. Том 22 № 4 2019, с. 53-63