ОБРАБОТКА ТЕКСТОВ, ВКЛЮЧЕННЫХ В МЕТАРАЗМЕТКУ, НА СПЕЦИАЛЬНОМ КОМПЬЮТЕРНОМ ПРОГРАММНОМ ОБЕСПЕЧЕНИИ
https://doi.org/10.55491/2411-6076-2021-3-37-52
Аннотация
В статье рассматривается проблема металингвистической разметки текстов в составе Национального корпуса казахского языка. Описаны метаразметные системы казахских текстов. Метаразметка включает в себя ссылку на текст поисковым параметрам, характеризующих фрагмент в целом. Мета-разметка позволяет пользователю искать и выбирать тексты для составления внутренней структуры с указанными свойствами. Метаразмеченные материалы – незаменимый источник в научно-исследовательской работе по сбору текстового контента, относящегося к определенному периоду, стилю, автору, теме и др. Одной из главных задач при выборе литературы при создании корпуса является учет жанрового разнообразия текстов. Необходимость введения метаразметок при создании корпуса не вызывает споров. Они позволяют пользователю корпуса, особенно исследователям-корреспондентам, быстро и легко находить любую необходимую информацию.
Кроме того, лингвистическая информация по возможности извлекается со всех языковых уровней. А вот в корпусах предоставление лингвистической информации сразу по всем уровням крайне сложно и возможности ограничены. Тем не менее, в «корпусе текстов казахского языка» запущена программа метатекстовых разметок и лингвистических разметок – морфологических, словообразовательных, фонетических, морфосемантических разметок. В статье описываются виды метатекстов на корпус (23 параметра), механизмы функционирования программы лингвистических разметок.
Об авторах
А. А. ЖанабековаКазахстан
Алматы
А. К. Кожахметова
Казахстан
Алматы
Список литературы
1. Finegan E. LANGUAGE: its structure and use. – N.Y.: Harcourt Brace College Publishers, 2004.
2. Wikipedia – http://en.wikipedia.org/wiki/
3. McEnery T., Wilson, A. Corpus Linguistics. – Edinburgh: Edinburgh University Press, 2001.
4. Рыков В.В. Корпус текстов как реализация объектно-ориентированной парадигмы // Труды Международного семинара Диалог-2002. – М.: Наука, 2002.
5. Захаров В.П. Корпусная лингвистика: Учебно-метод. пособие. – СПб., 2005.
6. Савчук С.О. Метатекстовая разметка в Национальном корпусе русского базовые принципы и основные функции // Национальный корпус русского языка: 2003–2005. Результаты и перспективы. – М., 2005 – С. 62–88.
7. Сиразитдинов З.А., Бускунбаева Л.А., Ишмухаметова А.Ш., Ибрагимова А.Д. Информационные системы и базы данных башкирского языка. – Уфа: Книжная палата РБ, 2013. – 116 с.
Рецензия
Для цитирования:
Жанабекова А.А., Кожахметова А.К. ОБРАБОТКА ТЕКСТОВ, ВКЛЮЧЕННЫХ В МЕТАРАЗМЕТКУ, НА СПЕЦИАЛЬНОМ КОМПЬЮТЕРНОМ ПРОГРАММНОМ ОБЕСПЕЧЕНИИ. TILTANYM. 2021;(3):37-52. https://doi.org/10.55491/2411-6076-2021-3-37-52
For citation:
Zhanabekova A.A., Kozhahmetova A.K. PROCESSING OF THE TEXTS INCLUDED IN METAMARKING ON THE SPECIAL COMPUTER SOFTWARE. Tiltanym. 2021;(3):37-52. (In Kazakh) https://doi.org/10.55491/2411-6076-2021-3-37-52