Разметка
Национальный корпус калмыцкого языка – это информационно-справочная система, содержащая тексты на калмыцком и других (русском, монгольском и т.д.) языках и металингвистическую и лингвистическую аннотацию, или разметку:
Национальный корпус калмыцкого языка содержит три вида разметки:
- Метатекстовая разметка – совокупность металингвистических сведений о тексте (например, указание автора, времени создания, жанра и т.д.);
- Грамматическая разметка – морфологические пометы, которые получены в результате работы автоматического анализатора TextAnalyxer (программист А.Ю. Каджиев, см. подробно об алгоритме работы парсера здесь);
- Семантическая разметка – лексико-грамматические и семантические пометы, характеризующие лексическую единицу с точки зрения ее принадлежности к определенному лексико-грамматическому разряду, таксономии, топологии, мереологии и т.д.