Семантические фильтры для разрешения многозначности в национальном корпусе русского языка: глаголы

В статье обсуждаются результаты эксперимента по разработке системы семантических фильтров глаголов, используемых для разрешения неоднозначности лексико-семантической разметки в Национальном корпусе русского языка. Основные задачи эксперимента: проверить, в какой степени можно использовать специализированные лексикографические источники для создания таких фильтров (в качестве основного источника использовался словарь глагольного управления [Апресян-Палл 1982]); какие ограничения на актанты (семантические, лексические, грамматические) наиболее значимы для фильтров.

Использование Интернет-ресурсов в школьном обучении: Национальный корпус русского языка

Национальный корпус русского языка размещен в сети Интернет в 2004 г. (после предварительной подготовки и лингвистической разметки текстов). Корпус находится в свободном доступе на сайте www.ruscorpora.ru, им могут пользоваться все желающие. Но прежде всего Корпус рассчитан на тех, кто занимается лингвистическими исследованиями, а также на тех, кто изучает или преподает русский язык.

НКРЯ: семантические фильтры для разрешения многозначности глаголов

Нам уже приходилось писать в ряде публикаций (см. Кустова и др. 2005, 2006; Шеманаева и др. 2007; Кустова, Толдова 2008а,b) о том, как устроена семантическая разметка в Национальном корпусе русского языка (нкря) и как работает программа снятия неоднозначности2. Однако, чтобы не затруднять читателя поиском этих публикаций, мы сочли целесообразным вкратце повторить некоторые основные тезисы, касающиеся проблемы многозначности в нкря и методов ее автоматического разрешения.