Семантические фильтры для разрешения многозначности в национальном корпусе русского языка: глаголы

В статье обсуждаются результаты эксперимента по разработке системы семантических фильтров глаголов, используемых для разрешения неоднозначности лексико-семантической разметки в Национальном корпусе русского языка. Основные задачи эксперимента: проверить, в какой степени можно использовать специализированные лексикографические источники для создания таких фильтров (в качестве основного источника использовался словарь глагольного управления [Апресян-Палл 1982]); какие ограничения на актанты (семантические, лексические, грамматические) наиболее значимы для фильтров.

НКРЯ: семантические фильтры для разрешения многозначности глаголов

Нам уже приходилось писать в ряде публикаций (см. Кустова и др. 2005, 2006; Шеманаева и др. 2007; Кустова, Толдова 2008а,b) о том, как устроена семантическая разметка в Национальном корпусе русского языка (нкря) и как работает программа снятия неоднозначности2. Однако, чтобы не затруднять читателя поиском этих публикаций, мы сочли целесообразным вкратце повторить некоторые основные тезисы, касающиеся проблемы многозначности в нкря и методов ее автоматического разрешения.