Использование Национального корпуса русского языка для решения задач моделирования речевой деятельности

В докладе планируется изложение результатов, полученных при решении ряда задач моделирования речевой деятельности с помощью Национального корпуса русского языка (НКРЯ). 1. О выборе корпуса современного русского языка Строго говоря, этот пункт избыточен, т.к. на настоящее время НКРЯ является единственным корпусом современного русского языка, обладающим следующими характеристиками: (1) сплошная морфологическая аннотированность; (2) значительный объем корпуса (корпус со снятой омонимией насчитывает около 4 млн. с/у в 100 документах; нами использовался, главным образом, корпус со снятой омонимией); (3) доступность в качестве Интернет-ресурса для осуществления некоторых типов поиска, (4) возможность задавать тематические подкорпуса.