Введение

Вариативность (наличие нескольких вариантов чего-либо) – очень распространенное явление в русском языке. Она имеет место в различных областях языка, в том числе и в морфологии. Интересно изучить то, что именно влияет на выбор того или иного варианта из нескольких возможных, а также выявить тенденции этого выбора.

Для более подробного изучения взяты конструкции типа Фермер продал три овцы // трех овец. Целью данной работы является выявление тенденций выбора падежной формы в этих конструкциях и определение факторов, влияющих на этот выбор.

Для изучения были взяты числительные оба, два, три, четыре. Подбор материала осуществлялся с помощью НКРЯ и корпуса SketchEngine. Я использовала лексико-грамматический поиск и вводили следующий запрос: оба/два/три/четыре (в именительном или винительном падеже) + существительное (женского рода, во множественном числе, одушевленное, семантический класс - животное), расстояние между словоформами от 1 до 3. При таком запросе также находятся и диминутивы существительных.

В данных конструкциях может быть использована одушевленная или неодушевленная форма винительного падежа. Формы обе/две/три/четыре будем называть “неодушевленными”, а формы обеих/двух/трех/четырех – “одушевленными”:

            Завтракал Орлов (деж.). Долго гулял, убил три вороны. Занимался и писал, а после обеда читал Аликс вслух. [Николай II. Дневники 1904-1907 (1904-1907)]

            Гейден. Погулял еще и убил трех ворон. Занимался с успехом. [Николай II. Дневники 1904-1907 (1904-1907)]

Из найденных примеров не рассматривались те, в которых использовались существительные пиявка, креветка (для данных существительных в Грамматическом словаре русского языка А.А.Зализняка указаны колебания по одушевленности):

            А теперь припустил себе к носу две пиявки да воображает, что у него усы! [М. Н. Загоскин. Москва и москвичи (1842-1850)]

            Сергей выбрал еще три креветки, стараясь найти среди них самые крепкие и привлекательные, наживил каждую из них, тщательно продев крючок сквозь всетуловище, и осторожно опустил за борт свою снасть. [Фазиль Искандер. Морской скорпион (1977)]

Необходимые библиотеки.

library('languageR')
library('Hmisc')
library(party)
library(lattice)
library(rms)
library(ggplot2)

Файлы с данными.

nk = read.csv('/Users/angelinaprisyazhnaya/Desktop/ovtsy_ruscorpora.csv', sep=';')
se = read.csv('/Users/angelinaprisyazhnaya/Desktop/ovtsy_sketch.csv', sep=';')
ovtsy_all = read.csv('/Users/angelinaprisyazhnaya/Desktop/ovtsy_all.csv', sep=';')


Данные из НКРЯ

В НКРЯ было найдено 729 подходящих примеров. На графике показано количество вхождений для различных форм и числительных.

summary(nk)
##     numeral        form          year       century     homogenious_parts
##  chetyre: 63   anim  :607   Min.   :1709   XIX  :197   no        :575    
##  dva    :481   inanim:122   1st Qu.:1892   XVIII: 13   yes_anim  :117    
##  oba    : 19                Median :1932   XX   :429   yes_inanim: 37    
##  tri    :166                Mean   :1929   XXI  : 90                     
##                             3rd Qu.:1977                                 
##                             Max.   :2011                                 
##  pair_numerals definiteness adjectives
##  no :711       high  :586   no :577   
##  yes: 18       low   : 15   yes:152   
##                medium:128             
##                                       
##                                       
## 
head(nk)
##   numeral   form year century homogenious_parts pair_numerals definiteness
## 1     dva inanim 2011     XXI                no            no         high
## 2     dva inanim 2003     XXI                no           yes          low
## 3     dva inanim 2003     XXI                no            no       medium
## 4     dva inanim 2001     XXI                no            no         high
## 5     dva inanim 2001     XXI          yes_anim            no       medium
## 6     dva inanim 2001     XXI                no           yes          low
##   adjectives
## 1         no
## 2        yes
## 3         no
## 4         no
## 5        yes
## 6         no
ggplot(nk, aes(numeral)) + geom_bar(aes(fill = form), position="dodge") + geom_text(stat='count',aes(label=..count.., hjust=0.5, vjust=-0.5, group=form), position=position_dodge(width = 1)) + xlab("Числительное") + ylab("Количество вхождений") + ggtitle("Количество вхождений на основе НКРЯ")


Данные из SketchEngine

В SketchEngine было найдено 784 подходящих примера. На графике показано количество вхождений для различных форм и числительных.

summary(se)
##     numeral        form      homogenious_parts pair_numerals definiteness
##  chetyre: 69   anim  :643   no        :669     no :720       high  :528  
##  dva    :508   inanim:141   yes_anim  : 86     yes: 64       low   : 64  
##  oba    : 23                yes_inanim: 29                   medium:192  
##  tri    :184                                                             
##  adjectives
##  no :633   
##  yes:151   
##            
## 
head(se)
##   numeral   form homogenious_parts pair_numerals definiteness adjectives
## 1     dva inanim                no            no         high         no
## 2     dva inanim                no            no         high         no
## 3     dva inanim                no            no         high        yes
## 4     dva inanim                no            no         high         no
## 5     dva inanim                no            no         high        yes
## 6     dva inanim                no            no         high         no
ggplot(se, aes(numeral)) + geom_bar(aes(fill = form), position="dodge") + geom_text(stat='count',aes(label=..count.., hjust=0.5, vjust=-0.5, group=form), position=position_dodge(width = 1)) + xlab("Числительное") + ylab("Количество вхождений") + ggtitle("Количество вхождений на основе SketchEngine")


Факторы

Я предположила, что выбор формы может зависеть от следующих факторов:

Наличие однородных членов

Возможны три варианта для данного фактора:

  • есть одушевленный однородный член (yes_anim)
                Сии последние стреляли по двум полкам, оставшимся верными королю, и убили до смерти шестерых всадников и двух лошадей. [Журнал событиям, совершившимся в Париже в 11-го по 17-е июля 1789 года (1789)]
  • есть неодушевленный однородный член (yes_inanim)
                Один из грабителей убит, двое скрылись, оставив двух лошадей и ценные вещи. [неизвестный. Вести (1911.02.13) // «Новое время», 1911]
  • нет однородных членов (no)

Гипотеза: если в предложении содержатся однородные члены в “неодушевленной” форме, то название животного подвергается их влиянию и употребляется в “неодушевленной” форме (и наоборот).

Двойные числительные

Возможны два варианта для данного фактора:

  • двойное числительное (yes)
                Лишь некоторые зажиточные вогуличи держали при юртах одну-две коровы. [Финно-угорские народы. Манси (2001) // «Жизнь национальностей», 2001.12.28]
  • обычное одиночное числительное (no)

Гипотеза: двойные числительные чаще употребляются в “неодушевленной” форме, чем в “одушевленной”.

Определенность

Возможны три варианта для данного фактора:

  • Речь о конкретных объектах, их количество точно определено (high)
                Привязав обеих лошадей к прутьям ограды, монах вошел в палисадник. [Роберт Штильмарк. Наследник из Калькутты (1950-1951)]
  • Речь не о конкретных объектах, но их количество точно определено (medium)
                На эти деньги мы должны приобрести четырех собак. [Марта Баранова, Евгений Велтистов. Тяпа, Борька и ракета (1962)]
  • Речь не о конкретных объектах, их количество точно не определено (low)
                И не зря: как ни пойдешь, всегда тут две-три гадюки увидишь. [В. В. Бианки. Лесные были и небылицы (1923-1958)]

Гипотеза: с повышением определенности чаще употребляются “одушевленные” формы.

Наличие определений

Возможны два варианта для данного фактора:

  • есть определение (yes)
                Нюра еще издали окинула взглядом путик и поняла, что рыжая лесовая собака не успела пробежаться по нему и напроказить, может, погрызла двух-трех тундровых птиц, никак не больше. [Владимир Личутин. Вдова Нюра (1973)]
  • нет определения (no)

Гипотеза: при наличии определений чаще употребляются “одушевленные” формы.

Дата

Возможные варианты для данного фактора: XVIII, XIX, XX, XXI века.

Цель - проверить, есть ли временная тенденция.

Дерево решений

Для того, чтобы выяснить, зависит ли выбор падежной формы от каких-либо рассматриваемых факторов, я решила использовать дерево решений.

Дерево решений на основе данных из НКРЯ

nk.ctree=ctree(form ~ definiteness + homogenious_parts + adjectives, nk)
plot(nk.ctree, main="Дерево решений на основе данных из НКРЯ")