Если нравится — мало? Если влюбился — много? Если б узнать сначала, Если б узнать надолго! Где ж ты, фантазия скудная, Где ж ты, словарный запас! Милая, нежная, чудная!.. Ах, не влюбиться бы в вас! 1961 ....................................КОПИЯ СТРАНИЦЫ
В.В. Кромер, Ю.Н. Тамберг
Новосибирский государственный педагогический университет
ЧАСТОТНЫЙ СЛОВАРЬ ТВОРЧЕСТВА В.С. ВЫСОЦКОГО
Частотный словарь составлен коллективом сотрудников отдела прикладной лингвистики НГПУ по материалам собрания сочинений В.Высоцкого в 2-х томах (составление и подготовка текста А.Е.Крылова, 1990). Выбранное издание представляет творчество В.Высоцкого и его содержание составляют песни, стихотворения, песни театра и кино, поэма, а также прозаические произведения. В соответствии с рубрикацией выбранного издания подсчет слов производился отдельно по 5 вышеуказанным жанрам.
При составлении словаря частично использовалась методика группы “Статистика речи”, за основу аналитической грамматики была взята аналитическая грамматика, написанная Л.Н.Засориной для Частотного словаря русского языка (1977).
За словоупотребление считалась последовательность букв, ограниченная двумя пробелами. Дефис считался буквой; имена собственные, цифры, формулы и иноязычные слова, записанные нерусскими буквами, исключались из подсчета. Были составлены частотные списки словоформ и лексем по 5 жанрам и по всему обследованному творчеству, всего 12 частотных списков.
Составлен также распределительный словарь всего творчества по 4 “жанрам” распределительного словаря. С целью относительного выравнивания объемов текстов по каждому “жанру” для распределительного словаря произведено объединение поэмы с песнями театра и кино. Из 16211 зафиксированных лексем во всех 4 “жанрах” встречаются 1288 слов. Ниже представлены частотные списки лексем в порядке убывания частот. Жирным шрифтом выделены слова, встретившиеся во всех 4 “жанрах” распределительного словаря.
100 самых частых лексем (частоты от 6602 до 163)
и, я, в, не, на, а, он, с, что, быть, мы, но, как, ты, всё, это, они, у, по, вы, за, она, так, к, вот, да, мой, из, этот, от, кто, то, мочь, же, тот, сказать, ну, только, все, там, до, нет, ни, один, если, еще, знать, бы, свой, без, себя, такой, говорить, даже, есть, уже, его, друг, когда, или, ведь, где, для, потом, два, наш, про, под, хотеть, люди, ли, о, сам, рука, идти, дело, надо, весь, здесь, который, теперь, дом, стать, жить, хоть, человек, другой, видеть, просто, раз, душа, очень, дать, жизнь, первый, пусть, ее, пить, земля, день;
101 самое частое существительное
(частоты от 271 до 41)друг, люди, рука, дело, дом, человек, раз, душа, жизнь, земля, день, песня, время, бог, слово, лицо, глаз, женщина, год, сон, правда, конец, нога, голова, конь, черт, вода, парень, свет, лета, дверь, место, кровь, путь, мир, час, ночь, спина, ветер, голос, окно, ребята, смерть, мужчина, враг, бой, сила, век, стол, море, брат, судьба, поезд, война, купе, сердце, беда, дорога, работа, вид, девушка, гора, жена, товарищ, рот, город, мать, страна, народ, слеза, дети, деньги, отец, водка, поле, грудь, нож, машина, корабль, профессор, проводник, игра, стена, снег, лес, плечо, пес, ум, мама, зуб, минута, утро, король, вопрос, вечер, язык, любовь, срок, сосед, рай, письмо;
100 самых частых глаголов
(частоты от 1388 до 39)быть, мочь, сказать, знать, говорить, есть, хотеть, идти, стать, жить, видеть, дать, пить, взять, выйти, любить, спросить, пойти, стоять, уйти, ждать, глядеть, петь, спать, думать, сидеть, значить, бить, ответить, прийти, кричать, давать, ходить, начать, делать, бывать, решить, лежать, пройти, играть, слышать, смотреть, встать, вернуться, остаться, брать, найти, забыть, просить, выпить, помнить, успеть, сделать, плакать, писать, читать, увидеть, упасть, верить, умереть, бояться, слушать, казаться, бросить, сесть, лечь, бежать, узнать, спасти, лететь, смеяться, считать, попасть, понимать, звать, заметить, спешить, хотеться, плевать, простить, держать, улыбаться, вести, улыбнуться, убить, попросить, работать, взглянуть, крикнуть, посмотреть, иметь, смочь, продолжать, отвечать, хватить, ехать, вспомнить, войти, молчать, поднять;
109 самых частых прилагательных
(частоты от 183 до 14, грамматические омонимы сущ./прил. не различались)другой, белый, молодой, черный, большой, живой, последний, злой, добрый, старый, новый, дорогой, целый, хороший, милый, пьяный, любой, правый, великий, вечный, полный, чужой, уверенный, красивый, красный, больной, тихий, благообразный, бывший, главный, похожий, золотой, неприятный, знакомый, лучший, счастливый, холодный, общий, грубый, разный, веселый, страшный, серый, маленький, странный, огромный, открытый, чистый, зеленый, длинный, высокий, лишний, нежный, безумный, нужный, влюбленный, плохой, настоящий, простой, мертвый, готовый, острый, синий, проклятый, долгий, здоровый, короткий, прекрасный, родной, голый, горячий, следующий, древний, дурной, детский, легкий, левый, сильный, русский, подобный, свободный, глупый, верный, каретный, спокойный, опасный, умный, пустой, серебряный, святой, слабый, бедный, крупный, желтый, ученый, равный, надежный, прямой, любимый, соседний, известный, малый, славный, лихой, общее, согласный, голубой, тяжелый, старший;
44 самых частых числительных и числовых обозначения (частоты от 398 до 5)
один, два, первый, три, сколько, третий, двое, второй, пять, оба, восемь, сто, четыре, трое, двадцать, семь, тридцать, десять, сорок, тысяча, тыща, шесть, нуль, пятый, первый-второй, семнадцать, пятьсот, треть, двенадцать, седьмой, семьдесят, четвертый, пятьдесят, триста, двенадцатый, миллион, ноль, пятнадцать, восьмой, четыре-два-четыре, девятый, три-четыре, во-вторых, мильон.
Статистические параметры словаря
Жанр |
N |
F1 |
Словоформы |
Лексемы |
||
|
|
|
v(N) |
v1 |
v(N) |
v1 |
Поэма |
3239 |
134 |
1621 |
1260 |
1278 |
877 |
Песни театра и кино |
16920 |
699 |
6560 |
4804 |
4595 |
2848 |
Стихотворения |
19300 |
886 |
7661 |
5966 |
5254 |
3378 |
Прозаические произведения |
39942 |
2232 |
9943 |
6678 |
5987 |
3222 |
Песни |
64037 |
2651 |
17607 |
11878 |
10324 |
5511 |
Все обследованное творчество |
143438 |
6602 |
31150 |
19780 |
16211 |
7738 |
Обозначения:
N – объем текста (словоупотреблений); F1 – частота самого частого слова (союза И), совпадает в частотных списках словоформ и лексем; v(N) – объем словаря; v1 – количество одноразовых слов.Авторы выражают признательность инженеру-программисту А.Э.Гренсманну за разработку программы обработки текстов.