Сразу скажу мнение моё - СЛОВ НА СВЕТЕ РОВНО СТОЛЬКО, СКОЛЬКО ВЕЩЕЙ НА СВЕТЕ. А поскольку свет един, вещей тьма, а языков много, то всякий язык должен иметь равное количество слов, тождественное, воспринимаемому миру, ибо, каждый имеющий способность образа - имеет и способность наречения его. Поэтому, количество слов - бесконечно. И именно поэтому у Бога множество имён, а не потому что вам толкователи библий да исламов всяких проповедуют. Так что я думаю не стоит верить тому, что всего слов насчитывается около трёх миллионов. Но именно так утверждает лингвистика. Ну такого просто не может быть, ведь на нашей планете Земля, в данный момент около шести миллиардов человек, а это значит, что и слов должно быть уже никак не меньше этого числа, ибо всякий человек индивидуален, и он имеет имя своё, лишь ему данное, это не то что в паспорте записано, это облик его, образ некий. То же самое и о растениях, и о животных и о вообще всех вещах... Будь не так - всякое определение было бы величайшей глупостью, ибо каждое имеет исключительное название. Кто не верит мне, просто подумайте над тем, что я сказал чуть выше. А на данной странице я, по возможности, буду публиковать анализ словарного запаса известных людей(ничита мну каторые); поэтов, писателей, вождей, руководителей, и других общественных деятелей, как литературных, так и не очень, представителей рода человеческого, от начала сотворения мира, принявшего слово в дар...
Не знаю, для чего я это делаю, быть может, мне просто интересно, но, у всего есть свои причины, о которых мы даже не догадываемся. Ведь, произнесённое тобой - помыслено однажды; и оно - не должно исчезнуть бесследно, а взяться из ниоткуда - это бессмысленно, глупо и бездушно.
Смысл сказанного тобой не просто имеет образ некий, он - выстраивается именно тобою порядком определённым, который определяется только тобой,
ибо ты - личность, и это ты несёшь миру гармонию и красоту, ибо ты - Бог;
не будь слова - ты бы никогда не узнал о Боге. И ты - знаешь, что Бог - есть.
Не в том ли смысл жизни разумной?
Словарный запас Андреева Даниила
Частотный анализ Всех Произведений Даниила Андреева.
Всего слов:356381 Уникальные слова:67775 Энтропия:0,19
Частотный анализ Стихов Даниила Андреева
Всего лексем:45652 Уникальные лексемы:16061 Энтропия:0,35
_________________________________________
Словарный запас Ахматовой.
Частотный анализ Всех Произведений Ахматовой на русском языке.
Всего слов:109007 Уникальные слова:23700 Энтропия:0,217
Частотный анализ всех Стихов Ахматовой [.txt]
Всего лексем:35321 Уникальные лексемы:11516 Энтропия:0,326
_________________________________________
Словарный запас ЦЦветаевой.
Частотный анализ Всех Произведений Марины Цветаевой на русском языке
Всего лексем:545142 Уникальные:79355 Энтропия:0,145
скачать произведения Цветаевой по которым нами проводился частотный анализ
rar - пр.кн.мыши. Сохранить как, если ваш браузер не видит тип файла.
_________________________________________
Словарный запас Библии
Частотный анализ 66 книг Библии на русском языке (Ветхий завет + Новый завет)
Всего слов:676622 Уникальные слова:49837 Энтропия:0,0736
___________________________________________
Словарный запас Блока
Частотный анализ Всех Стихов Блока на русском языке.
Всего слов:94217 Уникальные слова:22217 Энтропия:0,236
___________________________________________
Словарный запас Бродского
Частотный анализ Всех Стихов Бродского на русском языке.
Всего слов:158588 Уникальные слова:37852 Энтропия:0,238
___________________________________________
Словарный запас Бунина
Частотный анализ собрания сочинений И.Бунина в четырёх томах. (rar-rtf)
Всего слов:514848 Уникальные слова:74282 Энтропия:0,144
___________________________________________
Словарный запас Высоцкого
Частотный анализ всех стихов Высоцкого.
Всего слов:70906 Уникальных:19662 Энтропия:0,277
___________________________________________
Словарный запас Горького
Частотный анализ всех произведений Горького (оглавление).
Всего лексем:2721780 Уникальных:160401 Энтропия:0,059
__________________________________________
Словарный запас Есенина
Частотный анализ всех произведений Сергея Есенина. Пять томов без комментариев. (rar-rtf)
Всего лексем:109490 Ункальные:29003 Энтропия:0,264
__________________________________________
Словарный запас Лермонтова
Частотный анализ всех произведений Лермонтова. (оглавление)
Всего слов:265548 Уникальных:40617 Энтропия:0,153
Лексемы, состоящие из одного знака были исключены в силу неадекватности исходных текстов.
___________________________________________
Словарный запас Ленина
___________________________________________
Словарный запас Маяковского
Частотный анализ творчества Маяковского.
Всего слов:389007 Уникальных:79424 Энтропия:0,2
___________________________________________
Словарный запас Мандельштама
Частотный анализ всех стихов Мандельштама.
Всего слов:33479 Уникальных:15629 Энтропия:0,466
Лексемы, состоящие из одного знака были исключены в силу неадекватности исходных текстов.
___________________________________________
Словарный запас Пастернака
Частотный анализ Всех Стихов Пастернака на русском языке.
Всего слов:59508 Уникальных:25253 Энтропия:0,42
Лексемы, состоящие из одного знака пришлось удалить в силу неадекватности исходных текстов. У меня складывается такое ощущение что редакторо-верстальщики либо идиоты, либо умышленно мешают ближнему... но, при таком раскладе, идиоты они по-любому, нормальные люди же не поступают подобным образом в любом случае...
Вот для чего по текстам менять русские буквы например Е, О, В и т.д. на соответствующие по написанию латинские? Ну это ли не идиотизм?
И это же не опечатки машинальные которые, это же надо макросом делать, поиском-заменой...
А буквы в слове пробелами разрывать это разве нормально? Или это красиво так?
Или чтобы дуракам попонятнее было? То же самое и с комментариями гениальными повсемествно; ну вынеси ты комментарии твои отдельно, чтобы я их не видел вообще, в конце книги написуй их, вот как у Ницше сделано, кому надо тот отлистает взад, да прильнёт ухом и сердцем к слову тваму мудрёному.
Да я с детства знал что 90% чсп, или претендующие туда - идиоты... ну, что поделать, поэтому я не переживаю так как они, ибо они - страхом движимы... ума-то - нет.
Короче, не бесите меня. Ладно.
___________________________________________
Словарный запас Пушкина
Тексты произведений я не привожу, ибо много очень.
Да и кому надо, найдёте сами, оглавление ниже.
А ниже, я привёл результат анализа, где из общего текста были исключены одно-двух-трёх значные лексем (это была необходимость крайняя, ибо редакторы-издатели так книжки печатают, что слова пробелами разрывают на буквы и поди разбери компьютеру какое это слово написано... А руками корректировать, - так это порядка 5000 страниц. (я бы всем чспэшникам головы бы их безмозглые поотрывал бы... ну за что они не возьмутся, всё у них через это самое получается... О том, что я их комментарии удалять замучился не буду тут говорить, ой сколько я слов плохих миру добавил пока анализ этот делал...
Вот про Пушкина скажу немного, Пушкин слово СПБ изменял 18-ю позициями, когда подписывал письма, либо стихи свои. Подобным образом он поступал и с именем своим, то есть, Пушкин - даже в этом не повторялся, если это было возможно! Вообще, у Пушкина порядка 6000 стихов, где порядка 110 тысяч уникальных слов. Да вы просто посмотрите на энтропию, даже без удаления некоторых лексеем энтропия его была 0,13, а при таком объёме творчества это высший пилотаж, что на порядок выше Шекспира. Пушкина пока никто не переплюнул и вряд ли кто в будущем переплюнет. Его даже сравнить ни с кем невозможно. Это моё мнение.) Люди, почитайте Пушкина! Это единственное что у вас есть (ну и Не Юлин есть у вас, тоже малый ваще прям весь из себя. Берегите Не Юлина раз Пушкина не уберегли!)
Список произведений находится здесь
Частотная статистика:
Всего лексем:621810 Уникальных:95594 Энтропия:0,154
___________________________________________
Словарный запас Толстого Л.Н.
Частотный анализ всех произведений Толстого. (оглавление)
Всего слов:3329238 Уникальные:153588 Энтропия:0,046
Анализ проводился по изданию 1958 года; комментарии, дополнения, и пр. мысли не Льва Толстого из анализа были исключены
___________________________________________
Словарный запас Тургенева
Частотный анализ всех произведений Тургенева. (rar-txt)
Всего лексем:1639792 Уникальные:113668 Энтропия:0,069
___________________________________________
Словарный запас Чехова
Частотный анализ Всех произведений Антона Чехова ППС в 18-и томах + Письма в 12-и томах (rar-txt)
Всего слов:2457088 Уникальные:150032 Энтропия:0,061
___________________________________________
Словарный запас Шекспира.
Сонеты я посчитал отдельно - Анализ 154-х сонетов на языке оригинала:
Всего слов:18067 Уникальные:3088 Энтропия:0.17
При этом, каждый сонет имеет энтропию в среднем 0,7. Это правильно, ибо Поэзия, в отличие от Прозы - короче и содержательнее; законченнее. А повторение слов в поэзии есть - необходимость, ибо, если я во всех стихах буду говорить о себе, то лексему "я" я буду повторять в каждом отдельном стихе, и т.д. (иначе будет ложь и вода), что в сумме и даёт низкую энтропию. Когда я говорю Энтропия Низкая или Высокая, я подразумеваю её числовой показатель (само число). А вообще, энтропия может только увеличиваться (если мы говорим о самом процессе, то это есть, попросту говоря - смерть.). Поэтому о качестве Поэзии нельзя судить по Общей Энтропии - Энтропии Текста. К слову скажу, что русские переводы Шекспира имеют более высокую энтропию (я говорю о числовом показателе), и в среднем это 0,8. Так что, Русский язык - самая бесценная ценность человечества.
Следующий анализ включает в себя всё творчество Шекспира на английском языке:
Всего слов:966063 Уникальные:28016 Энтропия:0,028
___________________________________________
Словарный запас ......
...
___________________________________________