Список форумов

Esperanto новости

Форум об эсперанто и языках вообще

Избранное:
En Esperanto: UEA :: REU :: Vikipedio :: Libera Folio
По-русски: Esperanto новости :: Что такое эсперанто? :: Курс эсперанто по эл. почте


Сейчас Сб апр 20, 2019 7:55 am

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 36 ]  На страницу 1, 2  След.
Автор Сообщение
 Заголовок сообщения: Реальный дефект у токи поны
СообщениеДобавлено: Пт май 29, 2009 18:26 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Кртитикующие токипону часто делают это необдуманно.
Я же хочу предложить основательную критику.
Известно, что в любом из естественных языков частотный словарь имеет одну и ту же универсальную закономерность. А именно. Если расположить все слова данного языка в порядке убывания частоты употребления данного слова и присвоить каждому слову номер N, так что самое частое слово будет N=1, второе по частоте - N=2 и так далее, то окажется удивительная вещь:
Частота каждого слова оказывается обратно пропорциональна его номару в списке!
То есть: если обозначить частоту слова как F(N), то окажется
F(N)*N = const!

Естественно, в любом естественном языке эта закономерность выполняется не совсем точно, особенно среди нескольких первых слов, а также в конце списка. Но уклонение от этого правила бывает не слишком заметным.

Природу этого феномена, насколько мне известно, никто еще не объяснил. По крайней мере, в 80-х годах, когда я жил в городе и активно занимался наукой, это оставалось совершенной загадкой.

Исследовав частотый словарь токипоны, я обнаружил, что этот язык значительно уклоняется от данной закономмерности. Мне думается, это признак погрешности данного языка.
Давайте обсудим мои резоны - может, я ошибаюсь?

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  

 Заголовок сообщения: Re: Реальный дефект у токи поны
СообщениеДобавлено: Пт май 29, 2009 18:32 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Вот для начала частотный словарь языка токи пона:

1 1136 toki сущ. язык, разговор, речь, коммуникация*прил. говорящий, вербальный*пер. гл. сказать*гл. общаться, болтать*межд. привет! здравствуй! 1136

2 1116 li разд. разделяет подлежащее (кроме mi и sina) и сказуемое; также используется для представления нового глагола для существительного 2232

3 1007 e разд. (разделяет сказуемое и дополнение) 3021

4 1003 pona сущ. доброта, простота, позитивность*прил. хороший, простой, правильный*межд. хорошо! спасибо! OK! круто!*пер. гл. улучшать, ремонтировать 4012

5 860 mi сущ. я, мы*прил. мой, наш 4300

6 633 jan сущ. человек, люди, кто-то*прил. человеческий, чей-то, личный*пер. гл. олицетворять, очеловечивать 3798

7 525 la разд. (разделитель между наречием или фразой контекста и предложением) 3675

8 435 ni прил. это, этот 3480

9 367 ona сущ. он, она, оно, это, они*прил. его, её, их 3303

10 337 tawa prep в, для, по направлению к (указывает на цель действия), до*гл. идти, гулять, путешествовать, двигаться, покидать*сущ. передвижение, транспортировка*прил. передвижной, мобильный*пер. гл. двигать, перемещать 3370

11 283 pi разд. из, of, (разделитель в составных словах) 3113

12 282 ala прил. не, нет, не-*сущ. ничего, отрицание, ноль*межд. нет! 3384

13 234 sina сущ. ты*прил. твой 3042

14 227 en союз и (используется для соединения подлежащих) 3178

15 201 kama гл. подходить, приходить, прибывать, случаться, начинать, приводить в состояние*сущ. событие, происшествие, шанс, прибытие, начало*прил. наступление, будущее*пер. гл. принести, вызвать 3015

16 199 sona сущ. знание, мудрость, понимание*пер. гл. знать, понимать*kama sona учиться 3184

17 196 mute прил. много, очень, несколько, больше*сущ. число, количество*пер. гл. увеличить 3332

18 182 tenpo сущ. время, период, момент, длительность, ситуация 3276

19 179 wile пер. гл. хотеть, желать, сделать в будущем*сущ. желание, нужда, воля*прил. необходимый 3401

20 177 o разд. (обращение или повелительное наклонение)*межд. эй! (привлечь чьё-то внимание) 3540

21 174 ali (оба варианта правильные)*сущ. всё, каждое, жизнь, вселенная*прил. все, каждый, целый, полный 3654

22 169 lon prep быть в, располагаться*гл. быть, присутствовать, существовать*сущ. правда 3718

23 146 ken гл. мочь, разрешать, сделать возможным*сущ. возможность, разрешение, способность*пер. гл. сделать возможным, разрешить*cont возможно, что … 3358

24 128 ike прил. плохой, отрицательный, неправильный, злой, слишком сложный, (образно) больной*межд. жаль! увы!*сущ. вредность, негодность, злость*пер. гл. сделать плохим, ухудшить, вызвать негативный эффект*гл. быть плохим 3072

25 125 suli прил. большой, высокий, длинный, взрослый, важный*пер. гл. увеличивать, удлиннять*сущ. размер 3125

26 120 moku сущ. еда, питание*пер. гл. есть, пить, глотать, потреблять 3120

27 115 ma сущ. земля, страна, пространство, место 3105

28 106 luka сущ. рука 2968

29 104 jo пер. гл. иметь, содержать*сущ. имущество, собственность *kama получить, взять 3016

30 103 lukin пер. гл. смотреть, видеть, наблюдать, читать*прил. визуальный, видимый 3090

31 101 ijo сущ. вещь, что-то, объект*прил. из чего-то*пер. гл. воплощать 3131

32 99 pali сущ. активность, деятельность, работа*прил. активный, рабочий*пер. гл. делать, создавать, строить, работать 3168

33 98 lawa сущ. голова, ум*прил. главный, лидирующий*пер. гл. управлять, контролировать, направлять 3234

34 94 wan прил. один*сущ. единица, элемент, часть, частица, кусок*пер. гл. объединить 3196

35 86 kalama сущ. звук, шум, голос*гл. шуметь*пер. гл. звонить, играть (на инструменте) 3010

36 86 tomo сущ. помещение, пространство, дом, комната, здание, конструкция*прил. городской, домашний 3096

37 84 kiwen прил. твёрдый, сплошной, каменный, металлический*сущ. твёрдая вещь, скала, камень, металл, земля 3108

38 78 seme oth что? (вопросительное слово)*jan seme — кто?*lon seme — где?*tan seme — почему?*kepeken nasin seme — как? каким образом? 2964

39 76 tu прил. двойной*сущ. два, пара*пер. гл. разделять, отделять 2964

40 73 lili прил. маленький, молодой, немного, мало*пер. гл. уменьшать, сокращать 2920

41 72 telo сущ. вода, жидкость, сок*пер. гл. мыть 2952

42 70 nimi сущ. слово, имя 2940

43 68 kin прил. также, даже, (усиливает слова, перед этим словом) 2924

44 66 nasa прил. тупой, сумасшедший, пьяный, странный*пер. гл. сводить с ума, чудить 2904
45 65 pana пер. гл. давать, класть, посылать, выпускать, вызывать (что-либо)*сущ. передача, обмен 2925
46 64 sin прил. новый, свежий, другой, ещё*пер. гл. обновить, освежить 2944
47 60 ante сущ. отличие*прил. отличный, другой*cont иначе*пер. гл. изменить, сменить 2820
48 59 meli сущ. женшина, девочка, жена, подружка*прил. женский 2832
49 58 tan prep из, с помощью, благодаря, из-за, впоследствии, после*сущ. источник, причина 2842
50 58 taso прил. единственный, исключительный*союз но, однако 2900
51 56 pilin сущ. чувства, эмоции*гл. чувствовать*пер. гл. думать о чём-либо, ощущать, трогать 2856
52 54 sama прил. такой же, похожий, равный*prep как (в сравнении) 2808
53 53 kepeken пер. гл. использовать*prep с помощью 2809
54 53 lupa сущ. дыра, отверстие, окно, дверь, проход 2862
55 52 nanpa сущ. число*oth(порядковое числительное) 2860
56 52 suno сущ. солнце, свет 2912
57 50 sitelen сущ. изображение, картинка*пер. гл. рисовать, писать 2850
58 47 moli сущ. смерть*гл. умереть, быть мёртвым*пер. гл. убить*прил. мёртвый, убийственный, фатальный 2726
59 47 nasin сущ. дорога, путь, выбор, доктрина, метод 2773
60 41 kulupu пер. гл. слушать*прил. слуховой, слух 2460
61 41 olin n любовь*прил. любимый*пер. гл. любить (человека) 2501
62 39 kili сущ. плод, фрукт, овощ, гриб 2418
63 38 ilo сущ. инструмент, устройство, приспособление, механизм, аппарат, машина, прибор; вещь, используемая для определённой цели 2394
64 37 mije сущ. мужчина, муж, бойфренд*прил. мужской 2368
65 37 open пер. гл. открыть, включить 2405
66 36 awen гл. оставаться, ждать, пребывать*пер. гл. хранить*прил. оставшийся, неподвижный, постоянный, сидячий, оседлый 2376
67 35 anu союз или 2345

68 31 kute сущ. группа, сообщество, сомпания, люди*прил. общий, публичный, совместный 2108
69 31 musi сущ. развлечение, игра, отдых, искусство*прил. искусный, смешной, развлекательный*гл. играть, развлекаться*пер. гл. развеселить 2139
70 30 pini сущ. конец, кончик*прил. законченный, прошлый*пер. гл. заканчивать, приближать, выключать 2100
71 30 soweli сущ. животное, наземное млекопитающее 2130
72 30 unpa сущ. пол, сексуальность*прил. эротический, половой*пер. гл. заниматься сексом 2160

73 27 utala сущ. конфликт, соревнование, схватка, бой, война, атака, спор, оскорбление, насилие*пер. гл. ударть, атаковать, соперничать 1971
74 26 kon сущ. воздух, ветер, запах, душа, дух*прил. воздушный, неземной, газообразный 1924
75 25 lape n, vi сон, отдых*прил. спать, сонный 1875
76 25 mama сущ. родитель, мама, папа*прил. родительский, отцовский, материнский 1900
77 24 sewi сущ. верх, над, на*прил. верхний, возвышенный, религиозный, официальный 1848
78 23 pimeja прил. чёрный, тёмный*сущ. темнота, тень*пер. гл. затемнять 1794
79 21 kasi сущ. растение, лист, дерево, трава 1659
80 21 laso прил. синий, сине-зелёный 1680
81 19 lipu сущ. плоский и гибкий предмет, бумага, карточка, билет 1539
82 19 palisa сущ. длинный, твёрдый объект, палка, ветка 1558
83 18 insa сущ. внутри, внутренний мир, центр, живот, желудок*прил. внутренний 1494
84 18 pakala сущ. промах, происшествие, ошибка, разрушение, ущерб, сломанный*пер. гл. разрушить, сломать, повредить*гл. разрушиться, сломаться, развалиться*межд. чёрт! 1512
85 18 sijelo сущ. тело, физическое состояние 1530
86 18 walo прил. белый, светлый*сущ. белая вещь, белизна, чистота 1548
87 17 wawa сущ. сила, энергия*прил. мощный, интенсивный, уверенный, сильный, энергичный*пер. гл. усиливать, укреплять, возбуждать 1479
88 16 anpa сущ. низ, нижняя часть, под, пол, ниже*прил. низ, ниже, вниз 1408
89 16 loje прил. красный 1424
90 16 waso сущ. птица, животное с крыльями 1440
91 15 sike сущ. круг, колесо, кольцо, шар, мяч*прил. круглый, периодический*пер. гл. кружить 1365
92 14 sinpin сущ. перед, грудь, торс, лицо, стена 1288
93 14 weka прил. далекий, отсутствующий, пропавший*сущ. отсутствие*пер. гл. выбросить, убрать, освободиться 1302
94 13 jaki прил. грязный, грубый, мерзкий*сущ. грязь, загрязнение, мусор, брань*пер. гл. загрязнять, грязный*межд. фу! ew! yuck! 1222
95 13 len сущ. одежда, ткань 1235
96 13 mu межд. гав! мяу! му! (голос животного) 1248
97 13 uta сущ. рот*прил. устный, произносимый вслух, оральный 1261
98 12 jelo прил. жёлтый, светло-зелёный 1176
99 12 noka сущ. нога 1188
100 12 poki сущ. контейнер, коробка, чашка 1200
101 12 seli сущ. огонь, тепло*прил. горячий, тёплый, приготовленный (о еде)*пер. гл. нагревать, готовить 1212
102 11 linja сущ. длинный, очень тонкий предмет, верёвка, нитка, волос, цепь 1122

103 10 kule сущ. цвет, краска*прил. цветной*пер. гл. красить 1030

104 9 mani сущ. деньги, материальные блага, богатство 936

105 9 nena сущ. шишка, выпуклость, нос, холм, гора, кнопка 945

106 9 selo сущ. поверхность, снаружи, кожа, раковина, форма 954

107 8 monsi сущ. зад, сзади*прил. задний 856

108 7 kala сущ. рыба, морское животное 756

109 7 pipi сущ. насекомое, жук, паук 763

110 6 lete сущ. холод*прил. холодный, неприготовленный*пер. гл. охладить, заморозить 660

111 5 ko сущ. вязкая субстанция, резина, порошок 555

112 4 mun сущ. луна*прил. лунный 448

113 4 poka сущ. сторона, бок, край, бедро, почти*прил. соседний 452

114 3 oko сущ. глаз 342

115 3 supa сущ. горизонтальная поверхность, мебель, стол, стул, колонна, этаж 345

116 2 akesi сущ. неприятное животное, рептилия, пресмыкающееся 232

117 2 suwi сущ. конфетка, лакомство*прил. сладкий, изящный*пер. гл. услащать 234

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения: Re: Реальный дефект у токи поны
СообщениеДобавлено: Пт май 29, 2009 18:37 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Прошу прощения за неудобный формат.
Первые цифры - это номер слова в частотном списке.
Затем пробел - увы, он вышел очень маленьким, неудобно, простите!
Затем количество употреблений данного слова в выборке.
Затем слово (латиницей, естественно).
Затем перевод(кириллицей).
Затем произведение частоты на номер.

Последнее число в идеальном языке должно быть константой.

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения: Re: Реальный дефект у токи поны
СообщениеДобавлено: Пт май 29, 2009 18:51 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Мы видим, что самые частые слова toki pona имеют аномальное уклонение от закономерности. Слова

toki 1136
li 2232
!особенно toki!

употребляются аномально редко,
а слова

pona 4012
mi 4300
jan 3798
la 3675
ni 3480

употребляются аномально часто.
Среднее значение F*N, как видим из таблицы, около 3000.
Но такого рода уклонение от общей закономерности меня в обще-то не настораживает. Подобное бывает и в естественных языках, хотя и не столь выражено.

Самое страшное - это конец таблицы!
linja 1122
kule 1030
mani 936
nena 945
selo 954
monsi 856
kala 756
pipi 763
lete 660
ko 555
mun 448
poka 452
oko 342
supa 345
akesi 232
suwi 234
Такое уклонение от общелингвистической закономерности - это совсем ненормально.
Слова из конца списка употребляются в десять-пятнадцать раз реже, чем "положено"!

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения: Re: Реальный дефект у токи поны
СообщениеДобавлено: Пт май 29, 2009 18:54 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
У меня есть версия, как следует объяснить эту аномалию. Есть также и конкретное предложение по усоврешенствованию данного планового языка.
Однако сейчас у меня неудобный момент, и я изложу свою точку зрения позже.

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения: Re: Реальный дефект у токи поны
СообщениеДобавлено: Пт май 29, 2009 19:14 pm 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3059
Откуда: Ensko
С этим в спортлото
Это я к тому, что не представляет никакого труда спроектировать язык, в котором закон ципфа будет нарушатсья вообще жестко типа все абсоютно слова будут иметь одинаковую частотность. Тот алгоритм построения етого языка который я вижу дает язык, похожий на токипону ну и что?
Дльше следует известная четырехбуквенная аббревиатура

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения: Re: Реальный дефект у токи поны
СообщениеДобавлено: Пт май 29, 2009 21:01 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
[quote="Ŝak'"]С этим в спортлото
Это я к тому, что не представляет никакого труда спроектировать язык, в котором закон ципфа будет нарушатсья вообще жестко типа все абсоютно слова будут иметь одинаковую частотность. Тот алгоритм построения етого языка который я вижу дает язык, похожий на токипону ну и что?[quote]
Нет, дорогой Ŝak, не относитесь к Ципфу столь легкомысленно. Хотя я Вас понимаю.
Попробуйте и Вы понять меня.
Я - физик, а не лингвист. И я сознаю, что нам на сегодняшний день известны причины практически все наблюдаемых нами закономерностей, которые имеют точное числовое выражение. Мы знаем, почему на небе столько звезд такой-то величины и такой-то величины. Мы знаем, почему волны по морю идут именно с такой скоростью, а не с другой. Почему ошибки статистики F(N) порядка sqpt(F).
Но мы не знаем и даже не видим достаточно убедительных причин закона Ципфа.
И это страшно, Ŝak.
Это значит, что мы имеем дело с некоторой закономерностью, несводимой к той сумме знаний о реальности, которая накоплена современной наукой.
Закон Ципфа - это вызов современной науке. И наука столь бессильна перед ним, что предпочитает помалкивать.
Не говорите, что это простое спротлото.
Это далеко не так.
Все закономерности статистики стортлото прозрачны для математики. Закон Ципфа непроницаем. Он является чисто эмпирической закономерностью, необъяснимой в рамках известной лично мне научной картины мира.

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения: Re: Реальный дефект у токи поны
СообщениеДобавлено: Пт май 29, 2009 21:15 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
С этим в спортлото
Это я к тому, что не представляет никакого труда спроектировать язык, в котором закон ципфа будет нарушатсья вообще жестко типа все абсоютно слова будут иметь одинаковую частотность. Тот алгоритм построения етого языка который я вижу дает язык, похожий на токипону ну и что?

Да, это нетрудно. Однако частота РЕАЛЬНОГО употребления слов данного языка будет иной. Люди, реально используя этот язык, начнут непроизвольно подгонять его под закон Ципфа.

Именно это и происходит с токипоной.
Используя этот язык, люди все равно говорят в соотетствии с законом Ципфа. Просто это означает, что невозможно говорить на токипоне, не используя дополнительных слов из других языков. Составляя чатотный словарь токипоны, слова других языков просто отбросили. Но эти слова оказывается не являются простым внешним довеском к токипоне.
Тот факт, что токипонские слова из конца списка используются реже, чем положено по Ципфу, означает, что наряду с ними используются чужие слова, СУЩЕСТВЕННЫМ ОБРАЗОМ дополняющие лексикон токипоны. Без зэтих слов полоценное общение было бы просто невозможным, так как полноценое общение происходит в соответствии с Ципфом, хотим мы того или нет.

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Пт май 29, 2009 22:18 pm 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Ср май 09, 2007 10:50 am
Сообщения: 308
Откуда: 56°oriente, 58°norde
А на буквы русского языка закон Ципфа распространяется?

Если да, то налицо аномалия: Ъ употребляется аномально редко.
Вторая аномалия - буква Ё: она то употребляется, то не употребляется.
Третья аномалия - буква Я. У неё аномально высокая дисперсия.

_________________
В научных вопросах ссылки на уголовный кодекс неуместны!


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Пт май 29, 2009 23:18 pm 
Не в сети
Fervora Forumano
Fervora Forumano
Аватара пользователя

Зарегистрирован: Вс окт 01, 2006 20:26 pm
Сообщения: 705
Откуда: Дублин
Ааа, мой мозг, мой мозг! Он сейчас взорвётся! "Люди говоря, пытаются подогнать под какой-то частотный закон" :)

Будьте проще. Люди употребляют одни и те же слова по бытовым и психическим причинам. Все любят говорить о себе, о жратве и бабах. От языка это не зависит.

Так как токи пона не есть полноценный язык, то и ожидать от него что-то как от другого языка это неизлечимый оптимизм.

P.S. Кстати, откуда раскладки по частотности? Если из текстов, то это будет отличаться от болтовни.

_________________
Совместный перевод книги "Практика вольных путешествий" http://docs.google.com/Doc?id=dc4jvdr4_ ... ite=cjffqq


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения: Re: Реальный дефект у токи поны
СообщениеДобавлено: Сб май 30, 2009 3:14 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3059
Откуда: Ensko
Солохин Максим писал(а):
Ŝak' писал(а):
С этим в спортлото
Это я к тому, что не представляет никакого труда спроектировать язык, в котором закон ципфа будет нарушатсья вообще жестко типа все абсоютно слова будут иметь одинаковую частотность. Тот алгоритм построения етого языка который я вижу дает язык, похожий на токипону ну и что?

Да, это нетрудно. Однако частота РЕАЛЬНОГО употребления слов данного языка будет иной. Люди, реально используя этот язык, начнут непроизвольно подгонять его под закон Ципфа.
.

Нихрена подобного. Частота всех слов всегда вне зависимости от желания говорящих под что-то другое будет одинкоовой. И чтобы сделать такое надо идти по пути токипоны то есть сократить число члов а реальные слова составить из комбнаций слов.

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб май 30, 2009 3:17 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3059
Откуда: Ensko
kapriculo писал(а):
А на буквы русского языка закон Ципфа распространяется?
.
Педполагаю что да (если нет у какого-то языка, то создаем язык из него превратив каждую букву исходного языка в слово нового и пусть люди подгоняют частотночть под ципфа) , толкьо с поправкой на то, что букв немного а в начале и конце списка он это закон как там вначале говорилось не очеь соблюдается
Я даже думаю на этот список
( http://www.e-novosti.info/forumo/memberlist.php если упорядочить по числу сообщений desc)
с теми допусками "приблизительно" он соблюдается

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб май 30, 2009 20:35 pm 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Ср май 09, 2007 10:50 am
Сообщения: 308
Откуда: 56°oriente, 58°norde
В Википедии сказано:
Цитата:
если все слова языка (или просто достаточно длинного текста) упорядочить по убыванию частоты их использования, то частота n-го слова в таком списке окажется приблизительно обратно пропорциональной его порядковому номеру n

То есть что получается?
Берём самое частое слово с коэффициентом 1, второе с коэффициентом 1/2, третье с коэффициентом 1/3, и так далее.
Сумма этого ряда логарифмически растёт с числом членов. А логарифмический ряд - расходящийся.

Выходит, если наиболее часто встречающееся слово содержится в тексте 1000 раз (или любое другое конечное количество), то общее число слов в тексте приблизительно бесконечно.

В чём дело? Очевидно, в здравом смысле. Нужно делать обрезание. Наиболее логичное место для которого - район того слова, которое в тексте окажется одно. В названном мной случае это 1000-ное слово, и длина текста получается порядка 1000*ln(1000), то есть 6908, а может, порядка 1000*ln(2000), то есть 7600

_________________
В научных вопросах ссылки на уголовный кодекс неуместны!


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб май 30, 2009 21:27 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
kapriculo писал(а):
А на буквы русского языка закон Ципфа распространяется?

Если да, то налицо аномалия: Ъ употребляется аномально редко.
Вторая аномалия - буква Ё: она то употребляется, то не употребляется.
Третья аномалия - буква Я. У неё аномально высокая дисперсия.

Для букв он не распространяется.
Слова нужно брать в том виде как они произносятся, разные падежные формы и омографы считаются как разные слова, омофоны считаются как одинаковое слово.
Т.е. если и считать, то нужно считать частоты для звуков или слогов.
В токипоне слов слишком мало, фактически аналогом слов обычного языка будут комбинации слов, и считать наверно нужно их.

Кстати, проверяли ли этот закон для эсперанто?


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб май 30, 2009 23:10 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
kapriculo писал(а):
Берём самое частое слово с коэффициентом 1, второе с коэффициентом 1/2, третье с коэффициентом 1/3, и так далее. Сумма этого ряда логарифмически растёт с числом членов. А логарифмический ряд - расходящийся.

Выходит, если наиболее часто встречающееся слово содержится в тексте 1000 раз (или любое другое конечное количество), то общее число слов в тексте приблизительно бесконечно.

В чём дело? Очевидно, в здравом смысле. Нужно делать обрезание.

Есть другой вариант рассуждения.
Я предлагаю его рассмтреть в отдельной теме

http://www.e-novosti.info/forumo/viewtopic.php?p=73898

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб май 30, 2009 23:44 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
kapriculo писал(а):
А на буквы русского языка закон Ципфа распространяется?
.
Педполагаю что да

Для справки.
n+3 буква xастота частота*(n+3)
4 о 928 3712
5 а 866 4330
3 е 810 2430
4 и 745 2980
5 н 635 3175
6 т 630 3780
7 р 553 3871
8 с 545 4360
9 л 432 3888
10 в 419 4190
11 к 347 3817
12 п 335 4020
13 м 329 4277
14 у 290 4060
15 д 256 3840
16 я 222 3552
17 ы 211 3587
18 ь 190 3420
19 з 181 3439
20 б 151 3020
21 г 141 2961
22 й 131 2882
23 ч 127 2921
24 ю 103 2472
25 х 92 2300
26 ж 78 2028
27 ш 77 2079
28 ц 52 1456
29 щ 49 1421
30 ф 40 1200
31 э 17 527
32 ъ 4 128

На конечном числе знаков (а особенно - на малом числе заков!) закон Ципфа точно выполняться не может, так как ряд 1/n логарифмически расходится.
Однако если поглядеть на Ципфа чуть пристальнее, можно попытаться найти правильное осмысление данной закономерности.
Моя идея закючется в следующем.
Число слов языка не может быть бесконечным в каждый данный момент времени, однако можно расмотреть язык в развитии.
Подробности здесь:
http://www.e-novosti.info/forumo/viewtopic.php?p=73898

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб май 30, 2009 23:56 pm 
Не в сети
Natura Forto
Natura Forto
Аватара пользователя

Зарегистрирован: Сб мар 15, 2003 12:46 pm
Сообщения: 5208
Откуда: SPb
У токипоны жёстко ограниченная лексика —в этом и отличие от „нормальных“ языков. В обычных языках есть место для „бесконечного“ хвоста из редких слов (термины, окказионализмы и всё такое). В токипоне такого хвоста нет.

_________________
Esperu ĉiam!

Модельное произношение эсперанто »»


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс май 31, 2009 0:00 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Матюшов писал(а):
Кстати, проверяли ли этот закон для эсперанто?
Да, это интересно было бы узнать. Кто бы дал ссылку на частотный словарь Эсперанто.

Что же касается токипоны, я объясняю наблюдаемую аномалию следующим образом. Думаю, закон Ципфа достаточно хорошо выполняется, если брать в рассчет не только слова токипоны, но и те "неофициальные слова", которыми пользуются токипонцы. Кроме того, надо брать и английские слова. Фактически на чатах, где они общаются, идет токипона вперемешку с английским. Считать надо все вместе.
Но тот факт, что частотый словарь Токипоны заваливается в конце списка, является, на мой взгляд, убедительным доказательством того, что "хвост" этого словаря составлен неудачно.
Де-факто токипонцы используют "неофициальные слова" чаще, чем слова
82 19 palisa сущ. длинный, твёрдый объект, палка, ветка 1558
83 18 insa сущ. внутри, внутренний мир, центр, живот, желудок*прил. внутренний 1494
84 18 pakala сущ. промах, происшествие, ошибка, разрушение, ущерб, сломанный*пер. гл. разрушить, сломать, повредить*гл. разрушиться, сломаться, развалиться*межд. чёрт! 1512
85 18 sijelo сущ. тело, физическое состояние 1530
86 18 walo прил. белый, светлый*сущ. белая вещь, белизна, чистота 1548
87 17 wawa сущ. сила, энергия*прил. мощный, интенсивный, уверенный, сильный, энергичный*пер. гл. усиливать, укреплять, возбуждать 1479
88 16 anpa сущ. низ, нижняя часть, под, пол, ниже*прил. низ, ниже, вниз 1408
89 16 loje прил. красный 1424
90 16 waso сущ. птица, животное с крыльями 1440
91 15 sike сущ. круг, колесо, кольцо, шар, мяч*прил. круглый, периодический*пер. гл. кружить 1365
92 14 sinpin сущ. перед, грудь, торс, лицо, стена 1288
93 14 weka прил. далекий, отсутствующий, пропавший*сущ. отсутствие*пер. гл. выбросить, убрать, освободиться 1302
94 13 jaki прил. грязный, грубый, мерзкий*сущ. грязь, загрязнение, мусор, брань*пер. гл. загрязнять, грязный*межд. фу! ew! yuck! 1222
95 13 len сущ. одежда, ткань 1235
96 13 mu межд. гав! мяу! му! (голос животного) 1248
97 13 uta сущ. рот*прил. устный, произносимый вслух, оральный 1261
98 12 jelo прил. жёлтый, светло-зелёный 1176
99 12 noka сущ. нога 1188
100 12 poki сущ. контейнер, коробка, чашка 1200
101 12 seli сущ. огонь, тепло*прил. горячий, тёплый, приготовленный (о еде)*пер. гл. нагревать, готовить 1212
102 11 linja сущ. длинный, очень тонкий предмет, верёвка, нитка, волос, цепь 1122

Нижеследующие слова исполльзуются в 2 - 3 раза реже неофициальных

103 10 kule сущ. цвет, краска*прил. цветной*пер. гл. красить 1030
104 9 mani сущ. деньги, материальные блага, богатство 936
105 9 nena сущ. шишка, выпуклость, нос, холм, гора, кнопка 945
106 9 selo сущ. поверхность, снаружи, кожа, раковина, форма 954
107 8 monsi сущ. зад, сзади*прил. задний 856
108 7 kala сущ. рыба, морское животное 756
109 7 pipi сущ. насекомое, жук, паук 763
110 6 lete сущ. холод*прил. холодный, неприготовленный*пер. гл. охладить, заморозить 660

А эти - в 6 раз реже неофициальных

111 5 ko сущ. вязкая субстанция, резина, порошок 555
112 4 mun сущ. луна*прил. лунный 448
113 4 poka сущ. сторона, бок, край, бедро, почти*прил. соседний 452
114 3 oko сущ. глаз 342
115 3 supa сущ. горизонтальная поверхность, мебель, стол, стул, колонна, этаж 345
116 2 akesi сущ. неприятное животное, рептилия, пресмыкающееся 232
117 2 suwi сущ. конфетка, лакомство*прил. сладкий, изящный*пер. гл. услащать 234

А последние - в 10 -15 раз реже неофициальных!

Это означает, что создательница Токипоны прекрасно выбрала первые 80 слов своего языка, но неудачно - следующие 40.

А теперь, собственно, ради чего я открыл эту тему!

Токипона - это прежде всего попытка выделить ОСНОВНОЙ ЛЕКСИКОН. И эта попытка в общем и целом БЛЕСТЯЩЕ УДАЛАСЬ.
Первые 60-80 слов-морфем токипоны действительно представляют собой некий лексический минимум, достаточный для реального общения.
С этих 60-80 понятий должен начинать всякий, желающий разработать лексикон для своего языка.
Смысл же моего сообщения в том, что не нужно слепо следовать за Токипоной в том, что в Токипоне неудачно.
От Токипоны надо взять половину.

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс май 31, 2009 0:08 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Slavik писал(а):
У токипоны жёстко ограниченная лексика —в этом и отличие от „нормальных“ языков. В обычных языках есть место для „бесконечного“ хвоста из редких слов (термины, окказионализмы и всё такое). В токипоне такого хвоста нет.
У токипоны такой хвост есть. На токипонском жаргоне его называют "неофициальные слова токипоны".
Моя мысль заключается в том, что если неофициальное слово употребляется чаще, чем официальное, значит, словарь составлен не слишком удачно.
А что неофициальные слова токипонцы используют чаще, чем некоторые официальные - об этом ясно свидетельствует приведенная мною таблица плюс Ципф.

Приглашаю Вас в смежную тему

http://www.e-novosti.info/forumo/viewtopic.php?p=73898

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс май 31, 2009 3:00 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3059
Откуда: Ensko
kapriculo писал(а):
То есть что получается?
Берём самое частое слово с коэффициентом 1, второе с коэффициентом 1/2, третье с коэффициентом 1/3, и так далее.
Сумма этого ряда логарифмически растёт с числом членов. А логарифмический ряд - расходящийся.
Угу. Он в бесконечности расходящийся а никтоне обещал бессконечное число слов:-) Еслди берем текст конечной длины то в нем будет и конечное число слов

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс май 31, 2009 3:04 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3059
Откуда: Ensko
Матюшов писал(а):
kapriculo писал(а):
А на буквы русского языка закон Ципфа распространяется?

Для букв он не распространяется.
тогда это доказывает, что закон ципфа- никкой не закон и соотеветственно глупо искать его объяснения.
Ибо берем язык, на буквы которого он не распространяется и проектируем новый земаня каждую букву словом. Получаем нарушение .

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс май 31, 2009 6:28 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
kapriculo писал(а):
А логарифмический ряд - расходящийся.
Угу. Он в бесконечности расходящийся а никтоне обещал бессконечное число слов:-) Еслди берем текст конечной длины то в нем будет и конечное число слов

Нет, не совсем, дорогой Ŝak. Вы недооцениваете трудность, связанную с расхождением гармонического ряда.
Осмыслить ее нетрудно.
Зададимся вопросом, почему в грамотных частотных словарях публикуют КОЛИЧЕСТВО УПОТРЕБЛЕНИЙ данного слова в данном тексте, а не ЧАСТОТУ употребления данного слова, выявленную в результате исследования?
Казалось бы, что трудного - поделить количествослучаев употребления данного слова на число слов в тексте?
Потому что понятие "частоты" есть екоторая экстраполяция, предсказание на будущее: как часто должно встречаться данное слово, если текст будет продолжаться, сохраняя своеобразие своего языка.
ОДнако штука в том, что яем длиннее рассматриваемый текст, тем получается меньше частота для каждого слова?
Это именно потому, что ряд расходится.
То есть, по мере того, как текст продолжается, в нем употребляются все новые и новые слова, которых не было раньше.
И если наблюдаемую закономерность в бесконечность, то частота употребления каждого слова окажется равной НУЛЮ.
Вот какая штука.
Это означает де-факто, что Ципф описывает некую тенденцию, принцип развития текста. А не какое бы то ни было финитное состояние языка данного текста.
Ципф де-факто октрыл, что любой текст - лишь фрагмент некоторой развивающейся системы.
Его "закон" - это ТЕНДЕНЦИЯ РАЗВИТИЯ языка, а не описание какого-либо стационарного состояния.
ОБ этом
http://www.e-novosti.info/forumo/viewto ... 3910#73910

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 36 ]  На страницу 1, 2  След.

Часовой пояс: UTC + 3 часа


Похожие темы форума | Similaj temoj en la forumo
 Темы   Автор   Ответы   Просмотры   Последнее сообщение 
В этой теме нет новых непрочитанных сообщений. Токи пона!!! Что это?

[ На страницуНа страницу: 1 ... 6, 7, 8 ]

Pennivajz

163

69468

Пн июл 30, 2018 3:27 am

Nabl777 Перейти к последнему сообщению

 


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
News News Plan de site Plan de site SitemapIndex SitemapIndex Flux RSS Flux RSS Liste des flux Liste des flux
Создано на основе phpBB® Forum Software © phpBB Group