Список форумов

Esperanto новости

Форум об эсперанто и языках вообще

Избранное:
En Esperanto: UEA :: REU :: Vikipedio :: Libera Folio
По-русски: Esperanto новости :: Что такое эсперанто? :: Курс эсперанто по эл. почте


Сейчас Сб май 25, 2019 6:34 am

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 57 ]  На страницу Пред.  1, 2, 3  След.
Автор Сообщение
 Заголовок сообщения:
СообщениеДобавлено: Ср июн 03, 2009 12:02 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
Солохин Максим писал(а):
Но конечно, в конце-концов график должен, просто обязан завалиться. Ведь ряд 1/n расходится! НИ один реальный язык не может полностью соответствовать Ципфу.
Еще раз: расходимсость тут при чем????
расходимость ряда (в бесконечности!) означает всего лишь расходимость ряда и все! Число слов любого языка конечно, поэтому расхходимость ряда в бесконечности ни к чему не обязывает
Возьмем язык из 2х слов и 1е слово пусть встречается в 1/3 случаев, 2е в остальных. Распределение ципфа соблюдается.
Закон Ципфа не может формулироваться просто как требование, чтобы второе слово встречалось в два раза реже первого, третье - в три раза реже и так далее до некоторого последнего, самого редкого слова.
Почему - не может?
Потому этому требованию удовлетворяют только знаковые системы, специально сконструированные для того, чтобы удовлетворять закону Ципфа.
Реальные языки не удовлетворяют этому жесткому и очень искусственному требованию.
А закон Ципфа в них все-таки явно имеет место быть!

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  

 Заголовок сообщения:
СообщениеДобавлено: Ср июн 03, 2009 13:18 pm 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3066
Откуда: Ensko
Солохин Максим писал(а):
Ŝak' писал(а):
Солохин Максим писал(а):
Но конечно, в конце-концов график должен, просто обязан завалиться. Ведь ряд 1/n расходится! НИ один реальный язык не может полностью соответствовать Ципфу.
Еще раз: расходимсость тут при чем????
расходимость ряда (в бесконечности!) означает всего лишь расходимость ряда и все! Число слов любого языка конечно, поэтому расхходимость ряда в бесконечности ни к чему не обязывает
Возьмем язык из 2х слов и 1е слово пусть встречается в 1/3 случаев, 2е в остальных. Распределение ципфа соблюдается.
Закон Ципфа не может формулироваться просто как требование, чтобы второе слово встречалось в два раза реже первого, третье - в три раза реже и так далее до некоторого последнего, самого редкого слова.
Почему - не может?
Потому этому требованию удовлетворяют только знаковые системы, специально сконструированные для того, чтобы удовлетворять закону Ципфа.
Реальные языки не удовлетворяют этому жесткому и очень искусственному требованию.
А закон Ципфа в них все-таки явно имеет место быть!

Внимательно прочитайте мой вопрос.

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт июн 04, 2009 5:58 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
Солохин Максим писал(а):
Ŝak' писал(а):
Солохин Максим писал(а):
Но конечно, в конце-концов график должен, просто обязан завалиться. Ведь ряд 1/n расходится! НИ один реальный язык не может полностью соответствовать Ципфу.
Еще раз: расходимсость тут при чем????
расходимость ряда (в бесконечности!) означает всего лишь расходимость ряда и все! Число слов любого языка конечно, поэтому расходимость ряда в бесконечности ни к чему не обязывает
Возьмем язык из 2х слов и 1е слово пусть встречается в 1/3 случаев, 2е в остальных. Распределение ципфа соблюдается.
Закон Ципфа не может формулироваться просто как требование, чтобы второе слово встречалось в два раза реже первого, третье - в три раза реже и так далее до некоторого последнего, самого редкого слова.
Почему - не может?
Потому этому требованию удовлетворяют только знаковые системы, специально сконструированные для того, чтобы удовлетворять закону Ципфа.
Реальные языки не удовлетворяют этому жесткому и очень искусственному требованию.
А закон Ципфа в них все-таки явно имеет место быть!

Внимательно прочитайте мой вопрос.

Вы спросили, при чем тут расходимость.
Я отвечаю: закон Ципфа может формулироваться двумя способами:
1) либо как требование, чтобы произведение номера слова в частотном списке на его частоту было постояным для всех слов языка
2) либо как требование, чтобы частотность слов в языке подчинялась распределению 1/n для любого n!
В первом случае число слов языка может быть конечным, во втором случае бесконечность закладывается в саму формулировку закона Ципфа. Потому что конечный словарь, конечно, никак не может удовлетворять требованию f=const/n для ЛЮБОГО n. Начиная с некоторго n в этом языке f=0.
Для меня интуитивно очевидно, что любой нормальный язык не может иметь распределение, вначале строго соответствующее Ципфу, а затем резкообрывающееся в ноль. В природе так не бывает, как не бывает и языков с определенным и фиксированным набором слов. Потому реальный язык не может соответствовать закону Ципфа и в формулировке (1), как чересчур строгой, ни в формулировке (2), как требующей бесконечного словаря.
Потому-то тот факт, что основная масса слов словарялюбого языка все-таки сответствует распределению Ципфа, представляется мне крайне станным и взывающим к здравому смыслу.
Мы имеем дело с чем-то фундаментальным, крайне важным и пока никем удовлетворительно не объясненным!
Значит, наблюдаемое нами

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт июн 04, 2009 8:55 am 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Солохин Максим писал(а):
Верно! В 1992 была статья
http://www.nslij-genetics.org/wli/pub/ieee92_pre.pdf

А ты хоть читал эту статью?
На самом деле распределение Ципфа не 1/n, а 1/n^p, где
p ≈ 1, но p > 1 !


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт июн 04, 2009 9:06 am 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Ср май 09, 2007 10:50 am
Сообщения: 308
Откуда: 56°oriente, 58°norde
На самом деле слова - элементы дискретные, а закономерности тут статистические. Это значит, подвержены флуктуациям. Причём характерный размер флуктуаций пропорционален квадратному корню из частотности слова.
При высоких частотностях квадратный корень гораздо меньше числа, при низких - сравним по порядку. То есть, хвост распределения тонет во флуктуациях. Ессно, это верно не только для слов, но и для прочих объектов, подчиняющихся закону Ципфа.

_________________
В научных вопросах ссылки на уголовный кодекс неуместны!


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт июн 04, 2009 19:07 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Солохин Максим писал(а):
НИ один реальный язык не может полностью соответствовать Ципфу.[/


Это касается не только "хвоста" распределения, но и его "головы".
Арапов М.В. Квантитативная лингвистика. М., 1988. С. 45–53.
3. Закон Ципфа и структура реального текста

Одно из основных утверждений, которое будет обсуждаться в данном разделе, состоит в том, что постулат о константности частот употребления структурных элементов словаря несовместим с предложением, что частоты этих элементов распределены по закону Ципфа.
3.3. Рассуждение, которое приводит нас к этому выводу, основывается на дополнительной гипотезе, практически всегда подтверждающейся, что первые 5–15 мест любого рангового распределения как раз и заняты лексическими структурными элементами. Эту гипотезу можно будет в значительной степени ослабить. Например, требовать, чтобы только первое место (ранг 1) было занято каким-то определенным структурным элемен¬том, т.е. существовало служебное слово, которое в любом тексте употреб¬ляется чаше, чем любое другое слово, например, в русской художественной прозе это союз и, в научно-технической литературе – предлог в, в драма¬тургии – местоимение я и т.п. Если в качестве второй гипотезы мы при¬мем, что существуют тексты разной длины, но с постоянной частотой данного структурного элемента, то сразу убедимся, что частота этого выделенного слова не может удовлетворять закону Ципфа.
Этот факт со всей очевидностью следует из того, что частота слова, имею¬щего любой фиксированный ранг, в том числе ранг 1, зависит от объема текста L: F1(F1=N) – есть корень уравнения L=N lnN. Аналогичные зависимости не сложно выписать для любого варианта и любых значе¬ний γ. Это, конечно, прямо противоречит гипотезе константности.
Вопрос о постоянстве относительной частоты самого частого слова многократно обсуждался в лингвостатистической литературе, особенно на раннем этапе, однако в несколько ином контексте [81, 121]. Высказы¬вались даже предложения возвести постоянство частоты самого употреби¬тельного слова в ранг лингвистической универсалии, но, по-видимому, стабильность этой величины тогда сильно преувеличивалась, сказывался недостаток эмпирических исследований. Реально частота самого частого слова заметно колеблется в зависимости от языка, стиля или жанра (однако, нам-то важно только то, что она не зависит при этом от длины текста).

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт июн 04, 2009 19:23 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Матюшов писал(а):
Солохин Максим писал(а):
Верно! В 1992 была статья
http://www.nslij-genetics.org/wli/pub/ieee92_pre.pdf

А ты хоть читал эту статью?
На самом деле распределение Ципфа не 1/n, а 1/n^p, где
p ≈ 1, но p > 1 !

Конечно, читал! Это очень важная статья.
Это ВенТьян Ли доказал, что если взять случайный текст, составленный из равновероятных статистически независимых букв (одна из которых является пробелом), то частотность слов этого текста должна быть 1/n^p.
Вы верно заметили, что у него получается, что p>1.
Но у того же автора получается, что p стремится к 1, когда число "букв" алфавита возрастает. Причем стремится очень быстро! уже при алфавите всего лишь из трех(!) букв получается практически единица, отклонение во втором знаке.
Конечно, ПОЧТИ 1 - это уже не 1! Ряд уже сходящийся.
Но интуитивно ясно, что реальный закон природы - если закон Ципфа действительно есть некий закон природы! - не может быть таким некрасивым, как число вроде 1.03
Это неэстетично, и так не бывает.
Думаю, это получилось у ВенТьяна Ли потому, что он рассматривал МОДЕЛЬ, в чем-то похожую на реальный язык - но в чем-то принципиальноотличающуюся от него...

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт июн 04, 2009 19:28 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
kapriculo писал(а):
На самом деле слова - элементы дискретные, а закономерности тут статистические. Это значит, подвержены флуктуациям. Причём характерный размер флуктуаций пропорционален квадратному корню из частотности слова.
При высоких частотностях квадратный корень гораздо меньше числа, при низких - сравним по порядку. То есть, хвост распределения тонет во флуктуациях. Ессно, это верно не только для слов, но и для прочих объектов, подчиняющихся закону Ципфа.
Это верное замечание, но сути дела оно не меняет, так как флуктуации бывают в обе стороны. И в среднем выходит то же самое.

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Пт июн 05, 2009 18:51 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Матюшов писал(а):
Солохин Максим писал(а):
Верно! В 1992 была статья
http://www.nslij-genetics.org/wli/pub/ieee92_pre.pdf

А ты хоть читал эту статью?
На самом деле распределение Ципфа не 1/n, а 1/n^p, где
p ≈ 1, но p > 1 !

Кстати, в качестве иллюстрации к данной статье как раз можно рассмотреть предложенный Вами язык из двух букв a и b, в котором вероятность появления a равна 2/3, а вроятность появления b равна 1/3.
Тогда частоты самых частых "слов" оказываются
a 0,66666 1 0,66666
aa 0,4444 2 0,8888
b 0,33333 3 0,99999
aaa 0,2962 4 1,1848
ab 0,22222 5 1,1111
ba 0,22222 6 1,33332
aaaa 0,1975 7 1,3825
aab 0,148 8 1,184
aba 0,148 9 1,332
baa 0,148 10 1,48
bb 0,1111 11 1,2221
aaab 0,0988 12 1,1856
aaba 0,0988 13 1,2844
abaa 0,0988 14 1,3832
baaa 0,0988 15 1,482
abb 0,074 16 1,184
bab 0,074 17 1,258
bba 0,074 18 1,332
aabb 0,049 20 0,98
abab 0,049 21 1,029
bbaa 0,049 22 1,078
abba 0,049 23 1,127
baba 0,049 24 1,176
baab 0,049 25 1,225
bbb 0,037 19 0,703
Что, грубо говоря, соответствует распределению Ципфа.
Хотя буквы всего две...
Заметьте, не точно соответствует, а ГРУБО соответствует...

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Пт июн 05, 2009 20:24 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Не правилно считашь! Внимательнее прочитай статью! А то у тебя вероятности слов a и b уже 100%! Также нужно дать некоторую вероятность появления пробела.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 4:21 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3066
Откуда: Ensko
Солохин Максим писал(а):
Конечно, ПОЧТИ 1 - это уже не 1! Ряд уже сходящийся.
Но интуитивно ясно, что реальный закон природы - если закон Ципфа действительно есть некий закон природы! - не может быть таким некрасивым, как число вроде 1.03
Поздравляю вас с тем, что вы только что сказали, число пи равно 3 или 4!

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 5:49 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Матюшов писал(а):
Не правилно считашь! Внимательнее прочитай статью! А то у тебя вероятности слов a и b уже 100%! Также нужно дать некоторую вероятность появления пробела.
Я считаю не то, чтобы неправильно. Просто по-другому немножко. Но я же и не обязан слепо следовать за Ли.
Дело в том, что пробел тут никакого реального значения не имеет. Это же просто один из символов Думаю, Ли вводит его для наглядности, чтобы лингвистам была понятнее его логика.
Я вот позволяю себе беседовать с Вами чуть свободнее, и, как видите, на каждом шагу возникают непонятки.
Если разрешить "словам" накладываться друг на друга, то для частот этих возникающих "слов" (произвольной длины) получается то же самое распределение Ципфа. При это окажется, что цепочка abbab содержит целый набор "слов" a, ab, bb, bab, bbab и так далее. Вот эти-то накладывающиеся слова и распределены по Ципфу.
А что вероятность получается как будто больше единицы, не пугайтесь: это ж частота, а не вероятность.
Дело в том, что с ростом длины цепочки n количество входящих в нее и накладывающихся друг на друга "слов" растет как n(n+1)/2. То есть, быстрее, чем растет само n.
И потому ясно, что частоты всех элементов неизбежно растут с ростом n - их же очень много становится...
Я сознаю, что создаю для Вас трудности в понимании, отходя от простой и нагляднй модели Ли. Но я рассчитываю на Ваш интеллект, на способность поглядеть на задачу с неожиданной стороны.

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 5:54 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
Солохин Максим писал(а):
Конечно, ПОЧТИ 1 - это уже не 1! Ряд уже сходящийся.
Но интуитивно ясно, что реальный закон природы - если закон Ципфа действительно есть некий закон природы! - не может быть таким некрасивым, как число вроде 1.03
Поздравляю вас с тем, что вы только что сказали, число пи равно 3 или 4!

Если бы "пи" иногда было таким, а иногда сяким, то Ваше сравнение было бы правомерным. Ведь именно так и получается с законом Ципфа! Наиболее подходящий к экспериметальным данным показатель степени выходит то таким, то чуть-чуть другим. Вопрос стоит так: какой же он на самом деле, если отбросить погрешности эксперимента?
В случае "пи" в ответе получается иррационаьлное число. Это нормально, и логика тут понятна.
А вот в случае Ципфа - неужели Вы действительно думаете, что на самом деле там не единица, а что-то иррациональное?!
Что-то близкое к 1, но не 1?!
Странно сие.

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 6:00 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3066
Откуда: Ensko
Солохин Максим писал(а):
Если бы "пи" иногда было таким, а иногда сяким, то Ваше сравнение было бы правомерным.
А оно и так иногда такое иногда сякое
берем метрику L-бесконечность (где расстояние между точками x1 y1 и x2 y2= max(|x1-x2|,|y1-y2|)) окружность радиуса 1 в ней это квадрат со стороной 2 длина каждой из 4х сторон=2 а периметр 8, Отсюда число пи в ней=4 (да и вообще есть теорема, что для любой метрики число пибольше или равно 3 и меньше или равно 4 и для 3 тое примеры метрик есть)
Для ншей метрики L2 оно да, то иррациональное число. И где тут логика?:-)))))

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 6:14 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Цитата:
Поздравляю вас с тем, что вы только что сказали

Кстати, дорогой Sak, чтобы нам преодолеть возникающее взаимонепонимание, не могли бы Вы по-свойски объяснить лингвисту Матюшкову Вашу идею насчет словосочетаний?
Тогда станет понятнее идея с "накладывающимися" словами, ведь одно и то же слово может входить в несколько разных словосочетаний.
Я действительно думаю, что слова и словосочетания надо брать при подсчетах в реальном языке вперемешку. Ведь мы говорим-то на самом деле именно словосочетаниями...
Не говоря уже про идиоматические словосочетания, которые по сути и являются просто-напросто словами...
...
Что же касается нашего с ВАми спора насчет показателя степени чуть больше единицы, то вот поверьте - таким способом никак не добьешься сходимости...
Любой конечный текст "сходится" и без этого, просто потому что в нем количество слов конечно. А бесконечный текст не может не "расходиться", потому что в нем количество слов бесконечно. И потому для конечного текста закон Ципфа может выполняться только приблизительно.
Когда же он выполняется ТОЧНО?
Вроде бы никогда - в материальной природе же все конечно...
Я делаю отсюда вывод: любой конечный текст является конечным образом какого-то бесконечного прообраза, существующего к голове его автора. То есть, наблюдаемый нами "приблизительный", сходящийся закон Ципфа есть некое отражение точного Ципфа. обитающего где-то в мире идей :)

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 6:20 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3066
Откуда: Ensko
Солохин Максим писал(а):
Кстати, дорогой Sak, чтобы нам преодолеть возникающее взаимонепонимание, не могли бы Вы по-свойски объяснить лингвисту Матюшкову Вашу идею насчет словосочетаний?
Идея проста. Деление на слова в языках как правило произольно. Чобы понять это достаточно сравнить деление на слова в русском и польском в одних и тех же словосочетаниях типа бы и -by, замуж и za mąż и прочх примеров выше крыши , посмотреть деление на слова в немецком и нидерлдандсокм особенно на примере такого как einzuladen или не дай б-г kennezulernen:-). Кстати хоть я и не знаю украинского, таки какие-то мелкие знания естьи о нем, и его с польским сравнить тоже можно - нема и nie ma впрочем тут оно возможно обосновано - не зняяю я украинского

Отсюда ципф валиден только приблизительно и не как языковой а как некий статистический закон.

ЗЫ Я вообще сомневаюсь, что Матюшов лингвист о себе он ничегоне рассказывает а спрашивать тут как то не принято из-за оффтоика. Предпологаю, что у него техническое образование. Да я не лингвист - мехмат закончил.

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 6:43 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
есть теорема, что для любой метрики число пибольше или равно 3 и меньше или равно 4.
Для нашей метрики L2 оно да, то иррациональное число. И где тут логика?:-)))))

Знаете, дорогой Ŝak, мы с Вами невольно уперлись в философию науки. И это закономерно.
Я -- физик. Физика же - поверьте физику! - это не наука, а искусство. Физика - это искусство прикладывать математику к ркальной жизни. Вот математика - это наука. Хотя не исключено, что математики на меня обидятся и скажут: не-ет, брат, математика - это тоже искусство! Это искусство уязывать интуитивные абстрактные прозрения с порядком строгой логики.
Исследуя реальность, нельзя следовать слишком уж слепо внутренней логике математики. Как показывает опыт, только немногие из ментальных конструкций, созданных математиками, действительно оказались полезными для описания реальности. По крайней мере, ПОКА!
Я согласен, действительно! "Пи" бывает разным, иррациональным и рациональным - в разных мирах.
Но закон-то Ципфа с ТОЧНОЙ единицей, как и наше родное 3.1415926..., проявляется в нашем мире, в нашей реальности!
У нас не бывает бесконечных текстов, как не бывает точных кругов - ну и что! Мы не можем экспериментально доказать, что "пи" равно именно тому-то, потому что не бывает бесконечно точных имерений - ну и что!
Довольно с нас, что мы знаем: на самом деле "пи" именно такое, какое и есть. И о Ципфе надо помышлять так же.
Как "пи", так и Ципф - это ласточки, залетающие к нам из мира идей. Их надо ловить и приручать, а не удивляться тому, какие они странные, нереальные, не от мира сего...
И миры с другим "пи" тоже могут пригодиться. Но приложить их к реальному миру не так -то просто - это целое искусство.
И скорее всего, окажется, что они не имеют отношения к геометрии. А имеют отношение как раз-таки к какой-нибудь лингвистике или биологии.
А вот обычное родное наше "пи" - это именно геометрия. И родной наш Ципф - это лингвистика. Тут не приходится ломать голову, с какой бы энто стороны данную абстракцию приложить к реальной реальнсти! Она и так прикрасно прилагается.
:) Хотя не исключаю, что в ином каком-то мире разговаривают с Ципфом 3/2. Интересно подумать, как выглядят эти тексты... Ряд сходится, значит, в том мире язык имеет КОНЕЧНОЕ ЧИСЛО СЛОВ. Конечное и фиксированное. Значит, обитают там плоские человечки с фиксированным набором понятий.
Зато в мире, где Ципф=2/3, наоборот, ряд очень быстро расходится. И как они, бедные, там общаются, нам даже трудно представить. Наверное, там вводятся жесткие формальные правила, ограничивающие свободу говорящего улетать в иррациоанльные бездны. Чтобы у слушателей крыша не ехала... Значит, со свободой слова там беда...

_________________
Только учусь...


Последний раз редактировалось Солохин Максим Сб июн 06, 2009 6:59 am, всего редактировалось 1 раз.

Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 6:51 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
Да я не лингвист - мехмат закончил.

Когда я закончил физфак, я понял, что ошибся дверью. Мне надо было идти на мехмат. Но вот, прошли годы и годы, и я постепенно заценил физику. С возрастом я понял, что физика дает математике необходимую трезвость, привязку к реальности.
Кто умеет совместить одно с другим - тот становится БОЛЬШИМ физиком и БОЛЬШИМ математиком соответственно.
Истина где-то посередине. И возникшее в последние времна раздробление единой науки на дисциплины - это палка о двух концах...

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 7:12 am 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
Отсюда ципф валиден только приблизительно и не как языковой, а как некий статистический закон.

Обоснуйте, на чем основано Ваше убеждение. Я хочу понять.
Вот, я говорю или пишу. Почему получается Ципф?
Чисто статистически? Но ведь я говорю не случайным образом. При чем тут статистика?
Тот факт, что Ципф выходит в "речах" генератора случайных чисел", мне понятен. Это важный факт, согласен. Он проливает свет на Ципфа.
Но я же - не генератор случайных чисел!
Почему у меня получается Ципф? И у всех людей получается...

Генератор редко говорит длинные слова, потому что они статистически редки. И выходит Ципф по длинне слова.
Но почем же я, я-то говорю некоторые слова редко, а некоторые часто именно по Ципфу?!
Вот, дорогой Ŝak'! Я серьезно отношусь к Вашим заявлениям - Вы мня уже раз подловили и доказали, что Вы - серьезная фигура в этой логической игре.
Объясните мне. Почему ципф - "некий статистический закон"?

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 7:46 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3066
Откуда: Ensko
Солохин Максим писал(а):
Ŝak' писал(а):
Отсюда ципф валиден только приблизительно и не как языковой, а как некий статистический закон.

Обоснуйте, на чем основано Ваше убеждение. Я хочу понять.
Ну я уже писал тут несколько дней назад, что если взять этот форум и залезть на страницу узверей и упорядочить по числу сообщений в обратном порядке и примерно прикинуть для 10го, 20го, 30го, 40го,50го, 60го 70го то видно, что и тут идет какое-то подобие ципфа (произведение атм сначала похоже на 15 тыщ, а потои падает к 10ти) Согласен это не аргумент, но вон теоремка, котрую вы ж сами показали тоже говорит о почти ципфе. Итд итп. Все очень похоже, что причина лежит где-то в математике.
Вобще я не вижу большого смысла искать причину ципфа тем более на таком инструменте, как язык. ибо в языке сломать ципфа, разбив его так на слова, чтоб ципфа не будет как я уже показал можно. Для языков он возможно может пригодиться для расшифровки текстов, но причин надо искать имхо не в языке а в математике.

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб июн 06, 2009 21:38 pm 
Не в сети
Novico

Зарегистрирован: Пн май 25, 2009 17:45 pm
Сообщения: 98
Откуда: Московская область
Ŝak' писал(а):
Солохин Максим писал(а):
Ŝak' писал(а):
Отсюда ципф валиден только приблизительно и не как языковой, а как некий статистический закон.

Обоснуйте, на чем основано Ваше убеждение. Я хочу понять.
Ну я уже писал тут несколько дней назад, что если взять этот форум и залезть на страницу узверей и упорядочить по числу сообщений в обратном порядке и примерно прикинуть для 10го, 20го, 30го, 40го,50го, 60го 70го то видно, что и тут идет какое-то подобие ципфа (произведение атм сначала похоже на 15 тыщ, а потои падает к 10ти) Согласен это не аргумент, но вон теоремка, котрую вы ж сами показали тоже говорит о почти ципфе. Итд итп. Все очень похоже, что причина лежит где-то в математике. Вобще я не вижу большого смысла искать причину ципфа тем более на таком инструменте, как язык. Для языков он возможно может пригодиться для расшифровки текстов, но причин надо искать имхо не в языке а в математике.

Пусть статистика! Хорошо!
Но ведь статистика - это не просто фокус-покус.
Я понимаю, почему отклонение от среднего распределено по Гауссу. Достаточно доказать, что сумма многих случайных величин стремится к Гауссу, когда число этих величин растет.
А как быть с Ципфом?
Какую ввести статистическую гипотезу относительно нашего форума, чтобы объяснить тот факт, что число сообщений каждогоо участника подчинено Ципфу?
Как Вам такая гипотеза: существует лента, назовем ее лента судьбы, на которой случайным образом появляются буквы. У каждого человека, живущего на земле, имеется свое кодовое имя. Когда буквы случайным образом складываются в его имя, человек садится за комп. и стучит сообщение на этот форум.
Легко доказать, что в этом случае будет Ципф.
Будучи физиком, я делаю отсюда заключение: либо Лента Судьбы действительно существует, и закон Ципфа является экспериментальным доказательством этого факта - либо надо искать другого объяснения...
Как Вам моя теория Ленты Судьбы?
Не нравится? Предложите какую-ниюудь другую! ТОлько чтобы из нее выводился Ципф.

Цитата:
в языке сломать ципфа, разбив его так на слова, чтоб ципфа не будет как я уже показал можно.
А тогда он выскочит в словосочетаниях, как в токипоне. Ан выскочит-таки...

_________________
Только учусь...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс июн 07, 2009 14:51 pm 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср мар 02, 2005 13:43 pm
Сообщения: 3066
Откуда: Ensko
Тут гланое правильно составить матмодель. А как - не имею понятия... Вон одна матмодель в задаче разбирлась, на которую вы ссылку дали...

_________________
Malfacila kaj tre trista estas vivo programista.


Вернуться к началу
 Профиль  
Ответить с цитатой  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 57 ]  На страницу Пред.  1, 2, 3  След.

Часовой пояс: UTC + 3 часа


Похожие темы форума | Similaj temoj en la forumo
 Темы   Автор   Ответы   Просмотры   Последнее сообщение 
В этой теме нет новых непрочитанных сообщений. Частотность словосочетаний и закон Ципфа

[ На страницуНа страницу: 1, 2 ]

palaman

42

17330

Вс июл 15, 2012 12:15 pm

Матюшов Перейти к последнему сообщению

Эта тема закрыта, вы не можете редактировать и оставлять сообщения в ней. Закон элементарных артикуляций, алфавит Симметрица и др.

[ На страницуНа страницу: 1, 2, 3 ]

valenok

49

24949

Чт окт 08, 2009 5:20 am

Sxak' Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. Монгольские языки

barkist

0

3455

Пн май 17, 2004 15:00 pm

barkist Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. Языки в Европе (вот она правда)

Sergej Ch

19

11184

Вт янв 27, 2004 14:31 pm

Erinaceus Перейти к последнему сообщению

 


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 3


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
News News Plan de site Plan de site SitemapIndex SitemapIndex Flux RSS Flux RSS Liste des flux Liste des flux
Создано на основе phpBB® Forum Software © phpBB Group