Список форумов

Esperanto новости

Форум об эсперанто и языках вообще

Избранное:
En Esperanto: UEA :: REU :: Vikipedio :: Libera Folio
По-русски: Esperanto новости :: Что такое эсперанто? :: Курс эсперанто по эл. почте


Сейчас Чт май 23, 2019 9:42 am

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 4 ] 
Автор Сообщение
СообщениеДобавлено: Чт июн 24, 2010 16:59 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Пн май 28, 2007 17:06 pm
Сообщения: 155
Рассмотрим язык Токипона. Часто встречающиеся обороты захламляют речь, т.к. требуют для выражения понятия множества слов. Например, "tenpo sike suno wan" для "год" или "tenpo mun pi nanpa luka luka tu" "декабрь" (можете попробовать пример лучше). Предположим, что оптимально для краткости изложения языку иметь много маленьких корней. Всех их нужно ещё придумать.

Идея (пока даже не проект):
1) определить "Базу", т.е. набор элементарных понятий с правилами построения смысла;
2) определить "Результирующий язык", в котором есть возможность к существованию множества "корней"
3) определить функцию перехода смыслов базы в корень результирующего языка.

Базой может служить любой простой и логичный язык. Лучше (наверное) с маленьким словарём.
Итоговый язык тоже может быть очень даже разным.
Функция перехода определяется, во-первых, через базу и итог; через возможность обращения, т.е. определения изначальных слов по результату.

Кажется, обратимые функции - не смогут привести к значительному увеличению краткости языка. Для необратимых есть проблема возникновения омонимов. (Рассматриваются простые случаи.)

У хорошей функции похожие по смыслу слова будут звучать весьма по-разному.

Дальше простейший пример. База - Токипона. Функция перехода: слова словаря Токипоны нумеруются, дальше берём хэш:
hash = firstWord;
hash = 7 * hash + secondWord;
hash = 7 * hash + thirdWord;
...
Получаем число, допустим 24 бит. Для краткости можно откинуть первых 8, останется 16.
Допустим, у нас есть 16 условно-согласных и 16 условно-гласных. Например, "бвгджзклмнпрстфх" для согласных, а-о-у-э-ы-я-ё-ю-е-и-ау-ай-ой-эй-уй для "гласных".

tenpo mun pi nanpa luka luka tu
tenpo = 111 tu = 114 luka = 48 mun = 61 nanpa = 65 pi = 81
(((((111 * 7 + 61) * 7 + 81) * 7 + 65) * 7 + 48 ) * 7 + 48 ) * 7 + 114 = 14303844 = в двоичной: 110110100100001001100100
Откидываем лишние знаки: 0100001001100100. Разбиваем на буквы: 0100 0010 0110 0100. Берём согласные и гласные по порядку: д о з э. Складываем: дозэ.
Т.е. для 7 слов токипоны (11 слогов) подряд вычислили обозначение в два простых слога.

Вопросы: чем этот метод плох? Почему неприменим? Почему вообще не стоит думать на эту тему? :)

P.S. Примеры взяты простые, не стоит судить по ним.


Вернуться к началу
 Профиль  
Ответить с цитатой  

 Заголовок сообщения:
СообщениеДобавлено: Вс июн 27, 2010 15:01 pm 
Не в сети
Fervora Forumano
Fervora Forumano
Аватара пользователя

Зарегистрирован: Вс июн 01, 2008 12:25 pm
Сообщения: 1339
Ничем не плох. Практичности маловато просто. :)

_________________
Не бывает ни чисто белого, ни чисто чёрного. Однако жить, навешивая ярлыки, куда проще.
За разнообразие в мире языков: http://vk.com/lingvomir


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб сен 04, 2010 21:16 pm 
Не в сети
Novico

Зарегистрирован: Сб июн 21, 2008 17:45 pm
Сообщения: 14
Откуда: Вел. Новгород / СПб
Данный конкретный хэш-код плох тем, что при замене k-го по словарю слова на (k+7)-е результат не меняется.
Наверно, можно придумать хэш-код получше. Единственное, непонятно, как в разговоре вычислять такую функцию, и тем более — как обращать (или этого не предполагается?).

Я тоже как-то над такими вещами думал. Удобной функцией могло бы стать выкидывание некоторых букв, при котором остальные буквы переставляются или модифицируются в зависимости от выкинутых.
Другой вариант — «таблица сложения». Например, представим язык с пятью гласными и шестью согласными и пронумеруем их:
А=0, О=1, Е=2, У=3, И=4 (mod 5);
К=0, П=1, Р=2, Н=3, С=4, Т=5 (mod 6).
Пусть все слова имеют вид «СГСГС». Пусть дано словосочетание из небольшого количества слов (если слов много, то можно выделить более короткие словосочетания). Как сжать это сочетание в слово? Очень просто: складываем поразрядно и берём остаток от деления на 5 (для гласных) или 6 (для согласных):
Код:
Р + К -> 2+0 =2 -> Р
О + У -> 1+3 =4 -> И
П + П -> 1+1 =2 -> Р
О + О -> 1+1 =2 -> Е
Т + Н -> 5+3 =8 -> =2 -> Р

РОПОТ + КУПОН = РИРЕР

Кстати, если в одном из слов изменить одну букву, то результат обязательно изменится.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб сен 11, 2010 11:50 am 
Не в сети
Plenrajta Forumano

Зарегистрирован: Пн май 28, 2007 17:06 pm
Сообщения: 155
Qwertic писал(а):
Данный конкретный хэш-код плох тем, что при замене k-го по словарю слова на (k+7)-е результат не меняется.
Наверно, можно придумать хэш-код получше.


Разговор получается несколько более математическим, чем лингвистическим :)

Но вы неправильно понимаете этот хэш-код. Допустим, есть два слова, 5 и 10. 5*7+10=45. Заменим первое слово на отстоящее на 7, 12. 12*7+10 = 94. Заменим второе слово на отстоящее на 7, допустим, 3. 5*7+3=38. Т.е. для такой операции получаем всегда разные хэши.

Результат остаётся тем же, если одно слово мы меняем на 7, а соседнее на 1. Но это уже совсем другое словосочетание. С этой проблемой можно до какой-то степени бороться, выбрав другое простое число, например, 31.

Qwertic писал(а):
Единственное, непонятно, как в разговоре вычислять такую функцию, и тем более — как обращать (или этого не предполагается?).


Гипотетически, много общения происходит в интернете. Соответственно можно иметь под рукой приложение-кодировщик. Можно иметь и раскодировщик – некую БД, хранящую возможные значения для этого хэша. С возможностью пользователя выбирать, какие варианты расшифровки являются "бредовыми".

Вообще же я предполагал, что оно будет больше использоваться как корни, т.е. запоминаться, а не вычисляться. Ведь вычислить даже простой хэш в уме в режиме реального времени (в ходе разговора) нереально.

Есть только совсем примитивный и распространённый вид хэша: аббревиатуры.


Вернуться к началу
 Профиль  
Ответить с цитатой  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 4 ] 

Часовой пояс: UTC + 3 часа


Похожие темы форума | Similaj temoj en la forumo
 Темы   Автор   Ответы   Просмотры   Последнее сообщение 
В этой теме нет новых непрочитанных сообщений. Гениальная идея для конлангеров

palaman

13

4616

Чт май 31, 2012 22:33 pm

dragun97yu Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. Конланг на основе иероглифической письменности: сырая идея

[ На страницуНа страницу: 1, 2 ]

Солохин Максим

26

13836

Пт июн 12, 2009 14:49 pm

Hemulo Перейти к последнему сообщению

 


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
News News Plan de site Plan de site SitemapIndex SitemapIndex Flux RSS Flux RSS Liste des flux Liste des flux
Создано на основе phpBB® Forum Software © phpBB Group