Список форумов

Esperanto новости

Форум об эсперанто и языках вообще

Избранное:
En Esperanto: UEA :: REU :: Vikipedio :: Libera Folio
По-русски: Esperanto новости :: Что такое эсперанто? :: Курс эсперанто по эл. почте


Сейчас Пт мар 22, 2019 3:43 am

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 54 ]  На страницу Пред.  1, 2, 3  След.
Автор Сообщение
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 8:51 am 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Вт ноя 15, 2005 2:27 am
Сообщения: 417
Откуда: Москва
palaman писал(а):
Если же устранить мечту об идеальном языке и искать реального и удачного компромисса между несовместимыми требованиями, то Эсперанто - это в своем роде идеальный компромисс.
(Хотя "компромисс" - это понятие по сути противоположное понятию "идеал")


Не совсем. Если это и компромисс, то не только между несовместимыми требованиями, но и (в большей степени) между желанием сделать как лучше и всякого рода случайностями, незнанием, стереотипами, заблуждениями. Т.е. что я хочу сказать - далеко не все из внутренних проблем языка эсперанто являются неизбежным следствием именно противоречивых требований к языку как таковых, многие моменты совершенно произвольны, и не имеют никаких ни обоснований, ни лингвистической, ни даже "технологической" необходимости. Например, согласование прилагательных/числительных/причастий по числу и падежу, например, фактический отказ от личного местоимения 2-го лица ед. числа, например, странная ситуация с родом (3 личных местоимения 3 л. ед. ч., и явное выражение женского рода несимметричным с мужским родом способом).

_________________
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
ТРЕЗВОСТЬ - НОРМА ЖИЗНИ


Вернуться к началу
 Профиль  
Ответить с цитатой  

 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 12:09 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
palaman писал(а):
Разные языки требую разных уточнений для однозначности (и даже вообще возможности )перевода. Значит ли это, что при переводе на наш машинный язык каждый пользователь должен каждый раз уточнять ВСЕ тонкости того, что именно он собирался выразить? все тонкости, необходимые для потенциально возможного перевода на все языки Вселенной?!

Да, значит. В разумных пределах, разумеется. Хомо сапиенс вообще должен думать, что он хочет сказать, когда говорит (точно формулируем свои мысли). Также он должен думать, зачем (с какой целью) он пишет и для кого (сможет ли понять целевая аудитория). И "среда разработки" искусственного языка, и сам искусственный язык должны интенсивно помогать писателю в этом.
Toman писал(а):
Ну вот - начали за здравие, а теперь уже на грамматический род соглашаетесь...

Род одушевлённого существительного можно рассматривать как дополнительную полезную информацию.
Toman писал(а):
Martin писал(а):
Моя мысль состоит в том, чтобы сделать искусственный язык практически полезным почти сразу же, без титанических усилий и затрат времени со стороны пользователя. Имхо, это единственный способ не родить мертвеца.

Однако это, боюсь, невозможно. По крайней мере, если иметь в виду создание текстов без специального словаря в руках.

Имеется в виду создание текстов только со специальным словарём в руках (даже более того — со специальным софтом для интерактивного конструирования текстов в руках, см. самый первый пост в этой теме). Искусственный язык выживет только в том случае, если конечному пользователю его не надо будет учить месяцами и годами.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 13:10 pm 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср июл 22, 2009 22:01 pm
Сообщения: 3054
Откуда: Россия
Martin писал(а):
palaman писал(а):
Разные языки требую разных уточнений для однозначности (и даже вообще возможности )перевода. Значит ли это, что при переводе на наш машинный язык каждый пользователь должен каждый раз уточнять ВСЕ тонкости того, что именно он собирался выразить? все тонкости, необходимые для потенциально возможного перевода на все языки Вселенной?!

Да, значит. В разумных пределах, разумеется. Хомо сапиенс вообще должен думать, что он хочет сказать, когда говорит (точно формулируем свои мысли). Также он должен думать, зачем (с какой целью) он пишет и для кого (сможет ли понять целевая аудитория). И "среда разработки" искусственного языка, и сам искусственный язык должны интенсивно помогать писателю в этом.


Хорошо! Тогда предлагаю вариант, как должен выглядеть интерфейс программы.
Печатаю ей предложение на русском языке.
Она тут же переводит его туда и обратно на русский язык, намеренно максимально искажая мой текст, но таким образом, чтобы показать как МОЖЕТ быть понято данное предложение, учитывая неоднозначность русского языка. Выдает десять-двадцать вариантов неправильного понимания (являющегося, впрочем, вполне возможным для иностранца), однако среди них и варианты вполне приемлемые.
Я отбрасываю варианты неприемлемые, тем самым указывая ей, что именно имел в виду.
То есть, перевод осуществляется в диалоговом режиме, причем сам автор текста (я, то есть) уточняет, какой вариант он имел в виду.


Цитата:
Искусственный язык выживет только в том случае, если конечному пользователю его не надо будет учить месяцами и годами.
Речь тут, как я теперь вижу, идет не о языке, который можно было бы выучить, а именно о создании программы перевода на иные языки. Внутренний язык машины, на который она осуществляет перевод, не предназначен для говорения.
То есть, учить вообще не надо.
Печатаешь текст, отбрасываешь "баги", копошащиеся в родном языке, которые обычно не осознаются, однако тут же выявляются программой - и получаешь готовый перевод твоего текста на сто пятьдесят языков планеты.
Впрочем, переводить на один какой-либо язык легче, если он семантически родственный (русский и немецкий), так как там многое можно не уточнять. Оставлять баги, пусть ползают...
Можно сделать в программе опцию: ограничение возможных языков, на ктороые будет переводиться текст.

Итак, суть проекта: надо создать программу, которая выявляла бы неоднозначности твоего текста и помогала уточнять, что имеет в виду автор.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 13:26 pm 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср июл 22, 2009 22:01 pm
Сообщения: 3054
Откуда: Россия
Toman писал(а):
далеко не все из внутренних проблем языка эсперанто являются неизбежным следствием именно противоречивых требований к языку как таковых, многие моменты совершенно произвольны, и не имеют никаких ни обоснований, ни лингвистической, ни даже "технологической" необходимости... например, фактический отказ от личного местоимения 2-го лица ед. числа, например, странная ситуация с родом (3 личных местоимения 3 л. ед. ч., и явное выражение женского рода несимметричным с мужским родом способом).
ПРиведенные Вами примеры свидетельствуют скорее иное: если проблемы Эсперанто всего лишь таковы, то язык весьма хорошо. Это разве ж проблема? Конечно, нулевой суффикс мужского рода - это неудобно, так как его трудно отличить от отсутствия суффикса. Но это мелочь. И объясняется эта мелочь как раз компромиссом: д-р Эсперанто ведь стремился к тому, чтобы как слова языка были взяты из существующих языков. А использованные им языки в большинстве как раз таким недостатком и обладают.


Цитата:
Например, согласование прилагательных/числительных/причастий по числу и падежу,
Это более серьезная претензия. Но она тоже объясняется компромиссом: доктор хотел, чтобы порядок слов в языке был максимально свободным, чтобы пользователь мог использовать любой, привычные ему порядок слов, оставаясь при этом понятным для собеседника.
Но за свободный порядок слов надо платить согласованиями.
Kutime interesaj ideoj mulajn diskusiojn naskas.
Kutime interesaj ideoj multaj diskussiojn naskas.
Если не согласовывать , то как понять, чего много - идей или порождаемых дискуссий?
Между тем, порядок слов в примере вполне естественный, как для меня, русского, так и для тюркоязычного человека (если я "въехал" в их сверхжесткий порядок слов).


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 16:09 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
palaman писал(а):
Речь тут, как я теперь вижу, идет не о языке, который можно было бы выучить, а именно о создании программы перевода на иные языки. Внутренний язык машины, на который она осуществляет перевод, не предназначен для говорения.
То есть, учить вообще не надо.

Не совсем так. Речь о языке. Он не предназначен для говорения, но это и не "внутренний" язык машины — пишет на этом языке человек. Именно поэтому этот язык должен походить на английский, являющийся международным языком де факто. Учить этот искусственный язык надо, но совершенно "не критично", т.к. должен быть софт, который помогает конструировать текст. Скажем, вы можете не знать HTML, но успешно конструировать Web-страницы с помощью софта. Но можете и хорошо знать HTML, и конструировать Web-страницы в Блокноте. Можете также знать HTML "немного", и конструировать Web-страницы частично обоими способами.
palaman писал(а):
Печатаешь текст, отбрасываешь "баги", копошащиеся в родном языке, которые обычно не осознаются, однако тут же выявляются программой - и получаешь готовый перевод твоего текста на сто пятьдесят языков планеты.

Если речь идёт о составлении текста на искусственном языке, то именно так.
palaman писал(а):
Итак, суть проекта: надо создать программу, которая выявляла бы неоднозначности твоего текста и помогала уточнять, что имеет в виду автор.

Нет :). Надо создать искусственный язык, а затем написать софт, о котором сказано в первом посте этой темы. Всего-то и делов :zam:.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 16:16 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Аналогия такова:

1. Язык Си => Машинные коды (этот процесс, который без проблем автоматизируется — компиляция).
2. Машинные коды => Язык Си (это проблематично автоматизировать).

1. Искусственный язык => Естественный язык (этот процесс, который автоматизируется).
2. Естественный язык => Искусственный язык (это проблематично автоматизировать).


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 16:41 pm 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Вт ноя 15, 2005 2:27 am
Сообщения: 417
Откуда: Москва
palaman писал(а):
ПРиведенные Вами примеры свидетельствуют скорее иное: если проблемы Эсперанто всего лишь таковы, то язык весьма хорошо.
Во-первых, это не исчерпывающий список, так что не всего лишь. Во-вторых, я и не говорю, что всё плохо - а просто что не все спорные моменты являются осознанным компромиссом ради какого-то качества.
Цитата:
Это разве ж проблема? Конечно, нулевой суффикс мужского рода - это неудобно, так как его трудно отличить от отсутствия суффикса. Но это мелочь. И объясняется эта мелочь как раз компромиссом: д-р Эсперанто ведь стремился к тому, чтобы как слова языка были взяты из существующих языков. А использованные им языки в большинстве как раз таким недостатком и обладают.

А вот это вообще не оправдание. Если оправдывать всё тем, что в каких-то близко знакомых языках тоже всё криво и нелогично в каком-то месте грамматики, то можно было автору языка вообще не браться за работу и не создавать новый язык, а пользоваться каким-нибудь существующим. Очевидно, целью-то было создать всё-таки по возможности более удобный язык.
Цитата:


Цитата:
Например, согласование прилагательных/числительных/причастий по числу и падежу,
Это более серьезная претензия. Но она тоже объясняется компромиссом: доктор хотел, чтобы порядок слов в языке был максимально свободным, чтобы пользователь мог использовать любой, привычные ему порядок слов, оставаясь при этом понятным для собеседника.
Но за свободный порядок слов надо платить согласованиями.
Kutime interesaj ideoj mulajn diskusiojn naskas.
Kutime interesaj ideoj multaj diskussiojn naskas.
Если не согласовывать , то как понять, чего много - идей или порождаемых дискуссий?
Между тем, порядок слов в примере вполне естественный, как для меня, русского, так и для тюркоязычного человека (если я "въехал" в их сверхжесткий порядок слов).


Однако, это - частный случай. Здесь у нас выбор между подлежащим в "нейтральном" падеже и прямым дополнением в винительном. Как только у нас появится другое существительное в "нейтральном" падеже вместо винительного, или нам приспичит прямое дополнение определять причастным оборотом с другим прямым дополнением... то нам никакое согласование не поможет. Более того, от этой напасти не помогает и жёсткий порядок слов как таковой (имеется в виду, не гарантирует разрешения неоднозначности, хотя в простых случаях может и помочь). Достаточно посмотреть на цепочечные конструкции английского/немецкого языка или тех же самых тюркских. Равно как и в эсперанто, кстати.

Реально разрешить проблему могут только скобочные конструкции. Однако в явном полноценном виде мало в каких языках они есть. Где-то они с жёстким ограничением уровня вложенности как-то отображаются на письме и/или в устной речи, где-то отображаются фактически только в устной речи - интонациями и ритмикой - но и это имеет какие-то пределы вложенности, тоже довольно небольшие, типа 2 уровней, например.

_________________
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
ТРЕЗВОСТЬ - НОРМА ЖИЗНИ


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 19:04 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Моё предолжение несколько другое - итоговый файл представляет из себя xml-документ. Если выбрасываем теги - получаем текст на языке оригинала. Если расставлены все теги, тескт можно восстановить исходя из них.
Имена тегов, аттрибутов, значениий аттрибутов - на одном из уже существующих языков, мы можем выбрать для этого эсперанто, но в коммерческом проекте, скорее всего, будет английский.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 19:46 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Матюшов писал(а):
Моё предолжение несколько другое - итоговый файл представляет из себя xml-документ. Если выбрасываем теги - получаем текст на языке оригинала. Если расставлены все теги, тескт можно восстановить исходя из них.

А кто и в какой момент расставляет теги? Ведь это работа, требующая недюжинной квалификации, и поручить её машине так же сложно, как осуществить безошибочный перевод с одного естественного языка на другой естественный.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 23:28 pm 
Не в сети
Fervora Forumano
Fervora Forumano
Аватара пользователя

Зарегистрирован: Вс июн 01, 2008 12:25 pm
Сообщения: 1339
palaman писал(а):
Хочу высказать одну идею в копилку лингвистических идей.
Давайте рассмотрим любое слово, которое может обозначать несколько разных понятий, как семантическое местоимение. А именно, оно заменяет собой конкретные обозначения каждого из этих понятий.
Например, слово "зверь" - это местоимение, обозначающее собаку, кошку, крысу и двугих зверей.
...
Не являются местоимениями имена собственные, уникальные. Они обозначают только то, что они обозначают, и не замещают собой каких-либо иных понятий.
НО есть такие имена собственные, которые используются омонимически, для обозначения разных объектов.
Такие имена собственные - это семантические артикли.

Поздравляю, коллега, вы только что самостоятельно вывели разницу между именами нарицательными и собственными. :)

Toman писал(а):
Т.е. что я хочу сказать - далеко не все из внутренних проблем языка эсперанто являются неизбежным следствием именно противоречивых требований к языку как таковых, многие моменты совершенно произвольны, и не имеют никаких ни обоснований, ни лингвистической, ни даже "технологической" необходимости. Например, согласование прилагательных/числительных/причастий по числу и падежу, например, фактический отказ от личного местоимения 2-го лица ед. числа, например, странная ситуация с родом (3 личных местоимения 3 л. ед. ч., и явное выражение женского рода несимметричным с мужским родом способом).

Томан, я очень рад снова видеть вас на этом форуме. На ЛФ не подумываете возвращаться?

Toman писал(а):
Однако, это - частный случай. Здесь у нас выбор между подлежащим в "нейтральном" падеже и прямым дополнением в винительном. Как только у нас появится другое существительное в "нейтральном" падеже вместо винительного, или нам приспичит прямое дополнение определять причастным оборотом с другим прямым дополнением... то нам никакое согласование не поможет. Более того, от этой напасти не помогает и жёсткий порядок слов как таковой (имеется в виду, не гарантирует разрешения неоднозначности, хотя в простых случаях может и помочь). Достаточно посмотреть на цепочечные конструкции английского/немецкого языка или тех же самых тюркских. Равно как и в эсперанто, кстати.
Реально разрешить проблему могут только скобочные конструкции. Однако в явном полноценном виде мало в каких языках они есть. Где-то они с жёстким ограничением уровня вложенности как-то отображаются на письме и/или в устной речи, где-то отображаются фактически только в устной речи - интонациями и ритмикой - но и это имеет какие-то пределы вложенности, тоже довольно небольшие, типа 2 уровней, например.

И снова полностью поддерживаю Томана. Классический пример - "Al urbo bela homo venis". Согласование может спасти, может не спасти, но язык загромоздит в любом случае.

Введение же в язык скобок моментально превращает его в чисто машинный. Если примеры открывающих скобок в языках довольно популярны (что, que, ke, das, that и т.п.), то вместо закрывающей паузы произносить закрывающую скобку - нууу...

Martin писал(а):
1. Искусственный язык => Естественный язык (этот процесс, который автоматизируется).
2. Естественный язык => Искусственный язык (это проблематично автоматизировать).

С этим я бы поспорил. Далеко не факт, что первое проще.

_________________
Не бывает ни чисто белого, ни чисто чёрного. Однако жить, навешивая ярлыки, куда проще.
За разнообразие в мире языков: http://vk.com/lingvomir


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 0:02 am 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Artem писал(а):
Martin писал(а):
1. Искусственный язык => Естественный язык (этот процесс, который автоматизируется).
2. Естественный язык => Искусственный язык (это проблематично автоматизировать).

С этим я бы поспорил. Далеко не факт, что первое проще.

Ну так спорьте :).


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 3:51 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср июл 22, 2009 22:01 pm
Сообщения: 3054
Откуда: Россия
Artem писал(а):
Поздравляю, коллега, вы только что самостоятельно вывели разницу между именами нарицательными и собственными. :)
Хочу уточнить. Я не у курсе, pardonu al mi! Артикли давно считаются именами собственными? Местоимения давно относят к именам нарицательным?

Toman писал(а):
Однако, это - частный случай. Здесь у нас выбор между подлежащим в "нейтральном" падеже и прямым дополнением в винительном. Как только у нас появится другое существительное в "нейтральном" падеже вместо винительного, или нам приспичит прямое дополнение определять причастным оборотом с другим прямым дополнением... то нам никакое согласование не поможет. Более того, от этой напасти не помогает и жёсткий порядок слов как таковой (имеется в виду, не гарантирует разрешения неоднозначности, хотя в простых случаях может и помочь). Достаточно посмотреть на цепочечные конструкции английского/немецкого языка или тех же самых тюркских. Равно как и в эсперанто, кстати.
Реально разрешить проблему могут только скобочные конструкции. Однако в явном полноценном виде мало в каких языках они есть. Где-то они с жёстким ограничением уровня вложенности как-то отображаются на письме и/или в устной речи, где-то отображаются фактически только в устной речи - интонациями и ритмикой - но и это имеет какие-то пределы вложенности, тоже довольно небольшие, типа 2 уровней, например.
Убедительно.

Artem писал(а):
И снова полностью поддерживаю Томана. Классический пример - "Al urbo bela homo venis". Согласование может спасти, может не спасти, но язык загромоздит в любом случае.
Введение же в язык скобок моментально превращает его в чисто машинный. Если примеры открывающих скобок в языках довольно популярны (что, que, ke, das, that и т.п.), то вместо закрывающей паузы произносить закрывающую скобку - нууу...

Пример не совсем удачный, так как тут все равно по логике нужен артикль (ведь не о ВСЯКОМ человеке речь...), который и разрешает проблему
Al urbo bela la homo venis.
Al urbo la bela homo venis.
Но я понимаю, в чем проблема. Проблема есть, это ясно и без примеров.
У меня есть идея.
...
Давайте сначала заменим все падежи предлогами (или послелогами) - все равно без оных не обходится ни один язык. ВВедем даже (ну, факультативный) предлог для обозначения именительного падежа, не говоря уже о винительном.
Типа Al urbo bela tan homo venis.
Tan - показатель именительного падежа. Обычно именительный падеж обозначается отсутствием предлогов и вообще чего-либо. Но это произвольно ведь. Мне удобнее пока опустить именительный в ряд с прочими.
Винительный будет обозначаться предлогом ta
tan la homo venis = la homo venintas
tan tio ta oni faras = Tio faritas de oni = Tio faritas tan oni
Ну, это потом можно рассмотреть отдельно - пока так, просто для закругленности идеи. Может, это и не обязательно....

Введем также особый предлог для обозначения предиката, к которому мы относим все эти падежи.
Al urbo bela tan homo is ven'.
Ну, выглядит странно, но пусть пока будет выглядеть так.

А затем введем новую грамматическую конструкцию. Назовем ее вложенные падежи или составные предлоги. Вот как это будет выглядеть:
Al urbo beligita per-al laboro de-per-al multa generacioj tan homo konata de-tan ni is ven'.
В город, украшенный трудами многих поколений, человек, которого мы знаем, приехал.

Такие составные предлоги заменяют скобки.
Количество элементарных предлогов, сложенных вместе, прямо показывает глубину вложенности (количество открытых и еще не закрытых скобок).
То есть, по умолчанию, появление нового предлога означает, что все открытые скобки закрываются. Предлог (составной) заново их открывает на нужную глубину.

Нравится?
Конечно, для устной речи это выглядит слегка громоздко. Но для внутреннего компьютерного языка очень даже ничего, по-моему...

Цитата:
Martin писал(а):
1. Искусственный язык => Естественный язык (этот процесс, который автоматизируется).
2. Естественный язык => Искусственный язык (это проблематично автоматизировать).

С этим я бы поспорил. Далеко не факт, что первое проще.
Мне тоже кажется, что проще.


Последний раз редактировалось palaman Вс окт 18, 2009 5:21 am, всего редактировалось 1 раз.

Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 11:15 am 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Martin писал(а):
1. Искусственный язык => Естественный язык (этот процесс, который автоматизируется).
2. Естественный язык => Искусственный язык (это проблематично автоматизировать).

Эсперанто - искусственный язык. Но перевод в обоих направлениях примерно одинаково сложен.

palaman писал(а):
Давайте сначала заменим все падежи предлогами (или послелогами) - все равно без оных не обходится ни один язык. ВВедем даже (ну, факультативный) предлог для обозначения именительного падежа, не говоря уже о винительном.
Типа Al urbo bela tan homo venis.
...

Зачем коверкать язык? Всё равно, этот промежуточный язык, как многие здесь уже согласились, не для разговоров.

Код:
(frazo)
  (komlemento)
     (prepozicio)Al (/prepozicio)
     (objekto)
       urbo
       (epiteto)bela(/epiteto)
     (/objekto)
  (/komlemento)
  (subjekto)homo(/subjekto)
  (predikato)venis(/predikato)
(/frazo)

(угловые скобки заменены на круглые, поскольку вводить их здесь трудно)
Кроме того, это не те теги которые более нужны - они относятся к грамматике конкретного языка.
Вводить их будет программа по указанию пользователя, и отображать графически (например, "al urbo bela" будет обведено прямоугольником.
Скажите что получится слишком большой файл? Может быть разработан более компактный двоичный формат, который компьютер может взаимно однозначно преобразовывать в xml.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 11:45 am 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Матюшов писал(а):
Эсперанто - искусственный язык. Но перевод в обоих направлениях примерно одинаково сложен.

Но я же говорю не об эсперанто, а о предельно формализованном искусственном языке, который должен быть спроектирован именно таким образом, чтобы по максимуму исключить неоднозначности (см. первый пост в этой теме).
Матюшов писал(а):
Зачем коверкать язык? Всё равно, этот промежуточный язык, как многие здесь уже согласились, не для разговоров.

И тем не менее, он для письма, и поэтому должен быть достаточно "гуманизированным". Теги XML слишком громоздки для непосредственного восприятия (а вот размер файла, думаю, проблемой не является).
Матюшов писал(а):
Вводить их будет программа по указанию пользователя, и отображать графически (например, "al urbo bela" будет обведено прямоугольником.

Такой пользователь должен обладать слишком большой лингвистической квалификацией. Разобраться в подлежащих-сказуемых предельно формализованного искусственного языка на порядок легче, чем в тех же явлениях любого естественного языка. Такой искусственный язык и должен быть составлен таким образом, чтобы это было легко.

Кстати, идея о замене падежей предлогами или чем-то подобным — имхо, отличная. Это позволяет сделать язык более "дискретным". Принцип "раздели на части, чтобы проанализировать" — важнейший принцип человеческого мышления. Вообще, очень многие языковые явления и конструкции, наверное, было бы удобно определять с помощью специальных коротких служебных слов.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 12:07 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Не хотите xml - можно имитировать обычный язык программирования, получится что-то вроде этого:
Код:
homo.iras(al:urbo{bela});


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 12:40 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Хотя... Попытаюсь сформулировать идею по-другому. Итак, наша проблема — улучшить на порядок качество машинного перевода.

Допустим, все искусственные языки идут лесом, работаем с естественными языками. Например, пишем по-русски и пытаемся сделать этот текст "доступным" автомату-переводчику на какой-то другой произвольный язык.

Действительно, идея XML-тегов выглядит привлекательно. Размечаем тегами структуру каждого предложения. Громоздкость тегов возможно и не важна, если есть софт, который в состоянии адекватно отобразить такой документ (когда теги будут отображены подчёркиваниями, цветами, рамками и т.п.). Трудность такой разметки для нелингвиста-пользователя — да, есть. Но её можно попытаться компенсировать принципом "выражайся проще, и люди к тебе потянутся" :zam:.

Дальше есть проблема многозначности лексики. Решается теми же тегами — в специальных тегах даём ссылку на раздел словарной статьи специального толкового словаря. Здесь софт может существенно помочь писателю, найдя слова, которые этого требуют, автоматически.

Автомат-переводчик должен обладать точной копией именно этого толкового словаря (здесь правообладатели из разных стран будут ставить палки в колёса техническому прогрессу :zam:).


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 12:43 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
В C# для использования ключевого слова в качестве идентификатора используется префикс @. В нашем случае удобнее наоборот, ставить @ перед ключеыми словами. Тогда мы можем иметь синонимические ключевые слова @vortaro, @dictionary, @словарь. В начале пользователь должен подключить нужные словари, после чего может использовать слова из них в своём тексте. Также он может опредилить свой словарь. Если слово есть в нескольких словарях, он должен уточнить из какого словаря его брать. Можно подключить словарь только для фрагмента текста.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 13:04 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Итак у нас есть два подхода: теги xml или язык, похожий на обычный язык программирования. Но возможно их сочетание.
xml используется для перевода, специальный язык - для составления словарей.
Если вы умеете программировать, можете посмотреть как подобный подход работает применительно к пользовательскому интерфейсу в Windows Presentation Framework. Там есть язык пользовательского интерфейса XAML, основанный на XML, позволяющий определить довольно сложный пользоваельский интефейс, включающий в себя анимацию. Когда XAML не хватает, используется C#.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 13:26 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Матюшов писал(а):
Итак у нас есть два подхода: теги xml или язык, похожий на обычный язык программирования. Но возможно их сочетание.
xml используется для перевода, специальный язык - для составления словарей.
Если вы умеете программировать, можете посмотреть как подобный подход работает применительно к пользовательскому интерфейсу в Windows Presentation Framework. Там есть язык пользовательского интерфейса XAML, основанный на XML, позволяющий определить довольно сложный пользоваельский интефейс, включающий в себя анимацию. Когда XAML не хватает, используется C#.

XAML — это диалект XML для разметки пользовательского интерфейса. Но мы здесь обсуждаем проблемы совсем не пользовательского интерфейса :). На чём писать софт — в нашем случае вопрос десятый. Я так понимаю, суть дискуссии в том, возможно ли в принципе сделать качественный скачок в машинном переводе и какими идеями руководствоваться при этом.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 17:31 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Да, XAML - это языка для разметки пользовательского интерфейса, но я не предлагал ничего писать именно на нём, а только ознакомиться с идеями, применёнными там. (стили, шаблоны, триггеры, словари, анимация и т. д.) То, что раньше приходилось программировать, теперь можно описать с помощью разметки. Эти идеи (в изменённом виде) можно использовать и в программе-переводчике.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс окт 18, 2009 21:31 pm 
Не в сети
Fervora Forumano
Fervora Forumano
Аватара пользователя

Зарегистрирован: Вс июн 01, 2008 12:25 pm
Сообщения: 1339
palaman писал(а):
Артикли давно считаются именами собственными? Местоимения давно относят к именам нарицательным?

Это вопрос терминологии.

palaman писал(а):
То есть, по умолчанию, появление нового предлога означает, что все открытые скобки закрываются.
Конечно, для устной речи это выглядит слегка громоздко. Но для внутреннего компьютерного языка очень даже ничего, по-моему...

Да, всё правильно, именно так машина и должна анализировать. :biero:

Martin писал(а):
Но я же говорю не об эсперанто, а о предельно формализованном искусственном языке, который должен быть спроектирован именно таким образом, чтобы по максимуму исключить неоднозначности (см. первый пост в этой теме).

При переводе из языка понятий в естественный язык, мы всегда ограничены возможностями естественного языка. Разложить же всю информацию, которое содержит естественное предложение, по машинным полочкам, как мне кажется, всё же более реально.

Матюшов писал(а):
Не хотите xml - можно имитировать обычный язык программирования

Это не суть важно. Но принцип правильный, именно таким образом группы слов и нужно разделять.
По сути, мы сейчас говорим об алгоритме для программы-переводчика, обычный человек таким "уродством" в обычной речи вряд ли сможет пользоваться.

_________________
Не бывает ни чисто белого, ни чисто чёрного. Однако жить, навешивая ярлыки, куда проще.
За разнообразие в мире языков: http://vk.com/lingvomir


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вс ноя 08, 2009 12:14 pm 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Вс фев 08, 2009 21:08 pm
Сообщения: 1664
Откуда: Germanio
palaman писал(а):
Toman писал(а):
По-моему, я тут чуть не больше года не появлялся, на этом форуме... Вот, что-то решил (ну да, так вот почти без всякой причины :) ) зайти посмотреть, как тут дела-то идут, а тут... :)
Мистика! но я на днях тоже собирался открыть тему с таким названием.
Что бы это значило?

Правда, я размышлял о таком искусственном языке,
1) на который и с которого было бы удобно автоматически переводить на Эсперанто и обратно;
2) он был бы максимально логичен, чтобы компу было удобнее анализировать тексты, созданные на этом языке.

Требование (1) обеспечивает полноценность языка, так как Эсперанто полноценен.
Требование (2) обеспечивает главную цель, в связи с идеей машинного перевода.

То есть, программа работы такая: создаем LogEspo - логический язык, равномощный Эсперанто, но полностью логичный по структуре.
Затем разрабатываем перевод с LogEspo на другие языки.
...Косвенно, все это послужит, между прочим, пропаганде Эсперанто: Эсперанто станут изучать так же, как сейчас изучают Линукс или С++, к примеру...

Пусть LogEspo будет неудобным как язык разговорной речи. Не заботимся о краткости слов, благозвучии и проч. Машине это не нужно. Эсперанто будет разговорным вариантом LogEspo. LogEspo будет машинным вариантом Эсперанто.


LogEspo - хорошая идея, притом, как я понял, Ваша личная. Он будет хорошим решением для проблемы, обсуждаемой в этой ветке. Конечно, это утверждение спорное, но идеального решения просто не существует. И если LogEspo будет разработан, он будет не равномощным эсперанто, а намного выше его по выразительной мощи и точности.
Уже предлагаю некоторые средства этого языка. Включить в него теги в фигурных скобках (кважратные вызовут путаницу в Википедии). Правила расстановки тегов чётко фиксированы. Основное требование - текст на обычном эсперанто получается простым удалением тегов. Алфавитная основа языка - Уникод, чтобы в него без проблем можно было включать и тексты на национальных языках, и шляпки над буквами эсперанто.

Вот примеры тегов.
1. Суффикс iĉ мужского рода (давно придуманный "ичистами").

Ĉeval{iĉ}o.

Суффикс in женского рода.

Ĉeval{in}o. Ĉevalino содержит обычный (не теговый) суффикс женского рода.

Местоимение ri для одушевлённых объектов неустановленного рода (пола), давно придуманное "риистами":

li{ri} estas altkreska.

Интересно выслушать другие предложения, особенно касающиеся однозначности специальных терминов. Например, целесообразно ввести тег интервала. В немецком языке час как момент времени (Uhr) не совпадает с часом как интервалом (Stunde). Для мер длины слово без тега интервала означало бы местоположение ("платформа 18-й километр"), а с тегом интервала - расстояние.


Вернуться к началу
 Профиль  
Ответить с цитатой  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 54 ]  На страницу Пред.  1, 2, 3  След.

Часовой пояс: UTC + 3 часа


Похожие темы форума | Similaj temoj en la forumo
 Темы   Автор   Ответы   Просмотры   Последнее сообщение 
В этой теме нет новых непрочитанных сообщений. Язык машинного перевода

Kurt

13

6798

Вт апр 12, 2005 2:13 am

Hemulo Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. А вам не кажется, что любой искусственный язык есть утопия?

[ На страницуНа страницу: 1, 2 ]

Pennivajz

23

7727

Пт сен 14, 2018 19:46 pm

skirlet Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. О странностях автоматического перевода

Nikolaj Mihajlenko

2

3430

Пн ноя 27, 2006 9:16 am

Nikolaj Mihajlenko Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. Язык Эдо

Gufido

0

5098

Вс фев 06, 2005 12:49 pm

Gufido Перейти к последнему сообщению

 


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 4


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
News News Plan de site Plan de site SitemapIndex SitemapIndex Flux RSS Flux RSS Liste des flux Liste des flux
Создано на основе phpBB® Forum Software © phpBB Group