Список форумов

Esperanto новости

Форум об эсперанто и языках вообще

Избранное:
En Esperanto: UEA :: REU :: Vikipedio :: Libera Folio
По-русски: Esperanto новости :: Что такое эсперанто? :: Курс эсперанто по эл. почте


Сейчас Сб май 25, 2019 5:55 am

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 54 ]  На страницу 1, 2, 3  След.
Автор Сообщение
СообщениеДобавлено: Вт окт 13, 2009 13:22 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Есть такая вещь, как машинный перевод. Который, однако, плохо работает, из-за навороченности и неоднозначности грамматики естественных языков и из-за многозначности-омонимичности их лексики. Интересно, почему до сих пор никто не изобрёл мёртвый глухо-немой язык-посредник для упрощения машинного перевода? Скажем, если такой язык будет обладать:

1. крайней формализованностью и простотой грамматики;
2. лексикой на основе английского языка (который по факту является международным), но полностью избавленной от многозначности (здесь придётся поработать, но, имхо, вполне осуществимо),

то что помешает:

1. написать софт для машинного перевода с языка-посредника на каждый естественный язык;
2. написать софт для облегчения интерактивного конструирования текстов на языке-посреднике для носителей каждого естественного языка??

По поводу последнего. Например, в таком режиме: выбираем подлежащее из специального словаря (имеющего функционал толкового), выбираем сказуемое из того же словаря, навешиваем таким же способом определения-дополнения и т.д. Далее запускаем формальную проверку на валидность и пробный перевод на естественный язык. Продвинутые пользователи могут писать в текстовом режиме, а потом сразу запускать проверку на валидность. Как среда разработки для языка программирования, короче :).


Вернуться к началу
 Профиль  
Ответить с цитатой  

 Заголовок сообщения:
СообщениеДобавлено: Вт окт 13, 2009 13:45 pm 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Вт ноя 15, 2005 2:27 am
Сообщения: 417
Откуда: Москва
По-моему, я тут чуть не больше года не появлялся, на этом форуме... Вот, что-то решил (ну да, так вот почти без всякой причины :) ) зайти посмотреть, как тут дела-то идут, а тут... :)

Если по делу, то слово "мёртвый" тут лишнее. По обычному определению, мёртвым язык считается, если он не используется в практических целях, т.е. на нём не говорят и не пишут новые тексты (а только, в лучшем случае на нём читаются существующие тексты, и люди учат его, но лишь для того, чтобы читать). Всякий язык, который активно используется - живой, даже если он чисто письменный.

_________________
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
ТРЕЗВОСТЬ - НОРМА ЖИЗНИ


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вт окт 13, 2009 16:32 pm 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Вт ноя 15, 2005 2:27 am
Сообщения: 417
Откуда: Москва
Просто небольшое пояснение - эта тема здесь по факту выросла из довольно внушительной темы (по тамошним меркам, конечно - на целых 2 страницы) на одном форуме (вообще не лингвистической тематики). Собственно, сюда на форум я зашёл в т.ч. потому, что подумал, не пора ли уже обсуждению прийти сюда на э-новости, на благодатную почву.
И - к моему удивлению - оказалось, что Martin зарегистрировался и опередил это моё шевеление, причём всего на несколько минут. И это при том, что ссылку на этот форум я ещё не успел дать :) никаким явным образом.
Т.е. это получилось такое сугубо спонтанное совпадение.
Вот думаю, давать здесь ссылку на ту тему форума, или нет? Не отдерут ли (за некоторые нелестные высказывания)? ;)

_________________
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
ТРЕЗВОСТЬ - НОРМА ЖИЗНИ


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вт окт 13, 2009 16:48 pm 
Не в сети
Fervora Forumano
Fervora Forumano
Аватара пользователя

Зарегистрирован: Вс июн 01, 2008 12:25 pm
Сообщения: 1339
Давать! Это примерно то, чем я сейчас занимаюсь!
А вообще жить в мире иллюзий - обманывать себя.

_________________
Не бывает ни чисто белого, ни чисто чёрного. Однако жить, навешивая ярлыки, куда проще.
За разнообразие в мире языков: http://vk.com/lingvomir


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вт окт 13, 2009 16:56 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Artem писал(а):
Давать!

На самом деле ничего выдающегося в ветке на том форуме нет.
Artem писал(а):
Это примерно то, чем я сейчас занимаюсь!
А вообще жить в мире иллюзий - обманывать себя.

Вот это уже интереснее. Чем конкретно занимаетесь?
Что за иллюзии?


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вт окт 13, 2009 22:59 pm 
Не в сети
Novico

Зарегистрирован: Вс май 06, 2007 16:42 pm
Сообщения: 31
Откуда: belarusio
В Гуголь хоть кто-нибудь обращался?

_________________
Uzu q,w,x,y!


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Вт окт 13, 2009 23:53 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Вот здесь есть упоминание о "тупиковой ветви":
Цитата:
В соответствии с некогда весьма популярной концепцией Interlingva процесс машинного перевода должен осуществляться в два этапа. На первом входное предложение следует перевести на искусственный язык-посредник (например, созданный на базе упрощенного английского языка), а затем результат этого перевода представить средствами выходного языка. Несмотря на то, что существует данная научная концепция уже полвека, ни одной реально работающей системы на ее основе пока не создано. Главная проблема – в разработке «посредника» и формальном описании его в терминах естественного языка.

Однако, я не говорю об автоматическом переводе на язык-посредник.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Ср окт 14, 2009 8:54 am 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Специально составлять язык-посредник необязательно, нужно в исходном тексте для омонимичных слов добавить теги для выбора нужного перевода. Нужна программа для расстановки тегов.
Программа переводчик сама расставит аналогичные теги в переведённом тексте.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Ср окт 14, 2009 11:51 am 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Матюшов писал(а):
Специально составлять язык-посредник необязательно, нужно в исходном тексте для омонимичных слов добавить теги для выбора нужного перевода. Нужна программа для расстановки тегов.

Как быть со сложной грамматикой? Автоматические переводчики делают очень много ошибок в плане построения предложений, согласования времён и т.п.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Ср окт 14, 2009 12:59 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Martin писал(а):
Как быть со сложной грамматикой? Автоматические переводчики делают очень много ошибок в плане построения предложений, согласования времён и т.п.

Аналогично, добавляются грамматические теги.
Например, при переводе с русского на английский у глагола прошедшего времени ставится ставится тег [женский род], и переводе с английского на украинский он восстановится.
Определить какие теги будут нужны довольно сложная задача, но всё же проще, чем придумывать новый язык.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Ср окт 14, 2009 14:25 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Матюшов писал(а):
Аналогично, добавляются грамматические теги.
Например, при переводе с русского на английский у глагола прошедшего времени ставится ставится тег [женский род], и переводе с английского на украинский он восстановится.

Это как-то очень неуниверсально выглядит, я пока что не могу представить себе этого :). Какой тег и кто будет добавлять при переводе с английского на русский, у этого самого глагола прошедшего времени? Для носителя английского, составляющего текст, это бессмыслица (он может даже не знать, на какой язык будет переводиться потом этот текст, и какие теги вообще могут потребоваться), а если программа сама в состоянии проставить такой тег, то это значит, что тег не нужен. Т.е. такие теги имеют смысл, только если заранее известно, на какой язык будет переводиться текст, и каковы грамматические отличия этого языка от языка оригинала, во всех подробностях. Кроме того, я уверен, что будет куча ситуаций, когда никакой тег вообще поставить будет нельзя, т.к. многие языковые явления в разных языках окажутся не сопоставимы с помощью таких тегов в принципе.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Ср окт 14, 2009 15:13 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
В англиском текста в начале может быть неясен пол героя, который будет выяснен только позже - как это перевести задача переводчика-человека, а не для автоматического переводчика.
Набор тегов действительно будет зависеть от языка(языков), на который должен переводиться текст, и переводчик, расставляющий теги должен иметь представление о грамматике языка, на который текст будет переводиться. В тоже время текст на английском с тегами для перевода на русский, переведётся на украинский почти без ошибок. Причём переводчик не должен смотреть на теги - он видит исходный текст и переведённый текст, посказки вариантов перевода и т.д.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Ср окт 14, 2009 15:22 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Матюшов писал(а):
Набор тегов действительно будет зависеть от языка(языков), на который должен переводиться текст, и переводчик, расставляющий теги должен иметь представление о грамматике языка, на который текст будет переводиться.

Это очень неуниверсально, имхо, и в корне отличается от мыслей, с которых я начал эту ветку. "Мой" искусственный язык не потребует переводческой квалификации от составителя текста, и должен работать независимо от того, на какие языки будет переводиться потом текст. Т.е. текст на таком искусственном языке можно использовать, например, в Интернете. Разместил статью, и пусть её переводит и читает потом кто хочет и как хочет (благо проблема полностью автоматизированного перевода с искусственного языка на любой естественный должна быть успешно решена). А вот с Вашими тегами для конкретных целевых языков такой номер уже не пройдёт.

Но Ваша идея тоже интересна :).


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Ср окт 14, 2009 23:53 pm 
Не в сети
Fervora Forumano
Fervora Forumano
Аватара пользователя

Зарегистрирован: Вс июн 01, 2008 12:25 pm
Сообщения: 1339
Матюшов писал(а):
Специально составлять язык-посредник необязательно, нужно в исходном тексте для омонимичных слов добавить теги для выбора нужного перевода. Нужна программа для расстановки тегов.
Программа переводчик сама расставит аналогичные теги в переведённом тексте.

На самом деле грамматический синкретизм с горем пополам прожевать можно. Самая большая проблема - неустойчивость лексики (метафоры сотоварищи).

_________________
Не бывает ни чисто белого, ни чисто чёрного. Однако жить, навешивая ярлыки, куда проще.
За разнообразие в мире языков: http://vk.com/lingvomir


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт окт 15, 2009 12:09 pm 
Не в сети
Plenrajta Forumano

Зарегистрирован: Сб май 19, 2007 9:21 am
Сообщения: 377
Мартин, в Вашем языке будет категоиря рода? Если нет, то могут быть проблемы при перводе таких предложений как "Доктор сказала". А если будут, то в разных языках разное деление на роды, даже иногда не соответствующее естественным. Например, немецкое "Mädchen" - девочка среднего рода. К "еs" в следущем предложении добваляем тег, связывающий его с "Mädchen" и программа-переводчик переведёт "она", а не "оно", т.е. грамматические теги по возможности лучше заменять на семантические. В Вашем языке пришлось бы отказаться от местоимений или иметь сложную систему местоимений - не соответствующую естественным языкам, и составлять текст на Вашем языке будет сложно.
Но действительно, как заметил Артём - наибольшая проблема в лексике.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт окт 15, 2009 12:39 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
Матюшов писал(а):
Мартин, в Вашем языке будет категоиря рода? Если нет, то могут быть проблемы при перводе таких предложений как "Доктор сказала". А если будут, то в разных языках разное деление на роды, даже иногда не соответствующее естественным. Например, немецкое "Mädchen" - девочка среднего рода. К "еs" в следущем предложении добваляем тег, связывающий его с "Mädchen" и программа-переводчик переведёт "она", а не "оно", т.е. грамматические теги по возможности лучше заменять на семантические. В Вашем языке пришлось бы отказаться от местоимений или иметь сложную систему местоимений - не соответствующую естественным языкам, и составлять текст на Вашем языке будет сложно.
Но действительно, как заметил Артём - наибольшая проблема в лексике.

Самое важное: это пока что не "мой" язык, да и вовсе не язык, а просто мысль, которая пришла в голову :).

Думаю, категория рода для одушевлённых предметов нужна. Вплоть до её формального определения (например, жёсткого окончания, что и будет по факту "тегом").

Насчёт "составлять текст будет сложно". Да, но составлять текст на любом языке, который не особо знаком — в любом случае очень сложно :). В этом и состоит проблема всех искусственных языков, включая эсперанто: нужно затратить колоссальные усилия и время, чтобы освоить язык. Именно поэтому все искусственные языки до сих пор бесповоротно мертвы, включая эсперанто (последнюю фразу прошу понять правильно — это не провокация на флейм :)).

Моя мысль состоит в том, чтобы сделать искусственный язык практически полезным почти сразу же, без титанических усилий и затрат времени со стороны пользователя. Имхо, это единственный способ не родить мертвеца. Если пользователю нужно будет выучить хотя бы несколько тысяч слов плюс несколько десятков грамматических явлений, язык будет не востребован с вероятностью в 200%, это будет ещё одна унылая запись в списке мертвецов.

Если же изучение искусственного языка сведётся к освоению софта, то шанс есть. Имхо.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Чт окт 15, 2009 22:59 pm 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср июл 22, 2009 22:01 pm
Сообщения: 3054
Откуда: Россия
Toman писал(а):
По-моему, я тут чуть не больше года не появлялся, на этом форуме... Вот, что-то решил (ну да, так вот почти без всякой причины :) ) зайти посмотреть, как тут дела-то идут, а тут... :)
Мистика! но я на днях тоже собирался открыть тему с таким названием.
Что бы это значило?

Правда, я размышлял о таком искусственном языке,
1) на который и с которого было бы удобно автоматически переводить на Эсперанто и обратно;
2) он был бы максимально логичен, чтобы компу было удобнее анализировать тексты, созданные на этом языке.

Требование (1) обеспечивает полноценность языка, так как Эсперанто полноценен.
Требование (2) обеспечивает главную цель, в связи с идеей машинного перевода.

То есть, программа работы такая: создаем LogEspo - логический язык, равномощный Эсперанто, но полностью логичный по структуре.
Затем разрабатываем перевод с LogEspo на другие языки.
...Косвенно, все это послужит, между прочим, пропаганде Эсперанто: Эсперанто станут изучать так же, как сейчас изучают Линукс или С++, к примеру...

Пусть LogEspo будет неудобным как язык разговорной речи. Не заботимся о краткости слов, благозвучии и проч. Машине это не нужно. Эсперанто будет разговорным вариантом LogEspo. LogEspo будет машинным вариантом Эсперанто.


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Пт окт 16, 2009 14:48 pm 
Не в сети
Novico

Зарегистрирован: Вт окт 13, 2009 13:10 pm
Сообщения: 16
palaman писал(а):
Правда, я размышлял о таком искусственном языке,
1) на который и с которого было бы удобно автоматически переводить на Эсперанто и обратно;

Здесь есть существенный изъян: если Вы признаёте, что сам Эсперанто не достаточно логичен для автоматического перевода, то автоматически переводить "с Эсперанто и обратно" будет проблематично на любой язык, будь он хоть в тысячу раз логичнее самого Эсперанто. Соответственно, Вы приходите в "тупиковую ветвь", которая была озвучена здесь выше.

Я же не говорю об автоматическом переводе на язык-посредник, а только с него.

По сути, Вы хотите просто улучшить Эсперанто. Может, эта идея не так уж плоха...


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 2:05 am 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Вт ноя 15, 2005 2:27 am
Сообщения: 417
Откуда: Москва
Матюшов писал(а):
Если нет, то могут быть проблемы при перводе таких предложений как "Доктор сказала".

При переводе с какого на какой? Тут, как бы сказать, проблемы будут в любом случае, т.к. само это предложение, с точки зрения русского языка, является грамматическим кошмаром, теоретически невозможным. Поэтому с такими предложениями проблемы были, есть и будут есть всегда, даже в речи на родном языке без всяких переводов. Детей приходится специально учить такому "беспределу" - как бы меняющемуся роду у как бы одного слова, в отличие от нормального грамматического управления родом, которому русскоговорящих детей никто специально не учит.
Цитата:
А если будут, то в разных языках разное деление на роды, даже иногда не соответствующее естественным. Например, немецкое "Mädchen" - девочка среднего рода. К "еs" в следущем предложении добваляем тег, связывающий его с "Mädchen" и программа-переводчик переведёт "она", а не "оно", т.е. грамматические теги по возможности лучше заменять на семантические.

Имхо, такой подход порочен. Ставить правильный род с точки зрения грамматики - это дело переводчика на конкретный язык, и именно на этой стадии сам этот переводчик должен будет "понять", какое слово с каким связано, и проставить правильный род или какую-то ещё зависимость, специфичную для данного языка.
Дело в том, что как только мы попытаемся прийти к каким-то семантическим родам, нам придётся, вероятно, указывать род во всех классификациях, какие только существуют в разных языках. Например, где-то грамматический род той же самой девочки будет совершенно разным в зависимости от возраста, а где-то - от социального статуса (причём сам этот статус может выражаться таким словом, которому в языке-источнике текста даже нет перевода, и автору текста даже и близко не знакомо такое понятие). Где-то для грамматического рода играет роль травянистость или древесность растения, а где-то однолетнесть или многолетнесть. Где-то в отдельный грамматический род выделены сверхъестественные существа, а где-то географические объекты определённого сорта. На всё "универсальных" тегов заранее не предусмотришь, и не надо пытаться. Вообще грамматический род - это (уж, пожалуйста, без обид...) признак дикарского языка, на каждый дикарский язык не наздравствуешься.
Цитата:
В Вашем языке пришлось бы отказаться от местоимений или иметь сложную систему местоимений - не соответствующую естественным языкам, и составлять текст на Вашем языке будет сложно.

С чего бы это, вообще-то говоря? Система местоимений - да, она должна быть не то чтобы сложной, но с точки зрения, скажем, европейца или русскоговорящего - может быть, несколько более "обильной", чем привычно. Но это никак не связано с родом, а просто как проявление общей линии на устранение смысловых неоднозначностей. Ну вот как в "соседней" теме замечали, что вот в чеченском языке есть очень полезная дифференциация личных местоимений - вместо одного нашего "мы" - есть "мы+вы", и есть чистое "мы". Вариантов может быть много, и то, что какие-то используемые нами местоимения являются неоднозначными по смыслу, может быть сходу не ясно.

Если же продолжить на тему проблемы родов и местоимений - то мне кажется, решение гораздо проще, и оно лежит на поверхности, то бишь, в практике нашего русского (и не только) языка. А именно, когда у нас в предложении из-за его сложности становится непонятно, к чему относится какое-то местоимение ("он", "который" и т.п.), то мы ставим в скобках или меж запятых то слово, которое оно (местоимение) заменяет. Таким образом, мы как раз не должны пытаться выдумать кучу семантических тегов для всевозможных родов и классов (и всё равно не угодить всем "дикарским" языкам), а просто требуем в обязательном порядке для местоимений указаний на то имя, с которым оно, местоимение, связано. Вот это и будет, если угодно так называть, тег. Только такое указание будет необходимо и для таких местоимений, как "я", "ты", "мы", "вы", "каждый", "всякий" и т.п., в общем, практически, наверное, для всех местоимений вообще, ибо на то они и местоимения. Такой вот специфический принцип выражаться всегда очень конкретно и точно - ну так язык такого плана к этому, имхо, и должен стремиться.

_________________
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
ТРЕЗВОСТЬ - НОРМА ЖИЗНИ


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 6:24 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср июл 22, 2009 22:01 pm
Сообщения: 3054
Откуда: Россия
Martin писал(а):
автоматически переводить "с Эсперанто и обратно" будет проблематично на любой язык, будь он хоть в тысячу раз логичнее самого Эсперанто. Соответственно, Вы приходите в "тупиковую ветвь", которая была озвучена здесь выше.
Согласен. Вы правы.

Цитата:
Я же не говорю об автоматическом переводе на язык-посредник, а только с него.

Дошло. Теперь дошло. По-моему, хорошая идея.

Цитата:
По сути, Вы хотите просто улучшить Эсперанто. Может, эта идея не так уж плоха...
Постепенно я начинаю понимать, на чем стоит Эсперанто, в чем секрет его успеха (пусть скромного, но все-таки реального успеха: хотя нас мало, но almenaŭ, Эсперанто жив, здоров, и явно будет жить далее, как уже состоявшийся язык).
Секрет в том, что идеал недостижим.
Вся интерлингвистика держится на заманчивой мечте идеального языка. А я, кажется, понял, почему эта мечта нереальна. Почему несовместимы самые необходимые требования к такому языку. Если же устранить мечту об идеальном языке и искать реального и удачного компромисса между несовместимыми требованиями, то Эсперанто - это в своем роде идеальный компромисс.
(Хотя "компромисс" - это понятие по сути противоположное понятию "идеал")[/u][/i][/quote]


Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 6:43 am 
Не в сети
Fervora Forumano
Fervora Forumano

Зарегистрирован: Ср июл 22, 2009 22:01 pm
Сообщения: 3054
Откуда: Россия
Toman писал(а):
Дело в том, что как только мы попытаемся прийти к каким-то семантическим родам, нам придётся, вероятно, указывать род во всех классификациях, какие только существуют в разных языках. Например, где-то грамматический род той же самой девочки будет совершенно разным в зависимости от возраста, а где-то - от социального статуса (причём сам этот статус может выражаться таким словом, которому в языке-источнике текста даже нет перевода, и автору текста даже и близко не знакомо такое понятие). Где-то для грамматического рода играет роль травянистость или древесность растения, а где-то однолетнесть или многолетнесть. Где-то в отдельный грамматический род выделены сверхъестественные существа, а где-то географические объекты определённого сорта. На всё "универсальных" тегов заранее не предусмотришь, и не надо пытаться.
То есть, учет того или иного рода - это проблема не семантики, а условных условностей того или иного языка.
А теги должны указывать что? Что-то объективное, от языка не зависящее?
Я пока не понял идею, как видно....

Цитата:
Вообще грамматический род - это (уж, пожалуйста, без обид...) признак дикарского языка, на каждый дикарский язык не наздравствуешься.
Никаких обид.
Все языки со времен Вавилона - языки языческие (то есть, враварские или дикарские). Язык Адама утрачен безвозвратно, если верить показаниям Библии (а я верю).
Однако я с Вами не согласен: думаю, в языке Адама наверняка была сложнейшая система родов. Полностью логичная и семантически обоснованная. Вот бы ее восстановить...
В сущности, "прилагательное" и "существительное" - это тоже роды (своего рода :-))

Цитата:
Система местоимений - да, она должна быть не то чтобы сложной, но с точки зрения, скажем, европейца или русскоговорящего - может быть, несколько более "обильной", чем привычно. Но это никак не связано с родом, а просто как проявление общей линии на устранение смысловых неоднозначностей.

Стоп-стоп. Так ведь местоимения напрямую связаны с грамматическими родами.
Если система местоимений богатая, то и система родов богатая - если не грамматических родов, то, по крайней мере, семантических родов.
Или же заменяйте любое слово одними и теми же вопросительным/указательным/собирательным местоимениями, как в токипоне.
Если должно быть много местоимений, то почему мало родов?
Я пока не понимаю логику...

Хочу высказать одну идею в копилку лингвистических идей.
Давайте рассмотрим любое слово, которое может обозначать несколько разных понятий, как семантическое местоимение. А именно, оно заменяет собой конкретные обозначения каждого из этих понятий.
Например, слово "зверь" - это местоимение, обозначающее собаку, кошку, крысу и двугих зверей.
Часто бывает достаточно сказать "зверь", не уточняя зверя. Часты бывает даже ЖЕЛАТЕЛЬНО НЕ уточнять: например, зоология - это наука о зверях вообще, а не о конкретном звере. Если бы мы должны были каждый раз уточнять, о каком конкретном звере мы говорим, то зоология не могла бы существовать. Иногда надо говорить абстрактно.
Еще пример. Слово "человек" - это местоимение, обозначающее Вас, меня или любого другого человека. И так далее.
То есть, местоимение - это обобщенное имя какого-то класса понятий. Местоимение обобщает, возвышая понятие над контекстом, абстрагируя его!
Итак, я ввожу новую полезную категорию лингвистического мышления: семантическое местоимение. В любом языке должно быть много семантических местоимений. Столько же, сколько общих понятий.

Все ли слова являются семантическими местоимениями в этом смысле?
Не все!
Не являются местоимениями имена собственные, уникальные. Они обозначают только то, что они обозначают, и не замещают собой каких-либо иных понятий.
НО есть такие имена собственные, которые используются омонимически, для обозначения разных объектов.
Такие имена собственные - это семантические артикли.
(В хорошем языке должно быть много артиклей:-). Шучу. В любом языке имена собственные - как бы за бортом официального словаря. Но омонимические имена, конечно, должны быть в словаре, в неофициальном разделе.)
Любое имя собственное, которое используется омонимически, то есть, для обозначения разных предметов (например, имя Андрей - ведь Андреев много!) - это семантический артикль. Что общего у омонимического имени с артиклем?Свойство обычного артикля - выделять что-то одно, конкретное, отличающееся от других вещей, имеющих то же имя. При этом сам артикль один и тот же, а смысл его разный, в зависимости от контекста.
Так вот, имя Андрей - это семантический артикль, обозначающий конкретного Андрея в конкретной ситуации.
В этом отличие артикля от местоимения: местоимение абстрагирует, артикль конкретизирует. В реальности эти две операции: абстрагирование и конкретизирование - часто необходимо соединять между собой. Получается, артикль плюс местоимение.
Артикль плюс местоимение - такое соединеие, мягко говоря непривычно. Грубо говоря, безграмотно.
Но полностью осмысленно!
Например, словосочетание the he может обозначать какого-то конкретного he, о котором ничего не говорится, кроме того, что он не she и не it, а именно he.
Почему это не используется?
Реально используемые в реальных высказываниях указательные местоимения и существительные подразумевают
- либо конкретный объект, и артикль потому не ставится: he в этом случае обозначает the he;
- либо, если же хотят говорить о he вообще, о мужском поле человеческого рода, то используют существительное без артикля: man)

Я эту теорию обобщенных артиклей и обобщенных местоимений разрабатываю в других целях, но для машинного перевода она, как кажется, тоже может быть полезна. Почему меня и привлекла данная тема.
Идея такова: в строго логическом машинном языке имеются только два самых общих семантических рода: артикли и местоимения!
Имена собственные + артикль - это одно.
Местоимения плюс имена собирательные - глаголы, прилагательные, наречия и проч. - это другое.

Я говорю о семантических родах.
Грамматика же заставляет нас использовать еще дополнительные слова, не имеющие самостоятельного смысла, чисто технически указывающие на связь слов в предложении, а также предложений между собой. Они в каждом языке свои, зависят от грамматики языка. И потому для семантики
несущественны.

Цитата:
Такой вот специфический принцип выражаться всегда очень конкретно и точно - ну так язык такого плана к этому, имхо, и должен стремиться.
Ну да! в том-то и преимущество компьютера, что он не затруднится в каждой фразе уточнять все оттенки смысла, на что у нас, людей, нет теперь ни сил, ни времени..

Тогда вот встречный вопрос:
Разные языки требую разных уточнений для однозначности (и даже вообще возможности )перевода. Значит ли это, что при переводе на наш машинный язык каждый пользователь должен каждый раз уточнять ВСЕ тонкости того, что именно он собирался выразить? все тонкости, необходимые для потенциально возможного перевода на все языки Вселенной?!

Или такие уточнения программа должна запрашивать по мере необходимости перевода на тот или иной конкретный язык?

Мне кажется, этот вопрос - ключевой в данной теме!:)


Последний раз редактировалось palaman Сб окт 17, 2009 12:48 pm, всего редактировалось 1 раз.

Вернуться к началу
 Профиль  
Ответить с цитатой  
 Заголовок сообщения:
СообщениеДобавлено: Сб окт 17, 2009 8:36 am 
Не в сети
Plenrajta Forumano
Аватара пользователя

Зарегистрирован: Вт ноя 15, 2005 2:27 am
Сообщения: 417
Откуда: Москва
Martin писал(а):
Думаю, категория рода для одушевлённых предметов нужна. Вплоть до её формального определения (например, жёсткого окончания, что и будет по факту "тегом").
Ну вот - начали за здравие, а теперь уже на грамматический род соглашаетесь :) Более того: "родом" или "классом" является также и одушевлённость, если её так рассматривать, и её тоже тогда придётся делать грамматическим классом. А это такая же лишняя конструкция и загромождение грамматики, как и роды. Тут важно не забывать, что так же, как и для прочих родов и классов определение одушевлённости-неодушевлённости в разных языках совершенно разное, так что просто двоичная метка тут опять ничего не даст в плане перевода на каждый конкретный язык. Более осмысленно и это, так же как и род, оставить на откуп переводчику на конкретный язык, а в самом промежуточном языке оставлять только реально смысловые понятия, а не формальные грамматические для каких-то отдельных языков.
Цитата:
Насчёт "составлять текст будет сложно". Да, но составлять текст на любом языке, который не особо знаком — в любом случае очень сложно :). В этом и состоит проблема всех искусственных языков, включая эсперанто: нужно затратить колоссальные усилия и время, чтобы освоить язык. Именно поэтому все искусственные языки до сих пор бесповоротно мертвы, включая эсперанто (последнюю фразу прошу понять правильно — это не провокация на флейм :)).
Собственно, почему только искуственные? Как правило, естественные языки существенно сложнее в изучении, чем искуственные, в т.ч. и эсперанто. (Ну, я не рассматриваю те конланги, которые придуманы специально чтобы быть сложными или чтобы изображать собой некий как бы естественный язык со своими намеренно придуманными странностями и сложностями). И тем не менее, естественные языки живы, причём независимо от своего уровня сложности (как вообще, так и для изучения иноязычным взрослым). Скажем, на английском говорит заметно больше людей, чем на турецком, а на русском, который, несомненно, ещё сложнее - больше, чем на финском, ногайском или хакасском. В то же время, на латышском, имеющем примерно сравнимый с русским уровень сложности (хотя, наверное, чуть-чуть всё-таки попроще русского, хотя тут лучше спросить того, кто его на самом деле учил), говорит сравнительно немного народа. Зато жители Латвии - таки говорят практически поголовно, на том или ином уровне. Намёк понятен? Короче говоря, я хотел сказать, что это (сложность) не причина. Причина - наличие или отсутствие некого внеязыкового стимула учить язык.
Цитата:

Моя мысль состоит в том, чтобы сделать искусственный язык практически полезным почти сразу же, без титанических усилий и затрат времени со стороны пользователя. Имхо, это единственный способ не родить мертвеца.

Однако это, боюсь, невозможно. По крайней мере, если иметь в виду создание текстов без специального словаря в руках. Ибо более 90% трудности изучения языка, а для языков со сравнительно простой (читай, логичной) грамматикой - я бы сказал, более 99% трудности составляет заучивание лексики. А размер "словаря значений" в любом языке одинаков. Вернее, в естественных языках, особенно, сравнительно близких (семантически близких - например, как русский и немецкий :) ), с точки зрения изучающего словарь будет казаться несколько меньше, просто из-за того, что многие неосознаваемо многозначные слова многозначны одинаковым или преимущественно похожим образом, и мы запоминаем перевод как слово-слово. В том "универсальном" языке, который мы обсуждаем, такой трюк, увы, не пройдёт, т.к. многозначность считаем недопустимой. И размер словаря значений с точки зрения изучающего будет полным, не уменьшенным.
Цитата:
Если пользователю нужно будет выучить хотя бы несколько тысяч слов плюс несколько десятков грамматических явлений, язык будет не востребован с вероятностью в 200%, это будет ещё одна унылая запись в списке мертвецов.

А что, эсперанто этим 2 условиям не удовлетворяет? Те несколько тысяч слов, которые надо знать для обычных разговоров на "неспециализированные" темы - они и в Африке несколько тысяч слов, число грамматических явлений, которые надо знать, вообще пренебрежимо мало (формально), и в несколько десятков вполне укладывается. В чём же тогда проблема? Кажется, только в том, что твёрдо выучить на память даже пару тысяч слов - таки всё равно сложно.
Цитата:

Если же изучение искусственного языка сведётся к освоению софта, то шанс есть. Имхо.


Это уже идеологический вопрос - что считать знанием языка. Если считать знанием языка умение на нём читать и писать осмысленные тексты с идеальным (не ограниченным в ёмкости, т.е. абсолютно полным) двусторонним словарём в руках - то можно было бы сказать, что я знаю/выучил язык эсперанто. Однако, по общепринятым критериям - способность читать, писать (а желательно - и слушать и говорить) без словаря в руках - я такого сказать никак не могу. Софт - это просто одна из форм представления словаря, м.б. очень удобная. Но по сути это всё равно тот же словарь. Так что тут мы говорим об изучении языка до уровня "чтение и письмо со словарём" - чтобы говорить честно и честно сравнивать с другими языками.

_________________
Во́зле до́ма хо́лм с куля́ми - вы́йду на́ холм, ку́ль поставлю.
ТРЕЗВОСТЬ - НОРМА ЖИЗНИ


Вернуться к началу
 Профиль  
Ответить с цитатой  
Показать сообщения за:  Поле сортировки  
Начать новую тему Ответить на тему  [ Сообщений: 54 ]  На страницу 1, 2, 3  След.

Часовой пояс: UTC + 3 часа


Похожие темы форума | Similaj temoj en la forumo
 Темы   Автор   Ответы   Просмотры   Последнее сообщение 
В этой теме нет новых непрочитанных сообщений. Язык машинного перевода

Kurt

13

6826

Вт апр 12, 2005 2:13 am

Hemulo Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. А вам не кажется, что любой искусственный язык есть утопия?

[ На страницуНа страницу: 1, 2 ]

Pennivajz

23

7862

Пт сен 14, 2018 19:46 pm

skirlet Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. О странностях автоматического перевода

Nikolaj Mihajlenko

2

3469

Пн ноя 27, 2006 9:16 am

Nikolaj Mihajlenko Перейти к последнему сообщению

В этой теме нет новых непрочитанных сообщений. Язык Эдо

Gufido

0

5166

Вс фев 06, 2005 12:49 pm

Gufido Перейти к последнему сообщению

 


Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 3


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
News News Plan de site Plan de site SitemapIndex SitemapIndex Flux RSS Flux RSS Liste des flux Liste des flux
Создано на основе phpBB® Forum Software © phpBB Group