Esperanto новости
http://www.e-novosti.info/forumo/

Версия словаря для Mobipocket Reader
http://www.e-novosti.info/forumo/eoru-ru/topic6089-88.html
Страница 5 из 6

Автор:  Kravejs [ Ср апр 13, 2011 9:35 am ]
Заголовок сообщения: 

Матюшов писал(а):
Kravejs писал(а):
Для словаря Nokia 6120, думаю, вполне подойдёт.

У меня как раз такой.
Не очень удобно набирать слова на цифровой клавиатуре.
Тем более, что в словаре русский индекс составлен так, что различает заглавные и строчные буквы - Nokia норовит первую букву сделать заглавной, так что если забудешь перейти на строчные, ищутся только сокращения, имена, географические названия и т. п.
Буквы ё на клавиатуре Nokia нет, а в индексе ё стоит в конце алфавита, так что слова начинающиеся на ё тоже не ищутся
(это относится к старой версии словаря, новую в телефон ещё не записывал)


На 95-ой Нокии - то же самое.

Особенности поиска:

1. Так как язык Эсперанто неизвестен для Mobipocket/Kindle, то язык словаря обозначен как английский. Но это имеет и свои преимущества, так как при поиске "английских" слов, программа считает букву с диакритическим знаком эквивалентной букве без диакритического символа. Более того, различий между верхним и нижним регистром нет. Таким образом, для поиска слова Ĉambro вы можете набрать на телефоне cambro и слово будет найдено без проблем.

2. Дополнительный, русско-эсперанто индекс также считается "английским", но для кириллицы программа делает различия между регистрами, из за чего и есть сложности с поиском. Эта проблема потеряет актуальность когда будет готов Русско - Эсперанто словарь Кондратьева.

По поводу эргономики. На мобильных устройствах удобнее всего использовать словарь на тач-скринах, когда можно тапнуть на неизвестном слове при чтении книги на эсперанто и тут же получить перевод. Из устройств, которые у меня были - это старые Palm. :) Также на Windows, если вы читаете книжку в мобипокете, то достаточно кликнуть мышкой на незнакомом слове и получить перевод. На телефонах нокии без тач-скрина, также можно выделить слово и получить его перевод, но для этого придётся совершить ряд действий: нажать кнопку меню, выбрать нужный пункт, клавишами со стрелками выбрать слово на экране и нажать подтверждение.

Что касается современных устройств с тач-скрином, то здесь слово за компанией Amazon с её программой Kindle Reader App. Первая версия программы не имела поиска вовсе, сейчас уже есть поиск по основному индексу, но пока нельзя поменять словарь по умолчанию. При этом на физическом Kindle это можно сделать! Так что, и в программах эта возможность должна скоро появиться и можно будет наслаждаться чтением книг на Эсперанто с возможностью моментально перевести любое слово.

Автор:  mpeg [ Чт апр 14, 2011 11:45 am ]
Заголовок сообщения: 

Матюшов писал(а):
Kravejs писал(а):
Для словаря Nokia 6120, думаю, вполне подойдёт.

У меня как раз такой.
Не очень удобно набирать слова на цифровой клавиатуре.
Тем более, что в словаре русский индекс составлен так, что различает заглавные и строчные буквы - Nokia норовит первую букву сделать заглавной, так что если забудешь перейти на строчные, ищутся только сокращения, имена, географические названия и т. п.
Буквы ё на клавиатуре Nokia нет, а в индексе ё стоит в конце алфавита, так что слова начинающиеся на ё тоже не ищутся
(это относится к старой версии словаря, новую в телефон ещё не записывал)

Про прикол с заглавной буквой в Nokia я знаю... :)
Уже смирился давно и привык.

А есть другие нелостатки, кроме неудобства цифровой клавиатуры и буквы "ё"?

Поиск по индексу присутствует, как на версии для ПК?

Автор:  mpeg [ Чт апр 14, 2011 11:53 am ]
Заголовок сообщения: 

Kravejs писал(а):
На мобильных устройствах удобнее всего использовать словарь на тач-скринах, когда можно тапнуть на неизвестном слове при чтении книги на эсперанто и тут же получить перевод.

...достаточно кликнуть мышкой на незнакомом слове и получить перевод.
На телефонах Нокии без тач-скрина, также можно выделить слово и получить его перевод, но для этого придётся совершить ряд действий: нажать кнопку меню, выбрать нужный пункт, клавишами со стрелками выбрать слово на экране и нажать подтверждение.


Тач-скрин это Сенсорный Экран?
А какие виды более перспективны, если в курсе, по вашему?

И ещё вопрос...
У меня есть Nintendo DS с сенсорным экраном.

Читать и играть в покер на ней очень удобно.

А есть ли для неё какие-нибудь читалки для словаря вроде Mobipocket/Kindle?
Ведь на бумаге словарь появится не скоро, как я понимаю...

Автор:  Kravejs [ Чт апр 14, 2011 13:07 pm ]
Заголовок сообщения: 

mpeg писал(а):
Kravejs писал(а):

У меня есть Nintendo DS с сенсорным экраном.
Читать и играть в покер на ней очень удобно.
А есть ли для неё какие-нибудь читалки для словаря вроде Mobipocket/Kindle?


Читалка, понимающая epub:
http://rhaleblian.wordpress.com/dslibri ... ntendo-ds/

Формат Mobipocket/Kindle основывается на epub. Получить словарь в формате epub не сложно и я уже думал об этом. Но epub не поддерживает "скрытые" индексы по которым можно делать поиск и единственная возможность - это "печатные" индексы по которым можно быстро добраться до нужной части словаря.

Так как это актуально, то я займусь этим.

Автор:  Kravejs [ Чт апр 14, 2011 13:28 pm ]
Заголовок сообщения: 

mpeg писал(а):
Kravejs писал(а):
И ещё вопрос...
У меня есть Nintendo DS с сенсорным экраном.

Читать и играть в покер на ней очень удобно.


А осилит приставка словарь?

Предлагаю попробовать этот словарь в формате epub. Он сравнимого со словарём Кондратьева объёма:
http://www.mobileread.com/forums/attach ... 1247851196

Мне интересно узнать на сколько удобно пользоваться таким словарём на игровой приставке с экраном 256х192 пикселей.

P.S. Нашёл видео как это выглядит:
How to read books on your Nintendo DS:
http://www.youtube.com/watch?v=qhj8eNmXBhk

Автор:  Kravejs [ Чт апр 14, 2011 18:46 pm ]
Заголовок сообщения: 

mpeg писал(а):
Kravejs писал(а):

Тач-скрин это Сенсорный Экран?
А какие виды более перспективны, если в курсе, по вашему?


Что скрин, что экран - слова иностранные. Только экран - французское, а скрин - английское. :)

А вопрос про виды не совсем понял - это по поводу экранов, телефонов или мобильных ос? Если про смартфоны, то самые популярные это Apple iPhone & Android (HTC, Samsung и др.). Хотя сейчас очень много разных систем: Bada (Samsung Wave), WebOS, Microsoft Phone 7, RIM BlackBerry и всякие прочие маэмо.

Автор:  mpeg [ Чт апр 14, 2011 19:48 pm ]
Заголовок сообщения: 

Kravejs писал(а):

Предлагаю попробовать этот словарь в формате epub. Он сравнимого со словарём Кондратьева объёма:
http://www.mobileread.com/forums/attach ... 1247851196

Мне интересно узнать на сколько удобно пользоваться таким словарём на игровой приставке с экраном 256х192 пикселей.


В выходные буду экспериментировать. :)

Завтра много работы.... :?

Закаченный словарь для эксперимента имел вид Websters Dictionary 1913_ver21.epub и 12.4 Мбайт веса.

Автор:  mpeg [ Вс апр 17, 2011 19:08 pm ]
Заголовок сообщения: 

Kravejs писал(а):
Мне интересно узнать на сколько удобно пользоваться таким словарём на игровой приставке с экраном 256х192 пикселей.

Вот здесь есть скриншоты как выглядит.
Англо-русский словарь на моей Nintendo DS.

Хорошее программирование + хорошая словарная база = удобство пользования.

Вполне удобно пользоваться... только у вышеуказанного словаря база слабая.

Kravejs писал(а):

А осилит приставка словарь?

Предлагаю попробовать этот словарь в формате epub.

Убил воскресенье, но не смог на моей флешки для DS запустить ни одну читалку .epub - файлов:
ни старенький dslibris-1.4.9, ни более свежую читалку IkuReader.

До кучи прилепил 9-ть разных наиболее подходящих драйверов к командному файлу ".nds". Если интересно, делается это так: DLDI и проблема несовместимости драйверов для доступа к файловой системе флешки

Но :cry: ни фига успеха не достиг... :(

Буду на ПК словарём пока пользоваться и думать над вариантами смартфонов. :?

Автор:  Kravejs [ Пн апр 18, 2011 1:32 am ]
Заголовок сообщения: 

mpeg писал(а):
Вот здесь есть скриншоты как выглядит.
Англо-русский словарь на моей Nintendo DS.

Вполне удобно пользоваться... только у вышеуказанного словаря база слабая.


Спроси у автора этой программки (у него есть мейл) согласиться ли он на основе нашей базы сделать Эсперанто-Русский словарь. Если да, то я с ним спишусь и сделаем эту экзотику.

Автор:  Kravejs [ Вт апр 19, 2011 15:15 pm ]
Заголовок сообщения:  Грамматика эсперанто в формате epub.

Появилась отдельная книжка по грамматике эсперанта (Бориса Кондратьева), созданная на основе текстов из словаря.

Книжка сделана в формате epub и должна открываться почти на всех современных ридерах.

Автор:  Kravejs [ Ср апр 20, 2011 17:27 pm ]
Заголовок сообщения: 

Матюшов писал(а):
ReVo в формате .mobi не открывается, там используется не поддерживаемый способ сжатия.


ReVo интересный словарь. Но тогда я слепил мобильную версию очень по-быстрому просто вырезая скриптом куски кода с html страниц.

Если делать "правильно" то нужно брать оригинальные файлы в формате XML и обрабатывать их согласно схеме. Всё это требует изрядного времени.

Если соберусь, то спишусь с автором этого словаря и сделаю "правильную" версию.

Автор:  Kravejs [ Ср апр 20, 2011 18:29 pm ]
Заголовок сообщения:  Словарь для телефонов с поддержкой J2ME

balamutick писал(а):
Но я, как и думаю очень многие люди, хочу спросить автора этой редакции, возможно сделать версию этого словаря для платформы: Java ME с профилем MIDP 2.0 ?
(эту версию поддерживает повальное большинство современных и даже не очень сотовых телефонов)


По поводу J2ME проблема заключается в том, что телефоны накладывают ограничение на размер JAR файла и для многих современных моделей это значение не превышает 0.5 - 1 Мб.

Весь словарь в такой объём не впихнуть. Есть следующие способы "ужать" словарь:

1 - максимально сократить размер словарных статей, исключив примеры, синонимы и редкие слова.

Например, оригинальную статью libro:
Цитата:
libr||o кни́га; кни́жка;
bindita ~o переплетённая кни́га;
komerca ~o торго́вая кни́га;
la ~o de Genezo кни́га Бытия́;
verki ~on (на)писа́ть кни́гу;
fermi ~on закры́ть кни́гу;
~a кни́жный;
~a ŝranko кни́жный шкаф;
~a merkato кни́жный ры́нок;
~aj scioj кни́жные зна́ния;
en ~a formo в фо́рме кни́ги;
~aĉ/o книжо́нка;
~ar/o подбо́рка, компле́кт, собра́ние книг;
~ej/o кни́жный магази́н, кни́жная ла́вка;
~em/ul/o редк., см. bibliofilo;
~et/o
1. кни́жечка;

2. муз. либре́тто;
~ist/o
1. кни́жный продаве́ц, продаве́ц книг;

2. книготорго́вец;
~uj/o портфе́ль, су́мка, па́пка для книг.


Можно сократить до следующего варианта:

Цитата:
libr||o книга;
~a книжный;
~aĉ/o книжонка;
~ar/o собрание книг;
~ej/o книжный магазин
~et/o 1. книжечка; 2. муз. либретто;
~ist/o 1. продавец книг; 2. книготорговец;
~uj/o портфель для книг.


2. Второй способ - по частотному словарю сделать выборку наиболее частных слов.

При комбинировании этих приёмов можно получить словарь объёмом 500Кб, который подойдёт для большинства телефончиков с J2ME. Но будет ли это словарь Бориса Кондратьева?

Одно из решений: если в оригинальном текстовом файле словаря будут определённым образом помечен минимальный вариант перевода, чтобы при генерации словарей можно было выбрать уровень: Базовый или Полный. Но на сколько воплотима данная идея - мне не понятно.

Автор:  mpeg [ Чт апр 21, 2011 18:58 pm ]
Заголовок сообщения: 

Kravejs писал(а):
Спроси у автора этой программки (у него есть мейл) согласиться ли он на основе нашей базы сделать Эсперанто-Русский словарь. Если да, то я с ним спишусь и сделаем эту экзотику.


Kravejs я - пас... :zam:
Уже один выходной убил на попытку подружить Nintendo DS c одной из самых совершенных флэшек с читалками интересных форматов для перевода на них Словаря... и считаю что свой долг перед Родиной уже честно выполнил... :zam:
В своё время покупал Nintendo DS в надежде, что она выиграет по популярности у портативной игровой приставки PSP в русскоязычном сегменте.
Однако как Вы верно заметили Nintendo DS на сегодня для русскоговорящих есть "экзотика".
С учётом того, что сейчас пионеры обнюхивают уже Nintendo DS 3D , то "экзотикой" она и останется.

Мне пока бумажного словаря Бокарева в связке с бумажным NPIV хватит как-нибудь.
Словарь Кондратьева изредка и на ПК смогу посмотреть.
Пока только для понимания происхождения слова "etoso"(тусовка) словарь оказал мне уникальную помощь.

Эксперименты со смартфонами слишком дорогие на фоне наличия новых тонких ноутбков-нетбуков с Win XP за 8-10.000 рублей:
- цена почти такая же, а то и меньше чем за смартфон
- вес и размер нетбука незначительно больше чем у смартфона.
- возможности для доступа к той или иной версии Словаря Кондратьева у ноутбука и больше и неизмеримо стабильнее.

Я конечно не собираюсь тему смартфонов совсем прикрывать для себя.
Но перспективным вижу что-то под открытую ОС - Андроид...
Только в Нижнем Новгороде с этой осью смартфоны от 7-8.000 рублей начинают продавать, что - дорого.
А оптимальный смартфон с сенсорным экраном от Нокии 5228 новый стоит сегодня 4.500 рублей за штуку, но его ось (Symbian OS 9.4) не поддерживает нужную для словаря программу.

Найти хорошее б/у с сенсорным экраном из старичков под .mobi - на сегодня уже проблема, которая будет только усугубляться.

Так что ждём-с а) усовершенствованных программ-читалок для смартфонов и б) дешёвый смартфон за 4-5.000 рублей с ОС - Андроид от LG, Panasonic и тому подобных производителей. :D

Автор:  mpeg [ Сб апр 23, 2011 9:49 am ]
Заголовок сообщения: 

А куда об ошибках версии словаря для Mobipocket Reader сообщать?

Например:
Через индекс не ищется слово "establi".

Приходиться заныривать в словарь через "esti" и дальше прокручивать текст, чтобы на "establi" выйти.

Автор:  Kravejs [ Сб апр 23, 2011 12:40 pm ]
Заголовок сообщения: 

mpeg писал(а):
А куда об ошибках версии словаря для Mobipocket Reader сообщать?


http://code.google.com/p/ervo/issues/list

В начале следующего месяца, вместе с обновлением словарной базы, выйдет новая версия электронной версии словаря. Там будет много исправлений, так как для генерации словаря сейчас используется заново переписанный скрипт.

Автор:  Kravejs [ Вс апр 24, 2011 18:59 pm ]
Заголовок сообщения: 

mpeg писал(а):
Через индекс не ищется слово "establi".


В новой версии, что должна выйти через неделю, должно искаться всё :)

Сейчас усиленно тестирую. Есть некоторые слова по которым генерируется масса индексов. Например,

Цитата:
opini/(o)/kontrol/o, opini/(o)/sond/(ad)/o


Превращается в такой код:

Код:
<p>
<idx:entry name="vortaro">
<idx:orth value = "opinikontrolo">
<idx:infl                       inflgrp="substantivo">
<idx:iform name="elizio"            value="opinikontrol"/>
<idx:iform name="pluralo"           value="opinikontroloj"/>
<idx:iform name="akuzativo"         value="opinikontrolon"/>
<idx:iform name="pluralakuzativo"   value="opinikontrolojn"/>
</idx:infl></idx:orth><a id="opinikontrolo" /><idx:orth value = "opiniokontrolo">
<idx:infl                       inflgrp="substantivo">
<idx:iform name="elizio"            value="opiniokontrol"/>
<idx:iform name="pluralo"           value="opiniokontroloj"/>
<idx:iform name="akuzativo"         value="opiniokontrolon"/>
<idx:iform name="pluralakuzativo"   value="opiniokontrolojn"/>
</idx:infl></idx:orth><a id="opiniokontrolo" /><idx:orth value = "opinisondo">
<idx:infl                       inflgrp="substantivo">
<idx:iform name="elizio"            value="opinisond"/>
<idx:iform name="pluralo"           value="opinisondoj"/>
<idx:iform name="akuzativo"         value="opinisondon"/>
<idx:iform name="pluralakuzativo"   value="opinisondojn"/>
</idx:infl></idx:orth><a id="opinisondo" /><idx:orth value = "opiniosondo">
<idx:infl                       inflgrp="substantivo">
<idx:iform name="elizio"            value="opiniosond"/>
<idx:iform name="pluralo"           value="opiniosondoj"/>
<idx:iform name="akuzativo"         value="opiniosondon"/>
<idx:iform name="pluralakuzativo"   value="opiniosondojn"/>
</idx:infl></idx:orth><a id="opiniosondo" /><idx:orth value = "opinisondado">
<idx:infl                       inflgrp="substantivo">
<idx:iform name="elizio"            value="opinisondad"/>
<idx:iform name="pluralo"           value="opinisondadoj"/>
<idx:iform name="akuzativo"         value="opinisondadon"/>
<idx:iform name="pluralakuzativo"   value="opinisondadojn"/>
</idx:infl></idx:orth><a id="opinisondado" /><idx:orth value = "opiniosondado">
<idx:infl                       inflgrp="substantivo">
<idx:iform name="elizio"            value="opiniosondad"/>
<idx:iform name="pluralo"           value="opiniosondadoj"/>
<idx:iform name="akuzativo"         value="opiniosondadon"/>
<idx:iform name="pluralakuzativo"   value="opiniosondadojn"/>
</idx:infl></idx:orth><a id="opiniosondado" />
<b>opini·(o)·kontrol·o, opini·(o)·sond·(ad)·o</b>  (вы́борочный) опро́с,
   иссле́дование обще́ственного мне́ния, отсле́живание
   обще́ственного мне́ния.
</idx:entry>
</p>

Автор:  Kravejs [ Пн апр 25, 2011 14:09 pm ]
Заголовок сообщения:  Что будет в новой версии

Что планируется в новой версии:

- Будет убран обратный русско-эсперанто индекс;
- Будет убран индекс по русским условным обозначениям;

+ Полная система индексации всех возможных форм слова, с учётом необязательных элементов;
+ Проставлены кросс-ссылки для слов с пометкой см. (смотри);
+ Добавлено содержание;
+ Обновлены дополнительные тексты "От автора" и "Грамматика". В дальнейшем эти тексты будут обновляться автоматически .
+ Добавлена страница "Условные сокращения";
+ Обложка словаря (спасибо Максиму Гришину!) теперь стандартного размера (800х600);
+ В названии файла для загрузки последнее число - номер версии скрипта для генерации словаря. Это число берётся автоматически. Полное название теперь выглядит так:
{ eoru | rueo } - {дата словарной базы} -r{версия скрипта} . {формат}

Например: eoru-2011-04-03-r104.azw - Эсперанто-Русский словарь, словарная база от 3 апреля 2011, сгенерирован программой версии 104, в оптимизированном для Amazon Kindle формате.

Планируется представлять словаря в нескольких форматах:

1. mobi - годиться для Mobipocket Reader & Amazon Kindle. содержит встроенный индекс.

2. azw - почти то же что и mobi, но будет оптимизирован для программы Amazon Kindle Reader.

3. epub - все то же, что и в предыдущих форматах, но нет внутреннего индекса. Будет добавлен визуальный индекс для быстрого перехода к нужному слову.

4. fb2 (под вопросом) - этот формат на сегодня самый популярный в России. Быстрый переход к нужным словам возможен с помощью дополнительной визуальной индексации.

Эта версия задумана как пред-релизная, максимально готовая к публикации.

Автор:  Kravejs [ Пт май 20, 2011 3:56 am ]
Заголовок сообщения: 

Обновление словарной базы от 2011-05-17.

http://ervo.googlecode.com/

Автор:  Maksimo [ Пт май 20, 2011 8:58 am ]
Заголовок сообщения:  Re: Что будет в новой версии

Kravejs писал(а):
- Будет убран обратный русско-эсперанто индекс;
- Будет убран индекс по русским условным обозначениям;

Простите, а почему убраны?

Не знаю, как другие, но я активно пользуюсь русским индексом. Пока нет русско-эсперантского словаря - это для меня незаменимая штука.
Без русского индекса я на эту версию переходить, пожалуй не буду.
Или я упустил какую-то очевидную штуку?

Автор:  palaman [ Пт май 20, 2011 10:40 am ]
Заголовок сообщения:  Re: Что будет в новой версии

Maksimo писал(а):
Не знаю, как другие, но я активно пользуюсь русским индексом. Пока нет русско-эсперантского словаря - это для меня незаменимая штука. Без русского индекса я на эту версию переходить, пожалуй не буду.
Или я упустил какую-то очевидную штуку?

Полностью поддерживаю.
Этот "русский индекс" на текущий момент - де-факто самый полный из известных мне русско-эсперантских словарей.

Автор:  Kravejs [ Пт май 20, 2011 11:38 am ]
Заголовок сообщения:  Re: Что будет в новой версии

Maksimo писал(а):
Простите, а почему убраны?

Не знаю, как другие, но я активно пользуюсь русским индексом. Пока нет русско-эсперантского словаря - это для меня незаменимая штука.
Без русского индекса я на эту версию переходить, пожалуй не буду.


Отвечу честно: мне не нравился алгоритм построения русского индекска в старой версии программы, но нового, хорошего, алгоритма я пока не придумал.

Если есть запросы, то этот индекс верну. Постараюсь улучшить алгоритм, чтобы индекс был более адекватным.

Автор:  Kravejs [ Пт июн 03, 2011 21:32 pm ]
Заголовок сообщения:  Новая версия

1. Обновление словарной базы от 2011-06-02ю
2. Вернул индекс по русским словам

http://code.google.com/p/ervo/

Замечания.

Скрипт для генерации словаря полностью переписан, поэтому индекс по русским словам создаётся несколько отличным от старой программы методом. Например, сейчас в индекс попадают слова выделенные курсивом. Хорошо это или плохо - не знаю.

Так как временные ресурсы ограниченны, то нет возможности основательно тестировать словарь. Либо я выкладываю словарь "как есть" и жду ваших замечаний, либо тестирую сам, но словарь при этом недоступен.

Технические моменты.

Сейчас преобразование из оригинальных текстовых файлов в формат Мобипокета происходит с помощью регулярных выражений. Тем, кто понимает что это такое даю ссылку на файл с этими самыми выражениями:
http://code.google.com/p/ervo/source/br ... n2html.ini

Собственно, всё построение индексов по русским словам происходит с помощью одного такого выражения:
[code]
(?<![а-яА-Я])([а-яА-Я]((́)|[а-яА-Я ])*)(?=[][_/.,;{}<>=])
[/code]
и то что найдено, заменяется на:
[code]
<idx:key name="Rusa" key="\1"/>\1
[/code]

Если есть мысли как сделать лучше - пишите.

Страница 5 из 6 Часовой пояс: UTC + 3 часа
Powered by phpBB® Forum Software © phpBB Group
https://www.phpbb.com/