|
|
Автор | Сообщение | Обсуждение словарей |
---|
SergeiSP Новичок
Сообщений : 19
| SergeiSP | :: Вс Мар 01 2009, 17:23 | Вс Мар 01 2009, 17:23 | |
| Хм. Как я понимаю, на данный момент под Ольгу нет качественных словарей? То что для Диалго, так в Ольге ошибок еще больше становиться, чем без этих словарей. В общем, либо я не догоняю чего-то, но есть хоть один словарь нормальный, или нет? |
|
|
| |
Stroodder V.I.P.
Сообщений : 97
Репутация : 7
| Stroodder | :: Вс Мар 01 2009, 18:35 | Вс Мар 01 2009, 18:35 | |
| SergeiSP Если найдете для Дигало нормальный, то и для Ольги можно сделать. |
|
|
| |
rquester V.I.P.
Сообщений : 137
Репутация : 16
| rquester | :: Пн Мар 02 2009, 02:54 | Пн Мар 02 2009, 02:54 | |
| SergeiSP Попробуйте "Книгодел" (в режиме Export). Он ставит ударения гораздо лучше всех словарей. Есть и возможность использовать для Ольги (три режима простановки ударений на выбор, выбираются в Настройках)... |
|
|
| |
Stroodder V.I.P.
Сообщений : 97
Репутация : 7
| Stroodder | :: Пн Мар 02 2009, 07:04 | Пн Мар 02 2009, 07:04 | |
| - Цитата :
- Он ставит ударения гораздо лучше всех словарей.
|
|
|
| |
rquester V.I.P.
Сообщений : 137
Репутация : 16
| rquester | :: Пн Мар 02 2009, 13:37 | Пн Мар 02 2009, 13:37 | |
| - Цитата :
- Он ставит ударения гораздо лучше всех словарей.
Именно так. Словари dic дают гораздо худший результат... Более того, увеличение размеров словарей уже мало что даст - улучшение распознавания ударения одних фраз будет сопровождаться ухудшением других... В Книгоделе используется гораздо более корректный алгоритм, который даёт сбои очень редко, причем, в основном, на фразах, которые и человек с трудом понимает. |
|
|
| |
Stroodder V.I.P.
Сообщений : 97
Репутация : 7
| Stroodder | :: Пн Мар 02 2009, 14:03 | Пн Мар 02 2009, 14:03 | |
| - Цитата :
- ...очень редко...
К сожалению ни одного факта или внятного аргумента Вы так и не смогли привести в подтверждение ни на этом, ни на других форумах, давайте не будем хотя бы в этой теме саморекламой заниматься и выдавать желаемое за действительное.
З.Ы. Если пользователь использует для обработки хлам, а не вычищенные словари, то и результат у него будет соответствующий. |
|
|
| |
rquester V.I.P.
Сообщений : 137
Репутация : 16
| rquester | :: Пн Мар 02 2009, 18:34 | Пн Мар 02 2009, 18:34 | |
| - Цитата :
К сожалению ни одного факта или внятного аргумента Вы так и не смогли привести в подтверждение ни на этом, ни на других форумах
Программа доступна для скачивания. Вполне можно проверить... Если хотите - можно сделать проверку - вы сами даёте текст (желательно какой-нибудь рассказ 30-50К, чтобы сравнение не заняло слишом много времени), я запускаю программу на последней выложенной версии (чтобы не мог "подстроить алгоритм"), без дополнительных словарей (кроме "Поиск неизвестных слов" с расстановкой ударений, хотя можно и без этого)) и мы проверяем число ошибок... Режим только омонимы отключен. Глюки движков не считаются (т.е. если в тексте ударение стоит првильно, а движок читает некорректно - подобные вещи не учитываются). - Цитата :
, давайте не будем хотя бы в этой теме саморекламой заниматься и выдавать желаемое за действительное.
Так в теме есть несколько человек, которые уже пользуются Книгоделом и вполне довольны... Какая уж тут самореклама... - Цитата :
З.Ы. Если пользователь использует для обработки хлам, а не вычищенные словари, то и результат у него будет соответствующий.
Чистка словарей тут мало что даёт... Но если Вы считаете, что Ваш словарь- намного лучше, можно провести проверку и Вашей методики. Только текст в данном случае должно давать третье, нейтральное лицо... |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Пн Мар 02 2009, 20:36 | Пн Мар 02 2009, 20:36 | |
| Воздержусь от оценки "книгодела", возможно подобная идея и имеет право на существование.Хотя на мой взгляд идея крайне утопическая. Просто отмечу, что тема подразумевает обсуждение словарей для Ольги. А как вы ответили в своей ветке, в ближайшей перспективе их создание вашей программой не планируется. Так что столь пространные споры только засоряют данную ветку форума и создают ошибочные иллюзии в умах неопытных посетителей. Надеюсь здравый смысл возобладает и здесь будут обсуждаться именно словари. |
|
|
| |
rquester V.I.P.
Сообщений : 137
Репутация : 16
| rquester | :: Пн Мар 02 2009, 21:16 | Пн Мар 02 2009, 21:16 | |
| Lexus - Цитата :
- Хотя на мой взгляд идея крайне утопическая.
Чем же она утопическая, если она уже работает, причем лучше словарей dic. - Цитата :
Просто отмечу, что тема подразумевает обсуждение словарей для Ольги.
Так Книгодел с Ольгой работает и для него, в принципе, тоже можно писать словари (в основном - словари фразеологизмов, остальное он корректно отслеживает). - Цитата :
А как вы ответили в своей ветке, в ближайшей перспективе их создание вашей программой не планируется. Так не "не планируется", а принципиально невозможно - не конвертируются данные в dic формат, никак... И это еще одна причина переходить на Книгодел(или что-то похожее, если найдётся) - возможностей словарей формата dic недостаточно.
- Цитата :
Так что столь пространные споры только засоряют данную ветку форума и создают ошибочные иллюзии в умах неопытных посетителей.
Какие "ошибочные иллюзии", когда программа уже существует и уже лучше аналогов? В ветке Книгодела, кстати, в основном, как раз опытные посетители сидят... |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Чт Апр 30 2009, 22:32 | Чт Апр 30 2009, 22:32 | |
| А как заставить правильно читать слово "авторитетны". Читает как "авторитэтны" |
|
|
| |
however63 Новичок
Сообщений : 10
Репутация : 1
| however63 | :: Пт Май 01 2009, 12:05 | Пт Май 01 2009, 12:05 | |
| Maqo попробуй вот так авторитетны=авторитьэтны "авторитетны" = "\SAMPA=(Vft@r'it'"Etn1#)" Как правильно и в какие словари заносить подобные слова не знаю и сколько вообще словарей нужно в Балаболке, MP3book2005, …
Неплохо было бы кто нить из опытных написал FAQ для новичков |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Пт Май 01 2009, 12:46 | Пт Май 01 2009, 12:46 | |
| Спасибо, оба варианта работают. Надо заносить либо первое в словарь Балаболки, либо второе в *.lex файл (loqlexerом) |
|
|
| |
Stroodder V.I.P.
Сообщений : 97
Репутация : 7
| Stroodder | :: Пт Май 01 2009, 21:53 | Пт Май 01 2009, 21:53 | |
| Mago Ну так как Ольга, благодаря Йишику (его и еще одного комрада кстати надо благодарить), стала доступной, появилась прога Phonolgaph, а потом уже LoqLexer, на которых можно испытывать транскрипцию. Поищи в форуме, я эти утилиты для изучения Ольги и писал. |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Сб Май 02 2009, 00:26 | Сб Май 02 2009, 00:26 | |
| Stroodder, эээ..ты вообще о чём?
- Цитата :
- Надо заносить либо первое в словарь Балаболки, либо второе в *.lex файл (loqlexerом)
Это было утверждение... |
|
|
| |
however63 Новичок
Сообщений : 10
Репутация : 1
| however63 | :: Сб Май 02 2009, 09:28 | Сб Май 02 2009, 09:28 | |
| Stroodder неплохо было бы взглянуть на Phonolgaph |
|
|
| |
however63 Новичок
Сообщений : 10
Репутация : 1
| however63 | :: Сб Май 02 2009, 12:33 | Сб Май 02 2009, 12:33 | |
| Maqo - Цитата :
- Надо заносить либо первое в словарь Балаболки
поточнее в какой именно |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Сб Май 02 2009, 14:02 | Сб Май 02 2009, 14:02 | |
| Ну как в какой? В любой. У программы балаболка есть возможность использования словарей. Нажимаем соответствующую кнопочку на тулбаре и справа появляется список словарей где их можно подключать/отключать/создавать/удалять/редактировать |
|
|
| |
however63 Новичок
Сообщений : 10
Репутация : 1
| however63 | :: Вс Май 03 2009, 11:20 | Вс Май 03 2009, 11:20 | |
| Maqo - Цитата :
- Ну как в какой? В любой.
в любой не пойдёт. Для чего тогда столько слоарей? |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Вс Май 03 2009, 22:03 | Вс Май 03 2009, 22:03 | |
| для удобства |
|
|
| |
SergeiSP Новичок
Сообщений : 19
Репутация : 0
| SergeiSP | :: Вт Май 05 2009, 16:49 | Вт Май 05 2009, 16:49 | |
| Так все-таки, какой на данный момент оптимальный словарь для Ольги? |
|
|
| |
however63 Новичок
Сообщений : 10
Репутация : 1
| however63 | :: Вт Май 05 2009, 22:40 | Вт Май 05 2009, 22:40 | |
| SergeiSP словари + новые слова |
|
|
| |
AlexDJ Наблюдатель
Сообщений : 2
Репутация : 0
| AlexDJ | :: Вт Июн 02 2009, 12:21 | Вт Июн 02 2009, 12:21 | |
| Скажите а можно ли самому создавать или редактировать эффекты типа смех пчих и т.д.? |
|
|
| |
druss87 Интересующийся
Сообщений : 5
Репутация : 2
| druss87 | :: Чт Июн 04 2009, 03:18 | Чт Июн 04 2009, 03:18 | |
| Здравствуйте!!! Скажите, пожалуйста, как исправить глюк с окончаниями слов, заканчивающимся на согласные буквы, если ударная гласная стоит перед последней согласной. Ольга делает во всём слове (до знака ударения) ударение правильно, а согласную букву читает отдельно. Т.е., например: оди' ^'н - читает как - [ади эн], капита' ^'л - как - [капита эл], сравни' ^'ть - [сравни тэ мяхкий знак]. Читаю Балаболкой, Подготавливая текст Книгоделом. Кстати, словаря, example.lex в указанной директории (C:\Program Files (x86)\Loquendo\LTTS7\bin) нет. Может у меня с настройками Балаболки что-то не то? |
|
|
| |
Moro Наблюдатель
Сообщений : 1
Репутация : 0
| Moro | :: Вт Июн 23 2009, 22:27 | Вт Июн 23 2009, 22:27 | |
| Словарей много, а какие оптимально подключаете на Ольгу? Тут, как я понимю такой вариант, что можно маслом кашу испортить :-) |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Ср Июн 24 2009, 12:36 | Ср Июн 24 2009, 12:36 | |
| - Цитата :
- Тут, как я понимю такой вариант, что можно маслом кашу испортить
Берете готовые и творчески перелопачиваете , так как очень много ошибок.
Группа по созданию словарей напоминает хорошо законспирированную группу революционеров-заговорщиков. Что на мой взгляд только вредит делу |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Чт Июн 25 2009, 23:41 | Чт Июн 25 2009, 23:41 | |
| дада подтверждаю lev55 умничка, сам словари проверяет, это очень сложно поверьте если со словарями Аленки более менее, хотя тоже есть свои моменты, то для Ольги все думают что они "словари" будут делаться сами а я просто подожду и скачаю потом, может, если конечно захочу, и тоже может быть |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Пт Июн 26 2009, 12:23 | Пт Июн 26 2009, 12:23 | |
| На мой взгляд, созданию словарей препятствует не пассивность пользователей, а недостатки программных средств, информации о словарях и сама методика их создания.
Тот же LoqLexer остановился в развитии и несмотря на все его достоинства, очень сырой, при проверке словарей может зажевывать правила, да и в плане удобства не помешали бы доработки в нем. Средства самой Ольги (java) по созданию словарей очень прожорливы и громоздки . Да и методы создания правил с пресловутым ' ^' отпугивают многих своей неоднозначностью . При обработке таких правил в читалках есть вопросы. Возможно и организация процесса уступает той же Алене.
Судя по составу участников считал что разработкой словарей Ольги занимается группа по созданию "Специализированных корпусных словарей". Теперь понял, что это не так. |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Июн 30 2009, 00:00 | Вт Июн 30 2009, 00:00 | |
| Как я понял lev55 мыслит масштабами космических кораблей. А нам, смертным хорош был бы и простой трактор. Не вдаваясь в заоблочные выси лексической омонемии хотелось бы иметь словари обычных слов (не омографов), которых миллионы и которые Ольга произносит неправильно. А для этого достаточно того же хорошо известного loqlexera и конечно же словарной базы. Вот именно эта база, обязательно с проставленными ударениями и может стать основой базового словаря для ольги. Пресловутый словарь Зализняка к Ольге уже прикручен. Аминь. Но это лишь капля во многомиллионом море русского языка. Добавляя по паре сотне слов каждым пользоватем проблему не решит, так как для этого потребуются годы, а за это время появится более совремнный движок. И все начнется сначала.
Нужно идти по пути поиска означенных словарей
Можно взять пример у rquester в его книгоделе:
- Цитата :
- Во-первых используется далеко не словарь Зализняка:
а)Он значительно пополнен (например, именами и географическими названиями, которых у Зализняка в принципе нет, кроме того, значительно пополнен сам словарь - фантастические, компьютерные термины и т.д. (написан собственный редактор словоформ, правда, пока не особо удобный для конечных пользователей... Это всего лишь возможные направления. |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Июн 30 2009, 22:44 | Вт Июн 30 2009, 22:44 | |
| - Цитата :
- Пока у меня на час прослушивания 1-2 ошибки, не учитывая имён и числительных.
Ну так это ведь в одной книжке, умножьте на 8 часов (средняя книга)ну и хотя бы 130 тыс (кол-во книг в одной из эл. библиотек)
- Цитата :
- Пусть Lexus этим и займётся. Я умываю руки.
Это Вы зря, уважаемый. В спорах рождается истина. |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Ср Июл 01 2009, 12:03 | Ср Июл 01 2009, 12:03 | |
| Вообще-то если 1000 человек пришлет по 2000 слов, то теоретически получится приличный словарь, почти на все случаи жизни. Но опять же, откуда возьмётся 1000 любителей ольги. Ведь это должны быть очень даже грамотные в компьютерном деле люди. Плюс увлекающиеся чтением, чтобы прочитать 130 книг, да ктому же просто грамотные, чтобы знать как произносятся и пишутся слова. Ну а поскольку люди эти будут примерного одного образовательного уровня, то и читать они будут примерно один и тот же список книг. Следовательно вся библиотека никогда не будет охвачена и словарь никогда не будет полным. Вывод - TTS и словари тоько тогда будут качественными, когда станут массовыми т.е. всенародными, а не элитарными. Несколько маленьких шагов благодаря созданию форума сделано. Но как распиарить эту идею до уровня домохозяек нужно думать дальше. |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Ср Июл 08 2009, 13:54 | Ср Июл 08 2009, 13:54 | |
| В некоторых словах Ольга глотает в конце букву и, например - бобами. Как с этим бороться? |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Ср Июл 08 2009, 16:27 | Ср Июл 08 2009, 16:27 | |
| бобами=боб^аами |
|
|
| |
king Новичок
Сообщений : 24
Репутация : 0
| king | :: Чт Июл 09 2009, 18:12 | Чт Июл 09 2009, 18:12 | |
| Всё по порядку установил со странички Словари до момента:
Reg -файл для Ольги http://depositfiles.com/files/kcu8z6h0n , там всё прописано.
С depositfiles не смог скачать. Этот файл обязательно устанавливать, или он нужен только для словарей николая? Если найду неправильные слова, то через форму в какое окошко писать. Например:
Гражданская война, продолжавшаяся с 1936 по 1939 год,
в балаболке после всех операций:
Гражданская война, продолжавшаяся с 1936 по тысяча девятьсот, |
|
|
| |
olvlad Наблюдатель
Сообщений : 1
Репутация : 0
| olvlad | :: Сб Июл 25 2009, 01:37 | Сб Июл 25 2009, 01:37 | |
| подскажите кто знает я установил балаболку и Ольгу словарь подключил но читает очень быстро и скорость не меняется регулировкой что это может быть ? |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Ср Сен 09 2009, 19:34 | Ср Сен 09 2009, 19:34 | |
| Постепенно набрался список слов которые не удаётся самому красиво исправить. Очень прошу помочь
- Спойлер:
вонючая. вонючий. ленюсь. борьба, отчаяние. перерезают нервы. вместе с . истерик, слез. бангкок. бангкокского. головоногое. одиннадцатого. пиететом. стенного. степенью. отозвалась Ася тоже. изрыгнул. надежды юношей питают. ставя. присылайте на. маркетинга Герман. степень. двуногое. душней. едина. подсел. подчинюсь. я таким текстам не верю. неучам. прошелестев. то это еще терпимо. хрустевшие. нюхают? ещё идеи по доработке. в армии служил. изжога. не проделка, а.
|
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Пн Сен 14 2009, 02:44 | Пн Сен 14 2009, 02:44 | |
| lev55, Это вам большое человеческое спасибо за то, что вносите основной вклад в словари Ольги
Основываясь на обновлённых словарях, прошу рассмотреть следующие предложения:
Если кинуть тот список слов в Балаболку, почему то первое слово читается неправильно (даже если поменять вонючая и вонючий местами) - но в реальных текстах я думаю всё будет в порядке
Вместо целых словосочетаний может лучше писать слова? борьба,=борьба; "нервы" = "\SAMPA=(#n'y"erv1#)" юношей=-юношей "присылайте" = "\SAMPA=(pr'is@5"aLt'y@)" "терпимо" = "\SAMPA=(#t'@rp'"imV#)" "идеи" = "\SAMPA=(#id'y"ei#)" "армии" = "\SAMPA=(#"armii#)" проделка,=проделка;
истерик может можно и без запятой? "истерик" = "\SAMPA=(ist'y"er'ik#)"
"Ася" произносится как Аса, может лучше так? Ася=^Асия
прошелестев=прошелесте' ^'в - так не пойдёт, читает "прошелестевээ" |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Пн Сен 14 2009, 12:36 | Пн Сен 14 2009, 12:36 | |
| Значит вместо
- Код:
-
борьба, отчаяние=борьба; отчаяние борьба,=борьба; , должно быть просто
- Код:
-
борьба,=борьба; так?
"присылайте" - так у вас и было @. Я имел ввиду что если записать это слово отдельно от "на", то тоже хорошо читает.
А что это за Loquendo.SAPI51.msi ? У меня от его установки в системе никаких новых файлов не появляется почемуто. Может оно уже встроено в Ольгу?
Вот как у меня читает Ольга "прошелестев" с текущими словарями - http://slil.ru/27980579
Остальное всё понял, спасибо. |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Пн Сен 14 2009, 15:19 | Пн Сен 14 2009, 15:19 | |
| lev55 С обновленным SAPI в балабокином словаре заработали ли конструкции с sampa. Или это тоже пока еще фантастика. |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Пн Сен 14 2009, 17:07 | Пн Сен 14 2009, 17:07 | |
| lev55 Loquendo.SAPI51.msi точно ничего не добавляет и не меняет у меня на компе (Windows XP sp3 PRO) Только появляется msi файл в C\WINDOWS\Installer\. Я ставлю его в песочницу поэтому заметил бы любые изменения. Вообще странные дела. Попробывал установить в чистой виртуалке (Windows Xp SP2 Pro) Там тоже ничего нового не появляется и не меняется. Даже посмотрел с помощью Procmon чего делается в system32 - а ничего не делается. Пошёл дальше и вытащил файлы из установщика вручную и скопировал в систему. Вот эти файлы:
- Спойлер:
C:\Program Files\Common Files\Microsoft Shared\Speech\sapi.cpl C:\Program Files\Common Files\Microsoft Shared\Speech\sapi.dll C:\Program Files\Common Files\SpeechEngines\Microsoft\spcommon.dll C:\Program Files\Common Files\Microsoft Shared\Speech\1049\spcplui.dll C:\Program Files\Common Files\SpeechEngines\Microsoft\TTS\1033\spttseng.dll C:\Program Files\Common Files\Microsoft Shared\Speech\sapisvr.exe C:\Program Files\Common Files\SpeechEngines\Microsoft\Lexicon\1033\ltts1033.lxa C:\Program Files\Common Files\SpeechEngines\Microsoft\Lexicon\1033\r1033tts.lxa C:\Program Files\Common Files\SpeechEngines\Microsoft\TTS\1033\Mary.SDF C:\Program Files\Common Files\SpeechEngines\Microsoft\TTS\1033\Mike.SDF C:\Program Files\Common Files\SpeechEngines\Microsoft\TTS\1033\Sam.SDF C:\Program Files\Common Files\SpeechEngines\Microsoft\TTS\1033\Mary.SPD C:\Program Files\Common Files\SpeechEngines\Microsoft\TTS\1033\Mike.SPD C:\Program Files\Common Files\SpeechEngines\Microsoft\TTS\1033\Sam.SP
Ничего пока не изменилось. Может ещё какие то ключи в реестре нужны.
Даже не знаю почему у меня неправильно читает прошелестев. Вот мой Russian.rex - http://slil.ru/27981430 дефолтный я его не менял.
После преобразования в Балаболке по ctrl+T, получается прошелесте' ^'в, в LoqLexer прошелесте' ^'в тоже читается прошелестевэ. Хелп плиз. lev55 посмотрите пожалуйста что у вас получается по ctrl+T и есть ли запись в лексиконе для этого.
Вообще если после ' ^' стоит одна-две буквы они у меня всегда читаются как бы отдельно прошелесте' ^'в - читается как "прошелесте вэ" приве' ^'т - читается как "приве тэ" побыстре' ^'й - вообще читает "побыстре и краткая"
Так что тут что-то не так. Очень прошу разобраться |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Пн Сен 14 2009, 17:24 | Пн Сен 14 2009, 17:24 | |
| Если в текстовое окно балаболки записать \SAMPA=(#t@rp'"imV#). Прочтет ли она его или как и раньше только знаки. |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Пн Сен 14 2009, 17:51 | Пн Сен 14 2009, 17:51 | |
| У меня читает знаки |
|
|
| |
Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Пн Сен 14 2009, 19:50 | Пн Сен 14 2009, 19:50 | |
| lev55 Спасибо, друг!!. Именно этого значения в реестре у меня в компе и не хватало. Прошу прощения за невнимательное чтение страницы со словарями. А на что нибудь ещё кроме слова прошелестев это оно влияет? |
|
|
| |
flint2 Посетитель
Сообщений : 43
Репутация : 11
| flint2 | :: Ср Сен 16 2009, 19:25 | Ср Сен 16 2009, 19:25 | |
| Подскажите, как отредактировать слова в лексиконе, или в словаре, или другим методом - Цитата :
- кал^оша
пор^оша т^уша и им подобные, которые кончаются на "оша" или "ша"? |
|
|
| |
flint2 Посетитель
Сообщений : 43
Репутация : 11
| flint2 | :: Чт Окт 08 2009, 17:01 | Чт Окт 08 2009, 17:01 | |
| И ещё. В лексиконе слова типа кастетом=kVst'@"et@m# добовляется Y и @ между смягчающим знаком и "ударением" - '". Я пробовал заменять ", и ." на ; и :. Помоемому нормально. |
|
|
| |
muk79 Участник «online словари»
Сообщений : 102
Репутация : 29
| |
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Дек 29 2009, 09:17 | Вт Дек 29 2009, 09:17 | |
| Все-же информация о времени обновления словарей в ветке или их версия очень желательны. Не у всех хороший доступ в нет. |
|
|
| |
muk79 Участник «online словари»
Сообщений : 102
Репутация : 29
| muk79 | :: Вс Мар 28 2010, 23:26 | Вс Мар 28 2010, 23:26 | |
| evilone_ Аленкин словарь запросто подходит к Ольге только нужно перевести большие буквы в ' ^' на подобии O+lga.dic только без плюсов.
Все ссылки в проверялке уже не рабочие, я так понимаю словари будут другие уже? |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Мар 31 2010, 08:05 | Ср Мар 31 2010, 08:05 | |
| так, сделали вам словарики для возможности чтения ольки со словарями аленки на лету без каких-либо лишних действий, работает пока только для стандартного метода замен
подключать как и у аленки нужно два словаря (словарь замен и словарь корректор) плюс дополнительный словарь для перевода ударений в формат ольки:
corector-olga.ini (корректор) alenka-to-olga.dic (ударения) omograph.dic (аленкин словарь)
попробуйте, вдруг будут ошибки
lev55 а такие правила точно работали? у меня есть более ранняя версия 390 но в ней - Цитата :
- *олет=олёт
пистолет=пистолет Длжно получится - пистолет. получается всегда пистолёт при любом методе |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Ср Мар 31 2010, 12:48 | Ср Мар 31 2010, 12:48 | |
| evilone_
Поясните, зачем это в corector-olga.ini, вроде будет только портить.
- Код:
-
#----------------------------------------------------------------------pronounce_cor @А=а @Е=е @Ё=ё @И=и @О=о @У=у @Ы=ы @Э=э @Ю=ю @Я=я В alenka-to-olga.dic лучше - Код:
-
$*Ё*=ё Но все равно будет создавать проблемы с разделением интонаций в предложениях. В начале предложений после точек должны быть большие буквы. А эти правила, задуманные для других целей, создадут проблемы.[i] |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Мар 31 2010, 18:45 | Ср Мар 31 2010, 18:45 | |
| - Цитата :
- Поясните, зачем это в corector-olga.ini, вроде будет только портить.
механизм там такой: -сначала идет обработка текста ini корректором (корректируется тире, пробелы между словами и знаками препинания и прочая ерунда) плюс идет замена всех заглавных гласных на строчные - далее идет обработка двумя dic словарями (сначала, поскольку правила самые длинные, срабатывает словарь замен omograph.dic а за ним словарь для перевода ударений поскольку в нем самые коротенькие правила)
правила убирающие заглавную гласную в словах по тексту нужны для того чтобы при замене словарем ударений замены вида - Цитата :
- $*О*=^о
$*У*=^у $*Ы*=^ы $*Э*=^э
не меняли заглавные безударные букавки на ударения и олька их произносила правильно, например
- Цитата :
- Они назвали море, залив и материк именем Росса. Они назвали горы именами своих друзей и покровителей. Они нарекли два вулкана, видневшихся на горизонте, в честь своих кораблей - вот этих самых кораблей, – дав дымящимся горам названия Террор и Эребус.
получится - Цитата :
^они назвали море, залив и материк именем Росса. ^они назвали горы именами своих друзей и покровителей. ^они нарекли два вулкана, видневшихся на горизонте, в честь своих кораблей - вот этих самых кораблей, – дав дымящимся горам названия Террор и Эребус. ерунда получится
просто у аленки ударение указывается в виде заглавной буквы в словах, но если слова нет в лексиконе то ей все равно какие там буквы в слове, заглавные или строчные у ольки в принципе тоже но поскольку словарь для перевода ударений простой до безобразия то при переводе для простоты все гласные переводятся в строчные потому что словарь ударений будет ставить ударение для всех гласных - и ударных и безударных, а это неправильно
можно и через плюсы но тогда, для того чтобы можно было пользоваться словарем аленки, нужно сперва заглавную перевести в строчную с плюсом а потом строчную с плюсом перевести в ударение, это долго и читать на лету уже не получится
у меня ольки установленной нет и я не могу проверить как она читает, но визуально вроде работает попробуйте послушать какой-то текст, как оно будет читать, если плохо то выкинем, если нормально то будет как запасной или альтернативный вариант |
|
|
| |
flint2 Посетитель
Сообщений : 43
Репутация : 11
| flint2 | :: Пт Апр 09 2010, 11:00 | Пт Апр 09 2010, 11:00 | |
| Lev55 Есть предложение. После того, как стали обрабатываться двойные слова с чёрточкой, то наверное надо избавиться от старого наследия в словарях. Такие правила Беркли-сквер=Беркли-скве' ^'р, Анка-пулеметчица=Анка-пулемётчица и Брайтон-Бич=Бр^айтон-Бич надо заменить на сквер=скве' ^'р, пулеметчица=пулемётчица и Брайтон=Бр^айтон а такие *-вахтера=-вахтёра и ковер-самолет=ковёр-самолёт )) вообще ненужны! Предлагаю разделить эту работу надвоих. Я возьму словарь Ё-моё, а ты 1Olga или наоборот. Ку или не Ку? |
|
|
| |
|
Обсуждение словарей |
---|