|
| |
Автор | Сообщение | Балаболка |
---|
evilone_ Участник «online словари»
Сообщений : 859
| evilone_ | :: Ср Дек 16 2009, 23:16 | Ср Дек 16 2009, 23:16 | |
| вот тут еще подумалось... сейчас в программе есть три формата словарей но реально 4 метода обработки может быть разделить словарь dic отдельно на быстрый и простой с возможностью одновременного подключения и работы двух словарей по разным методам как например ini+dic например чтобы была последовательность при смешанном наборе словарей - ini+dic(быстрый)+dic(стандартный) или ini+dic(стандарный)+dic(быстрый) только при этом разделить словари скажем на dic стандартный dem демагог форматы или четко указать где-то в свойствах словаря что его нужно обрабатывать в стандартном или быстром режимах
возможно из-за применения смешанных словарей будет падать скорость но с одной стороны пользователь сможет для себя выбрать "золотую середину" между качеством замен и скоростью чтения путем включения\выключения нужных словарей а с другой это значительно может улучшит качество расстановки ударений в тексте за счет комбинирования словарей
это было бы очень удобно и избавило от путаницы с форматами |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Чт Дек 17 2009, 04:04 | Чт Дек 17 2009, 04:04 | |
| evilone_ То есть, Вам мало двух форматов словарей (INI и DIC), и Вы хотите превратить их в три формата? Потом Вы захотите менять порядок применения словарей (три формата дадут шесть вариантов последовательностей применения форматов словарей). Или создать некий новый формат для сохранения содержимого панели словарей (где все словари размещены в определенном порядке и некоторые из них отмечены "галочками").
Простите, это не то, чем я хочу заниматься. Коррекция произношения была задумана как исправление звучания лишь некоторых слов или словосочетаний; для более серьезной обработки текстов нужны другие методы (и другие утилиты). Или можно переложить эту работу на разработчиков голосов... |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Пт Дек 18 2009, 10:26 | Пт Дек 18 2009, 10:26 | |
| Автор спасибо за ответ! Сейчас попробую. |
|
| | | Raido Наблюдатель
Сообщений : 1
Репутация : 3
| Raido | :: Сб Дек 26 2009, 14:42 | Сб Дек 26 2009, 14:42 | |
| balabolka, в последней версии 1.29.0.435 программы - битый setup.exe Исправте, и спасибо за программу! |
|
| | | CryBiT Наблюдатель
Сообщений : 1
Репутация : 0
| CryBiT | :: Сб Дек 26 2009, 17:59 | Сб Дек 26 2009, 17:59 | |
| - Raido пишет:
- битый setup.exe
рано ты праздновать начал |
|
| | | ptoton Бывалый
Сообщений : 108
Репутация : 25
| ptoton | :: Сб Дек 26 2009, 18:30 | Сб Дек 26 2009, 18:30 | |
| setup в архиве для версии 1.29.0.435 действительно битый |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Сб Дек 26 2009, 21:05 | Сб Дек 26 2009, 21:05 | |
| Заново выложил архив, сейчас должно быть все нормально. Спасибо за сообщение. |
|
| | | bober Наблюдатель
Сообщений : 3
Репутация : 1
| bober | :: Чт Янв 07 2010, 06:57 | Чт Янв 07 2010, 06:57 | |
| Пользуюсь голосом ольги. Проблема с некоторыми книгами. Подскажите как сделать чтобы книги на русском в которых присутствует много предложений и пояснений на английском читались разными голосами. Например ольга читает русские предложения а напимер симон английские. Я читал в справке к балаболке про использование тегов но если я правильно понял их нужно расстовлять каждый раз для каждой смены языка. Вот пример из справки программы балаболка. <voice required="Language=409"> A U.S. English voice should speak this. </voice> <lang langid="419"> Это предложение будет прочитано русским голосом. </lang> Но если вся книга кишит смешенными предложениями либо прослушивание превращается в кошмар, либо вылавливание разноязыковых строк.
Есть ли какой-нибудь еще способ кроме тегов сделать что-бы балаболка читала английские и русские слова на соответствующих языках, или может есть способ выставить теги только в начале книг а не при каждой смене языка? Заранее спасибо и извиняюсь если натупил. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Чт Янв 07 2010, 17:31 | Чт Янв 07 2010, 17:31 | |
| bober Рекомендую использовать программу mp3book2005, там есть возможность использовать второй (английский) голос для чтения слов, состоящих из латинских букв.
Моя программа рассчитана не только на русскоязычных пользователей, так что я не стал добавлять функцию чтения кириллических и латинских букв разными голосами - подобную опцию не смогли бы использовать иностранные пользователи программы. В "Балаболке" менять голос можно лишь при помощи тегов. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Чт Янв 07 2010, 22:55 | Чт Янв 07 2010, 22:55 | |
| balabolka Случайно безвозвратно удалил файл словаря. Но в программе в общем списке замен правила из него еще существует вместе с другими словарями. Вопрос, существует ли способ выцарапать его из общего списка? Или как вариант сохранить этот список в виде файла. Очень много работы пропадает. finrederом не поднять |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| | | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Янв 10 2010, 21:45 | Вс Янв 10 2010, 21:45 | |
| - evilone_ пишет:
- а с какой версии была замена тире в словосочетаниях на пробел при обработке словаря?
Не припомню, чтобы что-то здесь менял. Судя по тексту программы, дефис внутри слова рассматривается стандартным методом как граница слова, то есть "джаз-клубов" - это два слова, "джаз" и "клубов". Я посмотрел тексты старых версий программы (те, что еще остались) - дефис всегда так обрабатывался. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Пн Янв 11 2010, 09:53 | Пн Янв 11 2010, 09:53 | |
| Раньше такие слова обрабатывались как одно. Вот такая не очень приятная новость. Как я помню были попытки изменить только обработку словарей омографоф. А нельзя ли сделать какую нибудь галочку для отключения этого сомнительного новшества? |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Янв 11 2010, 21:58 | Пн Янв 11 2010, 21:58 | |
| Хорошо, в 436-ой версии дефис внутри слова не будет считаться границей между словами при использовании стандартного метода. Не уверен, что это абсолютно правильно; тогда для того, чтобы применять правила к таким словам, как, например, "генерал-полковник", нужно записывать слова со "звездочками" в правилах: генерал*, *полковник. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Янв 11 2010, 22:39 | Пн Янв 11 2010, 22:39 | |
| Хочу дать небольшие пояснения по поводу нового пункта меню "Иностранные слова" в 436-ой версии. Этот пункт автоматически расставляет теги для смены голосового движка при чтении, например, слов из латинских букв. Меня несколько раз просили сделать что-то подобное; вот и в данной теме, несколькими постами выше, речь идет об этих тегах.
Понимаю, что лучше было бы добавить в программу полноценный второй экземляр голоса - как это сделано в mp3book2005. Я тоже уже реализовывал подобный способ переключения между голосами, когда писал для немцев программу на заказ. Но это ОЧЕНЬ большая морока; придется, например, скурпулезно подсчитывать, с какого символа текста какой голос начинает чтение, применять словари по отдельности к русским и нерусским кускам текста (а это, по идее, должны быть разные словари, для разных языков и голосов) и т.д. Сейчас у меня нет никакой мотивации, чтобы начинать подобную модификацию программы.
Поэтому (пока, по крайней мере) ограничился лишь вариантом с использованием тегов. Реализовано это только для тегов SAPI 5 (от SAPI 4 пора постепенно отходить, мне все чаще приходят письма о том, что пользователи никак не могут установить движок SAPI 4 на Win7). Желательно вообще использовать эту функцию в Unicode-версии программы "Балаболка", чтобы нормально, например, обрабатывались немецкие буквы с умлаутами (в ANSI такие немецкие буквы сопадают с русскими буквами). Но если речь идет только лишь о русских текстах с английскими словами, то можно работать и в 1.хх версии "Балаболки".
Не все речевые движки нормально воспринимают переключение голосов. Так, голоса Voiceware стабильно дают ошибку при выходе из программы, если хотя бы раз они принимали участие в смене речевого движка (я скачал и проверил даже японский голос Misaki - он тоже дает ошибку при выходе из "Балаболки").
Не стал заниматься обработкой ситуаций, когда в тексте есть и слова из латинских букв, и римские числа. Сейчас пользователь должен сам решать, как ему обрабатывать подобные тексты. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Янв 12 2010, 10:48 | Вт Янв 12 2010, 10:48 | |
| Теперь быстрый и простой метод будут работать единообразно. Это хорошо. Но может быть, чтобы все были довольны, сделать настройку, чтобы каждый мого выбрать по вкусу, как обрабатывать дефис? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Янв 12 2010, 13:29 | Вт Янв 12 2010, 13:29 | |
| - Цитата :
- иногда очень хочется как-то выделить диалог
Вот где Ольга может пригодиться. Диалоги у нее эмоционально насыщены.Выделять ничего не нужно. Может присоединитесь? |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вт Янв 12 2010, 14:21 | Вт Янв 12 2010, 14:21 | |
| - evilone_ пишет:
- первое что бросилось в глаза что идет замена римских чисел
Так я и писал о том, что римские числа специальным образом никак не обрабатываются. Подумаю, что тут можно сделать.
- evilone_ пишет:
- вспомнилось по поводу - а планируется (сложно\нужно) реализовать такую же расстановку только для диалогов, как в koobaudio, т.е. чтобы можно было сменить голос\скорость чтения для обычного текста и диалогов так же расстановкой тегами?
Не считаю такую функцию важной - потому что диалоги всё равно должны читаться голосами разного пола. Пока искусственный интеллект не научится отличать внутри текста речь женщины от речи мужчины или слова, произнесенные ребенком, от высказывания взрослого - к чтению диалогов разными голосами нельзя относиться серьезно; подобное "раскрашивание" всё равно придется выполнять вручную.
Менять скорость/голос при чтении слов автора и прямой речи - мне это не нравится. Я слышал, как подобная фунция работает в других программах, и результаты меня не впечатлили (скорее, я убедился в том, что делать подобное совсем не стоит). Спасибо за идею, но пока не готов заниматься подобными вещами. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Янв 12 2010, 14:24 | Вт Янв 12 2010, 14:24 | |
| Обработка дефиса одним словом насущная необходимость. Открою маленький секрет, Ольга в своем словаре не обрабатывает правила с дефисом. Если их еще и балаболка не будет обрабатывать, то их вообще ничем не исправить. А проблемы с такими словами существуют например слово "все-таки". Можно конечно придумать двойную замену и прочие доставания правого уха левой рукой, но лучше, если это будет выполнено чрез словарь в простом и понятном виде. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Янв 12 2010, 16:13 | Вт Янв 12 2010, 16:13 | |
| В контексте предложения в "все-таки" не читается ё. То что у вас проблемы отсуствуют, возможно связано с удалением rex файла, либо с чем-нибудь другим. можно только гадать. Это не единственная проблемма подобного рода, есть и другие. Я предлагаю отдать решение вопроса дефиса на откуп пользователю, добавив соответсвующую настройку. Тем более и раньше правила с ним в быстром методе воспринимались как одно слово. Нужна ли такая путаница. Мне думается, что нет. Но решать автору. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Янв 12 2010, 17:02 | Вт Янв 12 2010, 17:02 | |
| - Цитата :
- Цитата:
- Цитата :
- Ольга в своем словаре не обрабатывает правила с дефисом
Это аксиома для всех программ работаюших с текстом.
Там (в Ольге) таких "аксиом" целое минное поле. Попробуйте поэкспериментируйте, наберется % на 16 от объема словаря. Поэтому и надежда на балаболку. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Янв 12 2010, 17:37 | Вт Янв 12 2010, 17:37 | |
| Можно только пожалеть русскоязычного пользователя, за то, что его не балуют фирмы-производители качественными голосами. И даже лучшие из них без костылей никуда не годятся. И виноваты не только разработчики с их мегаляпами, но и сам "великий и могучий" язык. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Янв 12 2010, 21:32 | Вт Янв 12 2010, 21:32 | |
| Кстати насчет аксиомы, Scansoft katerina без вопросов обрабатывает в своем словаре правила с дефисом. Да и Николай тоже, насколько помню препятствий не чинит. Правильнее говорить об одном из багов движка в обработке словарей. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Чт Янв 14 2010, 15:03 | Чт Янв 14 2010, 15:03 | |
| По поводу поиска иностранных слов: -влечет за собой обязательное предварительное форматирование текста при открытии на ошибочную OCR следующих латинских букв в русских словах: pocxPTMCKXE и др. Это не редкость в текстах. |
|
| | | kolobok123 Наблюдатель
Сообщений : 4
Репутация : 1
| kolobok123 | :: Пн Янв 18 2010, 16:10 | Пн Янв 18 2010, 16:10 | |
| balabolka
Я уже писал выше что в Windows 7(максимальная) Алена и Балаболка причем пробовал 1.27 и 1.28 и теперь самую последнюю 1.29.0.437 все работает и голоса но при конвертации файла в ogg формат вылетает вот такая ошибка
после конвертации в несколько аудиофайлов причем сразу после конвертации первого файла замечено, что при конвертации в ogg если поставить размер частей текста 50 кб то все нормально, а при 100 и более вылетает с ошибкой причем виснет балаболка намертво приходится снимать приложение, я так понял в последней версии это тоже не поправлено? |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Янв 18 2010, 18:30 | Пн Янв 18 2010, 18:30 | |
| kolobok123 В последних версих "Балаболки" эта ошибка не исправлена.
Не думаю, что смогу в ближайшее время что-либо поправить здесь: "Балаболка" не сама выполняет преобразование одного звукового формата в другой, а использует бесплатные файлы-библиотеки ogg.dll, vorbis.dll, vorbisfile.dll и vorbisenc.dll. Если есть ошибка в работе этих библиотек под Win7, надо дождаться, пока разработчики библиотек исправят проблему. Я слежу за этим; спасибо за напоминание. |
|
| | | vetandr Интересующийся
Сообщений : 7
Репутация : 2
| vetandr | :: Сб Янв 30 2010, 18:53 | Сб Янв 30 2010, 18:53 | |
| Здравствуйте, прежде всего - спасибо за Балаболку, прекрасная программа! 1.У меня проблема с произношением некоторых слов. Использую голос Николай Дигало. Словарь Микеланджело 31.5. Балаболка .439, метод правил - Говорилка Проблема со словами типа хулиганьё транспортёр в словаре им соответствуют правила транспорт*=тра<нспорт *хулиган*=хулига<н слова произносятся как "хулига" "тра" Скажите пожалуйста, в чём здесь может быть дело? В Айсбуке с тем же словарём и голосом "транспортер" произносится верно, а хулиганьё - как "хули га"... 2.Я полагал, что применение правил в словаре последовательное. То есть, если в словаре на первом месте идёт маска "транспортер=транспортёр", а затем - "*транспорт*=тра<нспорт", то в итоге получится "тра<нспортёр". Но где то в топике я прочёл, что при активации словаря Балабока сортирует его специальным образом, по длине строк. Если я буду объединять несколько словарей и сортировать их подобным образом, выкидывая затем повторы - такой подход будет иметь смысл? |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Янв 31 2010, 14:14 | Вс Янв 31 2010, 14:14 | |
| vetandr 1. В "Балаболке" есть возможность проверить, какие именно правила применяются к данному тексту. Оставьте в окне лишь то предложение, где находится "сомнительное" слово, и выберите пункт главного меню "Настройки | Коррекция произношения | Статистика замен". В появившемся диалоговом окне Вы увидите список тех правил, что будут применены программой к данному предложению. Это поможет Вам разобраться, какое именно правило меняет произношение слова.
2. Да, правила сортируются в памяти компьютера по длине строк. Посмотреть, как именно выглядит окончательный список правил при объединении нескольких словарей, можно таким способом: щелкните правой кнопкой мыши на панели словарей; в появившемся контекстном меню выберите пункт "Показать список". Программа выведит на экран отсортированный список используемых правил. |
|
| | | vetandr Интересующийся
Сообщений : 7
Репутация : 2
| vetandr | :: Вс Янв 31 2010, 18:04 | Вс Янв 31 2010, 18:04 | |
| - Цитата :
balabolka В "Балаболке" есть возможность проверить, какие именно правила применяются к данному тексту.
Я обычно использую "Применёные правила" в контекстном меню, сейчас сделал по Вашему - всё по прежнему: транспорт*=тра<нспорт *хулиган*=хулига<н Кстати, очень полезная функция, особенно, при подключении нескольких словарей!
А вопрос остался, я не могу понять, почему прога спотыкается на этих словах. Добавление правила "хулиганьё=хулиганьё" - не помогло, а вот "хулиганьё=хулиганье<" - сработало, но мне кажется, что так делать неправильно. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Янв 31 2010, 21:21 | Вс Янв 31 2010, 21:21 | |
| vetandr Насколько я понял cуть проблемы, это какой-то глюк "Николая": текст "тра<нспортёр" голос читает как "тра", а текст "хулига<ньё" как "хулига". Неправильное ударение в слове сбивает "Николая" с толку.
Словарь "Микеланджело" не так уж идеален, некоторые правила Вам всё равно придется исправлять. Это как раз такой случай, когда необходимо отредактировать список правил; не смогу Вам тут помочь, так как мне всё еще не очень понятно, что именно и как Вы хотите прочесть. Вам придется экспериментировать самостоятельно. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вт Фев 02 2010, 02:56 | Вт Фев 02 2010, 02:56 | |
| lev55 А что тут можно сделать?! Сначала срабатывает одно правило, затем второе; программа делает все правильно - она применяет к тексту все правила, который соответствуют шаблонам. Меняйте правила, чтобы избежать подобной коллизии. |
|
| | | cuneiform Интересующийся
Сообщений : 8
Репутация : 0
| cuneiform | :: Вт Фев 02 2010, 19:33 | Вт Фев 02 2010, 19:33 | |
| Вижу здесь все с опытом по словарям собрались. Вот специально зарегился, чтобы выяснить важный для меня вопрос по словарям. - Мне шефу надо аудиофайлы подарить. И вот я перебрал CoolReader, Govorilka, MP3Book2005, IceBook Reader и разные движки, чтобы делать шефу аудиофайлы. Для начала решил сделать самый маленький (понравится ли?). Вот стоит Катерина, L&H Борис и Светлана. Но вот тут то и начались проблемы.
Я решил остановиться на Balabolka portable, но причина может в моем компе, а не в программе читалки (WinXP, SP1, русская версия).
Почему-то никакая прога не видит изменений, которые я делаю в словаре - словарь _default , -
Никифоров*=Ники<форов ,
и все движки упорно читают НикифОров !
Пишут везде, что после изменений в словаре надо читалку перезапустить. Делал. Не помогает.
Read this Никифоров like this Ники<форов когда жму на оба репродуктора-иконки, то прога говорит всегда НикифОров !
Похелпите плиз, Задорнов говорил, что хелп от хелл происходит, может он прав... Прямо как заговорено... ТНХ |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вт Фев 02 2010, 19:58 | Вт Фев 02 2010, 19:58 | |
| - cuneiform пишет:
- Вот стоит Катерина, L&H Борис и Светлана.
Символ "<" меняет ударение в слове только для голоса "Николай" (и только при работе через SAPI 4). Так что, это не какой-то общепризнанный служебный символ для смены ударения - поддержка данного символа была реализована только разработчиками голоса "Николай".
У перечисленных Вами голосов (Катерина, Борис, Светлана) символа для изменения ударения в слове нет. Так что, поменять ударение для этих глосов почти невозможно (можно, например, разбить слово на части: "Ники форов", - или добавить лишнюю гласную: "Никиифоров").
Рекомендую Вам установить голос "Николай". Или голос "Ольга" от фирмы Loquendo - там также можно поменять ударение с помощью специальных символов (и ошибок ударения у "Ольги" намного меньше, чем у "Николая"). Подробнее о работе с этими двумя голосами читайте на соседних ветках данного форума. |
|
| | | vetandr Интересующийся
Сообщений : 7
Репутация : 2
| vetandr | :: Вт Фев 02 2010, 20:37 | Вт Фев 02 2010, 20:37 | |
| Разобрался вроде. Для того, чтобы более короткое правило не накладывалось на длинное правило нужно, чтобы длинное изменяло маску в области наложения короткого правила. На пример так:
транспорт*=тра<нспорт транспортер*=траЪнспортёр транспортёр*=траЪнспортёр
или в случае lev55
синеве=сиЪневе+ сине*=си+не Тогда правило транспорт* не будет накладываться на транспортёр, а сине* на синеве. Похоже этот способ используется и в словаре Микеланджело, там встречается "ъ" после гласной, не дающий никакого эффекта произношения.
balabolka
Согласен, что Микеланджело не идеален, но думаю, что на его основе, добавив и переработав еще несколько словарей можно получить универсальный и сравнительно компактный словарь... Тема интересная, я увлёкся. на бейсике неплохая утилита получилась для оптимизации таких вот составных словарей. Надо ещё добавить только функцию создания обобщений в большом словаре и будет мне щастье ) |
|
| | | cuneiform Интересующийся
Сообщений : 8
Репутация : 0
| cuneiform | :: Вт Фев 02 2010, 20:47 | Вт Фев 02 2010, 20:47 | |
| Очень признателен за ответ по существу! Ваше мнение дорогого стоит. Пока с фамилией шефа справился по подсказке от вас, как жаль, что сам не догадался, а ведь хорошо знаю еще по учебе в аспирантуре по экспериментальной и математической фонетике, что в русском ударение долготное... значит, удлиняя гласные - делаем "сильнее" ударение в русском, различая фонематичные пары зАмок-замОк, мУка-мукА, Игры-игрЫ и т.д. Надо было только рот открыть, сказать "мама" - и ответ на языке, как обмануть голос. Насчет словарей с ударениями вы меня сильно разочаровали, потому что Катерина практически хорошо звучит на научных текстах. Но нельзя тогда без словарей модифицировать числительные, например. А как со словарями для Аленки? Про Николая счас пишут только плохо (типа, отстой, старье), но верить надо только спецу, ясно. Я скорее консерватор во всем. чем любитель неоправданной новизны (типа Drum&Bass). Еще раз крайне большое спасибо за практическое наставление и уважение за серьезную программу. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вт Фев 02 2010, 21:18 | Вт Фев 02 2010, 21:18 | |
| - cuneiform пишет:
- А как со словарями для Аленки?
У "Алёны" специальных символов для изменения ударения нет. Но на этом форуме активно обсуждаются способы изменения ударения при помощи лексикона голоса "Алёна": транскрипция слова с правильным ударением заносится в лексикон при помощи редактора лексикона "Алёны", Это немного сложновато для новичка, но на страницах форума можно нати подробное описание того, как это делается. Есть уже готовые лексиконы, которые можно подключить к голосу, установленному на компьютере пользователя.
- cuneiform пишет:
- Про Николая счас пишут только плохо (типа, отстой, старье), но верить надо только спецу, ясно.
"Старьё", но российским пользователям выбирать не приходится, другого мужского голоса хорошего качества просто нет. Кстати, когда на научно-технической выставке президент Медведев здоровался за руку с роботом AR-600, тот приветствовал руководителя нашей страны голосом "Николая". |
|
| | | cuneiform Интересующийся
Сообщений : 8
Репутация : 0
| cuneiform | :: Ср Фев 03 2010, 12:37 | Ср Фев 03 2010, 12:37 | |
| Тогда скажите плиз, а какой смысл вкладывается в термин "лексикон"? - Вообще-то в лексикографии считается. что лексиконы описывают мир вещей (про вещи), а словари - мир слов (про слова). А придается редактор к "Алене" или это разработка с форума? - Я начинающий в области практики tts, а что до транскрипций, то знаю несколько систем фонетических и фонематических транскрипций, начиная с Белла, так что тут нет особых проблем. Другое дело, что хотелось бы знать, как управлять "Катериной" и другими голосами через словарь практически. Я так и не нашел в "Катерине" словарь, и тем более, не знаю, в чем его править. Хотя видел ее транскрипцию в справке к CoolReader 2.0. Но справка такая, что из нее не следовало, например, что редактирование словаря "Николая" и "Катерины" --- разные вещи.
Кста, а почему в робот вмонтировали "Николая", а не какой-то другой голос? Больше гибкости или что? Или тогда не было других? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Фев 03 2010, 16:53 | Ср Фев 03 2010, 16:53 | |
| cuneiform - Цитата :
- A user lexicon allows you to change the standard pronunciation of a word. This is typically used to provide a correct pronunciation for acronyms that are not recognized by the text processor, or to correct or change the pronunciation of specific words, for instance, foreign words.
или говоря проще это словарь фонетических транскрипций слов. |
|
| | | Igor7 Наблюдатель
Сообщений : 2
Репутация : 0
| Igor7 | :: Ср Фев 03 2010, 19:04 | Ср Фев 03 2010, 19:04 | |
| Спасибо Вам за программу. Было бы хорошо при разбиении текстового файла на части и порождении аудиофайлов для этих частей порождать также и сами части (текстовые файлы с такими же именами). Такая функция была бы полезной при изучении иностранных языков. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Ср Фев 03 2010, 21:03 | Ср Фев 03 2010, 21:03 | |
| lev55 "Быстрый" метод всегда применял к слову все подходящие правила; так в программе "Демагог", так и в "Балаболке". Насколько я вижу в программном коде, программа применяет правила до тех пор, пока не будут использованы все подходящие правила или пока не повстречается словосочетание (то есть, пока не встретится правило, содержащее больше одного слова).
Менять здесь что-нибудь не стану (да это уже и сложно будет сделать, многие словари используют текущий вариант "быстрого" метода). Моя точка зрения, что словари надо составлять таким образом, чтобы не возникали такие ситуации, когда к одному слову применяются два взаимоисключающих правила. Следить за этим - обязанность человека, а не программы.
- Igor7 пишет:
- Было бы хорошо при разбиении текстового файла на части и порождении аудиофайлов для этих частей порождать также и сами части (текстовые файлы с такими же именами).
Тогда Вам надо использовать два пункта главного меню "Сервис | Разбить файл на части" и "Сервис | Преобразовать список файлов в аудиофайлы". Сначала делите текст на текстовые файлы, затем преобразуете полученный список текстовых файлов в звуковые файлы. |
|
| | | Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Ср Фев 03 2010, 21:28 | Ср Фев 03 2010, 21:28 | |
| На мой взгляд, стандартизация в применении быстрого и обычного методов словарей должна быть максимальной. Не всегда мне нравится, множественность применения правил, но по опыту могу сказать, что обработка до первого попавшегося правила создает не меньше проблем, только проблемы получаются несколько иные. Например при использовании textaloud постоянно упирался в это ограничение. И был очень рад, что балаболка работает по-другому. Эная методику подготовки текстов lev55 могу отметить ее сложность, когда текст обрабатывается стандартным, а затем быстрам методом по отдельности. Мне думается, что никакое качестово не стоит таких человеческих трудозатрат. Идеальный вариант - однократная обработка текст во время чтения, лучше не заметная для полоьзователя по времени. Здесь быстый метод вне конкуренции. Не хотелось бы его портить. тем более при нормальном стиле составления словарей проблем быть не должно Может стоит ввести для особо продвинутых пользователей галочку, "обрабатывать до первого совпадения", либо обычным методом. И хотелось бы, чтобы "детские" вопросы просто удалялись из ветки без ответов. |
|
| | | nyamoro Наблюдатель
Сообщений : 3
Репутация : 4
| nyamoro | :: Ср Фев 03 2010, 21:40 | Ср Фев 03 2010, 21:40 | |
| - balabolka пишет:
- Моя точка зрения, что словари надо составлять таким образом, чтобы не возникали такие ситуации, когда к одному слову применяются два взаимоисключающих правила. Следить за этим - обязанность человека, а не программы.
И всё же, проверять словарь на соответствие стандарту - задача именно программы/парсера. Что было бы, если бы правильность xml-документа проверялась вручную? Был бы ад.
Я думаю, программа знает, какие правила взаимоисключающие, поэтому, как вариант, можно сделать кнопочку , а-ля "проверить все словари", которую пользователь будет нажимать вручную (не тратятся ресурсы на фоновые проверки) и которая будет запускать долгий и нудный процесс детальной проверки всех словарей на полное соответствие принятому в текущей версии программы стандарту (а может даже и исправлять ошибки, какие сможет).
Мимо проходил. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Ср Фев 03 2010, 23:11 | Ср Фев 03 2010, 23:11 | |
| nyamoro Ну, сравнение словаря с xml-документом не совсем правильное, в случае словарей коррекции произношения вообще непонятно, что именно человек хочет получить в результате. Формально пользователю разрешено всё: он может при помощи правил "уродовать" исходный текст так, как ему вздумается - добавлять или удалять символы, буквы, слова и т.д.. Был бы какой-нибудь стандарт, было бы легче.
Определить, какие правила взаимоисключающие, может ТОЛЬКО человек. Но Вы правы, вполне можно написать процедуру поиска пар правил, когда один шаблон полностью "умещается" внутри другого шаблона. Такие правила нельзя назвать "взаиимоисключающими" (возможно, пользователь и хотел такого "наложения"), но можно считать их "подозрительными". Сложнее с правилами, чьи шаблоны совпадают лишь частично, - тут может быть огромное количество "подозрительных" пар строк.
Обещаю подумать над этим; спасибо. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Чт Фев 04 2010, 20:16 | Чт Фев 04 2010, 20:16 | |
| lev55 Менять что-либо в методах применения правил коррекции произношения я не намерен. Надо прекратить "менять правила игры", пользователям придется смириться с тем, как сейчас работают "стандартный" и "быстрый" методы. "Стандартный" метод у меня почти такой же, как в "Говорилке", "быстрый" метод почти такой же, как в "Демагоге" (разница очень маленькая, в десятых долях процентов от числа применяемых правил), так что на этом и стоит остановиться.
Вообще, хочу еще раз озвучить свою позицию по составлению правил. Добавлять в словари надо ЦЕЛЫЕ слова или словосочетания; подстановочный символ "звездочка" должен применяться редко, только когда есть 100%-ная увереенность, что все варианты слова будут обработаны данным правилом корректно. Поэтому мне удивительно видеть шаблоны вида "сине*" или "*олет": четырех букв мало для создания однозначного правила.
Списки слов с неправильными ударениями надо отсылать разработчикам голосов. Жаль, конечно, что большинство из нас не являются зарегистрированными пользователями программных продуктов; например, мне так и не удалось получить нужную информацию от службы техподдержки Loquendo, итальянский менеджер вежливо послал меня подальше, пока не приобрету какой-нибудь из их продуктов. Достучаться до них сложно, но продолжать попытки стоит. |
|
| | | Igor7 Наблюдатель
Сообщений : 2
Репутация : 0
| Igor7 | :: Пт Фев 05 2010, 15:35 | Пт Фев 05 2010, 15:35 | |
| - balabolka пишет:
Тогда Вам надо использовать два пункта главного меню "Сервис | Разбить файл на части" и "Сервис | Преобразовать список файлов в аудиофайлы". Сначала делите текст на текстовые файлы, затем преобразуете полученный список текстовых файлов в звуковые файлы. Спасибо. Все получилось. |
|
| | | nyamoro Наблюдатель
Сообщений : 3
Репутация : 4
| nyamoro | :: Ср Фев 10 2010, 15:40 | Ср Фев 10 2010, 15:40 | |
| Как пожелание, ОЧЕНЬ не хватает профилей для подключаемых словарей,
- Спойлер:
в идеале - с привязкой к языку, на котором разговаривает текущий голос (дабы не было таких ситуаций, когда русские словари корректируют немецкий голос - "защита от дурака").
К примеру, у меня три голоса - Ольга, Алена и Crystal. Если я переключаюсь на Алену, то я могу выбрать профиль "Алена" и подключатся все 5 словарей Алены, а остальные выключатся (в профиле запоминаются только подключенные словари, остальные по умолчанию выключаются). Если же я хочу Ольгу, то при выборе голоса я могу в два клика подключить и нужные словари для Ольги, и при этом я точно не забуду, какие именно словари для Ольги самые подходящие.
И голос Crystal тоже перестанет превращаться в абракадабру только лишь потому, что я забыл отключить один русскоязычный словарь (который я даже не заметил, потому что он был скрыт за полосой прокрутки).
В общем, я думаю такая фишка была бы очень полезна, особенно для тех пользователей, которые получили программу уже настроенной, со словарями в комплекте, и просто не знают, какие словари подключать для выбранного голоса, а какие лучше не стоит. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Ср Фев 10 2010, 19:09 | Ср Фев 10 2010, 19:09 | |
| - nyamoro пишет:
- Как пожелание, ОЧЕНЬ не хватает профилей для подключаемых словарей,
Обещаю подумать над Вашим пожеланием. Спасибо. |
|
| | | Mago Постоялец
Сообщений : 77
Репутация : 8
| Mago | :: Ср Фев 10 2010, 20:33 | Ср Фев 10 2010, 20:33 | |
| При сохранении в несколько аудиофайлов Балаболка разрывает теги, т.е. начало тега в одной части, конец в другой, и следовательно возникает ошибка синтеза речи. Было бы хорошо если б балаболка этого не делала |
|
| | | | Балаболка |
---|
| |