| Встроенный словарь замен russian-ivona.lex | |
|
|
Автор | Сообщение | Встроенный словарь замен russian-ivona.lex |
---|
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Фев 07 2014, 17:14 | Пт Фев 07 2014, 17:14 | |
| Помимо pls-лексиконов (фонетических словарей) позволяющих менять звучание слова в голосе IVONA Tatyana (Татьяна) или Maxim (Максим) есть встроенный словарь замен russian-ivona.lex (russian.lex).
Словарь поддерживает правила на основе регулярных выражений стандарта PCRE (Perl-compatible regular expressions). Общий формат для правила: - Цитата :
- "фраза для поиска" "замена"
Каждое правило записывается в новой строке. Все символы пробела в правиле должны браться в кавычки а сам символ кавычек - "экранироваться" символом "\". Левая и правая части разделены пробелом и каждая из них взята в кавычки поэтому использования этих самых кавычек в строке поиска желательно избегать заменив их к примеру вот так: - Код:
-
\x22 кавычка \x20 пробел Пустые строки, строки содержащие только пробелы и начинающиеся символом (#) игнорируются. Для составления правил в словаре допускается использование шаблонов: - Цитата :
POSIX | Описание | ASCII | Unicode | [:alnum:] | буквенно-цифровые символы | [a-zA-Z0-9] | [\p{L&}\p{Nd}] | [:alpha:] | буквенные символы | [a-zA-Z] | \p{L&} | [:ascii:] | ASCII символы | [\x00-\x7F] | \p{InBasicLatin} | [:blank:] | пробел и отступ (табуляция) | [ \t] | [\p{Zs}\t] | [:cntrl:] | управляющие символы | [\x00-\x1F\x7F] | \p{Cc} | [:digit:] | цифры | [0-9] | \p{Nd} | [:graph:] | видимые символы (т.е. ничего кроме пробелов, управляющих символов и т.д.) | [\x21-\x7E] | [^\p{Z}\p{C}] | [:lower:] | строчные буквы | [a-z] | \p{Ll} | [:print:] | видимые символы и пробелы (т.е. ничего кроме управляющих символов, и т.д.) | [\x20-\x7E] | \P{C} | [:punct:] | пунктуация и символы. | [!"#$%&'()*+, | [\p{P}\p{S}] | | | \-./:;<=>?@ | | | | [\\\]^_`{|}~] | | [:space:] | все символы пробела, в том числе разрывов строк | [ \t\r\n\v\f] | [\p{Z}\t\r\n\v\f] | [:upper:] | прописные буквы | [A-Z] | \p{Lu} | [:word:] | символы в слове (буквы, цифры и знак подчеркивания) | [A-Za-z0-9_] | [\p{L}\p{N}\p{Pc}] | [:xdigit:] | шестнадцатеричные цифры | [A-Fa-f0-9] | [A-Fa-f0-9] |
russian-ivona.lex russian.lex
Установка словаря: Существует две копии данного файла. Первая расположена в папке с установленной программой. Вторая в папке профиля каждого пользователя на компьютере которого установлен голос. Для установки словаря достаточно скопировать его в папку с программой: Tatyana (Татьяна): "c:\Program Files\IVONA\IVONA 2 Voice\russian-ivona.lex" Maxim (Максим): "c:\Program Files\NextUp-Ivona\ivona_voices\russian.lex"
Замены словаря: - запрет произношения знаков ’—¦«»"'()-./<=>[\]^_`{|}~@ в тексте;
Для исправления произношения отдельных слов, в т.ч. замены аббревиатур сокращений и т.п. используйте pls-лексиконы.
Все ошибки и\или замечания пишите, пожалуйста, здесь.
|
|
|
| |
mna Гость
| mna | :: Вт Мар 18 2014, 17:26 | Вт Мар 18 2014, 17:26 | |
| А как правильно прописать код чтобы запятая считалась, например точкой? Дело в том, что Татьяна пролетает запятые без малейшей остановки, а хотелось бы паузу небольшую. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Мар 18 2014, 21:05 | Вт Мар 18 2014, 21:05 | |
| поиск: - Код:
-
\, замена: - Код:
-
. |
|
|
| |
mna Гость
| mna | :: Ср Мар 19 2014, 12:14 | Ср Мар 19 2014, 12:14 | |
| Я прописал так: "\," "." но все-равно не притормаживает. Где-то ошибся? Заранее спасибо. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Чт Мар 20 2014, 01:32 | Чт Мар 20 2014, 01:32 | |
| попробуйте так:
- Спойлер:
возможно нужно было перезагрузить голос? пауза после точки должна настраиваться тут:
- Спойлер:
|
|
|
| |
mna Гость
| mna | :: Чт Мар 20 2014, 12:12 | Чт Мар 20 2014, 12:12 | |
| Спасибо, заработало. Но вылезло другое, опять стала говорить "точка" если после точки стоит тире, например в прямой речи. Ранее выложенный Вами файлик это убрал, а моя замена вернула проговор точки! |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Чт Мар 20 2014, 20:13 | Чт Мар 20 2014, 20:13 | |
| >Спасибо, заработало. Но вылезло другое, опять стала говорить "точка" если после точки стоит тире, например в прямой речи. Ранее выложенный Вами файлик это убрал, а моя замена вернула проговор точки!
Очевидно, это реагирует на ",-" -> ".-" В каком порядке вы делаете замены и как управляете рекурсией?
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Мар 21 2014, 00:58 | Пт Мар 21 2014, 00:58 | |
| вообще-то паузу лучше всего делать не так... оставьте точку как было - мы ее туда добавили специально из-за kmplayer'а поиск: - Код:
-
\, замена: - Код:
-
<speak><break time='500ms'/></speak> вместо 500ms поставьте свое значение какое считаете лучше, можно в ms (миллисекундах) можно в s (секундах) - максимально допустимое 120s или 120000ms - apokrif пишет:
- В каком порядке вы делаете замены и как управляете рекурсией?
кстати да, это важно... в *.lex словаре очень важна последовательность правил - все правила применяются к тексту последовательно как в *.rex\*.ini обновите себе plshelper там добавлены кнопки для сортировки правил в russian-ivona.lex словаре |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Пт Мар 21 2014, 08:02 | Пт Мар 21 2014, 08:02 | |
| - evilone_ пишет:
- кстати да, это важно...
в *.lex словаре очень важна последовательность правил - все правила применяются к тексту последовательно как в *.rex\*.ini обновите себе plshelper там добавлены кнопки для сортировки правил в russian-ivona.lex словаре Э-э-э... А откуда он знает, какая мне нужна последовательность сортировки?
|
|
|
| |
mna Гость
| mna | :: Пт Мар 21 2014, 12:43 | Пт Мар 21 2014, 12:43 | |
| Ура! Этот код <speak><break time='500ms'/></speak> великолепно справился! Спасибо огромное! |
|
|
| |
bboss Наблюдатель
Сообщений : 2
Репутация : 0
| bboss | :: Сб Июн 07 2014, 23:20 | Сб Июн 07 2014, 23:20 | |
| Здравствуйте, все таки не смог разобраться, даже после прочтения почти всех тем по Татьяне. – Едва ли, – вздохнув, ответил Джим. В подобных предложениях всегда читает знак перед дефисом (запятая). Помогите пожалуйста. Установил все словари, пробовал разобраться через plshelper, ничего не получилось. |
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Сб Июн 14 2014, 00:40 | Сб Июн 14 2014, 00:40 | |
| - bboss пишет:
если пользуетесь балаболкой, то форматируйте текст. помогает. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
bboss Наблюдатель
Сообщений : 2
Репутация : 0
| bboss | :: Сб Июл 12 2014, 15:34 | Сб Июл 12 2014, 15:34 | |
| Да, Дмитрий, вы правы форматирование в Балаболке помогло.
Evilone, russian-ivona.lex в той директории не нашел, т.к. ее там просто нет. Т.е. в roaming папки ivona 2 voice просто нет. А корректор, это который corector_tatyana.rex или тот же russian-ivona.lex? И как его подключить? russian-ivona.lex уже скопирован в папку установленной проги. |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Сб Ноя 08 2014, 14:50 | Сб Ноя 08 2014, 14:50 | |
| - evilone_ пишет:
- Словарь поддерживает правила на основе регулярных выражений стандарта PCRE (Perl-compatible regular expressions).
Чуть подправил словарь от evilone_ в соответствии с докой. Проверял на Android. словарь должен называться russian.lex и быть в UTF-8 без BOM \. закомментировал Если оставить, то сокращения типа и т.д. и т.п. перестают распознаваться.
- Спойлер:
- Код:
-
#& encoding=UTF-8
# Pauses ['’`] "<speak><break time='50ms'/></speak>" [_¦] "<speak><break time='100ms'/></speak>" [=—,] "<speak><break time='200ms'/></speak>" #\. "<speak><break time='300ms'/></speak>"
# Remove unwanted characters from text: [[?@#$%*&|~()<>{}«»/\\^\-\]] ""
|
|
|
| |
| Встроенный словарь замен russian-ivona.lex | |
|
Встроенный словарь замен russian-ivona.lex |
---|