语音合成技术和文本语音转换 - Synthetic voice and Text to Speech technology - Синтетический голос и технологии преобразования текста в речь
 
TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  

Народный словарь

Предыдущая тема Следующая тема Перейти вниз
АвторСообщениеНародный словарь
lev55
Участник «online словари»
avatar


Сообщений : 384
Репутация : 45

 lev55 :: Вт Мар 24 2009, 15:30
Вт Мар 24 2009, 15:30

Предлагаю в этой рубрике обмениваться словарями. Здесь находятся словари.

Чтобы не гонять по сети лишний мусор, присылать, желательно, только те слова, которых нет в этих словарях.
Для этого есть словарь известных слов - known_words.txt.
Сравнение (объединение, пересечение) словарей и поиск новых слов удобно делать в MP3book2005
или Раптором и Балаболкой.

Выложенные сейчас словари будут обновлятся, с регулярностью зависящей от Вас.

Приветствуются и INI файлы для Балаболки.
Для нормальной работы словарей и ударений нужны записи в реестре

Цитата :
[HKEY_LOCAL_MACHINE\SOFTWARE\Loquendo\LTTS7\default.session]
"SpellingLevel"="pronounse"
[HKEY_LOCAL_MACHINE\SOFTWARE\Loquendo\LTTS7\LoqSAPI5]
"Lex.1049"="C:\Program Files\Loquendo\LTTS7\bin\example.lex"

example.lex находится здесь C:\Program Files\Loquendo\LTTS7\bin\example.lex

Вернуться к началу Перейти вниз
lev55
Участник «online словари»
avatar


Сообщений : 384
Репутация : 45

 lev55 :: Вс Апр 05 2009, 13:12
Вс Апр 05 2009, 13:12

Для удобства обмена словарями пользуйтесь этой ссылкой
В форму "Словарь транскрипций (sampa) " можно писать примеры неправильно произносимых слов со знаком припинания, или в сочитании с другим словом. Они будут исправленны и занесены в словарь.

Пролетарии всех стран объединяйтесь!
Омограф, он и в Африке - омограф, поетому можно объединить усилия почитателей различных движков в составлении общего словаря.
Только ударения нужно ставвит плюсом "+" и не вводить праввила, присущих только одному движку.

Вернуться к началу Перейти вниз
lev55
Участник «online словари»
avatar


Сообщений : 384
Репутация : 45

 lev55 :: Пн Апр 13 2009, 14:19
Пн Апр 13 2009, 14:19

открытое письмо:-)
Я думаю, что не верно разделятся на касты, или закрытые клубы..
Мы все одинаковые.
Как в жизни, "видишь пяный - отойди".

Вернуться к началу Перейти вниз
lev55
Участник «online словари»
avatar


Сообщений : 384
Репутация : 45

 lev55 :: Чт Апр 16 2009, 15:28
Чт Апр 16 2009, 15:28

Выложен объеденённый словарь ёфикации Алёны и Ольги.
Ударения поставлены "+".
Переменован из 2Olga_eo.dic в 2yo.dic.

Вернуться к началу Перейти вниз
lev55
Участник «online словари»
avatar


Сообщений : 384
Репутация : 45

 lev55 :: Вс Апр 19 2009, 13:54
Вс Апр 19 2009, 13:54

Всех с праздником!
Х.В.

Вернуться к началу Перейти вниз
lev55
Участник «online словари»
avatar


Сообщений : 384
Репутация : 45

 lev55 :: Сб Апр 25 2009, 14:07
Сб Апр 25 2009, 14:07

Словари увеличелись примерно в два раза.

Вернуться к началу Перейти вниз
lev55
Участник «online словари»
avatar


Сообщений : 384
Репутация : 45

 lev55 :: Пн Июн 01 2009, 19:53
Пн Июн 01 2009, 19:53

Информация:
В "Балаболке", - "Настройки/Коррекция произношения/Метод применения правил (DIC)/Быстрый ("Демагог") - работают правила:
омограф *окончание, т.е. все *о=ёсе *о.
Поэтому в словарь "0omograph.dic" будут заносится соответствующие правила!!!

P.S. Кто знал раньше - тот молодец!
Для такой же скорости чтения, как у "Алёны", при нуливых установках, нужны следующие установки:

Цитата :
Windows Registry Editor Version 5.00

[HKEY_LOCAL_MACHINE\SOFTWARE\Loquendo\LTTS7\LoqSAPI5]
"DataPath"="C:\\Program Files\\Loquendo\\LTTS7\\Data\\"
"VolumeUserScale"="0,100"
"SpeedUserScale"="0,30"
"PitchUserScale"="0,26"
"Lex.1049"="C:\\Program Files\\Loquendo\\LTTS7\\bin\\example.lex"

Читать выделенное.
Да и настройки помягче.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Пн Июн 01 2009, 21:13
Пн Июн 01 2009, 21:13

а правило со звездочкой в середине работает для простого метода применения правил? а то этот демагог ненадежный очень - много пропускает

Вернуться к началу Перейти вниз
lev55
Участник «online словари»
avatar


Сообщений : 384
Репутация : 45

 lev55 :: Вт Июн 02 2009, 17:53
Вт Июн 02 2009, 17:53

evilone_
Цитата :
а правило со звездочкой в середине работает для простого метода применения правил?
Нет - для таких правил: солво *окончание, т.е. xxx *yy. А со звёздочкой посередине слово1 * слово2 нужен другой алгоритм.
http://mytts.forum2x2.ru/forum-f16/tema-t73-150.htm тут на четвёртой странице.
Цитата :
а то этот демагог ненадежный очень - много пропускает
Там алгоритм другой, поэтому надо соответственно и словарь строить.
Я делаю так - зараяжаем (ставим галочки) сразу 0omograph.dic, 1Olga_default.dic, 2yo.dic, 3Olgazalizn_olga.dic и обрабатываем Быстрым ("Демагог"), а плюсы в нормальное ударение O+lga.dic нормальным способом, предварительно отключив предидущие, потому что для замены плюсов Демагог не работает (не все сочитания).
Пока ошибок не наблюдал, уже не одну сотню книг сделал.
P.S. Ощибки могут возникать если текст не отфаматирован, т.е. между словами стит перевод (разрыв) строки.

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Вт Фев 19 2013, 22:30
Вт Фев 19 2013, 22:30

Здесь словарь для вставки тегов пауз в текст в конце предложений и абзацев. В комментариях подробное описание.
Спойлер:
 

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Пн Янв 13 2014, 22:06
Пн Янв 13 2014, 22:06

https://drive.google.com/file/d/0B7fIANHkqAlYVHVrbW1oY2JXakk/edit?usp=sharing - ссылка на словарь омографов для Ольги. Применяется к тексту, обработанному словарём омографов для Алёны и/или программой Редактор ударений с опцией для голоса Алёна (при обработке в последней подключать словари выборочно, см. сообщения на форуме в ветке http://mytts.forum2x2.ru/t506-topic#7364).
Словарь подключается записью в реестре, помещается в папку с установленным движком, расширение .txt удалить. Если нужно, чтобы движок читал правильно другие слова - неомографы, словарь необходимо объединить с другим словарём. Для этого нужно открыть объединяемые словари в текстовом редакторе, и скопировать строки с шаблонами и правилами из одного в другой. Необходимо учесть, что кодировка текста должна быть при этом одинаковая!
Словарь предназначен для чтения текста различными русскоязычными голосовыми движками с соответствующей разметкой тегами в программе Балаболка. Если не планируется использовать более одного русскоязычного голоса, то лучше пользоваться словарями, предназначенными только для Ольги.
Словарь создан из словаря омографов "alenka.hmg", с помощью словаря "alenka-to-olga.dic" в программе Балаболка. Использованы только литеральные замены (фонемные отсутствуют).

Вернуться к началу Перейти вниз
Лёва
V.I.P.
avatar


Сообщений : 134
Репутация : 173

 Лёва :: Вт Янв 14 2014, 00:07
Вт Янв 14 2014, 00:07

basist
Не надо вводить уважаемую публику в заблуждение.
Словари с расширением 'lex' и словарь example.lex в частности, предназначены для исправления 'фифектов' речи голосового движка LOQUENDO, и никакого отношения к омографам не имеет!
Это во-первых.
Во-вторых, этот словарь должен содержать правила в виде sampa.
А здесь-
Цитата :
https://drive.google.com/file/d/0B7fIANHkqAlYVHVrbW1oY2JXakk/edit?usp=sharing - ссылка на словарь омографов для Ольги.
... , ну в общем понятно.
Это у Аленки, в силу невозможности установить ударение, кроме как отметив его в лексиконе, записываются омографы в лексикон, для Ольги этого не требуется.
Ей богу, надо сначала разобраться, чем отличаются движки и что для каждого применительно, прежде чем делать такие заявления.
Я пишу это не ради поругаться, а для ясности вопроса, а то это вносит дополнительную путаницу, потому что не верно.


Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Чт Янв 16 2014, 22:58
Чт Янв 16 2014, 22:58

Меньше всего я хотел бы оставаться непонятым. Вот пример текста, предварительно обработанного Вашей программой, и размеченного тегами смены голосов.
Спойлер:
 
Как сделать так, чтобы все ударения читались разными движками правильно? Какой словарь в Балаболке подключать?
Я подключил к голосу Катерина словарь омографов Алёны для Кати *.dct и к голосу Ольга словарь омографов Алёны для Ольги https://drive.google.com/file/d/0B7fIANHkqAlYVHVrbW1oY2JXakk/edit?usp=sharing example.lex (свой словарь). Эти словари меняют только ударения в соответствии с собственной концепцией движка. Ссылка для результата здесь https://drive.google.com/file/d/0B7fIANHkqAlYM1ZmUUhfRG1WTXc/edit?usp=sharing Я очень благодарен Вам за программу, она решает проблему омографов в тексте с тегами смены голосов.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 304
Репутация : 85

 apokrif :: Чт Янв 16 2014, 23:03
Чт Янв 16 2014, 23:03

>Как сделать так, чтобы все ударения читались разными движками правильно?
Это вряд ли. Движки могут вообще не поддерживать ударения. Да и новые движки время от времени появляются.

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Чт Янв 16 2014, 23:12
Чт Янв 16 2014, 23:12

Большинство поддерживает. Какие - плюсом, какие - скобками. Главное, это различать регистр. Я только хочу прикрутить это к чтению пьес.

Вернуться к началу Перейти вниз
Лёва
V.I.P.
avatar


Сообщений : 134
Репутация : 173

 Лёва :: Пт Янв 17 2014, 02:12
Пт Янв 17 2014, 02:12

Цитата :
Меньше всего я хотел бы оставаться непонятым.
Смыл идеи сразу понятен, но боюсь, что без мало-мальски специализированной программы не обойтись.
Словари и регулярные выражения - вряд-ли помогут. На первый взгляд программка должна получиться не сложная.
Почему я написал замечание, если перефразировать Булгакова, когда Берлиоз обращался к поэту Бездомному: - "А то выходит по твоему рассказу, что он действительно родился!.."
А то получиться по твоему рассказу, что правила "абАка" = "аб^ака", "абакА" = "абак^а" и в правду будут работать в словаре example.lex.
Прослушай как звучат такие слова, как " вакуумом, воздух" или любое другое слово из "родного" example.lex с твоим словарём или без.
1. Левая часть правил - регистронезависимая, поэтому сбЕгал и сбегАл ничем не отличаются.
2. Правая часть правил должна состоять из латинских знаков. (и они не аналоги буквам существующих языков).
Поэтому кириллица просто игнорируется.
3. Мне кажется, что и визуально отличаются "брючин" = "\SAMPA=(br'y"utS'in#)" и "абакА" = "абак^а".

Цитата :
>Как сделать так, чтобы все ударения читались разными движками правильно?

Думаю так:
Из текста нужно сделать несколько экземпляров по количеству голосов с соответствующими видами ударений.
В исходном тексте предварительно должны быть расставлены теги переключения голосов.
Они будут являться метками для замены текста.
Остаётся просканировать текст и заменять подстроки ограниченные разделителями (теги) на соответствующие из экземпляров с ударениями.
Лексиконы и словари тут не причем.

Цитата :
Я очень благодарен Вам за программу, она решает проблему омографов в тексте с тегами смены голосов.
Спасибо! Я тоже рад, что трудился не напрасно.
В конце ложка дёгтя - омографы и теги смены голосов, не просто две большие разницы, а сущности из разных измерений. Smile

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Пт Янв 17 2014, 04:15
Пт Янв 17 2014, 04:15

Цитата :
2. Правая часть правил должна состоять из латинских знаков. (и они не аналоги буквам существующих языков).
Поэтому кириллица просто игнорируется.
Может, у меня другая версия Локвендо, но слова в левой части регистрозависимые в словаре движка, и даже в родном редакторе словаря есть кнопка, отвечающая за это. В правой части правила пишется текст кириллицей в кавычках с расставленными ударениями, но без тега \SAMPA=(V#fs'y"ot@k'i#). И кириллица не игнорируется. Так выглядит фрагмент словаря в текстовом редакторе Блокнот в кодировке UTF-8
Спойлер:
 

У меня при подключенном словаре, загруженного по ссылке, все ударения произносятся как им и положено произноситься. Словарь сравнительно небольшой, попробуйте скачать и проверить, временно переименовав Ваш словарь. Хотя бы дайте прочесть вот такой фрагмент при всех отключенных словарях в программе Балаболка.
Спойлер:
 

Вернуться к началу Перейти вниз
FelixAndersen
Интересующийся


Сообщений : 6
Репутация : 0

 FelixAndersen :: Ср Янв 20 2016, 15:43
Ср Янв 20 2016, 15:43

Выложите, пожалуйста словари со страницы http://mytts.forum2x2.ru/t165-topic#bottom на более адекватное облако. Дропбокс посылает с Error (429).

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 616
Репутация : 208

 evmir_troll-hunter :: Ср Янв 20 2016, 18:44
Ср Янв 20 2016, 18:44

Дропбокс и есть адекватное облако - не в пример яндекс-диску!
Другое дело, что для таких популярных файлов с неожиданным но предполагаемым трафиком, нужно было оформить Бизнесс-аккаунт.

В принципе, не исключено, что "более адекватное облако" как Вы выражаетесь, также заблокирует исходящий трафик.

Вернуться к началу Перейти вниз
FelixAndersen
Интересующийся


Сообщений : 6
Репутация : 0

 FelixAndersen :: Ср Янв 20 2016, 21:04
Ср Янв 20 2016, 21:04

Сорри за оффтоп.
"Дропбокс и есть адекватное облако" крайне спорное утверждение. Доропбокс подводил неоднократно, хуже него только депозит и прочие файлообменники. Яндекс тоже не торт. Сервис drive.google.com пока не подводил. cloud.mail.ru скачивание не блокирует, но находит вирусы там, где их нет. Выложите, пожалуйста хоть куда нибудь кроме клятого дропбокса.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 616
Репутация : 208

 evmir_troll-hunter :: Ср Янв 20 2016, 22:19
Ср Янв 20 2016, 22:19

Повторюсь, для стабильной работы Любого файлообменника нужен Бизнесс-аккаунт.
Бесплатные же лишь для обмена доками и фотошопами Like a Star @ heavenмежду друзьми.

Вернуться к началу Перейти вниз
FelixAndersen
Интересующийся


Сообщений : 6
Репутация : 0

 FelixAndersen :: Чт Янв 21 2016, 09:20
Чт Янв 21 2016, 09:20

Снова оффтоп, сорри.
"нужен Бизнесс-аккаунт" - у гугла нет бизнес аккаунта. У яндекса и мейл.ру тоже не обнаружил. На яндексе при ограничении на скачивание нужно иметь учетку в их облаке, и файл можно скачать туда, оттуда на комп. С гуглом и мейлом вообще не возникает столь маразматичных проблем как на клятом дропбоксе. Можно сто раз повторить неверное утверждение, верным оно не станет. Это либо банальное нежелание помочь, либо вымогательство денег, для покупки ненужного "бизнесс-аккаунта".
Не желаете перевыложить на нормальное хранилище, ну и орган с ним. Утянул с торрентов старую версию словарей.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 616
Репутация : 208

 evmir_troll-hunter :: Чт Янв 21 2016, 12:17
Чт Янв 21 2016, 12:17

Орган не орган... как я могу выложить то чего у меня нет - что за детский сад! Или вы не знаете, что Loquendo Olga сейчас Никто не занимается.
Мало того, несколько лет назад модератор данной ветки lev55, поудалял ВСЕ словари отсюда!!!
Была восстановлена лишь часть...

Я сделал зеркала для файлов Алёны на Google-drive, и повторяю, я абсолютно НЕ уверен, что их не заблокируют через некоторое время.:download:

И кстати, с вас никто денег не вымогает для бизнесс-аккаунта, и вы не можете с точностью утверждать об адекватности и "безпроблемности" облаков яндекс\мейла и пр.

Вернуться к началу Перейти вниз
FelixAndersen
Интересующийся


Сообщений : 6
Репутация : 0

 FelixAndersen :: Чт Янв 21 2016, 12:42
Чт Янв 21 2016, 12:42

"что за детский сад" вот уж и правда. Попросил скинуть кого нибудь, у кого есть, а устроили детский сад.
"несколько лет назад" не застал. Пользовался Аленой.
"вы не можете с точностью утверждать об адекватности и "безпроблемности" облаков яндекс\мейла" Выкладывал самопальные прошивки для своего смарта для одного из форумов на три этих сервисах, количество скачек сотни за три-четыре по каждому файлу. Уже могу утверждать. Грабли топтал только с яндексом.

Вернуться к началу Перейти вниз
Tiramisu
Интересующийся


Сообщений : 9
Репутация : 1

 Tiramisu :: Вс Янв 24 2016, 15:23
Вс Янв 24 2016, 15:23

Цитата :
Или вы не знаете, что Loquendo Olga сейчас Никто не занимается.
Мало того, несколько лет назад модератор данной ветки lev55, поудалял ВСЕ словари отсюда!!!
Была восстановлена лишь часть...
Цитата :
"- Ну уж это положительно интересно, трясясь от хохота проговорил профессор, - что же это у вас, чего ни хватишься, ничего нет!" М.А. Булгаков. Мастер и Маргарита.
Я-Никто? Обидно.Crying or Very sad

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

Народный словарь

Предыдущая тема Следующая тема Вернуться к началу
Народный словарь
Страница 1 из 1Страница 1 из 1
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении
Создать форум | © phpBB | Бесплатный форум поддержки | Сообщить о нарушении | Создать бесплатный блог