TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



Nuance Milena TTS

Предыдущая тема Следующая тема Перейти вниз
На страницу : Предыдущий  1, 2, 3, 4
АвторСообщениеNuance Milena TTS
apokrif
V.I.P.


Сообщений : 331

 apokrif :: Вс Авг 04 2013, 02:26
Вс Авг 04 2013, 02:26

Dmitry пишет:
apokrif, опять без инструкции
Инструкция в Vocalizer_Expressive_SAPI5_x86_readme.rar
Установка на 100% совпадает с Vocalizer SAPI5.
Единственная неувязка, autov5_sapi5.dll & ve_sapi5.dll имеют одинаковый CLSID {98BAB182-19A8-40d5-9268-1F84E1B7B257}, т.е. они взаимоисключающие.

Можно поменять CLSID на другой (например {98BAB182-19A8-40d5-9268-1F84E1B7B258}) и поправить все *.reg и ve_sapi5.dll (и не забыть поправить checksum)

Вернуться к началу Перейти вниз
Swk
Посетитель


Сообщений : 26
Репутация : 1

 Swk :: Вт Окт 29 2013, 09:37
Вт Окт 29 2013, 09:37

apokrif
Можете записать сравнительные семплы, например голоса Milena, до, и после установки Vocalizer Expressive. Естественно с оптимальными настройками произношения?

И ещё не маловажный вопрос, после установки Vocalizer Expressive не возникнут какие-либо проблемы того или иного вида?

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Вт Окт 29 2013, 15:15
Вт Окт 29 2013, 15:15

Swk пишет:
Можете записать сравнительные семплы, например голоса Milena, до, и после установки Vocalizer Expressive. Естественно с оптимальными настройками произношения?
Там дело не семплах, а в наборе "глюков" произношения у Milen из Vocalizer и Vocalizer Expressive. Почитайте последние 5 страниц тут http://4pda.ru/forum/index.php?showtopic=200728

Swk пишет:
И ещё не маловажный вопрос, после установки Vocalizer Expressive не возникнут какие-либо проблемы того или иного вида?
"Проблема" только одна (IMHO)
apokrif пишет:
Единственная неувязка, autov5_sapi5.dll & ve_sapi5.dll имеют одинаковый CLSID {98BAB182-19A8-40d5-9268-1F84E1B7B257}, т.е. они взаимоисключающие.

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Чт Дек 19 2013, 23:39
Чт Дек 19 2013, 23:39

Не могли бы, уважаемые знатоки, подсказать, какие файлы скачивать на 4пда, чтобы Милена звучала не только в демо вокализир. А то у меня выскакивает сообщение "Данный голос не может быть воспроизведён." Мне там трудно самому во всём разобраться. Мне желательно голос без наворотов, самый лёгкий, но с возможностью подключения словаря. Скансофтовская Милена с RSUDE словарь *.bdc игнорирует. Словарь *.dat я научился создавать, ещё бы голос поставить на компьютер, который этот словарь читать будет.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Пн Янв 20 2014, 00:44
Пн Янв 20 2014, 00:44

Не совсем в тему - на 4pda есть German Anna 1GB (для ПС и Андроида)

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Пн Янв 20 2014, 21:04
Пн Янв 20 2014, 21:04

https://cloud.mail.ru/public/44f21033cc9f/VocalizerExpressive22kHz.rar - ссылка на три русских голоса. В одном архиве вместе лежат Катя, Юра и Милена. Прямо, какая-то шведская семья...
Копируете папку в C:\Program Files, регистрируете файлами реестра и радуетесь.
Скажу прямо, файлы взяты с 4пда, но мук я с ними натерпелся! То, что дано там как лекарство в "ридми", совершенно никуда не годится. Названия строк, содержание их, никак не соответствуют файлам данных. Пришлось приводить одно к другому. Имена голосов, возможно, не точно отражают их значение, как задумано производителем, но для меня важно было заставить их говорить. Для х86.

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Пн Янв 20 2014, 23:45
Пн Янв 20 2014, 23:45

Вдогонку к предыдущему сообщению архив Файлы для исправления Ю-канья https://cloud.mail.ru/public/39a310d94281/%D0%A4%D0%B0%D0%B9%D0%BB%D1%8B.rar
Взят с форума 4пда.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Вт Янв 21 2014, 04:21
Вт Янв 21 2014, 04:21

Цитата :
Скажу прямо, файлы взяты с 4пда, но мук я с ними натерпелся!
И у меня и других всё заработало без проблем.
Это только вы у нас велико-мученник.
Рад что вы разобрались самостоятельно!
Выложите ваши рег файлы и ваш же readme отдельно - я их на 4пда тоже загружу, может еще кому жизнь спасут Smile

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Пт Янв 24 2014, 14:05
Пт Янв 24 2014, 14:05

basist пишет:
Копируете папку в C:\Program Files, регистрируете файлами реестра и радуетесь.
Скопировал, зарегистрировал, но радости отчего-то нет. Все голоса видны, но ни в одном приложении не работают. Незарегистрированный класс, ошибка движка и т.п.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Пт Янв 24 2014, 16:34
Пт Янв 24 2014, 16:34

al2055 пишет:
Незарегистрированный класс, ошибка движка и т.п.
Предыдущую страницу всю прочитали?
Цитата :
Еще должен стоять Microsoft Visual C++ 2005 SP1 Redistributable Package (x86) 8.0.50727.762
Или поставьте Koba 3, он всё что нужно сам добавит.

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Пт Янв 24 2014, 22:15
Пт Янв 24 2014, 22:15

apokrif пишет:
Еще должен стоять Microsoft Visual C++ 2005 SP1 Redistributable Package (x86) 8.0.50727.762
Все это стоит и даже новее. Уже почти нашел, откуда уши торчат.

Вернуться к началу Перейти вниз
Комсомолец2
Наблюдатель


Сообщений : 3
Репутация : 0

 Комсомолец2 :: Сб Фев 08 2014, 21:43
Сб Фев 08 2014, 21:43

Всем доброго времени суток!
Я прошу прощения если ошибся темой, но не нашел ничего более подходящего. Да не обессудят новичка модераторы.
На просторах интернета я нашел следующее видео: http://www.youtube.com/watch?v=C3e7Op56qN8

Это "спич-тест", в котором участвуют три "голоса": Милена... Мария и Юля. и если с первым знаком, то последние две "дамы" - разработка наших соотечественников из ЦРТ. Что-то новенькое. Больше нигде в интернете не нашел. А тем не менее при наглядном сравнении видно, что забугорная Милена уступает как Марии так и Юле!

Я хотел бы спросить ваше мнение как понимающих в этом деле: как новенькие голоса по сравнению с Миленой на ваш счет?

P.S. Никто не сталкивался в практике с голосами "Марина" и "Юля" от ЦРТ? Их вообще реально найти?

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Вс Фев 09 2014, 18:25
Вс Фев 09 2014, 18:25

Комсомолец2 пишет:
Их вообще реально найти?
Это не подойдёт?

Вернуться к началу Перейти вниз
Комсомолец2
Наблюдатель


Сообщений : 3
Репутация : 0

 Комсомолец2 :: Вс Фев 09 2014, 20:40
Вс Фев 09 2014, 20:40

apokrif пишет:
Это не подойдёт?

Да нет, именно "Марину" ищу.

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Пт Фев 14 2014, 00:06
Пт Фев 14 2014, 00:06

apokrif пишет:
Цитата :
Выложите ваши рег файлы и ваш же readme отдельно - я их на 4пда тоже
Здесь файлы реестра, но они переделаны мной под голоса, скачанные из разных ссылок.
Тут же папка Vocalizer_Expressive_SAPI5_x86_readme, которую я скачал с 4пда
https://drive.google.com/folderview?id=0B7fIANHkqAlYRlh3Rm9nemhxVkk&usp=sharing
Задача была установить русские голоса весом около "центнера". Сами голоса, с которыми будут работать файлы реестра, также переименованы (я не специалист в компьютерах, в школе учился тогда, когда их в помине не было, поэтому делал как умел). Мои файлы реестра будут работать с голосами, переименованными мной и загруженными на сервер для скачивания по ссылке в предыдущем сообщении.

Вернуться к началу Перейти вниз
gammajung
Наблюдатель


Сообщений : 1
Репутация : 0

 gammajung :: Пт Фев 28 2014, 03:55
Пт Фев 28 2014, 03:55

Господа! Поставил "Милену" на XP - Premium High версию по ссылке из первого сообщения. Пишет "Ошибка синтезирования речи: класс не зарегистрирован". Что делать? Программа по восстановлению ключей реестра не работает.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Сб Сен 13 2014, 22:57
Сб Сен 13 2014, 22:57

gammajung пишет:
Пишет "Ошибка синтезирования речи: класс не зарегистрирован". Что делать?
Товарищ с 4pda.ru предлагает совсем простое решение:
AlienUser пишет:

Тем, у кого не работает "Милена" Premium High на XP по ссылке из первого сообщения (Vocalizer_for_Automotive_v5) и пишет "Ошибка синтезирования речи: класс не зарегистрирован", и не помогают никакие программы по восстановлению ключей реестра (FixRegistry, speech.reg), может помочь предварительная установка KobaSpeech 2 With Vocalizer Milena - Russian.exe (из личного опыта). Я взял ее с офиц. сайта, но надеюсь, она останется бесплатной и после 30-дневного срока (на оф. сайте ничего, вроде, не видел об этом), так как это старая версия, или по крайней мере после этого срока продолжат работать голоса из Vocalizer_for_Automotive_v5. После установки KobaSpeech 2 запустите Milena.reg и SAPI5.reg (я делал именно в такой последовательности, но вы можете экспепрементировать) из набора для Vocalizer_for_Automotive_v5. Заставить так работать Милену с KobaSpeech 3 With Vocalizer Yuri - Russian.exe не получилось, но я пробовал именно с Юрием (и запускал сначала SAPI5.reg, потом - Milena.reg, хотя не знаю, какое порядок имеет значение), так как хотел послушать на пробу мужской голос, с Миленой был уже знаком по Андроиду. Чуда не произошло, - Юра - просто ужас, как все везде и пишут, с Миленой рядом не стоял. После установки KobaSpeech 2 дальше эксперементировать с 3-ей версией (с Миленой оттуда) не стал, не хотел тратить время и сомневаюсь, что разница в голосах на что-то принципиально влияет в решении указанной проблемы.

Вернуться к началу Перейти вниз
retigor
Посетитель


Сообщений : 28
Репутация : 16

 retigor :: Чт Дек 25 2014, 14:36
Чт Дек 25 2014, 14:36

Качество звука новой Милены «Vocalizer Expressive»

Поставил (благодаря трудам apokrifX) на Win7 новую Милену «Vocalizer Expressive» и сравнил с её предшественницей Миленой «Vocalizer for Automotive v5», ожидал качественного прорыва! Ну думаю, и было неплохо, а с новыми возможностями, точно заткнёт за пояс и Алёну и Ольгу. Речь идёт, конечно же, об обеих версиях «Premium High».

Так вот, а что же действительно нового и качественного в «Vocalizer Expressive» ?
1. Возможность регуляции тембра (по-моему, в старой версии тембр не регулировался).
2. При этом, каких либо принципиально новых интонаций в новом голосе «экспрессивной», т.е. «выразительной» Милены, я не услышал.
3. Кроме того, в голосе появились какие-то щелчки.
4. А самое главное, звук стал более «резким», это в первую очередь связанно с тем, что разработчик увеличил громкость на верхних частотах речи, т.е. на частотах 5-6 КГц. Однако, на мой слух, новый голос Милены стал в значительной степени «металлическим». А это, как правило, бывает связанно со значительным уровнем гармонических искажений в звуке, что свидетельствует только об ухудшении качества звука.

Может я ошибаюсь?

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Сб Дек 27 2014, 21:17
Сб Дек 27 2014, 21:17

retigor пишет:
Может я ошибаюсь?
Ответил вам на другом форуме, просто там чаще бываю... silent

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Вс Авг 30 2015, 22:38
Вс Авг 30 2015, 22:38

выложили новую милену

тут

для того что бы скачать надо регистрацию там


пока на ПК не работает, работает на андройде, надо vocalizer_e.tts_1.0.2.3r и обязательно поправьте hdr (в папке ve).
для milena нужно удалить строку
Цитата :
<COMPONENT>fe/be_adapt</COMPONENT>
в ve_pipeline_rur_milena_22_full_vssq5f22.hdr

Вернуться к началу Перейти вниз
alexlaw
Наблюдатель


Сообщений : 4
Репутация : 1

 alexlaw :: Пт Сен 25 2015, 18:35
Пт Сен 25 2015, 18:35

Давно пользуюсь Миленой для прослушивания книг на телефоне.
А сегодня сделал простую вещь:
  • установил Balabolka
  • установил KobaSpeech 3 (ссылка выше)
  • заменил папку languages в KobaSpeech 3 на папку languages из milena_full_vssq5_f22_pmk с сайта 4PDA
Все. Теперь на телефоне и на компе один голос высокого качества.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Сб Сен 26 2015, 02:58
Сб Сен 26 2015, 02:58

alexlaw пишет:
-установил KobaSpeech 3 (ссылка выше)
-заменил папку languages в KobaSpeech 3 на папку languages из milena_full_vssq5_f22_pmk
с сайта 4PDA
Так в KobaSpeech 3 же совсем старая ve.dll была, неужели обновили?
Та, что была (1.1), milena_full_vssq5_f22_pmk из Yosemite точно не поддерживает.
Yosemite-овской нужна 1.5
Или 1.4 + правка hdr.

Или у вас совсем старая milena_full_vssq5_f22_pmk...
Посмотрите, какая у вас версия ve.dll?

Вернуться к началу Перейти вниз
alexlaw
Наблюдатель


Сообщений : 4
Репутация : 1

 alexlaw :: Сб Сен 26 2015, 07:05
Сб Сен 26 2015, 07:05

Версия файла 1.1.1.13071
Пример синтеза речи

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Сб Сен 26 2015, 18:47
Сб Сен 26 2015, 18:47

alexlaw пишет:
Версия файла 1.1.1.13071
У меня она не работала с Yosemite Milena:
Код:
<langversion>5.2.4.14345</langversion>
<voiceversion>5.2.4.14344</voiceversion>

Вернуться к началу Перейти вниз
alexlaw
Наблюдатель


Сообщений : 4
Репутация : 1

 alexlaw :: Сб Сен 26 2015, 22:53
Сб Сен 26 2015, 22:53

Код:
<BROKERSTRING>pipeline/Russian/milena/22/full_vssq5f22/text/pcm</BROKERSTRING>
<PRIORITY>4322</PRIORITY>
<PARAMETERS>
<language>Russian</language>
<langcode>RUR</langcode>
<langid>16</langid>
<langversion>5.2.3.0000</langversion>
<nativetypeofchar>utf-16</nativetypeofchar>
<voice>Milena</voice>
<voiceversion>5.2.3.12296</voiceversion>
<gender>Female</gender>

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Вс Сен 27 2015, 21:07
Вс Сен 27 2015, 21:07

alexlaw пишет:
<langversion>5.2.3.0000</langversion>
<voiceversion>5.2.3.12296</voiceversion>
У вас совсем древняя, похоже самая первая для Vocalizer Expressive?
Yosemite Milena 2015
Код:
    <langversion>5.2.4.14345</langversion>
    <voiceversion>5.2.4.14344</voiceversion>
Milena 2013
Код:
    <langversion>5.2.4.14210</langversion>
    <voiceversion>5.2.4.12297</voiceversion>

Вернуться к началу Перейти вниз
zsoft
Наблюдатель


Сообщений : 1
Репутация : 0

 zsoft :: Вс Ноя 29 2015, 06:28
Вс Ноя 29 2015, 06:28

помогите не могу разобраться как под винду поставить Nuance Vocalizer Expressive...
например Nuance Vocalizer for Automotive - ставится нормально и работает(в балаболке все вижу), но как я понял оно очень старое...
пробую ставить Nuance Vocalizer Expressive - все делаю по инструкции, но в балаболке не появляются голоса..., в винде в панели управления > распознование речи > преобразоание текста в речь - оно появляется (разные выбрать можно: компакт, плюс, премиум) - на любой тыкаю пишет ошибку: this voice cannot be played. Please try selection another voice or selecting a different audio output device.
прошу помощи...

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Чт Ноя 03 2016, 13:57
Чт Ноя 03 2016, 13:57

На сайте фирмы "Harpo", кроме голосов IVONA, доступны для покупки 97 голосов от компании Nuance. В том числе русские голоса Yuri, Milena и Katya. Цена одного голоса - $45.

http://harposoftware.com/en/2-main/s-1/index/brand-nuance/language-russian

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Пт Ноя 04 2016, 03:21
Пт Ноя 04 2016, 03:21

balabolka пишет:
На сайте фирмы "Harpo"...
Да, примерно в июне выложили. Если нужно поправить silent


Вернуться к началу Перейти вниз
alexlaw
Наблюдатель


Сообщений : 4
Репутация : 1

 alexlaw :: Пт Ноя 04 2016, 06:58
Пт Ноя 04 2016, 06:58

39 евро многовато будет. Т.к. для личного потребления это роскошь, а не средство "передвижения". Для себя на просторах всемирной паутины я давно нашел свою Милену для Винды не требующую за свои услуги ничего.

Вернуться к началу Перейти вниз
balaam
Интересующийся


Сообщений : 7
Репутация : 3

 balaam :: Пн Янв 02 2017, 22:51
Пн Янв 02 2017, 22:51

al2055 пишет:
Скопировал, зарегистрировал, но радости отчего-то нет. Все голоса видны, но ни в одном приложении не работают. Незарегистрированный класс, ошибка движка и т.п.
Мне, на Win 7 x64, помогло редактирование SAPI5_x86.reg. Нужно заменить в нём Program Files на Program Files (x86)
Ну и сам движок распаковывал в c:\Program Files (x86)

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Вт Сен 19 2017, 17:11
Вт Сен 19 2017, 17:11

Вступил в переписку со службой поддержки компании Nuance по поводу ошибок в их голосах, обнаруженных одним из пользователей "Балаболки". Выяснилось, что все текущие голоса от фирмы Nuance содержат две проблемы.

Проблема 1.
XML тег <silence/>, применяемый в SAPI 5 для добавления в речь паузы, зависит от скорости речи. Например, если указать звуковому движку сделать паузу продолжительностью 10 секунд:

<silence msec="10000"/>

то при скорости речи «0» длина паузы будет 10 секунд, при скорости речи «+5» пауза будет 7,5 секунд, при скорости речи «+10» пауза составит 5 секунд. Это очевидная ошибка в работе голоса, так как продолжительность пауз задается в миллисекундах и должна всегда оставаться неизменной (если, конечно, компьютер не движется со скоростью, близкой к скорости света).

Проблема 2.
Оказалось, что при использовании голосов Nuance невозможно добавить в звуковой файл паузу продолжительностью более 66 секунд. У голосов от других фирм такого ограничения нет.

Речь идет о связке тега <silence/> и еще какого-либо текста до или после тега. И, конечно же, скорость речь и здесь оказывает свое влияние: на скорости «0» можно записать 66 секунд тишины, на скорости «+10» максимальная пауза будет 33 секунды.

---

Посмотрим, даст ли эта переписка результат.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Ср Сен 20 2017, 14:27
Ср Сен 20 2017, 14:27

balabolka пишет:

Вступил в переписку со службой поддержки компании Nuance по поводу ошибок в их голосах, обнаруженных одним из пользователей "Балаболки".
Здорово! Я тоже пытался связаться через разный каналы лет 5 назад – не получил ни одного ответа...

balabolka пишет:

Проблема 1.
XML тег <silence/>, применяемый в SAPI 5 для добавления в речь паузы, зависит от скорости речи.
Да, настоящий баг. Понятно, что паузы от точек, запятых, и т.д. должны зависеть от скорости речи, но не эта.
Чтобы обойти, наверное можно тег <silence/> в скорость оборачивать?
Понятно, что через Ж, но лучше чем ничего?


balabolka пишет:

Проблема 2.
Оказалось, что при использовании голосов Nuance невозможно добавить в звуковой файл паузу продолжительностью более 66 секунд. У голосов от других фирм такого ограничения нет.
Дык эта, скорость уменьшите до 0 и любую паузу получите!


balabolka пишет:

Посмотрим, даст ли эта переписка результат.
Тоже интересно. А кто отвечает от Nuance - индусы или ...?

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Ср Сен 20 2017, 16:02
Ср Сен 20 2017, 16:02

apokrif
Пока получил лишь вежливый ответ, что мое сообщение принято к сведению и изложенная в нем информация будет проанализирована.

Проблема с тегом <silence/> имеет значение для преобразования субтитров в звуковой файл. Пока попробую ввести поправочные коэффициенты для разных значений скорости речи для голосов Nuance (то есть, для паузы 10 секунд и скорости речи "+10" программа будет использовать значение в 20 тысяч миллисекунд для тега тишины). Но это только для субтитров.

---

Тут пришла беда, откуда не ждали: один из пользователей сообщил, что проблема с тегом тишины есть и в голосах IVONA, которые продает фирма Harpo. В доказательство своих слов он прислал файл субтитров и звуковой файл, записанный при помощи "Татьяны" на скорости "+10". В этом аудиофайле та же проблема, что и в голосах Nuance: при увеличении скорости речи длительность пауз уменьшается.

У меня самого стоит "оригинальный" голос "Татьяна", купленный еще на сайте IVONA (версия 1.6.70): в нем такой проблемы нет. Сложно поверить, что в последних версиях голоса разработчики умудрились добавить такую серьезную ошибку, но пока это выглядит именно так.

Был бы признателен, если тот, у кого стоит последняя версия "Татьяны" от фирмы Harpo, преобразовал файл субтитров в звуковой файл на скорости речи "+10", а затем проверил, совпадает речь с метками времени или нет.

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Ср Сен 20 2017, 20:49
Ср Сен 20 2017, 20:49

balabolka, у Hapro на сайте демо версии всех голосов 30 суток бесплатно работают



прямая ссылка с их сайта на татьяну.
http://dnld.harposoftware.com/6oj4uhk7pn8gmjing/348_Tatyana.exe

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Чт Сен 21 2017, 01:00
Чт Сен 21 2017, 01:00

balabolka пишет:
Был бы признателен, если тот, у кого стоит последняя версия "Татьяны" от фирмы Harpo, преобразовал файл субтитров в звуковой файл на скорости речи "+10", а затем проверил, совпадает речь с метками времени или нет.
Может просто текст кинуть в SAPI, типа:
<speed=1/>Сейчас будет пауза 5 сек.<silence=5000/>пауза закончилась.
Сам бы сделал, но я в разметке SAPI ни бум бум...

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Чт Сен 21 2017, 15:04
Чт Сен 21 2017, 15:04

Спасибо всем тем, кто откликнулся на мою просьбу и прислал результаты тестов голосов IVONA от фирмы Harpo. Мне тоже удалось протестировать эти голоса.

Подтвердились худшие опасения: текущая версия голосов IVONA с сайта Harpo неправильно обрабатывает тег <silence/>, если скорость речи отличается от значения "0". Продолжительность тишины зависит от скорости речи, хотя величина задана в миллисекундах. В старой версии "Татьяны" (которая продавалась через сайт IVONA) всё работает нормально.

Подготовил текстовый пример и два звуковых файла, записанных с помощью новой и старой версий; отправлю их в службу поддержки Harpo. Пусть или разбираются сами, или пересылают в службу поддержки IVONA.

Подытожу:
  • Если кто-то собирается использовать "Балаболку" и голоса IVONA для преобразования субтитров, то берите старую версию голоса "Татьяна" (версия 1.6.70, файл Ivona_Voice_1.6_Tatyana_22kHz.exe). Либо записывайте субтитры только на скорости речи "0".
  • С голосами Nuance всё плохо; в нынешнем варианте их использовать для преобразования субтитров нельзя.
  • При использовании "Ольги" продолжительность тишины зависит от скорости речи.
  • Голос "Алёна" работает без проблем.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Вс Сен 24 2017, 02:36
Вс Сен 24 2017, 02:36

balabolka пишет:
apokrif пишет:

Чтобы обойти, наверное можно тег <silence/> в скорость оборачивать?
Понятно, что через Ж, но лучше чем ничего?
Пусть или разбираются сами, или пересылают в службу поддержки IVONA.
Дык, а по рабоче-крестьянски-то значится не выходит никак? Типа того:
Код:
<speed=0><silence=5000/></speed>

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Вс Сен 24 2017, 13:35
Вс Сен 24 2017, 13:35

apokrif
Тег <rate/> не помогает.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Вс Сен 24 2017, 15:09
Вс Сен 24 2017, 15:09

balabolka пишет:
apokrif
Тег <rate/> не помогает.
Ясно.
А зависимость от скорости речи одинаковая для IVONA и Nuance?
Если скорость выставляется в самой "Балаболке", а не в тексте, может можно таги <silence msec="10000"/> на лету под текущую <rate/> подправлять?
Хотя если таги самому обрабатывать, наверное можно и <rate/> тоже распознавать и учитывать...

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Вс Сен 24 2017, 19:26
Вс Сен 24 2017, 19:26

apokrif
Зависимость от скорости речи для голосов разных фирм разная.

В "Балаболке" коррекция будет только для голосов Nuance и только для преобразования субтитров. Для голосов IVONA ничего предпринимать не стану, так как надо распознавать версию голоса (а возможно, еще и вендора). Будем надеяться, что разработчики IVONA сами исправят ошибку в короткий срок.

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

Nuance Milena TTS

Предыдущая тема Следующая тема Вернуться к началу
Nuance Milena TTS
Страница 4 из 4Страница 4 из 4На страницу : Предыдущий  1, 2, 3, 4
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении