Искусственный голос и синтез речи - 语音合成
Вы хотите отреагировать на этот пост ? Создайте аккаунт всего в несколько кликов или войдите на форум.


语音合成技术和文本语音转换 - Synthetic voice and Text to Speech technology - Синтетический голос и технологии преобразования текста в речь
 
TTS книги  Проверялка  ФорумФорум  Последние изображенияПоследние изображения  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  

MILAN - редактор словарей для Nuance Милены

Предыдущая тема Следующая тема Перейти вниз
АвторСообщениеMILAN - редактор словарей для Nuance Милены
Dmitry
Постоялец


Сообщений : 85
Репутация : 39

MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 Dmitry :: Пт Апр 12 2013, 14:15
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пт Апр 12 2013, 14:15

Пользователь SZ-Vtk с форума ресурса http://4pda.ru написал редактор.

MILAN - редактор словарей для Nuance Милены
MILAN - редактор словарей для Nuance Милены 48382259

Три способа задания текста замены:
- текст без ударений
- текст с обязательным ударением (автоматически переводится в фонетическую транскрипцию)
- фонетическая транскрипция

Для генерации бинарного словаря .dat необходимы установленные Vocon и Python

Словарь для Милены - это двоичный (ненаглядный) файл с расширением .DAT (обычно userdct_rur.dat), находящийся на Андроиде в папке sdcard\Nuance\...\languages\rur\speech\components. Мы пока не умеем прямо на Андроиде создавать и редактировать этот файл, более того, мы не умеем этого делать и в Windows. Что мы умеем. Мы умеем создавать и редактировать (в Windows) текстовый файл словаря, преобразовывать его в двоичный файл, а затем, закинув его в Андроид, наслаждаться речью Милены: "Рамзес Второй - величайший из фараонов - правил 76 лет. У него был 51 сын и 50 дочерей..." ПрАвил, а не правИл, как сказала бы Милена без словаря. Итак, как создать словарь Милены с помощью программы Milan.

1) Скачиваем установку Vocon и запускаем её. Установлено.
2) Скачиваем установку Python и запускаем её. Установлено.
Python и Vocon используются программой Milan для конвертации словаря в .DAT.
3) Распаковываем и запускаем Milan. Перед нами появляются кнопки и пустые окошки. Нажимаем Загрузить и загружаем словарь userdct_rur. Это простой пробный иллюстрационный словарь. Его можно исправлять, удалять пары слов и добавлять пары слов. Из таких пар словарь и состоит.
Первая часть пары - шаблон - то, что мы будем заменять. Это слово или аббревиатура.
Вторая часть пары - это то, чем мы будем заменять. Три способа задания замены (способ отмечается точкой):
Код:
(1) текст.
Шаблон: правил
Замена: праавил

(2) текст с ударением - автоматически переведётся в фонетическую транскрипцию
Шаблон: правил
Замена: пра'вил
В поле транскрипции появится pr'a.v%jIl

(3) ручная фонетическая транскрипция
Шаблон: правил
Замена: pr'a.v%jIl (пишем в поле транскрипции)
Звучание Обеих частей можно прослушать.
После того, как словарь готов, нажимаем кнопку Выдать .DAT и .DCT. В поддиректории DICT кроме исправленного тестового словаря .VOC (мы с ним работали) появляется текстовый словарь .DCT и двоичный словарь .DAT. (Последний нам и нужен, чтобы закинуть его в устройство).

если к автору возникнут вопросы, тема где автор редактора обитает
http://4pda.ru/forum/index.php?showtopic=200728

31 Milan
31 VoCon 3200 Embedded Development System v3.3 зеркало
31 Python

Вернуться к началу Перейти вниз
Лёва
V.I.P.
Лёва


Сообщений : 134
Репутация : 173

MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 Лёва :: Вт Сен 10 2013, 17:20
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Вт Сен 10 2013, 17:20

Все движки, которые не понимают ударений в тексте, а работающие со своими словарями, в первую очередь заточенными для исправления "фифектов" речи, должны лихо справляться с омографами.
Таковых пока в природе не наблюдается. За исключением наверное пары - с большой натяжкой.
Из этого следует, что пытаться что то сделать полезное и стоящее, с такими движками, как Милена, не удастся.

Вернуться к началу Перейти вниз
basist
Гость
Anonymous



MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 basist :: Пт Фев 14 2014, 18:46
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пт Фев 14 2014, 18:46

Комсомолец2 пишет:
Цитата :
Сделал все как вы сказали (все файлы лежат в C, в самом корне), но файл dat все равно не получаю.
Точно такая же картина была и у меня. Я её исправил, переименовав папку в соответствии с названием в лог-документе. Словарь удалось получить.

Вернуться к началу Перейти вниз
basist
Гость
Anonymous



MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 basist :: Пт Фев 14 2014, 19:16
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пт Фев 14 2014, 19:16

Помещаю ссылку на словари замен слов-омографов фонемами для голосов Катя, Милена и Юрий, доступных для загрузки в параллельной ветке форума.
https://drive.google.com/folderview?id=0B7fIANHkqAlYZm8zeFhwS0UtSU0&usp=sharing
Для правильного отображения всех символов необходима кодировка UTF-8.
Применяется для исправления произношения ударений голосом Юрий в тексте,
размеченном выделением заглавной буквой ударной гласной.
Для удобства исправления "нюканья" Юрия пришлось словарь омографов Алёны разделить на два: с "У" и без "У".
При составлении словаря для простановки ударений использовалась программа "Милан", для разделения слов по слогам - "Слогоделитель" (Syllab3).
Ниже привожу некоторые заметки, созданные в результате работы со словарём. Может, пригодятся автору "Милана" или другим пользователям, желающим улучшить качество произношения. Здесь транскрипции некоторых безударных окончаний. 100% гарантии, что они всегда сработают, нет. Стрелка, стоящая перед косой чертой в интернет-обозревателе у меня не отображается, скопируйте фрагмент и вставьте в текстовый редактор с поддержкой UTF-8 кодировки.
Спойлер:

Вернуться к началу Перейти вниз
Leony
Наблюдатель


Сообщений : 4
Репутация : 0

MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 Leony :: Пт Ноя 21 2014, 21:36
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пт Ноя 21 2014, 21:36

Собственно, куда помещать файл под Windows.
C dat-файлами вижу папки:
... tts\milena\speech\components\data\
... \tts\milena\speech\components\conv\
сгенерированный userdct_rur.dat бросал в них, интерфейс к глосу (TextAloud) перегружал – как читала слово, так и читает. Хотя в Милане читает уже правильно.

Вернуться к началу Перейти вниз
Leony
Наблюдатель


Сообщений : 4
Репутация : 0

MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 Leony :: Сб Ноя 22 2014, 01:45
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Сб Ноя 22 2014, 01:45

если установить Nuance Vocalizer и скопировать userdct_rur.dat ему в
c:\Program Files\Nuance\Vocalizer for Automotive v5\languages\rur\speech\components\ – vautodemo.exe подхватит его. Но читалка TextAloudMP3 будет продолжать читать по-прежнему.

Вернуться к началу Перейти вниз
Leony
Наблюдатель


Сообщений : 4
Репутация : 0

MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 Leony :: Сб Ноя 22 2014, 14:47
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Сб Ноя 22 2014, 14:47

Чтобы я ни делал – никто, кроме vautodemo не подхватывает словарь userdct_rur.dat
Пробовал и набор Nuance\Vocalizer for Automotive v5
и набор ScanSoft Milena_Full_22kHz в оболочке Dolphin Guide – этот вообще словари не подхватывает.

Вернуться к началу Перейти вниз
DemonHuntress
Интересующийся
DemonHuntress


Сообщений : 8
Репутация : 1

MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 DemonHuntress :: Вт Мар 29 2016, 08:25
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Вт Мар 29 2016, 08:25

Подскажите, а ведь по идее, пользовательский словарь userdct_rur.dat должен подхватываться любым приложением, поскольку это установлено в HDR файле.
То есть, вне зависимости от программы, сам голос должен подхватывать словарь?

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 304
Репутация : 85

MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 apokrif :: Вт Мар 29 2016, 16:29
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Вт Мар 29 2016, 16:29

DemonHuntress пишет:
Подскажите, а ведь по идее, пользовательский словарь userdct_rur.dat должен подхватываться любым приложением, поскольку это установлено в HDR файле.
То есть, вне зависимости от программы, сам голос должен подхватывать словарь?
Да, именно так.

Вернуться к началу Перейти вниз
balaam
Интересующийся


Сообщений : 7
Репутация : 3

MILAN - редактор словарей для Nuance Милены WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 balaam :: Вт Янв 03 2017, 00:20
MILAN - редактор словарей для Nuance Милены FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Вт Янв 03 2017, 00:20

Комсомолец2 пишет:
Проблема с редактором словаря.
Сделал все как вы сказали (все файлы лежат в C, в самом корне), но файл dat все равно не получаю.

Лог следующий:
http://s8.uploads.ru/t/IHxWQ.jpg
На системах x64 vocon3200 ставится в C:\Program Files (x86)
а в скрипте путь такой:
C:\Python25\Python "C:\Program Files\Nuance\vocon3200\EDS_v3_3\tools\dictcpl.pyc"

Помогает создание ссылки в командной строке (с правами администратора)
mklink /j "C:\Program Files\Nuance" "C:\Program Files (x86)\Nuance"

P.S. на x64 Pyton не собрался dat-файл, на x86 собирается нормально.

Вернуться к началу Перейти вниз

MILAN - редактор словарей для Nuance Милены

Предыдущая тема Следующая тема Вернуться к началу
MILAN - редактор словарей для Nuance Милены
Страница 1 из 1Страница 1 из 1
      Форма быстрого ответа        Форма быстрого ответа  
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении
Как создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении | Последние обсуждения