TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



MILAN - редактор словарей для Nuance Милены

Предыдущая тема Следующая тема Перейти вниз
АвторСообщениеMILAN - редактор словарей для Nuance Милены
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Пт Апр 12 2013, 14:15
Пт Апр 12 2013, 14:15

Пользователь SZ-Vtk с форума ресурса http://4pda.ru написал редактор.

MILAN - редактор словарей для Nuance Милены


Три способа задания текста замены:
- текст без ударений
- текст с обязательным ударением (автоматически переводится в фонетическую транскрипцию)
- фонетическая транскрипция

Для генерации бинарного словаря .dat необходимы установленные Vocon и Python

Словарь для Милены - это двоичный (ненаглядный) файл с расширением .DAT (обычно userdct_rur.dat), находящийся на Андроиде в папке sdcard\Nuance\...\languages\rur\speech\components. Мы пока не умеем прямо на Андроиде создавать и редактировать этот файл, более того, мы не умеем этого делать и в Windows. Что мы умеем. Мы умеем создавать и редактировать (в Windows) текстовый файл словаря, преобразовывать его в двоичный файл, а затем, закинув его в Андроид, наслаждаться речью Милены: "Рамзес Второй - величайший из фараонов - правил 76 лет. У него был 51 сын и 50 дочерей..." ПрАвил, а не правИл, как сказала бы Милена без словаря. Итак, как создать словарь Милены с помощью программы Milan.

1) Скачиваем установку Vocon и запускаем её. Установлено.
2) Скачиваем установку Python и запускаем её. Установлено.
Python и Vocon используются программой Milan для конвертации словаря в .DAT.
3) Распаковываем и запускаем Milan. Перед нами появляются кнопки и пустые окошки. Нажимаем Загрузить и загружаем словарь userdct_rur. Это простой пробный иллюстрационный словарь. Его можно исправлять, удалять пары слов и добавлять пары слов. Из таких пар словарь и состоит.
Первая часть пары - шаблон - то, что мы будем заменять. Это слово или аббревиатура.
Вторая часть пары - это то, чем мы будем заменять. Три способа задания замены (способ отмечается точкой):
Код:
(1) текст.
Шаблон: правил
Замена: праавил

(2) текст с ударением - автоматически переведётся в фонетическую транскрипцию
Шаблон: правил
Замена: пра'вил
В поле транскрипции появится pr'a.v%jIl

(3) ручная фонетическая транскрипция
Шаблон: правил
Замена: pr'a.v%jIl (пишем в поле транскрипции)
Звучание Обеих частей можно прослушать.
После того, как словарь готов, нажимаем кнопку Выдать .DAT и .DCT. В поддиректории DICT кроме исправленного тестового словаря .VOC (мы с ним работали) появляется текстовый словарь .DCT и двоичный словарь .DAT. (Последний нам и нужен, чтобы закинуть его в устройство).

если к автору возникнут вопросы, тема где автор редактора обитает
http://4pda.ru/forum/index.php?showtopic=200728

31 Milan
31 VoCon 3200 Embedded Development System v3.3 зеркало
31 Python

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Чт Апр 25 2013, 01:39
Чт Апр 25 2013, 01:39

новая версия


Цитата :
Особенность: замены можно задавать "кустом"
отмечен(*,а,о,ы) отме'чен
Эквивалентно 4-м строкам


https://www.dropbox.com/s/5s30n9yqf5q2q9v/Milan14.zip

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Пт Июн 07 2013, 19:32
Пт Июн 07 2013, 19:32

новая версия

Цитата :
Версия 1.6 Добавлена кнопка "Поиск дубликатов"


https://www.dropbox.com/s/hucxplusjdqjr5b/Milan16.zip

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Вс Июн 09 2013, 14:20
Вс Июн 09 2013, 14:20

новая версия

Цитата :
Версия 1.7 Добавлено чтение всего словаря вслух

https://www.dropbox.com/s/qo7livmb2vxzmn2/Milan17.zip

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Пн Июн 10 2013, 14:34
Пн Июн 10 2013, 14:34

новая версия

Цитата :
Milan 1.8
1) Изменена работа с полями замены (орфо и фонетическая транскрипция)
2) Изменён bat-файл (снято ограничение на длины путей). Возможно, заработает генерация DAT-словаря, у кого она не работала.


https://www.dropbox.com/s/ejix5s3omv0nj6v/Milan18.zip

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Вс Июн 16 2013, 22:30
Вс Июн 16 2013, 22:30

новая версия 1.9

Цитата :
Исправления по замечаниям + Тест

https://www.dropbox.com/s/l8lphcvjkvp6ad1/Milan19.zip

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Вс Июн 16 2013, 22:44
Вс Июн 16 2013, 22:44

мне некоторые пишут, что не получается .dat словарь.



папку с программой держите на диске C в корне, а не на рабочем столе, слишком длинный путь.


так же программа при создании словаря создает pyt.bat он хранит инфу о ошибке или удаче. смотрите в нем где косяк.

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 106
Репутация : 39

 Dmitry :: Чт Сен 05 2013, 08:01
Чт Сен 05 2013, 08:01

новая версия 1.10


Цитата :
Исправление ошибок
https://www.dropbox.com/s/nnk21yf9w3oy8bw/Milan110.zip

Вернуться к началу Перейти вниз
Лёва
V.I.P.
avatar


Сообщений : 134
Репутация : 173

 Лёва :: Вт Сен 10 2013, 17:20
Вт Сен 10 2013, 17:20

Все движки, которые не понимают ударений в тексте, а работающие со своими словарями, в первую очередь заточенными для исправления "фифектов" речи, должны лихо справляться с омографами.
Таковых пока в природе не наблюдается. За исключением наверное пары - с большой натяжкой.
Из этого следует, что пытаться что то сделать полезное и стоящее, с такими движками, как Милена, не удастся.

Вернуться к началу Перейти вниз
Комсомолец2
Наблюдатель


Сообщений : 3
Репутация : 0

 Комсомолец2 :: Сб Фев 08 2014, 22:02
Сб Фев 08 2014, 22:02

Проблема с редактором словаря.
Сделал все как вы сказали (все файлы лежат в C, в самом корне), но файл dat все равно не получаю.

Лог следующий:
http://s8.uploads.ru/t/IHxWQ.jpg

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Пт Фев 14 2014, 18:46
Пт Фев 14 2014, 18:46

Комсомолец2 пишет:
Цитата :
Сделал все как вы сказали (все файлы лежат в C, в самом корне), но файл dat все равно не получаю.
Точно такая же картина была и у меня. Я её исправил, переименовав папку в соответствии с названием в лог-документе. Словарь удалось получить.

Вернуться к началу Перейти вниз
basist
Гость
avatar



 basist :: Пт Фев 14 2014, 19:16
Пт Фев 14 2014, 19:16

Помещаю ссылку на словари замен слов-омографов фонемами для голосов Катя, Милена и Юрий, доступных для загрузки в параллельной ветке форума.
https://drive.google.com/folderview?id=0B7fIANHkqAlYZm8zeFhwS0UtSU0&usp=sharing
Для правильного отображения всех символов необходима кодировка UTF-8.
Применяется для исправления произношения ударений голосом Юрий в тексте,
размеченном выделением заглавной буквой ударной гласной.
Для удобства исправления "нюканья" Юрия пришлось словарь омографов Алёны разделить на два: с "У" и без "У".
При составлении словаря для простановки ударений использовалась программа "Милан", для разделения слов по слогам - "Слогоделитель" (Syllab3).
Ниже привожу некоторые заметки, созданные в результате работы со словарём. Может, пригодятся автору "Милана" или другим пользователям, желающим улучшить качество произношения. Здесь транскрипции некоторых безударных окончаний. 100% гарантии, что они всегда сработают, нет. Стрелка, стоящая перед косой чертой в интернет-обозревателе у меня не отображается, скопируйте фрагмент и вставьте в текстовый редактор с поддержкой UTF-8 кодировки.
Спойлер:
 

Вернуться к началу Перейти вниз
Leony
Наблюдатель


Сообщений : 4
Репутация : 0

 Leony :: Пт Ноя 21 2014, 21:36
Пт Ноя 21 2014, 21:36

Собственно, куда помещать файл под Windows.
C dat-файлами вижу папки:
... tts\milena\speech\components\data\
... \tts\milena\speech\components\conv\
сгенерированный userdct_rur.dat бросал в них, интерфейс к глосу (TextAloud) перегружал – как читала слово, так и читает. Хотя в Милане читает уже правильно.

Вернуться к началу Перейти вниз
Leony
Наблюдатель


Сообщений : 4
Репутация : 0

 Leony :: Сб Ноя 22 2014, 01:45
Сб Ноя 22 2014, 01:45

если установить Nuance Vocalizer и скопировать userdct_rur.dat ему в
c:\Program Files\Nuance\Vocalizer for Automotive v5\languages\rur\speech\components\ – vautodemo.exe подхватит его. Но читалка TextAloudMP3 будет продолжать читать по-прежнему.

Вернуться к началу Перейти вниз
Leony
Наблюдатель


Сообщений : 4
Репутация : 0

 Leony :: Сб Ноя 22 2014, 14:47
Сб Ноя 22 2014, 14:47

Чтобы я ни делал – никто, кроме vautodemo не подхватывает словарь userdct_rur.dat
Пробовал и набор Nuance\Vocalizer for Automotive v5
и набор ScanSoft Milena_Full_22kHz в оболочке Dolphin Guide – этот вообще словари не подхватывает.

Вернуться к началу Перейти вниз
DemonHuntress
Интересующийся
avatar


Сообщений : 8
Репутация : 1

 DemonHuntress :: Вт Мар 29 2016, 08:25
Вт Мар 29 2016, 08:25

Подскажите, а ведь по идее, пользовательский словарь userdct_rur.dat должен подхватываться любым приложением, поскольку это установлено в HDR файле.
То есть, вне зависимости от программы, сам голос должен подхватывать словарь?

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 331
Репутация : 85

 apokrif :: Вт Мар 29 2016, 16:29
Вт Мар 29 2016, 16:29

DemonHuntress пишет:
Подскажите, а ведь по идее, пользовательский словарь userdct_rur.dat должен подхватываться любым приложением, поскольку это установлено в HDR файле.
То есть, вне зависимости от программы, сам голос должен подхватывать словарь?
Да, именно так.

Вернуться к началу Перейти вниз
balaam
Интересующийся


Сообщений : 7
Репутация : 3

 balaam :: Вт Янв 03 2017, 00:20
Вт Янв 03 2017, 00:20

Комсомолец2 пишет:
Проблема с редактором словаря.
Сделал все как вы сказали (все файлы лежат в C, в самом корне), но файл dat все равно не получаю.

Лог следующий:
http://s8.uploads.ru/t/IHxWQ.jpg
На системах x64 vocon3200 ставится в C:\Program Files (x86)
а в скрипте путь такой:
C:\Python25\Python "C:\Program Files\Nuance\vocon3200\EDS_v3_3\tools\dictcpl.pyc"

Помогает создание ссылки в командной строке (с правами администратора)
mklink /j "C:\Program Files\Nuance" "C:\Program Files (x86)\Nuance"

P.S. на x64 Pyton не собрался dat-файл, на x86 собирается нормально.

Вернуться к началу Перейти вниз

MILAN - редактор словарей для Nuance Милены

Предыдущая тема Следующая тема Вернуться к началу
MILAN - редактор словарей для Nuance Милены
Страница 1 из 1Страница 1 из 1
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении