Искусственный голос и синтез речи - 语音合成
Вы хотите отреагировать на этот пост ? Создайте аккаунт всего в несколько кликов или войдите на форум.


语音合成技术和文本语音转换 - Synthetic voice and Text to Speech technology - Синтетический голос и технологии преобразования текста в речь
 
TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  

Словари

Предыдущая тема Следующая тема Перейти вниз
АвторСообщениеСловари
bot
Гость


Сообщений : 317
Репутация : 12

Словари WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 bot :: Пт Дек 12 2008, 18:53
Словари FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пт Дек 12 2008, 18:53


Словари 2675288024Словари для голосового движка Loquendo (Ольга)

Словари 234844473Словари-фильтры необходимые для использования программных словарей Николая формата *.dic Ольгой
Словари 1141917519Словарь коррекции текста (дополнительный словарь для основного словаря замен корректирующий текст для лучшей расстановки ударений). Обсуждение и описание словаря тут.
Словари 234844473Словарь преобразования ударений Аленки для Ольги
Словари 2607383269Словарь транскрипций (sampa)
Словари 2600076159Словарь замены числительных и физических величин. Поскольку ударения в словаре указаны в формате для голоса Аленка рекомендуется использовать совместно со словарем преобразования ударений Аленки для Ольги или раскомментируйте в конце словаря нужную строку для замены вида ударения. Обсуждение и описание словаря тут.
Словари 1195538408Словарь склонения числительных. Обсуждение и описание словаря тут.
Словари 1195538408Словарь коррекции текста (дополнительный словарь для основного словаря замен корректирующий текст для лучшей расстановки ударений). Обсуждение и описание словаря тут.
Словари 3542510717Словарь для ручного поиска омографов к "балаболка" - Olga.hmg (скопировать в папку мои документыbalabolka)
Словари 234844473Словарь замены для Ё-фикации текста. Обсуждение и описание словаря тут.
Словари 234844473Словарь замены текста написанного транслитом
Словари 234844473Словарь замен преобразующий текст написанный кириллицей в "транслит" (текст написанный латиницей) и наоборот.
Словари 234844473Словарь замен преобразующий текст написанный в виде "12.30" к виду "12:30".
Словари 2600076159Словарь коррекции для чтения аббревиатур. Обсуждение и описание словаря тут.
Словари 1141917519Словарь коррекции для чтения дополнительных символов юникод. Обсуждение и описание словаря тут.

Словари 3828486923Перед установкой:

Все вышеприведенные словари проверены и могут быть использованы в программах "Балаболка" и "Демагог". Поддержка словарей другими программами не проверялась, но скорее всего, возможна.
Словари 234844473Словари 1839274682 словари - файлы со списками замен, каждая строка которых содержит шаблон и текст, которым будет заменен данный шаблон в тексте; между ними стоит знак равенства (=). Левая часть - искомый фрагмент текста, правая часть - замена. В первую очередь рассматриваются шаблоны с максимальным количеством букв, т.е. чем длиннее у правила левая часть тем раньше оно сработает в тексте. По умолчанию программа не учитывает различий между прописными и строчными буквами при рассмотрении шаблонов. Если регистр букв имеет значение, в правило добавляется символ "$" в начало строки. Например:
Цитата :
$МАГ=Международная ассоциация геодезии
По умолчанию шаблон представляет из себя отдельное слово (или несколько слов), ограниченное пробелами или знаками препинания. Если шаблон является частью слова, то для обозначения того, что перед текстом или после него могут быть любые символы, используется символ "*" (звездочка). Например:
Цитата :
авто*=авта
Данное правило будет применено к словам "автомобиль", "автокатастрофа" и т. д. Чтобы использовать в тексте специальные символы ("#", "*", "$", "="), их записывают дважды в соответствующем месте, например:
Цитата :
**=звёздочка
В этом случае отдельный символ "*" в тексте будет читаться как "звёздочка".

Словари Словари 234844473Словари 1195538408 самые распространенные среди различных программ для синтеза речи. Если программа поддерживает пользовательские словари то в первую очередь имеется в виду эти форматы словарей.

Следует заметить что в последнее время, в связи с появлением других алгоритмов словарных замен форматы написания правил в словаре замен могут отличаться друг от друга. Более подробно про все это безобразие написано тут.
Словари 3828486923Что такое Словари 3542510717 словарь и несколько слов про омографы

Омографы - слова, одинаковые по написанию, но различающиеся произношением. Иногда их также называют графическими омонимами. Одной из основных причин возникновения омографов в русском языке является различное ударение: зáмок – замóк. Омографы также возникают за счет того, что в текстах обычно не проставляют точки над ё, например: небо (нéбо и нёбо), берет (берéт и берёт).

Словари 3542510717 словари - файлы со списками замен, каждая строка которых содержит перечень словоформ искомого омографа и его искомую форму в тексте; между ними стоит знак равенства (=). Левая часть - искомый фрагмент текста, правая часть - варианты его замены, перечисленные через запятую.
Например:
Цитата :
замок=зАмок,замОк
По умолчанию различие между прописными и строчными буквами при рассмотрении шаблонов не делается. Если регистр букв имеет значение, добавляют символ "$" в начало строки также как и в словарях Словари 234844473Словари 1839274682:
Цитата :
$Толстой=тОлстой,толстОй
Данный формат словарей поддерживается программами "балаболка" (в ней он и был придуман) и "демагог". Для каждого омографа программа позволяет добавлять список фраз, замена которых будет осуществляться автоматически (закладка "Фразы с омографом" в редакторе омографов). Например:
Цитата :
замок=замОк
взломали замок=взломали замОк
При выполнении ручного поиска омографов в тексте программа "балаболка" (пункт главного меню "Текст|Искать омографы") эти выражения автоматически заменяются на новые а для слов, фразы с которыми нет в словаре, программа предлагает выбрать нужный вариант самостоятельно.
Словари V0q2lle

В отличии от словарей Словари 234844473Словари 1839274682, Словари 3542510717 словари используются только для ручной разметки текста. И хотя это очень долго и у многих не хватает терпения возиться со всем этим, особенно если текст весьма объемный, использование данного способа разметки позволяет практически полностью снять омонимию в тексте выставив нужную форму с проставленным ударением.

В последних версиях программ «балаболка» и «демагог» форматы Словари 2600076159Словари 1180426935Словари 1141917519 заменены на формат Словари 1195538408. Данная замена происходит автоматически. Словари формата Словари 1195538408 это те же словари Словари 2600076159Словари 1180426935Словари 1141917519 использующие регулярные выражения работающие только по стандарту PCRE.
Словари формата Словари 2600076159 поддерживаются только более ранними версиями программ где есть переключение старого формата словарей. Если вам нужна поддержка старого формата словарей скачайте и замените исполняющий файл в корне установленной ранее программы для «балаболка» или «демагог» (mytts.forum2x2.ru).
31 hmg2dic - Утилита для выделения правил из словарей Словари 3542510717 добавленных при ручном поиске омографов в формате для словаря замен Словари 234844473
Словари 3542510717Словари 234844473
31 DIC/HMG конвертер - Утилита для объединения, разделения и выделения правил из словарей Словари 3542510717Словари 234844473 добавленных при ручном поиске омографов в формате для лексиконов ударений аленки.
Словари 3542510717 ↔️ Словари 234844473
31 txt2hmg - Утилита для преобразования списка омографов в список правил Словари 3542510717 для "ручной" замены в тексте.
Словари 1038847852Установка и подключение словаря транскрипций:

Словарь транскрипций (sampa) - example.lex должен находиться в C:/Program Files/Loquendo/LTTS7/bin/example.lex. Для нормальной работы словарю необходима запись в реестре
Код:
[HKEY_LOCAL_MACHINE\\SOFTWARE\\Loquendo\\LTTS7\\default.session]
"SpellingLevel"="pronounse"
[HKEY_LOCAL_MACHINE\\SOFTWARE\\Loquendo\\LTTS7\\LoqSAPI5]
"Lex.1049"="C:\\Program Files\\Loquendo\\LTTS7\\bin\\example.lex"

Словари 1038847852Дополнительные настройки:

Файл настроек находится по адресу C:/Program Files/Loquendo/LTTS7/data/voices/Olga/Olga.vde
Код:
; LTTSComponentVersion=7.3.0
; Voice descriptor file for Loquendo TTS

"BaseDescription" = "Russian female voice"
"Library" = "LTTS7Olga, Olga"
"BaseSpeed" = "100"
"BasePitch" = "95"
"Gender" = "Female"
"Age" = "35"
"ProsodicPauses" = "punctuation"
"ShortPauseLenght" = "90"
"GildedTTS" = "yes"
"gdeInclude" = "OlgaGilded.gde"
"MotherTongue" = "Russian"
"MotherTongueAliases" = "Russian,ru-RU,ru"
"DemoSentence" = "Меня зовут Ольга, я – женский голос компании Локуэндо, мой родной язык – русский."

Словари 1038847852Установка для использования словарей от голосового движка «Николай»:


В качестве словарей можно использовать словари от голосового движка «Николай» предварительно установив словари-фильтры убирающие лишние знаки которые не поддерживаются в SAPI5.
  • Запускаем файл "Loquendo_speller_fixer.reg", соглашаемся с изменениями.
  • Подключаем два словаря с расширением "яя_0_Olga_basic_stresser.dic" и "яя_1_Olga_basic_remover.dic" к программе-читалке. Эти словари должны быть последними по списку.

Словари 1038847852Установка для использования словарей от голосового движка «Алена»:


В качестве словарей можно использовать словари от голосового движка «Алена» предварительно установив словари-фильтры корректирующие ударения.
  • Подключать нужно два словаря (основной словарь замен Аленки и словарь коррекции текста) плюс дополнительный словарь преобразования ударений Аленки для Ольги. Работает пока только для стандартного метода замен.

Словари 1038847852Альтернативный редактор лексикона Loquendo Olga

Альтернативный редактор лексикона Loquendo Olga, с возможностью конвертирования словарей движка Николая формата *.txt
31 LoqLexer v.1.1.2

Установка:
Скопировать файл в папку исполняемых файлов движка "Loquendo Olga" (по умолчанию: "C:/Program Files/Loquendo/LTTS7/bin"), также см. readme.txt в архиве.
Словари 3763456268Для слежения за обновлениями словарей, пользуйтесь программой myTTS проверялка.

Словари 3828486923Условные обозначения:

Словари 234844473 - словарь замен dic работающий в большинстве программ;
Словари 1839274682 - словарь замен dic работающий только в программе "демагог";
Словари 2600076159 - словарь замен использующий регулярные выражения работающий только по стандарту VBScript;
Словари 1180426935 - словарь замен использующий регулярные выражения работающий только по стандарту PCRE;
Словари 1141917519 - словарь замен использующий регулярные выражения работающий одинаково по стандарту VBScript и PCRE;
Словари 1195538408 - словарь замен использующий регулярные выражения работающий только по стандарту PCRE;
Словари 3542510717 - словарь для ручного поиска омографов;
Словари 2230594491 - словарь омографов, только для программы "Cognitive Dwarf Shell";
Словари 3790273260 - словарь замен, только для программы "Cognitive Dwarf Shell";
Словари 2607383269 - словарь транскрипций (sampa), только для голосов Loquendo.

Словари WarningЕсли вы нашли ошибки или неоднозначности в наших словарях дайте нам знать. Если при прослушивании появляются ошибки читайте этот топикСловари Warning


Вернуться к началу Перейти вниз

Словари

Предыдущая тема Следующая тема Вернуться к началу
Словари
Страница 1 из 1Страница 1 из 1
      Форма быстрого ответа        Форма быстрого ответа  
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении
Создать форум | © phpBB | Бесплатный форум поддержки | Сообщить о нарушении | Последние обсуждения