TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



Словари

Предыдущая тема Следующая тема Перейти вниз
АвторСообщениеСловари
bot
Гость


Сообщений : 317
Репутация : 12

 bot :: Вт Ноя 11 2008, 13:59
Вт Ноя 11 2008, 13:59

Словари для голосового движка Speech Cube Elan (Николай)

Основные словари:
Словарь замены ударений (народный словарь). Наиболее полный на сегодняшний день словарь ударений входящий в комплект mp3book (www.mp3book2005.narod.ru)
Словарь замены ударений Digalo Michelangelo
Дополнительные словари:
Дополнительный словарь замены ударений
Словарь замены для Ё-фикации текста. Обсуждение и описание словаря тут.
Подборка тематических словарей, включает в себя имена словосочетания слова аббревиатуры года и т.д.
Подборка тематических словарей для Elan Acapela
Словарь словоформ по словарю Зализняка. Содержит 1 490 789 строк.
Словарь коррекции текста (дополнительный словарь для основного словаря замен корректирующий текст для лучшей расстановки ударений). Обсуждение и описание словаря тут.
Словарь преобразования ударений Аленки для Николая
Словарь замены числительных и физических величин. Поскольку ударения в словаре указаны в формате для голоса Аленка рекомендуется использовать совместно со словарем преобразования ударений Аленки для Николая или раскомментируйте в конце словаря нужную строку для замены вида ударения. Обсуждение и описание словаря тут.
Словарь склонения числительных. Обсуждение и описание словаря тут.
Словарь замены текста написанного транслитом
Словарь замен преобразующий текст написанный кириллицей в "транслит" (текст написанный латиницей) и наоборот.
Словарь замен преобразующий текст написанный в виде "12.30" к виду "12:30".
Словарь коррекции для чтения аббревиатур. Обсуждение и описание словаря тут.
Словарь коррекции для чтения дополнительных символов юникод. Обсуждение и описание словаря тут.

Перед установкой:

Все вышеприведенные словари проверены и могут быть использованы в программах "Балаболка" и "Демагог". Поддержка словарей другими программами не проверялась, но скорее всего, возможна.

Все словари замен предназначены только для использования в программах-читалках. Они не содержат фонетической транскрипции слов и служат только для примитивной разметки текста (коррекции ударений, исправления неточностей набранного текста и т.п.).

В последних версиях программ «балаболка» и «демагог» формат заменён на формат . Словари формата это те же словари использующие регулярные выражения работающие только по стандарту PCRE.
Словари формата поддерживаются только более ранними версиями программ где есть переключение старого формата словарей. Если вам нужна поддержка старого формата словарей скачайте и замените исполняющий файл в корне установленной ранее программы для «балаболка» или «демагог».
Спойлер:
 

Словари программой «демагог» не поддерживаются.
31 hmg2dic - Утилита для выделения правил из словарей *.hmg добавленных при ручном поиске омографов в формате для словаря замен *.dic
-->

Установка и подключение словарей
для программы "Балаболка":

  • Устанавливаем "балаболку",, скачиваем словари и копируем их в папку "мои документы\balabolka".
  • Запускаем "балаболка" подключаем словари те, что мы скопировали в папку мои документы\balabolka. Программа готова к чтению.

Для предварительной обработки текста словарём предусмотрена опция "Показать измененный текст":
Копируем, вставляем и читаем(записываем).
Важно: для лучшей расстановки замен ini-словарями в программе "балаболка" в настройках нужно выбрать опцию "Применять правила к большим по размеру частям текста"

Установка и подключение словарей
для программы "Демагог":

  • Устанавливаем программу. Программа портативная, не требующая установки.
  • Скачиваем нужные словари и копируем их в папку dic, которая находится в папке с дистрибутивом.
  • Запускаем "Демагог". На пользовательской панели нажмите кнопку Словари или F10. Слева появится панель словарей:
  • Подключите ранее скопированные в папку dic словари, отметив их в списке. Программа готова к чтению.

Для предварительной обработки текста словарём, нужно его отметить на панели словарей, и нажать Сервис\Статистика\Измененный текст
Все результаты будут отображаться в последней вкладке 0-Статистика, причем каждый последующий результат удалит предыдущий.
Важно: нужно всегда сохранять результаты статистики в файл, или копировать их в другую вкладку.
Важно: нужно всегда отключать словари после предварительной обработки текста, иначе будет повторное его изменение уже "на лету", и это может привести к сбою чтения.
Важно: для правильной работы старых словарей необходимо включить режим совместимости со стандартом VBScript в общих настройках меню сервис.

Читать замененный словарями текст можно в любой программе для чтения.
Нужно обратить внимание! В отличии от "Демагога" программа "Балаболка" имеет два режима применения правил словарями - обычный и быстрый режимы.
Основные словари замен сейчас работают одинаково (должны работать) как в стандартом так и в быстром режимах, но поскольку быстрый режим относительно новый то не все словари еще полностью проверены на совместимость и для более точной расстановки ударений словарями рекомендуется пока использовать обычный режим применения правил "Говорилка", не потому что второй плохой просто так сделаны сами словари и при втором методе некоторые замены могут быть не учтены в тексте. Второй метод лучше всего использовать для больших словарей замен в которых не используется маска для замены (символ *) а также если при чтении "на лету" чувствуется значительная задержка при чтении, рывки, замирания и т.п.

Также настоятельно рекомендуется использовать функцию "форматировать текст" перед и после применения словарей замен для записи в аудио, или перед чтением со словарями замен "на лету", это также частично улучшит расстановку ударений словарями замен.
Условные обозначения:
- словарь замен dic работающий только по быстрому методу применения правил;
- словарь замен dic работающий только по стандартному методу применения правил;
- словарь замен dic работающий одинаково как по быстрому так и по стандартному методам применения правил;
- словарь замен ini использующий регулярные выражения работающий только по стандарту VBScript;
- словарь замен ini использующий регулярные выражения работающий только по стандарту PCRE;
- словарь замен ini использующий регулярные выражения работающий одинаково по стандарту VBScript и PCRE;
- словарь для ручного поиска омографов, только для программы "балаболка".
Если вы нашли ошибки или неоднозначности в наших словарях дайте нам знать. Если при прослушивании появляются ошибки читайте этот топик

Вы можете принять участие и дополнить словари.
Отправьте нам свои новые слова или найденные слова, которые на Ваш взгляд содержат ошибки. Мы будем благодарны Вам за участие и помощь в наполнении словарей.

Вернуться к началу Перейти вниз

Словари

Предыдущая тема Следующая тема Вернуться к началу
Словари
Страница 1 из 1Страница 1 из 1
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении