TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



Обсуждение словарей

Предыдущая тема Следующая тема Перейти вниз
На страницу : Предыдущий  1, 2, 3, 4, 5, 6, 7, 8, 9
АвторСообщениеОбсуждение словарей
evmir_troll-hunter
Admin


Сообщений : 627

 evmir_troll-hunter :: Сб Май 04 2013, 03:16
Сб Май 04 2013, 03:16

Dave_Scream пишет:
работа со словарями долгая нудная и кропотливая, её нужно делать сообща.
Такое уже было, уверен в этом деле нужен главный редактор. Админ. поручил мне Лексикон трудночитаемых слов, «Ё»-лексикон и Лексикон географических названий.
Все предложения\транскрипции пишите мне в ЛС.
Dave_Scream пишет:
Но GIT лучше
Обратитесь в администрацию форума.

Вернуться к началу Перейти вниз
Dave_Scream
Интересующийся


Сообщений : 5
Репутация : 2

 Dave_Scream :: Сб Май 04 2013, 13:16
Сб Май 04 2013, 13:16

Отписал в личку BOTу (если он админ)
Вот как это будет выглядеть:


и со стороны WEB ссылка на проект - видно что как изменялось с комментариями
https://github.com/OperatsiyaY/MonsterConfig/commits/master

а последняя версия всегда доступна по адресу
https://github.com/OperatsiyaY/MonsterConfig


Как это работает. На GIT участники создают свои учетные записи. Админ (главный редактор) создаёт команду и добавляет участников в эту команду (в примерах выше моя учетка Dave_Scream, а команда называется OperatsiyaY. После этого каждый участник ставит на компьютер программу GITHub, указывает где расположить на локальном диске репозиторий (можно сразу указать папку аленки, чтобы при синхронизации обновлений, GIT сразу скачивал их в нужное место).

В итоге система будет выглядеть так - кто-то вносит изменения в словарь (с комментариями что добавил), люди переодически запускают GITHub и синхронизируют новые изменения. Получится хорошая централизация всей работы.

Вернуться к началу Перейти вниз
king
Новичок


Сообщений : 24
Репутация : 0

 king :: Чт Июн 27 2013, 21:55
Чт Июн 27 2013, 21:55

Да, страница, как подключать словари, напоминает научную монографию. Это не критика, может оно и правильно.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пт Июн 28 2013, 03:20
Пт Июн 28 2013, 03:20

king пишет:
напоминает научную монографию
Когда-то кому-то написал кое-что попроще.Wink
Инструкция по Acapela Alyona (подключение лексиконов и словарей замен + небольшой tour по форуму синтезированных голосов.)

Если понравится, буду рад, а нет - зубрите монографию.:hammerdrill:

Вернуться к началу Перейти вниз
termitter
Наблюдатель


Сообщений : 4
Репутация : 2

 termitter :: Сб Июл 20 2013, 13:44
Сб Июл 20 2013, 13:44

Подскажите, плз. Мне надо исправить произношение слова модернизация (звучит как "дернизация", а надо как "дэрнизация". или например аббревиатура "ВТО"). Я запутался, это надо делать в словаре Балаболки (а в каком из omografi, corrector, chisla, default? - или разницы нет?) или это надо делать в программе Lex manager? Но в ней я так и не понял условных обозначений. Где посмотреть (phoetic table - не ясно, что это и как использовать)? Надо ли выставлять тип речи (сущ, глагол и пр.)?

Спасибо

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пн Июл 22 2013, 03:24
Пн Июл 22 2013, 03:24

termitter, чтобы не путаться почитайте Инструкцию по Acapela Alyona и Справку по работе с лексиконами для голоса Alyona.

Вы перечислили словари, они для замены одного фрагмента текста другим.
Есть лексиконы с условными обозначениями (транскрипции), они подключаются к движку.

В Lexicon manager откройте Лексикон трудночитаемых слов Alyona22k.dic, и добавьте:
модернизацией #m @ d I r n' $ z A1 ts I $ j NOUN
модернизациею #m @ d I r n' $ z A1 ts I $ Y NOUN
модернизации #m @ d I r n' $ z A1 ts I $ NOUN
модернизаций #m @ d I r n' $ z A1 ts I j NOUN
модернизацию #m @ d I r n' $ z A1 ts I Y NOUN
модернизация #m @ d I r n' $ z A1 ts I $ NOUN
модернизациям #m @ d I r n' $ z A1 ts I $ m NOUN
модернизациями #m @ d I r n' $ z A1 ts I $ m' $ NOUN
модернизациях #m @ d I r n' $ z A1 ts I $ x NOUN


В Словарь замены ударений omograph.dic запишите правило:
ВТО=вэ тэ о

Вернуться к началу Перейти вниз
termitter
Наблюдатель


Сообщений : 4
Репутация : 2

 termitter :: Пн Июл 22 2013, 21:47
Пн Июл 22 2013, 21:47

за расписанную "модернизацию" - большое спасибо. Инструкцию к Алене прочитал еще раз (до обращения на форум читал 2 раза). Остаются сомнения по поводу неоднозначно трактуемых фраз (например: "Рекомендую переименовать скачанный,
форумский лексикон – он постоянно растёт и время запуска Manager’а скоро
значительно возрастёт." - то ли время запуска будет возрастать, если переименовать, то ли если не переименовывать). У меня пока внутри сидит и файл "Alyona22k.dic" полупустой, для быстрой загрузки и "Alyona22kForum.dic" - полный и переименованный мною после его загрузки с форума. Правильно ли это, или как раз надо переименовать форумский файл в "Alyona22k.dic"?

Спасибо.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пн Июл 22 2013, 23:34
Пн Июл 22 2013, 23:34

termitter пишет:
... то ли время запуска будет возрастать, если переименовать, то ли если не переименовывать...
Если не переименовать - будет возрастать.
Lexicon manager связан со своим "системным" лексиконом "Alyona22k.dic", если данный файл пуст, то запуск Manager’а почти моментален. Поэтому я и рекомендую именно форумскому лексу давать какое-либо другое, уникальное имя.
По неоднозначной трактовке; напишите мне в личку список сомнительных фраз в инструкции - отредактирую.

Вернуться к началу Перейти вниз
termitter
Наблюдатель


Сообщений : 4
Репутация : 2

 termitter :: Вт Июл 23 2013, 21:10
Вт Июл 23 2013, 21:10

evmir_troll-hunter пишет:
По неоднозначной трактовке; напишите мне в личку список сомнительных фраз в инструкции - отредактирую.
evmir_troll-hunter пишет:
Хочу ответить в личку, а там неактивна кнопка "отправить". "Предпросмотр" активен, а "отправить" нет. Или я не туда нажимал?

Вернуться к началу Перейти вниз
termitter
Наблюдатель


Сообщений : 4
Репутация : 2

 termitter :: Вт Июл 23 2013, 21:10
Вт Июл 23 2013, 21:10

evmir_troll-hunter пишет:
По неоднозначной трактовке; напишите мне в личку список сомнительных фраз в инструкции - отредактирую.
evmir_troll-hunter пишет:
Хочу ответить в личку, а там неактивна кнопка "отправить". "Предпросмотр" активен, а "отправить" нет. Или я не туда нажимал?

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Вт Июл 23 2013, 21:23
Вт Июл 23 2013, 21:23

На форуме включена обязательная проверка орфографии. Без неё кнопка "отправить" неактивна.
Нажмите сначала "Проверить орфографию".
P.S форумский лексикон трудночитаемых слов переименован в Alyona22k_mytts_.dic.
В Lexicon Manager отключите старый файл Alyona22k.dic, и удалите его из папки:
C:\Users/имя пользователя/AppData\Roaming/Acapela Group\HW2L/UserLexicons
Перезапустите Manager.
Скопируйте файл Alyona22k_mytts_.dic в папку UserLexicons, и подключите его к Manager'у.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пн Ноя 04 2013, 07:26
Пн Ноя 04 2013, 07:26

Отредактирован Словарь замен.
Исправлены орфографические ошибки:
сводами замка=своБдами зАмка
и т.д.
Удалены "странные" правила:
средний егорлык=срЕдний егорлЫк
русская америка=рУсская амЕрика

и т.д.

Удалены правила с всЁ\всЕ (они уже не нужны)
Отделены правила со * (позже будет отдельный словарь с ними)
Удалено много сомнительного (возможно ещё кое-что осталось)Suspect
Добавлены 7000 правил (и будут добавляться...)
Отсортировано по алфавиту (но правила с "нЕбыло" размещены в самом низу)

Вернуться к началу Перейти вниз
sha2
Наблюдатель


Сообщений : 1
Репутация : 0

 sha2 :: Вс Ноя 10 2013, 22:29
Вс Ноя 10 2013, 22:29

Здравствуйте.
Я скачал балаболку и установил русский голос Алёна но она не всё читает правильно.
На сколько я понял для того что бы она всё читала более менее нормально нужно устанавливать библиотеки, можете подсказать какие библиотеки устанавливать для художественной литературы? Нужны определённые библиотеки или просто скачать и установить все что есть в этой теме http://mytts.forum2x2.ru/t164-topic ?

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пн Ноя 11 2013, 03:17
Пн Ноя 11 2013, 03:17

sha2 пишет:
или просто скачать и установить все что есть в этой теме http://mytts.forum2x2.ru/t164-topic ?
Да, указанная Вами тема ключевая. Кроме списка всех лексиконов\словарей там детально описан порядок их подключения - внимательно прочтите.
Лексиконы и рассчитаны на худ. литературу. Научные, спецтексты движок читает плохо.

Вернуться к началу Перейти вниз
алекс22
Гость
avatar



 алекс22 :: Ср Дек 11 2013, 21:38
Ср Дек 11 2013, 21:38

После установки в Балаболку corecror.rex разбивка тремя звездочками стала озвучиваться "дефис дефис дефис" Ничем не лучше "звездочка звездочка звездочка", как на мой вкусSmile Почему так происходит и как поправить?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Чт Дек 12 2013, 00:13
Чт Дек 12 2013, 00:13

алекс22, надо подключить Лексикон запрета чтения разделительных знаков и будет просто пауза при произношении

Вернуться к началу Перейти вниз
алекс22
Гость
avatar



 алекс22 :: Чт Дек 12 2013, 12:05
Чт Дек 12 2013, 12:05

C лексиконами такая фигня: подключить я их могу только из-под админа (под ограниченным пользователем кнопка добавления неактивна). Но и работают они потом только под той учетной записью, под которой добавлены. То есть чтобы пользоваться лексиконами я должен запускать и балаболку из-под админа. Кто-то с таким сталкивался?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Чт Дек 12 2013, 15:39
Чт Дек 12 2013, 15:39

балаболка - программа для чтения и к лексиконам отношения не имеет, только к словарям
лексиконы подключать нужно через программу-редактор по умолчанию она находится тут "C:\Program Files\Acapela Group\Infovox Desktop 2.2\LexiconMgr.exe" или ищите LexiconMgr.exe если установка была на другой диск(папку). подробнее тут

лексиконы можно подключить и через реестр
Код:
HKEY_CURRENT_USER\Software\Acapela Group\Infovox Desktop\HW2L\SpeechFonts\Alyona22k
параметр DefDict
где через точку с запятой перечисляются лексиконы в порядке их подключения

Вернуться к началу Перейти вниз
алекс22
Гость
avatar



 алекс22 :: Чт Дек 12 2013, 21:43
Чт Дек 12 2013, 21:43

Я читал инструкцию по установке лексиконов и словарей и знаю, куда их ставить. Проблема в другом: хотя Алена установлена для всех пользователей, но лексиконы устанавливаются только для пользователя с административными полномочиями. Это видно и в лексикон-менеджере (когда входишь из-под ограниченного пользователя, список лексиконов пуст) и в редакторе реестра (когда regedit запущен из-под админа, все так, как вы описываете, а когда из-под пользователя - то нет даже ветви Acapela). Может создать эту ветвь вручную? Или проще запускать Балаболку из-под админа (тогда для нее видимы все установленные админом лексиконы)? Хотелось бы, чтобы все работало нормально под рабочей учетной записью.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Чт Дек 12 2013, 22:06
Чт Дек 12 2013, 22:06

Цитата :
Или проще запускать Балаболку из-под админа (тогда для нее видимы все установленные админом лексиконы)?
Снова эта путаница! Для Балаболки как и для других TTS-программ НЕ существует лексиконов - они "видят" лишь словари замен на панели словарей.
Словари можно легко открыть и отредактировать в любом текст. редакторе. Лексиконы это закодированные файлы, открываются спецутилитами (для Алёны это Lexicon Manager), и предназначены они только для самого голоса.
На данном форуме когда-то уже обсуждали вопрос учётных записей - конкретного решения нет.

Вернуться к началу Перейти вниз
алекс22
Гость
avatar



 алекс22 :: Чт Дек 12 2013, 22:20
Чт Дек 12 2013, 22:20

Я не точно выразился. Понятно, что лексиконы видит не Балаболка, а речевой движок, главное - чтобы программа запускалась из-под того же пользователя, из-под которого в Алену устанавливались лексиконы.
Однако проблему удалось пофиксить, запустив редактор реестра из-под рабочей учетной записи (опытный пользователь, обычные пользователи, насколько я понимаю, не могут править реестр) и создав в HKCU такую ветвь, как было приведено выше, а так же запись DefDict, в которой прописал пути к словарям. Теперь звездочки, как и следует, не проговариваются, "гримерная" стала "гримёрной". Так что проблема, можно сказать, в лоб решается.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пн Дек 16 2013, 21:28
Пн Дек 16 2013, 21:28

маленькое замечание: с учетом последних обновлений лексиконов правильный порядок подключения (рекомендуемый) сейчас такой:
  1. Лексикон омографов (omograph_lex_mytts_.dic)
  2. Частотный лексикон (omograph_auto.dic)
  3. Лексикон трудночитаемых слов (Alyona22k_mytts_.dic)
  4. «Ё»-лексикон (1_YO_lex.dic и 2_YO_lex.dic)
  5. Лексикон географических названий (Geografic.dic)
  6. Лексикон имён и фамилий (propernoun.dic)
  7. Лексикон запрета чтения разделительных знаков (_punctuation.dic)
p.s. все последние обновления по словарям и лексиконам есть в проверялке

Вернуться к началу Перейти вниз
z652z
Интересующийся
avatar


Сообщений : 7
Репутация : 1

 z652z :: Ср Янв 01 2014, 01:20
Ср Янв 01 2014, 01:20

Об очерёдности подключения лексиконов в Алёнке. Не лучше ли передвинуть лексикон трудночитаемых слов с 5-ой позиции на 3-ю? Тогда он сможет исправлять ошибки, вносимые Ё-лексиконами. В них встречаются слова, произношение которых хочется исправить, но на 5 позиции это невозможно. Конечно, можно напрямую влезть в Ё-лексикон и исправить или удалить. Это если знаешь, что искомое слово там. А кто способен догадаться, что, к примеру, слова АКУШЕР, АКУШЕРА, АКУШЕРЫ и тп прячутся в Ё-1? Наверняка и ещё есть ошибки. По-моему, проще всего будет вносить коррективы в лексикон на 3-ей позиции(или даже на 2-ой).

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Ср Янв 01 2014, 05:09
Ср Янв 01 2014, 05:09

z652z пишет:
А кто способен догадаться, что, к примеру, слова АКУШЕР, АКУШЕРА, АКУШЕРЫ и тп прячутся в Ё-1?
акушЕр и акушЁр это омограф, спасибо что обратили на это моё внимание. Данные словоформы перенесены в Лексикон омографов.
Именно поэтому НЕ рекомендуется менять приоритет подключения - слишком много слов в Ё-лексиконе. Нелогично исправлять содержащиеся в нём ошибки лексиконом трудночитаемых слов!
Безусловно это всего лишь рекомендация, и каждый может делать как хочет.
1-я часть Ё-лекса состоит из 116500 слов (с "А" по "О" включительно), 2-я - 116314. Количество может (и будет обязательно) изменяться.
Обо всех ошибках звучания, замечаниях, пожеланиях пишите.

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

Обсуждение словарей

Предыдущая тема Следующая тема Вернуться к началу
Обсуждение словарей
Страница 9 из 9Страница 9 из 9На страницу : Предыдущий  1, 2, 3, 4, 5, 6, 7, 8, 9
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении