TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



Обсуждение словарей

Предыдущая тема Следующая тема Перейти вниз
На страницу : Предыдущий  1, 2, 3, 4, 5, 6, 7, 8, 9  Следующий
АвторСообщениеОбсуждение словарей
evilone_
Участник «online словари»


Сообщений : 860

 evilone_ :: Ср Сен 09 2009, 01:03
Ср Сен 09 2009, 01:03

al2055 тут читать как "в словарь сейчас добавляются только замены для омографов той формы которую голос не читает сам без простановки в нем ударения" это если проводить сравнения со словарями к ольге.

то что там есть лишние замены факт, но вреда от них не много
хотя до пояса=до пОяса это совсем не лишняя замена

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Ср Сен 09 2009, 02:33
Ср Сен 09 2009, 02:33

Странно. У меня "пояса" читает как "пОяса" (# p o1 $ s @).

Вернуться к началу Перейти вниз
Sylvia
Участник «online словари»
avatar


Сообщений : 72
Репутация : 83

 Sylvia :: Ср Сен 09 2009, 03:21
Ср Сен 09 2009, 03:21

evilone_ пишет:
al2055 обновили словарь замен с учетом неразрывного тире и твоих словарей замен и правок.
Да ужSmile Получился словарик на все вкусы, каждый может выбрать себе что-тоSmile Прямо шведский стол. (Я об omograph.7z) Чистили-чистили словарь, и опять он разросся. Например:
*ди -=ди _
*ди"=ди
*ди=ди'
А такое разве в книгах встречается?
*ъ-ъ-ъ-ъ-ъ*=ъ
*ы-ы-ы-ы-ы*=ы
*ь-ь-ь-ь-ь*=ь
Действительно, Алена настолько загадочная девушка, что единого мнения "как лучше" нет. Не то что у Коли, поставил ударение, и все, никаких тебе интонаций.
al2055 пишет:
Странно. У меня "пояса" читает как "пОяса" (# p o1 $ s @).
У меня тоже.
Но я согласна с
evilone_ пишет:
то что там есть лишние замены факт, но вреда от них не много

Просто ни у кого нет времени на основательную чистку словаря. Правится в основном по ходу слушания, когда что-то уж очень режет слух.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Ср Сен 09 2009, 13:12
Ср Сен 09 2009, 13:12

не "до пояса" а "до полу", перепутали, читает полУ вместо пОлу
Цитата :
*ди -=ди _
*ди"=ди
*ди=ди'
это старая замена для коррекции длинного "и" на конце слова

а те безобразия можно уже удалить если со словарем коррекции текста, это для слов вида
Мда-а-а-а-а
Ага-а-а-а-а
и т.п.

Цитата :
Чистили-чистили словарь, и опять он разросся.
ага из 15-18 уже до 21 тысячи вырос, это если сравнивать со старым на 36
для ольки словарик на 60 тысяч уже

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Ср Сен 09 2009, 16:26
Ср Сен 09 2009, 16:26

evilone_

В новой редакции описка вкралась: 2 раза стоит "*ни?=11 илетним", вместо "*ни?=ни _?".

Вернуться к началу Перейти вниз
Вадим Романько
Посетитель


Сообщений : 36
Репутация : 35

 Вадим Романько :: Вс Сен 13 2009, 06:34
Вс Сен 13 2009, 06:34

БРАВО!!!
Появились новые словари. Я произвел тестирование на совместимость с новыми словарями. В целом всё работает корректно. Во время тестирования обнаружены ошибочки (без них при разработке никак).

Ошибочки в лингвистическом предпроцессоре corredor.ini
1. Ошибки работы с теговыми скобками «<» и «>», тег открывается и не закрывается, текст далее не читается, синтезатор возвращает ошибку.
Пример:
Этот текст читается <-Ь> далее текст отключен. Ошибка синтезатора речи.
1<-ж> Ошибка.
2. «т. е.» превращается в «те», а не «то есть».
3. «1-й,» = «один и краткое», а не «первый».

Ошибочки в словаре omograph.dic
1. « … » читает, как «точка»
Пример:

2. «. =» заменяет на, что то очень длинное, (сбой в работе системы).
3. Звездочка заменяется на неприятную длинную паузу.
Пример: * пауза.
4. « - П » заменяется на «_п».

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Сен 13 2009, 06:55
Вс Сен 13 2009, 06:55

al2055, Вадим Романько ага пасиб, поправили все кроме "звездочки"

не совсем ясно зачем читать * как "звездочка" в тексте?
если их 3 и больше то это как правило начало нового раздела\главы\подраздела и т.п. произносить вслух три и более раза "звездочка" это безобразие Smile для этого и замена
вместо всех звездочек теперь будет выдерживаться одна небольшая 1-2 сек пауза, т.е.
Цитата :
текст
***
текст
будет читать как
Цитата :
текст
(пауза)
текст

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Вс Сен 13 2009, 16:12
Вс Сен 13 2009, 16:12

Так замены "* - п*= _п", "*, п*= _п" и были запланированы. Убирают многие проблемы с затыканиями на "п".

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Сен 13 2009, 18:50
Вс Сен 13 2009, 18:50

al2055 пишет:
Так замены "* - п*= _п", "*, п*= _п" и были запланированы. Убирают многие проблемы с затыканиями на "п".
а какие проблемы убирают? а то вроде пару раз попробовали и всюду читает внятно, а с заменой наоборот иногда искажает.

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Пн Сен 14 2009, 22:05
Пн Сен 14 2009, 22:05

evilone_

Ну, не знаю, может, это субъективно, а, может, дело в том, что я только слушаю, не видя текста и мне необходимо более четкое произношение, но у меня перед "п" с дефисом и запятой часто съедаются гласные и глухие согласные.

Вернуться к началу Перейти вниз
t64y
Новичок
avatar


Сообщений : 15
Репутация : 4

 t64y :: Сб Сен 19 2009, 22:04
Сб Сен 19 2009, 22:04

Сегодня ещё раз попробовал одну и туже книгу прочитать с обработкой "omograph" и чистый текст.
Впечатление /возможно спорное/ но количество ошибок в ударениях практически одинаковое.
Я не говорю о не правильно читаемых словах /не всё что забито "Alyona22k" - правильно/ , я об ударениях.

Всё что на мой взгляд не имеет второго значения /ударения или произношения- ну нет других вариантов слова/ я забиваю в lexcon.
Пример - сОсна - однозначно сОсна а не -соснА-.

Я понимаю что есть слова - дОрога, дорОга, и дорОга.
Как ни правь словарь замен - всё не отловить.

Но есть предложение сделать в части слов /во всех всё равно не получится/ ударение не явное , а что-то среднее т.е. полностью безударное .Это конечно не выход но часть проблем можно упростить. Например - ПОЛКА - висящая пОлка, развернул полкА. - Если ударение не правильное то режет слух , а если не явное - то как-бы это своеобразный акцент или произношение. - Аленка это позволят, хоть и через танцы с бубном.Слово читается мягче /чуть глуше/ , но по тексту приятней по восприятию.
висящая полка , развернул полка.
В добавок к ошибкам. Часто слово в лексиконе читает правильно - но в тексте с ошибками.
Вот что я выловил за последние два дня.
первая колонка слово, вторая то что было в лексиконе, третья исправление.
Может у кого-то и правильно но можно сравнить.
/Я читаю в TextAloudMP3- он не вмешивается в процесс чтения, читает - то что выдаёт Аленка/

Спойлер:
 

PS Отслеживаю очепятки практически ежедневно, так что если нужно можно выложить и продолжение.
Но словарный набор у меня своеобразный- читаю в основном фентези.

Вернуться к началу Перейти вниз
t64y
Новичок
avatar


Сообщений : 15
Репутация : 4

 t64y :: Сб Сен 19 2009, 22:39
Сб Сен 19 2009, 22:39

Вопрос к evilone_ на счет словарика "corector". Куда его прикрутить.
В балаболке он работает не очень коректно. Не всё правит. Видимо я что-то не догнал.
Так что пока правлю текс старым способом.
Да для примера. Последний отлов. Слово " голому - # g o1 l @ m U " почему- то зацепило запятую "голому, - # g V l o1 m U " А в лексиконе всё нормально. И пока не могу найти закономерность этого захвата. Зависит не только от конкретного слова /с очетания звуков в окончании/ но видимо и от предыдущих слов , знаков. Надо посмотреть. Набрать базу предложений или строк /каретка машинки/.
И ещё хорошо-бы все словари /то что выкладывается / - помечать датой создания .
На сайте - только дата выкладки. Не понятно были-ли изменения.
С читательским приветом.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Сб Сен 19 2009, 23:23
Сб Сен 19 2009, 23:23

Цитата :
Куда его прикрутить.
В балаболке он работает не очень коректно. Не всё правит. Видимо я что-то не догнал.
его скопировать нужно в папку со словарями балаболки и включить в балаболке где словари, как обычный словарь, этот словарь должен править совсем чуть-чуть Smile так что видимости от него не особо много но без него не будут правильно ставится замены из основного словаря замен omograph.dic
может потому что вы его не подключили и было
Цитата :
количество ошибок в ударениях практически одинаковое
Цитата :
Всё что на мой взгляд не имеет второго значения /ударения или произношения- ну нет других вариантов слова/ я забиваю в lexcon.
Пример - сОсна - однозначно сОсна а не -соснА-.
да, только слово неудачное Smile а так в принципе и надо делать, ну если только ударение однозначно можно поставить

Цитата :
Но есть предложение сделать в части слов /во всех всё равно не получится/ ударение не явное
а пример можно? для того же "полка" пример такой транскрипции с неявным ударением?

Цитата :
PS Отслеживаю очепятки практически ежедневно, так что если нужно можно выложить и продолжение.
нужно, только формат если можно сохранить лексиконовский т.е. слово таб транскрипция таб часть речи а то форматировать сложно потом словарь.

Цитата :
Да для примера. Последний отлов. Слово " голому - # g o1 l @ m U " почему- то зацепило запятую "голому, - # g V l o1 m U " А в лексиконе всё нормально.
вот такие ошибки очень интересны, их нужно ловить в первую очередь

там вся особенность в том что некоторые слова голос читает с ошибками если перед или позади слова стоит знак препинания. такие слова нужно смотреть в контексте и делать для них корректирующую замену
Цитата :
На сайте - только дата выкладки. Не понятно были-ли изменения.
если меняется дата выкладки меняется и содержимое словаря

Вернуться к началу Перейти вниз
t64y
Новичок
avatar


Сообщений : 15
Репутация : 4

 t64y :: Вс Сен 20 2009, 10:06
Вс Сен 20 2009, 10:06

Возращаясь к теме о " не правда, не хорошо, и т.д."
В лексиконе все читат по отдельности правильно.
Я взял " НЕ" - и поправил. - Было -
не # n' $
Теперь -
не # n $
И варианты без слития и правок читает правильно.
- не плохо,
- не хорошо,
- не правда,
- не-плохо,
- не-хорошо,
- не-правда,
.- не_плохо,
.- не_ хорошо,
.- не_правда,
.- не_плохо,
.- не_хорошо,
.- не_правда,

.-не_плохо?
.-не_ хорошо!
.-не_правда!
.-не_плох?!,
.-не_хорошо!!!
.-не_правда???
Но здесь варианы знаков немного влияют на интонацию /эмоции/.
Но пока всё правильно - дальше посмотрим, последим. К сожалению очень много зависит от качеста текста.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Сен 20 2009, 17:47
Вс Сен 20 2009, 17:47

Цитата :
Но здесь варианы знаков немного влияют на интонацию /эмоции/.
они как правило всегда влияют и не только на интонацию Sad
а насчет "не":
- не изменилось ли чтение обычный слов с "не" по тексту? особенно если слово после "не" начинается с ударной гласной?
- "апомню" в тексте встречается также слитно, т.е. некоторые "грамотеи" пишут в своих книгах непомню незнаю и т.д. такие замены правка в лексиконе перехватывать не будет;
- в словаре замен сейчас есть правка для "апомню" так что правильно может быть и не из-за этого на самом деле Smile без словаря замен тоже произносит правильно?

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Вс Сен 20 2009, 22:20
Вс Сен 20 2009, 22:20

t64y

Цитата :
В добавок к ошибкам. Часто слово в лексиконе читает правильно - но в тексте с ошибками.
Вот что я выловил за последние два дня.

Так в приведенном списке большинство слов - это омографы. Они и даются в omograf.dic с разными ударениями. Пример: рОга-рогА, вОлну-волнУ, тУпика-тупикА, цЕли-целИ, дрУгом-другОм и т.д.

Проблему с "голому" я снял так: #g o2 l @ m U

Вернуться к началу Перейти вниз
Keynol
Интересующийся


Сообщений : 6
Репутация : 0

 Keynol :: Пт Окт 23 2009, 20:58
Пт Окт 23 2009, 20:58

Добрый День!
Установил как и рекомендовали,

3 лексикона (первым - лексикон для словаря замен, третьим - лексикон запрета чтения разделительных знаков, новый Основной лексикон Alyona22k.dic, подключил вторым, как сказали) в TTS

1 словарь замен - в балаболку, подключил галочкой.
Всё путем.

Как я понял, чтобы использовать все наработки для Алёны на сегодняшний день (а я хочу именно это), и что бы охватить наибольший диапазон текстов (в моём случае - художественная литература, возможно субтитры к фильмам) надо перед работой надо непременно импортировать в Лексикон-Менеджер TTS 3 выкладывющихся словаря замены rur_1.txt - rur_3.txt

Как было сказано, импорт идет много часов (5-6)
У меня комп Core2Duo 2.2 Ghz

Вопрос такой, без этого шага, добиться в Балаболке кардинального улушчения качества чтения возможно или нет ?

И еще, можно ли выделить значком те словари, лексиконы которые надо прицеплять к балаболке ?
И как добиться их работы в других программах ? - может прицепить через Lexicon Manager ? Или там другой формат и он не поймёт ?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Сб Окт 24 2009, 01:49
Сб Окт 24 2009, 01:49

Цитата :
1 словарь замен - в балаболку, подключил галочкой.
Всё путем.
нужно еще подключать Словарь коррекции текста
Цитата :
Как я понял, чтобы использовать все наработки для Алёны на сегодняшний день (а я хочу именно это), и что бы охватить наибольший диапазон текстов (в моём случае - художественная литература, возможно субтитры к фильмам) надо перед работой надо непременно импортировать в Лексикон-Менеджер TTS 3 выкладывющихся словаря замены rur_1.txt - rur_3.txt
нет эти словари "Дополнительные словари" и они "Системные лексиконы движка (фонетические транскрипции уже встроенные в системный лексикон движка)" т.е. они уже есть изначально и дважды их добавлять бессмысленно Smile
Цитата :
И еще, можно ли выделить значком те словари, лексиконы которые надо прицеплять к балаболке ?
можно, сделаем
Цитата :
И как добиться их работы в других программах ? - может прицепить через Lexicon Manager ? Или там другой формат и он не поймёт ?
можно преобразовать текст в балаболке а затем уже работать с преобразованным текстом. форматы лексикона и словаря замен разные и работать не будут если их поменять местами.

Вернуться к началу Перейти вниз
Keynol
Интересующийся


Сообщений : 6
Репутация : 0

 Keynol :: Вс Окт 25 2009, 02:28
Вс Окт 25 2009, 02:28

evilone_
Если касаться только Аленки.

-- rur_1.txt ... - размер у них разный - не такой как в rur_1.bab.dca - разница на 500-600 кб. Как так ?
-- для каких случаев, для кого, тогда, выложены rur_1-3.txt ?

-- Когда я начал прицеплять rur_1.txt, лексикон подумал вначале пару минут, потом выдал - "идет отличия в слове абель - и два примера - старого и нового. Как это понимать, если файлы rur_1.txt и rur_1.bab.dca по логике идентичны ?

Еще вопрос. Надо ли понимать ситуацию так, что, если человек скачал Акапеллу/Алёнку, то кроме трех словарей, ему (если Балаболку не использовать) нечего больше присоединять ?
Все остальные наработки народа - для балаболки сделано ?
То есть Кул Ридер и пр. отдыхают?

Цитата :
можно преобразовать текст в балаболке а затем уже работать с преобразованным текстом. форматы лексикона и словаря замен разные и работать не будут если их поменять местами.

Как преобразовать ? Какую кнопку нажать ?
Я запутался с очередностью.
Допустим, меня интересует чтение 1) субтитров паралельно к фильму, 2) Чтение книги в Кул Ридере.

Какие мне надо сделать шаги для достижения результата (чтение красивым голосом без ошибок) 1) Субтитров по мере просмотра фильма 2) Книги в Cool Reader 2), имея:

-- Три, как я выше писал, прицепленных словаря на Лексикон-менеджере (т.е. в ядре - для всех программ), и
-- Балаболку с установленными ini и dic словарями.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Окт 25 2009, 02:20
Вс Окт 25 2009, 02:20

Цитата :
для каких случаев, для кого, тогда, выложены rur_1-3.txt ?
наверно нужно будет их спрятать а то с этими лексиконами народ впадает в крайности zombie

если Балаболку не использовать то хватит и 2х - лексикон для словаря замен тогда можно не подключать потому что словаря замен не будет.

Цитата :
Все остальные наработки народа - для балаболки сделано ?
да все наработки сделаны с использованием словарей, если программа не умеет обрабатывать текст словарями то
Цитата :
отдыхают


Цитата :
Как преобразовать ? Какую кнопку нажать ?
подключить нужные словари и нажать ctrl+T

Цитата :
Допустим, меня интересует чтение 1) субтитров паралельно к фильму, 2) Чтение книги в Кул Ридере.
преобразовываешь текст в балаболке сохраняешь и открываешь в том в чем нужно прочесть только тогда уже нужно подключать все три лексикона (трудные слова, для словаря замен и пунктуация) и читаешь измененный текст как обычный

Цитата :
-- Три, как я выше писал, прицепленных словаря на Лексикон-менеджере (т.е. в ядре - для всех программ)
про эти самые три словаря, только лучше их обзывать лексиконами а то можно запутаться, лучше забудь совсем, они нужны только для правки уже готовых транскрипций

Вернуться к началу Перейти вниз
Keynol
Интересующийся


Сообщений : 6
Репутация : 0

 Keynol :: Вс Окт 25 2009, 02:41
Вс Окт 25 2009, 02:41

Попробовал преобразование

Спойлер:
 
особо разницы не заметил, разве что тут -> Впереди' и тут ->менее_

Подключены в балаболке
1. corrector.ini
2. аббревиатура В.Романько.ini
3. СИ В.Романько.ini
4. omograph.dic

Алена читает так
Впереди внизу в дымке...
Т.е. "и" - пропускает что ты не делай, и другие нюансы...

Цитата :
только тогда уже нужно подключать все три лексикона
Что значит только тогда ? Лексиконы на TTS подключать же надо непременно всегда.
Инсталлировал, подключил и забыл.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Окт 25 2009, 03:26
Вс Окт 25 2009, 03:26

Цитата :
особо разницы не заметил
а какая разница должна была быть заметной, нет правда? Smile

Вернуться к началу Перейти вниз
Keynol
Интересующийся


Сообщений : 6
Репутация : 0

 Keynol :: Вс Окт 25 2009, 03:49
Вс Окт 25 2009, 03:49

evilone_
К примеру расставление ударений, исправление проглатывания звуков, гласных и согласных, в общем убирание нюансов по умолчанию через коррекцию слов по фонетической базе или как-то так.

к примеру
- Впереди и внизу в дымке пульсировал широкий отсвет.
-> Впереди/[знак удлинения и] и[выделение И] внизу [небольшая пауза] пульсирован широкий отсвет.

Ибо сейчас она строчит "Впереди-внизу в дымке пульсировал широкий отсвет"

Потом, надо что-то делать со словом "расплавленного"
Она в этом единственном слове - 2-3 раза скачет по тону вверх-вниз!.

Я не знаю как у вас на машине всё настроено, конечно, но у меня, по умолчанию, и с имеющимися у меня словарями, звучит не особо хорошо.

А ведь кажется народ год работал над доводкой звучания.
Может я не нашел нужных словарей, лексиконов ?.. Или каждый пользуется своим родным не показывая другиим ? Тоже на это не похоже... Чтож тогда ? Ничего не понимаю.

Если не тут, не на этом, лучшем сайте по Алёнке, то где ж тогда искать ?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Окт 25 2009, 12:09
Вс Окт 25 2009, 12:09

Keynol
Цитата :
К примеру расставление ударений, исправление проглатывания звуков, гласных и согласных, в общем убирание нюансов по умолчанию через коррекцию слов по фонетической базе или как-то так.
ударения ставятся только там где нужно а не где попало, и для аленки понятие "поставить ударение в тексте" не работает. скорость чтения и паузы настраиваются в Voice Manager, а "коррекция по фонетической базе" делается по мере необходимости, другими словами, только если сильно заметна, специально никто ошибки не ищет, этим занимается, по крайней мере должен заниматься разработчик Rolling Eyes

Цитата :
А ведь кажется народ год работал над доводкой звучания.
кажется кто-то и занимался, кому это нужно было, а все костыли к голосу которые сейчас есть - есть тут, а если нету то они либо сильно новые либо не сильно хорошие. No

Цитата :
Или каждый пользуется своим родным не показывая другиим ? Тоже на это не похоже... Чтож тогда ? Ничего не понимаю.
скорее всего, свои труднопроизносимые слова у каждого свои, потому как их очень много и все их в лексикон не внесешь, имхо да и ненужны там слова которые встречаются только при чтении одного текста которые могут и не встретиться в тексте никогда

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Ср Дек 16 2009, 10:00
Ср Дек 16 2009, 10:00

Здравствуйте, ув. Автор и друзья.

Подскажите, пожалуйста кто знает. Установил словари (программа Балаболка) как подсказали здесь: http://mytts.forum2x2.ru/forum-f11/tema-t164.htm . Но после форматирования текста в нем появились "_" и Алена добросовестно их и читает как "подчеркивание". Сколько не пытался побороть это - не получается. Неужели теперь только вручную это можно удалить.

Подскажите, пожалуйста, в чем ошибка.

Автору спасибо за программу. Вещь.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Ср Дек 16 2009, 10:06
Ср Дек 16 2009, 10:06

del нужно подключить "Лексикон запрета чтения разделительных знаков"

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Ср Дек 16 2009, 11:15
Ср Дек 16 2009, 11:15

evilone_, спасибо Вам большое. Но в все это в Алену я добавлял. И в панели Балалболки он галочкой отмечен. Но получается, что не работает. Подскажите пожалуйста как его включить. Спасибо.

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Ср Дек 16 2009, 11:26
Ср Дек 16 2009, 11:26

Может быть в этом вот проблема?

Качаем лексикон для словаря замен и лексикон запрета чтения разделительных знаков и подключаем их (не импортируем) так чтобы лексикон для словаря замен стоял первым, потом лексикон трудночитаемых слов и лексикон запрета чтения разделительных знаков (тот что верхний тот приоритетнее). http://mytts.forum2x2.ru/forum-f11/tema-t164.htm

Что значит "подключаем их (не импортируем)"?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Ср Дек 16 2009, 12:19
Ср Дек 16 2009, 12:19

так ведь там все вроде в справочке написано, нет?
Цитата :
Как подключить новый лексикон не импортируя его в общий?
Откройте лексикон-менеджер и нажмите Ctrl+t затем нажмите добавить лексикон (Add lexicon) выберите нужный лексикон (файл с расширением dic)

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Ср Дек 16 2009, 16:17
Ср Дек 16 2009, 16:17

У меня все так и есть как на скрине там. Но это ее проклятое "подчеркивание" мне скоро наверное уже сниться будет.

Какие могут быть еще ошибки не подскажите? Может все вообще поудалять, да и заново поставить? Или есть еще менее радикальные способы?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Ср Дек 16 2009, 16:40
Ср Дек 16 2009, 16:40

del наверно лучше всего будет еще раз внимательно почитать все что написано тут а потом еще раз и еще один раз
кроме картинок там есть чуть-чуть текста который тоже нужно прочесть и сделать все как там написано

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Пт Дек 18 2009, 10:21
Пт Дек 18 2009, 10:21

Всем спасибо за ответы. Тут и автор посоветовал, что сделать, да и друг свой словарь прислал. Все вроде теперь без пробелов.

Кстати, он посоветовал пользоваться как можно меньшим количеством словарей во избежании несостыковок и ошибок.

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Вт Дек 22 2009, 20:43
Вт Дек 22 2009, 20:43

Друзья, на Торентсе нашел ссылку на словарь Алены аж на 22 тысячи слов! Не проанализируете его как более сведущие в этом вопросе? Я попробовал, вроде неплохо. Но соответствует ли все это тому о чем говорит автор поста? Не знаю.

Копирую полностью пост.

Сегодня в искал новый словарь и натолкнулся на следующее сообщение : Внимание! Буквально только что стал доступен словарь для движка "Алёнка" с литературным уклоном, состоящий из 22 000 слов!!! С наличием данного словаря речь Алёны становится более чистой, приятной, мягкой, правильной. Со словарём она, например, стихи очень приятно декламирует, попробуйте.

Для того, чтобы движок ""подхватил" данный словарь ВАМ необходимо зайти в папку: C:\Documents and Settings\ВАШЕ ИМЯ\Application Data\Acapela Group\HW2L\UserLexicons и заменить существующий там словарь Alyona22k.dic (1,27 КБ) на словарь, который предложен тут и весит 544 КБ. ВАЖНО!!! Название файла со словарём обязательно должно называться Alyona22k.dic, в противном случае движок синтеза речи не сможет его инициализировать. Так что не изменяйте имя словарика.
СКАЧАТЬ СЛОВАРИК С ЛИТЕРАТУРНЫМ УКЛОНОМ МОЖНО ТУТ:http://depositfiles.com/ru/files/4dyt0980c/


Отсюда: http://rutracker.org/forum/viewtopic.php?t=1014114&start=120

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Дек 22 2009, 23:24
Вт Дек 22 2009, 23:24

del
первая транскрипция из "литературного уклона" второй из "лексикон для трудночитаемых"

заперев #z A1 p' $ r' $ f #z @ p' $ r' e2 f
запряжен #z V p r' $ Z E1 n #z V p r' $ Z 91 n
запульсировала #z V p U l' s' $ r V v A1 l @ #z V p U l' s' i1 r @ v @ l @
запульсировало #z V p U l' s' $ r V v A1 l @ #z V p U l' s' i1 r @ v @ l @


с первого взгляда это какая-то из разновидностей первых версий "трудночитаемого" с кучей ошибок No но может я и ошибаюсь

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Ср Дек 23 2009, 10:04
Ср Дек 23 2009, 10:04

Друзья, а есть ли вообще в природе инструкция по пользованию Lexicon Manager? Я все никак не могу разобраться в этих символах и как ими пользоваться.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Ср Дек 23 2009, 11:56
Ср Дек 23 2009, 11:56

del да, есть встроенная справка лексикона (F1) и есть отдельно справка по лингвистике движка
перевод на русском
оригинал на английском

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Ср Дек 23 2009, 19:44
Ср Дек 23 2009, 19:44

Цитата от del : ... заменить существующий там словарь Alyona22k.dic (1,27 КБ) на словарь, который предложен тут и весит 544 КБ...
А у меня от 20.11.2009 словарь весит 567 КБ ,это нормально или какой то глюк?

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Ср Дек 23 2009, 21:38
Ср Дек 23 2009, 21:38

evilone_, lev55 спасибо вам большое. Сейчас буду учиться. Smile

Вот, например, надо было аленино "не бЫло" заменить на "нЕ было". Так я только справился насильно. "Нибыло" - решило проблему. No Ну теперь может профессионально решу это. Спасибо.

Кстати, lev55, а Вы не пробовали тот словарь, который я выше представил?

Вернуться к началу Перейти вниз
del
Новичок


Сообщений : 12
Репутация : 1

 del :: Ср Дек 23 2009, 21:53
Ср Дек 23 2009, 21:53

RIA, извините, я не знаю в чем причина. И что у Вас там. Нужно дождаться ответа и вердикта знатоков по этому словарю. И тогда замените (или нет).

Еще вопрос можно? Когда в Лексикон-Менеджере перерабатываешь слово, оно как я понял автоматом добавляется в файл. Если нужно переставить систему или программу, нужно просто тупо скопировать и сохранить уже этот отработанный словарь? Потом - как в первый раз сделать. Верно, нет?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Чт Дек 24 2009, 00:51
Чт Дек 24 2009, 00:51

Цитата :
А у меня от 20.11.2009 словарь весит 567 КБ ,это нормально или какой то глюк?
если это про "литературный" то нормально, наш больше и округлее What a Face
Цитата :
Вот, например, надо было аленино "не бЫло" заменить на "нЕ было". Так я только справился насильно. "Нибыло" - решило проблему. Ну теперь может профессионально решу это. Спасибо.
мне кажется вы сами для себя находите новые задачи Smile сначала подчеркивание, теперь "не было"
почитайте и установите правильно словари к балаболке и лексиконы и все будет хорошо, и "не было" и "не помню" и много чего еще

Цитата :
Длина и вес? (а для могих, я в том числе, и круглина попы значение имеет).
размер имеет значение? clown

Вернуться к началу Перейти вниз
Kile
Посетитель
avatar


Сообщений : 35
Репутация : 0

 Kile :: Сб Дек 26 2009, 21:20
Сб Дек 26 2009, 21:20

Год прошел, раньше omograph весил 1335 кб, сейчас 1339, - что такая малая разница.
Потом, файл конфигурации (или как вы его зовете - лексикон трудно читаемых слов) corector ini у вас в инструкции весит что-то 354 кб, а на деле - скачивается всего 3кб.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Дек 27 2009, 01:36
Вс Дек 27 2009, 01:36

Kile пишет:
Год прошел, раньше omograph весил 1335 кб, сейчас 1339, - что такая малая разница.
маленький наверно потому что это лексикон омографов и не так много их туда за год добавилось, вот поэтому и размер не сильно вырос

Kile пишет:
Потом, файл конфигурации (или как вы его зовете - лексикон трудно читаемых слов)
а как его называете вы? corector ini это словарь "словарь коррекции текста" его размер действительно 3кб, но он никакого отношения к "лексикону трудно читаемых слов" увы не имеет. а размер того самого лексикона не 354кб а чуть больше 600кб, не совсем понятно о каком файле идет речь Suspect

а вообще мы все тут бездельники и лентяи и ни за что не отвечаем, нет правда мы такие pale

Вернуться к началу Перейти вниз
ptoton
Бывалый
avatar


Сообщений : 108
Репутация : 25

 ptoton :: Вс Янв 10 2010, 19:51
Вс Янв 10 2010, 19:51

при использовании совместно corrector.ini и omograph.dic
фразы

где-то далеко
Во-первых, ведро начинает вращаться


меняются при обработке на

гдео далеко
Вох, ведрО начинает вращаться


подскажите в чем дело?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Янв 10 2010, 20:10
Вс Янв 10 2010, 20:10

это старые версии
там было обновление с правками

Вернуться к началу Перейти вниз
Phazorx
Наблюдатель


Сообщений : 1
Репутация : 0

 Phazorx :: Пт Фев 12 2010, 17:49
Пт Фев 12 2010, 17:49

Подскажите как правильно разъяснять балаболке где куда ударения ставть в завсимости от части речи?
например в лексиком менеджере можно указать к добовляемому слову часть речи, и соответственно хотелось бы:
пoтом - # p o2 t @ m - NOUN (р. пад., существительное)
потoм - #p V t o1 m - ADVERB (наречие)

и тому подобные

Вернуться к началу Перейти вниз
av161955
Посетитель


Сообщений : 45
Репутация : 6

 av161955 :: Пт Фев 26 2010, 22:44
Пт Фев 26 2010, 22:44

Уважаемые Знатоки!
Я - новичок и поэтому прошу у вас совет.
Пользуюсь для чтения и записи прогой TextAloud и стандартным словарем Alyona22k.dic,
скачанным где-то в интернете.
Решил улучшить работу программы и скачал с этого форума некоторые словари для Аленки:
лексикон трудно читаемых слов
лексикон для словаря замен omograph_lex.dic
лексикон запрета чтения разделительных знаков _punctuation.dic,
установил их в папку C:\Documents and Settings\%username%\Application Data\Acapela Group\HW2L\UserLexicons и подключил их в Lexicon Menadger в таком порядке
omograph_lex.dic
Alyona22k.dic
_punctuation.dic

и никакой разницы

Правильные ли я словари скачал, туда ли их засунул, правильно ли подключил, в том ли порядке?

Где-то читал, что нужно что-то прописать в реестре

Может дадите еще рекомендации. так как глазами много читать не могу

Заранее благодарю

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Сб Фев 27 2010, 00:07
Сб Фев 27 2010, 00:07

av161955
вот так всегда, что скачать читается легко а что потом с этим делать - трудно :ku:
на самом деле там чуть ниже сразу после Установка: как можно проще написано как его потом подключать нужно, с той разницей что если читается (записывается) TextAloud'ом то все это безобразие можно предварительно подготовить в балаболке и потом уже этот текст читать чем захочется.

Вернуться к началу Перейти вниз
av161955
Посетитель


Сообщений : 45
Репутация : 6

 av161955 :: Сб Фев 27 2010, 09:10
Сб Фев 27 2010, 09:10

evilone_
Спасибо!
Наконец-то я понял, что через Балаболку можно откорректировать текст с помощью словарей.
А как можно увидеть, ЧТО Балаболка сделала, т. е. как сравнить варианты ДО и После?

Хочу узнать Ваше мнение о Балаболке: она действительно лучше для записи, чем TextAloud ?

И какой алгоритм дальнейших моих действий:
прослушать Всю книгу, внося вручную изменения через Lexicon Menedger, а только потом перегнать текст в Mp3 ?

Заранее прошу прощение за глупые вопросы, но седьмой десяток и слепой Sad

P.S.
Разбираюсь по-маленьку...
Помогите скачать Словарь замены для Ё-фикации текста и
Программа для «отлова» трудночитаемых слов ATTS

толи битые, толи сервер не дает. выложите, плиз, в другом месте

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Сб Фев 27 2010, 15:30
Сб Фев 27 2010, 15:30

av161955 да, ссылка на Ё-словарь была неправильной, точнее была правильной пока ее не изменили Sad уже должна работать
а вместо ATTS лучше (удобнее) использовать myTTS AccentFixer Shell

Цитата :
А как можно увидеть, ЧТО Балаболка сделала, т. е. как сравнить варианты ДО и После?
если просто посмотреть были ли изменения то после преобразования текста нажать на "статистику замен" Ctrl+J там покажут какие замены были и какими словарями, это в балаболке все

Цитата :
И какой алгоритм дальнейших моих действий:
вообще-то достаточно просто открыть текст и слушать, если хочется как лучше то можно дополнительно перед прослушиванием воспользоваться "поиском имен в тексте" Alt+F3 и прослушать наиболее употребляемые имена названия и т. п. в тексте если качество не устраивает и нужно подправить произношение то добавлять прямо в лексикон движка

Вернуться к началу Перейти вниз
av161955
Посетитель


Сообщений : 45
Репутация : 6

 av161955 :: Сб Фев 27 2010, 17:48
Сб Фев 27 2010, 17:48

evilone
Все скачал, понял, буду работать (слушать) дальше.

Спасибо, если что - не откажите в помощи Smile

Вернуться к началу Перейти вниз
av161955
Посетитель


Сообщений : 45
Репутация : 6

 av161955 :: Сб Фев 27 2010, 19:43
Сб Фев 27 2010, 19:43

И еще вопрос:
у меня в Lexicon Menadger в таком порядке (рекомендованном) подключены словари:
omograph_lex.dic
Alyona22k.dic
_punctuation.dic

Какой из них имеет бОльший приоритет?

При редактировании слова в Lexicon Menadger, добавлении его в словарь и сохранении словаря
где, в каком словаре оно сохраняется?

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

Обсуждение словарей

Предыдущая тема Следующая тема Вернуться к началу
Обсуждение словарей
Страница 4 из 9Страница 4 из 9На страницу : Предыдущий  1, 2, 3, 4, 5, 6, 7, 8, 9  Следующий
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении