|
| |
Автор | Сообщение | Обсуждение словарей |
---|
evilone_ Участник «online словари»
Сообщений : 859
| evilone_ | :: Ср Сен 09 2009, 01:03 | Ср Сен 09 2009, 01:03 | |
| al2055 тут читать как "в словарь сейчас добавляются только замены для омографов той формы которую голос не читает сам без простановки в нем ударения" это если проводить сравнения со словарями к ольге.
то что там есть лишние замены факт, но вреда от них не много хотя до пояса=до пОяса это совсем не лишняя замена |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Ср Сен 09 2009, 02:33 | Ср Сен 09 2009, 02:33 | |
| Странно. У меня "пояса" читает как "пОяса" (# p o1 $ s @). |
|
| | | Sylvia Участник «online словари»
Сообщений : 72
Репутация : 83
| Sylvia | :: Ср Сен 09 2009, 03:21 | Ср Сен 09 2009, 03:21 | |
| - evilone_ пишет:
- al2055 обновили словарь замен с учетом неразрывного тире и твоих словарей замен и правок.
Да уж Получился словарик на все вкусы, каждый может выбрать себе что-то Прямо шведский стол. (Я об omograph.7z) Чистили-чистили словарь, и опять он разросся. Например: *ди -=ди _ *ди"=ди *ди=ди' А такое разве в книгах встречается? *ъ-ъ-ъ-ъ-ъ*=ъ *ы-ы-ы-ы-ы*=ы *ь-ь-ь-ь-ь*=ь Действительно, Алена настолько загадочная девушка, что единого мнения "как лучше" нет. Не то что у Коли, поставил ударение, и все, никаких тебе интонаций.
- al2055 пишет:
- Странно. У меня "пояса" читает как "пОяса" (# p o1 $ s @).
У меня тоже. Но я согласна с - evilone_ пишет:
- то что там есть лишние замены факт, но вреда от них не много
Просто ни у кого нет времени на основательную чистку словаря. Правится в основном по ходу слушания, когда что-то уж очень режет слух. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Сен 09 2009, 13:12 | Ср Сен 09 2009, 13:12 | |
| не "до пояса" а "до полу", перепутали, читает полУ вместо пОлу - Цитата :
- *ди -=ди _
*ди"=ди *ди=ди' это старая замена для коррекции длинного "и" на конце слова
а те безобразия можно уже удалить если со словарем коррекции текста, это для слов вида Мда-а-а-а-а Ага-а-а-а-а и т.п.
- Цитата :
- Чистили-чистили словарь, и опять он разросся.
ага из 15-18 уже до 21 тысячи вырос, это если сравнивать со старым на 36 для ольки словарик на 60 тысяч уже |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Ср Сен 09 2009, 16:26 | Ср Сен 09 2009, 16:26 | |
| evilone_
В новой редакции описка вкралась: 2 раза стоит "*ни?=11 илетним", вместо "*ни?=ни _?". |
|
| | | Вадим Романько Посетитель
Сообщений : 36
Репутация : 35
| Вадим Романько | :: Вс Сен 13 2009, 06:34 | Вс Сен 13 2009, 06:34 | |
| БРАВО!!! Появились новые словари. Я произвел тестирование на совместимость с новыми словарями. В целом всё работает корректно. Во время тестирования обнаружены ошибочки (без них при разработке никак).
Ошибочки в лингвистическом предпроцессоре corredor.ini 1. Ошибки работы с теговыми скобками «<» и «>», тег открывается и не закрывается, текст далее не читается, синтезатор возвращает ошибку. Пример: Этот текст читается <-Ь> далее текст отключен. Ошибка синтезатора речи. 1<-ж> Ошибка. 2. «т. е.» превращается в «те», а не «то есть». 3. «1-й,» = «один и краткое», а не «первый».
Ошибочки в словаре omograph.dic 1. « … » читает, как «точка» Пример: … 2. «. =» заменяет на, что то очень длинное, (сбой в работе системы). 3. Звездочка заменяется на неприятную длинную паузу. Пример: * пауза. 4. « - П » заменяется на «_п». |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Вс Сен 13 2009, 16:12 | Вс Сен 13 2009, 16:12 | |
| Так замены "* - п*= _п", "*, п*= _п" и были запланированы. Убирают многие проблемы с затыканиями на "п". |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Сен 13 2009, 18:50 | Вс Сен 13 2009, 18:50 | |
| - al2055 пишет:
- Так замены "* - п*= _п", "*, п*= _п" и были запланированы. Убирают многие проблемы с затыканиями на "п".
а какие проблемы убирают? а то вроде пару раз попробовали и всюду читает внятно, а с заменой наоборот иногда искажает. |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Пн Сен 14 2009, 22:05 | Пн Сен 14 2009, 22:05 | |
| evilone_
Ну, не знаю, может, это субъективно, а, может, дело в том, что я только слушаю, не видя текста и мне необходимо более четкое произношение, но у меня перед "п" с дефисом и запятой часто съедаются гласные и глухие согласные. |
|
| | | t64y Новичок
Сообщений : 15
Репутация : 4
| t64y | :: Сб Сен 19 2009, 22:04 | Сб Сен 19 2009, 22:04 | |
| Сегодня ещё раз попробовал одну и туже книгу прочитать с обработкой "omograph" и чистый текст. Впечатление /возможно спорное/ но количество ошибок в ударениях практически одинаковое. Я не говорю о не правильно читаемых словах /не всё что забито "Alyona22k" - правильно/ , я об ударениях. Всё что на мой взгляд не имеет второго значения /ударения или произношения- ну нет других вариантов слова/ я забиваю в lexcon. Пример - сОсна - однозначно сОсна а не -соснА-. Я понимаю что есть слова - дОрога, дорОга, и дорОга. Как ни правь словарь замен - всё не отловить. Но есть предложение сделать в части слов /во всех всё равно не получится/ ударение не явное , а что-то среднее т.е. полностью безударное .Это конечно не выход но часть проблем можно упростить. Например - ПОЛКА - висящая пОлка, развернул полкА. - Если ударение не правильное то режет слух , а если не явное - то как-бы это своеобразный акцент или произношение. - Аленка это позволят, хоть и через танцы с бубном.Слово читается мягче /чуть глуше/ , но по тексту приятней по восприятию. висящая полка , развернул полка. В добавок к ошибкам. Часто слово в лексиконе читает правильно - но в тексте с ошибками. Вот что я выловил за последние два дня. первая колонка слово, вторая то что было в лексиконе, третья исправление. Может у кого-то и правильно но можно сравнить. /Я читаю в TextAloudMP3- он не вмешивается в процесс чтения, читает - то что выдаёт Аленка/
- Спойлер:
рога # r o1 g @ # r V g A1 братаны # b r V t A1 n I # b r A t V n I1 Балбеса # b V l b' e1 s @ # b A l b' e1 s @ железка # Z I l' 91 s k @ # Z I l' e1 s k @ Кодекс # k o1 d' $ k s # k o d @ k s спешат # s p' e1 S @ t # s p' e S A1 t волну # v o1 l n U # v V l n U1 тупика # t u1 p' $ k @ # t u p i k A1 конет # k o1 n' $ # k V n' $1 обалдела # V b V l d' e1 l @ # V b @ l d' e1 l @ господин # g @ s p V d' i1 n # g @ s p V d' i n цели # ts E1 l' $ # ts E1 l' i затронет # z @ t r @ n' $ t # z V t r o n' $ t плетнём # p l' $ t n' 91 m # p l' i t n 91 m леггинсах # l' $ g g' i1 n s @ x # l' $1 g' $ n s @ x широк # S I r @ k # S I r o1 k ножнами # n V Z n A1 m' $ # n o1 Z n @ m' $ скале # s k A1 l' $ # s k A l' $1 распри # r A1 s p r' $ # r A1 s p r $ закуток # z V k u1 t @ k # z @ k u t o k закутка # z V k u1 t k @ # z @ k u t k A поклонник #p V k l o1 nn' $ k #p V k l o1 n n $ k спокойно # s p V k o1 j n @ # s' p V k o j n @ вырезана # v 11 r' $ z @ n @ # v 1 r' $1 z @ n @ другом # d r U g o1 m # d r U g o m трески # t r' e1 s k' $ # t r' e s k' i точеной #t V tS' e1 n @ j #t V tS' 91 n @ j корме # k o1 r m' $ # k V r m' $ быков # b 11 k @ f # b 1 k o1 f глуши # g l u1 S I # g l U2 S I груди # g r U d' i1 # g r U d' i убирает длинное -и- одеяние # V d I j {1 n' $ $ # V d $ j {1 n' $ $ лай # l A1 j # l A j убирает резкое - ай этаже # I t V Z E1 # I t V Z I убирает длинное-э масками #m A1 s k @ m' $ #m A1 ss k @ m' $ музей # m U z' e1 j # m U z' e j ему # j $ m u1 # j $ m U убирает дребезжащее - у священный # s v' $ S' 91 nn I j # s v' $ S' e1 nn I j шевелятся # S I v' e1 l' $ tts @ # S I v' e1 l' $ ts @ тропу # t r o1 p U # t r o p U поднятой # p o1 d n' $ t @ j # p V d' n' { t @ j щиколотку # S' i1 k @ l @ t k U # S' i k @ l @1 t k U край # k r A1 j # k r A j убирает резкое - ай заснеженного # z @ s' n' $ Z o1 nn @ v @ # z @ s' n' e Z @ nn @ v @ мастерские # m A1 s' t' $ r s k' $ $ # m @1 s' t' $ r s k' $ $ PS Отслеживаю очепятки практически ежедневно, так что если нужно можно выложить и продолжение. Но словарный набор у меня своеобразный- читаю в основном фентези. |
|
| | | t64y Новичок
Сообщений : 15
Репутация : 4
| t64y | :: Сб Сен 19 2009, 22:39 | Сб Сен 19 2009, 22:39 | |
| Вопрос к evilone_ на счет словарика "corector". Куда его прикрутить. В балаболке он работает не очень коректно. Не всё правит. Видимо я что-то не догнал. Так что пока правлю текс старым способом. Да для примера. Последний отлов. Слово " голому - # g o1 l @ m U " почему- то зацепило запятую "голому, - # g V l o1 m U " А в лексиконе всё нормально. И пока не могу найти закономерность этого захвата. Зависит не только от конкретного слова /с очетания звуков в окончании/ но видимо и от предыдущих слов , знаков. Надо посмотреть. Набрать базу предложений или строк /каретка машинки/. И ещё хорошо-бы все словари /то что выкладывается / - помечать датой создания . На сайте - только дата выкладки. Не понятно были-ли изменения. С читательским приветом. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Сен 19 2009, 23:23 | Сб Сен 19 2009, 23:23 | |
| - Цитата :
- Куда его прикрутить.
В балаболке он работает не очень коректно. Не всё правит. Видимо я что-то не догнал. его скопировать нужно в папку со словарями балаболки и включить в балаболке где словари, как обычный словарь, этот словарь должен править совсем чуть-чуть так что видимости от него не особо много но без него не будут правильно ставится замены из основного словаря замен omograph.dic может потому что вы его не подключили и было - Цитата :
- количество ошибок в ударениях практически одинаковое
- Цитата :
- Всё что на мой взгляд не имеет второго значения /ударения или произношения- ну нет других вариантов слова/ я забиваю в lexcon.
Пример - сОсна - однозначно сОсна а не -соснА-. да, только слово неудачное а так в принципе и надо делать, ну если только ударение однозначно можно поставить
- Цитата :
- Но есть предложение сделать в части слов /во всех всё равно не получится/ ударение не явное
а пример можно? для того же "полка" пример такой транскрипции с неявным ударением?
- Цитата :
- PS Отслеживаю очепятки практически ежедневно, так что если нужно можно выложить и продолжение.
нужно, только формат если можно сохранить лексиконовский т.е. слово таб транскрипция таб часть речи а то форматировать сложно потом словарь.
- Цитата :
- Да для примера. Последний отлов. Слово " голому - # g o1 l @ m U " почему- то зацепило запятую "голому, - # g V l o1 m U " А в лексиконе всё нормально.
вот такие ошибки очень интересны, их нужно ловить в первую очередь
там вся особенность в том что некоторые слова голос читает с ошибками если перед или позади слова стоит знак препинания. такие слова нужно смотреть в контексте и делать для них корректирующую замену - Цитата :
- На сайте - только дата выкладки. Не понятно были-ли изменения.
если меняется дата выкладки меняется и содержимое словаря |
|
| | | t64y Новичок
Сообщений : 15
Репутация : 4
| t64y | :: Вс Сен 20 2009, 10:06 | Вс Сен 20 2009, 10:06 | |
| Возращаясь к теме о " не правда, не хорошо, и т.д." В лексиконе все читат по отдельности правильно. Я взял " НЕ" - и поправил. - Было - не # n' $ Теперь - не # n $ И варианты без слития и правок читает правильно. - не плохо, - не хорошо, - не правда, - не-плохо, - не-хорошо, - не-правда, .- не_плохо, .- не_ хорошо, .- не_правда, .- не_плохо, .- не_хорошо, .- не_правда, .-не_плохо? .-не_ хорошо! .-не_правда! .-не_плох?!, .-не_хорошо!!! .-не_правда??? Но здесь варианы знаков немного влияют на интонацию /эмоции/. Но пока всё правильно - дальше посмотрим, последим. К сожалению очень много зависит от качеста текста. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Сен 20 2009, 17:47 | Вс Сен 20 2009, 17:47 | |
| - Цитата :
- Но здесь варианы знаков немного влияют на интонацию /эмоции/.
они как правило всегда влияют и не только на интонацию а насчет "не": - не изменилось ли чтение обычный слов с "не" по тексту? особенно если слово после "не" начинается с ударной гласной? - "апомню" в тексте встречается также слитно, т.е. некоторые "грамотеи" пишут в своих книгах непомню незнаю и т.д. такие замены правка в лексиконе перехватывать не будет; - в словаре замен сейчас есть правка для "апомню" так что правильно может быть и не из-за этого на самом деле без словаря замен тоже произносит правильно? |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Вс Сен 20 2009, 22:20 | Вс Сен 20 2009, 22:20 | |
| t64y
- Цитата :
- В добавок к ошибкам. Часто слово в лексиконе читает правильно - но в тексте с ошибками.
Вот что я выловил за последние два дня. Так в приведенном списке большинство слов - это омографы. Они и даются в omograf.dic с разными ударениями. Пример: рОга-рогА, вОлну-волнУ, тУпика-тупикА, цЕли-целИ, дрУгом-другОм и т.д.
Проблему с "голому" я снял так: #g o2 l @ m U |
|
| | | Keynol Интересующийся
Сообщений : 6
Репутация : 0
| Keynol | :: Пт Окт 23 2009, 20:58 | Пт Окт 23 2009, 20:58 | |
| Добрый День! Установил как и рекомендовали,
3 лексикона (первым - лексикон для словаря замен, третьим - лексикон запрета чтения разделительных знаков, новый Основной лексикон Alyona22k.dic, подключил вторым, как сказали) в TTS
1 словарь замен - в балаболку, подключил галочкой. Всё путем.
Как я понял, чтобы использовать все наработки для Алёны на сегодняшний день (а я хочу именно это), и что бы охватить наибольший диапазон текстов (в моём случае - художественная литература, возможно субтитры к фильмам) надо перед работой надо непременно импортировать в Лексикон-Менеджер TTS 3 выкладывющихся словаря замены rur_1.txt - rur_3.txt
Как было сказано, импорт идет много часов (5-6) У меня комп Core2Duo 2.2 Ghz
Вопрос такой, без этого шага, добиться в Балаболке кардинального улушчения качества чтения возможно или нет ?
И еще, можно ли выделить значком те словари, лексиконы которые надо прицеплять к балаболке ? И как добиться их работы в других программах ? - может прицепить через Lexicon Manager ? Или там другой формат и он не поймёт ? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Окт 24 2009, 01:49 | Сб Окт 24 2009, 01:49 | |
| - Цитата :
- 1 словарь замен - в балаболку, подключил галочкой.
Всё путем. нужно еще подключать Словарь коррекции текста - Цитата :
- Как я понял, чтобы использовать все наработки для Алёны на сегодняшний день (а я хочу именно это), и что бы охватить наибольший диапазон текстов (в моём случае - художественная литература, возможно субтитры к фильмам) надо перед работой надо непременно импортировать в Лексикон-Менеджер TTS 3 выкладывющихся словаря замены rur_1.txt - rur_3.txt
нет эти словари "Дополнительные словари" и они "Системные лексиконы движка (фонетические транскрипции уже встроенные в системный лексикон движка)" т.е. они уже есть изначально и дважды их добавлять бессмысленно - Цитата :
- И еще, можно ли выделить значком те словари, лексиконы которые надо прицеплять к балаболке ?
можно, сделаем - Цитата :
- И как добиться их работы в других программах ? - может прицепить через Lexicon Manager ? Или там другой формат и он не поймёт ?
можно преобразовать текст в балаболке а затем уже работать с преобразованным текстом. форматы лексикона и словаря замен разные и работать не будут если их поменять местами. |
|
| | | Keynol Интересующийся
Сообщений : 6
Репутация : 0
| Keynol | :: Вс Окт 25 2009, 02:28 | Вс Окт 25 2009, 02:28 | |
| evilone_ Если касаться только Аленки.
-- rur_1.txt ... - размер у них разный - не такой как в rur_1.bab.dca - разница на 500-600 кб. Как так ? -- для каких случаев, для кого, тогда, выложены rur_1-3.txt ?
-- Когда я начал прицеплять rur_1.txt, лексикон подумал вначале пару минут, потом выдал - "идет отличия в слове абель - и два примера - старого и нового. Как это понимать, если файлы rur_1.txt и rur_1.bab.dca по логике идентичны ?
Еще вопрос. Надо ли понимать ситуацию так, что, если человек скачал Акапеллу/Алёнку, то кроме трех словарей, ему (если Балаболку не использовать) нечего больше присоединять ? Все остальные наработки народа - для балаболки сделано ? То есть Кул Ридер и пр. отдыхают?
- Цитата :
- можно преобразовать текст в балаболке а затем уже работать с преобразованным текстом. форматы лексикона и словаря замен разные и работать не будут если их поменять местами.
Как преобразовать ? Какую кнопку нажать ? Я запутался с очередностью. Допустим, меня интересует чтение 1) субтитров паралельно к фильму, 2) Чтение книги в Кул Ридере.
Какие мне надо сделать шаги для достижения результата (чтение красивым голосом без ошибок) 1) Субтитров по мере просмотра фильма 2) Книги в Cool Reader 2), имея:
-- Три, как я выше писал, прицепленных словаря на Лексикон-менеджере (т.е. в ядре - для всех программ), и -- Балаболку с установленными ini и dic словарями. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Окт 25 2009, 02:20 | Вс Окт 25 2009, 02:20 | |
| - Цитата :
- для каких случаев, для кого, тогда, выложены rur_1-3.txt ?
наверно нужно будет их спрятать а то с этими лексиконами народ впадает в крайности
если Балаболку не использовать то хватит и 2х - лексикон для словаря замен тогда можно не подключать потому что словаря замен не будет.
- Цитата :
- Все остальные наработки народа - для балаболки сделано ?
да все наработки сделаны с использованием словарей, если программа не умеет обрабатывать текст словарями то - Цитата :
- отдыхают
- Цитата :
- Как преобразовать ? Какую кнопку нажать ?
подключить нужные словари и нажать ctrl+T
- Цитата :
- Допустим, меня интересует чтение 1) субтитров паралельно к фильму, 2) Чтение книги в Кул Ридере.
преобразовываешь текст в балаболке сохраняешь и открываешь в том в чем нужно прочесть только тогда уже нужно подключать все три лексикона (трудные слова, для словаря замен и пунктуация) и читаешь измененный текст как обычный
- Цитата :
- -- Три, как я выше писал, прицепленных словаря на Лексикон-менеджере (т.е. в ядре - для всех программ)
про эти самые три словаря, только лучше их обзывать лексиконами а то можно запутаться, лучше забудь совсем, они нужны только для правки уже готовых транскрипций |
|
| | | Keynol Интересующийся
Сообщений : 6
Репутация : 0
| Keynol | :: Вс Окт 25 2009, 02:41 | Вс Окт 25 2009, 02:41 | |
| Попробовал преобразование
- Спойлер:
оригинал --- Впереди и внизу в дымке пульсировал широкий отсвет. Облака дыма казались здесь менее густыми благодаря атмосферным течениям. Корабль неуверенно направился к этому району. Внизу лежало обширное море зловещей лавы, на волнующейся поверхности которого плясали разноцветные огни. Они спускались к Пламенному Океану. Норт энергично перевел рычаг, включив килевые и боковые дюзы, чтобы свернуть к югу. Но яростные атмосферные течения над этим морем расплавленного камня швыряли "Метеор", как листок в бурю.
преобразован -- Впереди' и внизу в дымке пульсировал широкий отсвет. Облака дыма казались здесь менее_ густыми благодаря атмосферным течениям. Корабль неуверенно направился к этому району. Внизу лежало обширное море зловещей лавы, на волнующейся поверхности которого плясали разноцветные огни. Они спускались к Пламенному Океану. Норт энергично перевел рычаг, включив килевые и боковые дюзы, чтобы свернуть к югу. Но яростные атмосферные течения над этим морем расплавленного камня швыряли "Метеор", как листок в бурю. -------------- особо разницы не заметил, разве что тут -> Впереди' и тут ->менее_
Подключены в балаболке 1. corrector.ini 2. аббревиатура В.Романько.ini 3. СИ В.Романько.ini 4. omograph.dic
Алена читает так Впереди внизу в дымке... Т.е. "и" - пропускает что ты не делай, и другие нюансы...
- Цитата :
- только тогда уже нужно подключать все три лексикона
Что значит только тогда ? Лексиконы на TTS подключать же надо непременно всегда. Инсталлировал, подключил и забыл. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Окт 25 2009, 03:26 | Вс Окт 25 2009, 03:26 | |
| - Цитата :
- особо разницы не заметил
а какая разница должна была быть заметной, нет правда? |
|
| | | Keynol Интересующийся
Сообщений : 6
Репутация : 0
| Keynol | :: Вс Окт 25 2009, 03:49 | Вс Окт 25 2009, 03:49 | |
| evilone_ К примеру расставление ударений, исправление проглатывания звуков, гласных и согласных, в общем убирание нюансов по умолчанию через коррекцию слов по фонетической базе или как-то так.
к примеру - Впереди и внизу в дымке пульсировал широкий отсвет. -> Впереди/[знак удлинения и] и[выделение И] внизу [небольшая пауза] пульсирован широкий отсвет.
Ибо сейчас она строчит "Впереди-внизу в дымке пульсировал широкий отсвет"
Потом, надо что-то делать со словом "расплавленного" Она в этом единственном слове - 2-3 раза скачет по тону вверх-вниз!.
Я не знаю как у вас на машине всё настроено, конечно, но у меня, по умолчанию, и с имеющимися у меня словарями, звучит не особо хорошо.
А ведь кажется народ год работал над доводкой звучания. Может я не нашел нужных словарей, лексиконов ?.. Или каждый пользуется своим родным не показывая другиим ? Тоже на это не похоже... Чтож тогда ? Ничего не понимаю.
Если не тут, не на этом, лучшем сайте по Алёнке, то где ж тогда искать ? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Окт 25 2009, 12:09 | Вс Окт 25 2009, 12:09 | |
| Keynol - Цитата :
- К примеру расставление ударений, исправление проглатывания звуков, гласных и согласных, в общем убирание нюансов по умолчанию через коррекцию слов по фонетической базе или как-то так.
ударения ставятся только там где нужно а не где попало, и для аленки понятие "поставить ударение в тексте" не работает. скорость чтения и паузы настраиваются в Voice Manager, а "коррекция по фонетической базе" делается по мере необходимости, другими словами, только если сильно заметна, специально никто ошибки не ищет, этим занимается, по крайней мере должен заниматься разработчик
- Цитата :
- А ведь кажется народ год работал над доводкой звучания.
кажется кто-то и занимался, кому это нужно было, а все костыли к голосу которые сейчас есть - есть тут, а если нету то они либо сильно новые либо не сильно хорошие.
- Цитата :
- Или каждый пользуется своим родным не показывая другиим ? Тоже на это не похоже... Чтож тогда ? Ничего не понимаю.
скорее всего, свои труднопроизносимые слова у каждого свои, потому как их очень много и все их в лексикон не внесешь, имхо да и ненужны там слова которые встречаются только при чтении одного текста которые могут и не встретиться в тексте никогда |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Ср Дек 16 2009, 10:00 | Ср Дек 16 2009, 10:00 | |
| Здравствуйте, ув. Автор и друзья.
Подскажите, пожалуйста кто знает. Установил словари (программа Балаболка) как подсказали здесь: https://mytts.forum2x2.ru/forum-f11/tema-t164.htm . Но после форматирования текста в нем появились "_" и Алена добросовестно их и читает как "подчеркивание". Сколько не пытался побороть это - не получается. Неужели теперь только вручную это можно удалить.
Подскажите, пожалуйста, в чем ошибка.
Автору спасибо за программу. Вещь. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Дек 16 2009, 10:06 | Ср Дек 16 2009, 10:06 | |
| del нужно подключить "Лексикон запрета чтения разделительных знаков" |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Ср Дек 16 2009, 11:15 | Ср Дек 16 2009, 11:15 | |
| evilone_, спасибо Вам большое. Но в все это в Алену я добавлял. И в панели Балалболки он галочкой отмечен. Но получается, что не работает. Подскажите пожалуйста как его включить. Спасибо. |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Ср Дек 16 2009, 11:26 | Ср Дек 16 2009, 11:26 | |
| Может быть в этом вот проблема?
Качаем лексикон для словаря замен и лексикон запрета чтения разделительных знаков и подключаем их (не импортируем) так чтобы лексикон для словаря замен стоял первым, потом лексикон трудночитаемых слов и лексикон запрета чтения разделительных знаков (тот что верхний тот приоритетнее). https://mytts.forum2x2.ru/forum-f11/tema-t164.htm
Что значит "подключаем их (не импортируем)"? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Дек 16 2009, 12:19 | Ср Дек 16 2009, 12:19 | |
| так ведь там все вроде в справочке написано, нет? - Цитата :
- Как подключить новый лексикон не импортируя его в общий?
Откройте лексикон-менеджер и нажмите Ctrl+t затем нажмите добавить лексикон (Add lexicon) выберите нужный лексикон (файл с расширением dic) |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Ср Дек 16 2009, 16:17 | Ср Дек 16 2009, 16:17 | |
| У меня все так и есть как на скрине там. Но это ее проклятое "подчеркивание" мне скоро наверное уже сниться будет.
Какие могут быть еще ошибки не подскажите? Может все вообще поудалять, да и заново поставить? Или есть еще менее радикальные способы? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Дек 16 2009, 16:40 | Ср Дек 16 2009, 16:40 | |
| del наверно лучше всего будет еще раз внимательно почитать все что написано тут а потом еще раз и еще один раз кроме картинок там есть чуть-чуть текста который тоже нужно прочесть и сделать все как там написано |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Пт Дек 18 2009, 10:21 | Пт Дек 18 2009, 10:21 | |
| Всем спасибо за ответы. Тут и автор посоветовал, что сделать, да и друг свой словарь прислал. Все вроде теперь без пробелов.
Кстати, он посоветовал пользоваться как можно меньшим количеством словарей во избежании несостыковок и ошибок. |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Вт Дек 22 2009, 20:43 | Вт Дек 22 2009, 20:43 | |
| Друзья, на Торентсе нашел ссылку на словарь Алены аж на 22 тысячи слов! Не проанализируете его как более сведущие в этом вопросе? Я попробовал, вроде неплохо. Но соответствует ли все это тому о чем говорит автор поста? Не знаю.
Копирую полностью пост.
Сегодня в искал новый словарь и натолкнулся на следующее сообщение : Внимание! Буквально только что стал доступен словарь для движка "Алёнка" с литературным уклоном, состоящий из 22 000 слов!!! С наличием данного словаря речь Алёны становится более чистой, приятной, мягкой, правильной. Со словарём она, например, стихи очень приятно декламирует, попробуйте.
Для того, чтобы движок ""подхватил" данный словарь ВАМ необходимо зайти в папку: C:\Documents and Settings\ВАШЕ ИМЯ\Application Data\Acapela Group\HW2L\UserLexicons и заменить существующий там словарь Alyona22k.dic (1,27 КБ) на словарь, который предложен тут и весит 544 КБ. ВАЖНО!!! Название файла со словарём обязательно должно называться Alyona22k.dic, в противном случае движок синтеза речи не сможет его инициализировать. Так что не изменяйте имя словарика. СКАЧАТЬ СЛОВАРИК С ЛИТЕРАТУРНЫМ УКЛОНОМ МОЖНО ТУТ:http://depositfiles.com/ru/files/4dyt0980c/
Отсюда: http://rutracker.org/forum/viewtopic.php?t=1014114&start=120 |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Дек 22 2009, 23:24 | Вт Дек 22 2009, 23:24 | |
| del первая транскрипция из "литературного уклона" второй из "лексикон для трудночитаемых"
заперев | #z A1 p' $ r' $ f | #z @ p' $ r' e2 f | запряжен | #z V p r' $ Z E1 n | #z V p r' $ Z 91 n | запульсировала | #z V p U l' s' $ r V v A1 l @ | #z V p U l' s' i1 r @ v @ l @ | запульсировало | #z V p U l' s' $ r V v A1 l @ | #z V p U l' s' i1 r @ v @ l @ |
с первого взгляда это какая-то из разновидностей первых версий "трудночитаемого" с кучей ошибок но может я и ошибаюсь |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Ср Дек 23 2009, 10:04 | Ср Дек 23 2009, 10:04 | |
| Друзья, а есть ли вообще в природе инструкция по пользованию Lexicon Manager? Я все никак не могу разобраться в этих символах и как ими пользоваться. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Дек 23 2009, 11:56 | Ср Дек 23 2009, 11:56 | |
| del да, есть встроенная справка лексикона (F1) и есть отдельно справка по лингвистике движка перевод на русском оригинал на английском |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Ср Дек 23 2009, 19:44 | Ср Дек 23 2009, 19:44 | |
| Цитата от del : ... заменить существующий там словарь Alyona22k.dic (1,27 КБ) на словарь, который предложен тут и весит 544 КБ... А у меня от 20.11.2009 словарь весит 567 КБ ,это нормально или какой то глюк? |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Ср Дек 23 2009, 21:38 | Ср Дек 23 2009, 21:38 | |
| evilone_, lev55 спасибо вам большое. Сейчас буду учиться.
Вот, например, надо было аленино "не бЫло" заменить на "нЕ было". Так я только справился насильно. "Нибыло" - решило проблему. Ну теперь может профессионально решу это. Спасибо.
Кстати, lev55, а Вы не пробовали тот словарь, который я выше представил? |
|
| | | del Новичок
Сообщений : 12
Репутация : 1
| del | :: Ср Дек 23 2009, 21:53 | Ср Дек 23 2009, 21:53 | |
| RIA, извините, я не знаю в чем причина. И что у Вас там. Нужно дождаться ответа и вердикта знатоков по этому словарю. И тогда замените (или нет).
Еще вопрос можно? Когда в Лексикон-Менеджере перерабатываешь слово, оно как я понял автоматом добавляется в файл. Если нужно переставить систему или программу, нужно просто тупо скопировать и сохранить уже этот отработанный словарь? Потом - как в первый раз сделать. Верно, нет? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Чт Дек 24 2009, 00:51 | Чт Дек 24 2009, 00:51 | |
| - Цитата :
- А у меня от 20.11.2009 словарь весит 567 КБ ,это нормально или какой то глюк?
если это про "литературный" то нормально, наш больше и округлее - Цитата :
- Вот, например, надо было аленино "не бЫло" заменить на "нЕ было". Так я только справился насильно. "Нибыло" - решило проблему. Ну теперь может профессионально решу это. Спасибо.
мне кажется вы сами для себя находите новые задачи сначала подчеркивание, теперь "не было" почитайте и установите правильно словари к балаболке и лексиконы и все будет хорошо, и "не было" и "не помню" и много чего еще
- Цитата :
- Длина и вес? (а для могих, я в том числе, и круглина попы значение имеет).
размер имеет значение? |
|
| | | Kile Посетитель
Сообщений : 35
Репутация : 0
| Kile | :: Сб Дек 26 2009, 21:20 | Сб Дек 26 2009, 21:20 | |
| Год прошел, раньше omograph весил 1335 кб, сейчас 1339, - что такая малая разница. Потом, файл конфигурации (или как вы его зовете - лексикон трудно читаемых слов) corector ini у вас в инструкции весит что-то 354 кб, а на деле - скачивается всего 3кб. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Дек 27 2009, 01:36 | Вс Дек 27 2009, 01:36 | |
| - Kile пишет:
- Год прошел, раньше omograph весил 1335 кб, сейчас 1339, - что такая малая разница.
маленький наверно потому что это лексикон омографов и не так много их туда за год добавилось, вот поэтому и размер не сильно вырос
- Kile пишет:
- Потом, файл конфигурации (или как вы его зовете - лексикон трудно читаемых слов)
а как его называете вы? corector ini это словарь "словарь коррекции текста" его размер действительно 3кб, но он никакого отношения к "лексикону трудно читаемых слов" увы не имеет. а размер того самого лексикона не 354кб а чуть больше 600кб, не совсем понятно о каком файле идет речь
а вообще мы все тут бездельники и лентяи и ни за что не отвечаем, нет правда мы такие |
|
| | | ptoton Бывалый
Сообщений : 108
Репутация : 25
| ptoton | :: Вс Янв 10 2010, 19:51 | Вс Янв 10 2010, 19:51 | |
| при использовании совместно corrector.ini и omograph.dic фразы
где-то далеко Во-первых, ведро начинает вращаться
меняются при обработке на
гдео далеко Вох, ведрО начинает вращаться
подскажите в чем дело? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Янв 10 2010, 20:10 | Вс Янв 10 2010, 20:10 | |
| это старые версии там было обновление с правками |
|
| | | Phazorx Наблюдатель
Сообщений : 1
Репутация : 0
| Phazorx | :: Пт Фев 12 2010, 17:49 | Пт Фев 12 2010, 17:49 | |
| Подскажите как правильно разъяснять балаболке где куда ударения ставть в завсимости от части речи? например в лексиком менеджере можно указать к добовляемому слову часть речи, и соответственно хотелось бы: пoтом - # p o2 t @ m - NOUN (р. пад., существительное) потoм - #p V t o1 m - ADVERB (наречие)
и тому подобные |
|
| | | av161955 Посетитель
Сообщений : 45
Репутация : 6
| av161955 | :: Пт Фев 26 2010, 22:44 | Пт Фев 26 2010, 22:44 | |
| Уважаемые Знатоки! Я - новичок и поэтому прошу у вас совет. Пользуюсь для чтения и записи прогой TextAloud и стандартным словарем Alyona22k.dic, скачанным где-то в интернете. Решил улучшить работу программы и скачал с этого форума некоторые словари для Аленки: лексикон трудно читаемых слов лексикон для словаря замен omograph_lex.dic лексикон запрета чтения разделительных знаков _punctuation.dic, установил их в папку C:\Documents and Settings\%username%\Application Data\Acapela Group\HW2L\UserLexicons и подключил их в Lexicon Menadger в таком порядке omograph_lex.dic Alyona22k.dic _punctuation.dic
и никакой разницы
Правильные ли я словари скачал, туда ли их засунул, правильно ли подключил, в том ли порядке?
Где-то читал, что нужно что-то прописать в реестре
Может дадите еще рекомендации. так как глазами много читать не могу
Заранее благодарю |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Фев 27 2010, 00:07 | Сб Фев 27 2010, 00:07 | |
| av161955 вот так всегда, что скачать читается легко а что потом с этим делать - трудно на самом деле там чуть ниже сразу после Установка: как можно проще написано как его потом подключать нужно, с той разницей что если читается (записывается) TextAloud'ом то все это безобразие можно предварительно подготовить в балаболке и потом уже этот текст читать чем захочется. |
|
| | | av161955 Посетитель
Сообщений : 45
Репутация : 6
| av161955 | :: Сб Фев 27 2010, 09:10 | Сб Фев 27 2010, 09:10 | |
| evilone_ Спасибо! Наконец-то я понял, что через Балаболку можно откорректировать текст с помощью словарей. А как можно увидеть, ЧТО Балаболка сделала, т. е. как сравнить варианты ДО и После?
Хочу узнать Ваше мнение о Балаболке: она действительно лучше для записи, чем TextAloud ?
И какой алгоритм дальнейших моих действий: прослушать Всю книгу, внося вручную изменения через Lexicon Menedger, а только потом перегнать текст в Mp3 ?
Заранее прошу прощение за глупые вопросы, но седьмой десяток и слепой
P.S. Разбираюсь по-маленьку... Помогите скачать Словарь замены для Ё-фикации текста и Программа для «отлова» трудночитаемых слов ATTS
толи битые, толи сервер не дает. выложите, плиз, в другом месте |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Фев 27 2010, 15:30 | Сб Фев 27 2010, 15:30 | |
| av161955 да, ссылка на Ё-словарь была неправильной, точнее была правильной пока ее не изменили уже должна работать а вместо ATTS лучше (удобнее) использовать myTTS AccentFixer Shell
- Цитата :
- А как можно увидеть, ЧТО Балаболка сделала, т. е. как сравнить варианты ДО и После?
если просто посмотреть были ли изменения то после преобразования текста нажать на "статистику замен" Ctrl+J там покажут какие замены были и какими словарями, это в балаболке все
- Цитата :
- И какой алгоритм дальнейших моих действий:
вообще-то достаточно просто открыть текст и слушать, если хочется как лучше то можно дополнительно перед прослушиванием воспользоваться "поиском имен в тексте" Alt+F3 и прослушать наиболее употребляемые имена названия и т. п. в тексте если качество не устраивает и нужно подправить произношение то добавлять прямо в лексикон движка |
|
| | | av161955 Посетитель
Сообщений : 45
Репутация : 6
| av161955 | :: Сб Фев 27 2010, 17:48 | Сб Фев 27 2010, 17:48 | |
| evilone Все скачал, понял, буду работать (слушать) дальше.
Спасибо, если что - не откажите в помощи |
|
| | | av161955 Посетитель
Сообщений : 45
Репутация : 6
| av161955 | :: Сб Фев 27 2010, 19:43 | Сб Фев 27 2010, 19:43 | |
| И еще вопрос: у меня в Lexicon Menadger в таком порядке (рекомендованном) подключены словари: omograph_lex.dic Alyona22k.dic _punctuation.dic
Какой из них имеет бОльший приоритет?
При редактировании слова в Lexicon Menadger, добавлении его в словарь и сохранении словаря где, в каком словаре оно сохраняется? |
|
| | | | Обсуждение словарей |
---|
| |