TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



Обсуждение словарей

Предыдущая тема Следующая тема Перейти вниз
На страницу : Предыдущий  1, 2, 3, 4, 5, 6, 7, 8, 9  Следующий
АвторСообщениеОбсуждение словарей
Rus
Новичок


Сообщений : 12

 Rus :: Вс Дек 26 2010, 09:53
Вс Дек 26 2010, 09:53

evilone_, Ага, ясно.
evilone_ пишет:
с пробелом? а разве словарь их не меняет? у меня например "50- х" заменяется на "пятидесятых" и т.д.
Сам не пойму. Примерно с середины книги Алёнка стала читать как "пятьдесят хэ".
Там где без пробела все прочитала окей.
Сейчас с этим словарем из темы проверил,окей стало. В настройках балаблки установил Правила вместо "Комбинированный метод", "Абзацами".
Тре-х, пяты-й, 2-й, 2-х и тд обычно пишутся словами, с этим имхо окей.

Осталась не ясность, например с аббревиатурой в тексте:
Цитата :
Баллистическая экспертиза была проведена по шкале VBL. V50BL
То есть речь о калибре оружия.
"VBL. V50BL" форматируется и читается как "V B L. V 50 бАйт L".
Как закоментировать подмену "B" на "байт"?

Простите, помню в коментах было про байты, но запамятовал в каком словаре это. Подскажите?
Спасибо.
P.S.
Может есть специальный словарь коррекции по оружейной и военной тематике?
P.P.S.
Как расставлять приоритеты словарей коррекции?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Дек 26 2010, 15:13
Вс Дек 26 2010, 15:13

V 50 это ошибка словаря, мы ее исправим, спасибо
а байты у вас меняет словарь "Си", чтобы посмотреть какое именно правило изменяет текст надо подключить словарь и нажать Ctrl+J или настройки-коррекция произношения-статистика замен в балаболке или Ctrl+J или сервис-показать примененные правила в демагоге
комментарий в ini словарях это символ решетка # в начале строки

Rus пишет:
Сам не пойму. Примерно с середины книги Алёнка стала читать как "пятьдесят хэ".
возможно вместо кириллицы там стоит латинский икс тогда замена просто не сработает, это пока что в словаре не предусмотрено

Rus пишет:
Может есть специальный словарь коррекции по оружейной и военной тематике?
такого увы здесь нету, если сделаете и поделитесь то будет Smile

Rus пишет:
Как расставлять приоритеты словарей коррекции?
если под приоритетным имеется ввиду тот который сработает раньше то приоритетные всегда ini потом dic
среди одинаковых ini приоритетный тот словарь который выше по списку
внутри одного ini словаря приоритетное правило то которое идет раньше
среди dic словарей там не все просто, есть два варианта обработки правил по словарю этого формата - быстрый и обычный
в обычном, если я правильно помню, играет роль только длина правила, т.е. чем правило длиннее тем раньше оно будет применено к тексту, порядок роли не играет, а про быстрый детально написано тут.

также советую почитать внимательно аленкин топик про словари, много вопросов отпадет Wink

Вернуться к началу Перейти вниз
Rus
Новичок


Сообщений : 12
Репутация : 3

 Rus :: Вт Дек 28 2010, 13:35
Вт Дек 28 2010, 13:35

evilone_,
Спасибо.
Действительно, много вопросов отпало.
Видимо в ручную стоит переименовывать файлы словарей, в случаи необходимости.
evilone_ пишет:
такого увы здесь нету, если сделаете и поделитесь то будет Smile
Спасибо за предложение.
Пока ну никак развернуто не освою синтаксис словарей и лексикона. Sad
Есть конечно задумки, хотя бы аббревиатуры военные озвучить. Буду их думать, как говорится. Smile
..
Тут вот столкнулся со словом США. Аленка прочитала как сша, вместо СэШэА. Причем, букву эС почти не различить, просто коротко ША. Как это лечить, можно на примере?

Вернуться к началу Перейти вниз
sharo
Интересующийся


Сообщений : 5
Репутация : 0

 sharo :: Вт Дек 28 2010, 14:43
Вт Дек 28 2010, 14:43

Здравствуйте.Помогите, пожалуйста, разобраться.

при установке "лексикона трудночитаемых слов "

произошла ЗАМЕНА файла этого лексикона на скачанный,
т.е. УДАЛИЛСЯ старый файл:

соответственно, возникли вопросы:

  1. Где можно скачать старый файл?
  2. Как все же правильно дополнить этот старый основной лексикон?
  3. Нужно ли копировать два других словаря "пунктуация" и "омограф" в папку "User Lexicons" как это показано на снимке?
Спасибо.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Дек 28 2010, 23:11
Вт Дек 28 2010, 23:11

Rus пишет:
Как это лечить, можно на примере?
можно вот так, как вариант:
Код:
США    #s I S E1 A1
для сложных слов внутри транскрипции можно вставлять длинные или короткие разрывы (паузы) иногда помогает лучше подобрать звучание
короткая пауза для аленки символ восклицательного знака "?"
длинная символ подчеркивания "_"
тогда можно вот так:
Код:
США    #s E1 _ S E1 _ A1
или так
Код:
США    #s E1 ? S E1 ? A1
или просто заменив сам текст словарем замен
Код:
США=сэ-шэ-а
вариантов много, кому как проще

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Дек 28 2010, 23:22
Вт Дек 28 2010, 23:22

sharo пишет:
Где можно скачать старый файл?
если имеется в виду "старый" который при первой установке голоса, то он пустой изначально, т.е. его размер равен нулю
на картинке изображено просто для наглядности, размер там совсем другой Smile

sharo пишет:
Как все же правильно дополнить этот старый основной лексикон?
дополнить лексикон можно импортировав в него список новых слов, это как правило текстовый файл формата:
Код:
слово{tab}транскрипция{tab}часть_речи
где {tab} - символ табуляции

sharo пишет:
Нужно ли копировать два других словаря "пунктуация" и "омограф" в папку "User Lexicons" как это показано на снимке?
это не обязательно, главное чтобы они были подключены через lexicon-manager как показано на других картинках, а где именно они будут не важно

Вернуться к началу Перейти вниз
sharo
Интересующийся


Сообщений : 5
Репутация : 0

 sharo :: Ср Дек 29 2010, 00:07
Ср Дек 29 2010, 00:07

Спасибо, evilone.

Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Чт Фев 24 2011, 22:21
Чт Фев 24 2011, 22:21

В фразе:
меня начало мутить
пытаюсь поставить правильное ударение (нАчало), однако словарь омографов выдаёт только варианты: начАло и началО.
Просьба добавить в словарь третий вариант: нАчало

Вернуться к началу Перейти вниз
t64y
Новичок
avatar


Сообщений : 15
Репутация : 4

 t64y :: Чт Мар 24 2011, 16:27
Чт Мар 24 2011, 16:27

Добрый день.
Просьба подсказать порядок использования /подключения/ словарей , в Балаболке, для подготовки файла к чтению.
Точнее "Ё-фицирование".
До проверки "omograph", после. или можно одновременно.
И огромное спасибо всем, кто продвигает этот проект дальше.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Чт Мар 24 2011, 18:58
Чт Мар 24 2011, 18:58

порядок использования /подключения/ словарей это не одно и тоже
словари *.dic нельзя упорядочить, они сами упорядочиваются, и не всегда так как бы этого хотелось Smile, их можно только подключить одновременно или последовательно по очереди за несколько проходов
порядок подключения важен только для *.ini\*.rex словарей - тот который выше тот первый

t64y пишет:
Точнее "Ё-фицирование".
До проверки "omograph", после. или можно одновременно.
единственное что может произойти - в словаре омографов могут быть замены для слов без буквы ё и лучше ее (простановку ё) делать после, а так без разницы
самый обычный порядок (за один раз) это:
1. корректор
2. омограф
3. пользовательский словарь

Вернуться к началу Перейти вниз
t64y
Новичок
avatar


Сообщений : 15
Репутация : 4

 t64y :: Чт Мар 24 2011, 20:56
Чт Мар 24 2011, 20:56

Спасибо.
Не заходил на форум года два - помню, что где-то уже читал, но не был уверен в последовательности подключения ...поискал по веткам, а они разрослись, не нашёл.
"Ё"шкой не пользовался - опыт первых словарей оставил не лучше впечатление.
Сейчас сравнил - поставил архивный словарь /словари/ и новый /новые/ .
Молодцы, или молодец /лично ВАМ evilone_ пусть другие не обижаются им тоже огромное спасибо./- разница ... ну очень заметна.
Для чистоты эксперимента записал "Второе правило волшебника" и сравнил с озвучкой Натальи Королевой /не профессионал но голос живой/
и " Мессия Дюны " исполнитель - Солоха Людмила , на мой взгляд или слух АЛЕНКА с новыми словарями лучше, живей и эмоциональней.
Не - Андриенко, конечно, но ... очень даже.
Ещё раз спасибо.




Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Пт Мар 25 2011, 11:53
Пт Мар 25 2011, 11:53

Фраза:
на любой вкус

Словарь омонимов выдаёт два варианта:
любОй и любОй

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пт Мар 25 2011, 17:24
Пт Мар 25 2011, 17:24

Ellie, исправим, спасибо
кстати а "гибридом" кто-то пользуется? обновлять или пусть для примера будет?

Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Сб Мар 26 2011, 20:24
Сб Мар 26 2011, 20:24

Лиз всегда планировала свои сроки не год вперёд.
Словарь выдаёт:
планировАла
планИровала

В русском языке существует слово "планировАла"?

Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Сб Мар 26 2011, 20:43
Сб Мар 26 2011, 20:43

малышкЕ
малЫшке

своЕго
своегО


Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Вс Мар 27 2011, 11:37
Вс Мар 27 2011, 11:37

Кожу Лиз начало покалывать.
Словарь:
начАло
началО

отсутствует слово нАчало

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Мар 27 2011, 17:38
Вс Мар 27 2011, 17:38

Ellie пишет:
В русском языке существует слово "планировАла"?
да, там много еще чего фантастического есть rulzz его нужно чистить, там почти половину всего можно смело убрать
ручным поиском занимаются единицы (не все готовы тратить половину дня на разметку одной книги), и этот словарь не сильно интересен сейчас

p.s. а на́чало и лю́бой добавлены еще вчера, обновите свой словарь

Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Вс Мар 27 2011, 21:06
Вс Мар 27 2011, 21:06

evilone_ пишет:
ручным поиском занимаются единицы (не все готовы тратить половину дня на разметку одной книги)
Я занимаюсь, так как мне проще один раз подготовить текст так как надо и записать его, чем потом отлавливать ошибки и перезаписывать заново.

evilone_ пишет:
p.s. а на́чало и лю́бой добавлены еще вчера, обновите свой словарь
Спасибо, обновлю.

Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Вс Мар 27 2011, 21:46
Вс Мар 27 2011, 21:46

Поймав на лету печенье, Джошуа сунул его в рот.

Словарь выдаёт:
лЕту
лЁту

Хотелось бы ещё, чтобы было слово летУ

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Мар 27 2011, 23:08
Вс Мар 27 2011, 23:08

Ellie пишет:
Хотелось бы ещё, чтобы было слово летУ
добавим, только нужно будет еще и лексикон обновить, потому что лету́ там нет сейчас, спасибо
Ellie пишет:
Я занимаюсь, так как мне проще один раз подготовить текст так как надо и записать его, чем потом отлавливать ошибки и перезаписывать заново.
а сколько это занимает у вас времени на одну книгу среднего размера, и составляете ли вы потом по размеченному тексту словарь?

Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Пн Мар 28 2011, 12:06
Пн Мар 28 2011, 12:06

evilone_ пишет:
а сколько это занимает у вас времени на одну книгу среднего размера
Я не считала, но, наверное где-то полдня и занимает. Хотя с каждой последующей книгой получается быстрее.

evilone_ пишет:
составляете ли вы потом по размеченному тексту словарь
Не совсем поняла вопрос. Пока что я добавляю неправильно читаемые слова в отдельный лексикон. В основном, имена собственые. Также добавляю некоторые омографы. Возможно, в будущем придётся заняться составлением словарей по той или иной тематике. Как только такая необходимость возникнет, сразу займусь.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Вс Апр 01 2012, 04:45
Вс Апр 01 2012, 04:45

Пояснения к новым обновлениям:
полностью переработан и значительно расширен Лексикон "трудночитаемых" слов, с учетом всех замечаний и дополнений.
Тем кто захочет импортировать эти транскрипции в свой личный лексикон, есть текстовый файл со списком трудных слов
В списке много словоформ - импорт будет очень долгим! Наберитесь терпения.Wink

Вернуться к началу Перейти вниз
z652z
Интересующийся
avatar


Сообщений : 7
Репутация : 1

 z652z :: Вс Апр 29 2012, 23:41
Вс Апр 29 2012, 23:41

На мой взгляд, представленный здесь словарь Алёны не только не полезен, а даже вреден. Его объём убеждает, что составить словарь самостоятельно или хотя бы перепроверить физически невозможно. К тому же в нём много ошибок и огромное количество мусора. По-моему, на качество голоса словарь Алёны влияет гораздо сильнее, чем словарь омографов. Поэтому я начал набивать словарь с нуля вручную. Сейчас проверил 33000 слов (словоформ?), в словарь добавил 5200 слов, из них 40% ошибочных слов, остальные - слова с исправленной интонацией. Результат обнадёживает. Голос стал значительно ровнее, ошибок гораздо меньше, чем со словарём с сайта. Буду продолжать дальше. Если не свихнусь. Потом надо будет заняться словарём замен, не увеличивать его, а сократить до 3-5 тысяч, по количеству наиболее часто встречающихся омографов. И сам словарь омографов довести до ума. То, что лежит на сайте, не ахти. Если не помру - поделюсь.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пн Апр 30 2012, 02:53
Пн Апр 30 2012, 02:53

z652z пишет:
слова с исправленной интонацией.
Не тешьте себя иллюзиями и не вводите новичков в заблуждение - интонацию движка могут исправить лишь разработчики.
Так много мусора? Э... вообще-то это труднопроизносимые слова - без лексикона Алёна произнесёт их "аправильно". Вы можете с легкостью в этом убедиться, проверив слово "неправильное".
z652z пишет:
Голос стал значительно ровнее, ошибок гораздо меньше
Это всё субъективно!
Каждый волен делать свои доп. лексиконы (у меня их к примеру 5). Для начинающих, форумских материалов достаточно.

Вернуться к началу Перейти вниз
z652z
Интересующийся
avatar


Сообщений : 7
Репутация : 1

 z652z :: Пн Апр 30 2012, 10:55
Пн Апр 30 2012, 10:55

Под исправлениями интонации я понимал изменения типа:

g @ s p V d' i1 n - g @ s p V d' i2 n

s t r A1 nn @ $ - s t r A nn @ $

В тексте подобные слова выбиваются из общего ряда, голос получается неровный, с хрипами, взвизгами и т.д. Исправления простейшие, но именно они оказывают решающее значение на звучание голоса. К сожалению, таких слов - море разливанное, чтобы полностью вылизать словарь необходимо исправить примерно каждое третье слово, а это................... Да и не все слова удаётся исправить, к сожалению, тандем алёна-балаболка работает не идеально. Повторюсь - впервые за три года работы с балаболкой появился ощутимый результат.

Вернуться к началу Перейти вниз
z652z
Интересующийся
avatar


Сообщений : 7
Репутация : 1

 z652z :: Пн Апр 30 2012, 11:23
Пн Апр 30 2012, 11:23

Кстати о лексиконе труднопроизносимых слов. Помнится я делал сравнение списка слов из словаря со словами из взятых наугад книг. Результат меня поразил - пересечений нашлось очень мало.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пн Апр 30 2012, 12:35
Пн Апр 30 2012, 12:35

z652z пишет:
Результат меня поразил - пересечений нашлось очень мало.
Подчёркиваю, можете делать сколько угодно лексиконов для себя лично.
Ваша критика неконструктивна!

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пн Апр 30 2012, 13:12
Пн Апр 30 2012, 13:12

хм, а мне нравится как аленка произносит
Код:
#g @ s p V d' i1 n
rulzz

z652z пишет:
из них 40% ошибочных слов
а могли бы вы привести пример ошибочных слов штук 10-20 для понимания?

z652z пишет:
Его объём убеждает, что составить словарь самостоятельно или хотя бы перепроверить физически невозможно.
все возможно, было бы желание
"мусора" в нем возможно и много в том смысле что есть слова которые встречаются редко но что касается ошибок то лучше с лексиконом чем без него

неточности вида 1→2 1→0 в ударении слов это, как уже сказал evmir1, не ошибки. они субъективны, каждому слышится лучше свой вариант
мне, например, вообще кажется что многие транскрипции можно сделать намного лучше по звучанию, но для того чтобы переделать все нужно много терпения
хотя, как правило, лень побеждает :saint:

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пн Апр 30 2012, 19:42
Пн Апр 30 2012, 19:42

z652z пишет:
Помнится я делал сравнение списка слов из словаря со словами из взятых наугад книг. Результат меня поразил - пересечений нашлось очень мало.
вот не знаю я как вы там делали сравнение но вот что у меня получилось, к примеру, для книги Д. Браун "Код да Винчи"
Спойлер:
 
это только по лексикону "трудночитаемых" слов - чуть больше 4% это не так и мало, без учета повторов слов в тексте, т.е. только уникальные слова fish

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Ср Май 30 2012, 15:16
Ср Май 30 2012, 15:16

frt пишет:
Аленка неправильно читает "22 КГц" и "тембр голосА".
В словаре замен добавьте 2 правила:
22 КГц=22 килогерц
тембр голоса=тембр гОлоса

Большинство делает доп. лексиконы\словари для себя. На форуме выложен необходимый минимум.

Вернуться к началу Перейти вниз
frt
Интересующийся


Сообщений : 7
Репутация : 0

 frt :: Вс Июн 03 2012, 20:45
Вс Июн 03 2012, 20:45

Сорри, 22 КГц читает правильно с Си словарем, а вот "тембр гОлоса" пришлось добавить
У меня такой вопрос вот я хочу, чтобы "флеш" читалась как "# f l E S". Я добавляю это в лексикон. Как мне теперь сделать, чтобы все слова, начинающиеся на "флеш", читались как "# f l E S" (т.е. флешка, флешками, флешмоб и т.д.)?

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Вс Июн 03 2012, 23:02
Вс Июн 03 2012, 23:02

frt пишет:
чтобы все слова, начинающиеся на "флеш", читались как "# f l E S" (т.е. флешка, флешками, флешмоб и т.д.)?
Каждое такое слово в лексикон. Долго?Smile Поэтому и делаются свои лексы.

Вернуться к началу Перейти вниз
frt
Интересующийся


Сообщений : 7
Репутация : 0

 frt :: Пн Июн 04 2012, 11:52
Пн Июн 04 2012, 11:52

Так я создал уже свой лексикон, даже поставил его на первое место, но правильно читается только то, что я добавляю, а не все возможные производные от слова...

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пн Июн 04 2012, 23:08
Пн Июн 04 2012, 23:08

frt пишет:
но правильно читается только то, что я добавляю, а не все возможные производные от слова...
Именно - верно будут произноситься лишь добавленные слова.
Все производные от слова (словоформы) во всех падежах нужно добавить в лексикон:
Спойлер:
 













Вернуться к началу Перейти вниз
frt
Интересующийся


Сообщений : 7
Репутация : 0

 frt :: Ср Июн 06 2012, 21:55
Ср Июн 06 2012, 21:55

Ок. Возвращаясь к моему первому вопросу про «тембр гОлоса». По-хорошему надо добавить правило, что если перед словом «гОлоса» стоит существительное, то ударение на первый слог. Возможно ли это сделать? Опять же Nicolai Speech Cube определяет часть речи (и число, если это прилагательное) перед словом «гОлоса» и правильно делает ударение.

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Чт Июн 07 2012, 00:11
Чт Июн 07 2012, 00:11

frt пишет:
По-хорошему надо добавить правило, что если перед словом «гОлоса» стоит существительное, то ударение на первый слог.
По-моему, не факт. Например: услышал(-а, -и) мужчина (женщина, люди и т.п.) голосА... (тут может быть любой текст - голосА их; голосА, идущие сверху и т.п.)

Вернуться к началу Перейти вниз
frt
Интересующийся


Сообщений : 7
Репутация : 0

 frt :: Чт Июн 07 2012, 02:24
Чт Июн 07 2012, 02:24

Да, русский язык позволяет нарушать это правило, но согласитесь, такие конструкции встречаются гораздо реже (и Nicolai ваш пример читает неправильно). Есть ли читалки, позволяющие строить правила на уровне частей речи?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пт Июн 08 2012, 20:32
Пт Июн 08 2012, 20:32

frt, вам нужно просто сделать разметку текста с омографами - указать ударение где го́лоса а где голоса́
frt пишет:
По-хорошему надо добавить правило, что если перед словом «гОлоса» стоит существительное, то ударение на первый слог. Возможно ли это сделать?
такое умеет делать Cognitive Dwarf Shell
frt пишет:
Как мне теперь сделать, чтобы все слова, начинающиеся на "флеш", читались как "# f l E S" (т.е. флешка, флешками, флешмоб и т.д.)?
да, нужно добавлять вручную в лексикон все словоформы
можно воспользоваться лемматизатором + транскриптором для быстрого построения всего списка и потом добавить его в лексикон

Вернуться к началу Перейти вниз
cve133
Наблюдатель


Сообщений : 2
Репутация : 1

 cve133 :: Пн Июл 23 2012, 20:41
Пн Июл 23 2012, 20:41

подскажите пожалуйста почему Алена говорит знак тире, после подключения лексиконов?

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Пн Июл 23 2012, 21:49
Пн Июл 23 2012, 21:49

cve133 пишет:
почему Алена говорит знак тире, после подключения лексиконов?
Скачайте и подключите 1-м по приоритету _punctuation.dic - лексикон для запрета чтения разделительных знаков.

Вернуться к началу Перейти вниз
Darlock
Интересующийся


Сообщений : 5
Репутация : 1

 Darlock :: Чт Сен 20 2012, 15:15
Чт Сен 20 2012, 15:15

Если я использую программу MP3book2005, то мне следует подключить только три лексикона? Можно как-нибудь улучшить качество озвучки с этой программой? Может кто-нибудь напишет об особенностях использования MP3book2005 с Алёной?

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Чт Сен 20 2012, 19:53
Чт Сен 20 2012, 19:53

Darlock пишет:
Может кто-нибудь напишет об особенностях использования MP3book2005 с Алёной?
MP3book2005 хорошая программа - автор постарался!
Там в основном голос Николая; автор с пользователями сделали приличный словарь.
Об особенностях с Алёной не уверен, обратитесь к В. Шойтов-Харитановскому напрямую на его сайте.

Вернуться к началу Перейти вниз
psb
Наблюдатель


Сообщений : 1
Репутация : 0

 psb :: Вс Сен 30 2012, 13:06
Вс Сен 30 2012, 13:06

вышел в свет голос Алёны для Андроида... там имеется возможность подключить свой словарь с именем: user.userdico
но он практически пустой вот его содержимое:

Код:
EMPTY USER LEXICON
P#DIC#IGNORE   13   #_-
P#DIC#PUNCT      13   #?./+=:;,~\$()[]{}!*@&'

подскажите, в каком формате добавлять слова ?

Вернуться к началу Перейти вниз
Dekabrus
Участник


Сообщений : 61
Репутация : 3

 Dekabrus :: Ср Окт 03 2012, 21:37
Ср Окт 03 2012, 21:37

evmir_troll-hunter пишет:

Извините. Не нашел, как загрузить словарь со словами, добавленными вручную.

Проблема:

Набил вручную в базовый словарь кучу слов по военной тематике.
Понадобилось переустановить виндевс.
Скопировал словарь в " Текстовый документ.

Как из " Текстового документа загрузить расширенный словарь обратно в Лексикон Менеджер?

Вернуться к началу Перейти вниз
Dekabrus
Участник


Сообщений : 61
Репутация : 3

 Dekabrus :: Ср Окт 03 2012, 21:48
Ср Окт 03 2012, 21:48

Базовый словарь находится в таком виде:

Цитата :
щ?ю??еб?
ъб??Пб?T¤б?I№б?~Ћб?oџб?ћnб?Џ?б?©Yб?Я/б?у?б?е?б??йа??ъа?<На?'Ца?TҐа?Iёа?`‘а

Скопированный словарь имеет обычный читаемый вид:

Цитата :
пике # p' i k' e1

полках # p V l k A1 x

полку # p V l k u1

полувоенный # p @ l U v V e1 n n I j

провода # p r @ v V d A1

проводами # p r @ v V d A1 m' $

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Чт Окт 04 2012, 02:57
Чт Окт 04 2012, 02:57

Dekabrus пишет:
Как из " Текстового документа загрузить расширенный словарь обратно в Лексикон Менеджер?[...]Базовый словарь находится в таком виде:
Словарь для движка называется лексикон; хоть и имеет расширение .dic но является зашифрованным и нечитаемым для других редакторов!
Работать с лексиконами можно лишь в Lexicon Manager.
Чтобы "скопировать словарь в Текстовый документ", Вы должны были экспортировать содержимое данного лекса через меню Файл\Экспорт лексикона.
Чтобы добавить слова из .txt нужно наоборот импортировать их в лексикон - Файл\Импорт лексикона.
Процесс импорта намного дольше экспорта, если слов много, то лучше создать новый лекс, импортировать туда, сохранить и подключить.
Меня смущает вид Вашего списка - должны быть 3 части разделённые табуляцией; слово, транскрипция, грамматический атрибут. Вот так:
пике # p' i k' e1 NOUN
полках # p V l k A1 x NOUN
полку # p V l k u1 NOUN
полувоенный # p @ l U v V e1 n n I j ADJECTIVE
провода # p r @ v V d A1 NOUN
проводами # p r @ v V d A1 m' $ NOUN

Также позвольте заметить, что почти все слова из Вашего примера считаются омографами (с двойным ударением и значением). Они прописаны в спецлексиконе "Лексикон для словаря замен[omograph_lex]


Вернуться к началу Перейти вниз
Dekabrus
Участник


Сообщений : 61
Репутация : 3

 Dekabrus :: Чт Окт 04 2012, 12:25
Чт Окт 04 2012, 12:25

evmir_troll-hunter пишет:
Меня смущает вид Вашего списка - должны быть 3 части разделённые табуляцией; слово, транскрипция, грамматический атрибут. Вот так:
пике # p' i k' e1 NOUN

так и есть:

Цитата :
авантюр #V v V n' t' U2 r NOUN
аварийной #V v V r' i j n I j ADJECTIVE
аварийную #V v V r' i j n U Y ADJECTIVE
evmir_troll-hunter пишет:
Также позвольте заметить, что почти все слова из Вашего примера считаются омографами (с двойным ударением и значением). Они прописаны в спецлексиконе "Лексикон для словаря замен[omograph_lex]

И мне следует удалить ненужный вариант слова?

Вернуться к началу Перейти вниз
Dekabrus
Участник


Сообщений : 61
Репутация : 3

 Dekabrus :: Чт Окт 04 2012, 12:33
Чт Окт 04 2012, 12:33

Вопрос по конкретному слову.

не было #n' e1 b 1 l @

в Лексиконе читает правильно ( с ударением на "не")

В балаболке читает с ударением на "ы".

можно ли это исправить?

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 627
Репутация : 208

 evmir_troll-hunter :: Чт Окт 04 2012, 13:34
Чт Окт 04 2012, 13:34

Dekabrus пишет:
И мне следует удалить ненужный вариант слова?
Ни в коем случае!Smile Кроме лексиконов есть т.н. словари замен, они не зашифрованы и содержат правила для замены текста. Скачайте Словарь замены ударений [omograph], откройте его в Блокноте и вставьте доп. правила:
$пике=пикЕ
$полках=полкАх
$полку=полкУ
$провода=проводА
$проводами=проводАми


Dekabrus пишет:
Вопрос по конкретному слову: не было
В словарь замен вставьте:
не было=нЕбыло
а в Лексикон для словаря замен, (про который я говорил ранее) добавьте транскрипцию:
нЕбыло #n' e1 b 1 l @ VERB
И вообще, все предпочтительные варианты омографов прописываются пользователем именно в словарях замен.
Что это такое, как их подключить, как изменить текст и т.д. подробно описано тут
Изучайте, удачи.

Вернуться к началу Перейти вниз
Dekabrus
Участник


Сообщений : 61
Репутация : 3

 Dekabrus :: Чт Окт 04 2012, 14:57
Чт Окт 04 2012, 14:57

evmir_troll-hunter пишет:
Что это такое, как их подключить, как изменить текст и т.д. подробно описано тут
Изучайте, удачи.

Пока всё понял. Спасибо.

Вернуться к началу Перейти вниз
asgard
Новичок


Сообщений : 23
Репутация : 1

 asgard :: Пт Окт 05 2012, 12:22
Пт Окт 05 2012, 12:22

Пользуюсь Балаболкой с голосовым движком Алёна. При чтении не реагирует на запятые, хотя все остальные знаки препинания работают нормально. Никаким регулировкам не поддаётся. В SpeechPad запятую читает. Возможно проблема в самой балаболке. Подскажите в чём может быть причина?

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

Обсуждение словарей

Предыдущая тема Следующая тема Вернуться к началу
Обсуждение словарей
Страница 7 из 9Страница 7 из 9На страницу : Предыдущий  1, 2, 3, 4, 5, 6, 7, 8, 9  Следующий
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении