|
|
Автор | Сообщение | Обсуждение словарей |
---|
Rus Новичок
Сообщений : 12
| Rus | :: Вс Дек 26 2010, 09:53 | Вс Дек 26 2010, 09:53 | |
| evilone_, Ага, ясно. - evilone_ пишет:
- с пробелом? а разве словарь их не меняет? у меня например "50- х" заменяется на "пятидесятых" и т.д.
Сам не пойму. Примерно с середины книги Алёнка стала читать как "пятьдесят хэ". Там где без пробела все прочитала окей. Сейчас с этим словарем из темы проверил,окей стало. В настройках балаблки установил Правила вместо "Комбинированный метод", "Абзацами". Тре-х, пяты-й, 2-й, 2-х и тд обычно пишутся словами, с этим имхо окей.
Осталась не ясность, например с аббревиатурой в тексте: - Цитата :
- Баллистическая экспертиза была проведена по шкале VBL. V50BL
То есть речь о калибре оружия. "VBL. V50BL" форматируется и читается как "V B L. V 50 бАйт L". Как закоментировать подмену "B" на "байт"?
Простите, помню в коментах было про байты, но запамятовал в каком словаре это. Подскажите? Спасибо. P.S. Может есть специальный словарь коррекции по оружейной и военной тематике? P.P.S. Как расставлять приоритеты словарей коррекции? |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Дек 26 2010, 15:13 | Вс Дек 26 2010, 15:13 | |
| V 50 это ошибка словаря, мы ее исправим, спасибо а байты у вас меняет словарь "Си", чтобы посмотреть какое именно правило изменяет текст надо подключить словарь и нажать Ctrl+J или настройки-коррекция произношения-статистика замен в балаболке или Ctrl+J или сервис-показать примененные правила в демагоге комментарий в ini словарях это символ решетка # в начале строки
- Rus пишет:
- Сам не пойму. Примерно с середины книги Алёнка стала читать как "пятьдесят хэ".
возможно вместо кириллицы там стоит латинский икс тогда замена просто не сработает, это пока что в словаре не предусмотрено
- Rus пишет:
- Может есть специальный словарь коррекции по оружейной и военной тематике?
такого увы здесь нету, если сделаете и поделитесь то будет
- Rus пишет:
- Как расставлять приоритеты словарей коррекции?
если под приоритетным имеется ввиду тот который сработает раньше то приоритетные всегда ini потом dic среди одинаковых ini приоритетный тот словарь который выше по списку внутри одного ini словаря приоритетное правило то которое идет раньше среди dic словарей там не все просто, есть два варианта обработки правил по словарю этого формата - быстрый и обычный в обычном, если я правильно помню, играет роль только длина правила, т.е. чем правило длиннее тем раньше оно будет применено к тексту, порядок роли не играет, а про быстрый детально написано тут.
также советую почитать внимательно аленкин топик про словари, много вопросов отпадет |
|
|
| |
Rus Новичок
Сообщений : 12
Репутация : 3
| Rus | :: Вт Дек 28 2010, 13:35 | Вт Дек 28 2010, 13:35 | |
| evilone_, Спасибо. Действительно, много вопросов отпало. Видимо в ручную стоит переименовывать файлы словарей, в случаи необходимости.
- evilone_ пишет:
- такого увы здесь нету, если сделаете и поделитесь то будет Smile
Спасибо за предложение. Пока ну никак развернуто не освою синтаксис словарей и лексикона. Есть конечно задумки, хотя бы аббревиатуры военные озвучить. Буду их думать, как говорится. .. Тут вот столкнулся со словом США. Аленка прочитала как сша, вместо СэШэА. Причем, букву эС почти не различить, просто коротко ША. Как это лечить, можно на примере?
|
|
|
| |
sharo Интересующийся
Сообщений : 5
Репутация : 0
| sharo | :: Вт Дек 28 2010, 14:43 | Вт Дек 28 2010, 14:43 | |
| Здравствуйте.Помогите, пожалуйста, разобраться.
при установке "лексикона трудночитаемых слов "
произошла ЗАМЕНА файла этого лексикона на скачанный, т.е. УДАЛИЛСЯ старый файл:
соответственно, возникли вопросы:
- Где можно скачать старый файл?
- Как все же правильно дополнить этот старый основной лексикон?
- Нужно ли копировать два других словаря "пунктуация" и "омограф" в папку "User Lexicons" как это показано на снимке?
Спасибо.
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Дек 28 2010, 23:11 | Вт Дек 28 2010, 23:11 | |
| - Rus пишет:
- Как это лечить, можно на примере?
можно вот так, как вариант: - Код:
-
США #s I S E1 A1 для сложных слов внутри транскрипции можно вставлять длинные или короткие разрывы (паузы) иногда помогает лучше подобрать звучание короткая пауза для аленки символ восклицательного знака "?" длинная символ подчеркивания "_" тогда можно вот так: - Код:
-
США #s E1 _ S E1 _ A1 или так - Код:
-
США #s E1 ? S E1 ? A1 или просто заменив сам текст словарем замен - Код:
-
США=сэ-шэ-а вариантов много, кому как проще |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Дек 28 2010, 23:22 | Вт Дек 28 2010, 23:22 | |
| - sharo пишет:
- Где можно скачать старый файл?
если имеется в виду "старый" который при первой установке голоса, то он пустой изначально, т.е. его размер равен нулю на картинке изображено просто для наглядности, размер там совсем другой
- sharo пишет:
- Как все же правильно дополнить этот старый основной лексикон?
дополнить лексикон можно импортировав в него список новых слов, это как правило текстовый файл формата: - Код:
-
слово{tab}транскрипция{tab}часть_речи где {tab} - символ табуляции
- sharo пишет:
- Нужно ли копировать два других словаря "пунктуация" и "омограф" в папку "User Lexicons" как это показано на снимке?
это не обязательно, главное чтобы они были подключены через lexicon-manager как показано на других картинках, а где именно они будут не важно |
|
|
| |
sharo Интересующийся
Сообщений : 5
Репутация : 0
| sharo | :: Ср Дек 29 2010, 00:07 | Ср Дек 29 2010, 00:07 | |
| Спасибо, evilone. |
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Чт Фев 24 2011, 22:21 | Чт Фев 24 2011, 22:21 | |
| В фразе: меня начало мутить пытаюсь поставить правильное ударение (нАчало), однако словарь омографов выдаёт только варианты: начАло и началО. Просьба добавить в словарь третий вариант: нАчало |
|
|
| |
t64y Новичок
Сообщений : 15
Репутация : 4
| t64y | :: Чт Мар 24 2011, 16:27 | Чт Мар 24 2011, 16:27 | |
| Добрый день. Просьба подсказать порядок использования /подключения/ словарей , в Балаболке, для подготовки файла к чтению. Точнее "Ё-фицирование". До проверки "omograph", после. или можно одновременно. И огромное спасибо всем, кто продвигает этот проект дальше. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
t64y Новичок
Сообщений : 15
Репутация : 4
| t64y | :: Чт Мар 24 2011, 20:56 | Чт Мар 24 2011, 20:56 | |
| Спасибо. Не заходил на форум года два - помню, что где-то уже читал, но не был уверен в последовательности подключения ...поискал по веткам, а они разрослись, не нашёл. "Ё"шкой не пользовался - опыт первых словарей оставил не лучше впечатление. Сейчас сравнил - поставил архивный словарь /словари/ и новый /новые/ . Молодцы, или молодец /лично ВАМ evilone_ пусть другие не обижаются им тоже огромное спасибо./- разница ... ну очень заметна. Для чистоты эксперимента записал "Второе правило волшебника" и сравнил с озвучкой Натальи Королевой /не профессионал но голос живой/ и " Мессия Дюны " исполнитель - Солоха Людмила , на мой взгляд или слух АЛЕНКА с новыми словарями лучше, живей и эмоциональней. Не - Андриенко, конечно, но ... очень даже. Ещё раз спасибо.
|
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Пт Мар 25 2011, 11:53 | Пт Мар 25 2011, 11:53 | |
| Фраза: на любой вкус
Словарь омонимов выдаёт два варианта: любОй и любОй
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Мар 25 2011, 17:24 | Пт Мар 25 2011, 17:24 | |
| Ellie, исправим, спасибо кстати а "гибридом" кто-то пользуется? обновлять или пусть для примера будет? |
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Сб Мар 26 2011, 20:24 | Сб Мар 26 2011, 20:24 | |
| Лиз всегда планировала свои сроки не год вперёд. Словарь выдаёт: планировАла планИровала
В русском языке существует слово "планировАла"? |
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Сб Мар 26 2011, 20:43 | Сб Мар 26 2011, 20:43 | |
| малышкЕ малЫшке
своЕго своегО
|
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Вс Мар 27 2011, 11:37 | Вс Мар 27 2011, 11:37 | |
| Кожу Лиз начало покалывать. Словарь: начАло началО
отсутствует слово нАчало |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Мар 27 2011, 17:38 | Вс Мар 27 2011, 17:38 | |
| - Ellie пишет:
- В русском языке существует слово "планировАла"?
да, там много еще чего фантастического есть его нужно чистить, там почти половину всего можно смело убрать ручным поиском занимаются единицы (не все готовы тратить половину дня на разметку одной книги), и этот словарь не сильно интересен сейчас
p.s. а на́чало и лю́бой добавлены еще вчера, обновите свой словарь |
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Вс Мар 27 2011, 21:06 | Вс Мар 27 2011, 21:06 | |
| - evilone_ пишет:
- ручным поиском занимаются единицы (не все готовы тратить половину дня на разметку одной книги)
Я занимаюсь, так как мне проще один раз подготовить текст так как надо и записать его, чем потом отлавливать ошибки и перезаписывать заново.
- evilone_ пишет:
- p.s. а на́чало и лю́бой добавлены еще вчера, обновите свой словарь
Спасибо, обновлю. |
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Вс Мар 27 2011, 21:46 | Вс Мар 27 2011, 21:46 | |
| Поймав на лету печенье, Джошуа сунул его в рот.
Словарь выдаёт: лЕту лЁту
Хотелось бы ещё, чтобы было слово летУ |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Мар 27 2011, 23:08 | Вс Мар 27 2011, 23:08 | |
| - Ellie пишет:
- Хотелось бы ещё, чтобы было слово летУ
добавим, только нужно будет еще и лексикон обновить, потому что лету́ там нет сейчас, спасибо
- Ellie пишет:
- Я занимаюсь, так как мне проще один раз подготовить текст так как надо и записать его, чем потом отлавливать ошибки и перезаписывать заново.
а сколько это занимает у вас времени на одну книгу среднего размера, и составляете ли вы потом по размеченному тексту словарь? |
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Пн Мар 28 2011, 12:06 | Пн Мар 28 2011, 12:06 | |
| - evilone_ пишет:
- а сколько это занимает у вас времени на одну книгу среднего размера
Я не считала, но, наверное где-то полдня и занимает. Хотя с каждой последующей книгой получается быстрее.
- evilone_ пишет:
- составляете ли вы потом по размеченному тексту словарь
Не совсем поняла вопрос. Пока что я добавляю неправильно читаемые слова в отдельный лексикон. В основном, имена собственые. Также добавляю некоторые омографы. Возможно, в будущем придётся заняться составлением словарей по той или иной тематике. Как только такая необходимость возникнет, сразу займусь. |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| |
| |
z652z Интересующийся
Сообщений : 7
Репутация : 1
| z652z | :: Вс Апр 29 2012, 23:41 | Вс Апр 29 2012, 23:41 | |
| На мой взгляд, представленный здесь словарь Алёны не только не полезен, а даже вреден. Его объём убеждает, что составить словарь самостоятельно или хотя бы перепроверить физически невозможно. К тому же в нём много ошибок и огромное количество мусора. По-моему, на качество голоса словарь Алёны влияет гораздо сильнее, чем словарь омографов. Поэтому я начал набивать словарь с нуля вручную. Сейчас проверил 33000 слов (словоформ?), в словарь добавил 5200 слов, из них 40% ошибочных слов, остальные - слова с исправленной интонацией. Результат обнадёживает. Голос стал значительно ровнее, ошибок гораздо меньше, чем со словарём с сайта. Буду продолжать дальше. Если не свихнусь. Потом надо будет заняться словарём замен, не увеличивать его, а сократить до 3-5 тысяч, по количеству наиболее часто встречающихся омографов. И сам словарь омографов довести до ума. То, что лежит на сайте, не ахти. Если не помру - поделюсь. |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Пн Апр 30 2012, 02:53 | Пн Апр 30 2012, 02:53 | |
| - z652z пишет:
- слова с исправленной интонацией.
Не тешьте себя иллюзиями и не вводите новичков в заблуждение - интонацию движка могут исправить лишь разработчики. Так много мусора? Э... вообще-то это труднопроизносимые слова - без лексикона Алёна произнесёт их "аправильно". Вы можете с легкостью в этом убедиться, проверив слово "неправильное".
- z652z пишет:
- Голос стал значительно ровнее, ошибок гораздо меньше
Это всё субъективно! Каждый волен делать свои доп. лексиконы (у меня их к примеру 5). Для начинающих, форумских материалов достаточно. |
|
|
| |
z652z Интересующийся
Сообщений : 7
Репутация : 1
| z652z | :: Пн Апр 30 2012, 10:55 | Пн Апр 30 2012, 10:55 | |
| Под исправлениями интонации я понимал изменения типа:
g @ s p V d' i1 n - g @ s p V d' i2 n
s t r A1 nn @ $ - s t r A nn @ $
В тексте подобные слова выбиваются из общего ряда, голос получается неровный, с хрипами, взвизгами и т.д. Исправления простейшие, но именно они оказывают решающее значение на звучание голоса. К сожалению, таких слов - море разливанное, чтобы полностью вылизать словарь необходимо исправить примерно каждое третье слово, а это................... Да и не все слова удаётся исправить, к сожалению, тандем алёна-балаболка работает не идеально. Повторюсь - впервые за три года работы с балаболкой появился ощутимый результат. |
|
|
| |
z652z Интересующийся
Сообщений : 7
Репутация : 1
| z652z | :: Пн Апр 30 2012, 11:23 | Пн Апр 30 2012, 11:23 | |
| Кстати о лексиконе труднопроизносимых слов. Помнится я делал сравнение списка слов из словаря со словами из взятых наугад книг. Результат меня поразил - пересечений нашлось очень мало. |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Пн Апр 30 2012, 12:35 | Пн Апр 30 2012, 12:35 | |
| - z652z пишет:
- Результат меня поразил - пересечений нашлось очень мало.
Подчёркиваю, можете делать сколько угодно лексиконов для себя лично. Ваша критика неконструктивна! |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пн Апр 30 2012, 13:12 | Пн Апр 30 2012, 13:12 | |
| хм, а мне нравится как аленка произносит - Код:
-
#g @ s p V d' i1 n
- z652z пишет:
- из них 40% ошибочных слов
а могли бы вы привести пример ошибочных слов штук 10-20 для понимания?
- z652z пишет:
- Его объём убеждает, что составить словарь самостоятельно или хотя бы перепроверить физически невозможно.
все возможно, было бы желание "мусора" в нем возможно и много в том смысле что есть слова которые встречаются редко но что касается ошибок то лучше с лексиконом чем без него
неточности вида 1→2 1→0 в ударении слов это, как уже сказал evmir1, не ошибки. они субъективны, каждому слышится лучше свой вариант мне, например, вообще кажется что многие транскрипции можно сделать намного лучше по звучанию, но для того чтобы переделать все нужно много терпения хотя, как правило, лень побеждает
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Ср Май 30 2012, 15:16 | Ср Май 30 2012, 15:16 | |
| - frt пишет:
- Аленка неправильно читает "22 КГц" и "тембр голосА".
В словаре замен добавьте 2 правила: 22 КГц=22 килогерц тембр голоса=тембр гОлоса Большинство делает доп. лексиконы\словари для себя. На форуме выложен необходимый минимум.
|
|
|
| |
frt Интересующийся
Сообщений : 7
Репутация : 0
| frt | :: Вс Июн 03 2012, 20:45 | Вс Июн 03 2012, 20:45 | |
| Сорри, 22 КГц читает правильно с Си словарем, а вот "тембр гОлоса" пришлось добавить У меня такой вопрос вот я хочу, чтобы "флеш" читалась как "# f l E S". Я добавляю это в лексикон. Как мне теперь сделать, чтобы все слова, начинающиеся на "флеш", читались как "# f l E S" (т.е. флешка, флешками, флешмоб и т.д.)? |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| |
| |
frt Интересующийся
Сообщений : 7
Репутация : 0
| frt | :: Пн Июн 04 2012, 11:52 | Пн Июн 04 2012, 11:52 | |
| Так я создал уже свой лексикон, даже поставил его на первое место, но правильно читается только то, что я добавляю, а не все возможные производные от слова... |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Пн Июн 04 2012, 23:08 | Пн Июн 04 2012, 23:08 | |
| - frt пишет:
- но правильно читается только то, что я добавляю, а не все возможные производные от слова...
Именно - верно будут произноситься лишь добавленные слова. Все производные от слова (словоформы) во всех падежах нужно добавить в лексикон:
- Спойлер:
флешек #f l E1 S I k NOUN флешка #f l E1 S k @ NOUN флешкам #f l E1 S k @ m NOUN флешками #f l E1 S k I m' $ NOUN флешках #f l E1 S k @ x NOUN флешке #f l E1 S k' $ NOUN флешки #f l E1 S k' $ NOUN флешкой #f l E1 S k @ j NOUN флешкою #f l E1 S k @ Y NOUN флешку #f l E1 S k U NOUN флешмоб #f l I S m o1 b NOUN флешмоба #f l I S m o1 b @ NOUN флешмобам #f l I S m o1 b @ m NOUN флешмобах #f l I S m o1 b @ x NOUN флешмобе #f l I S m o1 b' $ NOUN флешмобов #f l I S m o1 b @ v NOUN флешмобом #f l I S m o1 b @ m NOUN флешмобу #f l I S m o1 b U NOUN флешмобы #f l I S m o1 b I NOUN и т.д.
|
|
|
| |
frt Интересующийся
Сообщений : 7
Репутация : 0
| frt | :: Ср Июн 06 2012, 21:55 | Ср Июн 06 2012, 21:55 | |
| Ок. Возвращаясь к моему первому вопросу про «тембр гОлоса». По-хорошему надо добавить правило, что если перед словом «гОлоса» стоит существительное, то ударение на первый слог. Возможно ли это сделать? Опять же Nicolai Speech Cube определяет часть речи (и число, если это прилагательное) перед словом «гОлоса» и правильно делает ударение. |
|
|
| |
al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Чт Июн 07 2012, 00:11 | Чт Июн 07 2012, 00:11 | |
| - frt пишет:
- По-хорошему надо добавить правило, что если перед словом «гОлоса» стоит существительное, то ударение на первый слог.
По-моему, не факт. Например: услышал(-а, -и) мужчина (женщина, люди и т.п.) голосА... (тут может быть любой текст - голосА их; голосА, идущие сверху и т.п.) |
|
|
| |
frt Интересующийся
Сообщений : 7
Репутация : 0
| frt | :: Чт Июн 07 2012, 02:24 | Чт Июн 07 2012, 02:24 | |
| Да, русский язык позволяет нарушать это правило, но согласитесь, такие конструкции встречаются гораздо реже (и Nicolai ваш пример читает неправильно). Есть ли читалки, позволяющие строить правила на уровне частей речи? |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Июн 08 2012, 20:32 | Пт Июн 08 2012, 20:32 | |
| frt, вам нужно просто сделать разметку текста с омографами - указать ударение где го́лоса а где голоса́
- frt пишет:
- По-хорошему надо добавить правило, что если перед словом «гОлоса» стоит существительное, то ударение на первый слог. Возможно ли это сделать?
такое умеет делать Cognitive Dwarf Shell - frt пишет:
- Как мне теперь сделать, чтобы все слова, начинающиеся на "флеш", читались как "# f l E S" (т.е. флешка, флешками, флешмоб и т.д.)?
да, нужно добавлять вручную в лексикон все словоформы можно воспользоваться лемматизатором + транскриптором для быстрого построения всего списка и потом добавить его в лексикон |
|
|
| |
cve133 Наблюдатель
Сообщений : 2
Репутация : 1
| cve133 | :: Пн Июл 23 2012, 20:41 | Пн Июл 23 2012, 20:41 | |
| подскажите пожалуйста почему Алена говорит знак тире, после подключения лексиконов? |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Пн Июл 23 2012, 21:49 | Пн Июл 23 2012, 21:49 | |
| - cve133 пишет:
- почему Алена говорит знак тире, после подключения лексиконов?
Скачайте и подключите 1-м по приоритету _punctuation.dic - лексикон для запрета чтения разделительных знаков. |
|
|
| |
Darlock Наблюдатель
Сообщений : 3
Репутация : 1
| Darlock | :: Чт Сен 20 2012, 15:15 | Чт Сен 20 2012, 15:15 | |
| Если я использую программу MP3book2005, то мне следует подключить только три лексикона? Можно как-нибудь улучшить качество озвучки с этой программой? Может кто-нибудь напишет об особенностях использования MP3book2005 с Алёной? |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Чт Сен 20 2012, 19:53 | Чт Сен 20 2012, 19:53 | |
| - Darlock пишет:
- Может кто-нибудь напишет об особенностях использования MP3book2005 с Алёной?
MP3book2005 хорошая программа - автор постарался! Там в основном голос Николая; автор с пользователями сделали приличный словарь. Об особенностях с Алёной не уверен, обратитесь к В. Шойтов-Харитановскому напрямую на его сайте. |
|
|
| |
psb Наблюдатель
Сообщений : 1
Репутация : 0
| psb | :: Вс Сен 30 2012, 13:06 | Вс Сен 30 2012, 13:06 | |
| вышел в свет голос Алёны для Андроида... там имеется возможность подключить свой словарь с именем: user.userdico но он практически пустой вот его содержимое:
- Код:
-
EMPTY USER LEXICON P#DIC#IGNORE 13 #_- P#DIC#PUNCT 13 #?./+=:;,~\$()[]{}!*@&' подскажите, в каком формате добавлять слова ?
|
|
|
| |
Dekabrus Участник
Сообщений : 61
Репутация : 3
| Dekabrus | :: Ср Окт 03 2012, 21:37 | Ср Окт 03 2012, 21:37 | |
| - evmir_troll-hunter пишет:
Извините. Не нашел, как загрузить словарь со словами, добавленными вручную.
Проблема:
Набил вручную в базовый словарь кучу слов по военной тематике. Понадобилось переустановить виндевс. Скопировал словарь в " Текстовый документ.
Как из " Текстового документа загрузить расширенный словарь обратно в Лексикон Менеджер? |
|
|
| |
Dekabrus Участник
Сообщений : 61
Репутация : 3
| Dekabrus | :: Ср Окт 03 2012, 21:48 | Ср Окт 03 2012, 21:48 | |
| Базовый словарь находится в таком виде:
- Цитата :
- щ?ю??еб?
ъб??Пб?T¤б?I№б?~Ћб?oџб?ћnб?Џ?б?©Yб?Я/б?у?б?е?б??йа??ъа?<На?'Ца?TҐа?Iёа?`‘а Скопированный словарь имеет обычный читаемый вид:
- Цитата :
- пике # p' i k' e1
полках # p V l k A1 x
полку # p V l k u1
полувоенный # p @ l U v V e1 n n I j провода # p r @ v V d A1
проводами # p r @ v V d A1 m' $ |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Чт Окт 04 2012, 02:57 | Чт Окт 04 2012, 02:57 | |
| - Dekabrus пишет:
- Как из " Текстового документа загрузить расширенный словарь обратно в Лексикон Менеджер?[...]Базовый словарь находится в таком виде:
Словарь для движка называется лексикон; хоть и имеет расширение .dic но является зашифрованным и нечитаемым для других редакторов! Работать с лексиконами можно лишь в Lexicon Manager. Чтобы "скопировать словарь в Текстовый документ", Вы должны были экспортировать содержимое данного лекса через меню Файл\Экспорт лексикона. Чтобы добавить слова из .txt нужно наоборот импортировать их в лексикон - Файл\Импорт лексикона. Процесс импорта намного дольше экспорта, если слов много, то лучше создать новый лекс, импортировать туда, сохранить и подключить. Меня смущает вид Вашего списка - должны быть 3 части разделённые табуляцией; слово, транскрипция, грамматический атрибут. Вот так: пике # p' i k' e1 NOUN полках # p V l k A1 x NOUN полку # p V l k u1 NOUN полувоенный # p @ l U v V e1 n n I j ADJECTIVE провода # p r @ v V d A1 NOUN проводами # p r @ v V d A1 m' $ NOUN Также позвольте заметить, что почти все слова из Вашего примера считаются омографами (с двойным ударением и значением). Они прописаны в спецлексиконе "Лексикон для словаря замен[omograph_lex]
|
|
|
| |
Dekabrus Участник
Сообщений : 61
Репутация : 3
| Dekabrus | :: Чт Окт 04 2012, 12:25 | Чт Окт 04 2012, 12:25 | |
| - evmir_troll-hunter пишет:
- Меня смущает вид Вашего списка - должны быть 3 части разделённые табуляцией; слово, транскрипция, грамматический атрибут. Вот так:
пике # p' i k' e1 NOUN так и есть:
- Цитата :
- авантюр #V v V n' t' U2 r NOUN
аварийной #V v V r' i j n I j ADJECTIVE аварийную #V v V r' i j n U Y ADJECTIVE - evmir_troll-hunter пишет:
- Также позвольте заметить, что почти все слова из Вашего примера считаются омографами (с двойным ударением и значением). Они прописаны в спецлексиконе "Лексикон для словаря замен[omograph_lex]
И мне следует удалить ненужный вариант слова? |
|
|
| |
Dekabrus Участник
Сообщений : 61
Репутация : 3
| Dekabrus | :: Чт Окт 04 2012, 12:33 | Чт Окт 04 2012, 12:33 | |
| Вопрос по конкретному слову.
не было #n' e1 b 1 l @
в Лексиконе читает правильно ( с ударением на "не")
В балаболке читает с ударением на "ы".
можно ли это исправить? |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Чт Окт 04 2012, 13:34 | Чт Окт 04 2012, 13:34 | |
| - Dekabrus пишет:
- И мне следует удалить ненужный вариант слова?
Ни в коем случае! Кроме лексиконов есть т.н. словари замен, они не зашифрованы и содержат правила для замены текста. Скачайте Словарь замены ударений [omograph], откройте его в Блокноте и вставьте доп. правила: $пике=пикЕ $полках=полкАх $полку=полкУ $провода=проводА $проводами=проводАми
- Dekabrus пишет:
- Вопрос по конкретному слову: не было
В словарь замен вставьте: не было=нЕбыло а в Лексикон для словаря замен, (про который я говорил ранее) добавьте транскрипцию: нЕбыло #n' e1 b 1 l @ VERB И вообще, все предпочтительные варианты омографов прописываются пользователем именно в словарях замен. Что это такое, как их подключить, как изменить текст и т.д. подробно описано тут Изучайте, удачи. |
|
|
| |
Dekabrus Участник
Сообщений : 61
Репутация : 3
| Dekabrus | :: Чт Окт 04 2012, 14:57 | Чт Окт 04 2012, 14:57 | |
| - evmir_troll-hunter пишет:
- Что это такое, как их подключить, как изменить текст и т.д. подробно описано тут
Изучайте, удачи. Пока всё понял. Спасибо. |
|
|
| |
asgard Новичок
Сообщений : 23
Репутация : 1
| asgard | :: Пт Окт 05 2012, 12:22 | Пт Окт 05 2012, 12:22 | |
| Пользуюсь Балаболкой с голосовым движком Алёна. При чтении не реагирует на запятые, хотя все остальные знаки препинания работают нормально. Никаким регулировкам не поддаётся. В SpeechPad запятую читает. Возможно проблема в самой балаболке. Подскажите в чём может быть причина? |
|
|
| |
|
Обсуждение словарей |
---|