TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



Обсуждение словарей

Предыдущая тема Следующая тема Перейти вниз
На страницу : Предыдущий  1, 2, 3, 4, 5, 6, 7, 8, 9  Следующий
АвторСообщениеОбсуждение словарей
muk79
Участник «online словари»


Сообщений : 103

 muk79 :: Ср Мар 11 2009, 14:25
Ср Мар 11 2009, 14:25

box440 Ты посмотри внимательно какие архивы и куда распаковывать нужно. Alenka.hmg есть в теме со словарями.

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Чт Май 21 2009, 16:40
Чт Май 21 2009, 16:40

Всем добрый день! Я только осваиваюсь и вот начал потихоньку править словари.С изменением произношения слов вроде получается , но вот возник вопрос : у меня в тексте много (* * * ), Алена читает (звездочка звездочка звездочка). В Lexikon Manager во всех трех словарях я заменил транскрипцию на (#A b z A1 ts g l A v I2). Но Алена в тексте все равно читает (звездочка звездочка звездочка).Может кто объяснит ,что делать.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Чт Май 21 2009, 16:56
Чт Май 21 2009, 16:56

Цитата :
В Lexikon Manager во всех трех словарях я заменил транскрипцию на (#A b z A1 ts g l A v I2)
а какую именно транскрипцию? "* * *"?

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Пн Май 25 2009, 08:43
Пн Май 25 2009, 08:43

evilone_
Транскрипция была такая -(# z v' 91 z d @ tS' k @ z v' 91 z d @ tS' k @ z v' 91 z d @ tS' k @ ). В выходные менял местами приоритетность словарей , переустанавливал Balabolku , Lexicon.Не получается.
И еще вопрос :при попытке просмотра словарей в Балаболке, я вижу только sz_bukvayo.dic ,другие словари(_punktuation.dic , Alyona22k.dic , omograph.dic ) пустые (галочки стоят). В Lexikon Manager все есть.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пн Май 25 2009, 11:01
Пн Май 25 2009, 11:01

RIA так не получится, в лексикон слова с пробелами добавлять можно но они не читаются или не все. нужно добавить в словарь замен, тот что для балаболки, замену

Цитата :
** ** **=абзац главы

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Вт Май 26 2009, 09:00
Вт Май 26 2009, 09:00

evilone_
Я попытался , но не получается, все равно читает "звездочки". Добавил во все отмеченные словари Балаболки.
Образец текста:
...продемонстрировать Тайному Городу мощь Великого Дома Чудь, что в принципе вполне соответствует хвастливому характеру доблестных рыцарей. Приглашенных на церемонию в Замок особенно впечатлил парад гвардии, в котором приняла участие половина боевых магов Ордена, но который тем не менее..."("Тиградком")

* * *

Муниципальный жилой дом.
Москва, улица Люсиновская, 29 июля, воскресенье, 22:31.

Несмотря на прекрасно проведенный день, а может быть, как раз из-за этого, сон не приходил. Воскресенье прошло очень весело. ...

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Май 26 2009, 12:26
Вт Май 26 2009, 12:26

RIA
добавь в словарь %где-то там где твои документы%\balabolka\omograph.dic строку
Цитата :
** ** **=абзац главы
открой balabolka, подключи этот словарь и нажми и нажми ctrl+T

а вообще наверно скоро обновится словарик замен там эта замена будет, только не как "абзац главы" а как небольшая пауза при чтении

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Вт Май 26 2009, 19:56
Вт Май 26 2009, 19:56

evilone_
В словарь omograph.dic вставил , но результат тот же. Меня смущает ,что в измененном тексте ,после Ctrl+T , все равно стоят звездочки и соответственно они так и читаются.
Вопрос: если в тексте стоят( * * *), а в словаре мы записываем как
(** ** **=абзац главы), то Алена просто не понимает?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Чт Май 28 2009, 12:45
Чт Май 28 2009, 12:45

Цитата :
Меня смущает ,что в измененном тексте ,после Ctrl+T , все равно стоят звездочки
значит где-то что-то пропустил

Цитата :
Вопрос: если в тексте стоят( * * *), а в словаре мы записываем как
(** ** **=абзац главы), то Алена просто не понимает?
нет

Вернуться к началу Перейти вниз
Desert Fox
Наблюдатель


Сообщений : 2
Репутация : 0

 Desert Fox :: Чт Май 28 2009, 23:36
Чт Май 28 2009, 23:36

попробуй следующее:
в .dic словаре балаболки добавить - (** * **=абзац главы)
проверено работает

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Пт Май 29 2009, 12:58
Пт Май 29 2009, 12:58

Честно скажу- перерыл все что мог-не пойму ,что такое (.dic словарь балаболки ),как этот словарь полностью выглядит. У меня есть default.dic , punktuation.dic , Alyona22k.dic , omograph.dic , sz_bukvayo.dic.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пт Май 29 2009, 21:44
Пт Май 29 2009, 21:44

Цитата :
перерыл все что мог-не пойму ,что такое (.dic словарь балаболки)
так с этого и надо было начинать Smile
читай там все написано

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Пн Июн 01 2009, 20:11
Пн Июн 01 2009, 20:11

evilone_
Я перечитал инструкции , как я понимаю (.dic словарь балаболки) это omograph.dic . Я поочередно включал словари (у меня стоит пять словарей в балаболке- default.dic , punktuation.dic , Alyona22k.dic , omograph.dic , sz_bukvayo.dic. ) ,через Ctrl+T пытался изменить текст . но все равно читает (***). Буду ждать новый словарь замен.
И еще раз мой вопрос про словари , подробности на форуме не могу найти.
У меня в Lexicon -Voice Associations стоят три словаря(сверху вниз) :omograph.dic ,Alyona22k.dic , punktuation.dic , при открытии я вижу их наполнение , могу работать с ними. В Балаболке у меня установлены 5 словарей, но эти три словаря из Lexicon -Voice Associations при открытии ("редактировать") пустые, хотя в папке Балаболки в свойствах я вижу ,что omograph.dic -1,30 МБ , Alyona22k.dic -567 кб ,punktuation.dic -1,66 кб. При нажатии "Показать список" все хорошо раскрывается но править то нельзя .Зато sz_bukvayo.dic открывается при редактировании и я вижу его наполнение-3,12 МБ. Если я добавляю свои "звезды" в эти пустые словари и нажимаю "Сохранить",то в папке Балаболки словари обнуляются и содержат только мое исправление (** * **=абзац главЫ).

Вопрос- это я что-то неправильно установил или неправильно делаю или эти словари можно увидеть раскрытыми только в Lexicon -Voice Associations .

Вернуться к началу Перейти вниз
Desert Fox
Наблюдатель


Сообщений : 2
Репутация : 0

 Desert Fox :: Пн Июн 01 2009, 21:04
Пн Июн 01 2009, 21:04

Не путай словари.
Словари для Алёны (те которые с транскрипцией) не подключишь к балаболке и наоборот.
Словарь для алёны .dic в блокноте не откроешь
sz_bukvayo.dic - вариант словаря для балаболки

создай простой текстовый файл - например MyDictionary.txt и переименуй его в MyDictionary.dic. Сохрани его в папке .../Мои документы/балаболка/

Перезапусти балаболку и поставь галочку напротив этого словаря.
Теперь его можно редактировать.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пн Июн 01 2009, 21:11
Пн Июн 01 2009, 21:11

RIAтак даже картинка есть куда какие словари распаковывать и подключать, как их можно перепутать? silent :123:

те словари которые к балаболке их можно прочитать в блокноте а те которые к лексикону нет

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Вт Июн 02 2009, 18:19
Вт Июн 02 2009, 18:19

Desert Fox_
Я пытался это делать раньше ,только назвал /мой.dic/ . Все равно в тексте
читает- "* * *".

evilone_
(те словари которые к балаболке их можно прочитать в блокноте а те которые к лексикону нет )
Я наверно неправильно технически выражаюсь - я имею ввиду ,что при двойном клике левой кнопкой мыши по любому словарю в открытой Балаболке выходит таблица "Коррекция произношения" и в словарях omograph.dic ,Alyona22k.dic , punktuation.dic в левой большой части нет ничего-нечего корректировать , а словари sz_bukvayo.dic. и default.dic открываются для коррекции (левая таблица содержит список замен).

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Пн Июн 08 2009, 14:39
Пн Июн 08 2009, 14:39

evilone_
По поводу (* * *)- экспериментируя обнаружил что если самому ввести (***-без пробелов) в читаемый текст(а в тексте стоят пробелы между (*)) и соответственно внести изменения в Lexicon Manager и dic.словарь Балаболки-"абзац главЫ" ,то начинает читать как надо. Но при этом если поставить пробелы (* * *)читает как "звездочка ...", хотя в Lexicon и dic.словаре я внес изменения т.е. приходится в тексте самому перебивать(***)и еще ставить точку(иначе не делает паузы).В Lexicon и dic. словарях я проставил разные сочетания "звездочек"-(** * ** , _* * *_,_** * **_),но правильно читает только(***- без пробелов).
Вопрос: может в словарях есть какое-то закрепленное понятие "звездочка с пробелом"?
И еще один вопрос : - в книге у меня время проставлено как (11.31 -с одной точкой)и соответственно читается "одиннадцать целых тридцать одна сотая".Чтобы добавить в словари все часы с минутами надо будет внести 1440 записей.Нельзя ли как-то дать понять словарю что это надо читать как время (пусть даже как "одиннадцать тридцать одна")?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Июн 09 2009, 15:34
Вт Июн 09 2009, 15:34

RIA неужели так сложно прочитать абзац текста и нормально сделать замену как писали выше? зачем такие сложности и экспирименты? wall
а с числами замени точку на "-" или "_"

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Ср Июн 10 2009, 12:02
Ср Июн 10 2009, 12:02

evilone_
Просто у меня 13 книг , в каждой порядка 70 значков (* * *), т.е. долгая правка.
Но я нашел способ -перевожу документ в Word и делаю автоматическую замену (* * *) на "абзац главы",а потом открываю Балаболку.
И с временем та же история -порядка 70-100 времен,вручную долго править.

Вернуться к началу Перейти вниз
Sylvia
Участник «online словари»
avatar


Сообщений : 72
Репутация : 83

 Sylvia :: Ср Июн 10 2009, 16:38
Ср Июн 10 2009, 16:38

RIA пишет:
evilone_
Просто у меня 13 книг , в каждой порядка 70 значков (* * *), т.е. долгая правка.
Но я нашел способ -перевожу документ в Word и делаю автоматическую замену (* * *) на "абзац главы",а потом открываю Балаболку.
И с временем та же история -порядка 70-100 времен,вручную долго править.
Если потом открываешь Балаболку, для чего править в Worde? Ведь это же самое можно сделать в Балаболке, комбинация Ctrl+R. Все автоматически заменяется... О ручной правке никто не говорит.

Вернуться к началу Перейти вниз
RIA
Новичок


Сообщений : 12
Репутация : 1

 RIA :: Чт Июн 11 2009, 11:18
Чт Июн 11 2009, 11:18

Sylvia_
Спасибо за подсказку , я как то прошлепал ушами в правке эту позицию.

Вернуться к началу Перейти вниз
vnb1953
Наблюдатель


Сообщений : 3
Репутация : 0

 vnb1953 :: Вс Июн 28 2009, 18:27
Вс Июн 28 2009, 18:27

Здравствуйте.
Создал, как посоветовали на форуме свой словарь для Аленки, MyAlyona.dic. Но вот возникла проблема: попытался изменить произношение следующей фразы "В 1994 году". Внес с помощью "Балаболки" в свой словарь вышеуказанную фразу, прослушал, сохранил, запустил прослушивание текста с этой фразой-произносит не правильно.
Вопрос: как быть, если в словарь Алены (под Балаболку) для коррекции произношения требуется внести фразу с пробелами между словами?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пн Июн 29 2009, 03:19
Пн Июн 29 2009, 03:19

vnb1953 в лексикон слова с пробелами вносить не получится, такие словосочетания лучше вносить в словарь замен (балаболкин) в виде:
В 1994 году=В 1990 четвертом году
В 1995 году=В 1990 пятом году
В 1996 году=В 1990 шестом году
и т.д.

Вернуться к началу Перейти вниз
vnb1953
Наблюдатель


Сообщений : 3
Репутация : 0

 vnb1953 :: Пн Июн 29 2009, 13:08
Пн Июн 29 2009, 13:08

Здравствуйте.
evilone спасибо за ответ.
По ходу работы сс словарями в "Балаболке" возник вопрос - каким символом в словарях корректируемых из "Балаболки" обозначается ударение. Перепробовал символы из окна редактирования (*,^,') читает совсем неправильно.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Июн 30 2009, 02:24
Вт Июн 30 2009, 02:24

vnb1953 никаким, ударения, если этого слова нету в лексиконе, голос не воспринимает, но если например в лексиконе есть запись
словА # s l V v A1
тогда можно в тексте ставить вместо "слова" - "словА" и тоже самое и со "слОва"
проще говоря для любого никак, но помечать можно, предварительно внеся слово в лексикон.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Ср Июл 01 2009, 01:21
Ср Июл 01 2009, 01:21

lev55 wall так уже вроде нарисовано и вроде бы все ясно, по установке так точно с картинками, осталось разве что только записать видео clown

Вернуться к началу Перейти вниз
bober
Наблюдатель


Сообщений : 3
Репутация : 1

 bober :: Пн Июл 20 2009, 08:03
Пн Июл 20 2009, 08:03

Чтобы не читались звездочки сделал в балаболке: *=
А с точкой такое не проходит, все равно читает, например проблемы с именами: В.И.Ленин ВточкаИточкаЛенин, подскажите как вы побороли точки, неужели все имена известных людей записывать в словарь: В.И.Ленин=Ленин.
Спасибо!

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Июл 21 2009, 12:56
Вт Июл 21 2009, 12:56

bober нужно чтобы перед точкой не стоял пробел, даже не так, чтобы сохранялись правила оформления печатного текста, т.е. после знака препинания пробел а перед ним без пробела
не В.И.Ленин а В. И. Ленин

Вернуться к началу Перейти вниз
st5s
Наблюдатель


Сообщений : 3
Репутация : 0

 st5s :: Ср Июл 22 2009, 11:06
Ср Июл 22 2009, 11:06

Всем привет.
Пользуюсь движком Аленка - имхо лучший из в настоящий момент существующих.
Есть желание внести свой вклад в словари, но естественно сразу возникает определенное количество вопросов. сразу переварить информацию написанную на форуме не получилось, возможно на мои вопросы уже были ответы, поэтому попрошу отослать по ссылке если повторюсь.
вопросы следующие:
1)Лексикон слов для участия в проекте делать отдельным словарем?
2)синтаксис транслита не совсем ясен, где можно ознакомиться подробней (расстановка ударений была описана 1 или 2 - тут все понятно)
3) программа по отлову труднопроизносимых слов - какие образом она их определяет?
4) я правильно понял, если пополнять словари Аленки, то все программы которые с этим движком работают будут произносить слова правильно?
Остальные вопросы немного не в тему (к словарям отношения не имеют), но все же
5)пробовал несколько программ, кроме балаболки ни одна нормально в мр3 не перегоняет (KoobAudio - как я понял из прочитанного работает со своим словарем), некоторые перегоняют только из формата txt - что тоже неудобно, другие же (cool reader например - пользуюсь для прослушки на компе) что то создает быстро и в результате маленький по размеру файл мр3 и одни шумы. Другие программы тоже несколько секунд и все... до мр3 book 2005 еще руки не дошли правда.

Вернуться к началу Перейти вниз
Vladimir_02
Посетитель
avatar


Сообщений : 28
Репутация : 9

 Vladimir_02 :: Ср Июл 22 2009, 14:14
Ср Июл 22 2009, 14:14

Всем Привет!
Админы! создайте тему по Сакраментовским голосам (пробовал создать - не могу)... у меняч есть полностью зарегеннная версия движка с 5-ю голосами (Вика, Вячеслав, Ирина, Юлия, Юрий)... имхо голоса будут похуже Алёны, Ольги и Катерины, а некоторые даже лучше Николая... В комплекте есть редактор словаря и голоса...
тут letitbit.net Sacrament.rar.html все в одном архиве (19 мб)... если надо - разбейте по отдельности на движок и голоса и перезалейте...

Вернуться к началу Перейти вниз
donbaton
Интересующийся


Сообщений : 7
Репутация : 0

 donbaton :: Ср Июл 22 2009, 14:38
Ср Июл 22 2009, 14:38

У меня дабавлении дополнительных словарей плюсы из них читаются Аленкой. И шипелявить начинает.

Вернуться к началу Перейти вниз
st5s
Наблюдатель


Сообщений : 3
Репутация : 0

 st5s :: Пт Июл 24 2009, 09:43
Пт Июл 24 2009, 09:43

Первая часть словаря Парадигма Зализняка для Loquendo (с ударениями), переделанные для Аленки. http://webfile.ru/3794253# Что бы подключить словарь необходимо файл переименовать в Alyona22k.dic Естественно все сырое. Пробуем, тестируем...если есть смысл - переделаю остальную часть словаря. потом можно будет и слова для николая с ударениями таким же макаром перегнать.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Авг 23 2009, 14:34
Вс Авг 23 2009, 14:34

st5s при беглом взгляде в лексиконе очень много ошибок в транскрипциях, не просто неточностей а именно не правильных транскрипций
пример:
Цитата :
абонементен
#V b @ n' $ m'1 n' t' $ n
вместо
#V b @ n' $ m' e1 n' t' $ n

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Ср Сен 02 2009, 13:27
Ср Сен 02 2009, 13:27

Более-менее вычитал лексикон Alyona22k. Кое-что убрал:
- грамматически неверные формы
- составные слова, которые там и по отдельности есть
- с частицей -то (я их по др. обрабатываю)
- те, которые ни в одной книге не встречал и вряд-ли встречу
- которые у меня и так в любом раскладе правильно читает
- имена и географию выделил в отд. лексикон.
Кое-что добавил и добавляю по мере работы с книгами.
Много что исправил. И грамм. ошибки и неправильное произношенние и то, что не нравилось (меня раздражало, напр., чрезмерное аканье).
Ряд исправлений сделал и в лексиконовском омографе, только то, с чем по ходу сталкивался. Хотя там достаточно много неточностей, имхо.
Затачивал под свое восприятие, естественно. Но, может кому интересно будет, могу выслать.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Ср Сен 02 2009, 16:44
Ср Сен 02 2009, 16:44

al2055
конечно высылайте, точнее заливайте и показывайте ссылку
особенно про омографы Smile
как показала практика, в лексикон 90% идут имена и названия которые характерны для каких-то одних книг\жанров и добавить их всех просто нереально и проще самому по чуть-чуть туда добавлять чем собирать все в кучу и его еще и проверять нужно будет потом наверно

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Чт Сен 03 2009, 14:55
Чт Сен 03 2009, 14:55

Вот здесь лексиконы. Первые два как стоят у меня, а омографы – выделил те, которые успел исправить и добавить. Которые совсем уж отвратно у меня читались. Все проверил и проставил части речи, по возможности.

slil.ru 27950538

Попутно вопрос, если можно. Установил движок в начале июня. Тогда же и словари все скачал. Честно говоря, так понял из того, что успел прочитать на форуме и лелеял надежду, что кто-то исправит ошибки, которых хватает в словаре замены ударений. На днях скачал оный от 27.08. Так понял, что идут только добавления. Ошибки, в основном, все остались. Очень много повторных определений, неоднозначных фраз. Примеров масса, приведу некоторые, которые под руку попались:

метровой длиннЫ; годА два назад; св. иегУменья

Генриха XVIII=Генриха восьмого
Генриху XVIII=Генриху восьмому

восемсот, девятсот, шэстьдесят, шэстой, шэстого, шэсть, одИнадцать, одИнадцатом -
мне кажется, в оригинальном написании звучит гораздо лучше.

вот и все=вот и всё; все быстро=всё быстро и т.д. - очень уж неоднозначно.

Это не критика Smile. Просто хотелось бы знать, ведется ли такая работа, чтоб не было двойных усилий. Процентов 30-40 словаря я уже сам перелопатил, слишком много времени это занимает. Что-то убрал, что-то добавил, что-то исправил. Все соберу и выложу, если это в чем-то поможет.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Чт Сен 03 2009, 17:15
Чт Сен 03 2009, 17:15

al2055
критика это наоборот хорошо, значит кому-то это нужно Smile
да в словаре есть ошибки, точнее они в нем были. изначально за основу словаря брался старый словарь от николая и долго, по мере нахождения в нем всего "нового" и "интересного", вычищался.

так специально каждую строчку в нем никто не проверял, потому что все либо лентяи tongue либо просто нет свободного времени этим заниматься, а проверялись только новые, какие-то самые частые замены и те ошибки которые явно выпирали при чтении из старых.

грамматика местами хромать может потому что ее специально искажали для лучшего чтения слов движком, но таких слов не так уж и много, по крайней мере для аленки, и скорее всего это тянется еще от колькиных словарей
"шэсть" и "одИнадцать" точно Arrow

поэтому если заметили какие-то неточности говорите поправим, это нормально
лексиконы поглядим, а замены если есть исправления то конечно лучше пришлите синхронизируемся

замены с числами скоро наверно вообще не нужны будут, для них будет словарь Вадима

а вот с лексиконами все не так просто, там нужно сидеть и проверять каждое слово, причем мне например нравится акание, а кому-то нет
а если показать ссылки на несколько одинаковых лексиконов то это еще больше запутает, многие и так уже жалуются что сильно заумно все это безобразие настраивать нужно

нужно подумать

Вернуться к началу Перейти вниз
t64y
Новичок
avatar


Сообщений : 15
Репутация : 4

 t64y :: Пт Сен 04 2009, 23:27
Пт Сен 04 2009, 23:27

Дорый день. Возник небольшой вопрос по поводу применения словарей и работе балаболки. Суть в том, что знаки препинания в тексте сильно влияют на правильность произношения "Аленкой" некоторых слов. Я имею в виду знаки после слов.
Когда точка / запятая , ? , ! , ; и : / стоит сразу после слова. ( иногда -и- читат как -я- или тянет как в английском - длинное - и - и ит.п. ). Если знаки ставить через пробел - то этот дефект пропадает.
Создал словарик замен знаков препинания с пробелом но Балаболка не хочет производить замену.
,= ,
!= !
?= ?
;= ;
.= .
Приходится сохранять в текстовом файле и там уже править.В принципе не долго но как-то не серьёзно, ведь по идее и Балаболка должна это делать.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Сб Сен 05 2009, 01:36
Сб Сен 05 2009, 01:36

t64y пишет:
Создал словарик замен знаков препинания с пробелом но Балаболка не хочет производить замену.
это глупая затея, такие замены будут читаться как точка, запятая, словами каждый знак уже давно проверено. вот подключи этот словарик и будет тебе счастье fish

Вернуться к началу Перейти вниз
t64y
Новичок
avatar


Сообщений : 15
Репутация : 4

 t64y :: Сб Сен 05 2009, 10:17
Сб Сен 05 2009, 10:17

Верю , что затея не шибко умная. Но знаки читает только при повторах типа многоточия когда пробел попадает между знаком. - !!! ! - если слитно то нет. Я не пишу аудио /90% времени провожу перед компом/ читаю с экрана. Так, что все что режет уши отлавливается сразу, и далее в редактор. Причем как правило запускаю несколько вариантов обработаного Балаболкой текста. Имеется в виду различные версии словаря ударений - какой лучше не скажу, слишком разные результаты , здорого зависит от текста. Бывает что необработанный вообще читает лучше всего. Ёфикацией не пользуюсь - слишком много ошибок - два слова исправляет и в три вносит ошибки.
А словарик попробуем. С сосвоим тоже разобрался. Добавил * перед знаом.Работает.

Ещё хотелось сказать СПАСИБО всем кто работает на форуме, отвечает на глупые /повторяющиеся/ вопросы, пытатся ловить кряки и их исправлять.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Сб Сен 05 2009, 13:30
Сб Сен 05 2009, 13:30

с заменой != ! получится замена
Цитата :
слово!=слово !
а если ! !=!! то оно будет пропускать, например, если там не один а два или три пробела между знаками.
по-моему проще не искать варианты замены а сделать отдельный лексикон вида:
Цитата :
! #_
? #_
...

Вернуться к началу Перейти вниз
t64y
Новичок
avatar


Сообщений : 15
Репутация : 4

 t64y :: Сб Сен 05 2009, 22:23
Сб Сен 05 2009, 22:23

Цитата :
по-моему проще не искать варианты замены а сделать отдельный лексикон
- так не проще , а правильней.
Что касается
Цитата :
а если ! !=!! то оно будет пропускать, например, если там не один а два или три пробела между знаками.
-то Аленки до лампочки подобные знаки - !!!!!- или ! ! ! ! , !!! ??. и т.д. точнее их количество, на эмоциональную окраску голоса это сильно или вообще не влияет. Поэтому у меня просто в словарь замен забиты строчки типа - " ! ! ! = !!! " , " . . . . = ...." . И уж после я добавляю пробел перед знаком.
А на счет лексикона я с вами согласен, так наверное проще и самое главное правильно. Просто принцип его работы достаточно своебразен и к сожалению не всегда понятен. И что самое обидное - не всё с его помощью получается сделать.
Например если я искажу /изменю/ написание слова ,при помощи словаря замен - разову на части , или ,наоборот солью в одно, или что, тоже весьма интересно добавлю - Ь- или - Ъ-, то удается добится, того что в лексиконе не получится.
Кстати насчет -Ь- это тоже один из способов /вариантов/ бороться с "Аплохо" - вставляю -Ь- после не - "неьплохо ", "неьправда" ,

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Сб Сен 05 2009, 23:06
Сб Сен 05 2009, 23:06

evilone_
Цитата :
замены с числами скоро наверно вообще не нужны будут, для них будет словарь Вадима
Хорошо бы, а то с числами действительно иногда ерунда выходит. Но пока еще нужны, я думаю. Вот тут замены с числами, которые я все (надеюсь) исправил. И пресловутые "шэсть" и "одИнадцать", и пары "гОда-годА", "гОду-годУ", и пр. Выберу время, приведу в порядок свои словари, пошлю что исправлял. ПосмОтрите, может сгодится Smile.

slil.ru 27956706

Кстати, думаю, что в заменах типа:
Цитата :
— не помн*=— не' помн
неплохо было бы длинное тире заменить или хотя бы продублировать. И подобные же замены для слитного написания слов, т.е "непомн*" и т.д.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Сен 06 2009, 00:01
Вс Сен 06 2009, 00:01

t64y пишет:
А на счет лексикона я с вами согласен, так наверное проще и самое главное правильно.
так получилось избавиться от неправильного произношения? если явно указать в лексиконе знаки препинания считать как пауза, не меняется ли интонация предложения?
t64y пишет:
Кстати насчет -Ь- это тоже один из способов /вариантов/ бороться с "Аплохо" - вставляю -Ь- после не - "неьплохо ", "неьправда" ,
у нас одинаковый подход, только вместо - Ь- или - Ъ- указывается ' который в лексиконе указан как короткая пауза, в результате чего не меняя общей интонации предложения получается сделать маленькую паузу между слогами(буквами) за счет чего исчезает аленкины "фефекты фикции" clown

al2055 пишет:
ПосмОтрите, может сгодится
обязательно, более того будем объединять и чистить, по чуть-чуть, самое главное не менять порядок строк в словаре и ни в коем случае не сортировать по алфавиту\длине а то будет сложно сверять потом Sad

al2055 пишет:
неплохо было бы длинное тире заменить или хотя бы продублировать
да это не все варианты, нужно просчитать все возможные варианты написания а то это "апомню" уже надоели совсем :34:

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Пн Сен 07 2009, 04:03
Пн Сен 07 2009, 04:03

evilone_

Это-то понятно. Но путаница с тире приводит к тому, что просто не все правила отрабатываются. Я у себя в правилах поставил
*—=-
*–=-
т.е. замену длинного и короткого тире неразрывным дефисом. И предварительно прошелся этим по всем словарям. Хоть этой путаницы избежал.

У меня достаточно много исправлений и добавлений, которые меня устраивают, но, к сожалению, не предполагал... ну, скажем, обмена мнениями, и посему все смешалось... Уже и не помню, что, где и откуда, что мое, что уже было...Smile.
Постараюсь понемногу выделить все изменения.
Пока так, понемногу, субъективно:
*ая жара=ая жарА ; неоднозначно, напр.: поддавая жАра
но знаю=но ззнаю ; ноъ знаю звучит лучше, аналогично
*знать,=знать ; *знать,=знать _
*нял?=нял. ; *нял?=нял_?
часты проблемы с одиночными "а" и "и", также буква "п" и пр., что часто попадается:
а,=а-а, ; а.=а-а.
а...=а-а. ; а!=а-а!
а?=а-а? ; а_*=а-а_
и...=_и... ; и!=_и!
и?=_и? ; *и и=и, и
* - п*= _п ; *, п*= _п
*ла я=ла а я ; *ни я,=ни яъ _
ого, *=ого _ ; д'*=дэ
*знал,=знал _ ;
эти "*=эти _ ; эти -*=эти _
*шали.=шали _ ; *шей,=шей _
*щей,=щей _ ; *ью,=ью _

Мне все это и подобное значительно улучшает восприятие, учитывая, что я слушаю книги с телефона во время поездок и разных ожиданий, а не читаю с компа. Может, кому еще пригодится. Не знаю, может, не стоит тут столько писатьSmile.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пн Сен 07 2009, 16:04
Пн Сен 07 2009, 16:04

Цитата :
Это-то понятно. Но путаница с тире приводит к тому, что просто не все правила отрабатываются. Я у себя в правилах поставил
*—=-
*–=-
т.е. замену длинного и короткого тире неразрывным дефисом. И предварительно прошелся этим по всем словарям. Хоть этой путаницы избежал.
а разве в словарях правила не обрабатываются по принципу от самого длинного правила к самому короткому? т. е. от такой замены толку никакого а если по ней еще по словарям пройтись то будет караул просто

вот для примера
словарь:
Цитата :
*—=-
а-а=аа
текст:
Цитата :
а—а
после замены так и останется а—а
Цитата :
У меня достаточно много исправлений и добавлений, которые меня устраивают, но, к сожалению, не предполагал... ну, скажем, обмена мнениями, и посему все смешалось...
мне интересно были ли какие-то правки в плане удаления строк, т.е. новые и правки по тексту найти не сложно а вот попадались ли явно лишние замены?

можно какой-то пример текста для замен с которыми читается лучше
Цитата :
*и и=и, и
*ла я=ла а я
*ни я,=ни яъ _
ого, *=ого _
а то у меня читается как-то одинаково что с ними что без них

Цитата :
понемногу, субъективно неоднозначно
если есть сомнения лучше всего искать по корпусу быстро можно увидеть вероятность подобной замены в тексте.

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Вт Сен 08 2009, 13:07
Вт Сен 08 2009, 13:07

evilone_
1. В словаре более 30 длинных и коротких тире, правила с которыми не всегда отрабатывают в тексте на дефисах и наоборот. Примеры из словаря:
все — как в=всё — как в
теперь — все=теперь — всё
— не помн*=— не' помн
Я исправил все это в словаре и маленьким словариком из 2-х строк: *—=- и*–=- прохожусь по текстам перед дальнейшей обработкой. И вообще у меня словарь разделен: выражения с омографами; все, что связано с числами; имена; «трудные» слова; аббревиатуры и т.д. выделены в отд. словари. Мне так легче отслеживать.
2. По поводу
*и и=и, и
*ла я=ла а я
*ни я,=ни яъ _
ого, *=ого _
В выражениях типа: «ни я, ни ты (он и пр.); «усни я, ты» и в подобных , «я» читается, как «ё» или «ю»
«ого,» читается что-то типа «огэ» или вообще смазывается: «ого, а ты молодец», «ого, я не ждал» и пр.
по поводу первых двух так с ходу не вспомню, проявляется реже, в достаточно длинных выражениях, особенно при записи; съедаются конечные «и» и «а» в словах.
3. Примеры из словаря «навскидку»:
возвышались горы хлама=возвышались горЫ хлама;
на вашем дому=на вашем домУ;
те доски=те доскИ;
засыпаю ее=засЫпаю её;
*хие доски=хие доскИ; ----- сухие дОски
*шие доски=шие доскИ; ----- высохшие, отсыревшие и т.д. дОски
из тени=из тенИ; ----- «в тенИ», но «из тЕни»
конец начала=конец начАла;----- возможно и такое, но «под конец началА», напр., чаще.

Во многих случаях ударение равновероятно, так если точно не определять выражения, лучше уж оставить на усмотрение движка, я думаю:

птенцам ворона=птенцам вОрона; ----- своим птенцам ворОна принесла
приходите на Землю=прихОдите на Землю; ----- приходИте на Землю
прикрывал спины=прикрывал спинЫ; ----- прикрывал спИны друзей
тона краски=тонА краски; ----- такого тОна краски
напротив окна=напротив окнА; ----- в доме напротив Окна
краю стены=крАю стенЫ; ----- на краЮ стенЫ
знал места=знал местА; ----- не знал мЕста
*ей руки=ей рукИ; ----- (целую, мою и т.д.) ей рУки; протянул к ней рУки
Таких примеров достаточно

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Сен 08 2009, 18:09
Вт Сен 08 2009, 18:09

идея мне нравится, только в два прохода обрабатывать текст можно если предварительно записывать текст, а если слушать "на лету" то такой вариант не пройдет, надо подумать...

Цитата :
Примеры из словаря «навскидку»
тут можно долго спорить, проще самому послушать и выбрать как лучше звучит.
не всегда правильное написание звучит именно так как написано, но действительно иногда попадаются явно лишние замены, пишите если увидели, будем исправлять.

оставить на усмотрение движка не выйдет потому, что всегда читается только одна форма омографа, и если явно не указать другую, ту которую голос не читает явно, то она читать сама никогда не будет.
в словаре сейчас замены для омографов только той формы которую голос не читает сам без простановки в нем ударения.

Цитата :
А кроме тебя, словарями для Алёны кто ныть занимается?
тут, только Sylvia и muk остальные все бездельники tongue

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вт Сен 08 2009, 21:27
Вт Сен 08 2009, 21:27

al2055 обновили словарь замен с учетом неразрывного тире и твоих словарей замен и правок.
для чтения "на лету" да и вообще чтения нужен "словарь коррекции текста" дополнительный словарь по типу твоего который преобразовывает длинный и короткий дефис в неразрывное тире перед заменой основным словарем, в общем вроде работает, проверь.

lev55 пишет:
Была мысль синхронизировать olga_plus.7z(0omograph.dic) с omograph.dic (для Алёны).
была Smile и сплыла
60к против 21к есть над чем работать, в том же словаре омографы наверно во всех формах и в той которая читается всегда и в той которая не читается сама никогда?
ударения у ольги ставятся просто в слове а у аленки его нужно еще вносить в лексикон.
сравнить два словаря это дела 5 минут
мне нужен список слов в которых есть ударение,
например:
Цитата :
девушке-лисе=девушке-лисЕ
девчонкины косы=девчонкины кОсы
девяти утра=девяти утрА
девятиэтажные корпуса=девятиэтажные корпусА
девятого часа=девятого чАса
девять утра=девять утрА

Цитата :
лисЕ
кОсы
утрА
корпусА
чАса
...
тогда можно попробовать, хотя не факт что аленка станет читать лучше Smile
и все замечания al2055 у omograph.dic так же касаются и 0omograph.dic судя по всему

где-то треть словаря числители (даты, года, века и т.д.) их уже можно выкидывать и брать словарь http://mytts.forum2x2.ru/forum-f11/tema-t310.htm

и все замечания al2055 у omograph.dic так же касаются и 0omograph.dic судя по всему, если они как-то пересекаются, а они по-моему пересекаются?

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Вт Сен 08 2009, 22:58
Вт Сен 08 2009, 22:58

evilone_

Цитата :
в словаре сейчас замены для омографов только той формы которую голос не читает сам без простановки в нем ударения.

Не совсем так. Опять таки "навскидку", открываем словарь на предлоге "до":

до дела=до дЕла
до кости=до кОсти
до лагеря=до лАгеря
до места=до мЕста
до моря=до мОря
до начала=до начАла
до ночи=до нОчи
до полу=до пОлу
до пояса=до пОяса
до самого конца=до сАмого концА
до самой кончины=до сАмой кончины.

Все эти (и еще много других) замены лишние. Движок читает так же без замен и даже лучше, на мой вкус. С заменами чересчур окает. Без оных "до" читает как "дъа".

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Ср Сен 09 2009, 01:03
Ср Сен 09 2009, 01:03

al2055 тут читать как "в словарь сейчас добавляются только замены для омографов той формы которую голос не читает сам без простановки в нем ударения" это если проводить сравнения со словарями к ольге.

то что там есть лишние замены факт, но вреда от них не много
хотя до пояса=до пОяса это совсем не лишняя замена

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

Обсуждение словарей

Предыдущая тема Следующая тема Вернуться к началу
Обсуждение словарей
Страница 3 из 9Страница 3 из 9На страницу : Предыдущий  1, 2, 3, 4, 5, 6, 7, 8, 9  Следующий
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении