|
| |
Автор | Сообщение | Обсуждение словарей |
---|
muk79 Участник «online словари»
Сообщений : 102
| muk79 | :: Ср Мар 11 2009, 14:25 | Ср Мар 11 2009, 14:25 | |
| box440 Ты посмотри внимательно какие архивы и куда распаковывать нужно. Alenka.hmg есть в теме со словарями. |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Чт Май 21 2009, 16:40 | Чт Май 21 2009, 16:40 | |
| Всем добрый день! Я только осваиваюсь и вот начал потихоньку править словари.С изменением произношения слов вроде получается , но вот возник вопрос : у меня в тексте много (* * * ), Алена читает (звездочка звездочка звездочка). В Lexikon Manager во всех трех словарях я заменил транскрипцию на (#A b z A1 ts g l A v I2). Но Алена в тексте все равно читает (звездочка звездочка звездочка).Может кто объяснит ,что делать. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Чт Май 21 2009, 16:56 | Чт Май 21 2009, 16:56 | |
| - Цитата :
- В Lexikon Manager во всех трех словарях я заменил транскрипцию на (#A b z A1 ts g l A v I2)
а какую именно транскрипцию? "* * *"? |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Пн Май 25 2009, 08:43 | Пн Май 25 2009, 08:43 | |
| evilone_ Транскрипция была такая -(# z v' 91 z d @ tS' k @ z v' 91 z d @ tS' k @ z v' 91 z d @ tS' k @ ). В выходные менял местами приоритетность словарей , переустанавливал Balabolku , Lexicon.Не получается. И еще вопрос :при попытке просмотра словарей в Балаболке, я вижу только sz_bukvayo.dic ,другие словари(_punktuation.dic , Alyona22k.dic , omograph.dic ) пустые (галочки стоят). В Lexikon Manager все есть. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пн Май 25 2009, 11:01 | Пн Май 25 2009, 11:01 | |
| RIA так не получится, в лексикон слова с пробелами добавлять можно но они не читаются или не все. нужно добавить в словарь замен, тот что для балаболки, замену
- Цитата :
- ** ** **=абзац главы
|
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Вт Май 26 2009, 09:00 | Вт Май 26 2009, 09:00 | |
| evilone_ Я попытался , но не получается, все равно читает "звездочки". Добавил во все отмеченные словари Балаболки. Образец текста: ...продемонстрировать Тайному Городу мощь Великого Дома Чудь, что в принципе вполне соответствует хвастливому характеру доблестных рыцарей. Приглашенных на церемонию в Замок особенно впечатлил парад гвардии, в котором приняла участие половина боевых магов Ордена, но который тем не менее..."("Тиградком")
* * *
Муниципальный жилой дом. Москва, улица Люсиновская, 29 июля, воскресенье, 22:31.
Несмотря на прекрасно проведенный день, а может быть, как раз из-за этого, сон не приходил. Воскресенье прошло очень весело. ... |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Май 26 2009, 12:26 | Вт Май 26 2009, 12:26 | |
| RIA добавь в словарь %где-то там где твои документы%\balabolka\omograph.dic строку - Цитата :
- ** ** **=абзац главы
открой balabolka, подключи этот словарь и нажми и нажми ctrl+T
а вообще наверно скоро обновится словарик замен там эта замена будет, только не как "абзац главы" а как небольшая пауза при чтении |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Вт Май 26 2009, 19:56 | Вт Май 26 2009, 19:56 | |
| evilone_ В словарь omograph.dic вставил , но результат тот же. Меня смущает ,что в измененном тексте ,после Ctrl+T , все равно стоят звездочки и соответственно они так и читаются. Вопрос: если в тексте стоят( * * *), а в словаре мы записываем как (** ** **=абзац главы), то Алена просто не понимает? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Чт Май 28 2009, 12:45 | Чт Май 28 2009, 12:45 | |
| - Цитата :
- Меня смущает ,что в измененном тексте ,после Ctrl+T , все равно стоят звездочки
значит где-то что-то пропустил
- Цитата :
- Вопрос: если в тексте стоят( * * *), а в словаре мы записываем как
(** ** **=абзац главы), то Алена просто не понимает? нет |
|
| | | Desert Fox Наблюдатель
Сообщений : 2
Репутация : 0
| Desert Fox | :: Чт Май 28 2009, 23:36 | Чт Май 28 2009, 23:36 | |
| попробуй следующее: в .dic словаре балаболки добавить - (** * **=абзац главы) проверено работает |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Пт Май 29 2009, 12:58 | Пт Май 29 2009, 12:58 | |
| Честно скажу- перерыл все что мог-не пойму ,что такое (.dic словарь балаболки ),как этот словарь полностью выглядит. У меня есть default.dic , punktuation.dic , Alyona22k.dic , omograph.dic , sz_bukvayo.dic. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Май 29 2009, 21:44 | Пт Май 29 2009, 21:44 | |
| - Цитата :
- перерыл все что мог-не пойму ,что такое (.dic словарь балаболки)
так с этого и надо было начинать читай там все написано |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Пн Июн 01 2009, 20:11 | Пн Июн 01 2009, 20:11 | |
| evilone_ Я перечитал инструкции , как я понимаю (.dic словарь балаболки) это omograph.dic . Я поочередно включал словари (у меня стоит пять словарей в балаболке- default.dic , punktuation.dic , Alyona22k.dic , omograph.dic , sz_bukvayo.dic. ) ,через Ctrl+T пытался изменить текст . но все равно читает (***). Буду ждать новый словарь замен. И еще раз мой вопрос про словари , подробности на форуме не могу найти. У меня в Lexicon -Voice Associations стоят три словаря(сверху вниз) :omograph.dic ,Alyona22k.dic , punktuation.dic , при открытии я вижу их наполнение , могу работать с ними. В Балаболке у меня установлены 5 словарей, но эти три словаря из Lexicon -Voice Associations при открытии ("редактировать") пустые, хотя в папке Балаболки в свойствах я вижу ,что omograph.dic -1,30 МБ , Alyona22k.dic -567 кб ,punktuation.dic -1,66 кб. При нажатии "Показать список" все хорошо раскрывается но править то нельзя .Зато sz_bukvayo.dic открывается при редактировании и я вижу его наполнение-3,12 МБ. Если я добавляю свои "звезды" в эти пустые словари и нажимаю "Сохранить",то в папке Балаболки словари обнуляются и содержат только мое исправление (** * **=абзац главЫ).
Вопрос- это я что-то неправильно установил или неправильно делаю или эти словари можно увидеть раскрытыми только в Lexicon -Voice Associations . |
|
| | | Desert Fox Наблюдатель
Сообщений : 2
Репутация : 0
| Desert Fox | :: Пн Июн 01 2009, 21:04 | Пн Июн 01 2009, 21:04 | |
| Не путай словари. Словари для Алёны (те которые с транскрипцией) не подключишь к балаболке и наоборот. Словарь для алёны .dic в блокноте не откроешь sz_bukvayo.dic - вариант словаря для балаболки
создай простой текстовый файл - например MyDictionary.txt и переименуй его в MyDictionary.dic. Сохрани его в папке .../Мои документы/балаболка/
Перезапусти балаболку и поставь галочку напротив этого словаря. Теперь его можно редактировать. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пн Июн 01 2009, 21:11 | Пн Июн 01 2009, 21:11 | |
| RIAтак даже картинка есть куда какие словари распаковывать и подключать, как их можно перепутать? :123:
те словари которые к балаболке их можно прочитать в блокноте а те которые к лексикону нет |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Вт Июн 02 2009, 18:19 | Вт Июн 02 2009, 18:19 | |
| Desert Fox_ Я пытался это делать раньше ,только назвал /мой.dic/ . Все равно в тексте читает- "* * *".
evilone_ (те словари которые к балаболке их можно прочитать в блокноте а те которые к лексикону нет ) Я наверно неправильно технически выражаюсь - я имею ввиду ,что при двойном клике левой кнопкой мыши по любому словарю в открытой Балаболке выходит таблица "Коррекция произношения" и в словарях omograph.dic ,Alyona22k.dic , punktuation.dic в левой большой части нет ничего-нечего корректировать , а словари sz_bukvayo.dic. и default.dic открываются для коррекции (левая таблица содержит список замен). |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Пн Июн 08 2009, 14:39 | Пн Июн 08 2009, 14:39 | |
| evilone_ По поводу (* * *)- экспериментируя обнаружил что если самому ввести (***-без пробелов) в читаемый текст(а в тексте стоят пробелы между (*)) и соответственно внести изменения в Lexicon Manager и dic.словарь Балаболки-"абзац главЫ" ,то начинает читать как надо. Но при этом если поставить пробелы (* * *)читает как "звездочка ...", хотя в Lexicon и dic.словаре я внес изменения т.е. приходится в тексте самому перебивать(***)и еще ставить точку(иначе не делает паузы).В Lexicon и dic. словарях я проставил разные сочетания "звездочек"-(** * ** , _* * *_,_** * **_),но правильно читает только(***- без пробелов). Вопрос: может в словарях есть какое-то закрепленное понятие "звездочка с пробелом"? И еще один вопрос : - в книге у меня время проставлено как (11.31 -с одной точкой)и соответственно читается "одиннадцать целых тридцать одна сотая".Чтобы добавить в словари все часы с минутами надо будет внести 1440 записей.Нельзя ли как-то дать понять словарю что это надо читать как время (пусть даже как "одиннадцать тридцать одна")? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Июн 09 2009, 15:34 | Вт Июн 09 2009, 15:34 | |
| RIA неужели так сложно прочитать абзац текста и нормально сделать замену как писали выше? зачем такие сложности и экспирименты? а с числами замени точку на "-" или "_" |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Ср Июн 10 2009, 12:02 | Ср Июн 10 2009, 12:02 | |
| evilone_ Просто у меня 13 книг , в каждой порядка 70 значков (* * *), т.е. долгая правка. Но я нашел способ -перевожу документ в Word и делаю автоматическую замену (* * *) на "абзац главы",а потом открываю Балаболку. И с временем та же история -порядка 70-100 времен,вручную долго править. |
|
| | | Sylvia Участник «online словари»
Сообщений : 72
Репутация : 83
| Sylvia | :: Ср Июн 10 2009, 16:38 | Ср Июн 10 2009, 16:38 | |
| - RIA пишет:
- evilone_
Просто у меня 13 книг , в каждой порядка 70 значков (* * *), т.е. долгая правка. Но я нашел способ -перевожу документ в Word и делаю автоматическую замену (* * *) на "абзац главы",а потом открываю Балаболку. И с временем та же история -порядка 70-100 времен,вручную долго править. Если потом открываешь Балаболку, для чего править в Worde? Ведь это же самое можно сделать в Балаболке, комбинация Ctrl+R. Все автоматически заменяется... О ручной правке никто не говорит. |
|
| | | RIA Новичок
Сообщений : 12
Репутация : 1
| RIA | :: Чт Июн 11 2009, 11:18 | Чт Июн 11 2009, 11:18 | |
| Sylvia_ Спасибо за подсказку , я как то прошлепал ушами в правке эту позицию. |
|
| | | vnb1953 Наблюдатель
Сообщений : 3
Репутация : 0
| vnb1953 | :: Вс Июн 28 2009, 18:27 | Вс Июн 28 2009, 18:27 | |
| Здравствуйте. Создал, как посоветовали на форуме свой словарь для Аленки, MyAlyona.dic. Но вот возникла проблема: попытался изменить произношение следующей фразы "В 1994 году". Внес с помощью "Балаболки" в свой словарь вышеуказанную фразу, прослушал, сохранил, запустил прослушивание текста с этой фразой-произносит не правильно. Вопрос: как быть, если в словарь Алены (под Балаболку) для коррекции произношения требуется внести фразу с пробелами между словами? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пн Июн 29 2009, 03:19 | Пн Июн 29 2009, 03:19 | |
| vnb1953 в лексикон слова с пробелами вносить не получится, такие словосочетания лучше вносить в словарь замен (балаболкин) в виде: В 1994 году=В 1990 четвертом году В 1995 году=В 1990 пятом году В 1996 году=В 1990 шестом году и т.д. |
|
| | | vnb1953 Наблюдатель
Сообщений : 3
Репутация : 0
| vnb1953 | :: Пн Июн 29 2009, 13:08 | Пн Июн 29 2009, 13:08 | |
| Здравствуйте. evilone спасибо за ответ. По ходу работы сс словарями в "Балаболке" возник вопрос - каким символом в словарях корректируемых из "Балаболки" обозначается ударение. Перепробовал символы из окна редактирования (*,^,') читает совсем неправильно. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Июн 30 2009, 02:24 | Вт Июн 30 2009, 02:24 | |
| vnb1953 никаким, ударения, если этого слова нету в лексиконе, голос не воспринимает, но если например в лексиконе есть запись словА # s l V v A1 тогда можно в тексте ставить вместо "слова" - "словА" и тоже самое и со "слОва" проще говоря для любого никак, но помечать можно, предварительно внеся слово в лексикон. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Июл 01 2009, 01:21 | Ср Июл 01 2009, 01:21 | |
| lev55 так уже вроде нарисовано и вроде бы все ясно, по установке так точно с картинками, осталось разве что только записать видео |
|
| | | bober Наблюдатель
Сообщений : 3
Репутация : 1
| bober | :: Пн Июл 20 2009, 08:03 | Пн Июл 20 2009, 08:03 | |
| Чтобы не читались звездочки сделал в балаболке: *= А с точкой такое не проходит, все равно читает, например проблемы с именами: В.И.Ленин ВточкаИточкаЛенин, подскажите как вы побороли точки, неужели все имена известных людей записывать в словарь: В.И.Ленин=Ленин. Спасибо! |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Июл 21 2009, 12:56 | Вт Июл 21 2009, 12:56 | |
| bober нужно чтобы перед точкой не стоял пробел, даже не так, чтобы сохранялись правила оформления печатного текста, т.е. после знака препинания пробел а перед ним без пробела не В.И.Ленин а В. И. Ленин |
|
| | | st5s Наблюдатель
Сообщений : 3
Репутация : 0
| st5s | :: Ср Июл 22 2009, 11:06 | Ср Июл 22 2009, 11:06 | |
| Всем привет. Пользуюсь движком Аленка - имхо лучший из в настоящий момент существующих. Есть желание внести свой вклад в словари, но естественно сразу возникает определенное количество вопросов. сразу переварить информацию написанную на форуме не получилось, возможно на мои вопросы уже были ответы, поэтому попрошу отослать по ссылке если повторюсь. вопросы следующие: 1)Лексикон слов для участия в проекте делать отдельным словарем? 2)синтаксис транслита не совсем ясен, где можно ознакомиться подробней (расстановка ударений была описана 1 или 2 - тут все понятно) 3) программа по отлову труднопроизносимых слов - какие образом она их определяет? 4) я правильно понял, если пополнять словари Аленки, то все программы которые с этим движком работают будут произносить слова правильно? Остальные вопросы немного не в тему (к словарям отношения не имеют), но все же 5)пробовал несколько программ, кроме балаболки ни одна нормально в мр3 не перегоняет (KoobAudio - как я понял из прочитанного работает со своим словарем), некоторые перегоняют только из формата txt - что тоже неудобно, другие же (cool reader например - пользуюсь для прослушки на компе) что то создает быстро и в результате маленький по размеру файл мр3 и одни шумы. Другие программы тоже несколько секунд и все... до мр3 book 2005 еще руки не дошли правда. |
|
| | | Vladimir_02 Посетитель
Сообщений : 28
Репутация : 9
| Vladimir_02 | :: Ср Июл 22 2009, 14:14 | Ср Июл 22 2009, 14:14 | |
| Всем Привет! Админы! создайте тему по Сакраментовским голосам (пробовал создать - не могу)... у меняч есть полностью зарегеннная версия движка с 5-ю голосами (Вика, Вячеслав, Ирина, Юлия, Юрий)... имхо голоса будут похуже Алёны, Ольги и Катерины, а некоторые даже лучше Николая... В комплекте есть редактор словаря и голоса... тут http://letitbit.net/download/5340.ad58cc8d2eb1a956993b6c131/Sacrament.rar.html все в одном архиве (19 мб)... если надо - разбейте по отдельности на движок и голоса и перезалейте... |
|
| | | donbaton Интересующийся
Сообщений : 7
Репутация : 0
| donbaton | :: Ср Июл 22 2009, 14:38 | Ср Июл 22 2009, 14:38 | |
| У меня дабавлении дополнительных словарей плюсы из них читаются Аленкой. И шипелявить начинает. |
|
| | | st5s Наблюдатель
Сообщений : 3
Репутация : 0
| st5s | :: Пт Июл 24 2009, 09:43 | Пт Июл 24 2009, 09:43 | |
| Первая часть словаря Парадигма Зализняка для Loquendo (с ударениями), переделанные для Аленки. http://webfile.ru/3794253# Что бы подключить словарь необходимо файл переименовать в Alyona22k.dic Естественно все сырое. Пробуем, тестируем...если есть смысл - переделаю остальную часть словаря. потом можно будет и слова для николая с ударениями таким же макаром перегнать. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Авг 23 2009, 14:34 | Вс Авг 23 2009, 14:34 | |
| st5s при беглом взгляде в лексиконе очень много ошибок в транскрипциях, не просто неточностей а именно не правильных транскрипций пример: - Цитата :
- абонементен
#V b @ n' $ m'1 n' t' $ n вместо #V b @ n' $ m' e1 n' t' $ n |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Ср Сен 02 2009, 13:27 | Ср Сен 02 2009, 13:27 | |
| Более-менее вычитал лексикон Alyona22k. Кое-что убрал: - грамматически неверные формы - составные слова, которые там и по отдельности есть - с частицей -то (я их по др. обрабатываю) - те, которые ни в одной книге не встречал и вряд-ли встречу - которые у меня и так в любом раскладе правильно читает - имена и географию выделил в отд. лексикон. Кое-что добавил и добавляю по мере работы с книгами. Много что исправил. И грамм. ошибки и неправильное произношенние и то, что не нравилось (меня раздражало, напр., чрезмерное аканье). Ряд исправлений сделал и в лексиконовском омографе, только то, с чем по ходу сталкивался. Хотя там достаточно много неточностей, имхо. Затачивал под свое восприятие, естественно. Но, может кому интересно будет, могу выслать. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Сен 02 2009, 16:44 | Ср Сен 02 2009, 16:44 | |
| al2055 конечно высылайте, точнее заливайте и показывайте ссылку особенно про омографы как показала практика, в лексикон 90% идут имена и названия которые характерны для каких-то одних книг\жанров и добавить их всех просто нереально и проще самому по чуть-чуть туда добавлять чем собирать все в кучу и его еще и проверять нужно будет потом наверно |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Чт Сен 03 2009, 14:55 | Чт Сен 03 2009, 14:55 | |
| Вот здесь лексиконы. Первые два как стоят у меня, а омографы – выделил те, которые успел исправить и добавить. Которые совсем уж отвратно у меня читались. Все проверил и проставил части речи, по возможности.
http://slil.ru/27950538
Попутно вопрос, если можно. Установил движок в начале июня. Тогда же и словари все скачал. Честно говоря, так понял из того, что успел прочитать на форуме и лелеял надежду, что кто-то исправит ошибки, которых хватает в словаре замены ударений. На днях скачал оный от 27.08. Так понял, что идут только добавления. Ошибки, в основном, все остались. Очень много повторных определений, неоднозначных фраз. Примеров масса, приведу некоторые, которые под руку попались:
метровой длиннЫ; годА два назад; св. иегУменья
Генриха XVIII=Генриха восьмого Генриху XVIII=Генриху восьмому
восемсот, девятсот, шэстьдесят, шэстой, шэстого, шэсть, одИнадцать, одИнадцатом - мне кажется, в оригинальном написании звучит гораздо лучше.
вот и все=вот и всё; все быстро=всё быстро и т.д. - очень уж неоднозначно.
Это не критика . Просто хотелось бы знать, ведется ли такая работа, чтоб не было двойных усилий. Процентов 30-40 словаря я уже сам перелопатил, слишком много времени это занимает. Что-то убрал, что-то добавил, что-то исправил. Все соберу и выложу, если это в чем-то поможет. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Чт Сен 03 2009, 17:15 | Чт Сен 03 2009, 17:15 | |
| al2055 критика это наоборот хорошо, значит кому-то это нужно да в словаре есть ошибки, точнее они в нем были. изначально за основу словаря брался старый словарь от николая и долго, по мере нахождения в нем всего "нового" и "интересного", вычищался.
так специально каждую строчку в нем никто не проверял, потому что все либо лентяи либо просто нет свободного времени этим заниматься, а проверялись только новые, какие-то самые частые замены и те ошибки которые явно выпирали при чтении из старых.
грамматика местами хромать может потому что ее специально искажали для лучшего чтения слов движком, но таких слов не так уж и много, по крайней мере для аленки, и скорее всего это тянется еще от колькиных словарей "шэсть" и "одИнадцать" точно
поэтому если заметили какие-то неточности говорите поправим, это нормально лексиконы поглядим, а замены если есть исправления то конечно лучше пришлите синхронизируемся
замены с числами скоро наверно вообще не нужны будут, для них будет словарь Вадима
а вот с лексиконами все не так просто, там нужно сидеть и проверять каждое слово, причем мне например нравится акание, а кому-то нет а если показать ссылки на несколько одинаковых лексиконов то это еще больше запутает, многие и так уже жалуются что сильно заумно все это безобразие настраивать нужно
нужно подумать |
|
| | | t64y Новичок
Сообщений : 15
Репутация : 4
| t64y | :: Пт Сен 04 2009, 23:27 | Пт Сен 04 2009, 23:27 | |
| Дорый день. Возник небольшой вопрос по поводу применения словарей и работе балаболки. Суть в том, что знаки препинания в тексте сильно влияют на правильность произношения "Аленкой" некоторых слов. Я имею в виду знаки после слов. Когда точка / запятая , ? , ! , ; и : / стоит сразу после слова. ( иногда -и- читат как -я- или тянет как в английском - длинное - и - и ит.п. ). Если знаки ставить через пробел - то этот дефект пропадает. Создал словарик замен знаков препинания с пробелом но Балаболка не хочет производить замену. ,= , != ! ?= ? ;= ; .= . Приходится сохранять в текстовом файле и там уже править.В принципе не долго но как-то не серьёзно, ведь по идее и Балаболка должна это делать. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Сен 05 2009, 01:36 | Сб Сен 05 2009, 01:36 | |
| - t64y пишет:
- Создал словарик замен знаков препинания с пробелом но Балаболка не хочет производить замену.
это глупая затея, такие замены будут читаться как точка, запятая, словами каждый знак уже давно проверено. вот подключи этот словарик и будет тебе счастье |
|
| | | t64y Новичок
Сообщений : 15
Репутация : 4
| t64y | :: Сб Сен 05 2009, 10:17 | Сб Сен 05 2009, 10:17 | |
| Верю , что затея не шибко умная. Но знаки читает только при повторах типа многоточия когда пробел попадает между знаком. - !!! ! - если слитно то нет. Я не пишу аудио /90% времени провожу перед компом/ читаю с экрана. Так, что все что режет уши отлавливается сразу, и далее в редактор. Причем как правило запускаю несколько вариантов обработаного Балаболкой текста. Имеется в виду различные версии словаря ударений - какой лучше не скажу, слишком разные результаты , здорого зависит от текста. Бывает что необработанный вообще читает лучше всего. Ёфикацией не пользуюсь - слишком много ошибок - два слова исправляет и в три вносит ошибки. А словарик попробуем. С сосвоим тоже разобрался. Добавил * перед знаом.Работает. Ещё хотелось сказать СПАСИБО всем кто работает на форуме, отвечает на глупые /повторяющиеся/ вопросы, пытатся ловить кряки и их исправлять. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Сен 05 2009, 13:30 | Сб Сен 05 2009, 13:30 | |
| с заменой != ! получится замена - Цитата :
- слово!=слово !
а если ! !=!! то оно будет пропускать, например, если там не один а два или три пробела между знаками. по-моему проще не искать варианты замены а сделать отдельный лексикон вида: - Цитата :
- ! #_
? #_ ... |
|
| | | t64y Новичок
Сообщений : 15
Репутация : 4
| t64y | :: Сб Сен 05 2009, 22:23 | Сб Сен 05 2009, 22:23 | |
| - Цитата :
- по-моему проще не искать варианты замены а сделать отдельный лексикон
- так не проще , а правильней. Что касается - Цитата :
- а если ! !=!! то оно будет пропускать, например, если там не один а два или три пробела между знаками.
-то Аленки до лампочки подобные знаки - !!!!!- или ! ! ! ! , !!! ??. и т.д. точнее их количество, на эмоциональную окраску голоса это сильно или вообще не влияет. Поэтому у меня просто в словарь замен забиты строчки типа - " ! ! ! = !!! " , " . . . . = ...." . И уж после я добавляю пробел перед знаком. А на счет лексикона я с вами согласен, так наверное проще и самое главное правильно. Просто принцип его работы достаточно своебразен и к сожалению не всегда понятен. И что самое обидное - не всё с его помощью получается сделать. Например если я искажу /изменю/ написание слова ,при помощи словаря замен - разову на части , или ,наоборот солью в одно, или что, тоже весьма интересно добавлю - Ь- или - Ъ-, то удается добится, того что в лексиконе не получится. Кстати насчет -Ь- это тоже один из способов /вариантов/ бороться с "Аплохо" - вставляю -Ь- после не - "неьплохо ", "неьправда" , |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Сб Сен 05 2009, 23:06 | Сб Сен 05 2009, 23:06 | |
| evilone_ - Цитата :
- замены с числами скоро наверно вообще не нужны будут, для них будет словарь Вадима
Хорошо бы, а то с числами действительно иногда ерунда выходит. Но пока еще нужны, я думаю. Вот тут замены с числами, которые я все (надеюсь) исправил. И пресловутые "шэсть" и "одИнадцать", и пары "гОда-годА", "гОду-годУ", и пр. Выберу время, приведу в порядок свои словари, пошлю что исправлял. ПосмОтрите, может сгодится .
http://slil.ru/27956706
Кстати, думаю, что в заменах типа: - Цитата :
- — не помн*=— не' помн
неплохо было бы длинное тире заменить или хотя бы продублировать. И подобные же замены для слитного написания слов, т.е "непомн*" и т.д. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Сен 06 2009, 00:01 | Вс Сен 06 2009, 00:01 | |
| - t64y пишет:
- А на счет лексикона я с вами согласен, так наверное проще и самое главное правильно.
так получилось избавиться от неправильного произношения? если явно указать в лексиконе знаки препинания считать как пауза, не меняется ли интонация предложения?
- t64y пишет:
- Кстати насчет -Ь- это тоже один из способов /вариантов/ бороться с "Аплохо" - вставляю -Ь- после не - "неьплохо ", "неьправда" ,
у нас одинаковый подход, только вместо - Ь- или - Ъ- указывается ' который в лексиконе указан как короткая пауза, в результате чего не меняя общей интонации предложения получается сделать маленькую паузу между слогами(буквами) за счет чего исчезает аленкины "фефекты фикции"
- al2055 пишет:
- ПосмОтрите, может сгодится
обязательно, более того будем объединять и чистить, по чуть-чуть, самое главное не менять порядок строк в словаре и ни в коем случае не сортировать по алфавиту\длине а то будет сложно сверять потом
- al2055 пишет:
- неплохо было бы длинное тире заменить или хотя бы продублировать
да это не все варианты, нужно просчитать все возможные варианты написания а то это "апомню" уже надоели совсем :34: |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Пн Сен 07 2009, 04:03 | Пн Сен 07 2009, 04:03 | |
| evilone_
Это-то понятно. Но путаница с тире приводит к тому, что просто не все правила отрабатываются. Я у себя в правилах поставил *—=- *–=- т.е. замену длинного и короткого тире неразрывным дефисом. И предварительно прошелся этим по всем словарям. Хоть этой путаницы избежал.
У меня достаточно много исправлений и добавлений, которые меня устраивают, но, к сожалению, не предполагал... ну, скажем, обмена мнениями, и посему все смешалось... Уже и не помню, что, где и откуда, что мое, что уже было.... Постараюсь понемногу выделить все изменения. Пока так, понемногу, субъективно: *ая жара=ая жарА ; неоднозначно, напр.: поддавая жАра но знаю=но ззнаю ; ноъ знаю звучит лучше, аналогично *знать,=знать ; *знать,=знать _ *нял?=нял. ; *нял?=нял_? часты проблемы с одиночными "а" и "и", также буква "п" и пр., что часто попадается: а,=а-а, ; а.=а-а. а...=а-а. ; а!=а-а! а?=а-а? ; а_*=а-а_ и...=_и... ; и!=_и! и?=_и? ; *и и=и, и * - п*= _п ; *, п*= _п *ла я=ла а я ; *ни я,=ни яъ _ ого, *=ого _ ; д'*=дэ *знал,=знал _ ; эти "*=эти _ ; эти -*=эти _ *шали.=шали _ ; *шей,=шей _ *щей,=щей _ ; *ью,=ью _
Мне все это и подобное значительно улучшает восприятие, учитывая, что я слушаю книги с телефона во время поездок и разных ожиданий, а не читаю с компа. Может, кому еще пригодится. Не знаю, может, не стоит тут столько писать. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пн Сен 07 2009, 16:04 | Пн Сен 07 2009, 16:04 | |
| - Цитата :
- Это-то понятно. Но путаница с тире приводит к тому, что просто не все правила отрабатываются. Я у себя в правилах поставил
*—=- *–=- т.е. замену длинного и короткого тире неразрывным дефисом. И предварительно прошелся этим по всем словарям. Хоть этой путаницы избежал. а разве в словарях правила не обрабатываются по принципу от самого длинного правила к самому короткому? т. е. от такой замены толку никакого а если по ней еще по словарям пройтись то будет караул просто
вот для примера словарь: - Цитата :
- *—=-
а-а=аа текст: - Цитата :
- а—а
после замены так и останется а—а - Цитата :
- У меня достаточно много исправлений и добавлений, которые меня устраивают, но, к сожалению, не предполагал... ну, скажем, обмена мнениями, и посему все смешалось...
мне интересно были ли какие-то правки в плане удаления строк, т.е. новые и правки по тексту найти не сложно а вот попадались ли явно лишние замены?
можно какой-то пример текста для замен с которыми читается лучше - Цитата :
- *и и=и, и
*ла я=ла а я *ни я,=ни яъ _ ого, *=ого _
а то у меня читается как-то одинаково что с ними что без них
- Цитата :
- понемногу, субъективно неоднозначно
если есть сомнения лучше всего искать по корпусу быстро можно увидеть вероятность подобной замены в тексте. |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Вт Сен 08 2009, 13:07 | Вт Сен 08 2009, 13:07 | |
| evilone_ 1. В словаре более 30 длинных и коротких тире, правила с которыми не всегда отрабатывают в тексте на дефисах и наоборот. Примеры из словаря: все — как в=всё — как в теперь — все=теперь — всё — не помн*=— не' помн Я исправил все это в словаре и маленьким словариком из 2-х строк: *—=- и*–=- прохожусь по текстам перед дальнейшей обработкой. И вообще у меня словарь разделен: выражения с омографами; все, что связано с числами; имена; «трудные» слова; аббревиатуры и т.д. выделены в отд. словари. Мне так легче отслеживать. 2. По поводу *и и=и, и *ла я=ла а я *ни я,=ни яъ _ ого, *=ого _ В выражениях типа: «ни я, ни ты (он и пр.); «усни я, ты» и в подобных , «я» читается, как «ё» или «ю» «ого,» читается что-то типа «огэ» или вообще смазывается: «ого, а ты молодец», «ого, я не ждал» и пр. по поводу первых двух так с ходу не вспомню, проявляется реже, в достаточно длинных выражениях, особенно при записи; съедаются конечные «и» и «а» в словах. 3. Примеры из словаря «навскидку»: возвышались горы хлама=возвышались горЫ хлама; на вашем дому=на вашем домУ; те доски=те доскИ; засыпаю ее=засЫпаю её; *хие доски=хие доскИ; ----- сухие дОски *шие доски=шие доскИ; ----- высохшие, отсыревшие и т.д. дОски из тени=из тенИ; ----- «в тенИ», но «из тЕни» конец начала=конец начАла;----- возможно и такое, но «под конец началА», напр., чаще.
Во многих случаях ударение равновероятно, так если точно не определять выражения, лучше уж оставить на усмотрение движка, я думаю:
птенцам ворона=птенцам вОрона; ----- своим птенцам ворОна принесла приходите на Землю=прихОдите на Землю; ----- приходИте на Землю прикрывал спины=прикрывал спинЫ; ----- прикрывал спИны друзей тона краски=тонА краски; ----- такого тОна краски напротив окна=напротив окнА; ----- в доме напротив Окна краю стены=крАю стенЫ; ----- на краЮ стенЫ знал места=знал местА; ----- не знал мЕста *ей руки=ей рукИ; ----- (целую, мою и т.д.) ей рУки; протянул к ней рУки Таких примеров достаточно |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Сен 08 2009, 18:09 | Вт Сен 08 2009, 18:09 | |
| идея мне нравится, только в два прохода обрабатывать текст можно если предварительно записывать текст, а если слушать "на лету" то такой вариант не пройдет, надо подумать...
- Цитата :
- Примеры из словаря «навскидку»
тут можно долго спорить, проще самому послушать и выбрать как лучше звучит. не всегда правильное написание звучит именно так как написано, но действительно иногда попадаются явно лишние замены, пишите если увидели, будем исправлять.
оставить на усмотрение движка не выйдет потому, что всегда читается только одна форма омографа, и если явно не указать другую, ту которую голос не читает явно, то она читать сама никогда не будет. в словаре сейчас замены для омографов только той формы которую голос не читает сам без простановки в нем ударения.
- Цитата :
- А кроме тебя, словарями для Алёны кто ныть занимается?
тут, только Sylvia и muk остальные все бездельники |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вт Сен 08 2009, 21:27 | Вт Сен 08 2009, 21:27 | |
| al2055 обновили словарь замен с учетом неразрывного тире и твоих словарей замен и правок. для чтения "на лету" да и вообще чтения нужен "словарь коррекции текста" дополнительный словарь по типу твоего который преобразовывает длинный и короткий дефис в неразрывное тире перед заменой основным словарем, в общем вроде работает, проверь.
- lev55 пишет:
- Была мысль синхронизировать olga_plus.7z(0omograph.dic) с omograph.dic (для Алёны).
была и сплыла 60к против 21к есть над чем работать, в том же словаре омографы наверно во всех формах и в той которая читается всегда и в той которая не читается сама никогда? ударения у ольги ставятся просто в слове а у аленки его нужно еще вносить в лексикон. сравнить два словаря это дела 5 минут мне нужен список слов в которых есть ударение, например: - Цитата :
- девушке-лисе=девушке-лисЕ
девчонкины косы=девчонкины кОсы девяти утра=девяти утрА девятиэтажные корпуса=девятиэтажные корпусА девятого часа=девятого чАса девять утра=девять утрА - Цитата :
- лисЕ
кОсы утрА корпусА чАса
... тогда можно попробовать, хотя не факт что аленка станет читать лучше и все замечания al2055 у omograph.dic так же касаются и 0omograph.dic судя по всему
где-то треть словаря числители (даты, года, века и т.д.) их уже можно выкидывать и брать словарь https://mytts.forum2x2.ru/forum-f11/tema-t310.htm
и все замечания al2055 у omograph.dic так же касаются и 0omograph.dic судя по всему, если они как-то пересекаются, а они по-моему пересекаются? |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Вт Сен 08 2009, 22:58 | Вт Сен 08 2009, 22:58 | |
| evilone_
- Цитата :
- в словаре сейчас замены для омографов только той формы которую голос не читает сам без простановки в нем ударения.
Не совсем так. Опять таки "навскидку", открываем словарь на предлоге "до":
до дела=до дЕла до кости=до кОсти до лагеря=до лАгеря до места=до мЕста до моря=до мОря до начала=до начАла до ночи=до нОчи до полу=до пОлу до пояса=до пОяса до самого конца=до сАмого концА до самой кончины=до сАмой кончины.
Все эти (и еще много других) замены лишние. Движок читает так же без замен и даже лучше, на мой вкус. С заменами чересчур окает. Без оных "до" читает как "дъа". |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Сен 09 2009, 01:03 | Ср Сен 09 2009, 01:03 | |
| al2055 тут читать как "в словарь сейчас добавляются только замены для омографов той формы которую голос не читает сам без простановки в нем ударения" это если проводить сравнения со словарями к ольге.
то что там есть лишние замены факт, но вреда от них не много хотя до пояса=до пОяса это совсем не лишняя замена |
|
| | | | Обсуждение словарей |
---|
| |