TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



Пожелания по развитию программы

Предыдущая тема Следующая тема Перейти вниз
На страницу : 1, 2, 3 ... 10 ... 20  Следующий
АвторСообщениеПожелания по развитию программы
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пт Ноя 14 2008, 00:19
Пт Ноя 14 2008, 00:19

Буду рад выслушать пожелания и советы по дальнейшему развитию программы "Балаболка". Не могу обещать, что все из этого реализую, но постараюсь все пожелания хорошенько обдумать и учесть. Заранее спасибо.

Прошу лишь принять во внимание, что "Балаболка" была задумана как программа для пользователей РАЗНЫХ СТРАН, использующих голоса для разных языков. Поэтому не следует просить меня адаптировать программу под конкретный русский голос (например, "Николай"); постарайтесь предлагать новые функции, которые пригодятся самому широкому кругу пользователей.

Также, не забывайте, что мои силы и мои финансовые возможности не безграничны; не просите меня разработать новый формат текстовых файлов специально для "Балаболки" или вставить в программу универсальный каталогизатор данных. Будьте реалистами в своих желаниях. Над программой могу работать лишь по ночам и по выходным; у меня есть основная работа (в одном из ивановских ВУЗов), есть еще один программный продукт Cross+A (программа для решения головоломок). Также, все еще не теряю надежды найти свою суженую, тогда у меня вряд ли будет много времени на программирование (по ночам буду заниматься женой, а по выходным ходить в гости к ее родственникам). Мне нравится работать над "Балаболкой", но эта программа не является всем смыслом моей жизни. Так что, если можете помочь чем-либо развитию программного продукта, если у Вас есть какие-либо полезные навыки - не стесняйтесь предложить свою помощь. Например, перевести интерфейс программы и ее файл справки на другие языки, улучшить графическое оформление "Балаболки"; помочь материально, наконец. Beneficium non in eo consistit, quod datur, sed in animo ejus, qui dat. (Благодеяние состоит не в том, что даётся, а в порыве души дающего.)

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пт Ноя 14 2008, 01:03
Пт Ноя 14 2008, 01:03

перекорчевую сюда со своими безумными идеями Smile
Программа на самом деле просто прелесть, и уже и так заслуживает всяких похвал.uraa
Главное чем в ней сейчас пользуемся это конечно то самое пресловутое ctrl+T очень упрощает проблему решения произношения при чтении книг для Аленки.
Если можно пару слов про
Цитата :
возможность выбирать - применять правила коррекции произношения к абзацам или к предложениям.
что это будет за функция и где ее лучше всего применять?
и чуть-чуть про
Цитата :
запись в аудиофайл без предварительной подготовки
пока что самое первое что приходит в голову из доделать это дополнительные фенички по подготовке текста к чтению. Например простановка точки после каждого разрыва строки или абзаца. В программке Textaloud как-то сделано так что при таких ситуациях текст все равно читается как положено с соблюдением пауз как в предложениях.
Может быть какие-то опции с установкой времени задержки после точки запятой новым абзацем или разделителем на новую строку чтобы небыло привязки к знакам препинания. То что говорили про поиск новых слов. Что автоматически ищутся слова с учетом частоты появления в тексте чтобы потом было проще подправить произношение их движком. read

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пт Ноя 14 2008, 01:28
Пт Ноя 14 2008, 01:28

evilone_ пишет:
что это будет за функция и где ее лучше всего применять?
Там будет картинка, в окне "Настройки". Как гласит китайская пословица, "одна маленькая картинка стоит тысячи слов". Smile

Поиск новых слов нужен, согласен, буду думать над этим.

Вернуться к началу Перейти вниз
Sylvia
Участник «online словари»
avatar


Сообщений : 72
Репутация : 83

 Sylvia :: Пт Ноя 14 2008, 10:49
Пт Ноя 14 2008, 10:49

balabolka пишет:

Поиск новых слов нужен, согласен, буду думать над этим.
uraa Здорово, если Вы это сделаете! Я думаю, что вполне достаточно будет поиска только слов с заглавной буквы, главное, что найдутся все имена. Желаю Вам дальнейших творческих успехов в работе и личной жизниSmile

Вернуться к началу Перейти вниз
mia
V.I.P.
avatar


Сообщений : 184
Репутация : 7

 mia :: Пт Ноя 14 2008, 13:27
Пт Ноя 14 2008, 13:27

Хотелось бы чтобы при подключении словаря .hmg выбор как-то запоминался и записывался в отдельный словарь как бы замен - постоянно наполняясь упрощая каждый последующий раз работу по поиску\замене. Не для текущего документа а как-то глобально потом перетекало в из .hmg в .dic

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пт Ноя 14 2008, 13:48
Пт Ноя 14 2008, 13:48

Sylvia пишет:
Я думаю, что вполне достаточно будет поиска только слов с заглавной буквы, главное, что найдутся все имена.
Хотелось бы, все-таки, поподробнее узнать, как именно по мнению пользователей должен выглядеть поиск новых слов - как в mp3book, например? Можно каждый раз находить ВСЕ слова, присутствующие в тексте, но ведь тогда придется снова и снова отслушивать одни и те же слова; значит, нужен некий список прослушанных слов? Но разные голоса будут читать одно и то же слово по-разному; значит, нужно составлять списки прослушанных слов для КАЖДОГО используемого голоса? Как именно должно корректироваться произношение найденных слов? Что делать с теми словами, чье правильное произношение пользователю неизвестно (не все же из нас филологи и лингвисты)?

Если у кого-либо из пользователей есть чёткое представление того, что именно должен делать поиск новых слов и как это должно выглядеть в программе "Балаболка" - опишите это на форуме, пожалуйста. пока у меня в голове нет ясной картины того, что необходимо реализовать в поиске.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Пт Ноя 14 2008, 13:51
Пт Ноя 14 2008, 13:51

В программе есть три опции по подготовке текста:
удаление переносов строк
удаление дублированных пробелов
удаление знаков переноса

1 Хотелось бы объедениения этих трех опций в один пункт меню и возможно удаление из меню их составляющих.

Мысль возникла после выполнения этих операций в последовательности приведшей к недостаточно корретной обработке текста.

2 Не все движки в состоянии правильно прочесть числителные и названия годов. При подготовке текстов преобразование их в пропись очень бы улучшила процесс озвучки.
Та же Ольга не в состоянии прочесть числа заканчивающиеся на 2 тысячи (52000) и т.п.
а в 1934-м к 1913-му и тому подобное и вовсе не всякий движок коректно прочитает.

Цитата :
Хотелось бы, все-таки, поподробнее узнать, как именно по мнению пользователей должен выглядеть поиск новых слов

Идеальный вариант - утилита Accentfixer от Ajaja c использованием морфологического словаря для проверки павильности прочтения слов диктором. Пока существует только для Алены. А будь такая для Ольги, я думаю она бы стала суперзвездой среди чтецов. Исходники ее были на абуковскрм форуме.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пт Ноя 14 2008, 14:08
Пт Ноя 14 2008, 14:08

mia пишет:
... выбор как-то запоминался и записывался в отдельный словарь как бы замен
Именно над этой проблемой и бьются авторы программ для чтения вслух: необходимо "как-то запоминать как бы замены" для омографов. Smile
Нет, серьезно, очень сложно придумать и реализовать такой способ. Сейчас в "Балаболке" есть возможность задавать целые фразы, где присутствует омограф; когда программу будет выполнять поиск омографов, то, встретив такую фразу в тексте, "Балаболка" автоматически заменит ее на фразу из словаря. Вот как выглядит редактор фраз с омографом:

Этот способ далек от совершенства, так что замечания и предложения от пользователей приветствуются.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пт Ноя 14 2008, 14:24
Пт Ноя 14 2008, 14:24

Lexus пишет:
1 Хотелось бы объедениения этих трех опций в один пункт меню и возможно удаление из меню их составляющих. Мысль возникла после выполнения этих операций в последовательности приведшей к недостаточно корретной обработке текста.
Если я объединю эти три опции в одну, где гарантии, что они не будут выполняться в этой самой "неправильной последовательности"?! А какова "правильная последовательность"?

Нет, не вижу необходимости объединять эти пункты меню. Например, не обязательно удалять разрывы строк внутри абзацев (как это бывает в старых текстовых файлах, созданных еще в MS-DOS): достоинством "Балаболки" как раз и является то, что она может читать неотформатированный текст.

Lexus пишет:
2 Не все движки в состоянии правильно прочесть числителные и названия годов. При подготовке текстов преобразование их в пропись очень бы улучшила процесс озвучки.
Хорошая идея, но как быть с другими языками, как быть с падежами и родами числительных? Sad Надо подумать; спасибо!

Вернуться к началу Перейти вниз
muk79
Участник «online словари»


Сообщений : 103
Репутация : 29

 muk79 :: Пт Ноя 14 2008, 14:31
Пт Ноя 14 2008, 14:31

balabolka пишет:
Сейчас в "Балаболке" есть возможность задавать целые фразы, где присутствует омограф
А можно подробнее про задавание целых фраз 3-4 слова. то делается через словарь вручную или все-таки как хочет mia в процессе редактирования текста словарем омографов т.е. например в фразе:
Код:
Он отрыл замок на двери своим ключем
ставится замена по словарю из зАмок; замОк
Код:
Он отрыл замОк на двери своим ключем
И какой-то кусок заносится автоматически в словарь фраз? Так он огда будет очень большой по объему. Может есть смысл отбирать скажем по слову или два слева и справа или только окончание обрамляющих слов.
Например в словарь будет занесена:
Код:
отрыл замОк
замОк на двери
*ыл замОк
Lexus пишет:
Не все движки в состоянии правильно прочесть числительные и названия годов
для этого есть тот самый пресловутый словарь замен и лексикон к нему. Читает превосходно. @

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пт Ноя 14 2008, 15:01
Пт Ноя 14 2008, 15:01

muk79 пишет:
А можно подробнее про задавание целых фраз 3-4 слова.
Что делает поиск омографов в "Балаболке": он просматривает текст от текущей позиции курсора вниз и, найдя омограф из словаря, предлагает в маленьком окошке варианты простановки ударения; когда пользователь выбирает подходящий вариант, программа изменяет текст в главном окне.

Что было добавлено нового: в редакторе омографов для каждого слова-омографа можно заранее задать список фраз, которые будут заменяться при поиске омографов АВТОМАТИЧЕСКИ. То есть, когда "Балаболка" найдет такую фразу с омографом в тексте, она не будет показывать маленькое окошко с вариантами ударений, а самостоятельно осуществит замену.

Что нужно сделать в Вашем примере - заранее в редакторе омографов, для слова "замок" добавить фразы:
Код:
замок на двери=замОк на двери
*ыл замок=ыл замОк
Символ '*' означает, что слева (или справа) могут стоять и другие буквы, что это не конец слова. Кстати, "ыл замок" - не самая удачная фраза; ведь может быть и такой текст: "Туман накрыл замок графа Абрамовича". Так что, добавлять фразу в словарь надо крайне осторожно - если только пользователь абсолютно уверен в единственности варианта ее прочтения.

Если фраза чувствительна к регистру букв, необходимо использовать символ '$':
Код:
$Л. Н. Толстой=Лев Николаевич Толсто<й
Что касается числительных, то смотрите мой самый первый пост в этой теме - в "Балаболку" будут добавляться только те функции, которые будут полезны не только русскоязычным, но и иностранным пользователям; вряд ли я смогу реализовать преобразование чисел в слова для иностранных языков. (Недавно отвечал на вопросы итальянца о "Балаболке": он не знает ни русского, ни английского, я не знаю итальянского; веселая вышла беседа. Smile )

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Пт Ноя 14 2008, 15:19
Пт Ноя 14 2008, 15:19

наболевший вопрос от strudera

Можно ли в программе сделать, чтобы движок инициализировался заново при нажатии на кнопку "Play" если до этого была нажата кнопа "Stop"? Объясню с чем связано: после корректировки словаря приходится в комбобоксе менять движок Ольга на другой и обратно, чтобы подгрузился измененный словарь.

Вернуться к началу Перейти вниз
Sylvia
Участник «online словари»
avatar


Сообщений : 72
Репутация : 83

 Sylvia :: Пт Ноя 14 2008, 15:39
Пт Ноя 14 2008, 15:39

balabolka
Цитата :

Хотелось бы, все-таки, поподробнее узнать, как именно по мнению пользователей должен выглядеть поиск новых слов - как в mp3book, например?
В mp3book нет выбора по частоте встречаемости - только по алфавиту. Мне кажется, это неудобно. Список из 100-200 слов прослушать довольно долго, и кто знает, в начале или в конце списка попадутся слова, которые встречаются по 200 раз. В KoobAudio поиск удобнее, можно прослушать половину списка, а слова, встречающиеся по 1-5 раз можно проигнорировать.

Цитата :
Можно каждый раз находить ВСЕ слова, присутствующие в тексте, но ведь тогда придется снова и снова отслушивать одни и те же слова; значит, нужен некий список прослушанных слов? Но разные голоса будут читать одно и то же слово по-разному; значит, нужно составлять списки прослушанных слов для КАЖДОГО используемого голоса?
Мне кажется, что это слишком сложная и трудоемкая задача для бесплатной программыSmile Хотя это было просто супер. Лично мне хватило бы просто списка всех имен собственных (пусть туда даже попадут слова с заглавной буквы).
Цитата :
Как именно должно корректироваться произношение найденных слов? Что делать с теми словами, чье правильное произношение пользователю неизвестно (не все же из нас филологи и лингвисты)?
Просто прослушать и неправильные занести в лексикон Алены. А если слова неизвестны, то их можно не заносить с словарь...
Хотелось бы услышать мнение других пользователей по этому вопросу. Может, больше это никому и не надо Question

Вернуться к началу Перейти вниз
unknown
V.I.P.


Сообщений : 73
Репутация : 11

 unknown :: Пт Ноя 14 2008, 16:01
Пт Ноя 14 2008, 16:01

Хочется...






Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пт Ноя 14 2008, 21:41
Пт Ноя 14 2008, 21:41

Lexus пишет:
Можно ли в программе сделать, чтобы движок инициализировался заново при нажатии на кнопку "Play" если до этого была нажата кнопа "Stop"?
Ох, как сурово! Я запускал программу и на старых машинах, пяти-шестилетней давности: там смена голоса (инициализация речевого движка) выполняется с заметной задержкой; чем новее голос, тем заметнее пауза. Боюсь, пользователи таких машин побьют меня камнями, если при каждом нажатии "Play" программа будет заново инициализировать голос.

Хорошо, я понял суть идеи, буду думать.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пт Ноя 14 2008, 23:17
Пт Ноя 14 2008, 23:17

а откуда качать новую версию? на страничке пишет 1.22.0.346 а у нас такая уже есть Smile или это она и есть?

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Сб Ноя 15 2008, 00:52
Сб Ноя 15 2008, 00:52

Версия 1.22.0.346 - самая последняя на данную минуту.

slag
Очень интересные картинки, но пока не готов реализовать Ваши идеи:

1) дополнительные кнопки в главное окно добавляться не будут - только если появится что-то очень важное. Например, во многих языках мира омографы не представляют собой такую серьезную проблему, как в русском языке; так что кнопка "Искать омографы" не появится на панели ни в коем разе.

2) идея понятна, но действительно ли надо так часто менять битрейт mp3-файлов?! Качество аудозаписи зависит в большей степени от голоса, а не от битрейта. Если Алена - это 22 КГц, то как ни меняй битрейт, лучше ее звучание не сделаешь; надо просто потратить полчаса, чтобы раз и навсегда найти те параметры аудиофайлов, которые Вас устроят. Это не очень хорошо, когда настройки начинают "расползаться" по окнам программы: есть одно окно настроек афудиофайлов, там и следует задавать битрейт.

3) эта идея просто супер, это совсем другой способ работы с омографами! Но именно потому, что это АБСОЛЮТНО другой способ искать омографы, я пока не готов браться за его реализацию. Два метода искать омографы - это лучше, чем один способ; но и работы для меня вдвое больше...

В любом случае, спасибо за новые идеи; буду рассматривать Ваши картинки и думать еще; тут есть о чем поразмыслить.

Вернуться к началу Перейти вниз
muk79
Участник «online словари»


Сообщений : 103
Репутация : 29

 muk79 :: Сб Ноя 15 2008, 02:34
Сб Ноя 15 2008, 02:34

Упрут идею конкуренты пока думать будете :tsss:
Я так и не понял как же все-таки автоматически добавляются фразы в словарь.
При проверке текста "поиск омографов" напрмер нажимаю "заменять всегда" Что должно быть? Это куда-то запоминается? Куда? Это действие должно добавлять фразу в тот словарь или его нужно открывать и писать туда фразу самому? Если так то тогда это пожелание номером первым наверно нужно ставить - чтобы автоматом кусок фразы шел при простановке омографов и выборе заменять всегда. Если нет то расскажите на пальцах как же все-таки они туда добавляются wall

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Сб Ноя 15 2008, 04:04
Сб Ноя 15 2008, 04:04

muk79 пишет:
Я так и не понял как же все-таки автоматически добавляются фразы в словарь.
Фразы с омографами в словарь автоматически НЕ добавляются. Добавить фразу можно только вручную, в редакторе омографов.

Кнопка "Заменять всегда" при поиске омографов заменяет только лишь слово-омограф на выбранный пользователем вариант из списка; это распространяется на текущую сессию (то есть до перезапуска программы).

Вернуться к началу Перейти вниз
unknown
V.I.P.


Сообщений : 73
Репутация : 11

 unknown :: Сб Ноя 15 2008, 04:57
Сб Ноя 15 2008, 04:57

Тогда в развитие идеи по п.3
Сначала опишу свой метод работы с Балаболкой и Николаем(sapi4).Вполне возможно,что-то
подойдёт и для других движков.
Первое.
В словаре exc_rus.txt(тот,что в папке с движком)у меня полностью отсутвуют какие-либо словосочетания,только одиночные слова,даты и года.СЮДА ВНЕСЕНЫ ОМОГРАФЫ так называемая-первая колонка(например - реки=ре<ки,реки< так вот реки:<ре<ки>/i внесены в этот словарь),где-то 3500 слов-омографов внесено.
Сейчас в словаре exc_rus.txt около 280 000 строк, весит он 9,5 мб(пока не тормозит).
Второе.
Словари .dic представлены:
- new.dic(сюда вношу все текущие корректировки,при прослушивании текущего текста)Затем,слова переносятся,одиночные-в основной(exc_rus.txt),словосочетания-в omo.dic
-omo.dic - представляет собой словарь словосочетаний с встречающимися омографами,т.е. только словосочетания в которых омографы из так называемой второй(третьей)колонки.Если брать вышеупомянутый пример,то только словосочетания,где реки должно звучать,как реки< найдут место здесь.Любые словосочетания где реки должны звучать как ре<ки не попадают сюда,это произношение забито в exc_rus.txt.Это касается всех слов омографов,то произношение,что забито в exc_rus.txt не попадает в omo.dic Здесь только словосочетания с омографами,с отличным от забитого в exc_rus.txt произношения.Единственно,что для правильного произношения в словах оканчивающихся на ударную гласную ставлю "твёрдый знак" излучина реки=излучина рекиъ<
Сейчас в словаре около 9 300 строк,вес 280 кб
-post.dic содержит только форму такого типа - авиамеханик*=авиамеха<ник ... и только!При этом авиамеханик и любые производные от этого слова отсуствуют в основном словаре exc_rus.txt
Никаках $,звездочек впереди(*ов=.....) и т.п.Сейчас там 5 500 строк,вес 115 кб.
Т.е.,что мы имеем? А имеем практически 100% отсуствие пересечений,дубляжа,что отвратно влияет на качесто озвучки.Значительное уменьшение размеров доп.словарей(dic),а про словарь омографов ниже.Улучшению озвучки еще способствует подготовка текста,о чём немного далее.
Всё.
Теперь немного о процессе.
Готовлю текст с помощью ICE Book Reader Professional 8.10 Rus.
Это шикарная программа и форматирует текст для читалки просто бесподобно.
Далее всё переводится в прописной,т.е. никаких заглавных букв.
И в заключении удаляются кавычки и при необходимости скобки(всякие),а также многоточие отодвигаем на пробел от слова.Занимает всё это дело 2-3 минуты от силы(вместе с ICE book).
Далее в Балаболке по Ctrl+T + omo.dic + post.dic + new.dic(если там,что-есть)Тескт 600 кб обрабатывается за 3 минуты на моей далеко не новой машине.
Всё,далее или слушаем или пишем.

Вот,а теперь к чему это всё.
К тому,что при данной организации,когда первая колонка омографов внесена в основной словарь,
и существует начальная база словосочетаний с омографами из второй(третьей,есть, но очень мало,можно даже пренебречь) колонки,предложеный мной выше способ вообще позволяет найденные и выделенные омографы редактировать одним щелчком(не надо выбирать,что вставлять,если слово просится на редактирование "щёлк" и готово.
Словарь омографов будет выглядеть так:
реки=реки< (ре<ки внесено в основной словарь)
||излучина реки=излу<чина рекиъ<
ноги=ноги< (но<ги внесено в основной словарь)
||не будет моей ноги=не будет моей ногиъ<
руки=руки< (ру<ки внесено в основной словарь)
||без руки=без рукиъ<

Не знаю доходчиво я объяснил всё это.Но ведь правда,есть над чем подумать и помечтать.Глядишь и придем к полной автоматизации.Эх мечты...

Все свои вышеупомянутые словари обязательно выложу.Еще чуток "подрихтую".


Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Сб Ноя 15 2008, 12:14
Сб Ноя 15 2008, 12:14

Цитата :
Если я объединю эти три опции в одну, где гарантии, что они не будут выполняться в этой самой "неправильной последовательности"?! А какова "правильная последовательность"?

А если просто дополнительно добавить пункт меню в котором объединено выполнение в последовательности:
1 удаление дублированных пробелов
2 удаление знаков переноса слов
3 удаление разрывов предложений (строк) \r\n
4 обединение предложений по абзацам без \r\n

А то утомляет выбирать пункты и ждать их выполнения Smile

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Сб Ноя 15 2008, 17:50
Сб Ноя 15 2008, 17:50

Lexus
Согласен, уговорили, добавлю в меню еще один пункт - "Форматировать текст", которые объединит три существующих пункта "Удалить лишние пробелы", "Удалить знаки переноса", "Удалить разрывы строк".

Дело в том, что я хотел, чтобы "Балаболка" могла читать тексты без какого-либо предварительного форматирования: открыл текстовый файл и сразу начал читать его. С иностранными голосами, в принципе, это вполне возможно; там если и есть слова, которые неправильно читаются, то их не так много; и проблема омографов в других языках не так серьезна, как у нас. Русские голоса, увы, содержат огромное количество слов, которые неправильно произносятся. Нам не обойтись без словарей коррекции произношения, а для этого нужно предварительно удалить лишние пробелы, удалить переносы, удалить разрывы предложений...

Поэтому мне бы не хотелось автоматически форматировать текст при открытии или сохранении текстового файла (как, например, это происходит в mp3book). Не всем пользователям это необходимо; таково мое мнение.

Вернуться к началу Перейти вниз
koshi
Новичок


Сообщений : 13
Репутация : 0

 koshi :: Вс Ноя 16 2008, 01:28
Вс Ноя 16 2008, 01:28

Цитата :
необходимо "как-то запоминать как бы замены" для омографов.
Нет, серьезно, очень сложно придумать и реализовать такой способ. Сейчас в "Балаболке" есть возможность задавать целые фразы, где присутствует омограф; когда программу будет выполнять поиск омографов, то, встретив такую фразу в тексте, "Балаболка" автоматически заменит ее на фразу из словаря.
Пока изучал информацию на aot.ru, то наткнулся на доселе незнакомое мне слово - конкорданс. Погуглил немного, интересная вещь оказывается.
Вариантов точных словосочетаний омографов может быть очень много и всё равно мы перечислим лишь малую их часть. Вместо этого можно составлять конкорданс предложений для каждой формы омографа (с учетом расстояния от него). Для новых предложений проверяется насколько они соответствуют конкордансу той или иной формы омографа и делается предположение о правильном звучании.
Малопригодно при полной вычитке (выслушке) омографов перед записью в файл, но весьма полезно для "автомата", а главное - соберется некоторая статистика контекста омографов.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Вс Ноя 16 2008, 17:51
Вс Ноя 16 2008, 17:51

Хорошо бы сделать обработку ошибки, возникающей при поытке чтения, когда курсор находится в в краеней позиции текста (в конце):

Ошибка синтезирования речи:
Access violation at address 0059E8D7 In module 'balabolka.exe'. Read of address 00000600.

347-я рулит Smile
Спасибо.

А опция (-i) в 347 не работает Sad

Вернуться к началу Перейти вниз
szasz
Посетитель
avatar


Сообщений : 34
Репутация : 28

 szasz :: Вс Ноя 16 2008, 19:54
Вс Ноя 16 2008, 19:54

Нельзя ли сделать сворачивание программы во время конвертации в аудиофайлы?
Приходится перетаскивать прогресс бар за экран. Сейчас он находится поверх всех окон.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Вс Ноя 16 2008, 23:06
Вс Ноя 16 2008, 23:06

Lexus
Поправил ошибки, версия 1.22.0.348 на сайте. Спасибо за информацию.
Параметр "balabolka.exe -i" до этого проверял на SAPI 4; теперь довел до ума и на SAPI 5. Должно работать.

szasz
Просьба понятна; буду думать, что тут можно сделать.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Пн Ноя 17 2008, 00:31
Пн Ноя 17 2008, 00:31

При удалении лишних пробелов и в опции форматировать текст просьба учесть, что несколькими пробелами в некоторых текстах раньшее отмечали начало абзаца. И один оставшиййся пробел уменьшает читабельность текста.
В начале строки и предложения их лучше не трогать или заменять на ТAB.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пн Ноя 17 2008, 01:02
Пн Ноя 17 2008, 01:02

Lexus
Согласен, буду оставлять пробелы в начале абзаца.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Пн Ноя 17 2008, 10:59
Пн Ноя 17 2008, 10:59

Раз пошло такое плодотворное сотрудничество.
Хотел бы предложить подумать над сохранением выбранных настроек для голосов в меню аудиофайлы в том числе с учетом галочки 'использовать при чтении вслух' по каждому из сохраненных голосов

Вернуться к началу Перейти вниз
elygreen
Наблюдатель


Сообщений : 2
Репутация : 0

 elygreen :: Пн Ноя 17 2008, 11:39
Пн Ноя 17 2008, 11:39

А как насчет распаралеливания программы ? А то так жалко смотреть как она забивает только одно ядро :-(
На мой взгляд, при пакетном перегоне из списка файлов, это будет совсем не тяжело сделать.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Пн Ноя 17 2008, 14:55
Пн Ноя 17 2008, 14:55

Lexus пишет:
Хотел бы предложить подумать над сохранением выбранных настроек для голосов в меню аудиофайлы
Да, это разумно; постараюсь реализовать.

elygreen пишет:
А как насчет распаралеливания программы ?
Не имел дела с многопоточностью; пока это только в планах на будущее. (Да и процессор у меня сейчас с одним ядром.)

Вернуться к началу Перейти вниз
elygreen
Наблюдатель


Сообщений : 2
Репутация : 0

 elygreen :: Пн Ноя 17 2008, 15:21
Пн Ноя 17 2008, 15:21

balabolka пишет:
Не имел дела с многопоточностью; пока это только в планах на будущее. (Да и процессор у меня сейчас с одним ядром.)
На самом деле это не должно быть тяжело в данном случае. Если под С/С++ то могу подсобить.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Вт Ноя 18 2008, 23:52
Вт Ноя 18 2008, 23:52

В окошке словари хорошо бы добавить кнопку 'обновить' на случай, если в папку программы были добавлены или удалены словари.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Ср Ноя 19 2008, 04:24
Ср Ноя 19 2008, 04:24

Lexus
Согласен. Только это будет не кнопка, а пункт в контекстном меню, появляющемся по правой кнопке мыши (пользователи не так уж часто изменяют содержимое папки со словарями).

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Ср Ноя 19 2008, 09:44
Ср Ноя 19 2008, 09:44

Вот еще идеи появились после работы со словарем:

1. Добавить пунктик который бы показывал результат объединения всех отмеченных словарей без сортировки по алфавиту всех правил , включая Ini для визуального представления порядка применения правил коррекции.

2 Словари как я понял в меню сортируются по алфавиту. Хорошо бы их перетаскивать для задания порядка их применения.

3. Запоминание выбраного набора и порядка следования словарей при смене движков.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Ср Ноя 19 2008, 17:04
Ср Ноя 19 2008, 17:04

Lexus
1. Списки правил из INI-файлов и из DIC-файлов НЕ объединяются. Когда при чтении текста применяются правила, то сначала применяются все правила из отмеченных INI-файлов, затем все правила из DIC-файлов. Когда я это программировал, мне и в голову не приходило, что кто-либо будет использовать для коррекции произношения разные форматы файлов; я думал - либо то, либо это.

Содержимое INI-файлов при объединении не сортируется. Список правил из DIC-файлов сортируется следующим образом: сначала будут применены правила, содержащие наибольшее количество букв в шаблоне:
Код:
слово
*лово
лов
*ов*
Это не моя идея, так было сделано в "Говорилке"; ведь формат *.dic позаимствован оттуда.

2. Сортировать словари в списке можно их переименованием. Я также думал над всем этим, когда добавлял панель словарей в программу, и решил, что хранить порядок словарей ВНУТРИ программы нет необходимости. Мне и в голову не приходила мысль, что кому-то может понадобиться возможность применять словари в разном порядке для разных голосов...

3. Нет, это уже чересчур. "Балаболка" предназначена для широкого круга пользователей, а не для аудиотехновербальных маньяков. Предложение запоминать порядок применения словарей для каждого из установленных на компьютере голосов - это уже слишком. Вы меня пугаете... Shocked

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Ср Ноя 19 2008, 22:00
Ср Ноя 19 2008, 22:00

Цитата :
Списки правил из INI-файлов и из DIC-файлов НЕ объединяются.
Когда при чтении текста применяются правила, то сначала применяются все правила из отмеченных INI-файлов, затем все правила из DIC-файлов

Содержимое INI-файлов при объединении не сортируется.Список правил из DIC-файлов сортируется следующим образом: сначала будут применены правила, содержащие наибольшее количество букв в шаблоне:

Отлично. Smile Вопрос возник по причине отсутствия в справке соотоветствующего описания. Согласитесь по этому достаточно интересному вопросу в справке написано не очень много.

Но даже из написанного здесь вами я не совсем понял, сортируются ли словари по отдельности в порядке следования в окошке словарей и затем в таком виде обединяются. Либо они сначала объединяются , а затем объединенный список сортируется.
Мы пользователи ведь не телепаты и не можем знать задумок автора. Открыв файл словаря TextAlouda chl , я без особых затруднений вижу порядок применения правил коррекции. Он вцелом соответсвует вашему. Сначала выполняются регулярные выражения и статьи большей длины.
Поэтому могу согласиться с вами, что пункты 2 и 3 излишни.

А вот пунктик который бы показывал результат объединения всех отмеченных словарей и последовательность применения правил , включая Ini для визуального представления порядка обработки правил коррекции, только бы улучшила процесс обработки текста и сотавления словарей.
Цитата :
"Балаболка" предназначена не для аудиотехновербальных маньяков
Согласен с вами на 100% Smile Безусловно здесь таких нет.
А по поводу совместного примениия ini и dic словарей. Так это круто и есть большой плюс программе.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Ср Ноя 19 2008, 23:20
Ср Ноя 19 2008, 23:20

Еще к идее запоминать выбор словарей для каждого голоса: теоретически это логичный шаг, тем более что словари для "Николая (SAPI 4)" вообще не будут работать в голосах SAPI 5 из-за символа '<'. Но реальность такова, что российские пользователи зачастую скачивают из сети ВСЕ словари *.dic, которые только могут найти; это десятки и сотни тысяч правил. Я опасаюсь, что на таких машинах программа будет тормозить при смене голоса, ведь все словари будут подгружаться заново. Не знаю, надо еще подумать; пока это слишком круто для меня.

В следующей версии программы в панели словарей будет отображаться реальный порядок применения словарей: сначала это будут словари *.dic (данный формат самый популярный, поэтому правила из таких файлов будут применяться к тексту в первую очередь), затем файлы *.ini. Также, добавлю пункт в контекстное меню панели, позволяющий посмотреть текущий список используемых правил.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Ср Ноя 19 2008, 23:39
Ср Ноя 19 2008, 23:39

Цитата :
В следующей версии программы в панели словарей будет отображаться реальный порядок применения словарей: сначала это будут словари *.dic (данный формат самый популярный, поэтому правила из таких файлов будут применяться к тексту в первую очередь), затем файлы *.ini. Также, добавлю пункт в контекстное меню панели, позволяющий посмотреть текущий список используемых правил.

Ой. Sad Не первый год работаю с различными видами правил, в том числе и на основе регулярных выражений. И возьму на себя смелость утверждать что ini- файлы в силу их универсальности и мощи нужно все-же ставить вначале выполнения правил. Т.е они позволяют устранить многие из выявленных дефектов движка , к которому потом можно применять обычные правила.
В подготовке текстов перед загрузкой в говорилки я даже использую спецутилиты работающие на регулярных выражениях. Я уже думал, что наконец-то можно обойтись без них. Может тогда сделать какой-нибудь переключатель?

Вернуться к началу Перейти вниз
unknown
V.I.P.


Сообщений : 73
Репутация : 11

 unknown :: Чт Ноя 20 2008, 00:58
Чт Ноя 20 2008, 00:58

Цитата :
... В подготовке текстов перед загрузкой в говорилки я даже использую спецутилиты работающие на регулярных выражениях...

Как бы с выделенным ознакомится.

Вернуться к началу Перейти вниз
maximus
Интересующийся


Сообщений : 6
Репутация : 4

 maximus :: Чт Ноя 20 2008, 03:34
Чт Ноя 20 2008, 03:34

Привык слушать чтение под музыку. Можно ли в будущих версиях попросить возможность добавления в выходной аудиопоток списка треков мп3 которым бы заполнялся по всей длительности начитанный текст книги чтобы играли на фоне?

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Чт Ноя 20 2008, 03:52
Чт Ноя 20 2008, 03:52

Lexus пишет:
И возьму на себя смелость утверждать что ini- файлы в силу их универсальности и мощи нужно все-же ставить вначале выполнения правил.
Как скажите. Тогда пусть первыми будут INI-файлы, нет проблем.

maximus пишет:
Можно ли в будущих версиях попросить возможность добавления в выходной аудиопоток списка треков мп3
Не знаю, как это можно реализовать. Не настолько силен в работе с аудиопотоками.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Чт Ноя 20 2008, 09:39
Чт Ноя 20 2008, 09:39

Цитата :
Как бы с выделенным ознакомится.
Погуглите Powergrep

Вернуться к началу Перейти вниз
unknown
V.I.P.


Сообщений : 73
Репутация : 11

 unknown :: Чт Ноя 20 2008, 11:51
Чт Ноя 20 2008, 11:51

Lexus пишет:
Погуглите Powergrep
Ага,теперь понятно,о каких спецутилитах,идет речь.
Search&Replace.
Ну такого добра полно в сети,и кое-что бесплатное есть
неплохое.
Всё, этот вопрос закрываем,как не относящийся к теме.

Вернуться к началу Перейти вниз
unknown
V.I.P.


Сообщений : 73
Репутация : 11

 unknown :: Пн Ноя 24 2008, 22:34
Пн Ноя 24 2008, 22:34

Приятная фишка- замена чисел словами.
Только вот навскидку,что с такими:
2 305 876 - это два миллиона и т.д. или
3 608 - это три тысячи и т.д.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Пн Ноя 24 2008, 23:50
Пн Ноя 24 2008, 23:50

Классная программа 'балаболка' v350.
Еще предложение по улучшению. В редакторе словарей после ввода текста в графу 'произносить' в случае переноса курсора в поле 'как' , необходимо осуществлять поиск по словарю, и в случае наличия записи отображать ее в этом поле.
Подсмотрено в Textaloud.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Вт Ноя 25 2008, 01:36
Вт Ноя 25 2008, 01:36

slag пишет:
Только вот навскидку,что с такими:
2 305 876 - это два миллиона и т.д.
Постараюсь что-нибудь сделать с этими числами.

Lexus
Хорошая идея, надо обдумать.

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Вт Ноя 25 2008, 09:50
Вт Ноя 25 2008, 09:50

Еще по поводу редактора словаря.
Он немного перегружен кнопками, которые зачастую дублируют друг друга.
Т.е. некоторые можно убрать , объединив выполнение.
Например 'найти правило' при реализации предлагаемой ранее функции и 'создать провило'.

Если оставить 'найти правило' то ему лучше добавить глобальности , например найти во всех словарях.

Вернуться к началу Перейти вниз
unknown
V.I.P.


Сообщений : 73
Репутация : 11

 unknown :: Вт Ноя 25 2008, 12:58
Вт Ноя 25 2008, 12:58


Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Вт Ноя 25 2008, 13:27
Вт Ноя 25 2008, 13:27

Lexus
Посмотрел, как поиск правил работает в TextAloud, и засомневался в целесообразности того, что Вы предложили. Тот подход, который сейчас реализован в "Балаболке", кажется мне более логичным. Не стану торопиться менять что-либо.

Поиск в редакторе "Балаболки" ищет не точные сопадения строк; это существенное отличие его от поиска в TextAloud.

slag
Да, это ошибка; точка или запятая после числа сбивают программу с толку - она пытается целое число обработать как вещественное. Спасибо за сообщение, исправлю ошибку в следующей версии.

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

Пожелания по развитию программы

Предыдущая тема Следующая тема Вернуться к началу
Пожелания по развитию программы
Страница 1 из 20Страница 1 из 20На страницу : 1, 2, 3 ... 10 ... 20  Следующий
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении