|
| Пожелания по развитию программы | |
| |
Автор | Сообщение | Пожелания по развитию программы |
---|
SkyFox Наблюдатель
Сообщений : 4
| SkyFox | :: Вс Мар 06 2011, 05:11 | Вс Мар 06 2011, 05:11 | |
| Большое спасибо за программу!
Добавьте пожалуйста опции для форматирования текста, когда программа должна видеть что начался новый абзац. Большинство текстов что я слушал имели чуть ли не после каждого предложения пустую строку, а там где на самом деле начинался новый абзац 3 пустых строчки. Поэтому приходится полностью убирать паузу между абзацами.
И ещё одна идея: нельзя ли распознавать диалоги но не просто автор-диалог а с возможностью привязки разных голосов к разным именам ( например если в строке стоит "сказал/крикнул/прошептал [имя]" или если в самом диалоге стоит имя оппонента ) с возможностью выделенный текст вручную привязывать к разным голосам |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| | | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Мар 06 2011, 11:11 | Вс Мар 06 2011, 11:11 | |
| - SkyFox пишет:
- Добавьте пожалуйста опции для форматирования текста, когда программа должна видеть что начался новый абзац.
Не понял, что именно Вы имеете ввиду. Приведите пример текста с описанным Вами форматированием.
- SkyFox пишет:
- И ещё одна идея: нельзя ли распознавать диалоги но не просто автор-диалог а с возможностью привязки разных голосов к разным именам ( например если в строке стоит "сказал/крикнул/прошептал [имя]" или если в самом диалоге стоит имя оппонента ) с возможностью выделенный текст вручную привязывать к разным голосам
У меня нет планов по реализации распознавания диалогов в тексте. Это очень сложно воплотить в жизнь; есть разные способы реализации, но я пока не вижу пути, как сделать такое распознавание удобным для пользователя. |
|
| | | SkyFox Наблюдатель
Сообщений : 4
Репутация : 1
| SkyFox | :: Вс Мар 06 2011, 17:30 | Вс Мар 06 2011, 17:30 | |
| - balabolka пишет:
- Приведите пример текста с описанным Вами форматированием.
- Спойлер:
— Извини, Кантор, но ты что, действительно на нее запал? Или ты не в силах терпеть среди живых человека, так много знающего о твоих тайных помыслах?
— Хоть раз не угадали, — злорадно ухмыльнулся Кантор. — Я хочу ее нанять.
Весь рабочий день вторника пошел у Ольги наперекосяк. . . . . . . . . . включая наводнение в южной Мистралии и ранние заморозки в восточном Галланте.
На практических занятиях Ольга тоже постоянно отвлекалась, все время возвращаясь мыслями к вчерашним неприятностям, пропустила половину из объяснений наставника и получила за это очередное нравоучение. Вероятно, завтра получит еще одно.
в данном примере настоящее разделение только между 2-рым и 3-им "абзацем", а если включена пауза между абзацами то она получается практически после каждого 2-го предложения.
- balabolka пишет:
- Это очень сложно воплотить в жизнь; есть разные способы реализации, но я пока не вижу пути, как сделать такое распознавание удобным для пользователя.
на примере данного фрагмента
- Спойлер:
— Извини, Кантор..... в первом случае имя стоит в самом диалоге, то есть это оппонент
- Спойлер:
...угадали, — злорадно ухмыльнулся Кантор. — Я ... во втором случае имя стоит вне диалога значит сама персона
так можно было бы распознавать на автомате, а для ручной обработки можно сделать отдельное окно где показана часть диалога и подчёркнута 1 реплика, а также пара кнопок к которым можно привязывать разные голоса и нажимая проставлять теги.... Подумайте вы сами или подкиньте идейку создателю "Dialoger" может можно совместно это реализовать.
Нашел также одну ошибку в функции "разделить и преобразовать": скажем текст разбит на 100 частей, если выбрать только часть скажем первые 10, то 9 будут нормально сделаны а в 10-ый Балаболка запихивает весь оставшийся текст (10-100). Если выбрать части 1,3,6,9 то получится 4 файла (1-2) (3-5) (6-8 ) (9-100). При выборе частей на запись галочку 1-ой части убрать не получается. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Мар 06 2011, 19:16 | Вс Мар 06 2011, 19:16 | |
| SkyFox Что касается форматирования текста, то программа сейчас поступает правильно: пустая строка - это однозначный признак конца абзаца, поэтому "Балаболка" и делает паузу.
Но и Вы также в чем-то правы: уже однажды высказывалась идея, чтобы программа делала разные паузы в случае одной пустой строки между абзацами и в том случае, если пустых строк больше одной. Пока я не готов внести подобное изменение в программу, но обещаю всё хорошенько обдумать.
---
По поводу распознавания диалогов: Вы привели два из, может быть, тысячи возможных вариантов записи реплик в диалоге. Еще раз повторюсь, что распознавание диалогов - это сложная задача, требующая хороших познаний в русском языке.
Есть сложности и технического характера. Например, чтобы автоматически распознавать диалоги, надо сначала найти все имена в тексте и поставить соответствия между именами типа "Иван Иванович", "Иван Иванов", "господин Иванов", "Иваныч" и т.п.; затем присвоить каждому найденному имени свой голос и т.д. Есть такие случаи, как "послышался чей-то голос", "я услышал шепот", "донеслось издалека", - программе будет нелегко понять, чья это реплика. Без ручной правки не обойтись.
Размечать диалоги вручную надежнее, но это не такое легкое занятие. Роман, хранящийся в текстовом файле объемом один мегабайт, содержит в среднем 3-5 тысяч реплик; даже если автоматический поиск сможет распознать половину наиболее простых случаев, всё равно на долю человека останется очень большой труд.
То есть, я хочу сказать, что распознавание диалогов - это большая работа, за которую стоит браться, лишь очень хорошо всё обдумав (и выполнять эту работу должен человек, обладающий отличным знанием русского языка, либо имеющий консультанта-филолога). Пока я не уверен, что такая работа мне по плечу. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Мар 06 2011, 19:27 | Вс Мар 06 2011, 19:27 | |
| - SkyFox пишет:
- Нашел также одну ошибку в функции "разделить и преобразовать": скажем текст разбит на 100 частей, если выбрать только часть скажем первые 10, то 9 будут нормально сделаны а в 10-ый Балаболка запихивает весь оставшийся текст (10-100).
"Галочки", которые Вы видите в окне непосредственно перед разбиением текста, - это не ЧАСТИ текста, а ГРАНИЦЫ между частями текста. Убирая "галочку", Вы не удаляете сам текст - Вы убираете границу между двумя соседними частями текста. Поэтому программа и "запихивает" несколько частей текста в один файл.
Самую первую "галочку" убрать нельзя, так как это не "граница" между двумя частями текста. Эта "галочка" присутствует в окне в информационных целях (например, чтобы пользователь видел, с каких слов начинается текст).
---
Если Вам не нужны какие-то части текста и Вы хотите их убрать - Вам придется удалить конечные текстовые файлы. В Вашем примере Вам надо будет удалить файлы с номерами от 11 до 100. |
|
| | | SkyFox Наблюдатель
Сообщений : 4
Репутация : 1
| | | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Ср Мар 09 2011, 13:44 | Ср Мар 09 2011, 13:44 | |
| SkyFox Вам спасибо за замечания и предложения.
Думал на тему распознавания диалогов; дело в том, что программой "Балаболкой" пользуются не только русскоязычные пользователи, так что хочется реализовать подобную функцию таким образом, чтобы и иностранцы могли ей пользоваться.
По моему представлению, возможны четыре способа обработки диалогов в программе для чтения вслух:
- Один голос. Полностью автоматический режим: пользователь выбирает нужный голос из списка (а также настройки для этого голоса), программа самостоятельно находит в тексте прямую речь и добавляет теги смены голоса. То есть, все реплики читаются одним выбранным голосом, отличающимся от основного голоса в программе. Просто, но очень быстро; и без усилий со стороны человек.
- Несколько голосов (ручной режим). Полностью ручной режим: программа просматривает текст сверху вниз и находит очередную реплику в диалоге; в специальном окне пользователю предлагается выбрать голос для чтения этой прямой речи (подобно тому, как это делается в поиске омографов). Пользователь делает выбор, и программа переходит к следующей реплике в тексте. Медленно и трудоемко, но надежно.
- Два голоса (мужской/женский). Можно реализовать только для русского языка. Пользователь выбирает мужской голос для высказываний персонажей мужского пола и женский голос - для персонажей-женщин. Программа ищет в тексте прямую речь; по роду глагола в словах автора определяется пол автора высказывания. Если есть 100%-ная уверенность - программа добавляет теги для смены голоса; если нет полной уверенности, то выбор делает пользователь (окно с двумя кнопками, "Мужчина" и "Женщина"). Достаточно просто и довольно быстро, но не универсально.
- Несколько голосов (автоматический режим). Только для русского языка. Программа находит в тексте имена всех персонажей, у которых есть реплики; пользователю предлагается присвоить каждому персонажу свой компьютерный голос. Затем программа просматривает текст сверху вниз в поисках прямой речи. Найдя очередную реплику, программа либо автоматически добавляет тег (если программа сумела распознать, какому персонажу принадлежат эти слова), либо предлагает пользователю сделать выбор подходящего голоса. Способ сложный, не универсальный, но эффективный.
Буду думать дальше, что из этого можно реализовать и стоит ли это делать. Повторюсь, что мне не хочется заниматься распознаванием диалогов только для русского языка, так как существует много иностранных пользователей программы. Но, в то же время, эффективное распознавание диалогов невозможно без "привязки" к конкретному языку. |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| | | | SkyFox Наблюдатель
Сообщений : 4
Репутация : 1
| SkyFox | :: Ср Мар 09 2011, 17:34 | Ср Мар 09 2011, 17:34 | |
| Присоединяюсь к вышесказанному Два голоса (мужской/женский) самый приемлемый и реализуемый вариант. |
|
| | | Sekuka Посетитель
Сообщений : 29
Репутация : 8
| Sekuka | :: Ср Мар 09 2011, 19:37 | Ср Мар 09 2011, 19:37 | |
| Два русскоязычных разнополых голоса не состыкуются по частотам. Уже обсуждалось. Костыли не помогут, придется делать два экземпляра голосового движка. Да и вряд ли это имеет практический смысл, разве эксперимента ради. Выделение авторского текста, может заслуживать внимания. Или как вариант, уже здесь упоминалось - озвучивание пьес. Опять же каждому голосу нужны свои словари. Не стоит оно того. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| | | | Sekuka Посетитель
Сообщений : 29
Репутация : 8
| Sekuka | :: Ср Мар 09 2011, 22:59 | Ср Мар 09 2011, 22:59 | |
| - Цитата :
- "Ольга" и "Дмитрий" от Loquendo состыковались бы.
"Дмитрий" он как "летучий голландец" как бы есть, но живого никто не видел. Опять же Ольга уже старовата, появись "молодой" Дима, они вместе не уживутся. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Пн Мар 21 2011, 01:30 | Пн Мар 21 2011, 01:30 | |
| Вечер добрый. Такая ситуация: - Код:
-
имеем слово - абв и правило - абв=вба При "быстром" методе, если в тексте в слове "абв" любая из букв заглавная, правило не отрабатывает, хотя в статистике замен учитывается. Если правило из нескольких слов, то срабатывает только если заменяемое слово не первое. Если в конце правила знак препинания, а тексте их, напр., два - Код:
-
!? / ." / "? и т.п. я так понимаю, что для "быстрого" метода надо дублировать правила для всех возможных комбинаций знаков? И еще, если нетрудно, раньше при редактировании словарей в поле "Произносить:" достаточно было ввести слово или фразу в любом регистре и оно автоматически находилось, при наличии и если записано без учета регистра, по щелчку в поле "как:", теперь как будто все правила записаны с учетом регистра. Та же ситуация и при редактировании словарей hmg. В многотысячных словарях стало трудно найти то, что нужно. Спасибо. |
|
| | | flegont V.I.P.
Сообщений : 355
Репутация : 476
| flegont | :: Пн Мар 21 2011, 11:08 | Пн Мар 21 2011, 11:08 | |
| - Цитата :
- При "быстром" методе, если в тексте в слове "абв" любая из букв заглавная, правило не отрабатывает, хотя в статистике замен учитывается.
К сожалению, эта неточность изначально содержится в Demagog'e, где собственно и зародился т.н. "быстрый метод", оттуда глюк просочился и в Балаболку . Местонахождение: функция FilterByMask(). Предполагаемое лечение:
... {Чтобы обрабатывать на общих основаниях замены по правилам $*...=Dest В остальных случаях $ замену не испортит, т.к. в Dest его нет} if (Length(S) > 1) and (Length(Mask) > 1) and (Mask[1] = '$') and (Mask[2] = '*') then begin S := Copy(S,2,Length(S)-1); Mask := Copy(Mask,2,Length(Mask)-1); end; if not Dollar then S := AnsiLowerCase(S); //ДОБАВЛЕНО Result := S; ...
Но это надо оч. хорошо протестировать... |
|
| | | flegont V.I.P.
Сообщений : 355
Репутация : 476
| flegont | :: Пн Мар 21 2011, 11:30 | Пн Мар 21 2011, 11:30 | |
| ...так как подводный камень уже виден. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Мар 21 2011, 11:34 | Пн Мар 21 2011, 11:34 | |
| - al2055 пишет:
- раньше при редактировании словарей в поле "Произносить:" достаточно было ввести слово или фразу в любом регистре и оно автоматически находилось, при наличии и если записано без учета регистра, по щелчку в поле "как:"
Поправлю это в следующей версии программы. Спасибо за сообщение. |
|
| | | flegont V.I.P.
Сообщений : 355
Репутация : 476
| | | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Мар 21 2011, 15:33 | Пн Мар 21 2011, 15:33 | |
| flegont Да, так, вроде бы, всё работает правильно.
Что за переменная "Dollar"? Вот это: - Код:
-
Dollar:=(Length(Mask)>0) and (Mask[1]='$'); Или что-то другое?
|
|
| | | flegont V.I.P.
Сообщений : 355
Репутация : 476
| flegont | :: Пн Мар 21 2011, 17:31 | Пн Мар 21 2011, 17:31 | |
| У меня в FilterByMask(S, Mask, Dest: string): string; флаг Dollar определяется по ходу дела в таком фрагменте:
Dollar := False; if (Length(S) > 0) and (S[1] = '$') then begin ... Dollar := True; end else begin ... end;
Так что в компактом виде это, видимо: Dollar:=(Length(S)>0) and (S[1]='$');
т.е. определяем, в каком виде строка S попала на "фильтрацию" - с $ или без...
|
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Мар 21 2011, 20:02 | Пн Мар 21 2011, 20:02 | |
| Понятно, спасибо. |
|
| | | torn Наблюдатель
Сообщений : 4
Репутация : 1
| torn | :: Ср Мар 23 2011, 04:19 | Ср Мар 23 2011, 04:19 | |
| balabolka, balabolka, довольно долго юзал билд 1.28.0.434 так вот, в нём при наведении на zip и rar архивы с книжками в контекстном меню проводника было "прочитать в Балаболке" хорошая была фишка... в последнем билде чёт это не работает на архивах. а нужны ли команды преобразования в аудио-форматы из проводника... всё ровно ж нуно сначал обрабатывать текст.. ненаю... а вот с архивами, да, стало не удобно. мона поправить как то сей досадный казус? |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Ср Мар 23 2011, 05:44 | Ср Мар 23 2011, 05:44 | |
| - torn пишет:
- ... всё ровно ж нуно сначал обрабатывать текст.. ненаю... а вот с архивами, да, стало не удобно. мона поправить как то сей досадный казус?
И к чему такой стиль - не понимаю! Здесь же люди книги читают\слушают, словари составляют. Этот стиль квази ошибок неприемлем для образованного человека. |
|
| | | Лёва V.I.P.
Сообщений : 134
Репутация : 173
| Лёва | :: Ср Мар 23 2011, 14:04 | Ср Мар 23 2011, 14:04 | |
| - Цитата :
- И к чему такой стиль - не понимаю!
Не в стиле дело, а в сути. P.S. " ..., считай калека!" |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Ср Мар 23 2011, 14:08 | Ср Мар 23 2011, 14:08 | |
| torn В следующей версии программы добавлю пункт контекстного меню для форматов rar и zip. |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Ср Мар 23 2011, 16:26 | Ср Мар 23 2011, 16:26 | |
| - Лёва пишет:
- Не в стиле дело, а в сути.
Суть нужно выражать правильными словами, иначе работа составителей словарей будет бессмысленна! Напр. я мог бы написать это сообщение на leet speak или на Боярском языке – было бы прикольно, но кто бы меня понял?! Единицы.
|
|
| | | torn Наблюдатель
Сообщений : 4
Репутация : 1
| torn | :: Ср Мар 23 2011, 17:07 | Ср Мар 23 2011, 17:07 | |
| сорри за "мой французский" постараюсь больше так не делать... |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Чт Мар 31 2011, 00:14 | Чт Мар 31 2011, 00:14 | |
| Вечер добрый. Некоторое время вручную не отлавливал омографы, сейчас столкнулся с тем, что если в тексте в таком виде: - Код:
-
омограф-слово все нормально, а если наоборот - хоть омограф и подсвечивается, но абсолютно никакой реакции. Раньше, вроде, отрабатывало. Спасибо. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Чт Мар 31 2011, 10:24 | Чт Мар 31 2011, 10:24 | |
| al2055 Проверьте еще раз, пожалуйста; мне кажется, Вы ошиблись. "Балаболка" находит и "омограф-слово", и "слово-омограф"; посмотрел также по тексту программы - должно работать, здесь ничего не менялось. |
|
| | | al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Чт Мар 31 2011, 12:25 | Чт Мар 31 2011, 12:25 | |
| - balabolka пишет:
- "Балаболка" находит и "омограф-слово", и "слово-омограф"
Да, спасибо, на самом деле находит. Поэкспериментировал, выявил, что периодически не ловит, если запущено более одной копии программы и открыто много текстов. Это не критично. |
|
| | | balabol Гость
| balabol | :: Ср Июн 29 2011, 21:59 | Ср Июн 29 2011, 21:59 | |
| Здравствуйте, в замечательной программе balabolka есть очень полезная функция Таймера. Скажите, можно ли расширить возможности действия программы по событию таймера? Очень бы хотелось, чтобы при выходе из программы и завершении работы, программой ставилась бы закладка на последнее прочитанное слово или предыдущий абзац. Сейчас приходится пролистывать текст вручную, поскольку позиция shutdown неизвестна. Еще дополнительно вопрос: хотелось бы взглянуть, сильно ли сложен код связанный с формой StopTimerForm и можно ли помочь развитию вашей программы, самостоятельно реализовав дополнительные функции? с ув Высоков Юрий. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Чт Июн 30 2011, 00:31 | Чт Июн 30 2011, 00:31 | |
| balabol Спасибо за сообщение, поправлю ошибку в следующей версии (программа будет сохранять настройки при выключении компьютера по таймеру).
Программный код, связанный с пунктом главного меню "Таймер", не так уж и сложен (строчек 20-30). Публиковать его не стану, но Вы можете найти нужную информацию об используемых функциях WinAPI в интернете (например, в MSDN). Если у Вас есть предложения по добавлению новых опций - пишите на форуме или присылайте по электронной почте; не могу обещать, что реализую эти идеи, но обещаю обдумать их. |
|
| | | S.DRO Гость
| S.DRO | :: Сб Сен 03 2011, 23:22 | Сб Сен 03 2011, 23:22 | |
| Доброго времени суток. Хочу поблагодарить Многоуважаемого Автора за отличную программу и огромный труд который он проделал. В данном посте мне хочется поделиться своими скромными соображениями по поводу развития "Балаболки". Мне кажется что работы по улучшению лингвистической части программы близки к своему логическому завершению. Поправьте меня пожалуйста если я ошибаюсь, (что весьма вероятно, ибо в этом вопросе я полный чайник и слово "омограф" впервые узнал на этом сайте) но по моему качество синтеза на доступных голосовых движках приблизилось к верхней планке и выжать из них что либо ещё весьма затруднительно. Сомнительно что из "тостера" получиться собрать "ядерную торпеду", потому как "МиГ-29" из него уже собрали. В следствии этого мне кажется что основные усилия по дальнейшему улучшению программы нужно направить на отшлифовку интерфейса и навешивание пользовательских "плюшек". Хочу заметить что внешний вид программы мне весьма импонирует (скин Fallout просто замечательно выполнен, случается открываю "Балаболку" на работе вместо скринсейвера, чтобы хоть что-то на рабочем столе прилично смотрелось). А теперь к делу:
1. Было бы неплохо если бы при наведении курсора на вкладки документов появлялись всплывающие окна со сканом обложки книги, либо другим изображением (fb2). Аналог панель задач Windows, или закладки Opera. 2.Приятно было бы наличие встроенного примитивного плейера который позволил бы проигрывание фоновой музыки во время синтеза. 3.Таймер стал бы ещё удобнее имея цветовую индикацию (убывающую полосу) в окне программы, а особенно в виджете при свёрнутой в трей программе. 4.Так же в функции таймера, удобным было бы наличие предупреждающих сигналов, например за 10 и за 1 минуту до срабатывания (звуковой зуммер + всплывающее сообщение). Аналог Power Off. 5. Думаю порадует многих возможность открытия в "Балаболке" баз данных типа DBF, Paradox и т.д. и импорта из них документов (в сети довольно часто встречаются библиотеки основанные на популярных форматах баз данных, но открывающиеся штатными (в 99 случаях из 100 ущербными) программами оболочками, перенесение текста из которых в "Балаболку" отнимает очень много времени).
Напоследок, хочу ещё раз поблагодарить Автора и пожелать ему Здоровья и Успеха во всех Его начинаниях. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Сен 04 2011, 11:59 | Вс Сен 04 2011, 11:59 | |
| S.DRO Спасибо за добрые слова о программе и за высказанные идеи, обещаю подумать над ними. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Сен 24 2011, 19:04 | Сб Сен 24 2011, 19:04 | |
| есть предложения, не знаю насколько они интересные и выполнимые но напишу а то забуду идея сделать поддержку раскраски и отображения\скрытия текста по маске\словарю например вот так: задается цвет и маска (регулярным выражением) - Код:
-
green|\<.*\>.*\<\/\> тогда текст в окне будет отображаться вот так: - Цитата :
- текст текст текст текст текст текст текст текст текст текст текст текст
текст текст <пум-пум>текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст</пум-пум> текст текст текст текст текст или, например, для скрытия текста обрамленного тегами или слов без\с ударениями - Код:
-
hide|\<.*\> hide|\<\/\> тогда для первого примера с учетом раскраски будет вот так - Цитата :
- тогда текст в окне будет отображаться вот так:
текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст текст ну и дать возможность пользователю редактировать список этих правил чтобы можно было расширить потом варианты применения этой настройки
также быстрый поиск и построение списка, как сейчас реализован поиск имен, только по регулярным выражениям (шаблонам), как это сделано в koobaudio задается маска и по ней затем при поиске строится список слов, очень удобно, например для поиска сокращений и\или аббревиатур, дат, слов на другом языке и т.п. |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Сен 25 2011, 15:25 | Вс Сен 25 2011, 15:25 | |
| evilone_ "Раскраска" текста в дополнение к тому, что уже есть, не удастся - там и так много чего "навешано" (подчеркивание ошибок правописания, показ омографов, выделение цветом тегов SAPI 5, подсветка прочитанного текста). Тот компонент, что используется для раскрашивания текста, не "потянет" еще один цвет.
Другая проблема с "раскраской" - для экономии ресурсов компьютера программа анализирует лишь тот кусок текста, что виден пользователю. Ваше же предложение потребует поиска по всему тексту (и автоматического обновления результатов такого поиска при редактировании текста пользователем). Это неприемлемо.
---
Сокрытие определенных частей текста - хорошая идея; было бы неплохо, например, вообще прятать теги SAPI от глаз пользователей, как в TextSpeech Pro (там все теги хранятся в отдельной таблице, а в тексте, который виден в главном окне, текст внутри тегов подчеркивается зеленой волнистой линией).
Но в случае "Балаболки" это не получится реализовать; об этом надо было думать раньше, когда только начинал создавать программу. Сейчас такая модификация потребует слишком много усилий.
---
Обещаю подумать насчет поиска по регулярным выражениям и шаблонам; но обещать не могу, пока не вижу большого смысла в такой функции. Буду думать еще.
Посмотреть, как это сделано в KoobAudio, не удастся: данная программа отказывается запускаться на моих компьютерах. Обычно стараюсь не критиковать программные продукты своих коллег, но в данном случае готов сделать исключение. Проверял на трех машинах, с WinXP и Vista, с разными наборами установленных компьютерных голосов - безрезультатно, программа выдает сообщения об ошибках еще на стадии запуска. Подождем, пока KoobAudio выйдет из состояния бета-версии.
Поэтому, пожалуйста, поясните подробнее, какой именно вид поиска Вам нужен; например, что потом делать с найденными словами и словосочетаниями. |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | alexyz Посетитель
Сообщений : 26
Репутация : 0
| alexyz | :: Вт Окт 11 2011, 18:51 | Вт Окт 11 2011, 18:51 | |
| Предлагаю расширить функцию создания пауз в программе, введя дополнительную опцию "регулируемая паузу в случае наличия нескольких пробелов подряд в тексте". Для чего это нужно:
Требуется создать аудио файл из текста подготовленного в Anki (популярная бесплатная SRS программа; 5 лет истории, более полумиллиона скачиваний) который экспортируется в следующем виде (пять произвольных строчек текста) Формат: tab-separated text file.: ... Weep something under the carpet hide a problem in the hope that it will be forgotten Bang your head against a brick wall keep trying to solve a problem and being unsuccessful Have a bee in your bonnet preoccupied or obsessed with a particular idea Bend over backwards make a special effort to do something Dig your heels in refuse to give in .... Нужно чтобы текст читался следующим образом: Первая часть текста (Weep something under the carpet) - пауза n секунд (например, 1 сек) Вторая часть текста (hide a problem in the hope that it will be forgotten) - пауза m секунд ( например, 2 сек) Первая часть текста (Bang your head against a brick wall) - пауза n секунд Вторая часть текста (keep trying to solve a problem and being unsuccessful)- пауза m секунд и т.д. до конца
В идеале, но не обязательно, первую и вторую часть текста следует озвучить разными голосами. Спасибо! |
|
| | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Ср Окт 12 2011, 03:55 | Ср Окт 12 2011, 03:55 | |
| alexyz То, что делают такие программы, как Anki или Mnemosyne, - это несколько далеко от того, для чего предназначен мой программный продукт. Ваша идея с паузами мне не совсем ясна; поэтому не уверен, что добавлю что-либо подобное в "Балаболку". |
|
| | | alexyz Посетитель
Сообщений : 26
Репутация : 0
| alexyz | :: Ср Окт 12 2011, 09:57 | Ср Окт 12 2011, 09:57 | |
| Спасибо за быстрый ответ. Прошу прощения, что недостаточно подробно и четко обозначил цель своего предложения. Поля базы Anki, которые я собираюсь экспортировать в Балаболку, - это тематически связанные, но независимые части информационного массива ("факта"). Отсутствие паузы мешает целостному эстетическому восприятию текста, аналогично тому, как если бы абзацы книги "наезжали друг на друга" без пауз. А многократное прослушивание данного "факта" (до 160 раз) нужно для активации данной информации на основе последних открытий профессора Chernov в области когнитивной психологии мозга. http://www.telegraph.co.uk/science/science-news/8200956/Cant-learn-a-foreign-language-Not-true-say-scientists.html
|
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Ср Окт 12 2011, 16:58 | Ср Окт 12 2011, 16:58 | |
| - alexyz пишет:
- В идеале, но не обязательно, первую и вторую часть текста следует озвучить разными голосами. [...] А многократное прослушивание данного "факта" (до 160 раз) нужно для активации данной информации на основе последних открытий профессора Chernov в области когнитивной психологии мозга.
Простите, но синтезированные голоса вряд ли предназначены для "активации информации" - несовершенны они, (неправильная интонация, безэмоциональность и т.д.) Аудиоматериал для Anki, начитанный "живыми" голосами, можно взять на сайте Forvo. |
|
| | | alexyz Посетитель
Сообщений : 26
Репутация : 0
| alexyz | :: Ср Окт 12 2011, 18:14 | Ср Окт 12 2011, 18:14 | |
| evmir1,
Простите, но я не вполне уверен что Вы,что называется, "в курсе дела".
После полутора лет работы с искусственными голосами (Ivona и т.д.) я без проблем пониманию оригинальное видео на английском(например, то что производится TTC (http://www.thegreatcourses.com/)), так что переключиться с искусственных голосов на натуральные на практике не представляет никаких проблем.
Также спасибо Вам за заботу по подбору ссылки на Forvo. Но поскольку я читаю материалы подобные тем, который я привел выше, практически без словаря, сайты с материалами для начинающих и продолжающих вряд ли могут принести мне существенную пользу.
Кроме того, какое отношение имеет "эмоциональность" к тому факту, что для того чтобы твердо запомнить слово (на любом языке, в т.ч. в медицинских целях) , вы просто должны прослушать его 160 раз в течение 15 минут.Я искренне надеюсь, что вы внимательно прочитали материал о научных исследованиях английских ученых, который я привел выше, прежде чем начинать писать возражение.
Также, поскольку Ivona предлагает аудиокниги начитанные искусственными голосами вместе со своими продуктами (Expressivo),я очень сомневаюсь, что там имеются сколь-нибудь существенные проблемы с произношением. Рынок бы этого просто не понял и не принял.
Попутно хочу заметить, что иностранные языки, это только небольшая часть того что делают люди с помощью Anki,и которые можно экспортировать в том числе и для озвучивания. Вот цитата с их сайта:
Anyone who needs to remember things in their daily life can benefit from Anki. Since it is content-agnostic ..., the possibilities are endless. For example: learning a language studying for medical and law exams memorizing people's names and faces brushing up on geography mastering long poems even practicing guitar chords!
Искренне надеюсь, что я развеял Ваш скепсис и сомнения!
|
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Ср Окт 12 2011, 18:18 | Ср Окт 12 2011, 18:18 | |
| Прошу прощения за оффтопик, вот выдержки из вышеприведённой статьи:
"Тем не менее, Shtyrov и его коллеги из Medical Research Council's Cognition and Brain Sciences Unit, разработали метод constraint-induced aphasia therapy (CIAT), не для того, чтобы помогать туристам изучить французский язык, а для помощи инсультным пациентам в восстановлении речи.
" - Данное исследование означает, что быстрая реабилитация возможна при лечении людей с повреждением мозга, - говорит д-р Shtyrov, - таких, как например, инсультные пациенты, с целью способности мозга быстро создавать эти цепочки памяти." [...] Он добавил, что следующим шагом было тестирование теории на инсультных пациентах.
Научно не доказано, что метод CIAT эффективен при изучении иностранных языков. Просто статья так называется, ну это уж дело репортёра.
|
|
| | | alexyz Посетитель
Сообщений : 26
Репутация : 0
| alexyz | :: Ср Окт 12 2011, 18:41 | Ср Окт 12 2011, 18:41 | |
| Тот факт, что исследование было проведено в медицинских целях, отнюдь не означает, что оно не может быть применено и для других целей. Чтобы доказать противоположное Вам надо опровергнуть тезис, изложенный в начале статьи:
The brain can learn a new word in less than 15 minutes, according to scientists, whose finding will rob many of the excuse that they can't learn a foreign language. All one needs to do is listen to a word 160 times over that period, found Cambridge neuroscientists. After that the brain will have formed a whole new network of neurons specifically tasked with remembering that word.
До тех пор Ваше заключение "просто статья так называется, ну это уж дело репортёра". выходит за рамки корректного логического обобщения. |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Ср Окт 12 2011, 21:10 | Ср Окт 12 2011, 21:10 | |
| - alexyz пишет:
- Чтобы доказать противоположное Вам надо опровергнуть тезис, изложенный в начале статьи:
[...] До тех пор Ваше заключение "просто статья так называется, ну это уж дело репортёра". выходит за рамки корректного логического обобщения. Данный тезис сам является некорректным обобщением - по сути это утверждение того же репортёра, так как дальнейшие слова д-р Shtyrov ему (утверждению) противоречат. Применение этого метода в медицинских целях подразумевает не запоминание пациентами лексем, а скорее напоминание слов, фраз родного языка, которые они забыли после инсульта, или сотрясения мозга. ведь не будут они учить итальянский в конце концов!
Поэтому подчеркну, что статья не доказывает эффективность метода CIAT при изучении иностранных языков.
|
|
| | | alexyz Посетитель
Сообщений : 26
Репутация : 0
| alexyz | :: Ср Окт 12 2011, 21:51 | Ср Окт 12 2011, 21:51 | |
| Исходный тезис корректно вытекает из характера эксперимента, который описан в следующих двух абзацах:
First they recorded the pulses generated when they listened to a familiar word. Then the volunteers were made to listen to a made-up word, over and over again. Initially the brain had to work hard to recognise the new word. But after 160 repetitions over 14 minutes, the new memory traces were "virtually indistinguishable" from those of the already familiar word, said Dr Shtyrov.
Из этого фрагмента ясно и недвусмысленно следует, что следы в памяти, созданные новыми "искусственными"словами после 160 повторений за 14 минут, практически не отличимы от тех следов , которые можно наблюдать в человеческом мозге при наблюдении за уже хорошо известными "естественными"словами.
Как образом Вы приходите к заключению, что эта закономерность относится только к больным людям?
|
|
| | | alexyz Посетитель
Сообщений : 26
Репутация : 0
| alexyz | :: Ср Окт 12 2011, 21:56 | Ср Окт 12 2011, 21:56 | |
| Dr Yury Shtyrov and his team made the discovery after placing electrodes on the heads of 16 healthy volunteers to monitor their brain activity.
Для тех кто не знает английский: в этом абзаце специально указано что эксперимент проводился над здоровыми (healthy) людьми. |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| | | | flegont V.I.P.
Сообщений : 355
Репутация : 476
| | | | alexyz Посетитель
Сообщений : 26
Репутация : 0
| alexyz | :: Ср Окт 12 2011, 23:26 | Ср Окт 12 2011, 23:26 | |
| made-up words - это именно совершенно новые выдуманные слова, отсутствующие в словарях, а никак не составные известные только специалистам. Наберите это сочетание в гугле и вы найдете множество ссылок с подробными объяснениями, что такое made-up words и как они создаются. Также в статье нигде не сказано, что были специально созданы легкие слова, не требующие усилий для запоминания, поскольку они похожи на известные слова родного языка.
Иностранные слова для изучающего ничем по своей сути не отличаются от выдуманных, особенно в начальной стадии обучения. А в дальнейшем они, наоборот, становятся легче в силу знакомства со строением языка.
Если мозг может запоминать выдуманные слова при 160 повторениях за 15 минут (подтверждено с помощью подсоединенных электродов), то он сможет справится за этот же срок и с иностранными словами. На этом и основывается утверждение журналиста о пригодности данного метода для изучения иностранных языков. |
|
| | | | Пожелания по развитию программы | |
| Пожелания по развитию программы |
---|
| |