|
| |
Автор | Сообщение | Loquendo Olga TTS |
---|
telo Участник
Сообщений : 58
| telo | :: Чт Дек 11 2014, 13:50 | Чт Дек 11 2014, 13:50 | |
| да ладно вам, не спорьте. хватит о высоких материях. давайте о целесообразности. Mr.tonick спрашивает - а можно-ли? вот именно в этом месте его нужно озадачить встречным вопросом - а нужно-ли?
лёва! ты как-то выкладывал образец, как у тебя читает ольга. с ошибками ты расправляешься лихо. там была исправлена ошибка, которую я исправить не смог. ну чё. мастер. но... в том месте, где исправлена ошибка, появился какой-то микро-затык ( микро-пауза ). это очень сложно объяснить. в местах исправления ошибок иногда пропадает "слитность произношения", появляются "микро-паузы". у тебя ещё и другие настройки голоса. я это слушать не смог. не комфортно. понимаю что это субьективно. если тебя устраивает, слушай на здоровье. это не упрёк. кстати, работа над ошибками проделана титаническая.
послушав лёвину ольгу, я задумался. ведь к своей ольге я просто привык. решил послушать "чистую ольгу". дело в том, что у меня исправлений в тексте - за гранью разумного. чуть-ли не полностью сделана предобработка текста. регулярными выражениями - озвончение, оглушение, редукция гласных и т.д. естественно, пришлось ставить ударение почти в каждом слове. поэтому и возник вопрос, а как у меня самого обстоят дела с "затыками". у лёвы-то я услышал, а у себя просто не замечаю, потому что к своему привык. поставил чистую ольгу. и что вы думаете? я был слегка ошарашен, мягко выражаясь. контраст был просто разительный, в пользу чистой ольги. оказалось, что у меня тоже присутствуют эти "затыки". и их достаточно много, т.к. в тексте очень много исправлений. я слушал свою ольгу и радовался, что ошибок стало очень мало. и сам не заметил, как потерял гораздо более ценное - "слитность произношения".
и чё? сейчас вы спросите - а какова мораль сей басни? а я вам не отвечу. сам не знаю. я решил отказаться от многих исправлений. ольга удивительно сбалансирована во всех отношениях. огорчают ошибки. часть ошибок можно исправить без ущерба. к остальным ошибкам легко привыкнуть. можно было-бы дать рекомендации новичкам. но, рекомендации - вещь неблагодарная. поэтому не буду. я сделаю проще. я напишу на чём я остановился. это как-бы необходимый минимум, без которого ольга вообще никакая.
1. делаю форматирование текста своим rex-словарём. вполне можно обойтись имеющимся на форуме "Словарь коррекции текста". лежит в разделе "Объявление: Словари". 2. делаю ёфикацию. пользуюсь "Программа ёфикации русских текстов". лежит в разделе "Программы для анализа и лингвистической обработки текста". 3. в "балаболке" заменяю числа/цифры на слова в ручном режиме ( даже не знаю, а есть ли там автоматический режим. на всякий случай написал ). 4. обрабатываю аббревиатуры своим rex-словарём. об этом чуть ниже.
вот и всё. для себя я решил что это необходимый минимум. остальное, скорее вредит, чем приносит пользу. остальное из разряда : одно лечим - другое калечим.
именно по этой причине я отказался от исправления ударений в тексте. там очень много разных косяков вылазит. если отказаться от исправлений ударения в тексте, то не нужно в реестре делать настройку "pronounse". она нужна для правки ударений. скорее всего ещё для чего-то нужна, но я не в теме. тут лёва может пояснить. я в своё время, столкнулся с тем, что с этой настройкой английские голоса переставали корректно читать аббревиатуры. меняется-ли что-то в чтении русских аббревиатур, уже не помню.
надеюсь, всё вышеописанное будет полезно/интересно начинающим. помню как сам начинал. очень не хватало чего-то подобного.
|
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Чт Дек 11 2014, 15:08 | Чт Дек 11 2014, 15:08 | |
| telo, не могли бы Вы прислать семпл, такой... "средней" продолжительности (mp3 30-40мин.) Скачанные до этого аудиокниги в ольгином исполнении раздражили обилием ошибок. С трудом установленная "Ольга" отпугнула сизифовой работой по исправлению этих ошибок!
|
|
| | | telo Участник
Сообщений : 58
Репутация : 25
| telo | :: Чт Дек 11 2014, 18:25 | Чт Дек 11 2014, 18:25 | |
| evmir_troll-hunter! прислать семпл - это невозможно. дело в том, что я хочу попробовать сделать свой голос. текстовая предобработка почти готова. но это предобработка для моего движка.( а может я его никогда и не сделаю?). пока своего движка нет, я экспериментировал с ольгой. для этого я делал отдельный rex-словарь, ( вернее там было двенадцать rex-словарей ) конкретно под ольгу. ошибок стало действительно гораздо меньше. но, в силу целого ряда причин, ( в том числе вышеописанных ) я отказался от этой затеи. я думал, что дав ольге обработанный текст, решу почти все проблемы. не тут-то было. там другой путь. надо в самой ольге выдирать её собственную предобработку и ставить более качественную. решил больше не заниматься ольгой. поудалял всё что было сделано для ольги. ольгу слушаю теперь только вышеописанным способом.( четыре пункта ). образцов не сохранилось. прослушав книгу, я её удаляю, т.к. слушаю только что-нибудь развлекательное, типа сталкер, метро и т. д. хранить это всё смысла нет. мы как-то с лёвой разговаривали на эту тему. я уже готов был предложить свою предобработку, что-бы лёва прикрутил её к ольге ( если это возможно конечно ). но тут мы внезапно разругались на пустом месте. наше возможное сотрудничество закончилось не начавшись. не думаю, что примирение возможно. не реально. мы пойдём каждый своей дорогой. к ольге вообще никакого интереса не осталось. хочется реализовать свои задумки. лёва грозился заняться ольгой вплотную и всерьёз. если он сделает качественную предобработку ( а ему это вполне под силу ) и прикрутит это к ольге, будет сказка. больше в ольге менять ничего не надо. я буду писать в одиночку, кооперироваться ни с кем не планирую. либо сделаю, либо нет. вот такие дела. жаль если я вас разочаровал с семплом. |
|
| | | Лёва V.I.P.
Сообщений : 134
Репутация : 173
| Лёва | :: Чт Дек 11 2014, 21:40 | Чт Дек 11 2014, 21:40 | |
| evmir_troll-hunter Вот пример. Ровно на 40 минут. Случайно получилось. telo С моими настройками у тебя звучит так-же? - Цитата :
- сделана предобработка текста. регулярными выражениями - озвончение,
оглушение, редукция гласных и т.д. естественно, пришлось ставить ударение почти в каждом слове. Я проставил ударения и записал за 2,26 минуты. В основном waw долго строится. Регулярными выражениями делал бы минут 15, если не больше. Хотелось бы понять, так-же звучит голос, на других компьютерах? Я на счёт: - Цитата :
- сложно объяснить. в местах исправления ошибок иногда
пропадает "слитность произношения", появляются "микро-паузы". |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Чт Дек 11 2014, 21:50 | Чт Дек 11 2014, 21:50 | |
| Спасибо за семпл. |
|
| | | Лёва V.I.P.
Сообщений : 134
Репутация : 173
| Лёва | :: Чт Дек 11 2014, 23:38 | Чт Дек 11 2014, 23:38 | |
| telo - Цитата :
- я уже готов был
предложить свою предобработку, что-бы лёва прикрутил её к Ольге ( если это возможно конечно ). Какую? Честно говоря, я не понял. Разложу по полочкам, как я понимаю. Что нужно сделать и что не нужно делать. Конечно всё не опишешь... 1. Не нужно ставить ударения по словарю Зализняка. Это отдельная тема и требует отдельного разговора. В двух словах - ударение может сползать на суффикс или приставку с основного корня. Сейчас во всех движках ударение строится по корню, без учёта приставки, или суффикса и окончания. Поправку на сползание сделать можно. Брать чистого Зализняка или подобное не правильно. Уже проходили. Это относится и к тому, если делать свой движок и построение csampa для него. Хорошие результаты даёт алгоритм для проверки правописания у Демагога, если его применить к ударению и увеличить разрядность "кирпичиков". 2. Не решив задачу с омографами, нечего и начинать. Как я сейчас делаю разрешение омографов - это полуправда. Нужно` понимание текста, и/или алгоритмы распознавания образов. Кое что уже получается с самоорганизующимися картами Кохонена. Синтаксис и морфологию никто не отменял! 3. Числа строкой с учётом контекста - не вопрос. В принципе уже всё готово. Руки не доходят прикрутить. Регулярными выражениями эта задача не решается. 4. Что касается самого звука, то нужен хороший звуковой движок. BASS и OpenAL не из той оперы. Можно подёргать dll из каких нибудь VST плагинов. Там есть хорошие спектральные библиотеки (для склейки фонем. у Алёны они лучше, чем у Ольги) и библиотеки по амплитудной и частотной модуляции. Для выразительного чтения. (у Ольги они лучше, чем у Алёны или Татьяны). Заменив фонемы у Ольги, или Татьяны с Алёной, от характерного акцента не избавишься. Он зависит как раз от алгоритма модуляции, который обрабатывает ключевые слова и знаки препинания. При хорошей и достаточно большой базе правил, что-то вроде прологовской, можно сделать конфетку. |
|
| | | telo Участник
Сообщений : 58
Репутация : 25
| telo | :: Пт Дек 12 2014, 00:36 | Пт Дек 12 2014, 00:36 | |
| лёва!
"С моими настройками у тебя звучит так-же?" "Хотелось бы понять, так-же звучит голос, на других компьютерах?"
когда я начинал, я пользовался многими твоими рекомендациями. в том числе и твои настройки пробовал. правда не все, а выборочно. уже и не помню своих впечатлений. помню только скорость твоя мне не понравилась. на более медленной скорости становятся заметны мелкие огрехи и погрешности самого движка. кажется, что качество движка упало. когда я говорил о твоих настройках, я имел ввиду прослушивание твоего предыдущего семпла. на слух ведь сразу чувствуется, что настройки другие. у меня стандартные настройки. после установки ольги настройки вообще не трогаю.
выше я тебе писал по памяти, о том что слушал ранее. послушал минут пять то, что ты выложил только что. всё верно я тебе описал. ошибки исправляешь на отлично. но места, где ты правил просто на слух заметны. запинается она там. реально читает просто рывками. всё очарование ольги просто пропало. ты просто привык, и не замечаешь этого. у меня оказалось всё то-же самое, просто менее выражено. всё что было для ольги удалил. возвращаться к ней больше не буду. ты вроде хорошо разобрался что у неё внутри. думаю что править внутри это единственный путь. увы, мне он не под силу. с ольгой покончил навсегда. слушать конечно её пока буду, пока нет ничего другого. выше я написал к чему я пришёл. только эти четыре пункта и никаких изысков.
пока писал, ты меня уже опередил. не могу угнаться за тобой. сегодня уже писать не буду. может в другой раз, по настроению. |
|
| | | telo Участник
Сообщений : 58
Репутация : 25
| telo | :: Пт Дек 12 2014, 10:31 | Пт Дек 12 2014, 10:31 | |
| ещё пару слов, чтобы закончить мысль. я написал, что потерял интерес к ольге, бла-бла-бла. это не означает, чтоя в ней разочаровался. продолжаю считать её лучшей на данный момент. что я решил для себя, повторяться не буду. с повышенным количеством ошибок придётся смириться. иногда, долго слушая ольгу, я ловил себя на мысли что вообще не замечаю ошибок. их как будто нет. начинаешь воспринимать эти ошибки, как будто так и должно бить. ошибки не режут слух. ольга во всём особенная. даже ошибки у неё особенные. во сказанул, да? давно хотел высказаться по этому поводу где нибудь в разделе обсуждения словарей. всё никак не мог собраться. вчера меня неожиданно прорвало. в общем, очень доволен, что высказался, ведь давно хотел. в ближайшее время отвечать никому не буду. никогда так много не писал. просто умаялся. отдохну слегка. |
|
| | | telo Участник
Сообщений : 58
Репутация : 25
| telo | :: Пт Дек 12 2014, 12:18 | Пт Дек 12 2014, 12:18 | |
| и ещё. лёва! я погорячился, сказав, что читает рывками. сейчас я снова немного послушал. у тебя, наверное, паузы на знаках препинания "не стандартные". с непривычки мне померещились какие-то рывки. конечно-же их нет. в общем очень и даже очень не плохо. если не сказать больше. у меня результаты были скромнее. а "затыки" я всё-таки слышу. но это скорее субьективно/предвзято. не обращай внимания. всё у тебя нормально. ещё было какое-то ощущение дежавю. у меня был очень близкий к твоему результат. |
|
| | | Лёва V.I.P.
Сообщений : 134
Репутация : 173
| Лёва | :: Пт Дек 12 2014, 15:18 | Пт Дек 12 2014, 15:18 | |
| - Цитата :
- даже ошибки у неё особенные.
Ошибки могут быть разного рода. Поэтому в каждом случае - отдельный разговор. 1. Не правильные ударения. - для этого есть словари. 2. Ошибки не правильного произношения сочетаний букв - Лечится через lex. 3. "Ошибки" стиля прочтения - регулируется: pronounce, punctuation, stress/no stress - Цитата :
- думаю что править внутри это единственный путь.
Кроме: Speed, Pitch, Timbre, Pause(7 видов), Stress, Prosodic; наружу выведено больше полусотни настроек в виде программного интерфейса и тегов. В том числе, как произносить аббревиатуры и разного рода предложения(короткие, длинные, с прямой речью...). Поэтому, когда я говорил, что может петь, я не преувеличивал. Есть теги - Tone. Задается частота на которой произносится следующее слово, или фраза. Например 500h - нота Ля первой октавы, или 'A' - в гармонической нотации. Чижик - Пыжик делается элементарно. Мат-часть, если уж не учить, так прочитать рекомендую. Кстати там описан программный интерфейс для разного рода читалок. Просто ни в одной это не реализовано, не только на программном уровне, а и через теги.
Я уже пол года не занимаюсь "голосом". Сначала решил сделать инструменты для этого. Чтобы косить, надо сначала косу отбить. |
|
| | | telo Участник
Сообщений : 58
Репутация : 25
| telo | :: Пт Дек 12 2014, 17:15 | Пт Дек 12 2014, 17:15 | |
| "даже ошибки у неё особенные." лёва! ну это же была шутка. настолько очевидная, что я не посчитал нужным ставить смайлик.
"думаю что править внутри это единственный путь" лёва! здесь мы явно не понимаем друг друга. не будем продолжать.
про настройки, тэги. неужели ты всерьёз думаешь что я об этом ничего не знал, и ты мне сейчас на всё это глаза открыл? я даже не затрагивал этих тем. о чём я хотел поговорить, я отчётливо обозначил.
посылаешь меня учить матчасть? прошлый раз мы поругались в схожей ситуации. ты отправлял меня читать букварь. тебе даже в голову не приходит мысль, что у нас буквари разные. и не факт, что твой букварь правильнее.
я тебе говорю : у меня своя концепция. попытаюсь сделать то, что ещё никто не делал.
ты говоришь : да этого нет в букваре, и другие люди так не делают.
тебе не кажется, что мы не слышим друг друга. и мне по барабану, что и где делают другие люди, и зачем они вообще живут.
нам обоим явно противопоказано общаться друг с другом. я обещаю тебе, что не буду к тебе обращаться и упоминать твой ник. от тебя я жду того-же.
надеюсь я был корректен. от тебя жду того-же. не говори ничего в спину уходящему. в любом случае, я отвечать не буду.
модераторы! спасибо, что перенесли. здесь это гораздо уместнее. я действительно не там начал.
|
|
| | | Лёва V.I.P.
Сообщений : 134
Репутация : 173
| Лёва | :: Пт Дек 12 2014, 18:04 | Пт Дек 12 2014, 18:04 | |
| - Цитата :
- мы не слышим друг друга.
Потому, что надо конкретно называть о чём идёт речь. Есть терминология. Если говорить в рамках терминов, всем всё будет понятно. У всего есть своё название. Я специально разложил по полочкам слово ошибка. Получается, что сказать "ошибка", значит ничего не сказать. Тоже самое: - Цитата :
- тебе даже в голову не приходит мысль, что у нас буквари
разные. и не факт, что твой букварь правильнее. О чём идёт речь? Совершенно не понятно. Можно только догадываться. Надо наполнить эту фразу конкретикой. Например; там-то, там-то написано то-то, то-то. Мы же не ясновидцы. Я могу назвать издание букваря, что по Loquendo, что по TTS. Дай сноску на твой букварь, или дай название, я сам погуглю, чтобы почитать. А пока получается, что ты что-то придумал сам и этому описания нет ни где. Тогда напиши и выложи. Только подозреваю, что описание опять будет без конкретики, а общие фразы не о чём. Если изъясняться сухим языком фактов, вопросов не возникнет. Канцелярщина - великая вещь! |
|
| | | telo Участник
Сообщений : 58
Репутация : 25
| telo | :: Сб Дек 13 2014, 11:08 | Сб Дек 13 2014, 11:08 | |
| evmir_troll-hunter!
я недавно прослушал один известный вам семпл. высказал своё мнение. получилось резковато/борзовато. учитывая непростые отношения с автором семпла, я решил немного сгладить ситуацию написать и хорошего. всё хорошее, что я написал это относится только к работе с ошибками. вы просили семпл, хотели услышать ольгу. получается, что я подтвердил, да семпл неплохой, неплохая ольга. у меня осталось стойкое ощущение, что я ввёл вас в заблуждение. поэтому лично для вас я решил уточнить некоторые моменты. скажу сразу - там нет ольги. прослушав семпл, вы прослушали всё что угодно, но только не ольгу. на стандартных настройках ольга "как диктор из телевизора". в семпле я не услышал "диктора". неудачными настройками там напрочь убита "интонационная составляющая". остался кусками нарубленный текст. что там ещё осталось, я уточнять не буду, дабы не провоцировать автора на продолжение дискуссии. по первому впечатлению я написал "всё очарование ольги просто пропало". это действительно так. сейчас я сформулировал более точно. выкладывать свои семплы не буду, т.к. время... лень... и т.д. желания кого-то обидеть действительно не было. написал как есть. это действительно всего лишь уточнения лично для вас. |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Сб Дек 13 2014, 17:55 | Сб Дек 13 2014, 17:55 | |
| - telo пишет:
- это действительно всего лишь уточнения
лично для вас. Всё понятно, претензий нет. Проверьте пожалуйста Личные сообщения... |
|
| | | apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Сб Дек 13 2014, 19:04 | Сб Дек 13 2014, 19:04 | |
| - telo пишет:
- высказал своё мнение.
Хочу мнение с соседнего форума добавить: Со временем привыкаешь голосу и практически перестаешь замечать не только мелкие шероховатости, но и откровенные ошибки. Некоторые слушают на скоростях x 2…4, а там другие проблемы. Общая тенденция – появляется кто-то новенький и говорит, как же это вообще можно слушать? Пытается что-то сделать... и сам перестаёт замечать.
Помнится, как то в школе делали опыты с сероводородом. Заходим в класс, а народ нам навстречу выходит. Мы им: "Блин, вы чо тут делали, как тут вообще можно без противогаза сидеть"? Потом запах исчез – толи проветрился, толи рассеялся... Отсидели урок, выходим, а следующий класс нам: "Блин, вы чо тут делали, как тут вообще можно без противогаза сидеть"?
|
|
| | | telo Участник
Сообщений : 58
Репутация : 25
| telo | :: Вс Дек 14 2014, 05:18 | Вс Дек 14 2014, 05:18 | |
| apokrif !
к ошибкам действительно привыкаешь. это касается любого голоса и всего остального в жизни. просто, я не упустил случая в очередной раз похвалить ольгу. у меня было очень много исправлений, и я привык к тому что есть. поставив чистую ольгу, я сразу уловил какую-то лёгкость. показалось, что сама ольга вздохнула с облегчением. да-да, именно так. если давать сравнительную характеристику - стало лучше. появилась лёгкость восприятия, слушать просто столо комфортнее. для меня это всё стало решающим. ошибки - это меньшее зло, по сравнению с тем, что теряешь. об остальном я уже написал.
немного о комфортности прослушивания на примере голоса RHVoice. слушая этот голос, я всегда ловлю себя на мысли : "неплохой голос. ну ладно, сейчас я выключу, послушаю потом". т.е. какого-то неприятия нет. голос действительно неплох. из несомненных достоинств - очень высокая разборчивость. но, где-то на подсознательном уровне, присутствует какой-то дискомфорт. хочется сейчас выключить. я думаю, это из-за монотонности. вообще, говорить что-то негативное про этот голос язык не поворачивается. там ведь очень много сделано для слепых. тётка сделала большое дело. у неё огромное, доброе сердце. |
|
| | | apokrif V.I.P.
Сообщений : 304
Репутация : 85
| | | | telo Участник
Сообщений : 58
Репутация : 25
| telo | :: Вс Дек 14 2014, 07:00 | Вс Дек 14 2014, 07:00 | |
| то что ольга яковлева слепая я не знал. а я её тёткой назвал. мне даже стыдно стало. не красиво получилось. извиняюсь. а с чиновниками и так всё ясно. |
|
| | | | Loquendo Olga TTS |
---|
| |