语音合成技术和文本语音转换 - Synthetic voice and Text to Speech technology - Синтетический голос и технологии преобразования текста в речь |
|
| |
Автор | Сообщение | myTTS Subtitles Helper |
---|
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пт Дек 28 2012, 21:41 | Пт Дек 28 2012, 21:41 | |
| А сами субтитры чем будут читаться? ABM Subtitles Reader, KMPlayer? KMPlayer, вроде бы, умеет "отбрасывать" специальные теги, читая вслух только сам текст? (Правда, давно уже не пользовался этим плеером; возможно, я ошибаюсь.)
Это Han Hyo Joo на аватарке? |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Дек 28 2012, 23:27 | Пт Дек 28 2012, 23:27 | |
| balabolka, я их читаю KMPlayer-ом, но наверно можно и тем и тем там отбрасывать можно не столько теги сколько дополнительную информацию например рекламу в начале и\или конце файлов, примечания, перевод песен (очень сильно раздражает) и прочую малополезную информацию при прослушивании иногда звучит много лишней информации которая отвлекает от просмотра да и если субтитров много то вручную их преобразовывать очень долго получается, а так раз два и готово
evmir, можно двумя способами: 1. скачать все файлы myttssh.exe, updater.exe и rules.txt (если блокируется доступ в интернет то при проверке обновлений программе еще нужен доступ на сайт tts-alenka.narod.ru); 2. скачать только myttssh.exe а остальные загрузятся после первого запуска.
- Цитата :
- как с правилами замен из .dic словарей? их все надо в rules.txt вставлять?
это просто надстройка с дополнительной функцией обработки текста regexp-словарем для нее нужна программа балаболка с подключенным набором словарей (путь к программе *.exe указать нужно) если выбрать "только замены" тогда не нужна, будет работать только словарь rules.txt (набор правил - только левая часть правила, та которую нужно удалить) для демагога пока нет потому что там нет поддержки командной строки для преобразования текста, или есть?
очень очень давно нужна была и наверно еще пригодится кому-то
balabolka, да |
|
| | | muk79 Участник «online словари»
Сообщений : 102
Репутация : 29
| muk79 | :: Сб Дек 29 2012, 03:56 | Сб Дек 29 2012, 03:56 | |
| Небольшие изменения: правила теперь имеют левую и правую части - что заменить=чем заменить; можно задать любое расширение для списка файлов srt, ass, txt ... В принципе, словарь тут и не сильно нужен, все замены можно подключить отдельным rex-словарем. Есть правда пару исключений где rex-словарь не поможет но их мало. Но если нужно пусть будет. При замене оригинал файла будет переименован в old. |
|
| | | evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Пн Дек 31 2012, 04:10 | Пн Дек 31 2012, 04:10 | |
| - Цитата :
- как с правилами замен из .dic словарей? их все надо в rules.txt вставлять?
- evilone_ пишет:
- это просто надстройка с дополнительной функцией обработки текста regexp-словарем для нее нужна программа балаболка с подключенным набором словарей
Я как раз про словари замен и хотел уточнить - теперь ясно. Хорошая идея, пакетно и быстро, спасибо!
|
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| | | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Янв 20 2013, 15:09 | Вс Янв 20 2013, 15:09 | |
| обновление: - добавился ansi-utf конвертер; - программа работает с файлами в кодировке ansi для поддержки старой версии балаболки, если файл в utf он будет автоматически преобразован; - добавился regexp-фильтр (быстрый поиск строк по шаблону);
p.s. у программы был изменен упаковщик, поэтому возможны ложные срабатывания некоторых антивирусных программ но вирусов там нет |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Июн 01 2013, 22:08 | Сб Июн 01 2013, 22:08 | |
| изменились ссылки для обновлений - заменить файл myttssh.ini чуть позже добавим инструкцию как быстренько подготовить ass-субтитры для чтения с помощью myTTS Subtitles Helper |
|
| | | evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Июн 07 2013, 21:04 | Пт Июн 07 2013, 21:04 | |
| Итак...
Как правило, наиболее часто встречающийся формат субтитров сейчас либо srt либо ass. Да, есть и много других, внешних и встроенных но в большинстве случаев натыкаешься именно на них.
В отличии от srt, ass субтитры, если они правильно размеченные, интереснее - в них быстро можно найти и отсеять все лишнее - то, что озвучивать не нужно, например рекламу, текст песен и прочую лишнюю для прослушивания во время просмотра информацию.
Все это можно быстро сделать при помощи программы myTTS Subtitles Helper. Быстро найти какие-то шаблонные фразы и словосочетания, например имена героев, названия, слова с цифрами и т.п. что поможет правильно подготовить и разметить текст для дальнейшего озвучивания.
После первого запуска программа обновит словари и фильтр для поиска фраз которые в дальнейшем можно будет редактировать и сохранять самому. И словарь и фильтр используют регулярные выражения для быстрого поиска и замены текста по маске.
Главное окно программы выглядит примерно так:
- В окне №1 указывается путь к папке с файлами субтитров.
- В окне №2 указывается путь к программе балаболка с помощью которой будет размечен текст.
- Окно №3 служит для ввода и редактирования правил для словаря замен. Правила строятся по принципу (что заменить)=(чем заменить) т.е. символ «=» отделяет левую часть правила от правой.
- Окно №4 – фильтр поиска по принципу совпадения т.е. если в строке будет выражение из этого списка то оно останется, отсеяв остальной текст.
- Окна №5 и №6 служат для предварительного просмотра работы правил. Скопировав текст в окно №5 результат можно будет увидеть в окне №6. Все это необходимо для удобной отладки правил, чтобы избежать ошибок замен.
- «Задержка» – в этом поле вводится число, в секундах, по истечении которого программа балаболка будет автоматически перезапущена на преобразование следующего по списку файла. Это необходимо в том случае когда она по какой-то причине «задумается». На старых версия бывало что программа зависала при обработке текста большим количеством словарей. Пустое значение автоматически отключает эту функцию.
- Опция «только замены» будет полезна если нужно обработать файлы только словарем замен без программы балаболка и ее словарей, для предварительной подготовки текста.
- В окне №7 выбирается формат субтитров для обработки. В одной папке могут быть любые файлы но программа будет обрабатывать только те из них, которые имеют выбранное расширение. Это бывает иногда удобно при преобразовании формата субтитров.
- Кнопка «обновление» проверяет обновление программы и словарей.
- Кнопка «сохранить словари» сохраняет текущий текст в окнах №3 и №4.
- Кнопка «преобразовать в srt» служит для конвертирования в формат srt субтитров из других форматов.
- Кнопка «ass теги» служит для быстрого поиска всех тегов в субтитрах. Результат выводиться в окно №6.
- Кнопки «ansi2utf» и «utf2ansi» служат для преобразования соответствующего формата субтитров для старой версии программы балаболка.
- Кнопка «фильтр» осуществляет поиск строк заданных в окне №4. Результат выводиться в окно №6.
- Кнопка «старт» запускает процесс преобразования субтитров в указанной папке.
При преобразовании файла субтитров программой балаболка, с ее словарями замен, лучше всего подходит именно формат srt как исходный. Это связано с некоторыми особенностями самих словарей замен которые могут искажать внутреннюю разметку. В результате текст может произноситься неправильно - будут звучать лишние буквы, непонятные наборы чисел и т.п. Поэтому если у вас есть субтитры в формате ass то лучше всего их предварительно обработать и преобразовать в формат srt с дальнейшей разметкой словарями с помощью программы балаболка. Для этого:- В окне №1 указываем путь к папке с файлами субтитров, и нажимаем кнопку «ass теги». Получаем список всех тегов. Как правило основной текст это Default все остальное зависит от разметки того кто создавал сами субтитры – это могут быть любые названия и т.п. песни сноски пояснения которые можно добавить в фильтр для пропуска в раздел «удаление всего кроме диалогов».
- Выбираем «только замены» и нажимаем кнопку «старт».
- После этого нажимаем кнопку «преобразовать в srt».
- Затем, предварительно отключив опцию «только замены» выбираем в окне №7 формат srt и снова нажимаем кнопку «старт».
Идем пить чай, если субтитров много, у вас есть минут 5-10 или больше в зависимости от скорости компьютера
Следует также отметить что при преобразовании файлов программой балаболка будут использованы только те словари, которые были подключены в ней при последнем запуске. Поэтому перед преобразованием есть смысл открыть программу и включить нужные нам словари. |
|
| | | | myTTS Subtitles Helper |
---|
| |
|