语音合成技术和文本语音转换 - Synthetic voice and Text to Speech technology - Синтетический голос и технологии преобразования текста в речь
 
TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  

myTTS Subtitles Helper

Предыдущая тема Следующая тема Перейти вниз
АвторСообщениеmyTTS Subtitles Helper
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Пт Дек 28 2012, 18:01
Пт Дек 28 2012, 18:01

Программа разметки текста субтитров для чтения с использованием речевого синтезатора.
С помощью программы можно быстро подготовить к озвучиванию любой список субтитров и удалить все "лишнее" из файлов (с использованием регулярных выражений).

автор: muk79

Установка и настройка
Программа не требует установки. Достаточно запустить, выбрать папку с файлами и путь к программе. Программа поддерживает работу с программой балаболка. В будущем возможно будет поддержка и других.

Режим "только замены" обрабатывает файлы только с учетом правил замен из окна-списка программы.
Параметр "задержка" (в секундах) используется для принудительной остановки выполнения преобразования в случае если программа по какой-либо причине зависает. Задавая его значение можно принудительно установить максимальное время затраченное на преобразование одного файла. Список правил окна-списка хранится в файле rules.txt

31 myTTS Subtitles Helper
31 myttssh.ini
31 updater.exe
31 rules.txt
31 filter.txt
31 SAConv.exe (зеркало)
Все ошибки и\или замечания пишите, пожалуйста, здесь.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Пт Дек 28 2012, 18:33
Пт Дек 28 2012, 18:33

поскольку правила капризные очень то для проверки их работы "на лету" удобно использовать Regex песочницу (PCRE) (vregexp) из пакета транскриптора :pink:

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1228
Репутация : 986

 balabolka :: Пт Дек 28 2012, 21:41
Пт Дек 28 2012, 21:41

А сами субтитры чем будут читаться? ABM Subtitles Reader, KMPlayer?
KMPlayer, вроде бы, умеет "отбрасывать" специальные теги, читая вслух только сам текст? (Правда, давно уже не пользовался этим плеером; возможно, я ошибаюсь.)

Это Han Hyo Joo на аватарке?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Пт Дек 28 2012, 23:27
Пт Дек 28 2012, 23:27

balabolka, я их читаю KMPlayer-ом, но наверно можно и тем и тем
там отбрасывать можно не столько теги сколько дополнительную информацию
например рекламу в начале и\или конце файлов, примечания, перевод песен (очень сильно раздражает) и прочую малополезную информацию
при прослушивании иногда звучит много лишней информации которая отвлекает от просмотра да и если субтитров много то вручную их преобразовывать очень долго получается, а так раз два и готово :beach:

evmir,
можно двумя способами:
1. скачать все файлы myttssh.exe, updater.exe и rules.txt (если блокируется доступ в интернет то при проверке обновлений программе еще нужен доступ на сайт tts-alenka.narod.ru);
2. скачать только myttssh.exe а остальные загрузятся после первого запуска.

Цитата :
как с правилами замен из .dic словарей? их все надо в rules.txt вставлять?
это просто надстройка с дополнительной функцией обработки текста regexp-словарем для нее нужна программа балаболка с подключенным набором словарей (путь к программе *.exe указать нужно) если выбрать "только замены" тогда не нужна, будет работать только словарь rules.txt (набор правил - только левая часть правила, та которую нужно удалить)
для демагога пока нет потому что там нет поддержки командной строки для преобразования текста, или есть? Suspect

очень очень давно нужна была и наверно еще пригодится кому-то :loveshower:

balabolka, да silent

Вернуться к началу Перейти вниз
muk79
Участник «online словари»


Сообщений : 102
Репутация : 29

 muk79 :: Сб Дек 29 2012, 03:56
Сб Дек 29 2012, 03:56

Небольшие изменения: правила теперь имеют левую и правую части - что заменить=чем заменить; можно задать любое расширение для списка файлов srt, ass, txt ...
В принципе, словарь тут и не сильно нужен, все замены можно подключить отдельным rex-словарем. Есть правда пару исключений где rex-словарь не поможет но их мало. Но если нужно пусть будет. При замене оригинал файла будет переименован в old.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 616
Репутация : 208

 evmir_troll-hunter :: Пн Дек 31 2012, 04:10
Пн Дек 31 2012, 04:10

Цитата :
как с правилами замен из .dic словарей? их все надо в rules.txt вставлять?
evilone_ пишет:
это просто надстройка с дополнительной функцией обработки текста regexp-словарем для нее нужна программа балаболка с подключенным набором словарей
Я как раз про словари замен и хотел уточнить - теперь ясно.
Хорошая идея, пакетно и быстро, спасибо!

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Вс Янв 06 2013, 04:48
Вс Янв 06 2013, 04:48

самый лучший вариант для работы с аленкиными словарями это srt формат
ass у меня почему-то иногда глючит + при работе с корректором искажаются теги (нужно менять словарь) - не все строки читает, но в ass удобно фильтровать диалоги, песни, примечания и т.п. если субтитры правильно сделаны

я делаю так:
- сначала обработка ass в myttssh только замены (убираем все лишнее);
- потом вот этой программой из ass делаю srt;
- и затем в myttssh уже полная замена

получается немножко дольше но с лучшим результатом Wink


Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Сб Янв 12 2013, 00:20
Сб Янв 12 2013, 00:20

программа обновилась: :pink:
- добавился конвертер в формат srt;
- сохранение словаря при редактировании;
- предпросмотр правил (вверху окно для исходного текста - внизу результат преобразования всеми правилами);
- появилось извлечение тегов для последующего построения правил фильтрации субтитров в формате ass (можно быстро найти все какие есть, у всех они разные и правила строить приходится отдельно под каждый вариант).

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Вс Янв 20 2013, 15:09
Вс Янв 20 2013, 15:09

обновление:
- добавился ansi-utf конвертер;
- программа работает с файлами в кодировке ansi для поддержки старой версии балаболки, если файл в utf он будет автоматически преобразован;
- добавился regexp-фильтр (быстрый поиск строк по шаблону);

p.s. у программы был изменен упаковщик, поэтому возможны ложные срабатывания некоторых антивирусных программ но вирусов там нет alien

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Сб Июн 01 2013, 22:08
Сб Июн 01 2013, 22:08

изменились ссылки для обновлений - заменить файл myttssh.ini
чуть позже добавим инструкцию как быстренько подготовить ass-субтитры для чтения с помощью myTTS Subtitles Helper Wink

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 859
Репутация : 317

 evilone_ :: Пт Июн 07 2013, 21:04
Пт Июн 07 2013, 21:04

Итак...

Как правило, наиболее часто встречающийся формат субтитров сейчас либо srt либо ass. Да, есть и много других, внешних и встроенных но в большинстве случаев натыкаешься именно на них.

В отличии от srt, ass субтитры, если они правильно размеченные, интереснее - в них быстро можно найти и отсеять все лишнее - то, что озвучивать не нужно, например рекламу, текст песен и прочую лишнюю для прослушивания во время просмотра информацию.

Все это можно быстро сделать при помощи программы myTTS Subtitles Helper. Быстро найти какие-то шаблонные фразы и словосочетания, например имена героев, названия, слова с цифрами и т.п. что поможет правильно подготовить и разметить текст для дальнейшего озвучивания.

После первого запуска программа обновит словари и фильтр для поиска фраз которые в дальнейшем можно будет редактировать и сохранять самому. И словарь и фильтр используют регулярные выражения для быстрого поиска и замены текста по маске.

Главное окно программы выглядит примерно так:


  • В окне №1 указывается путь к папке с файлами субтитров.
  • В окне №2 указывается путь к программе балаболка с помощью которой будет размечен текст.
  • Окно №3 служит для ввода и редактирования правил для словаря замен. Правила строятся по принципу (что заменить)=(чем заменить) т.е. символ «=» отделяет левую часть правила от правой.
  • Окно №4 – фильтр поиска по принципу совпадения т.е. если в строке будет выражение из этого списка то оно останется, отсеяв остальной текст.
  • Окна №5 и №6 служат для предварительного просмотра работы правил. Скопировав текст в окно №5 результат можно будет увидеть в окне №6. Все это необходимо для удобной отладки правил, чтобы избежать ошибок замен.
  • «Задержка» – в этом поле вводится число, в секундах, по истечении которого программа балаболка будет автоматически перезапущена на преобразование следующего по списку файла. Это необходимо в том случае когда она по какой-то причине «задумается». На старых версия бывало что программа зависала при обработке текста большим количеством словарей. Пустое значение автоматически отключает эту функцию.
  • Опция «только замены» будет полезна если нужно обработать файлы только словарем замен без программы балаболка и ее словарей, для предварительной подготовки текста.
  • В окне №7 выбирается формат субтитров для обработки. В одной папке могут быть любые файлы но программа будет обрабатывать только те из них, которые имеют выбранное расширение. Это бывает иногда удобно при преобразовании формата субтитров.
  • Кнопка «обновление» проверяет обновление программы и словарей.
  • Кнопка «сохранить словари» сохраняет текущий текст в окнах №3 и №4.
  • Кнопка «преобразовать в srt» служит для конвертирования в формат srt субтитров из других форматов.
  • Кнопка «ass теги» служит для быстрого поиска всех тегов в субтитрах. Результат выводиться в окно №6.
  • Кнопки «ansi2utf» и «utf2ansi» служат для преобразования соответствующего формата субтитров для старой версии программы балаболка.
  • Кнопка «фильтр» осуществляет поиск строк заданных в окне №4. Результат выводиться в окно №6.
  • Кнопка «старт» запускает процесс преобразования субтитров в указанной папке.

При преобразовании файла субтитров программой балаболка, с ее словарями замен, лучше всего подходит именно формат srt как исходный. Это связано с некоторыми особенностями самих словарей замен которые могут искажать внутреннюю разметку. В результате текст может произноситься неправильно - будут звучать лишние буквы, непонятные наборы чисел и т.п. Поэтому если у вас есть субтитры в формате ass то лучше всего их предварительно обработать и преобразовать в формат srt с дальнейшей разметкой словарями с помощью программы балаболка.
Для этого:
  1. В окне №1 указываем путь к папке с файлами субтитров, и нажимаем кнопку «ass теги». Получаем список всех тегов. Как правило основной текст это Default все остальное зависит от разметки того кто создавал сами субтитры – это могут быть любые названия и т.п. песни сноски пояснения которые можно добавить в фильтр для пропуска в раздел «удаление всего кроме диалогов».
  2. Выбираем «только замены» и нажимаем кнопку «старт».
  3. После этого нажимаем кнопку «преобразовать в srt».
  4. Затем, предварительно отключив опцию «только замены» выбираем в окне №7 формат srt и снова нажимаем кнопку «старт».
Идем пить чай, если субтитров много, у вас есть минут 5-10 или больше в зависимости от скорости компьютера :hammerdrill:

Следует также отметить что при преобразовании файлов программой балаболка будут использованы только те словари, которые были подключены в ней при последнем запуске. Поэтому перед преобразованием есть смысл открыть программу и включить нужные нам словари.

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

myTTS Subtitles Helper

Предыдущая тема Следующая тема Вернуться к началу
myTTS Subtitles Helper
Страница 1 из 1Страница 1 из 1
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении
Создать форум | © phpBB | Бесплатный форум поддержки | Сообщить о нарушении | Создать ваш бесплатный блог