TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



IVONA Tatyana (Татьяна)

Предыдущая тема Следующая тема Перейти вниз
На страницу : 1, 2, 3, 4, 5, 6, 7  Следующий
АвторСообщениеIVONA Tatyana (Татьяна)
balabolka
V.I.P.
avatar


Сообщений : 1181
Репутация : 986

 balabolka :: Пн Май 20 2013, 21:46
Пн Май 20 2013, 21:46

На сайте www.ivona.com в списке голосов онлайн-демо появился русский голос "Татьяна". Звучит неплохо, даже замечательно.
Похоже, что это пока только бета, так как в новостях на сайте компании нет информации о выпуске русского голоса.

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 105
Репутация : 39

 Dmitry :: Вт Май 21 2013, 00:13
Вт Май 21 2013, 00:13

к сожалению услышал иностранные нотки в голосе Sad или показалось?

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1181
Репутация : 986

 balabolka :: Вт Май 21 2013, 09:21
Вт Май 21 2013, 09:21

Dmitry
Показалось. Диктор, чей голос был использован при создании, явно родом из России, в голосе нет ничего иностранного. (Хотел бы я, подобно профессору Хиггинсу из "Моей прекрасной леди", заявить что-то вроде "Судя по дикции и артикуляции, это уроженка села Шапкино Мучкапского района Тамбовской области", но на самом деле, понятия не имею, чей это говор.)

Меня разочаровало другое: когда "Татьяна" произнесла по-английски фразу "BrightVoice" (и произнесла совершенно правильно!), обрадовался, что, наконец-то, есть голос, который читает хорошо по-русски и по-английски. Увы, это не так; "Татьяна" читает латинские буквы также, как и другие русские голоса, - то есть просто заменяет латинские буквы русскими эквивалентами.

Досадно, что так до сих пор и не появились "многоязычные" компьютерные голоса, то есть такие голоса, которые бы умели анализировать читаемую фразу, определять ее язык и выбирать нужную грамматику. Переводчик Google же научился по нескольким словам определять язык, так что это вполне можно реализовать. Совсем необязательно, чтобы диктор, озвучивавший "Татьяну", мог чисто говорить на нескольких языках; но можно подготовить нужные лексемы для 5-6 основных европейских языков, пусть даже с небольшим акцентом. За "многоязычными" голосами будущее, я уверен.

Как уже писал выше, "Татьяна" пока не продается, ее нет в списке продаваемых голосов "IVONA Voices 2". Но когда появится, постараюсь купить ее легально: 39 евро за одиночную лицензию или 71 евро за лицензию на 3 компьютера - это разумная цена за качественный программный продукт. (А если Россию по ценам приравняют к Польше, то выйдет еще дешевле.)

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 105
Репутация : 39

 Dmitry :: Вт Май 21 2013, 09:57
Вт Май 21 2013, 09:57

цена приемлемая за 1 пк, тоже возьму.

утром сегодня погонял на сайте, все токи вчера на ночь показалось


хотелось бы еще мужской голос хорошего качества

Вернуться к началу Перейти вниз
Ajaja
V.I.P.


Сообщений : 50
Репутация : 28

 Ajaja :: Вт Июн 18 2013, 21:22
Вт Июн 18 2013, 21:22

Голос зарелизился:
http://www.ivona.com/en/products/ivona-reader-tatyana/
Обещают 30-дневный полнофункциональный триал.

Вернуться к началу Перейти вниз
Ajaja
V.I.P.


Сообщений : 50
Репутация : 28

 Ajaja :: Пт Июн 21 2013, 10:26
Пт Июн 21 2013, 10:26

Триал со вчерашнего дня доступен. Первые впечатления от голоса смешанные. Голос очень неплох. Но иностранные нотки все-таки присутствуют. Как и у Милены нет возможности регулировать паузу на знаках препинания внутри предложений, из-за чего на больших скоростях получается слишком рваный темп речи, спотыкания на каждой запятой. И пока не понятно, как править ударения.
Но Татьяна, по-моему, все-таки заслуживает отдельного раздела на форуме. В полку качественных русских голосов явное пополнение Smile

Вернуться к началу Перейти вниз
king
Новичок


Сообщений : 24
Репутация : 0

 king :: Пт Июн 21 2013, 21:46
Пт Июн 21 2013, 21:46

Ajaja
Аналогично, те же впечатления, интонирование Николая не превзойдено.

Вернуться к началу Перейти вниз
Significance
Интересующийся


Сообщений : 7
Репутация : 1

 Significance :: Пт Июн 21 2013, 21:51
Пт Июн 21 2013, 21:51

Ну наконец то свершилось то чего наверное так долго ждали!!! Ура! Хоть кто то теперь может заменить Алену, не говоря уже о Милене. Самое прекрасное это то что она может читать ту тематику к которой еще не сделаны словари для Аленки (научные термины: медицина, астрономия, физика и др. то что мало интересно большинству). Единственное что в ней останется на всегда - это немного раздражающим "балтийский акцент". Так что еще раз Ура!!!

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пт Июн 21 2013, 22:29
Пт Июн 21 2013, 22:29

мне она чем-то напомнила Ольгу только с каким-то другим акцентом...
вот кусочек для примера как есть без улучшений на скорости "+1" для тех кому лень устанавливать триальную версию.

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 626
Репутация : 208

 evmir_troll-hunter :: Пт Июн 21 2013, 22:34
Пт Июн 21 2013, 22:34

Significance пишет:
Хоть кто то теперь может заменить Алену
Какой эмоциональный отзыв - не успел появиться сырой голосок, и Алёну в утиль...Wink
Демо-семпл посмешил; МЕртвой мЕртв, эти гОспода, уибку, не запОет.

Всего пару абзацев, а количество ошибок зашкаливает!
Голосу расти и развиваться, а пока... детский сад и лепет!
---------
В 2010 г. я сказал, что в ближайшие 10 лет голосов равных Алёне не будет.:oldtimer: Прошло три года - я пока прав.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Сб Июн 22 2013, 19:50
Сб Июн 22 2013, 19:50

Все честно сперто
Ivona 2 Tatyana SAPI5 for Windows XP/W7
Спойлер:
 

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 105
Репутация : 39

 Dmitry :: Вс Июн 23 2013, 10:21
Вс Июн 23 2013, 10:21

интересно полякам понравится, если в польском движке носитель польского будет из китая учившего польский месяца три. Smile



так трудно что ли настоящего носителя языка найти? а не тех, кто уехал лет 30-40 назад и уже имеет акцент....

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Вс Июн 23 2013, 13:17
Вс Июн 23 2013, 13:17

Цитата :
В 2010 г. я сказал, что в ближайшие 10
лет голосов равных Алёне не будет. Прошло три года - я пока прав.
Smile вы не меняете своих стойких предпочтений (заблуждений).








Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Июн 23 2013, 14:04
Вс Июн 23 2013, 14:04

у меня получилось научить ее произносить правильно слово запоёт :crazy:
в фале russian-ivona.lex правило:
Код:
(?<=^|[[:punct:][:space:]])запоет(?=[[:punct:][:space:]]|$) "<speak><phoneme alphabet='x-sampa' ph='z6p6j&quot;ot'/></speak>"
форма записи ужасная, но если разобраться то можно привыкнуть:patsak:
весь лексикон - это просто словарь замен использующий регулярные выражения по аналогии со словарями *.rex и все что нужно для коррекции и добавления своей фонетической транскрипции это просто дописать тег
Код:
<speak><phoneme alphabet='x-sampa' ph='*****'/></speak>
в текст, где вместо **** идет сама транскрипция слова

в общем можно это все сделать и через просто *.rex или даже *.dic словарь invalid

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 626
Репутация : 208

 evmir_troll-hunter :: Пн Июн 24 2013, 01:55
Пн Июн 24 2013, 01:55

Dmitry пишет:
так трудно что ли настоящего носителя языка найти?
А зачем?! Ведь нравится же уже кому-то. Ибо "Самое прекрасное это то что она может читать ту тематику к которой еще не сделаны словари для Аленки (научные термины: медицина, астрономия, физика и др.)"Laughing
Lexus пишет:
не меняете своих стойких предпочтений (заблуждений).
:yes:На том и стою́, чего и Вам желаю.

Вернуться к началу Перейти вниз
jovany
Наблюдатель


Сообщений : 2
Репутация : 0

 jovany :: Пн Июн 24 2013, 02:39
Пн Июн 24 2013, 02:39

apokrif пишет:
1. Rename Ivona_Voice_1.6_Tatyana_22kHz.dat to Ivona_Voice_1.6_Tatyana_22kHz.exe
2. Install
3. Patch to remove 30 day trial (optional):
Файлик: ivona_sapi5_voice_v1.6.xx.dll
Ищется: 7507F7DAF7D883DA00
Меняется на: B8FF00000090909090
А каким образом искать?

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Пн Июн 24 2013, 08:49
Пн Июн 24 2013, 08:49

jovany пишет:
А каким образом искать?
Что под рукой есть: WinHex, hiew, etc.
На 4PDA есть ivona_sapi5_voice_v1.6.60_patched.rar

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Пн Июн 24 2013, 12:08
Пн Июн 24 2013, 12:08

по-моему просто достаточно установить сам движок (тот который нужно переименовывать из *.dat в *.exe) и применить к нему лекарство из шапки отсюда, или нет?
а сам файл находится тут \IVONA\IVONA 2 Voice\x86\
только окно настроек голоса нужно будет вызывать через панель синтеза речи
Спойлер:
 

Вернуться к началу Перейти вниз
jovany
Наблюдатель


Сообщений : 2
Репутация : 0

 jovany :: Пн Июн 24 2013, 16:49
Пн Июн 24 2013, 16:49

apokrif
Спасибо, всё работает!
evilone_
На лекарство из шапки оттуда Каспер зарычал как башенный. Так что лучше ручками)

Вернуться к началу Перейти вниз
Ajaja
V.I.P.


Сообщений : 50
Репутация : 28

 Ajaja :: Пн Июн 24 2013, 17:22
Пн Июн 24 2013, 17:22

evilone_ пишет:
у меня получилось научить ее произносить правильно слово запоёт :crazy:
в фале russian-ivona.lex правило:
Код:
(?<=^|[[:punct:][:space:]])запоет(?=[[:punct:][:space:]]|$) "<speak><phoneme alphabet='x-sampa' ph='z6p6j&quot;ot'/></speak>"

Для этого слова, кажется, достаточно простой ё-фикации (запоет -> запоёт).
Но в целом для правки ударений, похоже, без фонетической записи не обойтись. Ударения как написано в ивоновском FAQ ( How to change the word stress? ), с Татьяной не работают. Sad Ни апострофы-кавычки(`/'/"), ни уникодовский символ acute accent (´) ни сами уникодовские гласные c acute вроде ó/á/é.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1181
Репутация : 986

 balabolka :: Пн Июн 24 2013, 20:59
Пн Июн 24 2013, 20:59

Задавал вопрос по поводу символа ударения в службу поддержки; ответили, что для русского голоса эта функция не поддерживается. Посоветовали делить слова на части при помощи пробела, а также отправлять слова с неправильными ударениями на их электронный адрес.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Пн Июн 24 2013, 21:13
Пн Июн 24 2013, 21:13

balabolka пишет:
ответили, что для русского голоса эта функция не поддерживается.
Класс! Интересно, это они её специально отломали, "по старой памяти"?
Я бы еще понял, если они ударение не умели автоматом определять, но "не уметь" ставить его принудительно - это не спроста!

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Пн Июн 24 2013, 22:47
Пн Июн 24 2013, 22:47

Цитата :
Файлик: ivona_sapi5_voice_v1.6.xx.dll

В системе два подходящих под описание файла. Еще один:
c:\Program Files (x86)\IVONA\IVONA 2 Voice\x64\ivona_sapi5_voice_v1.6.60_x64.dll
В нем что-то менять нужно? Если да, то что?

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Пн Июн 24 2013, 23:34
Пн Июн 24 2013, 23:34

А теперь смертельный номер!

http://rghost.ru/46993777

Очень неплохо, с виленско-белостоцким акцентом читает на беларускай мове.
Общие корни, сказываютя Smile

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Пн Июн 24 2013, 23:52
Пн Июн 24 2013, 23:52

Lexus пишет:
c:\Program Files (x86)\IVONA\IVONA 2 Voice\x64\ivona_sapi5_voice_v1.6.60_x64.dll
В нем что-то менять нужно? Если да, то что?
Это для x64 SAPI5. Оно вам надо?

Вернуться к началу Перейти вниз
Lexus
Эксперт
avatar


Сообщений : 413
Репутация : 32

 Lexus :: Вт Июн 25 2013, 00:07
Вт Июн 25 2013, 00:07

apokrif пишет:
Это для x64 SAPI5. Оно вам надо?
Виндовс у меня x64, так что есть вероятность, что пригодится.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Вт Июн 25 2013, 04:28
Вт Июн 25 2013, 04:28

Lexus пишет:
Виндовс у меня x64, так что есть вероятность, что пригодится.
Угу. Для x64 программ, например Office x64. "Сани" не катят, уже обсудили, больше не стоит. Smile

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1181
Репутация : 986

 balabolka :: Вт Июн 25 2013, 20:16
Вт Июн 25 2013, 20:16

Задал в службу поддержки IVONA вопрос о режимах "Strict" и "Professional reader", о которых говорится в справке голоса:

Цитата :
The IVONA Voice can work in two reading modes: "Strict" and "Professional reader" mode. IVONA interprets texts in different ways, depending of the reading mode settings.


Working in the "Strict" mode IVONA will read all special characters (e.g. commas, dash, etc), simply by reading their names. The "Strict" mode is a very usefull feature during text correction because it allows you to easily capture the irregularities of punctuation.


While working in the "Professional reader" mode IVONA will try to read texts the same way a human reader would do, this way punctuation marks will be interpreted and will change the sentence intonation. The "professional reader" mode can be very helpful for synthesizing large texts unfamiliar to the user, like books with many dialogues.

Сегодня получил ответ, что это ошибка в тексте справки. Эти настройки были в окне конфигурации голоса некоторое время назад, но теперь они убраны из программного продукта.

---

Также я пожаловался на то, что апостроф не только не работает как способ коррекции ударения в слове, но также и произносится голосом вслух: "д апостроф Артаньян", "Жанна д апостроф Арк". Вот ответ службы поддержки:

Цитата :
As regards the apostrophe it will be certainly corrected, but I cannot say when. The Russian voice has been issued a few weeks ago. Our customers’ feedback is very welcome. If you notice any other error, please let me know.

You can get rid of any character with the following regex:

(?<=^|[[:punct:][:space:][:alnum:]])any_character(?=[[:punct:][:space:][:alnum:]]|$)

In the field “To” in the Advanced tab of lexicon just enter a space character.
"Ситуация с апострофом будет исправлена, но не можем сказать, когда именно. Русский голос был выпущен лишь несколько недель назад. Мы приветствуем отклики от наших пользователей. Если обнаружите какую-либо ошибку, пожалуйста, дайте нам знать."

Вернуться к началу Перейти вниз
Ajaja
V.I.P.


Сообщений : 50
Репутация : 28

 Ajaja :: Вт Июн 25 2013, 20:43
Вт Июн 25 2013, 20:43

Странно. Проговаривание апострофа можно же в лексиконе отключить, они там целый раздел Ignored expressions сделали в стиле "просто поставь галочку".
Кстати, интересно, как туда свое добавлять?

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1181
Репутация : 986

 balabolka :: Вт Июн 25 2013, 22:56
Вт Июн 25 2013, 22:56

Ajaja
Да, меня тоже удивил предложенный вариант решения проблемы. Посоветовать добавить регулярное выражение в лексикон вместо того, чтобы предложить поставить одну "галочку" - это как-то уж очень сурово. (Но зато был предложен универсальный способ.)

Цитата :
Кстати, интересно, как туда свое добавлять?
Никак, всё хранится внутри sapi_dialogs2_v1_6_60.dll.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Ср Июн 26 2013, 00:01
Ср Июн 26 2013, 00:01

balabolka пишет:
Our customers’ feedback is very welcome. If you notice any other error, please let me know.
Если б они для Андроида TTS выложили, customers’ feedback живее пошел бы Wink

А вообще, странно, что russian-ivona.lex это именно текстовый файл для всего, включая лексикон/словарь. На "мобильных платформах" так способом "далеко не уедешь", IMHO.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Вс Июн 30 2013, 00:46
Вс Июн 30 2013, 00:46

IVONA накрылась... Amazon-ом

Вернуться к началу Перейти вниз
MoppoH197
Наблюдатель


Сообщений : 1
Репутация : 0

 MoppoH197 :: Вс Июн 30 2013, 22:04
Вс Июн 30 2013, 22:04

сыроват конечно голос, нет редактора словаря, интонации в предложение ставит как то странно, окончания слов проглатывает, будем надеяться что авторы его доделают

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 105
Репутация : 39

 Dmitry :: Вт Авг 06 2013, 20:24
Вт Авг 06 2013, 20:24

релиз был неделю назад, они новый билд выпустили или тупо убрали слово beta?

Вернуться к началу Перейти вниз
Significance
Интересующийся


Сообщений : 7
Репутация : 1

 Significance :: Ср Авг 07 2013, 20:33
Ср Авг 07 2013, 20:33

Dmitry второе (тупо убрали слово beta и повесили на главную страницу). Никаких обновлений не было, все голоса с билдом 1.6.60 включая Таню! Единственное только что IVONA Reader 1.1.3 версии на оф сайте (в триалке), на торрентах и смежных сайтах 1.1.2 - но разности в функционале нет.

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 105
Репутация : 39

 Dmitry :: Ср Авг 07 2013, 21:52
Ср Авг 07 2013, 21:52

evmir_troll-hunter пишет:
Демо-семпл посмешил; МЕртвой мЕртв, эти гОспода, уибку, не запОет.

подключаем словарь для для Ё-фикации текста в балаболке http://dl.dropbox.com/u/9079740/yo-dic.7z и проблема с Ё решается...



лично мне в целом голос понравился , правда ошибки ошибки и снова ошибки... сидеть и писать словарь...

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Ср Авг 07 2013, 23:58
Ср Авг 07 2013, 23:58

Dmitry пишет:
подключаем словарь для для Ё-фикации текста в балаболке http://dl.dropbox.com/u/9079740/yo-dic.7z и проблема с Ё решается...
Не понял... А причём тут IVONA Tatyana (Татьяна)?
Чем ваш словарь отличается от http://mytts.forum2x2.ru/t397-topic
Или вы просто с 4pda "не глядя" репостите Smile
http://4pda.ru/forum/index.php?s=&showtopic=200728&view=findpost&p=24087173

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 105
Репутация : 39

 Dmitry :: Чт Авг 08 2013, 00:07
Чт Авг 08 2013, 00:07

apokrif пишет:
Не понял... А причём тут IVONA Tatyana (Татьяна)?


у нее проблемы с буквой Ё как выше показано на примере
Цитата :
МЕртвой мЕртв, эти гОспода, уибку, не запОет

данный словарь через балаболку ее почти полностью исправляет.

apokrif пишет:
Чем ваш словарь отличается от http://mytts.forum2x2.ru/t397-topic

ничем, ссылка взята именно оттуда. я себе словарь не приписывал. если не заметили название оттуда же "для Ё-фикации текста"

apokrif пишет:
Или вы просто с 4pda "не глядя" репостите Smile
а если бы вы посмотрели на время создания моего поста, и того. вы бы заметили разницу во времени ...

Вернуться к началу Перейти вниз
evmir_troll-hunter
Admin
avatar


Сообщений : 626
Репутация : 208

 evmir_troll-hunter :: Чт Авг 08 2013, 12:42
Чт Авг 08 2013, 12:42

Dmitry пишет:
у нее проблемы с буквой Ё как выше показано на примере
Цитата:
МЕртвой мЕртв, эти гОспода, уибку, не запОет
проблемы "ё" может и поправимы, а "уибку"?
Ошибки есть во всех голосах, вопрос в их насыщенности на единицу текста (предложение, абзац).
В демо-семле лишь 2-3 абзаца, а нелепостей полно́! Чем делать лексиконы/словари, лучше сразу закопаться.:skul:

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 105
Репутация : 39

 Dmitry :: Чт Авг 08 2013, 14:37
Чт Авг 08 2013, 14:37

evmir_troll-hunter пишет:

а я делаю словарик через балаболку, вчера начал. 21 слово с неправильным ударением за 2 часа, книжка из жанра фэнтези.

конечно выход саппорт предложил странный(делить слово пробелом) но, получается более менее.


что нравится, нету проблем с окончаниями как у милены "юкание" и еще какая та буква. читает без нервных визгов


по файлу russian-ivona.lex , мне кажется странным политика компании, раз такой геморройный способ записи, могли бы собирать ошибки на почту свою, и править сами, выкладывая обновление данного файла на фтп свой, как это делают антивирусные программы.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Чт Авг 08 2013, 17:52
Чт Авг 08 2013, 17:52

Dmitry пишет:
по файлу russian-ivona.lex , мне кажется странным политика компании, раз такой геморройный способ записи, могли бы собирать ошибки на почту свою, и править сами, выкладывая обновление данного файла на фтп свой, как это делают антивирусные программы.
Им надо просто предложить так делать.
ivona саппорт довольно быстро отвечает.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Чт Авг 08 2013, 23:15
Чт Авг 08 2013, 23:15

Dmitry пишет:
по файлу russian-ivona.lex , мне кажется странным политика компании, раз такой геморройный способ записи
просто нужен аналог LoqLexer для Татьяны Wink
или наверно можно даже делать транскрипцию LoqLexer-ом а потом переделывать быстренько это безобразие под Татьяну, нет?
для Ольги даже есть уже готовый лексикон с транскрипциями, формат записи для Татьяны есть - его (для Ольги) можно же переделать под Татьяну?

Вернуться к началу Перейти вниз
profrager
Наблюдатель


Сообщений : 1
Репутация : 0

 profrager :: Сб Авг 10 2013, 14:28
Сб Авг 10 2013, 14:28

evilone_ пишет:
для Ольги даже есть уже готовый лексикон с транскрипциями, формат записи для Татьяны есть - его (для Ольги) можно же переделать под Татьяну?
После описания правил перевода фонетики с одного движка в другой несложно будет написать конвертер, но вот создание этих правил и будут основной проблемой. Т.е. нужно, чтобы кто-то попытался сопоставить звуки, создаваемые определенными знаками на одном и другом движках. Хотя мне кажется для того, кто создавал правила фонетики для "Ольги" это будет гораздо легче, чем стороннему заинтересованному человеку, вроде меня.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Авг 11 2013, 01:11
Вс Авг 11 2013, 01:11

profrager пишет:
Т.е. нужно, чтобы кто-то попытался сопоставить звуки, создаваемые определенными знаками на одном и другом движках.
ну и там и там, по-моему, x-sampa, нет?
только для Таньки в транскрипции нужно менять определенные знаки
Код:
&lt; это <
&gt; это >
&amp; это &
&apos; это '
&quot; это "
<!-- комментарий -->
для Ольки:
Цитата :
"авторитете" = "\SAMPA=(Vft@r'it'@"et'@#)"
для Таньки:
Цитата :
(?<=^|[[:punct:][:space:]])авторитете(?=[[:punct:][:space:]]|$) "<speak><phoneme alphabet='x-sampa' ph='Vft@r&apos;it&apos;@&quot;et&apos;@'/></speak>"
и в начале должно быть
Код:
#& encoding=windows-1251
вместо
Код:
#& encoding=utf-8

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Вс Авг 11 2013, 05:09
Вс Авг 11 2013, 05:09

evilone_ пишет:
просто нужен аналог LoqLexer для Татьяны
или наверно можно даже делать транскрипцию LoqLexer-ом а потом переделывать быстренько это безобразие под Татьяну, нет?
для Ольги даже есть уже готовый лексикон с транскрипциями, формат записи для Татьяны есть - его (для Ольги) можно же переделать под Татьяну?
В словаре example.lex ~4050 слов.
Для Ольги это "приблизительно" простой поиск и замена слов в строке.
Для Татьяны в словаре хранятся "Perl Compatible Regular Expressions (PCRE)"
Выполнять по 4000 PCRE для каждого фрагмента текста это порядочная нагрузка для CPU.
Т.е. перегнать-то словарь можно, а вот использовать...

По идее, нужно сделать обработку словаря (так же, как делали для Милены):
Запросить x-sampa для слова, если она совпадёт с той, что в словаре - слово включать в словарь НЕ нужно.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Авг 11 2013, 15:43
Вс Авг 11 2013, 15:43

да, нагрузка наверно будет но можно и попробовать
для примера переделанный лексикон от ольки
Словарь транскрипций (sampa)
там есть несколько слов с ударением в формате для ольги но они безвредны их можно будет потом удалить если что
также можно сделать отдельный лексикон для омографов по аналогии с аленкой
остается вопрос в каком виде (формате) делать ударение для словаря замен для ссылки на слово из лексикона Suspect
p.s. а как для милены ставится ударение для ссылки в лексикон если слово омограф?

Вернуться к началу Перейти вниз
upv
Наблюдатель


Сообщений : 1
Репутация : 0

 upv :: Вс Авг 11 2013, 16:37
Вс Авг 11 2013, 16:37

Многие слова из "Словарь транскрипций (sampa)" Tatyana произносит правильно и без оного
Судя по всему лексикон читается не до конца(добавил "пора" и ноль реакции)

Вернуться к началу Перейти вниз
Dmitry
Бывалый


Сообщений : 105
Репутация : 39

 Dmitry :: Вс Авг 11 2013, 17:05
Вс Авг 11 2013, 17:05

на самом деле после более детального знакомства с татьяной, можно сказать, что проблем с ошибками у нее не много(если исключить ё которое лечится словарем уже имеющимся)



из-за этого тупо перегонять чужие словари не вижу смысла, нужна программка как milan для милены, дабы обычный пользователь мог вбить слово, а в словарь записалось уже в виде транскрипции


иначе забьем мусором лексикон. из-за чего могут быть проблемы как с загрузкой цп, так и не правильное произношение.

Вернуться к началу Перейти вниз
apokrif
V.I.P.


Сообщений : 323
Репутация : 85

 apokrif :: Вс Авг 11 2013, 19:40
Вс Авг 11 2013, 19:40

evilone_ пишет:
p.s. а как для милены ставится ударение для ссылки в лексикон если слово омограф?
Честно - никак, ударение ставится только транскрипций.
В 99% работает вот так: "Он был ДО-ма. Вдалеке виднелись до-МА."

Dmitry пишет:
из-за этого тупо перегонять чужие словари не вижу смысла, нужна программка как milan для милены, дабы обычный пользователь мог вбить слово, а в словарь записалось уже в виде транскрипции
Это подход "вручную", а для автоматизации надо:
apokrif пишет:
Запросить x-sampa для слова, если она совпадёт с той, что в словаре - слово включать в словарь НЕ нужно.
Есть такая функция в SAPI5 или в самой Тане?

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Авг 11 2013, 22:06
Вс Авг 11 2013, 22:06

мда.. и как оказалось транскрипции не всегда совпадают с олькиными :kak_dam:
вот для примера:
Код:
(?<=^|[[:punct:][:space:]])словаря(?=[[:punct:][:space:]]|$) "<speak><phoneme alphabet='x-sampa' ph='s5@vVr&apos;y&quot;a'/></speak>"
т.е. надо чтобы было
Код:
s5@vVr&apos;&quot;a
вместо
Код:
s5@vVr&apos;y&quot;a
и такого много Sad вручную такое искать долго будет...

apokrif, т.е. в слове выделить ударный слог? например ЗА-мок зам-ОК или за-МО-к? Suspect

Вернуться к началу Перейти вниз

IVONA Tatyana (Татьяна)

Предыдущая тема Следующая тема Вернуться к началу
IVONA Tatyana (Татьяна)
Страница 1 из 7Страница 1 из 7На страницу : 1, 2, 3, 4, 5, 6, 7  Следующий
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении