|
|
Автор | Сообщение | IVONA Tatyana (Татьяна) |
---|
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Май 20 2013, 21:46 | Пн Май 20 2013, 21:46 | |
| На сайте www.ivona.com в списке голосов онлайн-демо появился русский голос "Татьяна". Звучит неплохо, даже замечательно. Похоже, что это пока только бета, так как в новостях на сайте компании нет информации о выпуске русского голоса. |
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Вт Май 21 2013, 00:13 | Вт Май 21 2013, 00:13 | |
| к сожалению услышал иностранные нотки в голосе или показалось? |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вт Май 21 2013, 09:21 | Вт Май 21 2013, 09:21 | |
| Dmitry Показалось. Диктор, чей голос был использован при создании, явно родом из России, в голосе нет ничего иностранного. (Хотел бы я, подобно профессору Хиггинсу из "Моей прекрасной леди", заявить что-то вроде "Судя по дикции и артикуляции, это уроженка села Шапкино Мучкапского района Тамбовской области", но на самом деле, понятия не имею, чей это говор.)
Меня разочаровало другое: когда "Татьяна" произнесла по-английски фразу "BrightVoice" (и произнесла совершенно правильно!), обрадовался, что, наконец-то, есть голос, который читает хорошо по-русски и по-английски. Увы, это не так; "Татьяна" читает латинские буквы также, как и другие русские голоса, - то есть просто заменяет латинские буквы русскими эквивалентами.
Досадно, что так до сих пор и не появились "многоязычные" компьютерные голоса, то есть такие голоса, которые бы умели анализировать читаемую фразу, определять ее язык и выбирать нужную грамматику. Переводчик Google же научился по нескольким словам определять язык, так что это вполне можно реализовать. Совсем необязательно, чтобы диктор, озвучивавший "Татьяну", мог чисто говорить на нескольких языках; но можно подготовить нужные лексемы для 5-6 основных европейских языков, пусть даже с небольшим акцентом. За "многоязычными" голосами будущее, я уверен.
Как уже писал выше, "Татьяна" пока не продается, ее нет в списке продаваемых голосов "IVONA Voices 2". Но когда появится, постараюсь купить ее легально: 39 евро за одиночную лицензию или 71 евро за лицензию на 3 компьютера - это разумная цена за качественный программный продукт. (А если Россию по ценам приравняют к Польше, то выйдет еще дешевле.) |
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Вт Май 21 2013, 09:57 | Вт Май 21 2013, 09:57 | |
| цена приемлемая за 1 пк, тоже возьму.
утром сегодня погонял на сайте, все токи вчера на ночь показалось
хотелось бы еще мужской голос хорошего качества |
|
|
| |
Ajaja V.I.P.
Сообщений : 49
Репутация : 28
| Ajaja | :: Вт Июн 18 2013, 21:22 | Вт Июн 18 2013, 21:22 | |
| Голос зарелизился: http://www.ivona.com/en/products/ivona-reader-tatyana/ Обещают 30-дневный полнофункциональный триал. |
|
|
| |
Ajaja V.I.P.
Сообщений : 49
Репутация : 28
| Ajaja | :: Пт Июн 21 2013, 10:26 | Пт Июн 21 2013, 10:26 | |
| Триал со вчерашнего дня доступен. Первые впечатления от голоса смешанные. Голос очень неплох. Но иностранные нотки все-таки присутствуют. Как и у Милены нет возможности регулировать паузу на знаках препинания внутри предложений, из-за чего на больших скоростях получается слишком рваный темп речи, спотыкания на каждой запятой. И пока не понятно, как править ударения. Но Татьяна, по-моему, все-таки заслуживает отдельного раздела на форуме. В полку качественных русских голосов явное пополнение
|
|
|
| |
king Новичок
Сообщений : 24
Репутация : 0
| king | :: Пт Июн 21 2013, 21:46 | Пт Июн 21 2013, 21:46 | |
| Ajaja Аналогично, те же впечатления, интонирование Николая не превзойдено. |
|
|
| |
Significance Интересующийся
Сообщений : 7
Репутация : 1
| Significance | :: Пт Июн 21 2013, 21:51 | Пт Июн 21 2013, 21:51 | |
| Ну наконец то свершилось то чего наверное так долго ждали!!! Ура! Хоть кто то теперь может заменить Алену, не говоря уже о Милене. Самое прекрасное это то что она может читать ту тематику к которой еще не сделаны словари для Аленки (научные термины: медицина, астрономия, физика и др. то что мало интересно большинству). Единственное что в ней останется на всегда - это немного раздражающим "балтийский акцент". Так что еще раз Ура!!! |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Июн 21 2013, 22:29 | Пт Июн 21 2013, 22:29 | |
| мне она чем-то напомнила Ольгу только с каким-то другим акцентом... вот кусочек для примера как есть без улучшений на скорости "+1" для тех кому лень устанавливать триальную версию. |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Пт Июн 21 2013, 22:34 | Пт Июн 21 2013, 22:34 | |
| - Significance пишет:
- Хоть кто то теперь может заменить Алену
Какой эмоциональный отзыв - не успел появиться сырой голосок, и Алёну в утиль... Демо-семпл посмешил; МЕртвой мЕртв, эти гОспода, уибку, не запОет.
Всего пару абзацев, а количество ошибок зашкаливает! Голосу расти и развиваться, а пока... детский сад и лепет! --------- В 2010 г. я сказал, что в ближайшие 10 лет голосов равных Алёне не будет. Прошло три года - я пока прав. |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Сб Июн 22 2013, 19:50 | Сб Июн 22 2013, 19:50 | |
| Все честно сперто Ivona 2 Tatyana SAPI5 for Windows XP/W7
- Спойлер:
1. Rename Ivona_Voice_1.6_Tatyana_22kHz.dat to Ivona_Voice_1.6_Tatyana_22kHz.exe 2. Install 3. Patch to remove 30 day trial (optional): Файлик: ivona_sapi5_voice_v1.6.xx.dll Ищется: 7507F7DAF7D883DA00 Меняется на: B8FF00000090909090
|
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Вс Июн 23 2013, 10:21 | Вс Июн 23 2013, 10:21 | |
| интересно полякам понравится, если в польском движке носитель польского будет из китая учившего польский месяца три.
так трудно что ли настоящего носителя языка найти? а не тех, кто уехал лет 30-40 назад и уже имеет акцент.... |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| |
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| |
| |
jovany Наблюдатель
Сообщений : 2
Репутация : 0
| jovany | :: Пн Июн 24 2013, 02:39 | Пн Июн 24 2013, 02:39 | |
| - apokrif пишет:
- 1. Rename Ivona_Voice_1.6_Tatyana_22kHz.dat to Ivona_Voice_1.6_Tatyana_22kHz.exe
2. Install 3. Patch to remove 30 day trial (optional): Файлик: ivona_sapi5_voice_v1.6.xx.dll Ищется: 7507F7DAF7D883DA00 Меняется на: B8FF00000090909090 А каким образом искать? |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Пн Июн 24 2013, 08:49 | Пн Июн 24 2013, 08:49 | |
| - jovany пишет:
- А каким образом искать?
Что под рукой есть: WinHex, hiew, etc. На 4PDA есть ivona_sapi5_voice_v1.6.60_patched.rar |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пн Июн 24 2013, 12:08 | Пн Июн 24 2013, 12:08 | |
| по-моему просто достаточно установить сам движок (тот который нужно переименовывать из *.dat в *.exe) и применить к нему лекарство из шапки отсюда, или нет? а сам файл находится тут \IVONA\IVONA 2 Voice\x86\ только окно настроек голоса нужно будет вызывать через панель синтеза речи
- Спойлер:
|
|
|
| |
jovany Наблюдатель
Сообщений : 2
Репутация : 0
| jovany | :: Пн Июн 24 2013, 16:49 | Пн Июн 24 2013, 16:49 | |
| apokrif Спасибо, всё работает! evilone_ На лекарство из шапки оттуда Каспер зарычал как башенный. Так что лучше ручками) |
|
|
| |
Ajaja V.I.P.
Сообщений : 49
Репутация : 28
| |
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Июн 24 2013, 20:59 | Пн Июн 24 2013, 20:59 | |
| Задавал вопрос по поводу символа ударения в службу поддержки; ответили, что для русского голоса эта функция не поддерживается. Посоветовали делить слова на части при помощи пробела, а также отправлять слова с неправильными ударениями на их электронный адрес. |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Пн Июн 24 2013, 21:13 | Пн Июн 24 2013, 21:13 | |
| - balabolka пишет:
- ответили, что для русского голоса эта функция не поддерживается.
Класс! Интересно, это они её специально отломали, "по старой памяти"? Я бы еще понял, если они ударение не умели автоматом определять, но "не уметь" ставить его принудительно - это не спроста! |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Пн Июн 24 2013, 22:47 | Пн Июн 24 2013, 22:47 | |
| - Цитата :
- Файлик: ivona_sapi5_voice_v1.6.xx.dll
В системе два подходящих под описание файла. Еще один: c:\Program Files (x86)\IVONA\IVONA 2 Voice\x64\ivona_sapi5_voice_v1.6.60_x64.dll В нем что-то менять нужно? Если да, то что? |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| |
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Пн Июн 24 2013, 23:52 | Пн Июн 24 2013, 23:52 | |
| - Lexus пишет:
- c:\Program Files (x86)\IVONA\IVONA 2 Voice\x64\ivona_sapi5_voice_v1.6.60_x64.dll
В нем что-то менять нужно? Если да, то что? Это для x64 SAPI5. Оно вам надо? |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Вт Июн 25 2013, 00:07 | Вт Июн 25 2013, 00:07 | |
| - apokrif пишет:
- Это для x64 SAPI5. Оно вам надо?
Виндовс у меня x64, так что есть вероятность, что пригодится.
|
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Вт Июн 25 2013, 04:28 | Вт Июн 25 2013, 04:28 | |
| - Lexus пишет:
- Виндовс у меня x64, так что есть вероятность, что пригодится.
Угу. Для x64 программ, например Office x64. "Сани" не катят, уже обсудили, больше не стоит. |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вт Июн 25 2013, 20:16 | Вт Июн 25 2013, 20:16 | |
| Задал в службу поддержки IVONA вопрос о режимах "Strict" и "Professional reader", о которых говорится в справке голоса:
- Цитата :
- The IVONA Voice can work in two reading modes: "Strict" and "Professional reader" mode. IVONA interprets texts in different ways, depending of the reading mode settings.
Working in the "Strict" mode IVONA will read all special characters (e.g. commas, dash, etc), simply by reading their names. The "Strict" mode is a very usefull feature during text correction because it allows you to easily capture the irregularities of punctuation.
While working in the "Professional reader" mode IVONA will try to read texts the same way a human reader would do, this way punctuation marks will be interpreted and will change the sentence intonation. The "professional reader" mode can be very helpful for synthesizing large texts unfamiliar to the user, like books with many dialogues. Сегодня получил ответ, что это ошибка в тексте справки. Эти настройки были в окне конфигурации голоса некоторое время назад, но теперь они убраны из программного продукта.
---
Также я пожаловался на то, что апостроф не только не работает как способ коррекции ударения в слове, но также и произносится голосом вслух: "д апостроф Артаньян", "Жанна д апостроф Арк". Вот ответ службы поддержки:
- Цитата :
- As regards the apostrophe it will be certainly corrected, but I cannot say when. The Russian voice has been issued a few weeks ago. Our customers’ feedback is very welcome. If you notice any other error, please let me know.
You can get rid of any character with the following regex:
(?<=^|[[:punct:][:space:][:alnum:]])any_character(?=[[:punct:][:space:][:alnum:]]|$)
In the field “To” in the Advanced tab of lexicon just enter a space character. "Ситуация с апострофом будет исправлена, но не можем сказать, когда именно. Русский голос был выпущен лишь несколько недель назад. Мы приветствуем отклики от наших пользователей. Если обнаружите какую-либо ошибку, пожалуйста, дайте нам знать." |
|
|
| |
Ajaja V.I.P.
Сообщений : 49
Репутация : 28
| Ajaja | :: Вт Июн 25 2013, 20:43 | Вт Июн 25 2013, 20:43 | |
| Странно. Проговаривание апострофа можно же в лексиконе отключить, они там целый раздел Ignored expressions сделали в стиле "просто поставь галочку". Кстати, интересно, как туда свое добавлять? |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вт Июн 25 2013, 22:56 | Вт Июн 25 2013, 22:56 | |
| Ajaja Да, меня тоже удивил предложенный вариант решения проблемы. Посоветовать добавить регулярное выражение в лексикон вместо того, чтобы предложить поставить одну "галочку" - это как-то уж очень сурово. (Но зато был предложен универсальный способ.)
- Цитата :
- Кстати, интересно, как туда свое добавлять?
Никак, всё хранится внутри sapi_dialogs2_v1_6_60.dll. |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Ср Июн 26 2013, 00:01 | Ср Июн 26 2013, 00:01 | |
| - balabolka пишет:
- Our customers’ feedback is very welcome. If you notice any other error, please let me know.
Если б они для Андроида TTS выложили, customers’ feedback живее пошел бы
А вообще, странно, что russian-ivona.lex это именно текстовый файл для всего, включая лексикон/словарь. На "мобильных платформах" так способом "далеко не уедешь", IMHO. |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Вс Июн 30 2013, 00:46 | Вс Июн 30 2013, 00:46 | |
| IVONA накрылась... Amazon-ом |
|
|
| |
MoppoH197 Наблюдатель
Сообщений : 1
Репутация : 0
| MoppoH197 | :: Вс Июн 30 2013, 22:04 | Вс Июн 30 2013, 22:04 | |
| сыроват конечно голос, нет редактора словаря, интонации в предложение ставит как то странно, окончания слов проглатывает, будем надеяться что авторы его доделают |
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Вт Авг 06 2013, 20:24 | Вт Авг 06 2013, 20:24 | |
| релиз был неделю назад, они новый билд выпустили или тупо убрали слово beta? |
|
|
| |
Significance Интересующийся
Сообщений : 7
Репутация : 1
| Significance | :: Ср Авг 07 2013, 20:33 | Ср Авг 07 2013, 20:33 | |
| Dmitry второе (тупо убрали слово beta и повесили на главную страницу). Никаких обновлений не было, все голоса с билдом 1.6.60 включая Таню! Единственное только что IVONA Reader 1.1.3 версии на оф сайте (в триалке), на торрентах и смежных сайтах 1.1.2 - но разности в функционале нет. |
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Ср Авг 07 2013, 21:52 | Ср Авг 07 2013, 21:52 | |
| - evmir_troll-hunter пишет:
- Демо-семпл посмешил; МЕртвой мЕртв, эти гОспода, уибку, не запОет.
подключаем словарь для для Ё-фикации текста в балаболке http://dl.dropbox.com/u/9079740/yo-dic.7z и проблема с Ё решается...
лично мне в целом голос понравился , правда ошибки ошибки и снова ошибки... сидеть и писать словарь... |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Ср Авг 07 2013, 23:58 | Ср Авг 07 2013, 23:58 | |
| - Dmitry пишет:
- подключаем словарь для для Ё-фикации текста в балаболке http://dl.dropbox.com/u/9079740/yo-dic.7z и проблема с Ё решается...
Не понял... А причём тут IVONA Tatyana (Татьяна)? Чем ваш словарь отличается от https://mytts.forum2x2.ru/t397-topic Или вы просто с 4pda "не глядя" репостите http://4pda.ru/forum/index.php?s=&showtopic=200728&view=findpost&p=24087173
|
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Чт Авг 08 2013, 00:07 | Чт Авг 08 2013, 00:07 | |
| - apokrif пишет:
- Не понял... А причём тут IVONA Tatyana (Татьяна)?
у нее проблемы с буквой Ё как выше показано на примере - Цитата :
- МЕртвой мЕртв, эти гОспода, уибку, не запОет
данный словарь через балаболку ее почти полностью исправляет.
- apokrif пишет:
- Чем ваш словарь отличается от https://mytts.forum2x2.ru/t397-topic
ничем, ссылка взята именно оттуда. я себе словарь не приписывал. если не заметили название оттуда же "для Ё-фикации текста"
- apokrif пишет:
- Или вы просто с 4pda "не глядя" репостите Smile
а если бы вы посмотрели на время создания моего поста, и того. вы бы заметили разницу во времени ...
|
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Чт Авг 08 2013, 12:42 | Чт Авг 08 2013, 12:42 | |
| - Dmitry пишет:
- у нее проблемы с буквой Ё как выше показано на примере
Цитата: МЕртвой мЕртв, эти гОспода, уибку, не запОет проблемы "ё" может и поправимы, а "уибку"? Ошибки есть во всех голосах, вопрос в их насыщенности на единицу текста (предложение, абзац). В демо-семле лишь 2-3 абзаца, а нелепостей полно́! Чем делать лексиконы/словари, лучше сразу закопаться. |
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Чт Авг 08 2013, 14:37 | Чт Авг 08 2013, 14:37 | |
| - evmir_troll-hunter пишет:
а я делаю словарик через балаболку, вчера начал. 21 слово с неправильным ударением за 2 часа, книжка из жанра фэнтези.
конечно выход саппорт предложил странный(делить слово пробелом) но, получается более менее.
что нравится, нету проблем с окончаниями как у милены "юкание" и еще какая та буква. читает без нервных визгов
по файлу russian-ivona.lex , мне кажется странным политика компании, раз такой геморройный способ записи, могли бы собирать ошибки на почту свою, и править сами, выкладывая обновление данного файла на фтп свой, как это делают антивирусные программы. |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Чт Авг 08 2013, 17:52 | Чт Авг 08 2013, 17:52 | |
| - Dmitry пишет:
- по файлу russian-ivona.lex , мне кажется странным политика компании, раз такой геморройный способ записи, могли бы собирать ошибки на почту свою, и править сами, выкладывая обновление данного файла на фтп свой, как это делают антивирусные программы.
Им надо просто предложить так делать. ivona саппорт довольно быстро отвечает. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
profrager Наблюдатель
Сообщений : 1
Репутация : 0
| profrager | :: Сб Авг 10 2013, 14:28 | Сб Авг 10 2013, 14:28 | |
| - evilone_ пишет:
- для Ольги даже есть уже готовый лексикон с транскрипциями, формат записи для Татьяны есть - его (для Ольги) можно же переделать под Татьяну?
После описания правил перевода фонетики с одного движка в другой несложно будет написать конвертер, но вот создание этих правил и будут основной проблемой. Т.е. нужно, чтобы кто-то попытался сопоставить звуки, создаваемые определенными знаками на одном и другом движках. Хотя мне кажется для того, кто создавал правила фонетики для "Ольги" это будет гораздо легче, чем стороннему заинтересованному человеку, вроде меня. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Авг 11 2013, 01:11 | Вс Авг 11 2013, 01:11 | |
| - profrager пишет:
- Т.е. нужно, чтобы кто-то попытался сопоставить звуки, создаваемые определенными знаками на одном и другом движках.
ну и там и там, по-моему, x-sampa, нет? только для Таньки в транскрипции нужно менять определенные знаки - Код:
-
< это < > это > & это & ' это ' " это " <!-- комментарий --> для Ольки: - Цитата :
- "авторитете" = "\SAMPA=(Vft@r'it'@"et'@#)"
для Таньки: - Цитата :
- (?<=^|[[:punct:][:space:]])авторитете(?=[[:punct:][:space:]]|$) "<speak><phoneme alphabet='x-sampa' ph='Vft@r'it'@"et'@'/></speak>"
и в начале должно быть - Код:
-
#& encoding=windows-1251 вместо - Код:
-
#& encoding=utf-8 |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Вс Авг 11 2013, 05:09 | Вс Авг 11 2013, 05:09 | |
| - evilone_ пишет:
- просто нужен аналог LoqLexer для Татьяны
или наверно можно даже делать транскрипцию LoqLexer-ом а потом переделывать быстренько это безобразие под Татьяну, нет? для Ольги даже есть уже готовый лексикон с транскрипциями, формат записи для Татьяны есть - его (для Ольги) можно же переделать под Татьяну? В словаре example.lex ~4050 слов. Для Ольги это "приблизительно" простой поиск и замена слов в строке. Для Татьяны в словаре хранятся "Perl Compatible Regular Expressions (PCRE)" Выполнять по 4000 PCRE для каждого фрагмента текста это порядочная нагрузка для CPU. Т.е. перегнать-то словарь можно, а вот использовать...
По идее, нужно сделать обработку словаря (так же, как делали для Милены): Запросить x-sampa для слова, если она совпадёт с той, что в словаре - слово включать в словарь НЕ нужно.
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
upv Наблюдатель
Сообщений : 1
Репутация : 0
| upv | :: Вс Авг 11 2013, 16:37 | Вс Авг 11 2013, 16:37 | |
| Многие слова из "Словарь транскрипций (sampa)" Tatyana произносит правильно и без оного Судя по всему лексикон читается не до конца(добавил "пора" и ноль реакции) |
|
|
| |
Dmitry Постоялец
Сообщений : 85
Репутация : 39
| Dmitry | :: Вс Авг 11 2013, 17:05 | Вс Авг 11 2013, 17:05 | |
| на самом деле после более детального знакомства с татьяной, можно сказать, что проблем с ошибками у нее не много(если исключить ё которое лечится словарем уже имеющимся)
из-за этого тупо перегонять чужие словари не вижу смысла, нужна программка как milan для милены, дабы обычный пользователь мог вбить слово, а в словарь записалось уже в виде транскрипции
иначе забьем мусором лексикон. из-за чего могут быть проблемы как с загрузкой цп, так и не правильное произношение. |
|
|
| |
apokrif V.I.P.
Сообщений : 304
Репутация : 85
| apokrif | :: Вс Авг 11 2013, 19:40 | Вс Авг 11 2013, 19:40 | |
| - evilone_ пишет:
- p.s. а как для милены ставится ударение для ссылки в лексикон если слово омограф?
Честно - никак, ударение ставится только транскрипций. В 99% работает вот так: "Он был ДО-ма. Вдалеке виднелись до-МА."
- Dmitry пишет:
- из-за этого тупо перегонять чужие словари не вижу смысла, нужна программка как milan для милены, дабы обычный пользователь мог вбить слово, а в словарь записалось уже в виде транскрипции
Это подход "вручную", а для автоматизации надо: - apokrif пишет:
- Запросить x-sampa для слова, если она совпадёт с той, что в словаре - слово включать в словарь НЕ нужно.
Есть такая функция в SAPI5 или в самой Тане?
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Авг 11 2013, 22:06 | Вс Авг 11 2013, 22:06 | |
| мда.. и как оказалось транскрипции не всегда совпадают с олькиными вот для примера: - Код:
-
(?<=^|[[:punct:][:space:]])словаря(?=[[:punct:][:space:]]|$) "<speak><phoneme alphabet='x-sampa' ph='s5@vVr'y"a'/></speak>" т.е. надо чтобы было - Код:
-
s5@vVr'"a вместо - Код:
-
s5@vVr'y"a и такого много вручную такое искать долго будет...
apokrif, т.е. в слове выделить ударный слог? например ЗА-мок зам-ОК или за-МО-к? |
|
|
| |
|
IVONA Tatyana (Татьяна) |
---|