Искусственный голос и синтез речи - 语音合成
Вы хотите отреагировать на этот пост ? Создайте аккаунт всего в несколько кликов или войдите на форум.


语音合成技术和文本语音转换 - Synthetic voice and Text to Speech technology - Синтетический голос и технологии преобразования текста в речь
 
TTS книги  Проверялка  ФорумФорум  Последние изображенияПоследние изображения  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  

Частотный лексикон (для словаря замен)

Предыдущая тема Следующая тема Перейти вниз
АвторСообщениеЧастотный лексикон (для словаря замен)
evilone_
Участник «online словари»
evilone_


Сообщений : 859
Репутация : 317

Частотный лексикон (для словаря замен) WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 evilone_ :: Пт Июн 04 2010, 16:44
Частотный лексикон (для словаря замен) FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пт Июн 04 2010, 16:44

Частотный лексикон (для словаря замен) LexЧастотный лексикон (для словаря замен)
Составители: mia, evilone, evmir

Частотный лексикон (для словаря замен) для автоматической разметки омографов в тексте с учетом их частоты встречаемости, составленный на основе Корпуса русского литературного языка объемом 1 млн словоупотреблений. Данный лексикон адаптирован к голосовому движку Acapela-Group Alyona (Алёна), и хотя его применение для других движков возможно, однако оно будет неполным.

Лексикон можно использовать совместно со всеми остальными словарями замен и лексиконами для Аленки. Он не мешает основной разметке текста и служит лишь для автоматической расстановки "пропущенных" при разметке омографов.
Установка: подключить в Lexicon Manager'у после обычного лексикона омографов (для словаря замен) (ниже).
Если в других лексиконах есть явно предопределенные омографы тогда самым последним (нижним) по списку.
27.01.14.
Есть уверенность, что довольно много омографов в своём изначальном, текстовом варианте (без капслоков) могут произноситься неправильно. Напр. "души", или "стою" (звучит "стая"), а перед запятой становятся проблемными слова "цели" (звучит целя), "стороны" (ударение на "ро"),
Нужно просто выбрать более частый вариант и всё нормализуется.

Как бы не редактировались/разделялись/пополнялись правила в словаре(рях) замен, никогда НЕ удастся охватить даже несколько процентов всех возможных словосочетаний! И в огромном количестве предложений будут присутствовать неизменённые омографы с непредсказуемым звучанием в зависимости от контекста, знака пунктуации или ещё чего.
Поэтому рекомендуется подключить данный лексикон - он исправлен и основательно дополнен.
Спасибо retigor за идею более активного использования лексикона.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
evilone_


Сообщений : 859
Репутация : 317

Частотный лексикон (для словаря замен) WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 evilone_ :: Сб Июн 05 2010, 15:52
Частотный лексикон (для словаря замен) FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Сб Июн 05 2010, 15:52

обновился:
добавилось с учетом частотности словаря замен

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
evilone_


Сообщений : 859
Репутация : 317

Частотный лексикон (для словаря замен) WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 evilone_ :: Пн Июн 07 2010, 00:24
Частотный лексикон (для словаря замен) FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пн Июн 07 2010, 00:24

Цитата :
Часто́тный слова́рь (или частотный список) — набор слов данного языка (или подъязыка) вместе с информацией о частоте их встречаемости. Словарь может быть отсортирован по частоте, по алфавиту (тогда для каждого слова будет указана его частота), по группам слов (например, первая тысяча наиболее частотных слов, за ней вторая и т. п.), по типичности (слова, частотные для большинства текстов), и т. д. Частотные списки используются для преподавания языка, создания новых словарей, приложений компьютерной лингвистики, исследований в области лингвистической типологии, и т. д.
За основу этого частотного лексикона для словаря замен был взят частотный словарь омографов составленный по заранее размеченному корпусу и правилам основного словаря замен (omograph_rules_mytts_.dic).

В лексикон включена группа наиболее частотных омоформ с учетом особенностей произношения самого голосового движка, а именно:
  • исходная форма слова содержащаяся в лексиконе не имеет разметки ударения (заглавной буквы) а также буквы "Ё";
  • в дальнейшем в лексикон будут внесены все омоформы в своём "частотном" варианте;

Вернуться к началу Перейти вниз
Sylvia
Участник «online словари»
Sylvia


Сообщений : 72
Репутация : 83

Частотный лексикон (для словаря замен) WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 Sylvia :: Пн Июн 07 2010, 18:14
Частотный лексикон (для словаря замен) FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пн Июн 07 2010, 18:14

evilone_, спасибо за проделанную работу, очень нужен такой словарь!

Вернуться к началу Перейти вниз
abs9
Новичок


Сообщений : 17
Репутация : 0

Частотный лексикон (для словаря замен) WAAACH5BAEAAAAALAAAAAABAAEAAAICRAEAOw==
 abs9 :: Пн Янв 07 2013, 23:15
Частотный лексикон (для словаря замен) FT09PX19cfHx+Pj4wAAAAAAAAAAACH+OjxDT1BZPkNvcHlyaWdodCAyMDA0IFRoZSBwaHBCQiBHcm91cCwgQWxsIFJpZ2h0cyBSZXNlcnZlZC4AIfkEAQAADQAsAAAAAAsACQAABCmwNUCpvDNoi4EWVUcQCEIAnaAKDHoBSnIchisBSaEP9mQMgwWvUwk1IgA7Пн Янв 07 2013, 23:15

нашёл, что искал. спасибо!

Вернуться к началу Перейти вниз

Частотный лексикон (для словаря замен)

Предыдущая тема Следующая тема Вернуться к началу
Частотный лексикон (для словаря замен)
Страница 1 из 1Страница 1 из 1
      Форма быстрого ответа        Форма быстрого ответа  
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении
Создать форум бесплатно | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении | Cookies | Последние обсуждения