|
|
Автор | Сообщение | Транскриптор |
---|
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Ср Мар 14 2012, 00:39 | Ср Мар 14 2012, 00:39 | |
| Транскриптор - программа для быстрого создания фонетической транскрипции слова с учетом ударения в нужном месте. Поддерживается классический формат ударения для Аленки - заглавная буква. Программа имеет поддержку пользовательских словарей для создания собственных фонетических правил и коррекции транскрипции. авторы: muk79, evilone, evmir
Транскриптор transcriptor.ini
phonemes phonemes.fix
Описание словарей
phonemes - фонетический словарь, формирующий правила разбиения слов на фонемы
Формат правил словаря: фонема(с ударением или без)=#транскрипция# - Код:
-
цУ=#ts u1# цЫ=#ts 11# цА=#ts A1# шУ=#S u1# phonemes.fix - словарь замен для коррекции транскрипций
Формат правил словаря: транскрипция1=транскрипция2
Важно! Сортировка такая же как и в *.ini - правила применяются последовательно один за другим: - Код:
-
#@ l=#V2 l #@ m=#V2 m #@ n=#V2 n #@ p=#V2 p Для выделения только части слова для замены в правиле можно использовать теги начала и окончания слова <w></w> - Цитата :
- <w>слово</w>
<w>#s l o1 v @</w> - Код:
-
<w>слов=<w>#s l o1 v# <w>сло=<w>#s l o1# ово</w>=#@ g @#</w> во</w>=#g @#</w> - Код:
-
<w>#s l o1 v=<w>#s l o2 v <w>#s l o1=<w>#s l o2 @ g @</w>=@ v @</w> g @</w>=v @</w> Формат фонетических транскрипций
Русская текстово-речевая система от Acapela использует подмножество фонетического алфавита (Speech Assessment Methods Phonetic Alphabet) или SAMPA. Только SAMPA может использоваться в фонетических транскрипциях. Символы не указанные ниже считаются неправильными, и будут проигнорированы при их включении в лексикон. Символы SAMPA пишутся с пробелом после каждой фонемы. Единственная кавычка « ' » после согласных, указывает на смягчение согласных. Числа «1» и «2» после гласных указывают на первостепенный и второстепенный лексический акцент (иногда называемый «word-stress». Лексический акцентЛексический акцент указывает уровень выступа (или акцента) слога в слове. В русском языке, некоторые слова могут различаться позицией этого лексического акцента. Например, слово замок имеет два значения, в зависимости от позиции лексического акцента в слове: - Код:
-
зАмок: /z A1 m @ k / замОк: /z V m o1 k / Практически все слова в русском языке имеют лексический акцент даже если он не всегда различается. Следовательно, важно включать лексические метки акцента при написании фонетических транскрипций. В фонетических транскрипциях, первичный акцент указан символом «1» непосредственно после (без пробела) акцентированной гласной. Второстепенный акцент указывается символом «2». Примеры: - Код:
-
Представитель / p r’ $ t s t V v’ i1t’ $ l’ / Спецпредставитель / s p e2 ts p r’ $ t s t V v’ i1 t’ $ l’ /
Символ «1» в русском языке имеет два значения: символ SAMPA для гласной /1/ (буква «ы»), и первичный лексический акцент. Символ первичного лексического акцента «1» всегда следует за символами гласной без пробела во второй позиции, и различается звуком SAMPA. Например /11/ в /v 11 t / отражает звук «ы» под первичным лексическим акцентом «1». Горловые паузыГорловые паузы представлены фонетическим символом - Код:
-
/?/ (вопросительный знак), - небольшим дополнительным звуком, произведенным в горле. Часто используется, для разделения двух слов, когда второе слово начинается с напряженной гласной. Этот звук включается в транскрипцию для чистоты произношения. Например, высказывание «ну а он» может произноситься бегло без паузы - Код:
-
/n U V o1 n/ или более ясно, с одной или двумя паузами - Код:
-
/n U? V? o1 n / ПаузаПри использовании дополнительно подключенного лексикона для запрета чтения разделительных знаков символы - Код:
-
’—¦«»"'()-/<>[\]^_`{|}~ в тексте генерируют небольшую паузу. В фонетической транскрипции небольшую паузу генерирует только символ - Код:
-
/ _ / (подчеркивание). Не кириллический вводСлова, написанные латинскими символами произносятся в соответствии с правилами American English, но с русскими звуками (как будто говорит по-русски с сильным акцентом). Фонетическая транскрипция - Цитата :
Гласные | Согласные | а е ё и о у ы э ю я А Е Ё И О У Ы Э Ю Я
| @ $ 9 $ @ U I e } { A1 e1 91 i1 o1 u1 11 E1 }1 {1
| б в г д ж з й к л м н п р с т ф х ц ч ш щ ъ ь
| b v g d Z z j k l m n p r s t f x ts tS' S S'
|
Быстрое построение ударений к большому количеству слов с помощью программы "книгодел"
Для быстрой расстановки ударений в большом списке слов удобно и просто использовать программу "книгодел". Для этого необходимо: - подготовить список слов предварительно сформированный в транскрипторе;
- установить программу (достаточно просто загрузить и распаковать - программа не требует установки);
- скопировать в папку с программой файл настроек для расстановки ударения в формате аленки;
- запустить программу, нажать F6 и выбрать список слов;
- результат расстановки будет сохранен в файле с приставкой "_pre" в названии;
- далее можно загрузить полученный результат в транскриптор, и быстро удалить\отфильтровать слова без\с ударениями (меню→форматирование→).
Быстрый поиск омографов
При построении транскрипций слова имеющие более одного грамматического атрибута могут иметь больше одного варианта ударения. Для быстрого поиска таких слов можно включить фильтрацию в настройках фильтра грамматических атрибутов (слова только с двумя и более грамматическими атрибутами).
Все ошибки и\или замечания пишите, пожалуйста, здесь. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Мар 16 2012, 06:01 | Пт Мар 16 2012, 06:01 | |
| добавлена новая функция - "сравнить" сравниваются две транскрипции: полученная с помощью транскриптора и непосредственно самим голосовым движком с учетом подключенных лексиконов (программа построения транскрипций от Ajaja) если они отличаются то выводится результат в виде - Цитата :
- слово #транскриптор #движок
также доступна смена голоса для разных голосовых профилей |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Мар 16 2012, 21:38 | Пт Мар 16 2012, 21:38 | |
| добавлена морфология - автоматическое определение части речи слова в формате лексикона (программа морфологического анализа mystem от Яндекс) - Цитата :
прилагательное наречие местоименное наречие порядковое числительное местоименное прилагательное часть композита (первая часть сложных слов) союз междометие числительное частица предлог существительное местоимение глагол
| ADJECTIVE ADVERB ADVERB ORDINAL ADJECTIVE CONTRACTION CONJUNCTION INTERJECTION CARDINAL QUANTIFIER PREPOSITION NOUN PRONOUN VERB
|
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Мар 17 2012, 23:23 | Сб Мар 17 2012, 23:23 | |
| обновление: - исправлены ошибки; - ускорена работа; - для замен в словарях теперь можно использовать теги начала и окончания слова <w>слово</w> или <w>#s l o1 v @</w>; - Код:
-
<w>слов=<w>#s l o1 v# <w>сло=<w>#s l o1# ово</w>=#@ g @#</w> во</w>=#g @#</w> - Код:
-
<w>#s l o1 v=<w>#s l o2 v <w>#s l o1=<w>#s l o2 @ g @</w>=@ v @</w> g @</w>=v @</w> - быстрый фильтр с\без учета регистра; - открытие небольших, до 1Мб но может быть и больше, надо проверить текстовых файлов с последующим преобразованием всего содержимого в список слов; |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пн Мар 26 2012, 17:08 | Пн Мар 26 2012, 17:08 | |
| обновление: - добавлено форматирование списка слов: - Цитата :
- Сортировать слова по длине (по убыванию)
- Сортировать слова по длине (по возрастанию)
- Сортировать по алфавиту от А до Я
- Сортировать по алфавиту от Я до А
- Все буквы строчные
- Заглавными только гласные
- Заменить Ё на Е
- Удалить слова написанные через дефис
- Оставить только слова написанные с большой буквы
|
|
|
| |
ptoton Бывалый
Сообщений : 108
Репутация : 25
| ptoton | :: Пн Мар 26 2012, 20:56 | Пн Мар 26 2012, 20:56 | |
| почему-то Транскриптор после обновления опять пишет: доступно обновление программы. установить?
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Апр 06 2012, 02:31 | Пт Апр 06 2012, 02:31 | |
| обновление: - добавлено сравнение списков слов (vlist):
- Цитата :
- Найти слова, которые есть в обоих списках
- Найти слова, которые есть лишь в одном из списков
- Найти слова, которые есть в первом списке и отсутствуют во втором списке
- Найти слова, которые есть во втором списке и отсутствуют в первом списке
- Найти слова, которые присутствуют в любом из списков (сумма списков)
- Удалить в первом списке строки в которых есть слова из второго
- Удалить в первом списке строки в которых нет слов из второго
- Объединить следом первый и второй списки
- Объединить вокруг первый и второй списки
|
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Пт Апр 13 2012, 22:06 | Пт Апр 13 2012, 22:06 | |
| обновление: - заменена программа морфологического анализа mystem от Яндекс; для обновления старой версии нужно запустить обновление меню→обновление→проверить обновление, удалить файл mystem.exe и перезапустить программу |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Июн 01 2013, 22:02 | Сб Июн 01 2013, 22:02 | |
| все тоже самое что и для проверялки - перед запуском программы скопировать файл transcriptor.ini из шапки рядом с программой и обновиться |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Ср Июн 26 2013, 18:05 | Ср Июн 26 2013, 18:05 | |
| Порядок расположения правил в phonemes очень важен. Реализовано 2 режима сортировки - Старый и Новый. К сожалению оба не учитывают теги <w>, </w>, и размещают правила с ними не так как нужно.
В будущем, программная сортировка будет удалена, пока же рекомендуется ею не пользоваться! Отсортировано вручную, всё работает как следует, обновите. |
|
|
| |
basist Гость
| basist | :: Чт Ноя 28 2013, 01:29 | Чт Ноя 28 2013, 01:29 | |
| - Цитата :
- обновление:
- добавлено вычитывание слов (vlex) Хорошо бы реализовать функцию "копировать-вставить" в окно списка для быстрой обработки. - Цитата :
- обновление (vlist):
Как пользоваться разделителем? Позволяет ли он создавать два списка из одного, например:- Спойлер:
неубаюканный;1 обеспокоенно;4 один-одинешенек;25 с разделителем ";" ? И ещё, хотелось бы какую-нибудь более подробную справочную информацию по возможностям использования программы, т.е. что даёт та или иная функция меню. Чувствую, что вещь очень хорошая, но не умею пользоваться, а хочу научиться. Спасибо! |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Ноя 30 2013, 16:43 | Сб Ноя 30 2013, 16:43 | |
| - Цитата :
- Как пользоваться разделителем?
разделитель служит только для пункта "объединить следом первый и второй списки" если есть первый список: - Код:
-
1 2 3 и второй: - Код:
-
3 2 1 и разделитель = то результат будет - Код:
-
1=3 2=2 3=1 - Цитата :
- Позволяет ли он создавать два списка из одного
нет, это можно сделать в vregexp (Regex песочница): - Код:
-
первый (\V+)\;(\V+)=$1 второй (\V+)\;(\V+)=$2
- Цитата :
- И ещё, хотелось бы какую-нибудь более подробную справочную информацию по возможностям использования программы
ну там вроде бы все понятно - все операции с двумя списками единственное чего я не помню - это "точное совпадение" на что оно влияет, но оно у меня включено изначально.
|
|
|
| |
Dimsok Участник
Сообщений : 55
Репутация : 1
| Dimsok | :: Чт Май 12 2016, 13:47 | Чт Май 12 2016, 13:47 | |
| У кого-нибудь осталась эта штука? Да, и почему нельзя выкладывать всё одним архивом, а не по нескольку ссылок давать для каждого файла настройки или словаря. |
|
|
| |
evmir_troll-hunter Admin
Сообщений : 616
Репутация : 208
| evmir_troll-hunter | :: Чт Май 12 2016, 15:37 | Чт Май 12 2016, 15:37 | |
| Ссылки исправлены... Программа создана одним, настройки (редактируемые) - другими. Труд совместный, поэтому и ссылки разные. |
|
|
| |
|
Транскриптор |
---|