TTS книги  Проверялка  ФорумФорум  RSS  ПоискПоиск  РегистрацияРегистрация  ВходВход  



Расширенный словарь для ручного поиска омографов

Предыдущая тема Следующая тема Перейти вниз
На страницу : Предыдущий  1, 2

Как вы боретесь с омонимией в русскоязычном тексте?
Пользуюсь только готовыми словарями замен.
38%
 38% [ 6 ]
Ищу вручную по словарю-индексу.
6%
 6% [ 1 ]
Использую программно – синтаксический анализатор.
19%
 19% [ 3 ]
Частично комбинируя все вышеперечисленное или как-то по-своему.
19%
 19% [ 3 ]
Что такое омографы?
18%
 18% [ 3 ]
Всего проголосовало : 16
 

АвторСообщениеРасширенный словарь для ручного поиска омографов
al2055
Постоялец


Сообщений : 96

 al2055 :: Ср Янв 26 2011, 00:51
Ср Янв 26 2011, 00:51

Андрей28 пишет:
Но обязательным осталось то, что они обозначали.
Ок. Спасибо. Это я пропустил.

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Ср Янв 26 2011, 01:27
Ср Янв 26 2011, 01:27

Андрей28 пишет:
все должно=всЁ должно
все должно=все должнО
Выложил исправленный вариант hmg2dic на сайт.

Вернуться к началу Перейти вниз
Андрей28
Участник


Сообщений : 74
Репутация : 8

 Андрей28 :: Ср Янв 26 2011, 14:31
Ср Янв 26 2011, 14:31

balabolka,

Спасибо. Огромное.

Вернуться к началу Перейти вниз
Андрей28
Участник


Сообщений : 74
Репутация : 8

 Андрей28 :: Ср Янв 26 2011, 17:57
Ср Янв 26 2011, 17:57

al2055 пишет:
Андрей28 пишет:
Но обязательным осталось то, что они обозначали.

Ок. Спасибо. Это я пропустил.

пришел к выводу, что (*, ) проставлять - обязательно в словаре омографов.

Правило:
, если не найдут его письма,=, если не найдут его письмА,
никак не хочет срабатывать. Хотя многие другие (подобные) - проблем не вызывали.
а правила:
*, если не найдут его письма,=, если не найдут его письмА,
*, если не найдут его письма, *=, если не найдут его письмА,

Срабатывают одинаково правильно.
Но что-то мне подсказывает, что звездочку в конце - лучше поставить. Хотя рука не поворачивается поставить ее в конце после точки (например). Да и звездочки в конце - убираются конвертором.

Однако:
Есть отличия в понимании звездочки.
В словаре замен это - любой символ.
В словаре омографов - только буква или цифра.
Поэтому кавычки или скобки - по разному поймутся.

balabolka,

Вы, пока не спешите исправлять конвертор. он тут - совсем не при чем.

Вернуться к началу Перейти вниз
al2055
Постоялец


Сообщений : 96
Репутация : 23

 al2055 :: Ср Янв 26 2011, 18:54
Ср Янв 26 2011, 18:54

Андрей28 пишет:
пришел к выводу, что (*, ) проставлять - обязательно в словаре омографов.
Но что-то мне подсказывает, что звездочку в конце - лучше поставить.
По-моему звездочку лучше ставить перед любым знаком препинания, кроме разве что дефиса, да и там не помешает. Так было и раньше. Насчет нее в конце, не знаю. Ни разу не сталкивался с такой необходимостью, кажись и без оной в конце все отрабатывает.
Цитата :
Есть отличия в понимании звездочки. В словаре замен это - любой символ. В словаре омографов - только буква или цифра.
Это стало в последних версиях, после изменения формата hmg. Думаю, это небольшая плата за то, что "*" стало возможным использовать и в середине выражения вместо любого слова или его части.Smile

Вернуться к началу Перейти вниз
Андрей28
Участник


Сообщений : 74
Репутация : 8

 Андрей28 :: Ср Янв 26 2011, 19:26
Ср Янв 26 2011, 19:26

al2055 пишет:
По-моему звездочку лучше ставить перед любым знаком препинания, кроме разве что дефиса,
так и есть.

al2055 пишет:
да и там не помешает.
При диалогах, там нет ничего.

Вернуться к началу Перейти вниз
Андрей28
Участник


Сообщений : 74
Репутация : 8

 Андрей28 :: Чт Янв 27 2011, 02:32
Чт Янв 27 2011, 02:32

balabolka,

я бы - еще одну поправочку попросил.
Бывают словосочетания, где слово применено несколько раз.
села, как села
меняется - только первое из них.

И еще- результат конвертирования:
$Все болтали=$всЕ болтали
$Все суетились=$всЕ суетились

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Чт Янв 27 2011, 05:19
Чт Янв 27 2011, 05:19

Андрей28 пишет:
Бывают словосочетания, где слово применено несколько раз.
Категорически не рекомендуется добавлять в словари омографов выражения, содержащие несколько одних и тех же слов-омографов. Сейчас программа обрабатывает лишь самое первое вхождение слова; после того, как омограф внутри фразы найден, остальные слова уже не проверяются. В этом есть смысл - программа не может знать, какой именно из двух или более омографов подлежит замене (оба? первый? второй?); именно поэтому составители словарей не должны использовать выражения с несколькими одинаковыми омографами.

Андрей28 пишет:
$Все болтали=$всЕ болтали
Исправил эту ошибку и обновил утилиту на сайте; удивительно, как я проглядел такое. Спасибо.

Вернуться к началу Перейти вниз
Ellie
Новичок


Сообщений : 20
Репутация : 4

 Ellie :: Пн Мар 28 2011, 14:58
Пн Мар 28 2011, 14:58

Словарь выдаёт 2 одинаковых варианта.
свечИ
свечИ
Слово свЕчи отсутствует.

Вернуться к началу Перейти вниз
abs9
Новичок


Сообщений : 17
Репутация : 0

 abs9 :: Вс Янв 06 2013, 02:49
Вс Янв 06 2013, 02:49

большую часть
заменяет на
бОльшую часть часть
т.е. дублирует "часть" и аналогично в случае других замен - как устранить дублирование?

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Вс Янв 06 2013, 03:45
Вс Янв 06 2013, 03:45

abs9 пишет:
большую часть
заменяет на
бОльшую часть часть
Правило в исходном файле *.HMG должно выглядеть так:
Код:
большую=бОльшую,большУю
||большую часть=бОльшую

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Янв 06 2013, 04:40
Вс Янв 06 2013, 04:40

а раньше вроде бы работало Suspect
balabolka, изменился формат словарных замен, да?

Вернуться к началу Перейти вниз
balabolka
V.I.P.
avatar


Сообщений : 1213
Репутация : 986

 balabolka :: Вс Янв 06 2013, 04:47
Вс Янв 06 2013, 04:47

evilone_
Нет, ничего не менял.

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Янв 06 2013, 05:01
Вс Янв 06 2013, 05:01

угу, у меня работает нормально...
Цитата :
Большую часть этих средств Канада планирует направить на программу содействия России в уничтожении химоружия и утилизации АПЛ.
Цитата :
бОльшую часть этих средств Канада планирует направить на программу содействия России в уничтожении химоружия и утилизации АПЛ.
только hybrid.hmg

abs9, напишите пример текста и какой словарь? делали утилитой или тот который по ссылке?

Вернуться к началу Перейти вниз
abs9
Новичок


Сообщений : 17
Репутация : 0

 abs9 :: Вс Янв 06 2013, 11:30
Вс Янв 06 2013, 11:30

Цитата :
abs9, напишите пример текста и какой словарь? делали утилитой или тот который по ссылке?
пример любой...
а такой результат получил в hybrid.dic после конвертирования hmg2dic.exe:
в его боку=в его в его бокУ
в боку=в в бокУ
в боку боли=в в бокУ бОли боли
болей=болЕй
органа боли=органа оргАна боли
заплачу от боли=заплачу от заплАчу от боли
в боку боли=в боку в бокУ бОли
еще большая=еще ещё бОльшая

Вернуться к началу Перейти вниз
evilone_
Участник «online словари»
avatar


Сообщений : 860
Репутация : 317

 evilone_ :: Вс Янв 06 2013, 21:25
Вс Янв 06 2013, 21:25

мне кажется что вы не знаете что хотите сделать Smile hmg2dic утилита для выделения правил из словарей *.hmg добавленных при ручном поиске омографов в формате для словаря замен *.dic
hybrid.hmg - словарь, объединяющий в себе "словарь замен" и обычный "словарь ручного поиска омографов" для упрощения ручного поиска омографов в тексте. зачем из него выделять правила в *.dic?
ссылки на простые словари есть в соответствующей теме

Вернуться к началу Перейти вниз
abs9
Новичок


Сообщений : 17
Репутация : 0

 abs9 :: Вс Янв 06 2013, 22:09
Вс Янв 06 2013, 22:09

Код:
зачем из него выделять правила в *.dic?
задача - замены делать не вручную, а автоматически.
не помню, что нажимал - но подобные замены - результат автоматической (не ручной) коррекции текста перед чтением - с использованием файла hybrid.hmd
из-за этих дублей решил сконвертировать в dic и посмотреть результат - результат с дублям.
задача не решена.

Вернуться к началу Перейти вниз
Спонсируемый контент




 Спонсируемый контент ::


Вернуться к началу Перейти вниз

Расширенный словарь для ручного поиска омографов

Предыдущая тема Следующая тема Вернуться к началу
Расширенный словарь для ручного поиска омографов
Страница 2 из 2Страница 2 из 2На страницу : Предыдущий  1, 2
Этот сайт не предоставляет электронные версии программного обеспечения и полнотекстовых электронных изданий, а занимается лишь
подборкой и каталогизацией ссылок, присылаемых и публикуемых на форуме нашими читателями.

Создать форум | ©phpBB | Бесплатный форум поддержки | Сообщить о нарушении