| Расширенный словарь для ручного поиска омографов | |
|
|
Как вы боретесь с омонимией в русскоязычном тексте? | Пользуюсь только готовыми словарями замен. | | 38% | [ 6 ] | Ищу вручную по словарю-индексу. | | 6% | [ 1 ] | Использую программно – синтаксический анализатор. | | 19% | [ 3 ] | Частично комбинируя все вышеперечисленное или как-то по-своему. | | 19% | [ 3 ] | Что такое омографы? | | 18% | [ 3 ] |
| Всего проголосовало : 16 | |
|
Автор | Сообщение | Расширенный словарь для ручного поиска омографов |
---|
al2055 Постоялец
Сообщений : 95
| al2055 | :: Ср Янв 26 2011, 00:51 | Ср Янв 26 2011, 00:51 | |
| - Андрей28 пишет:
- Но обязательным осталось то, что они обозначали.
Ок. Спасибо. Это я пропустил. |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Ср Янв 26 2011, 01:27 | Ср Янв 26 2011, 01:27 | |
| - Андрей28 пишет:
- все должно=всЁ должно
все должно=все должнО Выложил исправленный вариант hmg2dic на сайт. |
|
|
| |
Андрей28 Участник
Сообщений : 74
Репутация : 8
| Андрей28 | :: Ср Янв 26 2011, 14:31 | Ср Янв 26 2011, 14:31 | |
| balabolka,
Спасибо. Огромное. |
|
|
| |
Андрей28 Участник
Сообщений : 74
Репутация : 8
| Андрей28 | :: Ср Янв 26 2011, 17:57 | Ср Янв 26 2011, 17:57 | |
| - al2055 пишет:
- Андрей28 пишет:
Но обязательным осталось то, что они обозначали.
Ок. Спасибо. Это я пропустил. пришел к выводу, что (*, ) проставлять - обязательно в словаре омографов.
Правило: , если не найдут его письма,=, если не найдут его письмА, никак не хочет срабатывать. Хотя многие другие (подобные) - проблем не вызывали. а правила: *, если не найдут его письма,=, если не найдут его письмА, *, если не найдут его письма, *=, если не найдут его письмА, Срабатывают одинаково правильно. Но что-то мне подсказывает, что звездочку в конце - лучше поставить. Хотя рука не поворачивается поставить ее в конце после точки (например). Да и звездочки в конце - убираются конвертором.
Однако: Есть отличия в понимании звездочки. В словаре замен это - любой символ. В словаре омографов - только буква или цифра. Поэтому кавычки или скобки - по разному поймутся.
balabolka,
Вы, пока не спешите исправлять конвертор. он тут - совсем не при чем. |
|
|
| |
al2055 Постоялец
Сообщений : 95
Репутация : 23
| al2055 | :: Ср Янв 26 2011, 18:54 | Ср Янв 26 2011, 18:54 | |
| - Андрей28 пишет:
- пришел к выводу, что (*, ) проставлять - обязательно в словаре омографов.
Но что-то мне подсказывает, что звездочку в конце - лучше поставить. По-моему звездочку лучше ставить перед любым знаком препинания, кроме разве что дефиса, да и там не помешает. Так было и раньше. Насчет нее в конце, не знаю. Ни разу не сталкивался с такой необходимостью, кажись и без оной в конце все отрабатывает. - Цитата :
- Есть отличия в понимании звездочки. В словаре замен это - любой символ. В словаре омографов - только буква или цифра.
Это стало в последних версиях, после изменения формата hmg. Думаю, это небольшая плата за то, что "*" стало возможным использовать и в середине выражения вместо любого слова или его части. |
|
|
| |
Андрей28 Участник
Сообщений : 74
Репутация : 8
| Андрей28 | :: Ср Янв 26 2011, 19:26 | Ср Янв 26 2011, 19:26 | |
| - al2055 пишет:
- По-моему звездочку лучше ставить перед любым знаком препинания, кроме разве что дефиса,
так и есть.
- al2055 пишет:
- да и там не помешает.
При диалогах, там нет ничего. |
|
|
| |
Андрей28 Участник
Сообщений : 74
Репутация : 8
| Андрей28 | :: Чт Янв 27 2011, 02:32 | Чт Янв 27 2011, 02:32 | |
| balabolka,
я бы - еще одну поправочку попросил. Бывают словосочетания, где слово применено несколько раз. села, как села меняется - только первое из них.
И еще- результат конвертирования: $Все болтали=$всЕ болтали $Все суетились=$всЕ суетились |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Чт Янв 27 2011, 05:19 | Чт Янв 27 2011, 05:19 | |
| - Андрей28 пишет:
- Бывают словосочетания, где слово применено несколько раз.
Категорически не рекомендуется добавлять в словари омографов выражения, содержащие несколько одних и тех же слов-омографов. Сейчас программа обрабатывает лишь самое первое вхождение слова; после того, как омограф внутри фразы найден, остальные слова уже не проверяются. В этом есть смысл - программа не может знать, какой именно из двух или более омографов подлежит замене (оба? первый? второй?); именно поэтому составители словарей не должны использовать выражения с несколькими одинаковыми омографами.
- Андрей28 пишет:
- $Все болтали=$всЕ болтали
Исправил эту ошибку и обновил утилиту на сайте; удивительно, как я проглядел такое. Спасибо. |
|
|
| |
Ellie Новичок
Сообщений : 20
Репутация : 4
| Ellie | :: Пн Мар 28 2011, 14:58 | Пн Мар 28 2011, 14:58 | |
| Словарь выдаёт 2 одинаковых варианта. свечИ свечИ Слово свЕчи отсутствует. |
|
|
| |
abs9 Новичок
Сообщений : 17
Репутация : 0
| abs9 | :: Вс Янв 06 2013, 02:49 | Вс Янв 06 2013, 02:49 | |
| большую часть заменяет на бОльшую часть часть т.е. дублирует "часть" и аналогично в случае других замен - как устранить дублирование? |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Янв 06 2013, 03:45 | Вс Янв 06 2013, 03:45 | |
| - abs9 пишет:
- большую часть
заменяет на бОльшую часть часть Правило в исходном файле *.HMG должно выглядеть так: - Код:
-
большую=бОльшую,большУю ||большую часть=бОльшую |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Янв 06 2013, 04:40 | Вс Янв 06 2013, 04:40 | |
| а раньше вроде бы работало balabolka, изменился формат словарных замен, да? |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Янв 06 2013, 04:47 | Вс Янв 06 2013, 04:47 | |
| evilone_ Нет, ничего не менял. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Янв 06 2013, 05:01 | Вс Янв 06 2013, 05:01 | |
| угу, у меня работает нормально... - Цитата :
- Большую часть этих средств Канада планирует направить на программу содействия России в уничтожении химоружия и утилизации АПЛ.
- Цитата :
- бОльшую часть этих средств Канада планирует направить на программу содействия России в уничтожении химоружия и утилизации АПЛ.
только hybrid.hmg
abs9, напишите пример текста и какой словарь? делали утилитой или тот который по ссылке? |
|
|
| |
abs9 Новичок
Сообщений : 17
Репутация : 0
| abs9 | :: Вс Янв 06 2013, 11:30 | Вс Янв 06 2013, 11:30 | |
| - Цитата :
- abs9, напишите пример текста и какой словарь? делали утилитой или тот который по ссылке?
пример любой... а такой результат получил в hybrid.dic после конвертирования hmg2dic.exe: в его боку=в его в его бокУ в боку=в в бокУ в боку боли=в в бокУ бОли боли болей=болЕй органа боли=органа оргАна боли заплачу от боли=заплачу от заплАчу от боли в боку боли=в боку в бокУ бОли еще большая=еще ещё бОльшая |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Вс Янв 06 2013, 21:25 | Вс Янв 06 2013, 21:25 | |
| мне кажется что вы не знаете что хотите сделать hmg2dic утилита для выделения правил из словарей *.hmg добавленных при ручном поиске омографов в формате для словаря замен *.dic hybrid.hmg - словарь, объединяющий в себе "словарь замен" и обычный "словарь ручного поиска омографов" для упрощения ручного поиска омографов в тексте. зачем из него выделять правила в *.dic? ссылки на простые словари есть в соответствующей теме |
|
|
| |
abs9 Новичок
Сообщений : 17
Репутация : 0
| abs9 | :: Вс Янв 06 2013, 22:09 | Вс Янв 06 2013, 22:09 | |
| - Код:
-
зачем из него выделять правила в *.dic? задача - замены делать не вручную, а автоматически. не помню, что нажимал - но подобные замены - результат автоматической (не ручной) коррекции текста перед чтением - с использованием файла hybrid.hmd из-за этих дублей решил сконвертировать в dic и посмотреть результат - результат с дублям. задача не решена. |
|
|
| |
| Расширенный словарь для ручного поиска омографов | |
|
Расширенный словарь для ручного поиска омографов |
---|