| Бета-версия 2.0 (с поддержкой формата Юникод) | |
|
|
Автор | Сообщение | Бета-версия 2.0 (с поддержкой формата Юникод) |
---|
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Сб Сен 05 2009, 03:10 | Сб Сен 05 2009, 03:10 | |
| На сайте программы "Балаболка" доступна для скачивания бета-версия с поддержкой Юникода: http://www.cross-plus-a.com/balabolka_beta.zip
Системные требования: Microsoft Windows 2000/XP/2003/Vista
*** Важно ***
Версия 2.0 БЕТА распространяется только в ознакомительных целях. Это не готовый программный продукт, поэтому использовать программу следует с осторожностью.
Эта версия "Балаболки" поддерживает Юникод (кодировки UTF-8, UTF-16LE и UTF-16BE), поэтому станет возможным читать иностранные тексты на компьютере с русскими региональными установками. Однако, голоса SAPI 4 и некоторые старые версии голосов SAPI 5 не поддерживают Юникод, поэтому для чтения иностранных текстов следует использовать лишь новейшие версии голосов SAPI 5.
*** Словари ***
Все словари для коррекции произношения и списки омографов хранятся в файлах с кодировкой UTF-8. Если возникнет необходимость использовать такой словарь в версии 1.27 программы "Балаболка", его следует сохранить в кодировке ANSI (например, это можно сделать в программе Notepad ("Проводник") операционной системы Windows).
*** Текстовые файлы ***
"Балаболка" запоминает кодировку каждого открываемого в программе текстового файла, а затем использует эту информацию для сохранения измененного текста в нужном формате. Значение кодировки можно изменить при помощи пункта главного меню "Сохранить как".
Возможны ситуации, когда программа некорректно определяет кодировку текста при чтении файла. В качестве временного решения этой проблемы можно посоветовать повторно сохранить текстовый файл в той же самой кодировке, в каком-либо текстовом редакторе - например, в программе Notepad ("Проводник"), входящей в состав операционной системы Windows.
*** Проверка орфографии ***
Проверка орфографии, увы, по-прежнему обрабатывает текст в кодировке ANSI. Это означает, что на компьютере с русскими региональными установками можно проверять правописание текстов на русском языке, но не на иностранных языках.
*** Перевод интерфейса на другие языки ***
Файлы переводов интерфейса на другие языки хранятся в формате UTF-8. Чтобы надписи на других языках корректно отображались при любых региональных установках, для всех визуальных компонентов (кнопок, выпадающих списков и т.п.) шрифт был изменен с "MS Sans Serif" на "Microsoft Sans Serif".
Буду признателен за любые замечания и сообщения о найденных ошибках в работе бета-версии. Просьба указывать номер версии программы "Балаболка" и версию операционной системы Windows. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| evilone_ | :: Сб Сен 05 2009, 13:39 | Сб Сен 05 2009, 13:39 | |
| ура, дождались!!! :117: :117: юникод это хорошо :131: попробуем а старые словари получается нужно теперь все перевести в uft для этой версии? или можно пользоваться одними и теми де для ansy и unicode варианта? |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Сб Сен 05 2009, 15:14 | Сб Сен 05 2009, 15:14 | |
| - evilone_ пишет:
- а старые словари получается нужно теперь все перевести в uft для этой версии? или можно пользоваться одними и теми де для ansy и unicode варианта?
Старые словари можно открывать в новой версии без какой-либо конвертации; но по умолчанию в новой версии словари будут сохраняться как UTF-8. Есть кнопка "Сохранить как", можно при сохранении файла поменять его кодировку на ANSI - на тот случай, если понадобится перенести словарь из новой версии в старую.
Вообще, хочу добавить, что поддержка Unicode нужна лишь тем пользователям, которые хотят читать иностранные тексты на компьютере с русскими региональными установками. Тем же, кто слушает только русские тексты, нет никакой необходимости бросаться скачивать бета-версию (она еще долго будет "бета", так как я не намерен в ближайшее время переводить все свои программы на поддержку Юникода). |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
lev55 Участник «online словари»
Сообщений : 384
Репутация : 45
| lev55 | :: Вс Сен 06 2009, 20:30 | Вс Сен 06 2009, 20:30 | |
| evilone_ Сударыня, не пользуйтесь "ini", даже если это Алёна. Как доктор говорю ;-)) |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Сен 06 2009, 21:09 | Вс Сен 06 2009, 21:09 | |
| - evilone_ пишет:
- при работе со старым ini словарем некоторые слова стали читаться с паразитными звуками на конце (ющ ящ) иногда добавляет какие-то цифры в конец слова знак плюс и т.д.
Что ж, вполне такое может быть. Что такое "старый ini словарь", где взять этот файл, для какого он голоса? Можете ли привести пример 2-3 предложений с ошибками в применении правил? Спасибо. |
|
|
| |
evilone_ Участник «online словари»
Сообщений : 859
Репутация : 317
| |
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Сен 06 2009, 23:20 | Вс Сен 06 2009, 23:20 | |
| Увы, ищите источник проблемы в тех лексиконах, что установлены на Вашей машине. Я недавно переустановил операционную систему и все программы; "Алена" стоит у меня "чистая", без каких-либо дополнительных лексиконов, так что приведенный Вами пример текста вместе с подключенным INI-словарем читается абсолютно правильно.
Похоже, что правила из INI-файлов применяются к тексту в Юникоде нормально, а Lexicon Manager голоса "Алена" с Юникодом не дружит.
Буду разбираться еще; спасибо за информацию. |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Пн Сен 07 2009, 14:01 | Пн Сен 07 2009, 14:01 | |
| Прежде,чем скачивать интересует вопрос: Версия с поддержкой Юникода - Portable или обычный инсталятор. Не хотелось бы перезаписывать имеющийся Bild. Для экспериментов Portable более удобна. |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Пн Сен 07 2009, 14:15 | Пн Сен 07 2009, 14:15 | |
| Да, бета - это "portable" вариант; ни в другие папки, ни в системный реестр она ничего не пишет. |
|
|
| |
lev55 Участник «online словари»
Сообщений : 384
Репутация : 45
| lev55 | :: Вт Сен 08 2009, 15:34 | Вт Сен 08 2009, 15:34 | |
| balabolka "ни в другие папки, ни в системный реестр она ничего не пишет. " Это по нашему, по бразильски! Здо' ^'рово! P.S. ( "А Крафаген должен быть сожжон!" Ну будь человеком, сделай опцию с ударением " ' ^' " , а то новую версию каждый раз поновой надо "ломать". Можно это привязать к голосу "переменная" и т.д.) |
|
|
| |
cmhdream Новичок
Сообщений : 20
Репутация : 20
| cmhdream | :: Вт Дек 08 2009, 09:15 | Вт Дек 08 2009, 09:15 | |
| chinese language - Код:
-
http://www.4shared.com/file/167771060/8195af11/Chinese.html
|
|
|
| |
lev55 Участник «online словари»
Сообщений : 384
Репутация : 45
| lev55 | :: Вт Дек 08 2009, 16:11 | Вт Дек 08 2009, 16:11 | |
| balabolka Понял. Спасибо! P.S. каким знаком ударение обозначить- не суть важно, важно - только чтоб правильно было. А по мофологическим признакам ударения ставить - куда гораздей. |
|
|
| |
Lexus Эксперт
Сообщений : 408
Репутация : 32
| Lexus | :: Ср Дек 23 2009, 12:59 | Ср Дек 23 2009, 12:59 | |
| balabolka Интересует вопрос, в какой кодировке получает текст движок в ANSI или UNICODE. Вопрос не праздный - цель заставить Ольгу воспринимать тег \Sampa. В этой связи еще один вопрос автору, может как-нибудь попробовать поэкспериментировать с вариантами UNICODE , чтобы решить эту задачу? В родных утилитках Loquendo тег работает. Это очень поможет обойти баги движка. |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Ср Дек 23 2009, 17:42 | Ср Дек 23 2009, 17:42 | |
| - Lexus пишет:
- Интересует вопрос, в какой кодировке получает текст движок в ANSI или UNICODE.
В версии 2.0 текст передается в кодировке Unicode - ради этого всё и затевалось. Но это только для SAPI5 (голоса SAPI4 не работают с Юникодом).
Нет никаких подтвреждений тому, что в голосах Loquendo поддерживаются специализированные теги при работе через SAPI; есть поддержка только стандартных тегов SAPI. Специальные теги поддерживаются только при доступе к голосу через "родной" API от Loquendo. |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Вс Июн 06 2010, 21:17 | Вс Июн 06 2010, 21:17 | |
| В меню программы добавлен пункт "Перевести": вообще-то, я делал его для одной программы на заказ, но решил ради эксперимента вставить и в "Балаболку". Эта функция будет присутствовать лишь в бета-версии, так как для нормального отображения букв иностранных языков без Юникода не обойтись.
Перевод осуществляется при помощи онлайн-сервиса Google; документацию по работе этого сервиса можно посмотреть здесь: http://code.google.com/intl/ru-RU/apis/ajaxlanguage/documentation/
Программа делит большой текст на части и посылает данные на сервер Google маленькими порциями, так что, если пользователь решит одним махом перевести текст размером один мегабайт, это приведет к тысяче запросов в адрес сервера Google. Я бы не рекомендовал так делать, так как не могу предвидеть реакцию на подобный "поток" запросов со стороны Google или со стороны Вашего местного провайдера. Но, теоретически, можно таким образом переводить с одного языка на другой и очень большие по размеру тексты. |
|
|
| |
Nick0lay Наблюдатель
Сообщений : 1
Репутация : 0
| Nick0lay | :: Сб Окт 23 2010, 04:25 | Сб Окт 23 2010, 04:25 | |
| Приветствую ! Я пытаюсь использовать Балаболку для чтения книг по покеру, скажите а значок "масти карты" (черва, трефа) это спецсимвол ? смогу ли я в словаре показать что надо читать - "туз трефовый" и тд. ? и как это сделать ?
оно читает как "полоса" и с словаре не могу никак сделать что б читало нормально
помогите пожалуйста ! |
|
|
| |
balabolka V.I.P.
Сообщений : 1228
Репутация : 986
| balabolka | :: Сб Окт 23 2010, 05:13 | Сб Окт 23 2010, 05:13 | |
| Nick0lay Откройте панель словарей и в какой-нибудь из словарей с расширением DIC вставьте правила вида: - Код:
-
♣=трефовый дама ♣=трефовая дама Выберите "галочкой" отредактированный Вами словарь. Когда при чтении вслух программа встретит эти символы масти, "Балаболка" заменит их на текст из словаря.
Должно работать, я проверял; версия 2.0 умеет работать с такими символами из таблицы Юникод. |
|
|
| |
| Бета-версия 2.0 (с поддержкой формата Юникод) | |
|
Бета-версия 2.0 (с поддержкой формата Юникод) |
---|