Большинство текстовых редакторов, а также программ, позволяющих проверять орфографию, имеют словари исключений, в которые пользователь может вносить неизвестные орфографическим модулям слова.
Кроме наиболее известных программ, таких как MS Word и OpenOffice, орфографию способны проверять браузеры (FireFox, Chrome) и даже почтовые программы (Thunderbird).
При разработке программы локализации был также разработан словарь исключений, в который пользователь может включать игнорируемые слова. Он представляет собой текстовый файл, удобный для коллективной разработки с использованием сервера (svn/git/...).
Но возник вопрос, а можно ли использовать словари исключений других программ? Оказывается нет никаких технических проблем в их использовании, поэтому добавил настройки в программу локализацию, позволяющие задействовать сторонние словари исключений.
Файлы словарей исключений:
Firefox: C:\Users\username\AppData\Roaming/Mozilla/Firefox/Profiles\xxxxxx.default/persdict.dat
OpenOffice: C:\Users\username\AppData\Roaming/OpenOffice/4/user/wordbook/standard.dic
Thunderbird: C:\Users\username\AppData\Roaming/Thunderbird/Profiles\xxxxxx.default/persdict.dat
Chrome: C:\Users\username\AppData\Local/Google/Chrome/User Data/Default/Custom Dictionary.txt
Для FireFox и Thunderbird в пути к файлу указан профиль (см. "хххххх"), представляющий из себя набор символов для каждого профиля, поэтому программа локализации будет использовать такие словари только, если присутствует один профиль mozilla для этих программ.
Формат словарей - набор слов в кодировке utf8, но для Chrome добавлена строка с хешем строк словаря, а для openOffice присутствует специальный заголовок. Эта информация игнорируется при чтении словарей.
Соответственно при добавлении слова в любой из словарей это слово будет игнорироваться программой. По умолчанию используются все словари, но, используя параметры программы (см. справку), можно включать только некоторые из них или все сразу.
Не стал подключать словари Word, чтобы не рисковать с возможным нарушением лицензии Ms Office, так как пока с ней не разобрался, можно ли использовать ее словари... т.к. их "движок" орфографии точно без разрешения нельзя. Если учесть, что отчеты генерируются для браузеров, то Word в данном случае не так актуален.
Кроме использования словарей, добавил специальный раздел отчета, в который сводятся все слова из словарей исключений с указанием программы, из которых они получены, что позволяет не только разобраться в какой программе что добавлено, но и скопировать этот набор слов в основной словарь исключений программы локализации.
Пример сводного словаря FireFox/Chrome/Thunderbird/OpenOffice:
Кроме наиболее известных программ, таких как MS Word и OpenOffice, орфографию способны проверять браузеры (FireFox, Chrome) и даже почтовые программы (Thunderbird).
При разработке программы локализации был также разработан словарь исключений, в который пользователь может включать игнорируемые слова. Он представляет собой текстовый файл, удобный для коллективной разработки с использованием сервера (svn/git/...).
Но возник вопрос, а можно ли использовать словари исключений других программ? Оказывается нет никаких технических проблем в их использовании, поэтому добавил настройки в программу локализацию, позволяющие задействовать сторонние словари исключений.
Файлы словарей исключений:
Firefox: C:\Users\username\AppData\Roaming/Mozilla/Firefox/Profiles\xxxxxx.default/persdict.dat
OpenOffice: C:\Users\username\AppData\Roaming/OpenOffice/4/user/wordbook/standard.dic
Thunderbird: C:\Users\username\AppData\Roaming/Thunderbird/Profiles\xxxxxx.default/persdict.dat
Chrome: C:\Users\username\AppData\Local/Google/Chrome/User Data/Default/Custom Dictionary.txt
Для FireFox и Thunderbird в пути к файлу указан профиль (см. "хххххх"), представляющий из себя набор символов для каждого профиля, поэтому программа локализации будет использовать такие словари только, если присутствует один профиль mozilla для этих программ.
Формат словарей - набор слов в кодировке utf8, но для Chrome добавлена строка с хешем строк словаря, а для openOffice присутствует специальный заголовок. Эта информация игнорируется при чтении словарей.
Соответственно при добавлении слова в любой из словарей это слово будет игнорироваться программой. По умолчанию используются все словари, но, используя параметры программы (см. справку), можно включать только некоторые из них или все сразу.
Не стал подключать словари Word, чтобы не рисковать с возможным нарушением лицензии Ms Office, так как пока с ней не разобрался, можно ли использовать ее словари... т.к. их "движок" орфографии точно без разрешения нельзя. Если учесть, что отчеты генерируются для браузеров, то Word в данном случае не так актуален.
Кроме использования словарей, добавил специальный раздел отчета, в который сводятся все слова из словарей исключений с указанием программы, из которых они получены, что позволяет не только разобраться в какой программе что добавлено, но и скопировать этот набор слов в основной словарь исключений программы локализации.
Пример сводного словаря FireFox/Chrome/Thunderbird/OpenOffice:
;FireFox
А-Яа-я
;Chrome
инсталлятор
инсталлятора
;Thunderbird
;OpenOffice
Шредер
Данный подход с использованием словарей исключений популярных программ позволяет реализовать новые возможности работы со словарями.
Скорректировал отчет по всем словам, преобразовав его из обычного текста в форму с текстом ошибочных слов, что позволяет прямо в отчете html вносить слова правой кнопкой мыши в словарь исключений.
Причем прямо при наборе этой статьи в Chrome я могу добавить слово «водопадище» в словарь исключений Chrome, и оно будет использоваться при дальнейшей проверке орфографии программой локализации, при том, что отчеты проверяю в FireFox.
При переносе проверки орфографии файлов на сервер (svn/git/...), можно перенести все внесенные слова исключения в общий словарь программы из сводного словаря по всем перечисленным программам.
Примечание: функционал доступен с версии 0.14.
Примечание: функционал доступен с версии 0.14.
Комментариев нет:
Отправить комментарий