«Локализатор исходного кода» предназначен для локализации программных продуктов путем изменения их исходных кодов без предварительной подготовки.
Программа может быть использована при разработке программного обеспечения на серверах сборки, для автоматической локализации исходного кода, но она может также применяться и на рабочих компьютерах пользователей для проверки орфографии в исходных кодах, текстовых файлах, буфере обмена и словарях переводов.
Специальная версия программы позволяет проводить обфускацию исходного кода.


 

понедельник, 7 октября 2013 г.

Результаты проверки орфографии исходного кода Ubuntu 13.04

Провел проверку исходного кода ОС Ubuntu 13.04 версии, скачанной с ftp, 29 сентября 2013: ftp://cdimage.ubuntu.com

Проверял каталоги:
- language-pack-ru
- language-pack-ru-base

Результаты проверки:
- фраз содержащих кириллицу: 99260
- на проверку ушло примерно 1700сек (виртуальная машина Win7HB 1gb 1ядро HT, на компьютере i7-860)
- найдено 3109 слов с "ошибками", встречающиеся 8525 раз в тексте.

Скачать отчет: https://docs.google.com/file/d/0B2P_Drl0OiU9OVdpeE15QmtMRXc/edit?usp=sharing

Найдено множество ошибок:
002282     chk:   аналговые     text:   Изящные аналговые часы 
003017     chk:   Настрока     text:   Настрока Debian 
017250     chk:   Интсрумент     text:   Интсрумент GNOME для поиска строки в наборе файлов
000028     chk:   значиние     text:   Применение: %s [-LRSq] -s имя_атрибута [-V
...
Фрагмент отчета:

Ранее уже проверял открытые ОС - см. Автоматическая проверка орфографии исходных файлов на примере OpenSuse, по результатам которой ошибки были исправлены в ОС (см.Update), и по совету координатора локализации этой ОС, был скорректирован и улучшен данный отчет.

Профиль в Google+ и его оформление

Обнаружил трансляцию всех моих постов в свой аккаунт на google+...
Специально его не создавал, но оказалось Google другого мнения (или мелкая "галочка" где то в соглашении есть) по этому поводу.
Но с виду хорошо все выглядит и удобно сделано, потому спасибо им.

Только странные пропорции заглавной картинки. У OpenSuse и ряда аккаунтов картинки явно горизонтальные, а у других высокие-прямоугольные... в своем аккаунте Google упорно настаивает на своих пропорциях.
Решил отрисовать заглавную картинку в новых пропорциях и светлых тонах, потом может и редизайн сайта/блога/инсталляторов сделаю под новый стиль... посмотрим...

Google+: https://plus.google.com/u/0/103029391702241740789/posts
Картинка:
P.S. Застолбил название сообщества SourceLocalizer, но так как все записи транслировались в мой профиль, вероятно так и останусь на нем... 

воскресенье, 6 октября 2013 г.

Обновление программы локализации до версии 0.9.2.752

Изменения в программе:

  • Добавлена работа с буфером обмена.
  • Добавлена обработка po-файлов как текстового формата.
  • Улучшена подготовка текста к проверке орфографии (чистка спец.символов и тегов).
  • Добавлена настройка орфографии через параметр (для нижнего подчеркивания).
  • Добавлен пользовательский словарь исключений.
  • Изменены настройки контекста.
  • Добавлены параметры для гибкой настройки орфографии OpenOffice.
  • Продлил дату Бета-версии.
  • Расширены отчеты орфографии.
  • Добавлено игнорирование специальных файлов и каталогов при проверке "любых" файлов.
  • Добавлена информация в справку.
  • Добавлен отдельный инсталлятор тестовой версии для Linux(wine).

    суббота, 5 октября 2013 г.

    Проверка орфографии в буфере обмена или эволюция от командной строки до окон

    При разработке программы ориентировался на то, что необходимо будет работать с ней из командной строки или командных файлов, соответственно, отчеты генерировались в формате JUnit для сервера сборки.

    Со временем пришел к тому, что разработчику порой приходится работать локально, без сервера сборки и ему пригодится система отчетов в более привычном виде, например, HTML, что и сделал.

    Разработчику может быть не удобно писать скрипты и указывать проверяемые каталоги/файлы, поэтому сделал ярлыки, на которые их можно "бросать".

    Когда пишешь текст, то не удобно сохранять файл, например, в NotePad++, чтобы потом файл "бросить" на ярлык, поэтому добавил значок проверки буфера обмена.

    Читать мысли программы пока еще не умеют, поэтому эволюцию своей программы в этом направлении приостановлю... :)

    Проверка буфера обмена позволяет не только проверять свои текстовые файлы, но и страницы сайтов, PDF и прочее.

    Давайте проверим работу на примере сайта для переводчиков:
    https://help.launchpad.net/Translations/GuidesList/Russian
    "Справка Launchpad > Переводы > Общий путеводитель по переводу"

    Выделяем всю страницу и копируем в буфер, затем запускаем ярлык "Буфер обмена - проверка орфографии...".

    Получаем список ошибок:
    преводить, путеводтель, перевдчиками, пределать, середие, управляющи, преводить, коментарии, утройство, некторых, предложний, иформацию, свобдного, преводы, преведённая, преводить, преводу, преводчиков, способв, инфорацию, ладитьс, программынаваш

    Словарь локализатора GPL. Почему его нет?

    Для крупных проектов существует множество инструкций и советов, но нет (не нашел) словарей орфографии, которые можно было бы использовать переводчиками и тестировщиками.

    Если загрузить перевод в текстовый редактор, например, в OpenOffice или другой поддерживающий словари орфографии, например, Notepad, то целый ряд слов будет подчеркнут, как ошибки. Это в первую очередь относится к терминам и названиям, которых нет в словарях.
    Между такими терминами и названиями легко "прячутся" ошибки, которых не заметно на фоне множества ложных срабатываний.

    Кроме того, "устоявшиеся термины" и прочее можно было бы добавить в такой словарь, чтобы при ошибке в термине было сразу ее видно.

    Пример: "Словарь устоявшихся терминов" http://team.ubuntu.ru/translate/словарь_переводов

    В примечании к "кеш" (по ссылке к слову):
      Уважаемые переводчики, использующие слово "кеш"!
      Пожалуйста, пишите правильно - "кэш". Спасибо. --Артём

    Если слово "кэш" добавить в словарь, как и ряд других, то подчеркнутое слово "кеш" явно подскажет локализатору об ошибке.

    Отличным примером является название "Ши-сен-сё" и второй его вариант "Ши-сён-сё", встречающийся в переводе OpenSuse. При наличии правильной версии данного названия
    в словаре локализатор сразу бы увидел ошибку.

    Наиболее распространенными являются словари для утилиты hunspell, но также можно использовать словари пользователей для OpenOffice.

    Для начала рассмотрим формат OpenOfice, основной пользовательский словарь standard.dic, который имеет следующее содержание:

    четверг, 3 октября 2013 г.

    Тестовая версия программы для Linux (wine)

    Добавил инсталлятор для Linux.
    В связи с необходимостью наличия wine/mono в Linux, решил не делать deb-пакет, а реализовать все средствами InnoSetup, просто упростив основной инсталлятор: отключив создание ярлыков, регистрацию журналов, наличие большого количества примеров и убрав оконную программу "Генератор параметров" из инсталлятора.

    Получился простой дистрибутив с простой установкой.

    четверг, 19 сентября 2013 г.

    Автоматическая проверка орфографии для систем генерирования справочной документации на примере AsciiDoc, NovellDoc и OpenSuse.

    В своем проекте я использую программу (скрипт) Asciidoc для формирования документации на основе единого источника информации.

    Создаю текстовый документ со специальными метками и с помощью AsciiDoc, преобразую его в DocBook, а затем с помощью Apache FOP - в набор документов формата HTML,PDF,CHM.

    Пример фрагмента исходного текста:

    [[spellcheck]]
    == Проверка орфографии

    === Автоматическая проверка орфографии

    Для автоматической проверки орфографии используется модуль проверки из <<softOpenOffice,OpenOffice>>. 
    По результатам проверки Формируется ряд отчетов, например: "ОТЧЕТ ПО АВТОМАТИЧЕСКОЙ ПРОВЕРКЕ ОРФОГРАФИИ ИСХОДНЫХ ФАЙЛОВ", "ОТЧЕТ ПО АВТОМАТИЧЕСКОЙ ПРОВЕРКЕ ОРФОГРАФИИ СЛОВАРЯ".

    [NOTE]
    Для использования автоматической проверки обязательно наличие установленного на компьютере <<softOpenOffice,OpenOffice>>.

    [[spellcheck_orphoautosourcecodeany]]
    ==== Автоматическая проверка орфографии исходных файлов (любых)

    Как выглядит:
    На сайте: http://www.sourcelocalizer.ru/help/spellcheck.html
    PDF: см. ссылку в углу экрана онлайн-справки или по ссылке http://www.sourcelocalizer.ru/help/sourcelocalizer.pdf
    CHM: скачайте программу http://sourcelocalizer.ru/download :)

    AsciiDoc очень удобен и прост в использовании, так как справка генерируется из системы контроля версий (svn) на сервере сборки (CI Hudson) с помощью сборочной программы (NAnt), которая еще и правит (используя регулярное выражение добавления ссылок для всех html-файлов) HTML, чтобы добавить в онлайн версию ссылки на содержание и прочее (штатные средства AsciiDoc для таких ссылок не очень подошли, см. формируемую ссылку в справке в правом верхнем угле).