«Локализатор исходного кода» предназначен для локализации программных продуктов путем изменения их исходных кодов без предварительной подготовки.
Программа может быть использована при разработке программного обеспечения на серверах сборки, для автоматической локализации исходного кода, но она может также применяться и на рабочих компьютерах пользователей для проверки орфографии в исходных кодах, текстовых файлах, буфере обмена и словарях переводов.
Специальная версия программы позволяет проводить обфускацию исходного кода.


 

суббота, 19 октября 2013 г.

Создание отчета из 300k+ фрагментов текста на основе проекта из 290k+ файлов (653 пакета Gnome)

Создание отчета из 300000+ фрагментов текста на основе проекта из 290000+ файлов.
В качестве исходного кода взят набор репозиториев 653 проектов Gnome рассмотренных ранее.

Отличная возможность проверить производительность программы локализации на очень больших проектах.

Отчет позволяет производить поиск фраз по всем файлам локализации пакетов, для определения в каком из пакетов находится исходная фраза.
Поиск по самим po-файлам стандартными средствами затруднен тем, что в тексте po-файлов добавляются переносы строк, которые разделяют фразы на фрагменты.
Данный отчет отображает фразы целыми.

Для перечисленных целей был использован отчет по проверке орфографии (см. Проверка орфографии в исходном коде проекта) для передаче корректору, в котором перечислены все текстовые фразы из сходного кода. В данном случае po-файлы были указаны как исходный код который следует проверить корректору.

Исходные данные:
- исходный код расположен в каталоге: i:\gnomegit
- производится поиск текста только в файлах ru.po (остальные игнорируются по рег.выражению - см. параметры)
- отключены все лишние отчеты
- программа запущена на ОС Windows
- результаты отчета выгружаются в d:\temp
- все файлы в отчете корректируются рег.выражением убирающем корневой каталог.
- используется версия программы "Локализатор исходного кода" 0.9.2 - скачать. Подходит как windows-, так и wine-версия.



Для построения настолько большого отчета лучше использовать ОС Windows 7 HomeBasic и выше, так как Windows XP может не хватить, для выделения памяти программе на этапе формирования html-отчета (потребуется около 1,2Гб).

Команда с параметрами (все расположено в отдельных строках для удобства описания):

"D:\Program Files\SourceLocalizer\SourceLocalizer.exe"  
-PAUSE 
-DISABLESLOWADDITIONALREPORTS 
-SOURCEOPTIMIZELEVEL=BASE 
-SOURCEFILEIGNOREREGULAR="([^r].|.[^u])\.po$" 
-SOURCEDIR="i:\gnomegit" 
-FILEPATHREPLACE-REGULAR=^..[\\\/]gnomegit[\/\\] 
-FILEPATHREPLACE-NEWTEXT="" 
-DICTIONARYLIMIT=0 
-GENERATEONLYOPENREPORTHTML 
-RESULTHTMLDIR=d:\temp 
-SOURCETYPETRANSLATE=GETTEXT.TRANSLATE.ALL 
-OPENREPORTHTML=spellchecker 

Описание параметров в Online-справке программы.

Сгенерированный HTML-отчет (5мб zip)

Сгенерированный html-отчет можно просматривать как браузером (для html объемом 20МБ может потребоваться не слабый компьютер), так и простым текстовым редактором, так как для основного текста отчета не применяется оформление и он в нем легко просматривается.

UPDATE:
Скачал наборы po-файлов с сайта https://l10n.gnome.org/languages/ru/ и сгенерировал по ним отдельный отчет, на 330k фрагментов текста.

Комментариев нет:

Отправить комментарий