Странно, что у меня при компиляции не ругнулось

. У себя тоже поправил.
Говоря об улучшении, прямо сейчас я просто по основной базе статей прохожусь по всем и извлекаю статьи, потом сортирую и объединяю с одинаковым именами. Это короткий путь. Мультитран делает вначале простой морфологический анализ - отрезает окончания (согласно базе end.LANG), потом находит остаток в базе основ (stem.LANG) и исходя из этого уже получает список статей (ещё проходя через дополнительный поисковый индекс dict.xxD). При выделении основ он получает части речи. Т.к. я таким путём не иду, у меня сейчас части речи не известны для слов. Для них нужно ещё те несколько баз тоже парсить и подключить.
Что сейчас довольно доступно, так это transcr.LANG - база транскрипций, это простое отображение из слова в транскрипцию (по ихнему закодированную), потому её можно довольно быстро подключить, она и памяти не особо жрёт ввиду мелкого размера. Разве что нужно будет разбираться, как лингво кодирует в DSL транскрипцию...
По поводу названия словаря, как понимаю, для полноценного DSL нужно ещё несколько вещей с метаинфой, это 1) шапка чтобы была в DSL:
#NAME "MultiTran"
#INDEX_LANGUAGE "English"
#CONTENTS_LANGUAGE "Russian"
2) файл аннтоаций (для лингво) .ann и 3) картинка словаря .bmp. Шапка в iconv.7z лежит, header.txt, а также её просто в блокноте создать и сохранить как юникод.
Кстати, как в ReadMe.txt говорилось, там пример что шапку вначале пристыковывать нужно. Тогда будет имя и всё остально работать

.
Ещё в МультиТране довольно много всякого трэшняка, когда язык местами перепутан, когда битые статьи (с левыми байтами данных) и т.п. Относительно всего объёма их может 1%, потому я просто выкидывал, кое что лингво при компиляции уже выкидывает (например язык направлением перепутан). Так что ещё вопрос, как и что зачищать...
Относительно направления перевода. Все МультиТрановые баз статей просто без направления, у них даже статей нету, это просто набор пар слов из двух языков + доп. инфа типа комментов. Так вот, можно сделать её и в направлении Russian->English, достаточно в multitran_tool поменять -to и -from, т.е. поставить "-from russian -to english", я это пока не пробовал, но должно получится просто словарь в обратном направлении

, правда пометки и комменты у него будут на русском языке в тексте английских статей

, лингво наверное обидится...