Как преобразовать формат файла словаря stardict в любой читаемый формат (xml, txt или что-то еще)?
3 ответа
У tar-файла stardict-tools, загружаемого с их сайта, есть инструмент stardict2txt
, который вам нужно будет собрать из исходного кода.
Вы можете использовать это:
https://github.com/ilius/pyglossary
Если вам нужно установить его для пользователя на Linux, вы можете создать virtualenv и улучшить его
git clone https://github.com/ilius/pyglossary.git
cd pyglossary
#1. Add to setup.py after:
#import logging
#next line:
#logging.basicConfig()
#
#1. change in setup.py
#from pyglossary.glossary import VERSION to
#VERSION = "3.1.0" # version that was tested in my case
python setup.py
pyglossary
И конвертер будет работать, что вы можете делать разные преобразования.
Другой путь:
Есть файл .dict.dz.
- Emacs открывает его как текстовый файл, затем вы можете скопировать текст и поместить его в какой-нибудь файл.
выполнить:
dictunzip <dictname>.dict.dz
Чтобы преобразовать его в файл .dict, и читать как текстовый файл. Программа dictunzip находится в пакете dictzip (debian, ubuntu). В моем случае .dict был читабельным, в некоторых случаях он может быть двоичным.
Я нашел это пошаговое руководство о том, как использовать редактор StarDict для Windows , чтобы декомпилировать словарь StarDict в формат XML.
- Извлеките все файлы в папку, а затем запустите файл stardict-editor.exe, перейдите на вкладку DeCompile.
- Теперь посмотрите на файлы словаря StarDict, которые вы получили, их должно быть 3: * .idx, * .ifo, * .dz.
- Переименуйте файл * .dz в * .gz. Используйте WinZip или WinRAR для извлечения файла * .dict внутри.
- Переименуйте все файлы * .dict, * .ifo, * .idx в одно имя.
- Вернитесь в программу StarDict Editor, нажмите кнопку «Обзор», выберите файл * .ifo и нажмите «Декомпилировать».
- Вы увидите новый файл * .txt внутри папки.
- Используйте его с DfM DictionaryGeneration.