5

Я хочу очистить всю вики, которая использует программное обеспечение MediaWiki. Количество страниц довольно маленькое, но в них много ревизий, и я бы тоже предпочел пересмотреть ревизии.

В отличие от Википедии, вики не предлагает дампы базы данных. Существуют ли какие-либо программы / скрипты, предназначенные для очистки сайтов MediaWiki?

2 ответа2

5

Проверьте инструменты, доступные на WikiTeam. http://archiveteam.org/index.php?title=WikiTeam

Я лично использую dumpgenerator.py от wikiteam, который доступен здесь: https://github.com/WikiTeam/wikiteam

Это зависит от Python 2. Вы можете получить программное обеспечение с помощью git или скачать zip с github:

git clone https://github.com/WikiTeam/wikiteam.git

Основное использование:

python dumpgenerator.py http://wiki.domain.org --xml --images
3

Если сопровождающий вики не выключил его, вы можете экспортировать страницы с их историей через Special:Export. Это даст вам дамп XML, похожий на дамп базы данных Википедии, который вы затем сможете импортировать в другую вики.

Другой способ получить историю страниц из MediaWiki в формате XML - использовать запрос API prop = revisions. Однако формат результатов API несколько отличается от формата Special:Export, поэтому вам, вероятно, придется немного обработать вывод, прежде чем вы сможете передать его в стандартные сценарии импорта.

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .