Недавно я включился в новый проект с большим SVN (70 ГБ, 9000 коммитов, полный текстовых и двоичных файлов). Для своей работы мне нужно проанализировать различные документы и изменения, внесенные в них за последние 4 года. Хотя анализ истории отдельных файлов довольно прост, я натолкнулся на случай использования, для которого я не смог найти подходящего инструмента:
Узнайте, какие документы в хранилище содержали (в какой редакции) конкретный поисковый запрос. Мой наивный подход заключается в том, чтобы извлекать все ревизии локально в папку для каждой ревизии (и заменять неизмененные файлы символическими ссылками на другие папки для экономии места), а затем выполнять поиск с помощью grep в файлах.
Основным ограничением для меня является то, что я получил доступ к серверу только через svn-клиент (поэтому я не могу просто клонировать весь репозиторий).
Существует ли какой-либо инструмент, который позволил бы мне загрузить весь репозиторий (включая все версии) локально, а затем обеспечить быстрый поиск, не затопляя мой HD в дубликатах файлов?