1

Существует ли инструмент, похожий на grep/ack/grin, для всех типов файлов (включая MS Office, PDF и т.д.)? Мне часто приходится искать в папке или на целом диске строки внутри файлов, которые представляют собой нечто большее, чем простой текст.

Я особенно заинтересован в решениях для OSX, хотя интересуюсь кроссплатформенными и, в меньшей степени, решениями для UNIX/Windows.

Благодарю.

3 ответа3

1

Я не знаю ни одной утилиты, которая будет обрабатывать все, но некоторые полезные опции:

  1. строки (из пакета binutils)
  2. Lesspipe (из меньшего пакета)
  3. Antiword
  4. odt2txt
  5. pdftotext (из poppler-utils)

Что-нибудь еще, и вам, вероятно, нужно будет запустить /usr /bin /file и посмотреть, сможете ли вы найти пакет, который позволит вам конвертировать в какой-то канонический формат, с которым вы знаете, как обращаться.

1

Поскольку все ваши необходимые типы файлов находятся здесь, а Google Desktop больше не поддерживается, я бы попробовал Desktop Search Engines или поищите сайт загрузки, который по-прежнему предлагает Google Desktop, например CNET.

0

Нет, набор всех типов файлов и текстовых кодировок слишком велик, чтобы одна программа могла их проанализировать.

Рассмотрим для примера

  • Формат файла мода Amiga Noisetracker (содержит названия инструментов и т.д.)
  • Файл IBM VSAM, содержащий EBCDIC?
  • Файл Lotus Notes для OS/2 (зашифрованный)

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .