3

Моя проблема управления личной информацией

Я собрал терабайты данных, но стало привычкой хранить файлы и папки в одной и той же папке, эта папка может рассматриваться как Inbox где большинство файлов (неинсталляционных) попадают в мою систему. Таким образом, я получаю большие коллекции файлов, которые трудно организовать должным образом, в основном я делаю папки, которые соответствуют их типу файлов, но тогда у меня все еще есть несколько гигабайт данных на папку, что не делает ее настолько эффективной, что я можно продуктивно использовать папку.

Я предпочел бы сделать несколько кликов, чем искать файлы, будь то какой-то программный продукт или просматривая папку. Часто сами имена файлов не являются правильными, поэтому было бы легче распознать их, если бы их было несколько в папке, а не тысячи из них.

Масштабирование в структуре деревьев каталогов в компьютерном кластере сводит эту проблему к следующему:

Процессы хранения и поиска информации быстро приобретают все большее значение как в науке, так и в обществе в целом [1, 2, 3, 4]. Предпринимаются значительные усилия, во-первых, чтобы охарактеризовать и описать, как на самом деле организована общедоступная информация, например, во всемирной паутине, и, во-вторых, разработать эффективные методы доступа к этой информации.

[1] Р. М. Шиффрин и К. Бёрнер, Proc. Natl. Акад. Sci. США 101, 5183 (2004).
[2] С. Лоуренс, К.Л. Джайлс, Nature 400, 107–109 (1999).
[3] RFI Cancho и RV Sol, Proc. R. Soc. Лондон, Сер. B 268, 2261 (2001).
[4] М. Сигман и Г. А. Чекки, Proc. Natl. Акад. Sci. США 99, 1742 (2002).

Далее объясняется, как обычно организованы данные, если взглянуть на них в общих чертах, но, взглянув на реферат и заключение, они не приходят к выводу или подходу, которые приводят к продуктивной организации иерархии каталогов. Так что, по сути, это проблема, решение которой я еще не нашел; и я хотел бы увидеть научное решение этой проблемы.

В поисках эмпирического решения этой проблемы

При дальнейшем поиске я, похоже, не нашел ничего полезного или бесплатных документов, подходящих к этой проблеме, поэтому, возможно, я смотрю не в том месте. Я также отметил, что существуют разные способы обозначить эту проблему, что приводит к разным результатам работ. Возможно, есть бумага, но я не просто использую те же термины, что и эта бумага? Они часто используют более научные термины.

Однажды я слышал историю об адвокате с ноутбуком, который просто превзошел адвоката с тоннами бумаг, что показывает, как правильная организация ведет к производительности; но в этой истории не было подробностей о том, как адвокат использовал ноутбук или как он организовал свои данные. Но в любом случае это было гораздо полезнее, чем то, как большинство из нас организуют наши данные в наши дни ...

Посоветуйте мне, как мне организовать свои данные, я не ищу предложений здесь. Я хотел бы видеть статистику или научные подходы к измерению, которые помогут мне подтвердить, что это действительно помогает мне достичь моей цели.

Поиск не решает эту проблему

Поиск не является решением этой проблемы, поскольку он запрещает доступ к соответствующим файлам, что часто требуется, когда вы работаете в контексте файла (который часто требует других файлов). Вот почему я упоминал ранее, что плохие имена файлов являются проблемой мэра. И нет, размещение всех имен каталогов в имени файла не является правильным подходом к этому. Поисковая система полнотекстового поиска работает только для текстовых файлов, а имена каталогов часто не находятся внутри файла. Это делает Поиск ненадежным и неопределенным при поиске ...

Также обратите внимание, что я ищу структурную организацию / доступ, потому что семантические подходы (такие как «это то, как я делю это и работает для меня и моих друзей» или "поиск работает для меня") не применимы ко всем, в то время как структурные подходы применимо к большинству пользователей, которые перемещаются по их хранилищу.

1 ответ1

0

Вот измерение, которое я сделал:

  • Щелкнув по очень глубокой структуре папок, вы будете наблюдать за тем, чтобы найти нужный файл.
    34 сек

  • Нажмите клавишу Windows или клавишу «Command» +«Пробел» и введите ключевые слова для имени файла.
    9 секунд (SSD)

Большинство современных систем поиска данных также осуществляют поиск внутри файлов, поэтому имена файлов на самом деле не представляют большой проблемы. [cf OP: не все файлы являются текстовыми или содержат имена каталогов, их нельзя разумно поместить в имя файла или контекст поддержки]

Как примечание стороны:

Методология организации данных служит двум конечным целям [Отсутствует доказательство].

  1. Эффективный поиск.

  2. Пользователь OCD.

Если с последним вам придется бороться, тогда у вас возникнут проблемы. Если это первое, хороший поисковик позволит вам достичь цели точно так же или даже лучше [Отсутствует доказательство].

Кроме того, по мере того, как в нашу жизнь ежедневно загружается все больше и больше информации, наступает момент, когда организация становится слишком громоздкой. [Отсутствует доказательство]

Всё ещё ищете ответ? Посмотрите другие вопросы с метками .