Что было показано с научной точки зрения для поддержки производительности при структурной организации / доступе к файлам и папкам?

579
Tom Wijsman

Моя проблема управления личной информацией

Я собрал терабайты данных, но стало привычным хранить файлы и папки в одной и той же папке, эта папка может рассматриваться как место, Inboxгде большинство файлов (неинсталляционных) попадают в мою систему. Таким образом, я получаю большие коллекции файлов, которые трудно организовать должным образом, в основном я делаю папки, которые соответствуют их типу файлов, но тогда у меня все еще есть несколько гигабайт данных на папку, что не делает ее настолько эффективной, что я можно продуктивно использовать папку.

Я предпочел бы сделать несколько кликов, чем искать файлы, будь то какой-то программный продукт или просматривая папку. Часто сами имена файлов не являются правильными, поэтому было бы легче распознать их, если бы их было несколько в папке, а не тысячи из них.

Масштабирование в структуре деревьев каталогов в компьютерном кластере сводит эту проблему к следующему:

Процессы хранения и поиска информации быстро приобретают все большее значение как в науке, так и в обществе в целом [1, 2, 3, 4]. Предпринимаются значительные усилия, во-первых, чтобы охарактеризовать и описать, как на самом деле организована общедоступная информация, например, во всемирной паутине, и, во-вторых, разработать эффективные методы доступа к этой информации.

[1] Р. М. Шиффрин и К. Бёрнер, Proc. Natl. Акад. Sci. США 101, 5183 (2004).
[2] С. Лоуренс, К.Л. Джайлс, Nature 400, 107–109 (1999).
[3] RFI Cancho и RV Sol, Proc. R. Soc. Лондон, Сер. B 268, 2261 (2001).
[4] М. Сигман и Г. А. Чекки, Proc. Natl. Акад. Sci. США 99, 1742 (2002).

Далее объясняется, как обычно организованы данные, если взглянуть на них в общих чертах, но, взглянув на реферат и заключение, они не приходят к выводу или подходу, которые приводят к продуктивной организации иерархии каталогов. Так что, по сути, это проблема, решение которой я еще не нашел; и я хотел бы увидеть научное решение этой проблемы.

В поисках эмпирического решения этой проблемы

При дальнейшем поиске я, похоже, не нашел ничего полезного или бесплатных документов, подходящих к этой проблеме, поэтому, возможно, я смотрю не в том месте. Я также отметил, что существуют разные способы обозначить эту проблему, что приводит к разным результатам работ. Возможно, есть бумага, но я не просто использую те же термины, что и эта бумага? Они часто используют более научные термины.

Однажды я слышал историю об адвокате с ноутбуком, который просто превзошел адвоката с тоннами бумаг, что показывает, как правильная организация ведет к производительности; но в этой истории не было подробностей о том, как адвокат использовал ноутбук или как он организовал свои данные. Но в любом случае это было гораздо полезнее, чем то, как большинство из нас организуют наши данные в наши дни ...

Посоветуйте мне, как мне организовать свои данные, я не ищу предложений здесь . Я хотел бы видеть статистику или научные подходы к измерению, которые помогут мне подтвердить, что это действительно помогает мне достичь моей цели.

Поиск не решает эту проблему

Поиск не является решением этой проблемы, поскольку он запрещает доступ к соответствующим файлам, что часто требуется, когда вы работаете в контексте файла (который часто требует других файлов). Вот почему я упоминал ранее, что плохие имена файлов являются проблемой мэра. И нет, размещение всех имен каталогов в имени файла не является правильным подходом к этому. Поисковая система полнотекстового поиска работает только для текстовых файлов, а имена каталогов часто не находятся внутри файла. Это делает Поиск ненадежным и неопределенным при поиске ...

Также обратите внимание, что я ищу структурную организацию / доступ, потому что семантические подходы (такие как «это то, как я делю это и работает для меня и моих друзей» или «поиск работает для меня») не применимы ко всем, в то время как структурные подходы применимо к большинству пользователей, которые перемещаются по их хранилищу.

3
Нашел [этот документ] (http://muse.tau.ac.il/publications/101.pdf) и читаю его, я мог бы самостоятельно ответить в будущем, но все еще задаюсь вопросом, есть ли другая доступная информация по этому вопросу , На первый взгляд кажется, что он содержит некоторую полезную информацию, которая частично решает проблему ... Tom Wijsman 12 лет назад 1
«То, что было научно доказано, поддерживает производительность, когда структура» -> звучит более скептически. Sathya 12 лет назад 0
@Sathya: Ложь, потому что эта сторона предназначена для "изучения доказательств, на которых основаны претензии, с которыми вы сталкиваетесь" согласно FAQ. По-видимому, вы на самом деле не [уважаете свое сообщество] (http://blog.stackoverflow.com/2012/03/respect-the-community-your-own-and-others/). Я хотел бы знать, почему этот вопрос о компьютерных данных не по теме, потому что в противном случае это просто *** ты ***, который хотел видеть его закрытым без какой-либо ясной причины. Tom Wijsman 12 лет назад 1
Более того, я хочу, чтобы этот ответ был для Супер пользователя, «эмпирические или научные данные должны поступать в Skeptics.SE» - это не правильный способ решения таких вопросов, а просто означает, что вы отбрасываете свои вопросы высочайшего качества в другое сообщество. Если вы решите покончить с этим, похоже, пришло время покинуть Super User, потому что он превратился в беспорядок недалеких людей, которым нет дела до сообщества и их вопросов. * Качество> Количество ... * Tom Wijsman 12 лет назад 0
речь идет не о компьютерном оборудовании или программном обеспечении, а о том, чтобы спросить, что «научно доказано для поддержки производительности», что явно не по теме. Sathya 12 лет назад 3
ты можешь уйти. Никто не держит вас в качестве заложников сайта, и сообщество не становится "недалеким". Забавно, что исходит от одного из самых близких избирателей. Sathya 12 лет назад 0
@Sathya: в FAQ не говорится, что «научные» или «продуктивные» не по теме, ** мой вопрос касается файлов и папок на персональном компьютере, используемых пользователями компьютеров **; это очень по теме! Забавно, как вы решаете выбрать количество (количество голосов), но не обращаете внимания на качество (подразумевается голосование). Tom Wijsman 12 лет назад 0
Кросс опубликовал t0: http://productivity.stackexchange.com/questions/3005/what-was-scientifically-shown-to-support-productivity-when-structural-organizing random 12 лет назад 0
@random: Давайте подождем, что там думает сообщество, а также два других сайта, которые у меня есть в качестве вариантов для моего вопроса. Здесь требуется еще одно повторное голосование, для которого снова потребуется пять близких голосов (по крайней мере, если модераторы достаточно щедры, чтобы отказаться от второго обязательного голосования). Я буду в порядке с блокировкой, повторным закрытием или даже удалением в качестве временного решения; но, пожалуйста, прокомментируйте меня, если вы решите сделать один из них (чтобы понять, был ли он обязательным или нет). Я понимаю, что вопросы, открытые на обоих сайтах, являются проблемой; так что не стесняйтесь действовать * после / когда он снова откроется * ... Tom Wijsman 12 лет назад 0
Текущая форма все еще не по теме. На тему версии было бы больше узнать, как повысить скорость поиска или как дедуплицировать файлы в системе, чтобы помочь с архитектурой / организацией random 12 лет назад 0

1 ответ на вопрос

0
caliban

Вот измерение, которое я сделал:

  • Щелкнув по очень глубокой структуре папок, вы будете наблюдать за тем, чтобы найти нужный файл.
    34 сек

  • Нажмите клавишу Windows или клавишу «Command» + «Пробел» и введите ключевые слова для имени файла.
    9 секунд (SSD)

Большинство современных систем поиска данных также осуществляют поиск внутри файлов, поэтому имена файлов на самом деле не представляют серьезной проблемы. [cf OP: не все файлы являются текстовыми или содержат имена каталогов, их нельзя разумно поместить в имя файла или контекст поддержки]

Как примечание стороны:

Методология организации данных служит двум конечным целям [Отсутствует доказательство] .

  1. Эффективный поиск.

  2. Пользователь OCD.

Если с последним вам придется бороться, тогда у вас возникнут проблемы. Если это первое, хороший поисковик позволит вам достичь цели точно так же или даже лучше [Отсутствует доказательство] .

Кроме того, по мере того, как все больше и больше информации загружается в нашу жизнь ежедневно, наступает момент, когда организация становится слишком громоздкой. [Отсутствует доказательство]

Второй метод не является продуктивным, поскольку он запрещает доступ к соответствующим файлам, что часто требуется, когда вы работаете в контексте файла (который часто требует других файлов). Это не научно, так как это всего лишь одно измерение (личное наблюдение), но оно не помогает с навигацией и не помогает с неправильными именами файлов. И нет, размещение всех имен каталогов в имени файла не является правильным подходом. Поисковая система поиска данных работает только для текстовых файлов, а имена каталогов часто не находятся внутри файла. Это делает его ненадежным и неопределенным при поиске ... -1 Tom Wijsman 12 лет назад 0
Ваши два добавленных абзаца не отвечают на вопрос и просто напыщенные. Как я обрисовал, Поиск не поможет, если вы дезорганизованы. Пожалуйста, предоставьте эмпирическое доказательство для вашего последнего параграфа (и фактически, весь ваш ответ), потому что это далеко не научно, а скорее просто выдуманная мысль, пока вы не подтвердите это ... Tom Wijsman 12 лет назад 0

Похожие вопросы