Распределенное хранилище данных для медленной сети с высоким оттоком узла?

263
Vi.

Какое распределенное хранилище данных я должен использовать для надежного хранения данных на множестве узлов с плохой связью между ними?

Я хочу то, что:

  • Не ожидает, что все узлы теперь доступны, включая поддержку автономной работы;
  • Первоначально данные хранятся локально, но в конечном итоге (когда сеть работает хорошо и больше узлов подключено к сети) распространяют их на другие необходимые узлы;
  • Иметь хорошую автоматическую перебалансировку и восстановление перед лицом присоединения и выхода из сети;
  • Обрабатывать узлы, которые сильно различаются по емкости, сохраняя только маленькие и высокоприоритетные объекты на маленьких узлах;
  • Относитесь к локальному узлу особенным: «мои» данные всегда сначала сохраняются на локальном узле, а затем копируются на другие узлы.

Большинство решений, таких как Tahoe-LAFS или GlusterFS, по-видимому, ожидают более или менее стабильного набора узлов, которые находятся в сети и подключены к хорошей сети, без каких-либо длительных плановых простоев. Существует ли специальное распределенное хранилище, которое предполагает регулярное отключение узлов?

0
Я не думаю, что вы найдете то, что "ожидает" простоев. Лучшее, что вы получите, это те, которые могут обойти время простоя с помощью надлежащего ведения журнала и контроля четности - и даже у них будут ограничения (и потребуется больше места для хранения, чтобы увеличить время ожидания для большего количества узлов). По какой причине вам нужно «ожидаемое» время простоя, встроенное в ваше решение? Не станет ли устранение причины ожидания простоя первым шагом к реализации решения? MaQleod 10 лет назад 0
Например, из-за различных узлов могут быть обычные ПК, смартфоны и серверы. Между серверными узлами он должен работать более или менее подобно традиционным сетевым хранилищам. Но на смартфоне он должен работать [количественно] иначе. Узлы, находящиеся в автономном режиме, также должны делать что-то полезное, например, поддерживать доступ к небольшим, но высоким данным prio (которые копируются во все узлы сети). Хранение должно быть сосредоточено не на производительности, а на надежности, «построенной из плохого кирпича и плохого цемента». Vi. 10 лет назад 0
Примечание: «автономно» здесь означает «работающий, но без сети». В автономном режиме узел должен предоставлять доступ к ресурсу, который он имеет локально, и принимать новые данные, загружая эти данные в сеть, когда узел, наконец, подключается к сети. Vi. 10 лет назад 0

0 ответов на вопрос

Похожие вопросы