Вычислительный кластер
Вычислительный кластер – это набор соединенных между собой компьютеров (серверов), которые работают вместе и могут рассматриваться как единая система. В отличие от грид-вычислений, все узлы компьютерного кластера выполняют одну и ту же задачу и управляются одной системой управления.
Серверы кластера обычно соединяются между собой по быстродействующей локальной сети, причем на каждом из серверов работает собственный экземпляр операционной системы. В большинстве случаев все вычислительные узлы кластера используют одинаковое оборудование и одну и ту же операционную систему. Однако в некоторых инсталляциях, например, с использованием платформы приложений для организации кластеров OSCAR (Open Source Cluster Application Resources), могут использоваться различные операционные системы или разное серверное оборудование.
Кластеры обычно развертываются для большей производительности и доступности, чем то, что можно получить от одного компьютера, пусть даже очень мощного. Часто такое решение более экономично, чем отдельные компьютеры.
Насколько значителен прирост производительности при большем размере кластера
Рассчитывать на какой-то весомый прирост производительности HDD даже при максимально возможном размере кластера не стоит. Сам по себе механизм работы HDD имеет массу условностей, и гораздо больше толку в этом плане будет от регулярной процедуры дефрагментации. Прирост в скорости работы с данными будет исчисляться секундами, а то и вовсе миллисекундами. Тем не менее и за них, возможно, стоит побороться при формировании разделов для хранения файлов с весом, исчисляемым преимущественно в мегабайтах или вовсе в гигабайтах.
Какой размер кластера лучше для системного раздела С ? Установочный процесс Windows, позволяющий прямо на этапе установки системы формировать разделы диска с нераспределённым пространством, не даёт нам возможности выбора размера кластера.
Он по умолчанию задаётся 4096 байт (4 Кб) . И является оптимальным выбором для системного раздела С, поскольку в состав системы и сторонних программ входит огромное множество мелковесных файлов. Изменять его не рекомендуется.
А вот с несистемными разделами можно поэкспериментировать. Но прежде необходимо оценить текущую ситуацию и узнать, какой размер кластера у раздела сейчас. Чтобы потом сделать выводы о приросте производительности.
Подтипы отказоустойчивых кластеров
- С холодным резервом
- С горячим резервом
- С модульной избыточностью
Холодный резерв
Один сервер находится в пассивном режиме и ждет падения основного сервера
Горячий резерв
Два сервера обрабатывают запросы, в случае падения одного, вся нагрузка направляется на живой.
Модульная избыточность
Два сервера обрабатывают один и тот же запрос. Необходимо, когда нам нужно гарантированно обработать запрос и получить результат (результат берется любой).
Кластеры на виртуальных машинах
Наиболее доступным и масштабируемым решением является построение кластера на основе виртуальных машин на платформе Hyper-V.
В качестве web-боксов NLB-кластера используются виртуальные машины с установленными на них Windows Web Server 2008 (IIS7.х, пользовательское приложение).
В качестве кластера баз данных используется две виртуальные машины необходимой мощности на Windows Server 2008 Standard Edition и SQL Server 2008 Standard Edition.
Отказоустойчивое единое хранилище данных на основе Storage System от NetApp или HP.
Для обеспечения бОльшей надежности все узлы кластера располагаются на различных физических серверахузлах кластера.
Масштабируемость решения достигается путем увеличения мощности используемых виртуальных машин (вплоть до 100% мощности физического сервера), а также за счет добавления новых узлов в NLB-кластер.
С использованием средств онлайновой миграции со временем возможен перенос узлов кластера на новые, более современные физические сервера без потери работоспособности и без простоя любого узла.
Данный кластер является лучшим решением в соотношении цена/качество и рекомендуется как для критичных для бизнеса приложений, так и для относительно нагруженных web-проектов (~до 30000-50000 посетителей ежедневно).
Кластер – единица хранения данных
Наиболее часто с понятием «кластер» пользователи компьютера сталкивается при форматировании флешки, диска либо какого-нибудь другого носителя информации.
На рисунке диалоговые окно форматирования диска на операционной системе Windows 7. Это окно практически не отличается в разных ОС семейства Windows.
В диалоговом окне мы видим, что один из параметров форматирования носит название «Размер кластера». Давайте вместе разберемся, что такое кластер и зачем так важно определять его размер.
Начнём того, что файл на диск записывается небольшими частями, эти части совсем не обязательно идут друг за другом, порой они раскиданы по всему диску. Удаляя файл, мы очищаем эти части от информации, записывая — мы заполняем их снова. Понятно, что записывая и удаляя файлы, мы как бы перемешиваем информацию на диске.
Чтобы прочитать файл, жесткому диску приходится считывать её из с разных участков своей памяти. Думаю, понятно, что считывание информации с различных областей диска может существенно замедлять работу системы, ведь гораздо проще считывать информацию последовательно, чем прыгать с места на место.
Понятие кластер, в нашем случае, как раз и относится к этим участкам носителя информации. Кластер – это участки памяти на диске, имеющие определенный заданный объем, являющийся минимальным для хранения файлов.
Чем больше кластер, тем меньше переходов совершит система при считывании информации и тем быстрее будет работать система. Но не все так просто, как кажется на первый взгляд! Кластер может быть занят данными только из одного файла и если даже файл по своему объёму меньше размера кластера, то фактически он будет занимать размер целого кластера. Если размер файла, разделить на размер кластера, то остаток от деления все равно займется одним кластером. Таким образом, возникает дилемма, чем жертвовать — скоростью работы или свободным местом на жёстком диске.
Характеристики кластеров
Некоторые должны быть сильными вычислениями, такими как прогнозы погоды, ядерные испытания и т. Д. Это не несколько компьютеров, чтобы получить его. Это требует тысяч наборов вместе, чтобы завершить эту работу.
Рабочие нагрузки сетевых служб обычно являются большим количеством независимых задач. Его можно достичь через набор серверов, чтобы получить высокую общую производительность.
Эффективность цен (производительность затрат)
Обычно архитектура кластера системы, только несколько или десятки хостов серверов, с более высоким экономичным суперкомпьютером с ходами.
Сервер PC Server или сервер RISC и стандартное сетевое устройство, составляющее кластерную систему, снижены крупномасштабным производством, низкими ценами, с самым высоким соотношением производительности / цен. Если общая производительность увеличивается с увеличением узла, соотношение производительности / цена системы находится рядом с сервером ПК. Следовательно, эта слабо связанная структура имеет лучшую производительность / соотношение цены.
Масштабируемость
Количество узлов в кластерной системе может расти до тысяч или даже 10000, что намного больше, чем один суперкомпьютер.
Когда давление нагрузки на сервере растет, система может расширяться для удовлетворения спроса и не уменьшать качество обслуживания.
Высокая доступность
Существует избыточность на аппаратном и программном обеспечении, и маска неисправности предоставляется узлом выживания, а высокая доступность может быть достигнута путем обнаружения неисправности оборудования и программного обеспечения. Даже если некоторые аппаратные и программные программы не удаются, служба всей системы должна быть 7 * 24 часа. Когда модуль найден, сервис, указанный на этом модуле, мигрируется в другие модули. Эта миграция немедленная, автоматическая.
Физические кластеры
Проекты, для работы которых недостаточно мощности кластеров на виртуальных машинах, должны работать на физических серверах. Как правило это интернет-ресурсы с дневной нагрузкой, превышающей 50 000 человек. Конструктивно этот вариант ничем не отличается от создания кластера на виртуальных ПК. Единственное отличие в том, что вместо виртуальных машин эксплуатируются независимые физические серверы нужной мощности.
Геокластер – это максимально надежная структура, в которой каждый узел кластера оборудован отдельным доступом во Всемирную Сеть. Такой результат достигается размещением узлов в разных центрах обработки данных вместо их размещения в едином ЦОД, выход которого из строя вызовет отключение целого кластера.