Rambler's Top100
 
 
Статьи
19 февраля 2015

Аутсорсинг эксплуатации ЦОДа: нестрашно и полезно

Российский рынок сервисов обслуживания и эксплуатации оборудования дата-центров только начинает развиваться, но вывод на аутсорсинг хотя бы части работ по эксплуатации инфраструктуры ЦОДа -- это общемировой тренд.  

Нужно только грамотно построить службу эксплуатации дата-центра, считает Леонид ШИШЛОВ, руководитель направления сервисов для ЦОДов компании Schneider Electric. Леонид ШИШЛОВ, Schneider Electric

-- Насколько актуальна сейчас передача эксплуатации ЦОДа на аутсорсинг? Сформировался ли в России рынок аутсорсинговых услуг по эксплуатации инфраструктуры дата-центров

-- За последние пять-семь лет в России научились строить качественные ЦОДы, в том числе крупные, но еще не успели получить достаточного опыта эксплуатации этих объектов. В США, Западной Европе и в развитых странах азиатского региона аутсорсинг эксплуатации дата-центров популярен уже несколько лет. Там отдают свои службы эксплуатации на аутсорсинг даже большие компании, которые, казалось бы, в состоянии всё делать самостоятельно. В России же рынок таких услуг сейчас только формируется. У нас еще фактически нет серьезных компаний, которые целенаправленно занимались бы предоставлением услуг эксплуатации инфраструктуры ЦОДов, и владельцы дата-центров в силу различных причин предпочитают иметь свою службу эксплуатации. Но с течением времени, с развитием индустрии таких сервисов, с появлением компаний, готовых оказывать такие услуги и уже набравших соответствующий опыт, и вообще с увеличением зрелости этого рынка неизбежно появится необходимость в аутсорсинге. Кроме того, должно сформироваться понимание у самих владельцев дата-центров, что не всё надо делать самим.

-- Каков сейчас в России спрос на сервисы эксплуатации дата-центров? Востребованы ли услуги аудита службы эксплуатации?

-- Пока некоторые российские заказчики не понимают (или как минимум -- недопонимают), для чего такие сервисы нужны и чем отличается эксплуатация ЦОДа от эксплуатации бизнес-центра. Это происходит просто в силу слабого развития рынка таких сервисов. Но рынок надо формировать, в том числе и путем обучения участников рынка. Некоторые подвижки в этом направлении уже видны. Всё то же самое можно сказать и об услугах аудита службы эксплуатации: спрос постепенно формируется.

-- Серьезные коммерческие и корпоративные дата-центры обычно имеют свою службу эксплуатации. На каких тогда заказчиков ориентированы предложения аутсорсинга обслуживания оборудования ЦОДов?

-- Рано или поздно даже крупные коммерческие ЦОДы, специализирующиеся на colocation, начинают думать об аутсорсинге эксплуатации пусть не всего оборудования, а какой-то его части, потому что аутсорсинг стал уже неотъемлемым элементом современного бизнеса. Вопрос, отдавать или не отдавать на аутсорсинг, уже не стоит. Ни одна даже очень крупная серьезная компания не может заниматься всем. Проблема состоит только в том, чтобы правильно выбрать оборудование, обслуживанием которого займутся сторонние профессионалы, и компанию-аутсорсера.

-- Как и почему компании приходят к пониманию того, что эксплуатацию дата-центра нужно отдать на аутсорсинг?

-- Этому есть несколько разных причин. Первая: собственная служба эксплуатации не справляется со своими функциями и подтверждением этого являются разного рода аварии и инциденты. После анализа ситуации делается вывод о том, что в службе эксплуатации, допустим, недостаточно людей или квалификация ее специалистов невысока или организационная структура службы эксплуатации неправильно выстроена и т.д. и т.п. Вторая причина: компания понимает, что собственная служба эксплуатации обходится дороже, чем услуги сторонних специализированных организаций (это одна из главных причин, почему вообще какие-либо функции компании отдают на аутсорсинг). Возможна также комбинация первой и второй причин. Кроме того, хотелось бы отметить, что сейчас при строительстве серьезного дата-центра еще на этапе проектирования оператор будущего ЦОДа задумывается об организации службы эксплуатации -- как она будет формироваться, чем будет заниматься собственный персонал, что будет отдано на аутсорсинг и т.п. Это стало уже правилом хорошего тона, что можно только приветствовать.

-- Обслуживание каких систем большинство клиентов уже сейчас готовы отдать на аутсорсинг?

-- Общего правила здесь нет. У нас есть заказчики, которые полностью отдают на аутсорсинг все работы по эксплуатации, начиная от обслуживания систем охлаждения, систем распределения питания, систем пожарной безопасности и заканчивая чуть ли не физической установкой серверов в стойки. Некоторые компании частично выводят на аутсорсинг обслуживание того оборудования, на которое у них не хватает ресурсов. Например, один из наших заказчиков привлек Schneider Electric для эксплуатации только системы охлаждения (но она действительно весьма внушительная -- несколько сотен кондиционеров). В общем, всё очень индивидуально.

-- Кому лучше всего доверить эксплуатацию оборудования? Поставщику, производителю, интегратору?

-- Эксплуатацию оборудования ЦОДа нужно отдавать на аутсорсинг, прежде всего, профессионалам, т.е. тем, кто умеет работать с этим оборудованием. И, кстати, производитель отдельных инженерных систем дата-центра не всегда является лучшей кандидатурой для этого. Производитель отлично знает, как работают его узлы и агрегаты, но дата-центр -- это, как правило, достаточно сложная массивная структура, состоящая из большого количества различных компонентов и систем от разных производителей, которые увязаны вместе проектировщиками и интеграторами. Знания особенностей работы отдельных элементов недостаточно для грамотной повседневной эксплуатации всей структуры со сложными взаимосвязями, и тем более с соблюдением тех высоких требований по отказоустойчивости (а теперь еще и по энергоэффективности), которые предъявляются к ЦОДам. Здесь нужен реальный многолетний опыт эксплуатации таких больших объектов. В этом плане актуален опыт наших зарубежных коллег из Schneider Electric, которые занимаются аутсорсингом эксплуатации уже порядка 15 лет.

-- Каковы типичные ошибки операторов дата-центров при организации службы эксплуатации?

-- Так как рынок аутсорсинга эксплуатации ЦОДов в России только формируется, то у владельцев дата-центров еще не созрело понимание того, что служба эксплуатации очень важна, что мало спроектировать, построить и запустить ЦОД -- нужно обеспечить его работу в течение 5--10--15 лет, а, может быть, и дольше. И для этого нужны не просто электрики и сантехники, которые могут заниматься обслуживанием обычных офисных зданий, а более квалифицированный персонал. Плюс к этому необходимы правильная организация работы и соответствующие ИТ-системы, помогающие службе эксплуатации в работе. Пока понимания важности всех этих аспектов нет и, соответственно, операторы дата-центров не вкладывают серьезных сумм в развитие службы эксплуатации. Есть еще одна типичная ошибка, которая, кстати, имеет место не только на российском рынке. К сожалению, представителей службы эксплуатации иногда очень поздно привлекают к процессу проектирования и строительства дата-центра. Специалисты, занимающиеся исключительно проектированием и строительством, зачастую могут иметь весьма отдаленное представление о том, как правильно эксплуатировать большой ЦОД, ведь они этим никогда в жизни не занимались. А в эксплуатации таких объектов достаточно много нюансов, и чем раньше эксплуатационщики будут подключены к проектированию или хотя бы к строительству дата-центра, тем лучше. Их многолетний опыт эксплуатации подобных объектов необходимо учитывать при строительстве нового ЦОДа. Однако случается, что служба эксплуатации появляется на объекте чуть ли не в последний день этапа запуска ЦОДа в эксплуатацию, т.е. она не присутствует ни при тестировании оборудования, ни при его приемке, а это чревато большими проблемами в дальнейшем.

-- Что можно посоветовать операторам дата-центров для оптимизации затрат на обслуживание оборудования ЦОДа?

-- Российские дата-центры все очень разные, и какие-то общие советы давать сложно. Отдавать все работы по эксплуатации на аутсорсинг одной компании далеко не всегда разумно и, наверное, выгоднее иметь несколько поставщиков сервисных услуг, специализирующихся на разных системах. В крупных российских ЦОДах обычно так и происходит: одна компания занимается обслуживанием электрической инфраструктуры, другая -- обслуживанием систем охлаждения, третья -- генераторов и т.д. Можно добиться какой-то минимизации издержек, балансируя между разными поставщиками сервисных услуг, организуя каждый год тендеры на обслуживание и следя за тем, чтобы их участники закладывали минимальную маржинальность своих сервисов. Многие компании именно так и строят свою работу с аутсорсерами. Однако, если это серьезная динамично развивающаяся компания, имеющая достаточно приличный ЦОД или даже несколько дата-центров, то для нее заниматься такой, скажем, мышиной возней иной раз бывает накладно. В подобной ситуации бывает значительно выгоднее (особенно в долгосрочной перспективе), иметь одного поставщика всех сервисных работ. А практика организации ежегодных тендеров в погоне за минимальной ценой может оказаться просто пагубной для системы эксплуатации дата-центра. На самом деле год -- это минимальный срок для того, чтобы выстроить эффективную систему эксплуатации на большом объекте. Аутсорсинговая компания, пришедшая на объект заказчика, в течение первого года успевает только найти грамотных специалистов, обучить их, выстроить все процессы, процедуры и регламенты и лишь начать работы по снижению эксплуатационных расходов. И тут устраивается новый тендер, какая-то новая компания предлагает чуть меньшую цену, происходит смена аутсорсера и вся история начинается сначала. В итоге система эксплуатации постоянно пребывает во временном переходном состоянии. В деле эксплуатации объекта заказчику в своих же интересах следует строить долгосрочные отношения с аутсорсинговой компанией. Да, в первый год в эксплуатации будут проблемы, но они будут с любой сервисной компанией. Зато на второй год количество проблем и инцидентов сократится, а на третий год их практически не останется. А если каждый год менять эксплуатирующую организацию, то избавиться от проблем с эксплуатацией не удастся никогда. Так что тендеры нужно устраивать хотя бы раз в три года.

-- Как должна быть организована работа аутсорсинговой команды по эксплуатации?

-- Всё зависит от нужд и потребностей заказчика, т.е. от требуемого времени отклика на ту или иную проблему. Если критичность того бизнеса, функционирование которого обеспечивает данный ЦОД, обусловливает работу людей на объекте в режиме 24 х 7, то должно быть организовано круглосуточное присутствие дежурной смены. Если критичность бизнеса не столь высока, то выбирается режим 12 х 7 (дежурная смена находится на объекте по 12 часов 7 дней в неделю) или 8 х 5 (8 часов в будни), а в остальное время организуется дистанционный мониторинг с вызовом аварийной бригады и определяются временные нормативы ее прибытия на объект. В реальной жизни бывают и маленькие ЦОДы с круглосуточной дежурной сменой, и огромные дата-центры на тысячи стоек, где эксплуатационщики присутствуют только днем с понедельника по пятницу, а в остальное время работает система дистанционного мониторинга и оповещения.

-- Какова роль SLA в организации обслуживания и эксплуатации оборудования ЦОДа?

-- Стоит отметить, что сейчас практически все трактуют соглашение об уровне обслуживания SLA в терминах времени восстановления того или иного узла и агрегата. Причем это является фактически единственным и главным критерием, характеризующим работу службы эксплуатации. Но, на мой взгляд, SLA должно характеризовать некий минимальный уровень сервиса. Грубо говоря, если SLA выполнено, то можно поставить оценку «удовлетворительно», а если нарушено, то «неудовлетворительно». Однако в данном случае продуктивнее ввести хотя бы 5-балльную шкалу. В западных дата-центрах более распространены ключевые показатели эффективности (KPI) всей системы эксплуатации. В этом случае такие показатели, как время безаварийной работы и время восстановления, являются лишь частью большого набора дополнительных показателей, важных для организации эксплуатации ЦОДа. В частности, там учитываются, например, количество своевременно и грамотно выполненных технических работ по обслуживанию различных систем, регулярная отчетность, экономия средств за счет более грамотной эксплуатации и, соответственно, снижение затрат на закупки комплектующих или расходных материалов. По таким параметрам можно судить не только о выполнении SLA, но и о качестве всей системы эксплуатации. На этой основе можно даже выстроить модель поощрения для обслуживающей организации, чтобы у последней был стимул повышения качества эксплуатации и создания системы непрерывного совершенствования. Очень надеюсь, что такая практика получит распространение и на российском рынке.

Поделиться:
Заметили неточность или опечатку в тексте? Выделите её мышкой и нажмите: Ctrl + Enter. Спасибо!