Главная » 2017»Июнь»9 » Що таке UpTime? Чому 100% показник це міф, якою є реальність?
17:06
Що таке UpTime? Чому 100% показник це міф, якою є реальність?
Цей пост відкриває цикл статей на велику і неприємну тему, яка стосується всіх учасників веб-простору. Ми спробуємо розібратися в потенційних причини часткової і повної недоступності сайтів з поганим пінгом, навантаженнями, блокуваннями і т.д.
Що таке DDoS? Чому програмісти помиляються? Як застрахуватися?
Оповідання спробую вести зрозумілим для широкого кола користувачів мовою, щоб вивести на відверту і корисний діалог. Почнемо!
Одним з найважливіших показників комфорту життя веб-ресурсу є uptime. Фактично цей час безперервної роботи сайту. Найчастіше нам показують це значення у відсотках, тобто відношення часу штатної роботи сайту до загального (день, місяць, рік ...) проміжку часу. Майже всюди пишуть про 99%, 99.99% або навіть 99. (9)%. Однак ніхто не наважиться написати про 100%. Занадто велика кількість ймовірних чинників щомиті створює ризик "падіння" сайту. Починаючи з нетверезого екскаваторника, закінчуючи небесним світилом або світовим океаном.
Зупинюся на головному, щоб мета цього послання відразу була зрозуміла.
Нам дуже не хочеться, щоб якісь з наших ресурсів припиняли свою роботу навіть на кілька хвилин. Це зовсім не в наших інтересах. Ми заробляємо тільки тоді, коли все працює. Коли не працює - ми так само несемо збитки. Навіть якщо аккаунт платний, ми витрачаємо величезну кількість додаткових ресурсів і кидаємо всі сили на якнайшвидше вирішення проблеми. Ми витрачаємо реальні гроші на компенсації, ми втрачаємо колосальний нематеріальний бонус - лояльність своїх клієнтів. Саме в наших інтересах максимально швидке вирішення глобальної проблеми. У наших інтересах зробити так, щоб подібне не повторювалося надалі.
І, звичайно, це стосується не тільки нас, а абсолютно будь-якого веб-сервісу і хостинг-провайдера.
Кілька прикладів:
14 серпня 2003 року великий blackout: 40 млн. Жителів США і 10 млн. Жителів Канади проіснували без електрики протягом 30 хвилин;
25 травня 2005 р blackout в Москві: велика аварія в енергосистемі, в результаті якої на кілька годин була відключена подача електроенергії в кілька районів Москви;
11 серпень 2008 г., gmail: більш 100 000 000 постраждалих близько 2-х годин не могли скористатися поштовим сервісом Google, програмний збій;
1 квітня 2009 р uCoz: протягом 3-х діб після глобального оновлення системи сайти користувачів були недоступні різний час;
21 квітня 2011 р, amazon: неправильна настройка мережевого обладнання вивела з ладу хмарні сервіси, які використовують, наприклад, Netflix, Zynga, Foursquare, Quora і Reddit; простий в роботі - від 12-ти годин до 4-х діб;
6 березня 2011 р masterhost: найбільший російський хостинг-провайдер через проблеми в дата-центрі періодично "падав"; були недоступні різні сервіси, на різний час;
15 травня 2012 р beeline: через обрив на каналі більше 2-х годин були недоступні мобільний зв'язок і мобільний інтернет в 50 містах європейської частини Росії;
18-22 березня 2013 року, spamhaus: зафіксована найсильніша в історії DDoS-атака на сервіс Spamhaus; потужність атаки досягала 300 Gbit / s, що вплинуло і на роботу магістральних операторів зв'язку.
Прикладів безліч, кожен день тут або там щось виходить з ладу. Масштаби різні.
Упевнений, по кожному з наведених випадків можна написати книгу: які ресурси були витрачені на усунення неполадок, які правильні і неправильні рішення приймалися в авральному порядку, що було зроблено, щоб подібне не повторилося. Будь-який збій це випробування, яке в кінцевому підсумку, якщо не вбиває - робить сильнішими.
Так склалося, що мені подобається працювати з користувачами тісно. З кимось навіть трохи неформально, мало не по-дружньому. Все частіше помічаю, що ставлення до "падінь" все більш серйозне і грунтовне. Це не просто крики і лайка, це щире бажання зрозуміти причини, десь навіть посильно допомогти в рішенні. Це, безумовно, позитивна тенденція, і на нас вона накладає ще більшу відповідальність. Чим ми ближче, тим сильніше попит.