Sľúbili sme vám, že vás budeme pravidelne informovať o jednotlivých krokoch, ktoré vedú k zlepšovaniu kvality služieb. Dnes vám prinášame ďalší blogpost o tom, ako pokračujú práce na zlepšovaní dostupnosti hostingových služieb.
1. Nový dizajn siete
Prvou dôležitou zmenou bola zmena topológie internej siete. Do januára fungovala naša sieť na dizajne, ktorý vznikol v čase, keď mal WebSupport len niekoľko desiatok serverov. Rozhodli sme sa s naším partnerom prerobiť sieť tak, aby bola prispôsobená na nárast dátových prenosov a bola výrazne odolnejšia voči prípadným problémom.
Pôvodný stav spočíval v tom, že naša sieť bola zapojená z jednotlivých switchov, ktoré medzi sebou boli prepojené iba dátovými linkami a vytvárali tak viacero kruhov. Pri zmene v sieti sa prerátaval pomocou mSTP, (multiple spanning tree protocol) čo pri takmer 400 fyzických zariadeniach v sieti už zďaleka nie je ideálne.
Počas prerábky siete sme všetky „toprack switche“ zapojili do stacku a hlavné switche sme prepojili pomocou VSS. Tým sa odstránili kruhy zo siete, zvýšila sa odolnosť voči výpadku jednotlivých switchov a umožnilo nám to využívať active-active zapojenie serverov (LACP).
Najväčšou novinkou bolo zakúpenie štyroch switchov Dell S4840, čo sú 48x 10GE a 6x 40GE open networking switche. Tie nám umožnujú v hlavnom dátovom centre postupne rozdeliť funkciu core a agregačných switchov na 2 vrstvy a výrazne zrýchliť dátové prenosy v rámci internej siete. V sekundárnom dátovom centre slúžia nové Dell switche ako hlavné switche pre prepojenie dvoch dátových centier a rackov. Hlavným dôvodom pre výber týchto switchov bola možnost neskoršej výmeny systému za opensource – open networking systém, a tým ich plne integrovať do OpenStacku.
„Put your switch on stôl!“ 4 kusy nových Dell S4840-ON (6x40gbit/s a 48x10gbit/s porty) sú nachystané 🙂 #hwporn pic.twitter.com/XzJEBkagAu
— WebSupport.sk (@websupport_sk) 26. ledna 2016
Postupne ešte nahrádzame staršie Cisco switche za nové Dell top rack switche a pridávame manažment switchov a to tak, aby všetky racky mali jednotný dizajn – 2 top rack switche v stacku s 10GE uplinkom a jedným manažment switchom.
2. Nová interná infraštruktúra
Ďalšou novinkou bolo uvedenie našej novej internej infraštruktúry do prevádzky. Cieľom bolo vytvoriť nezávislú platformu pre prevádzku interných nástrojov, databáz a podporných služieb. Dnes z nej napríklad už beží hlavná WebSupport databáza, vďaka ktorej môžete jednoducho spravovať svoje služby cez WebAdmin.
Platforma je hardvérovo postavená na Dell FX2 FC630 serveroch, každý s 6x 400GB SSD, 256 GB RAM a 2x 10 jadrovými CPU. Servery sú medzi sebou prepojené internou 2x 10GE sieťou a rovnako sú tak pripojené aj do ostatnej infraštuktúry. Na ukladanie dát služí distribuovaný súborový systém GlusterFS, nad ktorým bežia virtuálne servery spravované OpenStackom.
Ďaľším krokom s prechodom na nový admin a novú internú infraštruktúru bude presťahovanie služieb pod Docker a manažment kubernetis, čím zabezpečíme ich vysokú dostupnosť a jednoduché nasadzovanie nových verzií od našich vývojárov.
Ďakujeme, že sledujete náš nový technologický kanál @websupport_tech
— WebSupport Tech (@websupport_tech) 2. května 2016
3. Viac miesta pre zálohy
Keďže miesta pre zálohy nie je nikdy dosť, v posledných mesiacoch sa naše miesto rozrástlo o dva servery so sumárnou použiteľnou kapacitou 195 TB. Servery sú na platforme Supermicro X10 s 36x 3TB, s diskami zapojenými po 6-ticiach v RAIDz2 (obdoba RAID6). Tým je vytvorené dostatočne redundatné, ale aj rýchle úložisko pre zálohy. Ako súborový systém používame overený ZFS, ktorý nám umožnuje jednoducho prenášať snapshoty medzi produkčnými servermi a backupmi a zväčšovať úložný priestor pomocou vstavanej kompresie.
Okrem nových backup serverov sme prerobili pripojenie všetkých, už existujúcich backup serverov na spomínané active-active 2x10GE pripojenie. Vďaka tomu vieme dáta nielen rýchlo zálohovať, ale aj rýchlo obnoviť v prípade potreby.
4. Nové riešenie mailových serverov
Naše staré diskové pole NetApp dlhodobo nie je schopné poskytovať potrebný výkon na rýchle načítanie e-mailov. Rozhodli sme sa e-maily presúvať na nové riešenie. Nové riešenie je postavené na samostatných serveroch, ktoré sú postavené na mixe HDD a SSD, kde SSD slúžia ako cache. Rozhodli sme sa pre konfiguráciu, ktorá obsahuje 256 GB RAM, 2x200GB SSD a 8x1TB HDD v RAIDz2 (obdoba RAID6) v podobe 1U serverov. Ako už názov použitého raidu vypovedá, znova sme nasadali súborový systém ZFS. Tým je zabezpečená bezpečnosť dát, ale hlavne veľmi rýchle odozvy, nakoľko iba minimum dotazov ide z rotačných diskov a viac ako 98% požiadaviek ide z RAM.
Servery sú pripojené 2×10 GE v active-active móde, čo nám umožnuje ich pravidelné zálohovanie vo veľmi krátkych intervaloch pre prípad fatálnej poruchy servera.
Postupne na takéto e-mail servery migrujeme všetky e-mailové kontá.
5. Nové verzie MySQL a MariaDB
Ku koncu roka sme premigrovali všetky databázy na samostatné SSD servery do kontajnerov, spravované OpenStackom. Vďaka tomu sa výrazne zlepšila odozva databázových serverov a nám umožnila ich jednoduchý manažment.
Juch. Toto sú 4 nové servery a ich miery sú: 10x200gb SSD + 2×6 jadro CPU a 128gb RAM #hwporn #websupport #hw pic.twitter.com/ztfsOTKrKr
— WebSupport Tech (@websupport_tech) 18. února 2016
Vo februári sme pridali už dlho očakávané nové verzie a to MySQL 5.7 a MariaDB 10.1, dostupné na klik cez WebAdmin. V kombinácií s najnovším PHP 7 umožnujú veľmi rýchlu prevádzku webových aplikácií. Treba mať však na pamäti, že nové verzie so sebou prinášajú aj zmeny, preto si treba overiť funkčnosť konkrétneho CMS pred nasadením do ostrej prevádzky.
[mc4wp_form]
4 odpovede na “5 noviniek, ktoré zlepšujú dostupnosť služieb”
toms , ako ta poznam, tak si to aj riadne tie zmeny uzivas 🙂 a inak good job!
Zverejnite aj ciselne (rychlost, vypadky) porovnanie stareho a noveho riesenia? Bude aj nova verzie PostgreSQL?
Cisla sme zverejnili v blogu, ked nove DB riesenie zacinalo – https://www.websupport.sk/blog/2015/12/inovovali-sme-databazove-servery/ . Vypadky musim pozriet podla typov a porovnat so statistikami, co si pamatam, tak je dostupnost o ~jeden rad lepsie. Vacsina vypadkov je od zmeny kvoli bugu v MySQL, zial tam pri starsich verziach uz nie su updatey.
Co sa tyka PostgreSQL, ano, chystame aj pre tento typ novu verziu.
Hlavným dôvodom pre výber týchto switchov bola možnost neskoršej výmeny systému za opensource – open networking systém, a tým ich plne integrovať do OpenStacku.
Co znamena plna integracia s openstackom ? Co je open networking system ?