techone --service=cloud-management
Správa cloudu a infrastruktury
Měsíční profylaxe, monitoring, zálohy s testy obnovy. Převzetí existující infrastruktury nebo dlouhodobý provoz pro Azure, AWS i vlastní servery.
Výzvy, které řešíme
Kdy firmy řeší správu cloudu a infrastruktury
Žádný interní DevOps tým
Provozujete produkční systém, ale nemáte čas a lidi na 24/7 dohled, monitoring, zálohy a bezpečnostní záplaty. Krizové situace řešíte ad-hoc, někdy v noci.
Po cloud migraci chybí provoz
Aplikace běží v Azure nebo AWS, ale nikdo systematicky nesleduje výkon, náklady, expirace certifikátů ani úspěšnost záloh. Problém vyplave, až když systém selže.
Krize a hašení požárů
Něco padá, výpadky se opakují. Faktury za "akutní servis" rostou. Dokumentace je nekompletní, nikdo neví co se kde mění.
Naše řešení
Co pro vás děláme
Měsíční profylaxe
Pravidelná kontrola prostředí, bezpečnostní revize, aktualizace, zálohy s testy obnovy. Vždy s písemným reportem.
- Bezpečnostní záplaty operačního systému a aplikací
- Test obnovy ze záloh (ne jen že záloha běží)
- Revize konfigurace a certifikátů
- Měsíční report: co se dělalo, co přijde
Monitoring a alerty
Sledování výkonu, dostupnosti, error rate a nákladů. Alerty na incidenty dřív, než si jich všimne uživatel.
- Prometheus + Grafana dashboardy pro klíčové metriky
- Alerty na CPU, paměť, latence, error rate
- Sledování cloud nákladů a anomálií
- On-call response na kritické incidenty
Převzetí existující infrastruktury
Audit aktuálního prostředí, dokumentace, postupné převzetí provozu od původního dodavatele nebo interního týmu.
- Vstupní audit konfigurace a security
- Sepsání architektonické dokumentace a runbooks
- Plán postupného převzetí bez výpadku
- Přístupy a knowledge transfer
Disaster recovery a kontinuita
Plán obnovy po výpadku, otestovaná procedura, definované RTO/RPO. Aby v krizi nikdo neimprovizoval.
- Definice RTO a RPO podle kritičnosti aplikací
- Otestovaný recovery postup (ne jen dokument)
- Geograficky oddělené zálohy
- Pravidelné drill a aktualizace plánu
Profylaxe IT: prevence místo hašení požárů
Většina kritických výpadků je vidět týdny dopředu - chybějící index v databázi, zaplňující se disk, expirující certifikát, selhávající záloha. Pravidelná kontrola je zachytí v plánovaném okně, ne ve 2 ráno v pracovní den.
Měsíční profylaxe znamená, že se na vaše prostředí systematicky díváme - ne jen reagujeme na alerty. Bezpečnostní záplaty operačního systému, aktualizace databáze, kontrola záloh včetně testu obnovy, revize konfigurace. S písemným reportem co se dělalo, co přijde a co doporučujeme.
Detailní rozbor profylaxe a monitoringu najdete v průvodci správou cloudu a serveru.
Převzetí infrastruktury bez výpadku
Měníte dodavatele nebo přebíráte prostředí, které dlouho nikdo systematicky neudržoval? Nejde o jednorázový krok. Začneme auditem - co tam je, jaké jsou rizika, co je nedokumentované. Sepíšeme architektonickou dokumentaci a runbooks pro klíčové scénáře.
Pak postupné převzetí: přístupy, monitoring, operativa. Paralelně s původním dodavatelem, dokud nebude jasné, že máme pod kontrolou všechny aspekty. Typicky 4-8 týdnů na plné převzetí, bez výpadku produkce.
Po převzetí pokračujeme v měsíční profylaxi a monitoringu. Pokud potřebujete také rozvoj nebo nové projekty, propojíme to s projektovým týmem.
Po cloud migraci přichází provoz
Migrace do cloudu je projekt - přesun aplikací, dat, ladění výkonu. Po nasazení do produkce ale začíná druhá fáze: dlouhodobý provoz. Monitoring, costs optimization, security patches, disaster recovery - to nekončí dnem go-live.
Naší specialitou je propojení obou fází. Pokud jsme dělali migraci do cloudu, plynule přebíráme dlouhodobý provoz - se znalostí prostředí, dokumentací z migrace a kontextem co bylo proč. Tým, který to nasadil, to spravuje dál.
Reference: Helvetia běží na Azure 3+ roky napříč 7 zeměmi bez kritických výpadků. Pravidelná profylaxe, monitoring, postupné optimalizace nákladů.
Žádný black box
Dodavatelé správy IT často fungují jako black box - klient platí měsíční poplatek a nemá tušení co se reálně děje. Něco se rozbije, někdo opraví, nikdo nepíše proč.
U nás každá změna má záznam. Měsíční report obsahuje co se dělalo, proč, co přijde a co doporučujeme. Klient vidí changelog, alerty, konfiguraci. Pokud se my zítra rozhodneme zmizet, máte kompletní dokumentaci, runbooks a přístupy - všechno potřebné aby si systém převzal kdokoliv jiný.
Tohle je jeden z důvodů, proč naši klienti zůstávají roky. Není to vendor lock-in, je to viditelná hodnota.
Jak pracujeme
Nejdřív pochopíme vaše procesy. Pak navrhneme postup.
Vstupní audit
Projdeme vaše prostředí, sepíšeme co tam je, jaké jsou rizika a co doporučujeme. Výstupem je písemný report.
Setup monitoringu a procesů
Nastavíme dashboardy, alerty, frekvenci profylaxe, runbooks. Domluvíme komunikační kanály a SLA.
Měsíční provoz
Pravidelná profylaxe, monitoring, on-call response. Měsíční report co se dělalo, co přijde, co doporučujeme.
Pravidelná revize
Čtvrtletně review trendů, optimalizace nákladů, plánování změn. Roční audit security a disaster recovery.
Případová studie
Helvetia: 3+ roky stabilního provozu na Azure
Helvetia
E-commerce3+ roky
Délka spolupráce
7
Země
Často kladené otázky
Co je rozdíl mezi vstupním auditem a měsíční profylaxí?
Audit je jednorázový průchod prostředí na začátku - zjistíme co tam je, kde jsou rizika, co opravit. Měsíční profylaxe je pravidelná údržba: aktualizace, zálohy s testy, revize konfigurace, monitoring. Audit je vstupenka, profylaxe je dlouhodobý vztah.
Jak funguje převzetí existující infrastruktury od jiného dodavatele?
Začneme auditem, sepíšeme architekturu a runbooks. Postupně přebíráme přístupy, monitoring a operativu. Bez výpadku, paralelně s původním dodavatelem. Typicky 4-8 týdnů na plné převzetí.
Pokrýváte i vlastní servery, nebo jen cloud?
Cloud (Azure, AWS), hybridní prostředí i on-premises. Detaily v průvodci správou cloudu a serveru.
Jak vypadá komunikace a reporting?
Měsíční písemný report co se dělalo, co přijde a co doporučujeme. Slack nebo Teams kanál pro běžnou komunikaci. Alerty z monitoringu jdou na jasně definovaný kanál. Při kritických incidentech jeden kontakt s on-call response.
Co když máme vlastní DevOps tým?
Můžeme být extension týmu - profylaxe na specifické oblasti, převzetí mimo pracovní dobu, audit na čerstvý pohled. Nebo plný outsourcing, pokud se interní tým posunul jinam. Nemusíte volit vše nebo nic.
Kolik to stojí?
Závisí na třech faktorech: velikost prostředí (počet serverů, databází, aplikací), rozsah reportu (co všechno chcete sledovat) a požadovaná doba reakce (business hours vs 24/7 SLA). Po vstupním auditu připravíme konkrétní nabídku.
Co s incidenty mimo SLA?
Záleží na zvolené úrovni. Profylaxe je business hours. 24/7 SLA má on-call response s definovaným časem. Při větší incidentech eskalujeme klientovi a postupujeme podle dohodnutého runbooks.
Probereme váš projekt? Ozveme se do 24 hodin.
Od analýzy po provoz. Helvetia 3+ roky, Lagardère a Tecam 2+ roky v provozu.
Nezávazná konzultace