Azure Stack nabízí základní telemetrii na úrovni hostitele, ale ten je vhodné doplnit pokročilým monitoringem z velkého Azure. Azure Stack a jeho monitoring z Azure Monitor je tak vlastně jednou z nejčastějších ukázek skutečné hybridního přístupu. Pro hostování svého IaaS si přinesu vlastnosti cloudu k sobě ve formě Azure Stack a současně využijí masivních clusterů, strojového učení a pokročilé funkce velkého cloudu pro přidání monitoringu.
Pojďme se na to dnes podívat.
První krok je v Azure založit log analytics workspace a opsat si jeho ID a klíč.
V Azure Stack administrátorském portálu si do katalogu stáhněte Extension pro automatické napojení VM do Azure Monitor.
Při vytváření VM v tenant portálu Azure Stack zvolte přidání Extension. Tam si vybereme Azure Monitor a vyplníme údaje pro připojení (ID a klíč v Azure) a také nainstalujeme Dependency agenta (tam se nic nekonfiguruje, ale ten pro Azure Monitor zajištuje síťový monitoring například pro servisní mapu).
Vrátíme se do Azure a vytvoříme Automation account. Projděte pak sekce Inventory, Change Tracking a Update management a propojte Automation a log analytics workspace. Pak ještě zapněte, že do těchto řešení chcete automaticky naboardovat všechna VM, která se do tohoto log analytics workspace napojí.
Podrobnější návod je tady: (https://docs.microsoft.com/en-us/azure-stack/user/vm-update-management)[https://docs.microsoft.com/en-us/azure-stack/user/vm-update-management]
Teď ještě vybereme co chceme logovat a sbírat.
Telemetrije je systémem sbírána a jsou pro vás připraveny základní workbooky, které si můžete libovolně upravovat nebo vytvářet vlastní.
Připravena je podpora různých agregací od průměru přes percentily.
Vybírat můžete celou řadu čitačů.
Logy ze syslog a Events ve Windows, které jsme v konfiguraci zapnuli, shromažďujeme do databáze, ve které je vše indexované a dají se dělat různé hledání v reálném čase i pokročilé transformace. V tomto prostoru jsou jak všechny logy, tak telemetrické údaje a můžete na základě nich dělat výstupy, grafy či reagovat spuštěním různých alertů včetně integrace do ITSM nástrojů, push notifikací do mobilní aplikace Azure, email či komplexní workflow v Logic App (například zprávu do Teams, Slacku, Service Now apod.).
Jak jsme na tom s patchováním?
Pokud chcete, můžete aktualizace plánovat a řídit odtud a to jak pro Windows tak pro Linux.
V inventáři zjistíme kde co a v jakých verzích máme nainstalované.
Můžeme sledovat klíčové soubory a záznamy v registrech.
Zkoumat na jakých strojích jaké služby a Linux daemony máme spuštěné.
V sekci Change tracking pak tyto informace najdete s časovým kontextem, tedy kdy co se na kterém stroji změnilo, což se velmi hodí pro troubleshooting problémů a přehlednost.
Azure Monitor sbírá informace o síťovém provozu a jste tak schopni vizualizovat s kým si vaše jednotlivé VM v Azure Stack povídají, na jakých portech, s jakou odezvou a ztrátovostí a rozkreslit tuto mapu závislostí až na jednotlivé procesy v OS, které provoz generují.
Kromě této vizualizace si můžeme prohlédnout i připravené workbooky na další analýzu.
Tak například tady vidíme odchozí provoz a všimněte si, že řešení také koreluje údaje s reputační databází a dokáže identifikovat komunikaci na nevhodné systémy v Internetu, třeba Command and Control servery botnetů apod.
Pro identifikaci případných bezpečnostních problémů se mi může hodit report kam že to moje servery vlastně komunikují.
Selhávají nějaká spojení?
Nebo jak vypadal provoz v Azure Stacku nebo konkrétní VM včera vs. dnes?
Díky automation accountu můžeme ve strojích pravidelně spouštět PowerShell nebo Python skripty například pro nějaké rutinní úlohy (čištění disku, rotace logů) nebo instalace software. Také můžeme udržovat OS v přesně daném desired state s využitím PowerShell DSC, což funguje pro Windows, ale dá se použít i pro Linux. Pro naboardování VM v Azure Stack proveďte kroky popsané tady: https://docs.microsoft.com/en-us/azure/automation/automation-dsc-onboarding#physicalvirtual-windows-machines-on-premises-or-in-a-cloud-other-than-azureaws
Potřebujete na základě překročení normálu generovat nějaký Alert? V rámci Azure Monitor klikneme na Alerts a nastavíme si jeden třeba na CPU VM v našem Azure Stacku.
Velmi zajímavá možnost je kromě fixní hodnoty použít i strojové učení. Alert pak analýzou časových řad stanoví co je běžná zátěž a naučí se běžné patterny hodiny, dne či týdne a informovat vás bude v okamžiku, kdy je situace značně nestandardní.
Modrá vizualizace jsou skutečné hodnoty a to červené spočítané horní a dolní pásmo normálu. Alert dostanu v okamžiku, kdy se hodnota dostane mimo toto dynamicky stanovované pásmo.
Události můžete filtrovat, protože třeba za některých okolností nechcete, aby se alarm vyvolal - například v průběhu maintenance okna. Akce je definována jako Action group.
Můžete odeslat email, push notifikaci do Azure mobilní aplikace, integrovat ITSM nástroj, posílat webhook a všechny ostatní věci vyřešíte přes Azure automation (například možnost v serveru pustit skript) nebo Logic App workflow s připravenými konektory na Office365, Teams, Slack, Wordpress, PageDuty, Service Now a mnoho dalších řešení.
Azure Monitor je velmi silný nástroj pro pokročilý monitoring a analýzu a je to časté hybridní řešení, kdy on-premises svět (Hyper-V, VMware, Azure Stack) napojíte na Azure Monitor. Pro zákazníky využívající Azure Stack je ale integrace nejsilnější - onboarding je zjednodušení a získáváte úplně maximum.