Od Excelu k datovému skladu: kdy si firma musí pořídit BI a co od něj očekávat.

28.1.20267 min readJiří Domjen

Většina českých SMB firem má dobré datové základy — fakturace v Pohodě nebo ABRA, sklad v ERP, web analytics v Google Analytics, mzdy v samostatném systému. Co chybí, je propojení a schopnost se na ten obraz dívat ne jednou za měsíc na poradě, ale denně. Tento článek shrnuje, kdy je čas přejít od Excelu k BI nástroji, kdy stavět vlastní datový sklad a kde se v BI projektech nejčastěji ztrácí čas i peníze.

Tři stage zralosti datové analytiky v SMB.

ZadejtV naší praxi vidíme tři typické stupně datové zralosti. Většina firem zůstává mezi prvním a druhým — a to je v pořádku, pokud k tomu mají dobré důvody. Stát se třetím stupněm dává smysl jen tehdy, když firmu reálně tlačí objem dat nebo požadavky na rychlost rozhodování.

Stage 1 — Excel a manuální exporty. Účetní jednou za měsíc exportuje data z Pohody, dolepí je do souboru s názvem „Reporting_FINAL_v3_skutecne.xlsx" a pošle vedení. Funguje to do firmy zhruba 30 až 50 zaměstnanců, dokud nemáte víc než dva systémy a méně než tři lidi, kteří potřebují čísla na denní bázi. Anti-pattern začíná, když má firma sedm Excelů, každý dělá někdo jiný a žádné dva nedávají stejné číslo.

Stage 2 — BI tool nad existujícími systémy. Power BI, Metabase nebo Looker Studio se přilepí na existující databáze a vytahuje data dotazy. Investice je řádově nižší (10 až 80 tisíc Kč na implementaci, plus licence), výsledkem je živý dashboard, který se aktualizuje hodinově nebo denně. Tato fáze pokrývá většinu české SMB.

Stage 3 — vlastní datový sklad nebo data lake. Sem firma dorůstá, když má buď velký objem dat (řádově desítky až stovky milionů záznamů), složité transformace přes víc systémů, nebo požadavek na real-time analytiku. U projektu pro klienta z automotive sektoru pod NDA jsme provozujeme platformu, která zpracovává 35 milionů inzerátů měsíčně přes Java, Elasticsearch a Docker — a real-time trend analytics tam dává smysl, protože reakční doba na nové nabídky se počítá v minutách, ne hodinách. text…

Kdy přejít z Excelu na BI tool a co se tím vyřeší.

Excel je úžasný nástroj, dokud nepřesáhne hranici, za kterou začíná škodit. Tu hranici poznáte podle čtyř příznaků.

Příznak první — víc než dva lidé exportují stejná data ze stejného systému, každý jinak. Účetní reportuje obrat z Pohody jednou metodikou, obchodní ředitel ho stahuje z CRM jinou a oba čísla se rozcházejí o 3 až 7 procent. To není chyba lidí, to je chyba systému.

Příznak druhý — měsíční reporting trvá víc než tři dny. Pokud první týden v měsíci jeden člověk čistí Excely místo toho, aby dělal svou práci, máte skrytý náklad, který se v ročním součtu vyšplhá na 200 až 400 tisíc Kč.

Příznak třetí — vedení dělá rozhodnutí o stavu firmy z dat starých dva týdny. To může být v pořádku pro strategii, ale ne pro operativu. Pokud sklad zjistí výpadek položky až na týdenní poradě, je pozdě.

Příznak čtvrtý — někdo chce zkombinovat data, která jsou ve dvou různých systémech, a v Excelu to znamená dvě hodiny VLOOKUP chyb. Tady už BI tool s pohodlným joinem ušetří týdně víc, než stojí licence.

U projektu pro středočeskou výrobní firmu jsme jako součást modernizace ERP nasadili Elasticsearch s reportingovou vrstvou postavenou na React. Před tím vedení mělo přehled o vozovém parku z papírových knížek a fleet/fuel monitoring v Excelu — po nasazení získalo živý přehled o 25 nákladních vozech ve třech lokacích. Klíčový posun nebyl ve vizualizaci, ale v tom, že data konečně sedla mezi sebou.

Kdy postavit vlastní datový sklad a kdy stačit s Power BI.

V naší praxi platí pravidlo: pokud existující BI tool nad existujícími databázemi pokryje 80 procent potřeb, datový sklad nestavíte. Datový sklad je drahý — implementace se pohybuje od 600 tisíc Kč nahoru, provoz pak řádově 15 až 40 tisíc Kč měsíčně podle objemu. To se nevyplatí firmě, která chce „prostě vidět tržby".

Datový sklad dává smysl ve čtyřech situacích. První — máte víc než pět zdrojových systémů a potřebujete je propojit konzistentní dimenzí (čas, zákazník, produkt). Druhá — chcete historii dat za víc let s konzistentní strukturou, i když se zdrojové systémy mění. Třetí — výkonnost reportingu nad produkční databází začíná zatěžovat aplikaci. Čtvrtá — máte real-time use-case (anti-fraud, market monitoring, IoT telemetry).

Mezi Power BI nad SQL databází a plnohodnotným data warehouse existuje rozumný mezistupeň: Azure SQL nebo PostgreSQL s denním ETL, které tahá data ze zdrojových systémů. Tento setup nasadíme za 6 až 10 týdnů. Plný warehouse se Snowflake, BigQuery nebo Redshift je pro českou SMB obvykle over-engineering.

U platformy pro NEAR Foundation jsme řešili podobný problém v jiném kontextu — DAO governance generuje data o hlasování členů a alokaci fondů. Pro analytiku stačila kombinace Node.js, React a struktur na NEAR blockchainu. Ne vždy je odpovědí klasický datový sklad.

Anti-pattern dashboardu, který nikdo nepoužívá.

Z naší praxe odhadem 30 až 40 procent BI projektů v SMB skončí v takzvaném dashboard cemetery — krásně vypadající dashboard, který se po prvních dvou týdnech přestane otevírat. Důvody jsou opakující se a je dobré je znát předem.

Důvod první — dashboard byl postavený na to, co je technicky možné, ne na to, co někdo reálně potřebuje k rozhodnutí. Dvanáct grafů na jedné stránce vypadá impresivně v prezentaci dodavateli, ale ráno před poradou nikdo nemá energii to číst.

Důvod druhý — chybí konkrétní owner. Pokud dashboard nepatří jednomu člověku, který ho denně sleduje a podle něj jedná, časem se rozpadne. Data se začnou rozcházet, někdo nahlásí chybu, nikdo ji neopraví, dashboard ztratí důvěryhodnost.

Důvod třetí — dashboard ukazuje historii, ale neříká, co s tím dělat. „Tržby v dubnu byly o 12 procent nižší" je informace. „Tržby v dubnu byly o 12 procent nižší kvůli poklesu konverzí na produktové stránce X — zde je odkaz na detail" je akce.

Důvod čtvrtý — data nesedí mezi sebou. Pokud se na dashboardu objeví jiné číslo než ve fakturačním systému, ztratíte důvěru za týden. Investice do datové kvality — duplicit, číselníků, validace — bývá větší než investice do vizualizace.

Realistický rozpočet a první kroky pro firmu před prvním BI projektem.

Pro firmu, která ještě BI nemá a chce začít, doporučujeme tříkrokový postup. Není to revoluce, ale funguje.

Krok první — discovery 5 až 10 MD. Zmapujeme zdrojové systémy, identifikujeme tři až pět klíčových otázek, na které vedení potřebuje denně odpověď, a navrhneme, jaký nástroj pokryje 80 procent potřeb. Tento krok se vyplatí udělat externě, protože interní lidé mají tendenci vidět limity systémů, které denně používají, jako přirozené.

Krok druhý — pilotní dashboard za 4 až 8 týdnů. Postavíme jeden dashboard na nejdůležitější otázku, propojený s 1 nebo 2 zdrojovými systémy, s denní aktualizací. Cílem je ukázat hodnotu ne na osmi grafech, ale na jednom rozhodnutí, které firma udělá jinak, než kdyby data neměla. Rozpočet typicky 80 až 180 tisíc Kč.

Krok třetí — postupné rozšiřování. Po pilotu se obvykle objeví další tři až pět užitečných pohledů. Přidávají se iterativně, dva týdny na pohled. Anti-pattern je „velký BI projekt na rok dopředu" — to bývá projekt, který se na konci zahodí.

Pokud zvažujete první BI projekt nebo migraci z Excelu na živý dashboard, ozvěte se nám — úvodní discovery v rozsahu do 5 MD děláme zdarma a do týdne dostanete mapu zdrojových systémů s realistickým odhadem prvního pilotu.

Zjistěte, jak bezpečně postavit datovou analytiku ve firmě.

Vše pod NDA. Odpovíme do 4 hodin. Vaše data zpracováváme dle ISO 27001 a GDPR.

NEZÁVAZNÁ KONZULTACE

Získejte návrh AI architektury pro vaši firmu.

Získejte úvodní AI analýzu v rozsahu až 5 MD zcela zdarma. Zmapujeme vaše procesy a navrhneme řešení s jasným ROI.

ODPOVÍDÁME DO 4 PRACOVNÍCH HODIN

Formuláře nejsou pro vás? Kontaktujte nás napřímo.

NÁŠ EMAIL

info@etyka.cz

NÁŠ TELEFON

+420 777 720 777

CTO

Jiří Domjen

Rád s vámi proberu technickou stránku vašeho projektu. Zhodnotíme možnosti API integrace na vaše stávající systémy a navrhneme architekturu pro vaši novou webovou aplikaci.