Vlastní AI aplikace versus SaaS off-the-shelf: kdy se vyplatí stavět.

25.3.20267 min readJiří Domjen

CTO a produktoví ředitelé se nás v posledním roce čím dál častěji ptají, jestli má smysl AI aplikaci stavět vlastní, nebo si koupit SaaS řešení. Odpověď není ideologická — záleží na třech konkrétních kritériích a na tom, kolik si TCO za tři roky reálně dotáhnete dovnitř. Tento článek je shrnutí toho, co u klientů funguje, a kde jsme my sami klientovi doporučili nestavět.

Tři kritéria, podle kterých se rozhodujeme pro custom build.

Než klientovi doporučíme stavět vlastní AI aplikaci, projdeme s ním tři kritéria. Pokud aspoň dvě z nich nejsou splněná, vlastní vývoj nedává ekonomický smysl a doporučujeme SaaS — případně SaaS plus jednoduchá integrační vrstva.

První kritérium: jazyková nebo doménová specifičnost. Pokud váš proces pracuje s českým jazykem ve specifické oblasti (zdravotnictví, právo, účetnictví, výroba), generický SaaS dosahuje znatelně horších výsledků než fine-tunovaný custom model.

Druhé kritérium: vlastní data jako konkurenční výhoda. Pokud máte unikátní datovou sadu (historické zakázky, pacientské záznamy, výrobní data), kterou SaaS dodavatel nemá k dispozici, custom build vám umožní tuto výhodu monetizovat. SaaS by ji vyžadoval předat vendorovi.

Třetí kritérium: vendor lock-in a regulatorní požadavky. Pokud potřebujete on-premise deployment, ISO 27001 audit trail, nebo nemůžete data odesílat ven z EU, custom build je často jediná cesta. SaaS je v těchto kritériích typicky kompromisní.

Kritérium 1 — jazyková a doménová specifičnost.

Generické LLM (GPT-4, Claude, Gemini) v češtině pracují solidně, ale doménově specifické úlohy v češtině typicky řeší o 10 až 18 procentních bodů hůř než v angličtině. Pro support chatbot v generálním kontextu to nevadí. Pro klasifikaci právních dokumentů nebo zdravotnické záznamy vadí.

U projektu pro GreenEnergy — sustainable energy provider s 10 000+ zákazníky — bylo právě tohle hlavním důvodem custom buildu. Klient zkoušel komerční SaaS chatbot, který zvládl 41 % standardních dotazů s mírou hallucinací neudržitelnou pro regulovaný sektor (faktury, smlouvy). Po nasazení vlastního NLP s Transformers a fine-tuningem na češtinu jsme dosáhli 68 % automatizace dotazů s podstatně lepší konzistencí. Reakce ze 24 hodin na 5 minut, úspora 20 hodin týdně pro 5člennou support team.

Pro účetní kancelář v Brně — fine-tuning na české účetní legislativě byl rovněž kritický. RAG postavený na pgvector s ABRA a Pohoda integrací zvládá specifické dotazy klientů (jaký účet, jaká DPH sazba, kdy podat) výrazně lépe než generický asistent. Tady custom build dával smysl ne kvůli akademické přesnosti, ale kvůli tomu, že generický model nedokáže odpovědět na otázky, které vyžadují aktuální českou legislativu z roku 2024 nebo 2025.

Kritérium 2 — vlastní data jako konkurenční výhoda.

Druhý důvod pro custom build je situace, kdy máte unikátní datovou sadu, která vám dává konkurenční výhodu. Předat ji SaaS dodavateli znamená vzdát se této výhody nebo zaplatit za to enterprise licenci.

Pro klienta z automotive sektoru (pod NDA) jsme od roku 2021 stavěli platformu, která zpracovává 35 milionů+ inzerátů měsíčně z českého a evropského trhu ojetých vozů. Stack: Java, Elasticsearch, React, Docker, Nginx. Reakce na nové nabídky během minut, prediktivní modely na historických datech, detailní equipment breakdown.

Klíčová věc — historická data klienta o tržních cenách za posledních pět let jsou jeho aktivum. Předat je SaaS vendorovi (i kdyby existoval) by znamenalo, že vendor je může nabízet konkurenci. Custom build s vlastní infrastrukturou je tady jediná rozumná cesta.

Stejná logika platí pro výrobní firmy s historickými daty o zakázkách. U středočeské kovovýroby (~80 zaměstnanců) jsme v rámci OP TAK projektu stavěli ERP s automatickými zakázkovými listy postavenými na klientových historických zakázkách. Vlastnictví modelu i dat zůstává klientovi.

Kritérium 3 — vendor lock-in a regulatorní požadavky.

Třetí důvod je nejvíc viditelný u klientů, kteří pracují s regulovanými daty — zdravotnictví, finanční služby, státní správa. SaaS dodavatelé pracují s public cloud (AWS, Azure US-region, Google Cloud) a často data zpracovávají mimo EU. To je pro řadu českých firem nepřijatelné.

Druhý aspekt je vendor lock-in samotný. Když si SaaS přizpůsobíte na míru přes konfiguraci, prompt engineering a interní integrace, je velmi těžké odejít. SaaS dodavatel zvyšuje ceny, mění SLA, nebo prostě skončí — a vy máte za sebou roky investice do něčeho, co nepřevedete.

Custom build s open-source základem (Llama, Mistral, vlastní fine-tuning, vlastní RAG infrastrukturu) tenhle lock-in eliminuje. TCO je vyšší, ale dlouhodobá flexibilita je úplně jiná. Pro produkty s pětiletým a delším horizontem se rozdíl typicky vyplatí — pro jednorázové iniciativy ne.

U pre-Series A SaaS startupu, kde jsme dělali audit a převzetí AI komponent, byl tohle jeden z aspektů, který investor v due diligence zkoumal. Aplikace měla 14 medium a 3 high zranitelností, ale strategicky stejně závažný nález byl, že 100 % AI funkcionality stálo na OpenAI API bez fallbacku. To investor nechtěl. Refactor obsahoval mimo jiné abstrakci AI vrstvy a možnost přepnutí na vlastní fine-tunovaný model.

Realistické TCO custom AI aplikace za tři roky.

Custom AI aplikace má jiný cost shape než SaaS. SaaS má nízký vstup a vysoký long-tail, custom má vysoký vstup a nízký long-tail. Pro tříletý horizont se zlomová hranice obvykle pohybuje kolem objemu, který si jako klient neplánujete přiznat.

Realistická kalkulace pro střední custom AI aplikaci v naší cenovce: - Audit a roadmapa: 200 až 450 tisíc Kč - Pilot (1 use-case, 8 až 12 týdnů): 600 tisíc až 1,4 milionu Kč - První produkční verze (3 až 5 měsíců): 1,2 až 2,8 milionu Kč - Provoz a monitoring: 12 až 35 tisíc Kč měsíčně - Retraining a iterace: 3 až 6 dnů kvartálně, ~80 až 200 tisíc Kč ročně

Celkem za 3 roky: 2,8 až 5,8 milionu Kč podle komplexity.

SaaS srovnání pro stejný use-case: 25 až 60 tisíc Kč měsíčně + integrační projekt 200 až 600 tisíc Kč jednorázově. Celkem za 3 roky: 1,1 až 2,8 milionu Kč.

Custom build vychází dráž. Hodnota custom buildu je v jazykové specifičnosti, datovém vlastnictví a flexibilitě. Pokud žádné z těch tří kritérií nepotřebujete, SaaS je správná volba.

Proč 87 až 94 % accuracy je pro produkci dostatečné.

Poslední věc, kterou klientům na začátku projektu vysvětlujeme — co je realistická accuracy pro produkční AI aplikaci. Marketingové materiály často operují s 99 a víc procenty, což pro reálnou produkci v doménově specifickém kontextu nesedí.

U účetní kanceláře dosahuje OCR + klasifikace 89 % accuracy na hlavních kategoriích a 76 % na okrajových. U GreenEnergy chatbot zvládá 91 % top-15 kategorií dotazů. U automotive klienta predikce cenového rozpětí dosahuje 87 % správnosti v intervalu +/- 8 %.

To jsou produkční čísla, která fungují, protože AI nenahrazuje člověka úplně — snižuje jeho zátěž a posílá nestandardní případy do review fronty. Cíl není 100 % accuracy. Cíl je takové accuracy, aby čas ušetřený automatizací výrazně převyšoval čas strávený opravami chyb.

Pokud zvažujete, jestli pro vaši aplikaci stavět custom AI nebo zvolit SaaS, ozvěte se. Úvodní konzultaci s rozhodovacím rámcem a kalkulací TCO za 3 roky děláme zdarma a do dvou týdnů dodáme písemné srovnání obou variant pro váš konkrétní use-case.

Zjistěte, jak rozhodnout mezi custom AI a SaaS.

Vše pod NDA. Odpovíme do 4 hodin. Vaše data zpracováváme dle ISO 27001 a GDPR.

NEZÁVAZNÁ KONZULTACE

Získejte návrh AI architektury pro vaši firmu.

Získejte úvodní AI analýzu v rozsahu až 5 MD zcela zdarma. Zmapujeme vaše procesy a navrhneme řešení s jasným ROI.

ODPOVÍDÁME DO 4 PRACOVNÍCH HODIN

Formuláře nejsou pro vás? Kontaktujte nás napřímo.

NÁŠ EMAIL

info@etyka.cz

NÁŠ TELEFON

+420 777 720 777

CTO

Jiří Domjen

Rád s vámi proberu technickou stránku vašeho projektu. Zhodnotíme možnosti API integrace na vaše stávající systémy a navrhneme architekturu pro vaši novou webovou aplikaci.