Jeden z najčastejších dotazov, ktoré dostávame od technických tímov plánujúcich prvého produkčného agenta: „Ktorý framework máme použiť?" Otázka je pochopiteľná — GitHub má desiatky projektov, každý má ukážky, ktoré vyzerajú dobre, a porovnávacie blogy protirečia jeden druhému.
Krátka odpoveď: framework je sekundárne rozhodnutie. Primárne je architektúra agenta — vzor, podľa ktorého agent uvažuje a koná (ReAct, Plan-and-Execute, reflexia). Frameworky tieto vzory *implementujú*, nevymýšľajú ich. LangGraph, CrewAI, AutoGen a vlastný kód sú štyri spôsoby, ako tie isté vzory zhmotnite v kóde. Každý má iné trade-off. Tento článok vám pomôže vybrať správny — alebo vás odradí od výberu frameworku tam, kde vôbec nie je potrebný.
Čo frameworky robia (a čo nie)
Skôr než porovnávame konkrétne projekty, treba si ujasniť, čo agentový framework vôbec rieši. Typicky poskytuje:
- Orchestráciu krokov — ako agent prechádza z jedného stavu do druhého (cyklus reason-act-observe alebo plán → vykonanie → reflexia)
- Správu kontextu a stavu — kde sa ukladá história, medzivýsledky, kontext medzi volaniami
- Routing medzi agentmi — ako sa úloha odovzdáva z jedného špecializovaného agenta na druhého
- Integráciu nástrojov — štandardizovaný spôsob, ako agent volá externé API, vektorové databázy, kód
- Checkpointing a resumability — možnosť obnoviť agenta po zlyhaní bez straty pokroku
Čo frameworky nerobia: nezdieľajú vám zodpovednosť za správnosť promptov, kvalitu nástrojov, guardrails alebo observability. To zostáva na vás bez ohľadu na to, čo si vyberiete.
LangGraph: explicitný graf, explicitný stav
LangGraph stavia agenta ako orientovaný graf — uzly sú funkcie (LLM call, nástroj, podmienka), hrany sú prechody medzi stavmi. Stav je explicitný Python dataclass alebo dict, ktorý sa predáva medzi uzlami.
Čo z toho plynie v praxi:
- Každý prechod v grafe je viditeľný a testovateľný izolovane
- Checkpointing je vstavaný — agent sa môže zastaviť a obnoviť z posledného uzla (dôležité pri dlhých úlohách)
- HITL (human-in-the-loop) sa implementuje cez
interrupt()— agent sa zastaví, čaká na ľudský vstup, potom pokračuje. Toto je v súlade s požiadavkou EU AI Act čl. 14 na human oversight pri high-risk systémoch, ktorá je povinná od augusta 2026 - Debugovateľnosť je nadpriemerná: viem presne, v ktorom uzle a s akým stavom agent zlyhal
Kedy LangGraph dáva zmysel:
- Produkčné stateful agenty s viacerými krokmi (viac ako 3–4 tool cally za úlohu)
- Potrebujete checkpointing — agent beží minúty alebo hodiny
- HITL na kritických akciách (finančné operácie, odosielanie dokumentov)
- Tím chce mať grafovú vizualizáciu toku pre review a debugging
- Nasadenie do regulovaného prostredia, kde treba audit trail na uzol-per-uzol úrovni
Kedy je LangGraph zbytočný:
- Jednoduchý jednokrokový RAG (embed → retrieve → generate) — tu je to overhead bez hodnoty
- Rýchly prototyp, kde potrebujete výsledok za deň, nie za týždeň
- Tím nie je oboznámený s grafovým programovaním — krivka učenia je reálna
LangGraph je dnes považovaný za produkčne najstabilnejší framework pre enterprise stateful agentov. Nejde o najjednoduchší vstup, ale o najkontrolovateľnejší výstup.
CrewAI: role, tímy, rýchly štart
CrewAI myslí v pojmoch role a tímy. Definujete agentov s konkrétnymi rolami (Researcher, Analyst, Writer), každý má vlastný cieľ a sadu nástrojov, a framework koordinuje, ako si úlohu odovzdávajú.
Bariéra vstupu je nízka — základný multi-agent tím zvládnete na ~20–35 riadkoch kódu. To je hlavná prednosť CrewAI: prototyp funkčného multi-agent systému za hodiny, nie za dni.
Čo z toho plynie v praxi:
- Rýchle prototypovanie je skutočne rýchle — syntax je čitateľná, onboarding nový člen tímu zvládne za hodiny
- Role-based abstrakcia je intuitívna pre tímy, ktoré myslia v pojmoch "kto čo robí"
- V produkcii má CrewAI menej nástrojov pre explicitné riadenie stavu a checkpointing v porovnaní s LangGraph
- Debugovateľnosť je slabšia — pri zlyhaní je ťažšie presne identifikovať, v ktorom kroku a prečo
Kedy CrewAI dáva zmysel:
- Proof-of-concept alebo interný prototyp, kde chcete rýchlo ukázať hodnotu
- Multi-agent scenáre, kde role-based myslenie prirodzene sadí na problém (napr. pipeline: zozbieranie dát → analýza → správa)
- Tím bez hlbokého backgroundu v graph-based programovaní
- Menej kritické systémy, kde príležitostné zlyhanie je akceptovateľné
Kedy CrewAI nestačí:
- Produkčné systémy, kde potrebujete spoľahlivý checkpointing a resumability
- HITL s garantovaným zastavením na kritických bodoch
- Dlhé agentic úlohy (desiatky tool callov), kde stav musí byť explicitne spravovaný
- Regulované prostredia s požiadavkou na audit trail
CrewAI nie je zlý framework. Je to správny nástroj pre prototyp — ale prechod z CrewAI prototypu do produkčného systému často znamená čiastočný alebo úplný rewrite v LangGraph alebo vlastnom kóde.
AutoGen: konverzačné agenty, výskumný charakter
AutoGen (teraz AG2) myslí inak ako LangGraph alebo CrewAI. Namiesto explicitného grafu alebo rolí má konverzačný GroupChat — agenti si píšu správy, framework riadi, kto hovorí kedy.
AutoGen dosiahol v roku 2025 verziu 1.0 GA, čo signalizuje dozrievanie. Je obľúbený vo výskumnom prostredí a pri experimentovaní s multi-agent dialógom.
Čo z toho plynie v praxi:
- Silné pre scenáre, kde riešenie vzniká konverzáciou medzi agentmi — napr. jeden agent píše kód, iný ho kontroluje a navrhuje opravy
- Flexibilný a expresívny pre experimentovanie — ľahko pridáte nového agenta do chatu
- Menej predvídateľný v produkcii — konverzačný tok je ťažšie deterministicky kontrolovať ako explicitný graf
- Observability a checkpointing sú slabšie miesta v porovnaní s LangGraph
Kedy AutoGen dáva zmysel:
- Výskum a experimentovanie s novými agent-to-agent vzormi
- Systémy, kde viacero špecialistov (agentov) musí spoločne iteratívne pracovať na odpovedi
- Coding assistanty a code review pipelines
- Prototypy, kde viete akceptovať nižšiu predvídateľnosť
Kedy AutoGen nestačí:
- Produkčné systémy s požiadavkami na deterministický tok
- Scenáre, kde potrebujete garantované zastavenie (HITL) na konkrétnych akciách
- Firmy s dlhodobou zodpovednosťou za kvalitu výstupu — konverzačný chaos je ťažko auditovateľný
Vlastný kód: niekedy najlepšia voľba
Toto je odpoveď, ktorú ľudia nečakajú, ale v praxi ju vidíme častejšie, než by sa zdalo: niekedy nie je potrebný žiadny framework.
Ak váš agent vykonáva fixnú sekvenciu krokov — napr. prijme dokument, zavolá 2–3 nástroje, vráti štruktúrovaný výstup — Python s priamym volaním SDK (Anthropic, OpenAI) a vlastnou retry logikou môže byť čistejší, rýchlejší a jednoduchšie udržiavateľný ako akýkoľvek framework.
Kedy vlastný kód dáva zmysel:
- Agentová logika je jednoduchá a stabilná — menej ako 3–4 kroky, žiadne vetvenie
- Tím má silný Python background a frameworky pridávajú viac complexity ako hodnoty
- Chcete minimálnu sadu závislostí — každý framework pridáva desiatky tranzitívnych balíčkov
- Budujete špecifickú pipeline, nie generický agent runtime
Pozor na past:
Vlastný kód sa rýchlo mení na nekontrolovateľné "hobby framework" — pridávate stav, retry, checkpointing jeden po druhom. Keď agent dorastie na 5+ krokov s vetvením, LangGraph alebo iný framework sa stane racionálnou voľbou. Vlastný kód je dobrý štart, nie vždy dobrý cieľ.
Rozhodovací rámec
Namiesto tabuľky (ktorá by bola nečitateľná) tu je rozhodovacia logika z praxe:
Začnite s otázkou: Koľko krokov a aká komplexnosť?
- Menej ako 3–4 kroky, fixná sekvencia → vlastný kód alebo CrewAI
- 5+ krokov, vetvenie, potreba resumability → LangGraph
- Multi-agent dialóg, výskum, coding review → AutoGen
Potom: Je to prototyp alebo produkcia?
- Prototyp, PoC, demo → CrewAI alebo AutoGen (rýchlosť vstupu)
- Produkcia, SLA, regulované prostredie → LangGraph alebo vlastný kód (kontrola)
Potom: Je potrebný HITL?
- Áno, s garantovaným zastavením → LangGraph (
interrupt()) alebo vlastný kód s explicitným await - Nie alebo "human-on-the-loop" dostačuje → ľubovoľný framework
Nakoniec: Aké sú požiadavky na observability?
Toto je bod, ktorý firmy najčastejšie podcenia. Bez observability — zachytávania traces na úrovni každého uzla a tool callu — neviete v produkcii diagnostikovať zlyhania. Pre LangGraph je prirodzená integrácia s LangSmith, pre ostatné frameworky funguje dobre Langfuse (self-hostable, framework-agnostic) alebo Arize Phoenix. Viac o tejto téme v článku o observability AI agentov.
Čo majú všetky frameworky spoločné: tool calling
Jeden vzor platí bez ohľadu na to, ktorý framework si vyberiete: spoľahlivosť tool callingu nie je zadarmo. Väčšina produkčných incidentov agentov nenastáva pri zlom reasoning — nastáva pri malformovaných argumentoch nástroja, nespracovanej chybe nástroja alebo pri tom, že agent zavolá nástroj s nezmyselnými parametrami.
Povinné minimum pre produkciu:
- Striktná JSON schema validácia vstupu a výstupu každého nástroja
- Retry logika s exponenciálnym backoff na transakčné chyby
- Maximálny počet pokusov (napr. 3) s fallback — agent sa musí vedieť "vzdať" gracefully
- Logovanie každého tool callu s parametrami a výsledkom
Hlbší pohľad na túto tému je v článku tool calling spoľahlivo.
Frameworky vs. vzory: správne poradie
Vráťme sa k bodu, kde sme začali. Pred výberom frameworku si odpovedzte na tieto otázky:
- 1.Aký vzor potrebujem? ReAct (slučka), Plan-and-Execute (plán najprv), reflexia (self-kritika)? Viac o vzoroch v architektúrach AI agentov.
- 2.Aké sú požiadavky na spoľahlivosť a auditovateľnosť? Regulované prostredie, finančné operácie, zdravotníctvo — tu platí LangGraph alebo vlastný kód.
- 3.Aký je horizont? Prototyp na 2 týždne vs. systém, ktorý pobeží 2 roky — to sú fundamentálne iné rozhodnutia.
Framework je len obal. Zlý vzor v elegantnom frameworku stále zlyhá. Správny vzor v jednoduchom vlastnom kóde môže bežať bez problémov roky.
Časté otázky
Môžem kombinovať frameworky?
Áno, ale opatrne. Kombinácia LangGraph pre orchestráciu s CrewAI crew vnútri jedného uzla je technicky možná, ale debugging sa komplikuje. V praxi odporúčame vybrať jeden framework pre celý systém. Ak to nie je možné (napr. integrujete existujúci CrewAI prototyp do nového LangGraph systému), izolujte integráciu do dedikovaného uzla s jasným API kontraktom.
Musím migrovať z CrewAI do LangGraph, keď idem do produkcie?
Nie nevyhnutne. Niektoré produkčné systémy na CrewAI bežia spoľahlivo — záleží na komplexnosti agenta a požiadavkách. Pravidlo z praxe: ak váš agent beží dlhšie ako minútu, má viac ako 5 krokov alebo potrebuje garantované HITL, migrácia sa oplatí. Kratšie, jednoduchšie agenty môžu zostať na CrewAI.
Je AutoGen vhodný pre produkciu?
AutoGen 1.0 GA (2025) je zrelší ako jeho 0.x verzie. Pre správne definované use casy (coding assistanty, review pipelines) je produkčné nasadenie reálne. Pre scenáre s požiadavkou na auditovateľnosť každého kroku a garantované HITL LangGraph zostáva lepšou voľbou.
Aký model použiť s frameworkom?
Framework je model-agnostický — funguje s akýmkoľvek modelom s tool calling podporou. V praxi odporúčame testovať s frontier modelom (Claude Sonnet, GPT trieda) pri vývoji, a ak je cost kritický, postupne testovať lacnejšie modely (Haiku tier, open-weight Qwen 3.x alebo Llama 4) v produkčnom prostredí. Náklady rôznych modelov v agentových scenároch sú spracované v nákladoch AI agenta v produkcii.
Ako frameworky riešia bezpečnosť — guardrails?
Krátka odpoveď: neriešia — to je vaša zodpovednosť. Framework poskytuje štruktúru toku, nie bezpečnostnú vrstvu. Guardrails (input validácia, prompt injection detekcia, tool permission scope, output filtering) musíte pridať explicitne — buď cez dedikované nástroje (NeMo Guardrails, Guardrails AI) alebo vlastnú validačnú logiku. Viac v článku o guardrails pre AI agentov.
*Výber frameworku je dôležité rozhodnutie, ale nie to najdôležitejšie pri budovaní agenta. V MP Industrial Solutions pomáhame klientom prejsť celou cestou — od výberu vzoru a frameworku cez produkčné nasadenie až po monitoring a guardrails. Ak plánujete prvého produkčného agenta alebo hodnotíte, či váš prototyp je pripravený na produkciu, radi si s vami prejdeme konkrétny use case.*
