Tri roky som sa pozeral na ten istý pitch deck v rôznych verziách: „nasadíme AI asistenta pre operátorov, ušetria 30 % času, ROI za 8 mesiacov." Realita po 12 mesiacoch v 10 nasadeniach: štyri use-cases, ktoré sa vrátili (často trojnásobne), a šesť, ktoré zožrali rozpočet a tím prešiel z entuziazmu cez frustráciu na ticho. Tu sú konkrétne use-cases s číslami, a niekoľko, ktoré radíme klientom odmietnuť bez ohľadu na to, koľko peňazí majú voľných.
Štyri use-cases, ktoré zarábajú
1. SOP search & shift-handover summary
**Use-case:** operátor potrebuje rýchlo nájsť postup („ako resetnúť alarm 14-021 na linke L4"), alebo prijíma zmenu a chce mať 90-sekundový brief o tom, čo sa udialo na predchádzajúcich dvoch zmenách.
**Stack:** RAG nad SOP dokumentmi + shift logs + maintenance tickets. Tablet na linke (Zebra ET40, Panasonic Toughbook) alebo voice assistant cez Bluetooth headset (Plantronics Voyager 5200 UC) pre hlučné prostredia.
**Reálne čísla z nasadenia (nemecký Tier-2 automotive supplier, 3-mesačný pilot):** - 14 hodín / týždeň ušetreného času na zmenovej zmene a SOP-vyhľadávaní cez 8 operátorov - Pri hodinovej sadzbe 28 EUR / h fully-loaded → **1 568 EUR / mesiac úspora** - Nasadenie a integrácia: 38 000 EUR (RAG pipeline + 6 týždňov field tuning) - **ROI: 24 mesiacov** v jednej linke. Pri škálovaní na 4 linky → 8 mesiacov.
Kľúčové: nehrali sme s „nahraj všetko". Doménový engineer s operátorom prešiel 200 najfrekventovanejších otázok zo zmenového logu a tým chunkmi sa naladil retrieval. Otázky, ktoré sa nepýtajú, sa neoptimalizovali — ROI ich nepotrebuje.
2. Troubleshooting wizard pre PLC / SCADA / robotiku
**Use-case:** Operátor narazí na alarm, ktorý nevie hneď identifikovať. Otvorí copilot, napíše „Allen-Bradley CompactLogix 5380, alarm code 16#0001, RPI exceeded", a dostane: - popis chyby v ľudskej reči - top-3 najpravdepodobnejšie príčiny podľa historických tiketov - step-by-step diagnostiku - link na manuál Rockwell s presnou stranou
**Stack:** RAG nad: PLC manuálmi (Rockwell Knowledgebase, Siemens TIA Portal docs, Beckhoff TwinCAT docs) + interný issue tracker (Jira, ServiceNow, vlastný systém) + community fóra (Plctalk.net, Reddit /r/PLC scraped). Embedding model: BGE-M3 alebo Cohere multilingual. Reranker: BGE-Reranker-v2-m3.
**Reálne čísla z nasadenia (slovinský EMS výrobca, plnohodnotné nasadenie 9 mesiacov):** - MTTR (Mean Time To Repair) klesol o 18 % cez 6 mesiacov - Nahradil neformálnu interakciu „pýtam sa Petra, ktorý už 10 rokov pracuje s tými linkami" — Peter mohol robiť hodnotnejšie veci - Pri 200 incidentoch / mesiac × priemerne 45 min MTTR × 18 % zníženie × 65 EUR / h technika → **8 775 EUR / mesiac** - Nasadenie: 52 000 EUR - **ROI: 6 mesiacov.**
Kľúčové: Peter neodišiel. Peter pomáhal trénovať systém — jeho 10 rokov skúseností sa zaintegrovalo do prompt-templates a feedback loop-u. Bez Petra by systém bol generický a vrátil by sa za 24+ mesiacov.
3. Quality deviation reporting / 8D dráft
**Use-case:** Linka vyrobila batch s odchýlkou (zlá kalibrácia, materiálová vada, operátorská chyba). Operátor + quality engineer musia spísať 8D report, root cause analysis, corrective action plan. Trvá to typicky 4–8 hodín.
**Stack:** LLM (Claude Sonnet 4.6, lokálne Llama 3.3 70B, alebo Qwen2.5-32B-Instruct) s prístupom k: 5 Why template, Ishikawa formátu, historickým 8D reportom firmy, ISO 9001 / IATF 16949 guidelines. Quality engineer popíše defekt v 3–5 vetách, systém vygeneruje **draft** 8D — ľudská review a doplnenie zostane.
**Reálne čísla z nasadenia (rakúsky tier-1 metal forming):** - 8D draft time: zo 6 h na 1,5 h v priemere - 14 reportov / mesiac × 4,5 h úspora × 55 EUR / h engineer → **3 465 EUR / mesiac** - Nasadenie: 18 000 EUR (jednoduchší stack, lebo prísnejší formát) - **ROI: 5 mesiacov.**
Kľúčové: AI nikdy nezavrelo 8D — to je human-in-the-loop gate. Generuje draft + návrhy preventívnych opatrení podľa precedensov. Bez review by sa ROI zmenil na compliance risk.
4. Multi-language operator instructions
**Use-case:** Linka má operátorov z 5 krajín (SK, UA, RO, PL, HU). SOP-y sú v anglickom origináli. Operátori potrebujú native-language výklad krok-za-krokom.
**Stack:** GPT-5 alebo Claude Sonnet 4.6 (cloud, business-tier subscription s GDPR EU region) s tool-call pre native TTS (Azure Speech, ElevenLabs). Operátor naskenuje QR kód SOP-u, dostane výklad vo svojom jazyku, môže sa pýtať doplňujúce otázky.
**Reálne čísla (poľská montáž elektroniky):** - Onboarding nového operátora: zo 12 dní na 7 dní (40 % redukcia) - Pri 6 nových operátoroch / kvartál × 5 dní × 8 h × 22 EUR / h fully-loaded → **5 280 EUR / kvartál = 21 120 EUR ročne** - Nasadenie: 24 000 EUR - **ROI: 14 mesiacov.**
Kľúčové: SOP-y boli kvalitné v origináli. Pre fabriky s zlými, zastaranými SOP-mi systém prekladá zlé inštrukcie — nie je to prekladač chýb, len jazykového bariéra.
Šesť use-cases, kde to nezarobí
1. Real-time process control
„Pridáme AI, ktorá v reálnom čase optimalizuje parametre na linke." Nikdy.
Latencia LLM volania je 800–3 000 ms. Process control loop pracuje na 10–100 ms cykloch. Mimo toho: regulačné požiadavky (IEC 61508, ISO 13849) vyžadujú deterministické správanie — LLM má z definície non-determinizmus.
**Čo namiesto:** klasický PLC + classical control (PID, MPC). LLM má hodnotu **off-line analýzou logov a navrhovaním tuningu** parametrov — nie real-time inferenciou.
2. Routine vision QA
„LLM s vision module pozrie obrázok dielu a povie, či má defekt."
Multimodal LLM (GPT-4o, Claude Sonnet 4.6 vision) majú 3–5 sek latenciu, 70–85 % accuracy na neexpertnú vision úlohu, $0,005–0,015 per obrázok. Purpose-built vision systém (Cognex VisionPro Deep Learning, Keyence CV-X) má 30–80 ms latenciu, 98–99,7 % accuracy, zero per-image cost po nákupe HW.
**Kedy LLM dáva zmysel:** **incident analýza** (po fakte, expert chce rýchle posúdenie), edge case kategorizácia (defekt, ktorý nepoznal classifier), generovanie defect report-ov z 50 fotiek. Real-time QA na linke — nikdy.
3. Maintenance scheduling
„LLM rozhodne, kedy plánovať preventívnu údržbu na základe usage patterns."
Na to existuje CMMS (Computerized Maintenance Management System) — IBM Maximo, SAP PM, Limble, MaintainX. Tieto systémy majú deterministické pravidlá, integráciu s ERP (čo treba objednať), a auditovateľné logy. LLM nepridá hodnotu k optimizácii, ktorú deterministický scheduler robí lepšie.
**Kedy LLM pomôže:** **vysvetľovanie** prečo CMMS navrhol konkrétny harmonogram, summary report pre management („tento týždeň zabralo údržba 47 % kapacity team-u, 60 % z toho bolo na linke L3 a tri najčastejšie poruchy boli ..."). Decision-making — nie.
4. Safety-critical interaction
„AI copilot povie operátorovi, či je bezpečné vstúpiť do zóny."
LSI (Life Safety Interlock) musí byť FMEA-analyzovaný, certifikovaný (SIL 2/3), deterministický. LLM tu nemá miesto — nie ako sekundárny kanál, nie ako informačný. Reč LSI je: light curtain, safety relay, dvojkanálový start, manual reset, žiadny softvér nad ktorým by stál LLM.
**Kedy LLM pomôže:** **training simulácia** safety scénarov pre operátorov mimo živej zóny. Live decision — absolútne nie.
5. Inventory / orders / supply chain decisions
„AI rozhodne, koľko surovín objednať, na základe trendov."
To je úloha ERP-MRP systému (SAP S/4HANA, Oracle, NetSuite) so správnymi forecast modulmi. LLM tu pridá 5–10 % marginal accuracy oproti dobre nakonfigurovanému MRP, a 30–50 % oproti zlému. Ale fixovať zlý MRP je lacnejšie a udržateľnejšie ako pridať LLM vrstvu nad ním.
6. „Univerzálny chatbot pre celú fabriku"
„Operátor sa môže opýtať na hocičo — SOP-y, HR, payroll, prevádzkové dáta, OEE, kvalitu, plánovanie."
Single chatbot, ktorý vie všetko, vie zle všetko. Authority boundaries (HR data vs. operational data vs. financial data) sa rozplyvajú, role-based access control je v LLM nemožné implementovať robustne (prompt injection breaks RBAC), a operátor stratí dôveru pri prvej zlej odpovedi.
**Lepší prístup:** 3–5 špecializovaných copilotov so zúženou doménou. Každý s vlastným RAG-om, vlastným system prompt-om, vlastným audit log-om. Jednotné UI, špecializovaný backend.
Stack rozhodnutia v 2026
Lokálny vs. cloud LLM
**Lokálny (vlastný GPU server):** vhodný pre väčšie nasadenia (50+ operátorov denne), regulované odvetvia (automotive aerospace s ITAR-compliance), továrne bez stabilného internetu.
Konkrétne modely v 2026: - **Qwen2.5-32B-Instruct AWQ** — 24 GB VRAM, výborná multilingual schopnosť, dobré pre EU jazyky - **Llama 3.3 70B AWQ** — 48 GB VRAM, silnejší reasoning, lepší pre troubleshooting - **Mistral Small 3 (22B)** — 16 GB VRAM, dobrá voľba pre cost-sensitive setupy
Hardware: 1× RTX A6000 (48 GB) alebo 2× RTX 4090 (cumulative 48 GB) pre Llama 3.3 70B. Cena 12–18 k EUR. Throughput pri vLLM serving: 40–80 RPS pri typickom shop-floor query mix.
**Cloud LLM:** vhodný pre menšie nasadenia, pilot fázy, projekty kde nepotrebujete data residency. Default v 2026: **Claude Sonnet 4.6 (Anthropic EU region)** alebo **GPT-5 (Azure OpenAI EU)**. Per-query cost typicky 0,002–0,012 EUR pri RAG s 4 k input tokenov + 300 output tokenov. Mesačný náklad pri 200 dotazov / deň × 22 dní × 8 operátorov = **75–250 EUR / mesiac**.
UI: tablet vs. voice
**Tablet:** Zebra ET40 (3 800 EUR), Panasonic Toughbook G2 (4 200 EUR), Microsoft Surface Pro 11 v IP65 kryte (2 800 EUR). Vhodné pre detailné troubleshooting, foto attachment, kreslenie schém. Hlučnosť linky nevadí.
**Voice (Bluetooth headset):** Plantronics Voyager 5200 UC (260 EUR), Jabra Engage 65 (310 EUR), Apple AirPods Pro 2 v industrial setup (310 EUR + custom dock). Vhodné pre hands-free operácie, hlučné prostredie do 95 dB s active noise cancelation. Latencia STT (Speech-to-Text) je kritická — Whisper v3 large na lokálnom GPU 200–400 ms, cloud Azure Speech 250–500 ms.
V pilotoch sme zistili, že **kombinácia** funguje najlepšie: tablet pre detailný interaction, voice pre quick query („ako resetnúť alarm 14-021" počas chôdze k stroju).
Pilot framework, ktorý nezhorí peniaze
1. **Vyberte 1 (max 2) use-cases** z odporúčaných 4. Nikdy nie „nasadíme všetko naraz". 2. **Definujte merateľný KPI** *pred* startom: úspora hodín, MTTR redukcia, draft time, onboarding time. Bez baseline merania ROI report bude wishful thinking. 3. **8-týždňová PoC fáza:** 4 týždne integrácia + 4 týždne field testing s 6–10 operátormi. Žiadne škálovanie pred dokončenou PoC. 4. **Stop-go gate po PoC:** ak KPI nedosiahli aspoň 50 % cieľa, nezaškálovať. Skontrolujte stack, alebo zrušte projekt. 5. **6-mesačný rollout** ku všetkým operátorom + integrácia s existujúcimi systémami (MES, CMMS, ERP read-only access).
Konkrétny príklad zo zmieneného nemeckého supplier-a: 80 hodín plytvania v integrácii bolo z toho, že tím sa snažil prepojiť AI copilot s **9 internými systémami** v PoC fáze. Reálne 6 z 9 sa ukázalo ako zbytočné a 3 stačili. Ale priorita „integrate everything first" stratila prvé 3 mesiace projektu.
---
*Implementujeme shop-floor AI copilot riešenia s 8-týždňovou PoC + 6-mesačným rollout-om. Ak zvažujete tento typ nasadenia, prvý workshop (3 hodiny) prejde 4 odporúčané use-cases na vašom konkrétnom procese a vyradí tie, ktoré sa nevrátia v rozumnom horizonte.*