Línka beží, senzory merajú, operátori kontrolujú. Napriek tomu uniknú chyby — nie preto, že by ľudia nepracovali dobre, ale preto, že ľudská vizuálna pozornosť má pri opakujúcich sa úlohách objektívny strop. Po dvoch hodinách monotónnej inšpekcie klesá detekčná spoľahlivosť výrazne. AI vizuálne systémy tento strop nemajú: procesujú každý kus rovnako a pri správnom nasadení dosahujú presnosť nad 99 % tam, kde ľudský inšpektor dosiahne typicky okolo 85 %.
Problém je, že "správne nasadenie" nie je triviálne. V praxi vidíme projekty, kde AI systém na kontrolu kvality priniesol zásadné výsledky, a rovnako projekty, kde sa skončilo nainštalovanou kamerou, ktorá sa po troch mesiacoch vypla. Rozdiel nie je v technológii — je v tom, čo výrobca urobil predtým, ako kúpil prvý hardware. Tento článok je rozhodovaciou pomôckou: kedy do toho ísť, čo vyriešiť skôr, a kde AI nestačí sama.
Čo AI vizuálna inšpekcia skutočne robí
Základná úloha je jednoduchá: kamera nasnímala kus, model rozhodne OK alebo NOK, systém označí alebo vyradí. Za touto jednoduchosťou sa skrývajú tri odlišné technické úlohy, ktoré si vyžadujú rôzne prístupy.
Detekcia defektov — lokalizácia konkrétnej chyby na povrchu alebo súčiastke: škrabanec, trhlina, pórovitosť, chybný závar. Model musí nielen povedať "chyba existuje", ale aj ukázať kde. Nástroje ako YOLOv10 alebo YOLO11 (Ultralytics) sú v roku 2026 štandardom pre real-time detekciu: spracujú snímku za menej ako 200 ms, čo zodpovedá drvivej väčšine výrobných rýchlostí.
Anomaly detection — odhalenie niečoho "iného ako zvyčajne" bez toho, aby ste vopred vedeli, čo konkrétne hľadáte. Modely trénované iba na "dobrých" kusoch sa naučia normalitu a akákoľvek odchýlka sa označí ako anomália. Prístup vhodný pre sériové výroby, kde sú defekty vzácne a nemáte dostatočný počet chybových vzoriek na klasický supervised tréning.
Segmentácia a meranie — presné ohraničenie plochy defektu, meranie rozmerov, počítanie objektov. SAM 2 (Meta) dnes umožňuje zero-shot segmentáciu — dokáže orámovať neznámy typ defektu bez predchádzajúceho trénovania, čo výrazne urýchľuje anotovanie nových kategórií chýb.
Moderné systémy kombinujú všetky tri: YOLO detekuje, SAM segmentuje, downstream logika meraní rozhoduje o závažnosti.
Kedy sa AI oplatí — a kedy nestačí
Nie každý inšpekčný problém si zaslúži vision model. Skôr než investujete do hardware a integrácie, odpovedzte na päť otázok.
1. Je chyba vizuálne konzistentná? Škrabance na hliníkovom profile vyzerajú vždy podobne. Korózia na zvaroch môže mať desiatky variantov. Čím konzistentnejší je vizuálny prejav defektu, tým ľahšie model trénujete a tým vyššiu presnosť dosiahnete. Defekty s extrémne premenlivým vzhľadom (závislé od teploty materiálu, uhla nárazu, dávky suroviny) sú oveľa náročnejšie.
2. Máte dostatok snímok defektov? Toto je najčastejšia prekážka. Na klasický supervised tréning YOLOv10-typu potrebujete rádovo stovky až tisíce anotovaných príkladov *každej* kategórie defektu. V praxi má väčšina výrobcov plné archívy OK kusov a desiatky chybových snímok. Riešenia existujú — syntetické augmentácie, GAN-generované defekty, alebo práve anomaly detection bez chybových labelov — ale pridávajú komplexitu.
3. Je kontrola reprodukovateľná? Osvetlenie, poloha kusa, rýchlosť pohybu, odraz — všetko musí byť stabilné. Model trénovaný pri jednom type osvetlenia zlyhá pri inom. Nie je to zlý model, je to fyzika. Ak výrobná linka nemá stabilné podmienky snímania, treba ich najprv vyriešiť mechanicky alebo konštruktívne — AI to nevyrieši.
4. Dokáže existujúce riešenie problém riešiť lacnejšie? Jednoduché binárne kontroly (prítomnosť/neprítomnosť súčiastky, správne otočenie) rieši klasická strojová vízia s pravidlami a profilovými senzormi za zlomok ceny a bez tréningových dát. AI sa oplatí tam, kde klasické pravidlové systémy zlyhávajú — nepravidelné povrchy, variabilita tvaru, subjektívne kritériá kvality.
5. Aká je cena úniku defektu vs. cena falošného alarmu? V automotiví jeden uniknutý defekt môže znamenať recall stoviek vozidiel. V spotrebnom tovare je tolerancia vyššia. Pomer NOK/OK a cena oboch typov chýb determinuje, aký threshold nastavíte — a tým priamo ovplyvní, či AI systém bude ekonomicky zmysluplný.
Realita presnosti: čo znamená 99 %
Číslo "99 % presnosť" sa objavuje v každej prezentácii. Je dôležité rozumieť, čo znamená a čo nie.
Ak výrobná linka produkuje 10 000 kusov denne a podiel defektných je 1 %, máte 100 chybových kusov. AI systém s 99 % celkovou presnosťou pri tejto distribúcii môže mať veľmi odlišný reálny výkon — závisí od toho, ako sa tá 1 % chybovosť rozkladá medzi false positives a false negatives. Pre kritické aplikácie nie je podstatná celková presnosť, ale presnosť na triede defektov, ktoré naozaj potrebujete zachytiť.
V praxi vidíme tieto vzory: modely dobre trénované na hlavných typoch defektov dosahujú excelentné výsledky práve na týchto typoch, ale degradujú na zriedkavých alebo nových variantoch, ktoré neboli v tréningových dátach. Preto je kritické neustále doplňovanie tréningového setu o nové príklady z produkcie — model nie je jednorazová investícia, je to živý systém.
Porovnanie s ľudskou inšpekciou je tiež kontextové. AI systémy sú konzistentne lepšie pri opakujúcich sa, dobre definovaných typoch kontroly. Skúsený inšpektor s hlbokým poznaním procesu dokáže zachytiť anomálie, ktoré model ešte nevidel — hybridné nastavenie (AI flaguje, ľudský operátor validuje edge cases) je v roku 2026 bežná produkčná prax.
Málo dát: ako riešiť chronický problém
Nedostatok chybových vzoriek je realita väčšiny výrobcov. Niekoľko overených prístupov:
Anomaly detection namiesto klasifikácie. Modely ako ViT (Vision Transformer) trénované len na "dobrých" kusoch sa naučia distribúciu normality. Pri produkcii každý kus, ktorý sa líši od tejto distribúcie, dostane vysoké anomaly skóre. Nevýhoda: model nevie pomenovať typ defektu, iba oznámiť "niečo nie je v poriadku". Pre prvú fázu nasadenia to stačí.
Syntetická augmentácia. Realistické syntetické defekty (škrabance, trhliny, škvrny) sa dajú generovať priamo na OK snímkach pomocou algoritmických metód alebo GAN/difúznych modelov. V priemyselných projektoch sme videli, že kvalitná syntetická augmentácia môže nahradiť 30–50 % reálnych chybových príkladov bez výrazného dopadu na presnosť — ale výsledok silne závisí od podobnosti syntetiky s realitou.
`SAM 2` na anotovanie. Manuálne anotovanie snímok je časovo nákladné. SAM 2 umožňuje zero-shot segmentáciu — znalec ukáže na defekt, model ho okamžite orámuva presnou maskou. V praxi skracuje anotovanie nových kategórií defektov o 60–80 % oproti klasickému manuálnemu workflow.
Transfer learning. Začnite s modelom pred-trénovaným na priemyselných dátach (existujú verejné datasety pre detekciu povrchových defektov na kove, textíliách, dreve) a dofine-tuneujte na svojich špecifických dátach. Potrebujete omnoho menej príkladov ako pri trénovaní od nuly.
Pre hlbšie pochopenie prístupu k tréningovým dátam — vrátane toho, koľko vzoriek reálne potrebujete a ako ich štruktúrovať — odkazujeme na Dataset na fine-tuning — koľko a akú kvalitu.
Edge nasadenie: kde sa spracovanie deje
Veľká otázka architektúry: kde bude inferencia bežať?
Cloud — snímky sa odosielajú na vzdialený server. Nevhodné pre väčšinu výrobných liniek z dôvodu latencie (round-trip sieť + spracovanie) a dostupnosti (výpadok internetu = výpadok kontroly). Pre offline dávkové spracovanie archívnych snímok je cloud prijateľný.
On-premise server — inferencný server v sieti závodu, typicky na GPU (NVIDIA RTX 4090 alebo A-série). Latencia v rámci intranetu je nízka (milisekundy), dostupnosť závisí len od internej infraštruktúry. Štandard pre väčšinu sériových výrob.
Edge device — výpočet priamo pri kamere alebo na priemyselnom PC na linke. Odľahčené vision modely exportované do ONNX alebo TensorRT formátu dnes umožňujú nasadenie aj bez dedikovanej GPU — napríklad cez OpenVINO na Intel hardware alebo ONNX Runtime na štandardnom priemyselnom PC. Pre jednoduché binárne OK/NOK rozhodnutia to stačí. Pre komplexnú multi-class detekciu s vysokou presnosťou je edge hardware stále limitujúci faktor.
V praxi používame kombináciu: edge device zabezpečuje okamžité OK/NOK rozhodnutie v pod-100 ms, výsledky sa posielajú na centrálny server pre analytiku, retraining a reporting. Táto architektúra je odolná voči sieťovým výpadkom a zároveň umožňuje centrálnu správu modelov.
Keď zvažujete hardware sizing pre inferenčný server, môže byť užitočný aj článok o GPU na inferenciu LLM — princípy memory bandwidth a VRAM sizing sa aplikujú rovnako.
Integrácia do výrobného procesu
Vision systém, ktorý len zobrazuje výsledky na monitore, nemá plnú hodnotu. Reálna integrácia znamená:
Prepojenie na výrobný systém — MES, SCADA, alebo priamo PLC. Signál NOK spúšťa akciu: zastavenie linky, vychýlenie kusa, alarm operátorovi. Bez tejto väzby je AI iba pasívny pozorovateľ.
Traceabilita — každý kus má snímku, rozhodnutie, timestamp a batch ID. Pri reklamácii alebo analýze zákazníka dokážete okamžite prehrať inšpekčný záznam. Toto je jedna z najcennejších vedľajších hodnôt AI vizuálnych systémov — nie iba automatizácia, ale dokumentácia.
Uzavretá slučka — pokročilejšie nasadenia (vidíme ich čoraz viac) prepájajú vizuálny systém priamo s robotickým ramenom alebo korekčným aktuátorom. Detekovaný defekt → príkaz na opravu alebo triedenie → potvrdenie korekcie ďalšou snímkou. Tento closed-loop vzor je smer, ktorým sa odvetvie pohybuje.
Dashboard a retraining pipeline — operátori musia vidieť výkon systému v reálnom čase (počty OK/NOK, typy detekovaných defektov, false alarm rate). A keď sa objaví nový typ defektu, musí existovať workflow: operátor označí snímku → anotácia → doplnenie do tréningového setu → retraining → deploy novej verzie modelu. Bez tohto pipeline model stárne.
Pre tímy zvažujúce ako podobné agentic loopy nastaviť pre dlhodobú správu AI systémov odporúčame preštudovať Architektúry AI agentov (ReAct, Plan-and-Execute).
Kedy klasické kamery stačia
Bolo by nečestné nepovedať: existujú prípady, kde AI vision model nie je správna odpoveď.
Presencia/absencia komponentu — či je skrutka na svojom mieste, či je etiketa nalepená, či je uzáver zatvorený. Klasická pravidlová strojová vízia to zvládne spoľahlivo za podstatne nižšiu cenu a bez tréningových dát.
Rozmerová kontrola s mikrometrickým presnosťou — kontaktné meracie systémy alebo laserové profilomery sú presnejšie a spoľahlivejšie ako kamerová inšpekcia pre sub-milimetrové rozmery.
Extrémne jednoduché binárne kontroly — ak defekt vyzerá vždy rovnako a kontrast voči pozadiu je dostatočný, jednoduchý threshold algoritmus stačí. AI je overkill.
AI vision prináša hodnotu tam, kde variabilita, komplexnosť alebo subjektivita prevyšuje možnosti pravidlových systémov. Keď ste na hranici, urobte pilot: otestujte oba prístupy na reálnych dátach a porovnajte cenu implementácie vs. zlepšenie detekcie.
Časté otázky
Koľko tréningových snímok potrebujem na detekciu defektov?
Pre klasický supervised model (YOLO-typ) potrebujete typicky stovky anotovaných príkladov na kategóriu defektu — prakticky to znamená 500 až 2 000 snímok pre prvú použiteľnú verziu. Ak máte menej, zvážte anomaly detection (trénovaný len na OK kusoch) alebo syntetickú augmentáciu. Kvalita anotácií je dôležitejšia ako čistý počet — zle anotované dáta model skôr poškodzujú.
Aká rýchla musí byť kamera a ako rýchlo systém rozhoduje?
Pre väčšinu výrobných liniek (do 60 kusov za minútu) postačuje kamera so 60 fps a latencia inferencie pod 100 ms. YOLO11 na RTX 4090 spracuje snímku za 10–30 ms, čo dáva dostatočnú rezervu aj pre rýchlejšie linky. Pre extrémne rýchle procesy (stovky kusov za minútu) treba line-scan kamery a špecializovaný hardware — to je iná kategória riešení.
Funguje AI vizuálna inšpekcia na reflexných alebo transparentných materiáloch?
Reflexné povrchy (leštený kov, chróm) a transparentné materiály (sklo, plast) sú technicky náročnejšie — odrazy a variabilný kontrast zavádzajú model. Riešenie je kombinácia špeciálneho osvetlenia (polarizované, dome light, coaxial) a tréning na dátach zachytených práve za týchto podmienok. Nie je to neriešiteľný problém, ale vyžaduje viac prípravy a testovania.
Potrebujem GPU priamo na výrobnej linke?
Nie nevyhnutne. Pre jednoduché modely postačuje výkonný priemyselný PC bez dedikovanej GPU (inferencia na CPU je pomalšia, ale pre menej náročné úlohy dostatočná). Pre real-time inšpekciu s komplexnými modelmi odporúčame edge server s GPU v rozvádzači pri linke — nie priamo v prašnom a vibračnom prostredí. GPU na cloude alebo centrálnom serveri je alternatíva, ale závislá od sieťovej dostupnosti.
Kedy AI vizuálna inšpekcia nahradí ľudskú kontrolu úplne?
V praxi sa k úplnej náhrade blíži len málokto. Bežnejší model je augmentácia: AI zvládne 90–95 % inšpekcie autonómne, zvyšok (edge cases, nové typy defektov, eskalované reklamácie) ide na ľudského experta. Tento hybrid je racionálny — ušetrí väčšinu manuálnej práce a zároveň zachová odborné know-how pre situácie, kde model ešte nie je spoľahlivý.
*AI vizuálna inšpekcia nie je produkt, ktorý kúpite a zapojíte — je to systém, ktorý treba navrhnúť, natrénovať a udržiavať. V MP Industrial Solutions pomáhame výrobným firmám posúdiť, či a ako je AI inšpekcia pre ich proces zmysluplná: od analýzy existujúcich dát a defektových vzoriek, cez výber architektúry, až po integráciu s existujúcim MES alebo SCADA. Ak zvažujete tento krok, radi si najprv priamo pozrieme váš konkrétny prípad.*
