Na spotkaniu z dyrektorem produkcji pada pytanie, które słyszymy niemal w każdej firmie myślącej dziś o AI: „Kupujemy jakieś gotowe narzędzie, czy będziemy musieli to budować sami?" Pytanie brzmi prosto, ale w rzeczywistości łączy trzy różne decyzje — o różnicowaniu, o danych i o kosztach w czasie. Kto odpowiada na nie w pierwszych piętnastu minutach spotkania, zazwyczaj odpowiada źle.
Ten artykuł oferuje framework, który sprawdziliśmy w praktyce przy kilkudziesięciu wdrożeniach. To nie jest wojna religijna między „buy everything" a „build everything" — oba podejścia są ekstremalne i oba są błędne. Chodzi o to, by wiedzieć, którą warstwę każdego konkretnego rozwiązania kupić, którą zbudować i gdzie leży granica, za którą jedno lub drugie przestaje się opłacać.
Podstawa frameworku — trzy warstwy każdego rozwiązania AI
Każde produkcyjne rozwiązanie AI można podzielić na trzy warstwy:
- 1.Model i inferencing — LLM, model embeddingowy, infrastruktura serving. To jest komodyta. OpenAI, Anthropic, Google, czy modele open-weight jak
Qwen 3,Mistral,Llama 4— wszystkie zapewniają solidną podstawę, której stworzenie kosztuje setki milionów dolarów, a Państwo dostają ją ułamek tej ceny. - 2.Orkiestracja i retrieval — pipeline RAG, logika agentów, memory, narzędzia, guardrails. To jest warstwa, w której rozstrzyga się jakość wyników. Jest częściowo komodytowa (frameworki jak
LangGraph,LlamaIndex, bazy wektorowe jakQdrantsą open-source i dojrzałe), ale specyfika wdrożenia — Państwa dane, Państwa procesy, Państwa edge-case'y — wymaga własnej pracy. - 3.Warstwa domenowa — prompty, datasety, fine-tuning, ewaluacje, UI, integracja z systemami. To jest miejsce, gdzie powstaje różnicowanie. Nikt inny nie ma Państwa danych produkcyjnych, Państwa dokumentów SOP ani Państwa historii klientów. Tej warstwy kupić nie można — można ją tylko zbudować.
W uproszczeniu: kup warstwy 1 i część 2, buduj warstwę 3 i resztę 2. Problem pojawia się wtedy, gdy firma kupuje warstwę 1 od jednego vendora, który pakuje w to warstwę 2 i warstwę 3 do własnościowej platformy — i firma nie zdaje sobie sprawy, co podpisuje.
Kiedy kupować
Zakup ma sens, gdy use-case jest komodytowy — tzn. że ten sam problem rozwiązuje już pięćdziesiąt innych firm i istnieje dojrzały rynek rozwiązań. Przykłady:
- Obsługa klienta z FAQ (Zendesk AI, Intercom, Freshdesk AI) — standardowe zadanie, gotowe integracje, szybki onboarding.
- Podsumowania spotkań i transkrypcja (Otter.ai, Fireflies, Microsoft Copilot) — żadnej wartości różnicującej, kluczowa jest szybkość wdrożenia.
- Asystent kodowania dla zespołu (GitHub Copilot, Cursor, Codeium) — ogólny use-case, gdzie indywidualny fine-tuning przyniesie marginalne ulepszenie za nieproporcjonalne koszty.
- Screening HR pierwszego etapu (istnieje kilka dojrzałych platform) — komodytowy problem, regulowany rynek, gotowa zgodność z przepisami.
Poza komodytą obowiązuje zasada: kupuj, jeśli szybkość do produkcji jest ważniejsza niż wydajność. W niektórych przypadkach rozwiązanie na poziomie 80% dostępne jutro jest lepsze niż rozwiązanie na poziomie 95% dostępne za osiem miesięcy.
Ostatni argument za zakupem: jeśli Państwa firma nie ma i w najbliższej przyszłości nie będzie mieć zespołu AI z odpowiednimi kompetencjami, utrzymanie własnego rozwiązania będzie kosztować więcej niż subskrypcja SaaS — zarówno pod względem kosztów, jak i zawodności.
Kiedy budować
Budowanie ma sens w trzech sytuacjach:
Różnicowanie przez dane. Jeśli mają Państwo dane, których nikt inny nie ma — zapisy produkcyjne z maszyn, historię reklamacji, wewnętrzne normy techniczne, wyniki pomiarów — i jeśli te dane mogą być źródłem lepszej wydajności niż u konkurencji, musicie budować. Gotowe rozwiązanie tych danych nie zintegruje; kupując je, płacicie za generyczną jakość. Fine-tuning lub RAG nad własnymi danymi zmienia generyczny model w domenowego specjalistę — ale wymaga to Państwa pracy.
Bezpieczeństwo i wymogi regulacyjne. Jeśli działają Państwo w branży, gdzie dane nie mogą opuszczać sieci (ochrona zdrowia, energetyka, obronność, instytucje finansowe z danymi objętymi NDA), rozwiązania SaaS są po prostu poza stołem. Odpowiedzią jest tu on-prem LLM — lokalne wdrożenie modelu open-weight z vLLM lub Ollama, gdzie inferencing działa na Państwa sprzęcie i żaden token nie opuszcza sieci. To nie tylko wybór techniczny — to wymóg compliance.
Specyfika procesów, której gotowy produkt nie obsłuży. Jeśli Państwa use-case zawiera niestandardowe kroki — np. integrację ze starszym systemem SCADA, przetwarzanie własnościowego formatu dokumentacji lub wieloetapowy workflow agentowy odzwierciedlający Państwa procesy produkcyjne — żadna gotowa platforma tego nie pokryje bez rozległej customizacji. A ta customizacja doprowadzi do takiego samego nakładu pracy jak własne rozwiązanie, tylko z cudzym kodem pod spodem.
Model hybrydowy — rzeczywistość większości wdrożeń produkcyjnych
W praktyce rzadko widzieliśmy czyste wdrożenie build lub czyste buy. Typowa architektura, która działa:
- Kupić: LLM API (Claude Sonnet, GPT, Gemini Flash) lub model open-weight przez
vLLMna własnym serwerze; baza wektorowa (Qdrantto de facto standard dla polskiego rynku — EU-hosted, Apache 2.0); model embeddingowy (rodzina open-weightBGEjest sprawdzona produkcyjnie). - Zbudować: pipeline RAG ze specyficznymi strategiami retrieval dla Państwa typu dokumentów; warstwa promptów odzwierciedlająca procesy i terminologię firmową; fine-tuning na domenowym słownictwie, gdy różnica w jakości jest mierzalna; integracja z systemami ERP/SCADA/MES; ewaluacja i monitoring wydajności w produkcji.
To podejście hybrydowe daje Państwu szybkość warstw komercyjnych (model i baza danych są gotowe w dniu startu) i różnicowanie własnych warstw (logika domenowa pozostaje Państwa). Jednocześnie zmniejsza ryzyko lock-inu — jeśli jutro wyjdzie lepszy model, wymieniacie wywołanie API bez przepisywania całego rozwiązania.
Total cost of ownership — gdzie kalkulacja się zmienia
Najczęstszy błąd w decyzji build vs buy to porównywanie ceny subskrypcji SaaS z jednorazowymi kosztami rozwoju. Prawidłowa kalkulacja musi uwzględniać całkowity koszt posiadania (TCO) za 3–5 lat:
SaaS / buy TCO: - Miesięczna subskrypcja (skaluje się z liczbą użytkowników lub wolumenem danych — śledźcie to) - Onboarding i integracja (zazwyczaj nie jest bezpłatna) - Przestoje z powodu zmian API lub warunków usługi (widzieliśmy cenniki podnoszone o 40–80 % przy odnowieniu umowy) - Niewidoczne koszty: dane opuszczają firmę → ryzyko prywatności → potencjalne koszty compliance
Build TCO: - Inicjalny rozwój (typowo dominująca pozycja w roku 1) - Sprzęt w przypadku on-prem (serwer GPU — orientacyjnie 15–60 k EUR dla wdrożenia produkcyjnego w zależności od wymagań, amortyzowany typowo przez 3 lata) - Koszty osobowe utrzymania i iteracji (nie są zerowe — kalkulujcie realistycznie) - Zależność od wewnętrznego know-how (odejście kluczowego inżyniera = ryzyko)
Kluczowy punkt: SaaS wydaje się korzystny w roku 1, build opłaca się od roku 2–3. Jeśli use-case jest tymczasowy (projekt pilotażowy, testowanie hipotezy, sezonowy), kupujcie. Jeśli jest strategiczny i długoterminowy, build ma typowo niższe TCO i wyższą kontrolę.
Lock-in — ryzyko, które się bagatelizuje
Vendor lock-in ma w kontekście AI trzy formy, które są gorsze niż klasyczny lock-in w software:
Danych lock-in. Gdy Państwa dane firmowe (dokumenty, historia, adnotacje, feedback) żyją wyłącznie na platformie vendora, migracja jest bolesna lub niemożliwa. Przed zakupem zawsze sprawdzajcie: czy mogę wyeksportować 100 % swoich danych w standardowym formacie? Jeśli nie — jesteście w lock-inie od pierwszego dnia.
Lock-in modelowy. Jeśli zbudowali Państwo logikę promptów, zestaw fine-tuningowy lub ewaluacje pod jeden konkretny model (np. klasa GPT-4), migracja na inny model wymaga przeprojektowania nawet wtedy, gdy nowy model jest lepszy. Rozwiązanie: warstwa abstrakcji w orkiestracji, gdzie model jest konfiguracją, a nie hardcodem.
Lock-in integracyjny. Niektóre platformy oferują konektory do Państwa systemów — ERP, CRM, SCADA. Gdy te konektory są własnościowe i nieudokumentowane, zmiana platformy wiąże się z przepisywaniem integracji. Zawsze preferujcie otwarte API i standardowe protokoły.
Dobra wiadomość: modele open-weight (Llama 4, Qwen 3, Mistral — większość pod Apache 2.0 lub porównywalną licencją komercyjną) zasadniczo zmniejszyły lock-in modelowy przez ostatnie dwa lata. Wydajność na poziomie frontier jest osiągalna lokalnie bez uzależnienia od konkretnego dostawcy.
Mapa decyzyjna — 5 pytań przed wnioskiem
Przed ostateczną decyzją przejdźcie w zespole przez te pięć pytań:
- 1.Czy use-case jest komodytowy? Jeśli dwie dziesiątki firm w tej samej branży rozwiązują ten sam problem w ten sam sposób, gotowe rozwiązanie jest prawdopodobnie efektywniejsze.
- 2.Czy nasze dane są źródłem różnicowania? Jeśli tak, musicie budować — gotowy produkt ich nie przetworzy w sposób dający Wam przewagę.
- 3.Czy dane mogą opuszczać sieć? Jeśli nie, build/on-prem to jedyna opcja.
- 4.Czy mamy (lub jesteśmy w stanie zapewnić) zespół do budowania i utrzymania? Build bez kompetentnego zespołu jest gorszy niż buy — skład zespołu do projektu AI to osobny temat, który trzeba rozwiązać równolegle.
- 5.Jak długo planujemy to rozwiązanie eksploatować? Do 12 miesięcy lub jeśli use-case jest niepewny → kupujcie. 2+ lata z jasnymi wynikami → build lub hybrid wyjdzie lepiej.
Gdy odpowiedzi na te pytania nie wyłaniają jednoznacznego zwycięzcy, zazwyczaj chodzi o przypadek hybrydowy — kupić warstwy podstawowe, zbudować domenową specjalizację.
Typowe błędy, które widzimy
Zakup całego stacku od jednego vendora bez sprawdzenia, czy każda warstwa jest rzeczywiście na poziomie best-in-class. Platformy robiące wszystko nie robią niczego doskonale. Coraz więcej udanych wdrożeń produkcyjnych składa komponenty od różnych dostawców: model API z jednej strony, baza wektorowa open-source, orkiestracja własna.
Build bez zdefiniowanego use-case'u. „Chcemy AI, więc to zbudujemy" to wyprawa bez mapy. Większość projektów, które widzieliśmy, jak upadały, nie miała przed startem zdefiniowanego success metric — a więc i żadnego sposobu, by sprawdzić, czy to, co budują, ma wartość. ROI projektów AI trzeba mierzyć od pierwszego dnia.
Niedoszacowanie kosztów danych. Zanim będziecie mogli budować, musicie mieć dane — oczyszczone, ustrukturyzowane, dostępne w formacie, który LLM potrafi przetworzyć. Według Cisco AI Readiness Index tylko ok. 34 % firm ocenia swoją gotowość danych jako wystarczającą. Jeśli należycie do pozostałych 66 %, pipeline danych jest Waszym pierwszym projektem, a nie samo AI.
Ignorowanie EU AI Act. Od sierpnia 2026 obowiązują konkretne wymogi dla firm wdrażających systemy AI w regulowanych kontekstach. Jeśli kupujecie platformę, sprawdźcie, czy vendor dostarcza dokumentację compliance. Jeśli budujecie — dokumentacja compliance jest Waszą odpowiedzialnością. Ignorowanie tego aspektu dziś może oznaczać przerabianie rozwiązania w przyszłości.
Najczęstsze pytania
Czy ma sens testowanie gotowego rozwiązania jako proof-of-concept, a następnie zastąpienie go własnym?
Tak, ale pod warunkiem: pilot musi testować Państwa konkretny use-case, a nie generyczne demo. Jeśli pilot z kupionym rozwiązaniem pokaże, że use-case ma wartość, macie dowód dla inwestycji we własny build. Ważne, aby pilotowa architektura oddzielała logikę danych od platformy — migracja będzie wtedy łatwiejsza.
Co oznacza „model open-weight" z punktu widzenia licencji i zastosowania komercyjnego?
Modele takie jak Qwen 3 czy Mistral są wydane na licencji Apache 2.0 — można je wykorzystywać komercyjnie bez opłat licencyjnych. Llama 4 ma własną licencję (bezpłatne użycie komercyjne poniżej określonego limitu miesięcznych aktywnych użytkowników). Zawsze sprawdzajcie aktualne warunki licencyjne dla konkretnego modelu i wersji przed wdrożeniem.
Czy wdrożenie on-prem jest realne dla firmy bez dużego zespołu IT?
Tak, jeśli use-case jest wyraźnie określony. Jeden serwer GPU z Ollama i mniejszym modelem open-weight (na przykład Qwen 3 8B lub Phi-4 14B) potrafi wdrożyć doświadczony inżynier w ciągu jednego dnia. Trudniejsze jest wdrożenie produkcyjne z wysoką dostępnością, monitoringiem i CI/CD — to wymaga więcej. Właściwym wyborem dla firmy bez zespołu AI jest zazwyczaj zarządzane rozwiązanie on-prem ze wsparciem zewnętrznym, a nie samodzielna infrastruktura.
Kiedy fine-tuning jest częścią strategii „build", a kiedy nie?
Fine-tuning ma sens, gdy chcecie wyspecjalizować model na Wasz rejestr językowy, terminologię lub format wyników — i gdy macie wystarczającą ilość wysokiej jakości danych treningowych (orientacyjnie 5 000+ par przykładów dla podstawowego SFT). Jeśli nie macie danych lub jeśli problem potrafi dobrze rozwiązać odpowiednio zaprojektowany pipeline RAG, fine-tuning jest przedwczesną optymalizacją. Więcej o tej decyzji w artykule RAG vs fine-tuning.
Jaka jest najczęstsza przyczyna przekraczania budżetu przez projekty build?
Z naszej praktyki: niedoszacowanie ewaluacji i iteracji. Zbudowanie pierwszej wersji zajmuje przewidywalną ilość czasu — ale zmierzenie, czy działa, zidentyfikowanie, gdzie zawodzi, i naprawienie tego, zajmuje tyle samo czasu ponownie. Projekty, które uwzględniają to od początku, dostarczają w czasie i budżecie. Projekty, które zakładają, że pierwsza wersja będzie produkcyjna — nie.
*MP Industrial Solutions pomaga firmom przejść przez decyzję build vs buy z liczbami w ręku — od mapowania use-case'ów przez kalkulacje TCO aż po pierwsze wdrożenie produkcyjne. Jeśli stoją Państwo przed tą decyzją, chętnie ocenimy Państwa konkretny przypadek wspólnie.*
