Gemini Image w n8n — automatyczna edycja zdjęć produktów dla e-commerce

Kacper17 czerwca 2026 · 3 min czytania

Streszczenie

→ Film: Gemini Imagen w n8n — edycja zdjęć krok po kroku
→ Do czego możesz tego użyć?
→ Krok 1: Klucz API Google Gemini
→ Krok 2: Workflow w n8n — struktura

Gemini Image w n8n — automatyczna edycja zdjęć produktów dla e-commerce

Zmiana tła zdjęcia produktu ręcznie — 5 minut na sztukę. Masz 500 produktów w sklepie? To 40 godzin roboty. Albo 15 minut konfiguracji w n8n i Gemini Imagen robi to za Ciebie automatycznie, dla każdego zdjęcia które wrzucisz do formularza.

Szkolenia AI dla firm · 30 min

Przeszkól zespół z AI, którego realnie użyje w pracy

Copilot, Gemini, ChatGPT, n8n — warsztat na Waszych procesach. Bez generycznej prezentacji o AI.

Kacper Sieradziński · founder Dokodu

4,9 · zwykle odpowiada w 2h

Wybierz dogodny termin bezpłatnej rozmowy (30 min).

Umów bezpłatną rozmowę

Film: Gemini Imagen w n8n — edycja zdjęć krok po kroku

Poniżej pełny tutorial z konfiguracją każdego węzła.

Do czego możesz tego użyć?

Gemini Imagen to model Google do generowania i edycji obrazów. W połączeniu z n8n możesz zautomatyzować:

E-commerce — usuwanie tła ze zdjęć produktów, ujednolicanie tła na białe
Sklep z okularami — przymierzanie oprawek na zdjęcie klienta
Fryzjerstwo — symulacja fryzur na zdjęciu przed wizytą
Architektura i wnętrza — zmiana kolorów ścian, wstawianie mebli do pustego pokoju
Marketing — modyfikacja zdjęć kampanii bez Photoshopa

Wszystko przez jeden prompt tekstowy.

Krok 1: Klucz API Google Gemini

Wejdź na aistudio.google.com:

Lewy panel → API Keys
Create API key → wybierz projekt (lub utwórz nowy)
Skopiuj klucz

Koszty: Model ma darmowy tier, ale przy intensywnym użyciu możesz trafić na limit. Przy konfiguracji konta płatnego kosztuje kilka groszy za obraz — wielokrotnie taniej niż ręczna edycja.

Krok 2: Workflow w n8n — struktura

Workflow składa się z 6 węzłów:

Form Trigger → Extract from File → Code (sanitize) → Set (variables) → HTTP Request → Code (decode) → Convert to File

Krok 3: Form Trigger — formularz wejściowy

Dodaj węzeł Form Trigger z dwoma polami:

prompt — typ: Text, wymagane
image — typ: File, akceptowane formaty: image/jpeg, image/png, wymagane, Multiple files: OFF

Po zapisaniu kliknij Execute Step — otworzy się formularz do testowania.

Krok 4: Extract from File — konwersja do Base64

Zdjęcie które użytkownik wrzuca do formularza trzeba przekonwertować do Base64 zanim wyślesz je do API Gemini.

Dodaj węzeł Extract from File:

Operation: Move File to Base64 String
Input Field Name: image (nazwa pola z formularza)
Output Field Name: image

Czym jest Base64? To sposób zapisu danych binarnych (jak zdjęcie) jako tekst. API Gemini nie przyjmuje pliku bezpośrednio — przyjmuje tekst reprezentujący ten plik.

Krok 5: Code — sanityzacja promptu

Polskie znaki i cudzysłowy w prompcie mogą wysypać żądanie HTTP. Węzeł Code (JavaScript) czyści prompt:

JavaScript
1
2
3
4
5
6
7
8
9
10
11
const items = $input.all();
return items.map(item => {
  const raw = item.json.prompt || '';
  const sanitized = JSON.stringify(raw).slice(1, -1); // escape special chars
  return {
    json: {
      ...item.json,
      sanitizedPrompt: sanitized
    }
  };
});

Krok 6: Set — zmienne

Węzeł Edit Fields zbiera dwie wartości w jednym miejscu:

image ← wartość z Extract from File ({{ $('Extract from File').item.json.image }})
key ← Twój klucz API Gemini (wklej bezpośrednio lub użyj n8n Credentials)

Krok 7: HTTP Request — wywołanie Gemini API

Dodaj węzeł HTTP Request:

Method: POST
URL: https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp:generateContent
Headers:
- x-goog-api-key → {{ $json.key }}
- Content-Type → application/json
Send Body: ON, format: JSON
Body:

JSON
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
{
  "contents": [
    {
      "parts": [
        {
          "text": "{{ $('Code').item.json.sanitizedPrompt }}"
        },
        {
          "inline_data": {
            "mime_type": "image/jpeg",
            "data": "{{ $json.image }}"
          }
        }
      ]
    }
  ],
  "generationConfig": {
    "responseModalities": ["IMAGE", "TEXT"]
  }
}

Krok 8: Dekodowanie odpowiedzi

Gemini zwraca edytowany obraz jako... Base64. Trzeba go odkodować z powrotem do pliku. Węzeł Code:

JavaScript
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
const items = $input.all();
return items.map(item => {
  const parts = item.json?.candidates?.[0]?.content?.parts || [];
  const imagePart = parts.find(p => p.inlineData?.data);

  if (!imagePart) {
    return { json: { error: 'Brak obrazu w odpowiedzi' } };
  }

  return {
    json: {
      imageBase64: imagePart.inlineData.data,
      mimeType: imagePart.inlineData.mimeType || 'image/jpeg'
    }
  };
});

Krok 9: Convert to File — gotowy plik

Ostatni węzeł Convert to File:

Operation: Move Base64 String to File
Input Field Name: imageBase64
Output File Name: wynik.jpg

Po tym kroku masz gotowy plik z edytowanym zdjęciem — możesz go zapisać na dysk, wysłać mailem, wrzucić do CDN.

Przykłady promptów

Usuń tło i zastąp je białym — zachowaj produkt bez zmian

Zmień kolor ścian na jasnoniebieski

Dodaj modne okulary przeciwsłoneczne do tej osoby

Zmień fryzurę na krótkie włosy z grzywką

Dalej w tym klastrze

Chcesz zautomatyzować obróbkę zdjęć produktów w swoim sklepie? Porozmawiajmy →

Tagi

#AI#automatyzacja#n8n#Gemini#Gemini Imagen

Najczęściej zadawane pytania

Przy płatnym koncie Google AI Studio koszt to około 0.04-0.08 zł za wygenerowany obraz, czyli 80-150 zł za 1000 zdjęć. Dla porównania: freelancer na Useme/Fiverr za podobny wolumen weźmie 10-20 tys. zł i 2-3 tygodnie czasu, a wewnętrzny grafik to ~166 godzin pracy (przy 5 min/zdjęcie). Doliczasz tylko koszt utrzymania n8n (np. self-hosted na Hetzner za ~50 zł/mies.) i jednorazową konfigurację workflow.

Częściowo. Gemini Imagen dobrze radzi sobie z usuwaniem tła, ujednoliceniem kolorów tła i prostymi modyfikacjami, ale przy bardzo wysokich wymaganiach brand consistency (konkretny look kosmetyków, moda premium, biżuteria) model może subtelnie przesuwać kolory i kompozycję. Dla marek premium rekomendujemy hybrid: Gemini do listingowych białych teł i prostych wariantów, lokalny Stable Diffusion z Flux LoRA wytrenowanym na zdjęciach marki dla hero shotów i kampanijnych zdjęć.

Dodaj w n8n węzeł Wait z exponential backoff w error path z HTTP Request. Pierwszy retry po 5 sekundach, drugi po 15, trzeci po 60. Jeśli i to nie pomoże — log do bazy i przejdź dalej, wrócisz do failed items osobnym workflow. W praktyce przy płatnym koncie 429 zdarza się rzadko, a workflow z retry logic ratuje sytuację gdy Google chwilowo zdławi region.

Po węźle Convert to File dodaj węzeł HTTP Request (albo natywny Shopify/WooCommerce node w n8n) z wywołaniem API platformy: Shopify Admin API (endpoint products/PRODUCT_ID/images) lub WooCommerce REST API (products/PRODUCT_ID z polem images). Workflow przekaże link do pliku i SKU jako identyfikator produktu. Kluczowe: w trigerze workflow musisz mieć mapping SKU → product_id, najwygodniej w Postgres lub Airtable jako lookup table.

Tak, ale nie z Gemini Imagen — to model API-only Google. Lokalna alternatywa to Stable Diffusion (np. Flux) w ComfyUI uruchomiony na karcie RTX 3090/4090, podłączony do n8n przez HTTP Request do lokalnego API ComfyUI. Daje pełną kontrolę nad stylem (przez LoRA), brak wysyłania danych do chmury (ważne dla branż regulowanych) i kosztu API. Wymaga jednorazowej inwestycji w GPU (~10-15 tys. zł) i wiedzy o konfiguracji ComfyUI.

Gemini Image w n8n — automatyczna edycja zdjęć produktów dla e-commerce

Przeszkól zespół z AI, którego realnie użyje w pracy

Film: Gemini Imagen w n8n — edycja zdjęć krok po kroku

Do czego możesz tego użyć?

Krok 1: Klucz API Google Gemini

Krok 2: Workflow w n8n — struktura

Krok 3: Form Trigger — formularz wejściowy

Krok 4: Extract from File — konwersja do Base64

Krok 5: Code — sanityzacja promptu

Krok 6: Set — zmienne

Krok 7: HTTP Request — wywołanie Gemini API

Krok 8: Dekodowanie odpowiedzi

Krok 9: Convert to File — gotowy plik

Przykłady promptów

Dalej w tym klastrze

Tagi

Najczęściej zadawane pytania

Ile realnie kosztuje wygenerowanie 1000 zdjęć produktów przez Gemini Imagen w 2026?

Czy Gemini Imagen w n8n nadaje się dla marek premium z wysokim wymaganiem brand consistency?

Co jeśli Gemini API zwraca błąd 429 (rate limit) w środku batcha 2000 zdjęć?

Jak zintegrować ten workflow z Shopify/WooCommerce żeby automatycznie podmieniać zdjęcia w produktach?

Czy mogę użyć tego workflow lokalnie zamiast wysyłać zdjęcia produktów do Google?

Najczęściej zadawane pytania

Ile realnie kosztuje wygenerowanie 1000 zdjęć produktów przez Gemini Imagen w 2026?

Czy Gemini Imagen w n8n nadaje się dla marek premium z wysokim wymaganiem brand consistency?

Co jeśli Gemini API zwraca błąd 429 (rate limit) w środku batcha 2000 zdjęć?

Jak zintegrować ten workflow z Shopify/WooCommerce żeby automatycznie podmieniać zdjęcia w produktach?

Czy mogę użyć tego workflow lokalnie zamiast wysyłać zdjęcia produktów do Google?