Paweł Kijko, jeden z tegorocznych zwycięzców Call4Papers, ponownie zawitał na scenę semKRK#24 BIG! Podczas swojego wystąpienia poruszył temat tworzenia contentu eksperckiego, m.in. z wykorzystaniem narzędzi AI. Po treściwej prezentacji nie zabrakło pytań, na które pędzimy z odpowiedziami i zapraszamy do zapoznania się z wywiadem.
Jak wspominasz pierwsze wystąpienie na semKRK?
Paweł KijkoOgromny stres i pierwsza taka przeprawa w wystąpieniu. Przetestowałem swoją prezentację, gdyż następną miałem na Affiliate Summit East w Nowym Jorku - tą samą, ale po angielsku.
Ile czasu zajęło dojście do oceny contentu 10 na 10 przez księgowych?
Paweł KijkoMyślę że z miesiąc. Znaleźliśmy dobry model, a ja już miałem doświadczenie z konstrukcją artykułów przez API (one strukturalnie są inne niż poprzez aplikacje) i sporo testowałem ze studentami Uniwersytetu Warmińsko-Mazurskiego.
A co jeśli nie ma tematów na bloga, które mają wysoki potencjał, które stricte pasują do biznesu? Zbieżne tematy, w które można wpleść produkt?
Paweł KijkoZawsze zaczynam od pokrycia tematów dotyczących niszy. Nauczyłem się przez 15 lat pisania treści, że nie można patrzyć na jedno słowo kluczowe, a nawet klastry tematyczne czasem są mylące. Treść ekspercka to najlepsza treść na ten temat w Internecie.
Który model sprawdza Ci się najlepiej? Robiłeś jakieś rozlegle testy porównawcze?
Paweł KijkoTak. Skupiałem się na Gemini i ChatGPT. W Gemini najlepiej pisało nam się Gemini 2.5 Flash, a w Chat GPT obecnie stosuje GTP-5.5 (system) a wcześniej stosowałem GPT 5.4 (system). Zwracam tylko szczególną uwagę, że chodzi o pisanie artykułów z użyciem API modeli językowych, a nie korzystając z aplikacji.
Jest różnica. I według deklaracji firm, używanie API nie powoduje, że twoje zapytania wędrują do danych treningowych - przynajmniej w teorii.
Jak oceniasz ważność BIO autora? Czy faktycznie daje to dużą wartość?
Paweł KijkoKluczowe. Według mnie nadaje wartości artykułowi, ale i z drugiej strony, promuje autora.
Co sądzisz o prawach autorskich przy artykułach pisanych przez AI a podpisanych przez realne osoby?
Paweł KijkoWażne jest żebyś podał źródła skąd pobrałeś treści lub autorów które je napisali. W tym procesie masz pełną wiedzę o tym w oparciu o jakie materiały pisane są artykuły.
Jak bardzo księgowi musieli poprawiać wygenerowane treści? Czy AI mocno konfabulowało?
Paweł KijkoW większości poprawki wydawały mi się znikome. Myślę, że 40% artykułów ich nie zawierało w ogóle.
W pozostałych 40% poprawki były mało istotne. Myślę, że 20% zawierało istotne dodatki, a nawet księgowym zdarzało się skreślać całe zdania jako błędne.
Budowa RAG oparta na treści dostępnej w Internecie nie jest zbyt ryzykowna i aktualna? Może lepiej byłoby kierować tworzenie treści specjalistom?
Paweł KijkoEksperci księgowi Taxeo sprawdzali treści. Jedynym zagrożeniem jest fakt, że taki proces wymaga podejrzliwości do stworzonych treści - której często nam ludziom brakuje. Myślimy, że AI opiera się na własnych przemyśleniach i rozumuje jak człowiek, ale często mogą zdarzyć się halucynacje i trzeba to wyłapać.
W moim przypadku blokadą jest właśnie sprawdzenie merytoryczne tekstów przez np. księgowe. Jak wyglądał u Was ten proces?
Paweł KijkoNajpierw musisz przekonać szefa. Później musisz zaimplementować proces sprawdzania artykułów jako jeden z tasków w firmie do wykonania. Może mieć niski priorytet, ale musi być prędzej czy później wykonany. Warto też czasami bezpośrednio zwrócić się do pracowników z prośbą o przesunięcie taska wyżej w priorytetach.
A co z YMYL a treścią tworzona przez AI?
Paweł KijkoRobiliśmy kalkulatory finansowe (np. czy warto przejść na B2B z umowy o pracę) z treściami z AI i były to jedne z najlepszych stron. Więc wszystko co daje wartość użytkową jest dobrze oceniane przez Google, niezależnie czy pisze to AI czy nie.
Czy nie uważasz, że pisanie pod punktację nie ma już znaczenia dla retrievalu?
Paweł KijkoJeśli chodzi o punktację np. w programach jak contadu - nie sugeruję się nią. Jeśli chodzi o punktację nadawaną jako feedback przez odbiorców treści - jest dla mnie wyznacznikiem jej jakości.
Czy ludzie nie odpierają takich podcastów stworzonych przez AI? Czy ktoś ich słucha?
Paweł KijkoNa pewno jeśli użytkownik zorientuje się, że słucha Voice AI - a nie wiedział o tym, ma wrażenie, że uczestniczy w ściemie. Nie chce słuchać maszyny. Dlatego w Taxeo informujemy, że podcast jest wygenerowany przez AI, ale na podstawie treści sprawdzonych przez ekspertów. To daje różnice. Widzę, że ten trend rośnie. Można znaleźć wiele takich podcastów na Spotify, a nawet w podcastach Onet.
Jak z duplikacją treści podcast vs artykuł. Nie zachodziła czy wręcz napędzały się wzajemnie?
Paweł KijkoSą to byty niezależne. A nawet się wspierały. Zagnieżdżaliśmy w naszych artykułach iframe’y do podcastów. Same podcasty były wyszukiwane poprzez wyszukiwarkę Spotify.
Jak analizujesz oglądalność podcastu per wiek? Skąd wiesz, że to z powodu AI, a nie innych elementów? Próbowałeś zrobić go w wersji human i sprawdzić odsłuchania?
Paweł KijkoNie analizowałem wersji human. Pewnie byłoby lepiej. W Spotify masz podstawowe statystyki odbiorców - płeć, wiek, lokalizacja, platforma. Do tego ilość odsłuchań poszczególnych odcinków, ilość śledzących podcast - i statystyki te można analizować per odcinek.
Czy robiliście testy związane z widocznością artykułów wskazanych jako generowane vs niegenerowane?
Paweł KijkoNie mamy artykułów nie-generowanych. Jedynie takie ogłaszające współpracę czyli PRowe - ale nie miały na celu ściągania ruchu.
Czy tylko Bielika wykorzystywałeś (ze względu na nasz rodzimy język)? Czy może testowałeś inne modele językowe?
Paweł KijkoTestowałem Bielika. Bardzo chciałem, pisać jego modelami. Niestety w każdej próbie wyglądał gorzej od innych modeli. Dodatkowo, Bielik nie ma modułu w make.com którego używamy w całym procesie. Musiałem się nagimnastykować, żeby zrobić integrację, a i ona była niestabilna. Podkreślam, że korzystamy z API, a nie aplikacji.
Czy przeprowadzaliście podobne badania czytelnicze na użytkownikach bloga – jak odbierają teksty wygenerowane?
Paweł KijkoBardzo dobry pomysł. Na pewno będziemy chcieli.
Skąd wybór ChataGPT? Dlaczego nie wybrać polskiego modelu LLM?
Paweł KijkoBardzo chciałem zintegrować Bielika. Nawet dorobiłem integracje do make.com żeby łączyć się z jego API (okazała się mało stabilna). Nie mniej jednak odpowiedzi były znacznie gorsze niż w ChatGPT. Na przykład pisząc prompta - “w tekstach skup się na słowach kluczowych” Bielik mi odpowiadał umieszczając je sztywno w artykułach a nie w tekstach. Same teksty były wyraźniej krótsze.
Szukam zastosowania dla niego i wracam co jakiś czas do tematu Bielka. Na pewno go znajdę. Nie mniej jednak na pewno nie w jakości pisanych artykułów.
W moim procesie modele językowe są typowymi narzędziami do przetwarzania dokumentów, które im dostarczam. Nie ma tutaj kontekstu “polskości”. Bielik w benchmarkach wypada gorzej od innych modeli w takich zadaniach. Ale to nie oznacza, że nie znajdzie roli i u nas. Na pewno kiedyś go wykorzystamy. Warto wspierać polskie rozwiązania.
Paweł, dziękujemy Ci za uzupełnienie tematu i wyczerpujące odpowiedzi!
Na kolejne odpowiedzi standardowo wyczekujcie we wtorki i piątki.

Przeczytaj wywiad z Krzysztofem Miotkiem
Dowiedz się więcej o segmentacji klientów





















