DevaGroup Blog Haystack Search Relevance Conference 2023 – relacja

Haystack Search Relevance Conference 2023 – relacja

Aleksandra Pizoń-Liwocha
Archiwum 03.2023

Haystack Search Relevance Conference 2023
– relacja i podsumowanie

23 lutego w Krakowie, w siedzibie edrone odbyła się kolejna konferencja z serii Haystack on tour – The search relevance. Spotkanie zorganizowane zostało przez edrone oraz założycieli Haystack – Open Source Resolutions. Tego dnia zapewniono nam 3 sesje z merytorycznymi prelekcjami światowej klasy specjalistów. Nie obyło się też bez ciekawych rozmów i smacznych finger foodów w trakcie przerw kuluarowych. Zapraszamy na krótką relację z wydarzenia.

Organizatorzy wydarzenia:

Haystack – to zespół specjalistów ds. wyszukiwarek Ich podejście opiera się na danych naukowych i skupieniu na potrzebach biznesowych. Pomagają organizacjom w USA i Europie budować potężną, skalowalną, dokładną i odpowiednią wyszukiwarkę, aby wzmocnić sukces ich zespołów różnorodnymi narzędziami, procesami, treningami czy konsultacjami. Działania te prowadzą poprzez budowanie narzędzi open source do ulepszenia wyszukiwarek w platformach sklepowych. Cyklicznie prowadzą również konferencje w celu poszerzenia wiedzy w branży na temat ich ulubionej dziedziny.

Edrone – partner DevaGroup. Założycielami firmy są Michał Blak i Rahim Blak, którzy poprzez prowadzenie agencji i obsługiwanie wielu sklepów online zauważyli lukę na rynku. Małe i średnie e-commerce nie miały dostępu do narzędzi, które spełniałyby ich potrzeby. Misją stało się dostarczanie nowoczesnych narzędzi i technologii, które skutecznie zwiększają zaangażowanie klientów oraz sprzedaż dla e-commerce. Swoje działania rozwinęli do 1200+ klientów na całym świecie. Dodatkowo posiadają 20+ osób w zespole badawczo-rozwojowym pracujących nad wyszukiwarkami głosowymi.

Haystack blog

SESJA I

Charlie Hull – Intro: Dlaczego wyszukiwanie jest wciąż tak trudne do prawidłowego wdrożenia?

Charlie Hull (współzałożyciel i dyrektor zarządzający Flax) opowiadał o wyzwaniach, jakie stoją przed wyszukiwarkami. Razem ze swoim zespołem podkreślają, że sama wyszukiwarka nie jest jedynym problemem braku sprzedaży. Ważny jest też poprawny kontekst dla danego zapytania przyszłego klienta. Trafność wyszukiwania jest subiektywna. Charlie pokazał to na konkretnych przykładach np. poprzez wpisanie słowa “kawiarka”. Mogą się nam ukazać wyniki zarówno profesjonalnego ekspresu do kawy, jak i prostego czajniczka do zaparzania kawy. Odpowiednie dopasowanie wyników ma więc kluczowe znaczenie.

Twórcy wyszukiwarek zaczęli zadawać sobie następujące pytania:

Czy wyniki które wpisuję w wyszukiwarkę są trafne?
Jak mogę to zmierzyć?
Jakie metryki mogę wykształcić do tych pomiarów?

Pomimo bardzo dużego wyboru wyszukiwarek na rynku, wybór tej odpowiedniej okazał się dla firm wyzwaniem. Dlatego powstała firma Haystack – aby sprostać temu zadaniu i rozwijać wiedzę oraz narzędzia w powiązanej tematyce. Jak wspomniał “nie wszystko złoto, co się świeci” – dane narzędzie może dobrze wyglądać i działać, ale pomimo to w danym biznesie się nie sprawdzi.

René Kriegler: W kierunku systematycznych usprawnień jakości wyszukiwania

René Kriegler (dyrektor Wyszukiwania e-commerce w firmie Open Source Connections), pracuje nad wyszukiwarkami od około 16 lat. W swojej dotychczasowej działalności skupił się na wyszukiwarkach w e-commerce, pracując z 10 dużymi niemieckimi sprzedawcami detalicznymi. Podczas prelekcji mówił o trudności z wyznaczaniem i dowożeniem odpowiednich KPI (key performance indicators – kluczowy wskaźnik efektywności) dla biznesu oraz sprawdzaniem czy system wyszukiwania jest poprawny.

Zaproponował model ustalania takiego procesu biznesowego oraz przedstawił kilka pomagających w takim procesie pytań:

Jak rozumiemy cele i potrzeby naszego użytkownika?
Jakie wyniki osiągają użytkownicy/biznes?
Jak możemy zmierzyć te wyniki z łatwiejszymi do uzyskania wiodącymi wskaźnikami?

René wskazał też różnice pomiędzy wiodącymi/wstępnymi (leading KPIs), a późniejszymi celami biznesowymi KPI (lagging KPIs). René zaznaczył, że możemy odczuwać przytłoczenie poprzez złożone zagadnienia KPI. Zalecił, aby łączyć dane z własnym osądem i doświadczeniem. Mogą one pomóc nawiązać odpowiednie porozumienie pomiędzy zespołami pracującymi nad rozwojem wyszukiwarek, a managerami, a także usprawnić proces wdrażania testów A/B.

Prelegent pokazał też działanie jednego z narzędzi: Quepid demo, które sprawia, że ulepszanie wyników wyszukiwania Twojej aplikacji jest powtarzalnym, niezawodnym procesem inżynieryjnym, zrozumiałym dla całego zespołu. Działanie aplikacji opiera się na zbieraniu i optymalizacji opinii o przydatności wyszukiwania w trybie offline.

SESJA II

Piotr Stachowicz: Wyszukiwanie głosowe – wyzwania i możliwości

Drugą sesję po krótkiej przerwie rozpoczął Piotr Stachowicz, CTO edrone. Podkreślał, jak wielki odsetek wyszukiwań stanowią obecnie te przeprowadzane z urządzeń mobilnych (75%) oraz podkreślał fakt, że wyszukiwania głosowe są znacznie szybsze niż te wpisywane ręcznie. Charakteryzują się one również tym, że zazwyczaj są dłuższe i bardziej precyzyjne. Z drugiej strony jednak, wyszukiwarki głosowe mają jeszcze pewien problem w zrozumieniu kontekstu zapytania. Często gubią się w homonimach, których po prostu nie rozumieją w sposób intuicyjny, jak to dzieje się u człowieka. Jako sztandarowy przykład tego zjawiska Piotr podał case z życia wzięty: “show me a bat” vs. “show me a butt”. Wyzwaniem dla NLU (Natural Language Understanding) jest również przywoływanie odpowiednich wyników w przypadku poszukiwania przez użytkownika konkretnych przedmiotów np. bluzki bez pasków – w takich sytuacjach często wyniki wyszukiwania prezentują produkty wprost odwrotne od tych z zapotrzebowania internauty.

Arek Flinik (Lekta.AI): Wyszukiwanie w świecie rzeczywistym – dlaczego ludzie nie zawsze chcą tego, co mówią, że chcą – wnioski dotyczące UX wyciągnięte z wdrożenia funkcji wyszukiwania w komercyjnych aplikacjach głosowych

Kolejny prelegent – Arek Flinik, współzałożyciel aplikacji Lekta.ai – pełni stanowisko Produkt Managera i inżyniera oprogramowania, odnosząc sukcesy w kilku Polskich startupach. Podczas prelekcji wdrożył nas w zagadnienie budowania dobrych wyszukiwarek i botów głosowych, potrafiących nawiązywać wartościowe konwersacje z klientami.

Wskazał kilka wyzwań, z jakimi musi się mierzyć dostosowanie “user experience” dla wyszukiwań głosowych, m.in.:

niezrozumiała mowa – niepoprawne rozpoznawanie wymowy, odgłosy z zewnątrz, zakłócenia w przekazywaniu komend głosowych;
oczekiwania ludzi względem AI (sztucznej inteligencji);
niewłaściwa konstrukcja systemu – nowa technologia zastępowana przez stare systemy;
ludzie są trudni – nikt nie wie czego tak naprawdę chcą, nie potrafią się jasno wyrazić.

Podczas prezentacji wspomniał też o kilku błędnych założeniach w kreowaniu odpowiedzi przez chatboty:

Pamiętaj, że wiesz lepiej czego chcą użytkownicy.
Nie bierz tego, co mówią użytkownicy zbyt poważnie.
Prawda nie jest aż tak ważna.
Dodaj kilka wyników, które nie mają sensu.
Po co ten pośpiech? Inni mogą poczekać, by uzyskać konkretniejszą odpowiedź.

Zaznaczył, że konstruowanie dobrego chatbota z odpowiedziami jest jak gra “Akinator”. Tylko zadawanie odpowiednich pytań może zawęzić poszukiwania do poprawnych i efektywnych odpowiedzi. Budowanie takiego narzędzia jest nie lada wyzwaniem przez pryzmat tego jak unikatowi są ludzie. Różnorodność jest tutaj kluczowym czynnikiem. Uczestnikiem takiej rozmowy może być nastolatek, który sam nie wie jak powinno wyglądać poprawne zapytanie lub osoba starsza, której komenda może trwać nawet 5 minut przez dodanie całości kontekstu sytuacji, zamiast precyzyjnego i adekwatnego do potrzeby pytania. Te wszystkie czynniki sprawiają, że istnieje jeszcze duża przestrzeń do ulepszenia świata ludzi i wyszukiwarek głosowych.

SESJA III

Atita Arora: Wektoryzacja wyszukiwania w e-commerce

Przedostatnią prelegentką, a jednocześnie jedyną kobietą wśród występujących była Atita Arora, która z tematyką Search ma styczność już od 2008 roku i w tym czasie zaangażowała się w różne opensource’owe projekt takie jak: Quepid, Chorus, OpenNLP, Solr czy Opensearchserver. Na konferencji organizowanej przez Haystack wyjaśniła jak wyszukiwanie wektorowe konwertuje tekst w połączenia numeryczne przy wykorzystaniu wybranego “przekształcacza” (jak Bert czy miniLM), a następnie indeksuje i przeszukuje te semantyczne połączenia.

Jaka jest podstawowa różnica między wyszukiwaniem tradycyjnym a wektorowym? Pierwsze bazuje na słowach kluczowych, natomiast drugie wykorzystuje semantykę do przeszukiwania dokumentów i dopasowywania ich do zapytania. Gdzie widać największy potencjał wyszukiwania wektorowego? Atita wskazuje, że skorzystać na nim mogą frazy z długiego ogona, wyszukiwania zero-click (zero-hit), a także wyszukiwanie multilingwalne. Wektoryzacja sprzyja też odnajdywaniu podobnych produktów, a także użytkowników o zbliżonych zainteresowaniach. W celu zoptymalizowania wyszukiwań w e-commerce poleca wykorzystanie narzędzia Chorus.

Zbyszko Papierski: Deduplikacja treści – podejście wektorowe a podejście oparte na słowach kluczowych

Ostatnią z osób występujących był Zbyszko Papierski, kierownik ds. technologii wyszukiwania w Brainly. Również on – jednak pod nieco innym kątem niż Atita – skupił się na opozycji klasycznego i wektorowego podejścia do wyszukiwania. Jego polem badawczym tym razem są głównie zapytania generowane przez uczniów pragnących zdobyć konkretną odpowiedź na zadane pytanie. Podkreślił, że kontekst edukacyjny jest skomplikowany i różnorodny. Tym bardziej, że zadający pytanie często tworzy niekompletne komendy lub do jednego zapytania dokleja kolejne lub niepełną część kolejnego.

Opisywał różne rodzaje podejść, które testował z różnymi wynikami końcowymi pod kątem dwóch aspektów związanych z trafnością wyszukiwania, tj. precision (pozytywna wartość predykcyjna) i recall (czułość – frakcja istotnych instancji, które zostały wyszukane). Najbardziej efektywnym okazało się podejście bazujące na słowach kluczowych – zarówno pod kątem trafności, jak i kosztów.

Podsumowanie

Krakowska konferencja Haystack Search Relevance pokazała, jak ważnym i głębokim zagadnieniem jest wyszukiwanie w e-commerce. Nie chodzi tylko o klasyczne wyszukiwania, ale również te odnoszące się do podejścia wektorowego czy też potencjał wyszukiwania głosem. Wszyscy zainteresowani tematem wyszukiwania w e-commerce mogli liczyć na ciekawe i merytoryczne wystąpienia kompetentnych prelegentów, którzy nadmienili też, jak ciekawa może być przyszłość searchu w dobie ChatGPT. Po każdej prelekcji padały pytania z publiki, a za te najciekawsze uczestnicy mogli zdobyć książki i słodycze. Po konferencji natomiast odbył się luźny networking, podczas którego omawiane były wszystkie zagadnienia zbierane na tablicy pomysłów podczas całego wydarzenia. Haystack zapowiedziało, że krakowska edycja konferencji nie jest ostatnią w planach. Z chęcią zagoszczą jeszcze w naszym kraju.

zakończenie haystack

Aleksandra Pizoń-Liwocha

Senior SEM Specialist. Certyfikowana specjalistka Google Ads i Google Analytics. Zajmuje się zarządzaniem kampaniami w Google Ads, Facebook Ads czy TikTok Ads. Uwielbia patrzeć, jak przychody Klientów rosną i z zafascynowaniem poszerza horyzonty w marketingu internetowym. Relaksuje się podczas szalonych wyjazdów i wędrówek po górach. Po intensywnym dniu lubi się zaszyć w kuchni lub wyciszyć z dobrą książką.

Natalia Golisz

Były pracownik na stanowisku Seo Specialist. Pozycjonowaniem i optymalizacją zajmuje się od 2014 roku. W DevaGroup zajmuje się prowadzeniem kampanii SEO, optymalizacją stron klientów pod kątem najnowszych trendów. Posiada doświadczenie w in-house'owych kampaniach e-commerce. Po godzinach relaksuje się poprzez aktywność w sportach walki.

Podobał Ci się artykuł? Wystaw 5!