Astro Basics

Ako to funguje pod kapotou: Ako staviame právneho AI asistenta – Časť 1

Zadáte do vyhľadávania „monitorovanie pracovnej komunikácie“, ale nič nenájdete. Skúsite „uchovávanie e-mailov na archiváciu“ — stále nič. Asi iba zle hľadáte, alebo treba skúsiť ďalší nástroj. Možno prejsť na Google.

Nie, to nie je vaša chyba. To je chyba systému.

Tento príspevok je prvý zo série, v ktorej vám ukážem, ako funguje náš AI právny asistent, ktorý pomáha nájsť právne odpovede rýchlejšie, inteligentnejšie a bez frustrácie. Rozoberieme technické základy, na ktorých je postavený — od sémantického vyhľadávania a spracovávania textov až po systémové príkazy a prácu s dokumentami — a to všetko v právnom kontexte.


Problém tradičného právneho vyhľadávania

Dnešné právne vyhľadávanie je často skôr detektívka než práca s informáciami.

Z našej skúsenosti vieme, že právnici nepoužívajú len jeden nástroj. Striedajú Slov-lex, rôzne platené nástroje alebo — keď už nič nezaberá — skúšajú Google či dokonca české právne predpisy.

Jeden a ten istý dopyt opakujú dookola, len mierne menia formuláciu, skúšajú synonymá, s diakritikou aj bez nej.

Tradičné vyhladávanie funguje bud na systméme ze každé slovo sa musí presne nachádzať v texte ktorí sa najde. Čo ale znamená že často sa nič nenajde. Alebo sa nájde každý text ktory obsahuje aspon jedno slovo z vyhladávania. Čo ale znamená ze zväčša je príliš vela výsledkov.

A tu je ten najväčší problém:

Keď niečo hľadáte a nič nenájdete, neviete, či to naozaj neexistuje — alebo iba systém nepochopil, čo ste mali na mysli.


Alternatívne spôsoby vyhľadávania

Fulltext

Na rozdiel od klasického vyhľadávania je fulltextové vyhľadávanie pokročilejšie.

Umožňuje vyhľadávať automaticky s diakritikou aj bez nej, rozpoznáva rôzne tvary slov (napríklad sledovať, sledovanie, sledovaný) a inteligentne zoraďuje výsledky podľa pravdepodobnosti zhody. Tým sa zvyšuje šanca, že sa relevantné výsledky objavia aj pri menej presnej formulácii.

Niektoré pokročilejšie systémy dokonca umožňujú upravovať dopyt pomocou znakov ako „-“, „+“ alebo „*“ na vylúčenie slov či čiastočné zhody.

Výhodou je aj rýchlosť a presnosť pri jasne formulovaných dotazoch. Fulltext sa dobre hodí na vyhľadávanie názvov zákonov, konkrétnych paragrafov alebo známych fráz — najmä ak viete presne, čo hľadáte.

Stále však treba poznať konkrétne slová, ktoré sa v texte spomínajú, vedieť pracovať s komplexným systémom a byť ochotný prechádzať množstvom výsledkov — často rádovo väčším.


Chytrejšie vyhľadávanie pomocou sémantiky

Sémantické vyhľadávanie funguje úplne iným spôsobom. Nehľadá konkrétne slová, ale význam. (Viac o tom, ako funguje sémantické vyhľadávanie a embeddings, si povieme v ďalšom článku.) V skratke — snaží sa zachytiť „podstatu“ slov alebo viet a nájsť významovo podobné časti textu, aj keď sú formulované úplne inak.

Takže frázu „sledovanie elektronickej komunikácie“ môže systém nájsť aj cez dotazy ako „uchovávanie e-mailov na archiváciu“, „polícia – zbieranie a analyzovanie SMS správ“ alebo „monitorovanie pracovnej komunikácie“.

Tento prístup je mimoriadne užitočný vtedy, keď presne neviete, aké slová by sa mali v texte nachádzať, alebo keď sa predpis či súdne rozhodnutie vyjadruje inak, než vy.

Samozrejme, aj tento prístup má svoje obmedzenia, ktorým sa budeme venovať neskôr.


Hybridné vyhľadávanie: To najlepšie z oboch svetov

Najlepší prístup je kombinovať výhody oboch alternatívnych systémov. Využiť presnosť a rýchlosť fulltextu tam, kde presne vieme, čo hľadáme — a použiť sémantické vyhľadávanie tam, kde nám jednoduché porovnávanie slov nič zmysluplné nevracia.

Zisťovanie, ktorý typ vyhľadávania použiť a ako ich skombinovať, prebieha u nás automaticky. Nemusíte sa teda učiť žiadne zložité systémy.

Taktiež používame viacero trikov, ako túto kombináciu ešte vylepšiť — napríklad sémantiku zapájame najmä pri dlhších dopytoch, aplikujeme stemming, skúšame použiť synonymá slov, predspracovávame dopyt na špecifické frázy a podobne.


V ďalšom článku sa pozrieme na embedovanie — teda na to, ako dokáže systém „pochopiť“ význam viet pri sémantickom vyhľadávaní.

Ak vás to zaujalo, vyskúšajte si náš nástroj na praktik.ai. Skúste zadať vlastný právny problém a porovnajte výsledky s tým, čo by ste našli manuálne. Alebo sa nám ozvite priamo — radi poskytneme viac informácií, ukážku alebo spätnú väzbu k vášmu konkrétnemu prípadu.