Geneo Toolkit
Sztuczna inteligencja w genealogii – narzędzie, nie wyrocznia

Sztuczna inteligencja w genealogii – narzędzie, nie wyrocznia

Jeszcze kilka lat temu odczytanie zamazanego rękopisu po rosyjsku albo przetłumaczenie łacińskiego aktu chrztu wymagało albo specjalistycznej wiedzy, albo cierpliwości, albo znajomości właściwego eksperta. Dziś wystarczy wkleić skan do odpowiedniego narzędzia i poczekać kilkanaście sekund.

Sztuczna inteligencja weszła do genealogii z impetem i robi tam naprawdę użyteczne rzeczy. Problem w tym, że robi też rzeczy groźne — i robi je z taką samą pewnością siebie. Jeśli używasz AI w poszukiwaniach genealogicznych, ten artykuł jest dla Ciebie.

Co AI naprawdę potrafi

Zacznijmy od tego, gdzie AI faktycznie pomaga — i to bardzo.

Transkrypcja trudnych rękopisów

To jeden z najsilniejszych obszarów zastosowania AI w genealogii. Modele wytrenowane na historycznych pismach potrafią odczytać zamazane, wyblakłe lub pisane trudnym charakterem pisma dokumenty z zaskakującą dokładnością. Szczególnie dobrze radzą sobie z powtarzalną strukturą metryk — gdzie układ treści jest przewidywalny, a słownictwo ograniczone.

Tłumaczenie dokumentów

Łacina w aktach kościelnych, rosyjski w dokumentach Królestwa Kongresowego, starogermański w pruskich metrykach — AI tłumaczy to wszystko sprawnie i w kontekście. Nie perfekcyjnie, ale na tyle dobrze, żeby zrozumieć treść i wiedzieć, czego szukać dalej.

Sugestie wariantów i interpretacje

AI może zaproponować możliwe warianty zapisu nazwiska, wyjaśnić kontekst historyczny dokumentu czy pomóc zrozumieć strukturę administracyjną danego regionu w konkretnym okresie. To świetny punkt wyjścia do dalszych poszukiwań.

Wskazówka: AI najlepiej sprawdza się jako tłumacz i asystent do wstępnej analizy. Wynik jej pracy traktuj jak hipotezę do weryfikacji — nie jak gotową odpowiedź.

Gdzie AI zawodzi – i dlaczego to niebezpieczne

Tu zaczyna się trudniejsza część. AI ma fundamentalną wadę, która w genealogii jest szczególnie groźna: nie wie, czego nie wie. Gdy napotka lukę w danych, nie mówi „nie mam pewności" — uzupełnia tę lukę czymś, co brzmi wiarygodnie.

Halucynacje — zmyślone fakty podane pewnym głosem

Halucynacje to techniczny termin na sytuację, gdy model generatywny produkuje informacje, które nie mają pokrycia w rzeczywistości. W genealogii wygląda to tak:

  • pytasz o konkretną osobę — AI podaje datę urodzenia, której w żadnym dokumencie nie ma,
  • prosisz o sygnaturę archiwalną — AI wymyśla numer, który nie istnieje,
  • chcesz uzupełnić drzewo — AI „odnajduje" pradziadka, który nigdy nie żył.

Najgroźniejsze jest to, że halucynacje brzmią dokładnie tak samo jak prawdziwe odpowiedzi. AI nie sygnalizuje niepewności — po prostu mówi.

Błędne odczyty w transkrypcji

Nawet w transkrypcji, gdzie AI jest najsilniejsza, zdarzają się błędy — i to błędy systematyczne. Podobnie wyglądające litery w starych pismach (n/u, a/o, r/n) mogą być konsekwentnie mylone. Jeśli nie sprawdzisz wyniku przy skanie, możesz przez miesiąc szukać osoby o nazwisku, które nigdy nie istniało.

Uwaga: Nigdy nie cytuj odpowiedzi AI jako źródła genealogicznego. „Według AI mój pradziadek urodził się w 1872 roku" to nie jest źródło — to hipoteza, którą dopiero trzeba zweryfikować w dokumencie.

Złote zasady korzystania z AI w genealogii

Mając świadomość zarówno możliwości, jak i ograniczeń, można wypracować podejście, które pozwoli czerpać z AI korzyści bez wpadania w pułapki.

  • AI jako punkt wyjścia, nie konkluzja — każdą informację uzyskaną od AI traktuj jak wskazówkę do sprawdzenia, nie jak fakt.
  • Zawsze wracaj do źródła pierwotnego — jeśli AI odczytała datę z metryki, sprawdź ją na skanie. Jeśli AI przetłumaczyła dokument, wróć do oryginału przy kluczowych fragmentach.
  • Pytaj o proces, nie o wynik — zamiast „kim był mój pradziadek Jan Kowalski?", pytaj „jak mogę szukać Jana Kowalskiego w aktach z Królestwa Kongresowego z lat 1850–1880?" — to drugie pytanie daje sprawdzalną metodę, nie niezweryfikowany fakt.
  • Ufaj ograniczeniom bardziej niż pewności — model, który mówi „nie jestem pewien" jest bardziej wiarygodny niż ten, który zawsze odpowiada z pewnością siebie.
  • Dokumentuj źródła niezależnie od AI — twoje drzewo genealogiczne powinno opierać się na dokumentach, nie na odpowiedziach algorytmu.

Jak podchodzimy do tego w geneo-toolkit.pl

Budując geneo-toolkit.pl, od początku zdawaliśmy sobie sprawę z tych ograniczeń. Dlatego AI jest w naszych narzędziach jednym z elementów procesu — nie jego końcem.

Gdy wgrywasz dokument, AI go odczytuje i transkrybuje. Ale na tym nie kończymy: wyniki są automatycznie sprawdzane przez cross-matching z Twoim plikiem GEDCOM — jeśli znalezione nazwisko lub miejscowość pojawia się już w Twoim drzewie, system od razu to sygnalizuje. Co więcej, każde znalezione nazwisko i miejscowość są oznaczane bezpośrednio na skanie dokumentu, dokładnie w miejscu, gdzie AI je odczytała — żebyś mógł jednym spojrzeniem zweryfikować odczyt przy oryginale.

A jeśli AI się pomyli? Możesz poprawić odczyt ręcznie. Żadnych czarnych skrzynek, żadnych wyników, których nie możesz sprawdzić — tylko Ty, dokument i narzędzie, które Ci w tym pomaga.

Podsumowanie

AI to jedno z najpotężniejszych narzędzi, jakie trafiły do rąk genealogów — i jedno z najbardziej ryzykownych, jeśli używa się go bez świadomości jego ograniczeń. Transkrypcja, tłumaczenie, kontekst historyczny — tu AI naprawdę pomaga. Daty, sygnatury, konkretne fakty o konkretnych osobach — tu zawsze wracaj do źródła.

Dobra genealogia opiera się na weryfikowalnych dokumentach, nie na sugestiach algorytmu. I właśnie na tej zasadzie staramy się budować geneo-toolkit.pl.

← Wróć do bloga