Naukowcy z Danii wykorzystali potężne algorytmy uczenia maszynowego do dokładnego określenia różnych aspektów ludzkiego życia, w tym tego, kiedy dana osoba może umrzeć.
Profesor Sune Lehmann Jorgensen z Duńskiego Uniwersytetu Technicznego i jego współpracownicy wykorzystali zbiór danych dotyczących całej Danii, obejmujący edukację, wizyty u lekarzy i pobyty w szpitalach, wszelkie wynikające z nich diagnozy, dochody i zawody 6 milionów mieszkańców tego kraju w latach 2008–2020. Ten wielki zbiór danych został przekształcony w słowa, które można wykorzystać do uczenia dużego modelu językowego opartego na sztucznej inteligencji.
- Z tym rodzajem danych możemy przewidzieć wszystko - powiedział Sune Lehmann, główny autor badania i profesor Technical University of Denmark.
Jak działa ChatGPT
Modele takie np. ChatGPT działają poprzez analizę serii słów i określenie, które słowo ma statystycznie największe prawdopodobieństwo, że pojawi się jako następne, w oparciu o ogromną liczbę przykładów. Sztuczna inteligencja, która została wyszkolona na danych osobowych obejmujących całą populację Danii może przewidzieć ryzyko śmierci z większą dokładnością niż jakikolwiek istniejący model, nawet ten stosowany w branży ubezpieczeniowej.
Naukowcy zajmujący się tą technologią twierdzą, że może ona mieć również pozytywny wpływ na wczesne przewidywanie problemów społecznych i zdrowotnych, jednak uznali, że należy ją trzymać z dala od wielkiego biznesu, który wykorzystałby ją we własnym interesie, ze szkodą dla innych. Prawdopodobnie zresztą firmy już korzystają z podobnych modeli.
Teraz pora na Life2vec
Duński model nazwany Life2vec może przyjrzeć się serii wydarzeń życiowych, które tworzą historię danej osoby i określić, co najprawdopodobniej wydarzy się w następnej kolejności. Podczas eksperymentów eLife2vec został przeszkolony na danych ze wszystkich dostępnych lat z wyjątkiem ostatnich czterech, bo dane te zostały zatrzymane do testów. Dane dotyczyły grupy osób w wieku od 35 do 65 lat, z których połowa zmarła w latach 2016–2020. Badacze dostosowali techniki przetwarzania języka i wygenerowali słownictwo dotyczące wydarzeń życiowych, aby life2vec mógł interpretować zdania na podstawie danych, takich jak "we wrześniu 2012 roku Francisco otrzymał dwadzieścia tysięcy koron duńskich jako strażnik zamku w Elsinore" lub "w trzecim roku nauki w szkole z internatem Hermione wybrała pięć zajęć dodatkowych".
Algorytm uczył się z tych danych i był w stanie przewidywać pewne aspekty życia ludzi, w tym to, w jaki sposób mogą myśleć, czuć i zachowywać się, a nawet czy osoba może umrzeć w ciągu najbliższych kilku lat. Aby przewidzieć, kiedy ktoś może umrzeć, zespół korzystał z danych od 1 stycznia 2008 roku do 31 grudnia 2015 roku dotyczących kohorty ponad 2,3 miliona osób w wieku od 35 do 65 lat. Wybór grupy, jak zaznaczył Lehmann, podyktowany był tym, że trudniej jest przewidzieć śmiertelność w tym przedziale wiekowym. Life2vec używał danych do oszacowania prawdopodobieństwa przeżycia osoby przez cztery lata po 2016 roku.
Wybrano zatem grupę 100 tys. osób, z których połowa żyła, a połowa zmarła. Badacze wiedzieli, które osoby zmarły po 2016 roku, ale algorytm nie. Algorytm musiał dokonywać indywidualnych przewidywań, czy dana osoba żyła po 2016 roku. Wyniki były imponujące: algorytm był poprawny w 78 proc. przypadków. Life2vec również przewyższał inne zaawansowane modele o co najmniej 11 procent. W przypadku mężczyzn istniało większe prawdopodobieństwo zgonu po 2016 roku. Bycie wykwalifikowanym pracownikiem lub diagnoza problemów ze zdrowiem psychicznym, takich jak depresja, to czynniki, które również prowadziły do wcześniejszej śmierci. Zajmowanie stanowiska kierowniczego lub posiadanie wysokich dochodów często wiązało się z przeżywalnością.
AI przewiduje, kto przeżyje, a kto umrze
Life2vec został poproszony o przewidzenie, kto przeżyje, a kto umrze. Okazał się o 11 proc. dokładniejszy niż jakikolwiek istniejący model sztucznej inteligencji lub tzw. aktuarialne tabele trwania życia, stosowane przy obliczaniu ryzyka wypadków losowych i wysokości związanych z tym składek ubezpieczeniowych.
Model był także w stanie przewidzieć wyniki testu osobowości w podzbiorze populacji dokładniej niż modele AI przeszkolone specjalnie do tego zadania.
Jorgensen uważa, że model przyswoił sobie wystarczającą ilość danych, aby prawdopodobnie rzucić światło na szeroki zakres zagadnień zdrowotnych i społecznych. Oznacza to, że można go wykorzystać do przewidywania problemów zdrowotnych i wczesnego ich wykrywania lub do zmniejszania nierówności społecznych przez rządy. Podkreśla jednak, że może on zostać wykorzystany w szkodliwy sposób także przez firmy.
Naukowcy zaznaczyli jednak, że jeśli ktoś nie otrzymuje wynagrodzenia -lub nie korzysta z systemu opieki zdrowotnej, to nie było dostępu do jego danych i nie był brany pod uwagę w badaniu. Zauważyli też, że badanie przeprowadzono w bogatym kraju z dobrym systemem opieki zdrowotnej.
Fot. Sztuczna inteligencja, zdj. ilustracyjne/Pixabay
Tomasz Wypych
Inne tematy w dziale Technologie