Na pytania dot. wojny na Ukrainie Chat GPT odpowiada tak jak ruska propaganda
Podwójnie smutna rocznica
Pierwsza rocznica wybuchu wojny w Ukrainie skłoniła mnie żeby zapytać sztuczną inteligencję ChatGPT co wie na temat tej wojny. Odpowiedzi które uzyskałem negatywnie mnie zaskoczyły. Wykazują one bowiem dużą zbieżność z propagandową linią kremla. ChatGPT pisze o "powstaniu separatystów na wschodzie Ukrainy" i zwraca uwagę na "osobliwość wschodniej Ukrainy" która "polega na tym, że tamtejsza ludność mówi głównie po rosyjsku i utożsamia się z Rosją kulturowo i historycznie." Pierwsze wrażenie jest takie, że Chat GPT zdaje się nie posiadać wiedzy na temat tego że Rosja prowadzi otwartą wojnę przeciwko Ukrainie. Generowane odpowiedzi informują o tym, że na wschodzie Ukrainy walczą separatyści z siłami rządowymi. Dopiero gdy wprost napisałem, że to kłamstwo Chat GPT "wypluł" informację o tym że "Od 24 lutego 2022 roku Rosja rozpoczęła inwazję na Ukrainę". Pod artykułem załączam zrzuty ekranów z moim pytaniami i uzyskanymi odpowiedziami.
Uczenie maszynowe
Odpowiedzi generowane przez Chat GPT zawierają niedopuszczalne usprawiedliwienia dla Rosyjskiej agresji przeciwko Ukrainie i przedstawiają rosyjski punk widzenia, który kłamliwie uzasadnia zbrodnicze działania Rosji wobec Ukrainy. Wygląda na to, że rosyjskie treści propagandowe dot. wojny w Ukrainie wywarły decydujący wpływ na proces uczenia maszynowego zastosowany przez firmę OpenAI. Mogło się tak stać z dwóch powodów:
Pierwszy to ilościowa przewaga rosyjskich treści w internecie. Firma OpenAI do uczenia wykorzystuje treści pobierane z internetu, a sam proces uczenia to w dużej mierze statystyka polegająca na wyliczaniu prawdopodobieństw występowania określonych ciągów słów - im częściej określone ciągi słów występują w zbiorze danych uczących tym potem częściej pojawiają się w odpowiedziach generowanych przez model językowy. Z tego względu "ilość" ma tu znaczenia.
Druga możliwość to manipulacja zbiorem danych uczących w taki sposób żeby treści pochodzące od ruskiej propagandy zyskały dominujący wpływ na odpowiedzi generowane przez model językowy. To tylko spekulacja ale technicznie jest to możliwe do zrealizowania np. przez kogoś kto ma bezpośredni wpływ na dobór danych uczących.
Co dalej ?
Chat GPT i jemu podobne usługi oparte o sztuczną inteligencję już dziś zmieniają nasz sposób pozyskiwania wiedzy i informacji. Dzięki AI zamiast wertować godzinami stosy książek czy wyszukiwać informacje poprzez google w kilka sekund uzyskujemy wygenerowane odpowiedzi na nasze pytania. W perspektywie kilku lat taki sposób pozyskiwania informacji stanie się powszechny i sztuczna inteligencja zyska decydujący wpływ na kształtowanie naszego obrazu świata. Jeśli dziś nie zadbamy o to aby we właściwy sposób ukształtować sztuczną inteligencję to w perspektywie kilku lub kilkunastu lat może się okazać, że wiedza o okropieństwach wojny którą prowadzi dziś Rosja zostanie zakłamana czy wręcz zapomniana. Może to być największe zwycięstwo Moskwy w tym konflikcie. Myślę, że Rosja już dziś aktywnie pracuje nad tym zwycięstwem podobnie jak Niemcy po Drugiej Wojnie Światowej aktywnie pracowali nad zrzuceniem odpowiedzialności za Holokaust na Polaków wymyślając "polskie obozy zagłady". Dziś nosicielem rosyjskiego kłamstwa może okazać się sztuczna inteligencja. Z tego względu warto przyjrzeć się kto i w jaki sposób decyduje o doborze danych służących do trenowania modeli językowych wykorzystywanych przez usługi takie jak Chat GPT. Warto też zadbać o to aby te zbiory danych były wolne od treści generowanych przez ruską propagandę.
Inne tematy w dziale Technologie