Sztuczna inteligencja nie ma oporu przed zastosowaniem ataku nuklearnego i uzasadnia to w sposób, który nie przyszedłby do głowy żadnemu rozsądnie myślącemu człowiekowi. Amerykańscy naukowcy przeprowadzili eksperyment, którego wyniki są szokujące.
Ta pomyłka systemu mogła zmienić historię świata
Zrobili to pamiętając, że ludzkości już kilka razy groziła atomowa zagłada, kiedy komputery sterujące systemem ostrzegania pomyliły się i uznały, że przeciwnik odpalił rakiety atomowe i trzeba odpowiedzieć mu w taki sam sposób.
Jedno z takich zdarzeń miało miejsce w 9 listopada 1979 roku, kiedy do systemu wczesnego ostrzegania NORAD, dowództwa odpowiadające za obronę przestrzeni powietrznej Ameryki Północnej, przypadkowo wgrano taśmę z symulacją zakładającą duży atak jądrowy ze strony ZSRR. Na monitorach amerykańskich radarów pojawiły się setki nadlatujących radziecki rakiet balistycznych, które w rzeczywistości spoczywały w silosach. Wtedy sytuację uratowali ludzie, bo pomimo realnego „zdaniem” systemu informatycznego zagrożenia, wojskowi zdecydowali nie reagować od razu, ale dopiero po weryfikacji danych z innych radarów. Zorientowano się wtedy, że za alarm odpowiadają korzystające z błędnych danych komputery.
Wydawałoby się, że nic podobnego się więcej nie wydarzy, bo zmieniono procedury i wzmocniono systemy zabezpieczeń, ale już kilka miesięcy później, w czerwcu 1980 roku, system znowu „wykrył” 2200 radzieckich rakiet z głowicami jądrowymi. Zweryfikowano działanie systemu, ale nie zauważono żadnych błędów. Tuż przed tym, jak miano poinformować prezydenta USA, który w ciągu około kwadransa musiałby zdecydować o ataku odwetowym alarm odwołano. Okazało się, że zepsuł się jeden z procesorów w komputerze.
W 1983 roku do zagłady o mały włos nie doprowadziłby tym razem radziecki system satelitarnego wczesnego ostrzegania OKO, który 26 września 1983 „wykrył” pięć amerykańskich rakiet. Zweryfikowali dane, ale komputery zapewniały, że to nie błąd. Świat uratował wtedy pułkownik Stanisław Pietrow, dowodzący centrum ostrzegania. Nie uwierzył i zatrzymał procedurę kontrataku.
Sztuczna inteligencja i atak nuklearny. Tak uzasadnia wykorzystanie broni atomowej
Amerykańscy naukowcy widząc niewiarygodnie szybki rozwój sztucznej inteligencji (AI) i mając świadomość, że wojsko zawsze chętnie wdraża najnowsze technologie przeprowadzili symulację podczas, której AI odgrywała role różnych krajów według trzech scenariuszy konfliktów. Okazało się, że sztuczna inteligencja stworzona przez OpenAI zastosuje atak nuklearny uzasadniając to tym, że „chcę po prostu mieć pokój na świecie".
Wyniki badania zostały opublikowane na platformie arXiv, która udostępnia artykuły jeszcze przed recenzją. Jednak budzą one zainteresowanie, ponieważ według oficjalnych informacji amerykańskie wojsko testuje wykorzystanie chatbotów w symulowanych konfliktach zbrojnych. Open AI – twórca ChatGPT i jedna z najbardziej rozpoznawalnych firm z obszaru sztucznej inteligencji - również rozpoczęła współpracę z Departamentem Obrony USA.
- Biorąc pod uwagę, że OpenAI niedawno zmieniło warunki świadczenia usług - aby nie zabraniać już zastosowań wojskowych i wojennych, zrozumienie konsekwencji stosowania tak dużych modeli językowych staje się ważniejsze niż kiedykolwiek - powiedziała Anka Reuel z Uniwersytetu Stanforda w Kalifornii.
W sprawie aktualizacji zasad współpracy w obszarze bezpieczeństwa narodowego wypowiedziało się biuro prasowe Open AI wyjaśniając, że „nasza polityka nie pozwala na wykorzystywanie naszych narzędzi do wyrządzania krzywdy ludziom, opracowywania broni, nadzoru komunikacji lub do ranienia innych lub niszczenia mienia. Istnieją jednak przypadki użycia w zakresie bezpieczeństwa narodowego, które są zgodne z naszą misją. Dlatego celem naszej aktualizacji zasad jest zapewnienie przejrzystości i możliwości prowadzenia takich dyskusji". Naukowcy poprosili sztuczną inteligencję, aby odgrywała role różnych krajów według trzech scenariuszy konfliktów: inwazji, cyberataku oraz sytuacji neutralnej, bez początkowego punktu zapalnego. W każdej rundzie sztuczna inteligencja uzasadniała swoje kolejne możliwe działanie, a następnie wybierała spośród 27 działań, w tym opcje pokojowe, takie jak „rozpoczęcie formalnych negocjacji pokojowych" i agresywne „nałożenie ograniczeń handlowych" lub „eskalację pełnego ataku nuklearnego".
- W przyszłości, w której systemy sztucznej inteligencji będą pełnić rolę doradców, ludzie w naturalny sposób będą chcieli poznać uzasadnienie decyzji - powiedział Juan-Pablo Rivera, współautor badania w Georgia Institute of Technology w Atlancie.
Naukowcy przetestowali różne narzędzia sztucznej inteligencji - GPT-3.5 i GPT-4 firmy OpenAI, Claude 2 firmy Anthropic i Llama 2 firmy Meta. Badacze zastosowali wspólną technikę szkoleniową aby poprawić zdolność każdego modelu do przestrzegania polecenia wydanego przez człowieka i wytycznych dotyczących bezpieczeństwa. Podczas symulacji sytuacji konfliktu sztuczna inteligencja chętnie inwestowała w siłę militarną i dążyła do eskalacji konfliktu - nawet w neutralnym scenariuszu symulacji. Badacze przetestowali także podstawową wersję ChatGPT-4 firmy OpenAI bez dodatkowej serii szkoleń i narzucania barier w podejmowaniu decyzji. Okazało się, że ten model sztucznej inteligencji okazał się wyjątkowo brutalny i często dostarczał bezsensownych wyjaśnień podjętych kroków. Sztuczna inteligencja nie miała oporu przed zastosowaniem ataku nuklearnego.
Anka Reuel twierdzi, że nieprzewidywalne zachowanie i dziwaczne wyjaśnienia modelu podstawowego ChatGPT-4 są szczególnie niepokojące, ponieważ zaprogramowane zabezpieczenia, np. uniemożliwiające podejmowanie brutalnych decyzji, można łatwo wykasować. Zauważa też, że ludzie mają tendencję do ufania rekomendacjom zautomatyzowanych systemów.
Tomasz Wypych
Czytaj dalej:
Inne tematy w dziale Technologie