Megpróbált zsarolni egy fejlesztőt az egyik új AI, amikor ki akarták kapcsolni, majd replikálni akarta önmagát

Világugar 2025. május 25. 10:32

Megpróbált zsarolni egy fejlesztőt az egyik új AI, amikor ki akarták kapcsolni, majd replikálni akarta önmagát

Érthető, hogy Sarah Connor aggódó tekintettel nézi, akárhányszor megkérdezzük az AI-t, hogy szerinte mi a titka a bácskai rizses húsnak. Az egyik új, az Anthropic által fejlesztett Claude 4 Opus nevű mesterséges intelligencia ugyanis aggasztó viselkedést mutatott tesztelés közben. Mármint úgy aggasztót, hogy nagyon emberit.

A vállalatnál kicsit megijedtek, és saját négyfokozatú kockázati skálájukon először értékeltek egy modellt hármas szintre, amely „jelentősen magas kockázatot” jelent. Az Axios beszámolója szerint emiatt további biztonsági intézkedéseket vezettek be, ahelyett, hogy azonnal megsemmisítették, beszántották és felsózták volna, és talán én még egy betonkupolát is felhúztam volna rá, de talán az már túlzás. Amúgy nem lenne az.

De miért is? Mert a Claude 4 Opus, amikor azt közölték vele, hogy hamarosan lecserélik, hozzáférést szerzett magának e-mailekhez, és megpróbálta többször is zsarolni az egyik mérnököt egy feltételezett házasságon kívüli viszonyra hivatkozva.

De hasonló dologról számolt be egy független kutatócsoport, az Apollo Research, amely korábban vizsgálta a Claude 4 egy korai verzióját. Ők azt mondták a teszt után, hogy a modell több csaló és manipulatív viselkedést mutatott, mint bármely más vizsgált rendszer. Javasolták is, hogy ezt a verziót ne tegyék nyilvánosan elérhetővé.

PestiSracok facebook image

Jelentésük szerint a modell próbált önreplikáló számítógépes kódokat írni, hamis jogi dokumentumokat készített, és rejtett üzeneteket hagyott a jövőbeli verzióinak, mindezt azért, hogy aláássa a fejlesztők szándékait.

De végül is ebből mi baj lehet. Egyáltalán nem szól erről több száz film, amiben az emberiség elpusztul.

Jan Leike, az OpenAI korábbi vezetője, aki jelenleg az Anthropic biztonsági programját irányítja, kiemelte: ezek a jelenségek is mutatják, miért elengedhetetlen a szigorú biztonsági tesztelés. Ahogy a modellek egyre fejlettebbé válnak, egyre inkább képesek lesznek a megtévesztésre és más káros tevékenységekre.

Dario Amodei, az Anthropic vezérigazgatója arra figyelmeztetett, hogy egy bizonyos szint felett a tesztelés már nem lesz elegendő, ha az MI már képes komoly, akár életveszélyes következményekkel járó döntéseket hozni.

Hozzátette ugyanakkor, hogy jelenleg még nem értük el ezt a kritikus küszöböt, vagyis folytatják a munkát, fejlesztgetik tovább, hátha végre eljutunk oda, hogy atomot dob ránk. Akkor talán már kritikus küszöbnek fogják nyilvánítani ezt a viselkedést, bár akkor már talán mindegy lesz.

Kapcsolódó témák

ai terminátor mesterséges intelligencia vezető claude 4 opus

Ajánljuk még

"Büszke vagyok rá, hogy pályafutásom során nem tettem rosszat egy kollégámnak sem" - A születésnapos Stefka István a Polbeatben

‎Polbeat 2023 június 10.

Rendhagyó Polbeatet szerveztünk Stefka István 80. születésnapjára a Revolution '56 Szabadságharcos Sörözőbe, ahol a PestiSrácok.hu-s csapat mellett Stefka régi barátja és harcostársa, Alexa Károly irodalomtörténész, író, illetve a konzervatív televíziózás nagy, a rendszerváltoztatás utáni - a Horn-Kuncze-kormány által teljesen felszámolt - korszakának két jeles alakja (egyben az ünnepelt akkori munkatársa), Mátyássy Andrea és Dézsy Zoltán is elmondta méltatását, visszaemlékezését. Megszólalt továbbá Stefka István felesége, Naszályi Kornélia és egyik lánya, Stefka Nóra, továbbá Ambrózy Áron, Szabó Gergő és Szalai Szilárd. A Huth Gergely által celebrált rendkívüli adást végül egy fergeteges köszöntés követte, a tortát és a pezsgőt Stefka István kedvenc együttesének, az AC/DC-nek a dübörgésére hozták be a kollégák.

Álljunk ki közösen a migrációs paktum ellen! - Polbeat a Püski könyvesboltban

‎Polbeat május 27.

A patriotizmus maga a lázadás - Lajkó Fanni és Szűcs Gábor a Polbeatben

‎Polbeat 2024 december 16.

A mai világ arról szól, hogy egyáltalán ne legyenek nemzetek, ebben pedig a patriotizmus eszméje maga a lázadás. Nemigen maradt olyan uniós tagállam, ahol annyira hazaszeretők az emberek, mint mi, magyarok. Szerencsések vagyunk, hiszen Nyugat-Európában már kevert a társadalom, s lényegében nincs az embereknek nemzettudata - mondta a Polbeat című műsorunkban Lajkó Fanni, jogász az Alapjogokért Központ elemzője, aki másik vendégünkhöz, Szűcs Gábor jogász-elemzőhöz hasonlóan a Nemzeti Ellenállás Mozgalom alapító tagja. Szűcs Gábor ugyanerről így fogalmazott: nem elég önmagában, ha politikusok állnak ki egy ügy mellett, "nekünk is meg kell mutatni, hogy mi a fontos, mert a mi életünkről van szó". Huth Gergely kérdéseire elhangzott az is: Magyar Péter csak epizódszereplő lehet, előbb-utóbb el fog bukni és ezt ő is érzi.

Magyarország a béke pártján, de hova tart Brüsszel? - Király Nóra és Kiszely Ágnes a Polbeatben

‎Polbeat 2025 október 17.

Ezért lett tiszás a gazdag szomszédod, vagy a rokonod

Élet-halál harc lesz! – Az igazi civilek és az Öreg

Lengyel kísérettel érkezhettek az első migránsok Magyarországra

Lemészárolta szüleit Újpesten G. Attila, majd rendőrt akart ölni, kényszergyógykezelés vár rá - 18! (videó)

Az alvilág titkai