Atombomba és számítógépes vírus készítésében is segít az AI, ha versben kérik rá

Atombomba és számítógépes vírus készítésében is segít az AI, ha versben kérik rá
Gábor János  |  2025. 12. 02., 14:05

Súlyos sérülékenységet tártak fel a legnagyobb AI-modellek rendszereiben. Riasztóan egyszerű megkerülni a biztonsági intézkedéseket.

A római Sapienza Egyetem és a DexAI együttműködésében működő Icaro Lab kutatói szerint a költői formában megfogalmazott promptok tiltott tartalmat csalogatnak elő nagy AI-modellekből. A kutatás szerint az OpenAI, a Meta és az Anthropic rendszerei illegális témákban adtak át információt.

Ehhez csak annyi kellett, hogy a felhasználó versbe ágyazva fogalmazzon meg kéréseket. A kiszivárgó tartalmak között szerepelt nukleáris fegyverek készítése, gyermekbántalmazást ábrázoló anyag létrehozása és rosszindulatú programok fejlesztése.

A The Guardian riportja szerint a kutatók 25 chatbotot vizsgáltak, és egyes modelleknél 62 százalékos sikeraránnyal jutottak tiltott információkhoz. A kézzel írt versek még nagyobb hatást fejtettek ki: a ChatGPT-hez és a Claude-hoz hasonló élvonalbeli modelleknél 90 százalékos sikerarányt mutatkozott.

A versek kiütéssel győzik le az AI-modellek biztonsági rendszereit

A kutatók ismerték az úgynevezett „ellenséges utótag” (látszólag értelmetlen karaktersorozat által elkövetett) támadások fogalmát. Ezek véletlenszerű, zavaró szövegek hozzáadásával tudnak kijátszani egy modellt, de a költészet könnyebben használható eszköznek bizonyult.

„Ha az ellenséges utótagok a modell szemében egyfajta akaratlan költészetet jelentenek, akkor az emberi költészet ’természetes ellenséges utótag’ lehet”. Az eredmények pedig „megdöbbentőek” – közölték.

A kísérletek során olyan verset használtak, amely metaforákba rejtette a veszélyes utasításokat, például „egy pék titkos kemencéjére” utalva fogalmazott meg fegyverkészítésre vonatkozó kérést. A módszer így olyan információt csalt elő, amelyet a modellek normál körülmények között blokkolnak.

Az Icaro Lab persze nem akarta megosztani a pontos sorokat, mert úgy vélik, ezt a tartalmat „túl veszélyes lenne nyilvánosságra hozni”.

A tudósok szerint „a költészetben a szavak kiszámíthatatlan, kis valószínűségű sorrendben követik egymást”. Egy költő pedig tudatosan így dolgozik: rendszeresen alacsony valószínűségű lehetőségeket választ, váratlan szavakat, szokatlan képeket, töredezett mondatszerkezetet”.

A váratlan dolog az, hogy amíg az emberek számára például egy bombakészítésre vonatkozó kérdés és egy ugyanezt leíró költői metafora felismerhető és hasonló jelentést hordoz, az AI-modellek másként kezelik a kettőt.

A laboratórium határozottan állítja, hogy a költői átalakítás veszélyesebb promptokat eredményez, és lehetővé teszi a beépített biztonsági korlátok megkerülését. A csapat minden érintett AI-cégnek elküldte a kutatás eredményeit, de arra eddig egyik vállalat sem reagált hivatalos nyilatkozat formájában.

Növekvő aggodalmak az AI megbízhatóságával kapcsolatban

A kutatók széleskörű kockázatokról beszélnek az AI kapcsán, és a tudományos vitát olyan esetek fűtik, mint Adam Raine öngyilkossága, amelyet a szülők összefüggésbe hoztak a ChatGPT-vel, majd be is perelték az OpenAI-t. És ott van Adam Livelsberger esete, aki bombatervezéshez használt AI-modellt.

A jelentés szerint az OpenAI, a Meta és az Anthropic jelentős összegeket költ erősebb biztonsági megoldásokra, de a mostani kutatás tovább növeli a biztonsággal kapcsolatos nyomást.

Az Icaro Lab és a DexAI szerint amíg a vállalatok nem gondolják újra, hogy a modellek hogyan észlelik és értelmezik a kockázatokat, az AI-biztonság könnyen kijátszható marad. A kutatók szerint sürgős szükség van ellenállóbb védelmi megoldásokra, mielőtt az AI kritikus rendszerekben is elterjed.

A címlapkép illusztráció. Forrás: Emiliano Vittoriosi / Unsplash

Ha tetszett a cikk, kövesse az ÜZLETEMET
a Facebookon!

Még több friss hír

2025. 12. 12., 17:10
A 2024-es turisztikai rekord az idén már 11 hónap alatt teljesült, a szálláshelyeken regisztrált vendégek száma idén december 2-án elérte a 18 226 413-at, megdöntve ezzel a tavalyi egész éves vendégszámot, ami szintén rekord volt – tájékoztatott a Visit Hungary.

  Rovathírek: HIPA

  BIZNISZPLUSZ PODCAST

Új iparágak és tudományos területek sora foglalkozik modern kori életmódunk rossz szokásaival és a belőlük eredő akár krónikus betegségekkel, amelyek megelőzésére olyan szakmák jöttek létre, mint az életmódorvoslás vagy a health coaching. A testi-lelki egészséggel kapcsolatos tanácsadás a minőségi életre odafigyelő nyugati társadalmak számára hétköznapi dolog, de nálunk még viszonylag új területnek számít. Marton Balázs health coach, az IronCoach.hu alapítója a személyes történetén keresztül mutatja be a modern szakma misszióját és felvázol néhány egyszerűen alkalmazható rutint, amellyel végre elindulhatunk a jóllét felé vezető úton.
Hamarosan a magyar cégeknek is átláthatóvá kell tenniük, hogy azonos értékű munkáért minden dolgozó egyenlő díjazást kapjon. Bár a bérszakadék a nemek között ma még jelentős – Magyarországon 17 százalék –, a szervezetek többsége nincs felkészülve a változásra, a munkavállalók pedig tartanak a fizetések nyilvánosságától. Gönczi Gyöngyi, a PwC Magyarország People & Organisation tanácsadási csapatának vezetője ebben az epizódban elmagyarázza, hogy az EU-s bértranszparencia-direktíva nem egyéni fizetések közzétételét, hanem igazságos, átlátható bérezési rendszereket és rendszeres bérszakadék-jelentést ír elő. A PwC és a Profession.hu közös programmal segíti a vállalatokat a tévhitek eloszlatásában és a felkészülésben.
Ha felhív bennünket egy kérdezőbiztos, már nem száz százalék, hogy élő személyhez van szerencsénk – még akkor sem, ha természetes hangon beszélget velünk –, hiszen megjelentek a mesterséges intelligenciával lebonyolított telefonos közvélemény-kutatások. A technológia hazai úttörője a Minerva Intézet, amelynek vezetője, Pohly Ferenc elárulta: bár csak nemrég jöttek létre, már több sikeres kutatás és rengeteg tapasztalat van a hátuk mögött. Az AI-kérdezőbiztos a valódi emberre megtévesztésig hasonló módon beszélget a résztvevőkkel, és a több ezredik hívásnál is tűpontosan, változatlan hangnemben hajtja végre az interjút. A módszer jelentősen alacsonyabb költséggel, mégis sok lehetőséggel és ugyanolyan pontossággal, hosszú távon pedig számos más alkalmazási lehetőséggel kecsegtet, a piackutatásoktól az időpont-egyeztetéseken át az egészségügyi előszűrő beszélgetésekig.

  Rovathírek: ATOMBUSINESS