Az ELKH Nyelvtudományi Kutatóközpont kutatói két, világszínvonalon is jelentős nyelvmodellt fejlesztettek ki az ELKH infrastruktúra-fejlesztési pályázatán elnyert szuperszámítógépeken, neurális technológiát használó gépi tanulási algoritmusok segítségével.
A magyar nyelvre elkészült első GPT-3 típusú mesterséges intelligencia, a HILANCO-GPTX a Nyelvtudományi Kutatóközpont és a Pécsi Tudományegyetem közös fejlesztéseként született meg. Az angol és magyar nyelven egyaránt folyékony kommunikációra és szövegelőállításra is alkalmas rendszer akár még programkódot is képes generálni. Ennek a kétnyelvű rendszernek a betanításához a fejlesztők egy 102 milliárd szavas angol és egy 25 milliárd szavas magyar szövegkorpuszt használtak fel. A három hónapon át tartó gépi tanulás eredményeképpen létrejött nyelvi mesterséges intelligencia mindkét nyelven jól szerkesztett mondatokat képes alkotni, sőt akár még fordítani is tud a két nyelv között.
A Nyelvtudományi Kutatóközpont munkatársai a fenti technológiát és szuperszámítógép-rendszert használva elkészítettek egy az előzőnél is nagyobb magyar nyelvű anyagon tanított nyelvmodellt, a PULI GPT-3SX-et. Ez egy 32 milliárd szóból álló, csak magyar nyelvű szövegeket tartalmazó anyagon tanult magyarul.
Nonprofit kutatás-fejlesztési célokra mindkét nyelvmodell ingyenesen elérhető, demó változatuk kipróbálható:
a HILANCO-GPTX itt;
a PULI GPT-3SX itt.
Az NYTK kutatói e két rendszerről és más új kutatási eredményeikről Mesterséges intelligencia és a magyar nyelv címmel rendezvényt szerveznek 2022. november 23-án 16 órakor az MTA Székház Dísztermében. A Magyar Tudomány Ünnepe programsorozat keretében tartandó eseményen a kutatók a témához kapcsolódó előadásokkal és bemutatóval készülnek. Az eseményről bővebb információ található annak hivatalos weboldalán.
Nekem nagyon tetszik, annyira, hogy kiálltam mellette főszerkesztőnkkel szemben is, aki szerint csak szokványos ipari képlettel van dolgunk.
A Paksi Atomerőműben befejezték a 2. blokk ez évre tervezett karbantartását és éves főjavítását. Az üzemeltető szakemberek felterhelték a blokkot.