MI: 30 milliárd paraméterre bővítik a magyar nyelvi modellt

2024. 01. 31., 11:10

Az elmúlt évek a mesterséges intelligencia térhódításáról szóltak, hazánkban is mind a vállalatok, mind a lakosság egyre szélesebb körben használja az MI-t. Jelenleg azonban az alkalmazások többsége nem képes magyar nyelvű utasításokat megérteni vagy információkat elemezni, és amelyik igen, ott sok a pontatlanság.

Minden profitorientált céges fejlesztésnél szempont a megtérülés, jelen esetben, hogy az adott nyelvet mennyi felhasználó beszéli. Az új szoftverek, a megnövekedett számítási teljesítmény mellett az is meghatározza a mesterséges intelligencia fejlődési ütemét, hogy az adott nyelven mekkora adatmennyiség áll rendelkezésre. A most elérhető, az életünkbe viharos gyorsasággal beépülő mesterséges intelligencia alapú alkalmazások ezért futnak a nagy világnyelveken tökéletesen, míg a magyar kérdésekre, nagyon sok hibás válasz érkezik.

Anyanyelvünk használata nincs a nemzetközi technológiai cégek fejlesztéseinek fókuszában, így kiemelten fontos, hogy megőrizzük a magyar nyelv gazdagságát és a lehető legnagyobb magyar nyelvű szöveges adatbázis felhasználásával elkészítsük a magyar nyelvi modellt, mely beépülhet a mesterséges intelligencia alapú alkalmazásokba. Minél több lesz a hiteles magyar nyelvű szövegrész, annál pontosabbak és választékosabbak az MI válaszai.

A nagy nyelvi modell (angolul large language modell, vagy rövidítve LLM) olyan mesterséges intelligencia alapú algoritmus, amit hatalmas mennyiségű szöveges adaton, úgynevezett korpuszon tanítottak be, és képes megérteni, feldolgozni az emberi beszélt és írott nyelv sajátosságait.

Magyarországon két nagy projekt zajlik, amely a magyar nyelvi modell kifejlesztésén és tökéletesítésén dolgozik.

  • A Nyelvtudományi Intézet munkatársai kifejlesztették a magyar ChatGPT-t, egy mesterséges intelligencia-alapú szövegszerkesztő és nyelvelemző szoftvert, mely jelenleg csevegésre még nem képes, viszont meg tudja találni a szövegekben lévő összefüggéseket, alkalmas médiatartalom elemzésre. A Puli-GPT nevet viselő alkalmazás kidolgozásakor 41 milliárd szóból álló magyar (és 62 milliárd szóból álló angol) szövegállományt tápláltak be a kutatók, összehasonlításul az OpenAI Chat GPT 120-130 millió magyar (és 180 milliárd angol) szóból tanult. A Puli a közeljövőben bővül majd csevegési funkcióval, de már most képes megadott szavak alapján összefüggő szövegeket írni, vagy össze tudja foglalni egy cikk vagy egy könyv tartalmát.
  • A magyar állam és az OTP bank közös finanszírozásában hazai egyetemek bevonásával zajlik 2021 óta egy magyar mesterséges intelligencia nyelvi modell létrehozása. Első lépésben elkészült az alap nyelvi modell, mely 1,5 milliárd paramétert használt, most zajlik a 30 milliárd paraméterre bővítés.  A projekt célja, hogy olyan nyelvi modellt hozzanak létre, ami segíti a vállalati és a magán ügyfelek kiszolgálását, növeli a hatékonyságot, és hosszú távú versenyelőnyt biztosít nemcsak a banknak, hanem az egész magyar gazdaságnak.

„A nyelvi modelleken alapuló alkalmazások már megjelentek mind a köznevelésben, mind a felsőoktatásban. Ezek készségszintű, tudatos használata mind az egyén, mind a társadalom számára a jövőképesség, a siker feltétele. Jól működő magyar nyelvi modell, nemcsak szuverenitási, hanem jóléti kérdés is, mivel növeli az MI magyar haszonélvezőinek a körét. A Gábor Dénes Egyetemen ezért, nemcsak az oktatásunkban, hanem a kutatásainkban is kiemelt terület a nyelvi modell használata” – mondta dr. Dietz Ferenc, a Mesterséges Intelligencia Koalíció oktatási és tudatosítási munkacsoportjának a vezetője, a Gábor Dénes Egyetem elnöke.

Ha tetszett a cikk, kövesse az ÜZLETEMET
a Facebookon!

Még több friss hír

2024-04-16 14:10:00
A Miniszterelnökség Monitoring és Értékelési Főosztálya megbízásából elkészült a „Zöldinfrastruktúra útmutató”, amelynek célja, hogy segítséget nyújtson a támogatást igénylőknek (elsősorban önkormányzatoknak) a területükön jelentkező környezeti és klímakockázatok azonosításában, és a problémák természetalapú, zöld és kékinfrastruktúra létrehozásával történő megoldásában.

  BIZNISZPLUSZ PODCAST

Újabb különleges hazai vállalkozás, az Ország Söre szavazást alapító Beerselection mutatkozik be a csatornán. A budapesti sörszaküzletbe hetente több tucatnyi újdonság érkezik, köztük akár olyan különlegességekkel, amelyekből egyszerre csak pár darab érhető el az egész országban. A sörkultúra hazai terjesztése fontos küldetés a tulajdonosoknak, hiszen akár 800-féle sörstílus létezik, miközben a legtöbb ember egyedül a lágert ismeri fel. A magyar sörrajongók által idén összeállított recept sorsáról, a kissé elhasznált „kézműves” kifejezés mögötti igazságról, illetve arról, hogy miért érdemes szaküzletben venni a sört a nagy áruházak helyett, Bárkai Péter mesél a BeerSelectiontől. Az ügyvezető persze igazságot tesz az örök, csapolt, palackozott, vagy dobozos kérdésben is...
Az egészségpénztári befizetések ugyan nem a legelsők a fontossági sorrendben, amire félre akarunk tenni, de előkelő helyre kúsztak fel az utóbbi években Magyarországon. Annak ellenére, hogy milyen kedvező – és a közhiedelemmel ellentétben elérhető – megoldásokat nyújtanak a magáncélú megtakarítások, a magyar társadalom iszonyatos összeget fizet ki zsebből a magánegészségügyben. Dr. Kravalik Gábor, az Önkéntes Pénztárak Országos Szövetségének elnöke az ÖPOSZ legutóbbi közvélemény-kutatási eredményei nyomán vázolja honfitársaink hozzáállását a kérdéshez és egyértelmű választ ad rá, hogy hogyan járhatnánk jobban, ha tudatosabban tennénk félre. Fontos: akár havi párezer forintnak is van értelme, sőt!
A digitális technológiák kapcsán jelenleg két uniós rendelet is fontos: az egyik a digitális szolgáltatásokról, a másik a mesterséges intelligencia felhasználásának korlátozásáról szól. Sokáig azt hittük, az óriási tech vállalatok túl nagyra nőttek ahhoz, hogy meg lehessen regulázni a működésüket, Európában azonban – úgy tűnik – mégis sikerül rendeleti keretek közé szorítani, hogy mit tehet vagy épp' nem tehet meg a Facebook, a Snapchat, a TikTok és például a Google kereső. Dr. Baracsi Katalin internetjogász ebben az epizódban átfogó képed ad mind a digitális piacokat, mind pedig a mesterséges intelligencia felhasználását szabályozó uniós rendeletről.

  NÉPSZERŰ HÍREK

  Rovathírek: GUSTO

  Rovathírek: ATOMBUSINESS