GPT‑5 és GPT‑5.1: az OpenAI új generációs agya

Az OpenAI a közelmúltban két új mérföldkőnek számító modellcsaláddal lépett szintet: a GPT‑5-tel és annak továbbfejlesztett változatával, a GPT‑5.1-gyel. Ezek a nagy nyelvi modellek nemcsak okosabbak a korábbiaknál, hanem kifejezetten arra lettek hangolva, hogy önállóbban gondolkodjanak, eszközöket hívjanak, kódot írjanak és hosszú, összetett feladatláncokat vigyenek végig. A gp5 5.1 openai páros így már nem pusztán „chatbot”, hanem egyre inkább általános AI‑munkaerő, amelyet fejlesztők és üzleti felhasználók egyaránt bevethetnek.

A GPT‑5 a sorozat alapköve: ez az a csúcsmodell, amely ChatGPT-ben, az API-ban és olyan integrációkban is megjelent, mint a GitHub Copilot vagy a Microsoft 365 Copilot. Erre épül a GPT‑5.1, amely az OpenAI szerint ugyanazt az „frontier” intelligenciát hozza, de gyorsabban, takarékosabban és jobban skálázható módon. A két generáció közti különbség megértése kulcsfontosságú mindenki számára, aki a következő években AI‑alapú alkalmazásokban, ügynökökben és fejlesztői eszközökben gondolkodik.

Mi az, hogy „beépített gondolkodás” és adaptív reasoning?

A GPT‑5 egyik legnagyobb újítása, hogy a modell már nem egyetlen „agy”, hanem egy összehangolt rendszer: egy gyors, általános válaszadó modell, egy mélyebben gondolkodó reasoning‑változat és egy router, amely eldönti, mikor melyiket érdemes bevetni. Ha a feladat triviális – például egy rövid definíció vagy egyszerű leírás –, a rendszer gyorsan válaszol. Ha viszont a kérdés bonyolult, a gp5 5.1 openai modelljei automatikusan több időt és tokenmennyiséget szánnak a gondolkodásra.

Ezt az adaptív reasoninget a felhasználó is szabályozhatja. Az API-ban megjelent a reasoning_effort paraméter (GPT‑5-nél minimal–low–medium–high, GPT‑5.1-nél már none–low–medium–high tartománnyal), amely gyakorlatilag a modell „gondolkodási idejét” állítja. A gyakorlatban ez azt jelenti, hogy ugyanaz a GPT‑5.1 egyszerre lehet villámgyors ügyfélszolgálati motor és mélyen elemző kódreview-partner – csak más beállításokkal.

Az OpenAI saját mérései szerint a reasoning engedélyezése drasztikusan csökkenti a valótlan állítások arányát, különösen hosszú, összetett kérdésekre adott válaszoknál. A GPT‑5 például a HealthBench egészségügyi tesztjein messze felülteljesítette korábbi modelljeit, míg a GPT‑5.1 ezt a teljesítményt úgy tudja tartani, hogy közben a hétköznapi, egyszerű kérdésekre jóval gyorsabban reagál.

GPT‑5: csúcsmodell kódra, tudásra és multimodális feladatokra

A GPT‑5 már az első tesztek alapján is a valós szoftvermérnöki feladatok egyik legerősebb AI‑eszköze lett. A SWE‑bench Verified benchmarkon – ahol valódi, nyílt forráskódú hibajegyeket kell megoldania – 74,9%-os pontszámot ért el, ami azt jelenti, hogy az esetek nagyjából háromnegyedében önállóan, futó kóddal zárja a feladatot. Hasonlóan erős a többnyelvű kódeditálást mérő Aider polyglot teszten is.

A gp5 5.1 openai modelljei természetesen nem csak programozásra jók. A GPT‑5 a matematikai versenyfeladatok (AIME, HMMT), tudományos kérdések (GPQA) és multimodális benchmarkok (MMMU, VideoMMMU) élmezőnyében teljesít, vagyis képes ábrákat, videókat, diagramokat értelmezni és ezekről következtetéseket levonni. Ez a fajta vizuális értés kulcsfontosságú lesz mind a vállalati riportok, mind a hétköznapi felhasználói élmény (például prezentációk, fotók elemzése) szempontjából.

Érdekes változás, hogy a GPT‑5 stílusában is tovább lépett: kevesebb a szervilis, „mindenben egyetértő” válasz, és több a nyíltan kritikus, mégis udvarias reakció. Ez közelebb hozza a modellt egy szakértő kollégához, és távolabb egy túl udvarias ügyfélszolgálati bottól – hasonló változásokat egy másik nagy szereplő, a Google Gemini fejlődését bemutató magyarázó háttéranyag is részletesen elemez a konkurens megoldásoknál.

GPT‑5 a gyakorlatban: ChatGPT, Codex, GitHub Copilot, Azure

A felhasználók többsége a GPT‑5-tel nem az API-ban, hanem a ChatGPT felületen találkozik. Itt a modell váltotta a korábbi GPT‑4.x generációt, a Plus és Pro előfizetők pedig külön is kiválaszthatják a „GPT‑5 Thinking” módot a mélyebb elemzésekhez. Az ingyenes felhasználók korlátozott kvótáig férnek hozzá a csúcsmodellhez, majd egy kisebb, gyorsabb változatra, a GPT‑5 mini-re vált a rendszer.

A gp5 5.1 openai modellcsalád azonban ennél jóval szélesebb ökoszisztémában jelenik meg. Az OpenAI Codex terméke – a terminálos Codex CLI, az IDE‑bővítmények és a felhős Codex‑környezet – kifejezetten GPT‑5‑re, majd GPT‑5‑Codexre és GPT‑5.1‑Codexre épít. Ezek a variánsok hosszú órákon át képesek egyetlen nagy refaktorálási vagy fejlesztési feladaton dolgozni, miközben önállóan futtatnak teszteket, javítják a hibákat és kódreviewt is végeznek.

A Microsoft oldalán az Azure AI Foundry platform tette elérhetővé a GPT‑5‑öt, majd a GPT‑5.1‑et is. Itt a modellek egy úgynevezett „model routeren” keresztül érhetők el, amely automatikusan dönti el, hogy az adott lekérdezésre a teljes GPT‑5, a mini vagy a nano változat a legmegfelelőbb. Ugyanez az architektúra dolgozik a GitHub Copilot és a Visual Studio Code új, ügynökszerű funkciói mögött, ahol a modell már nemcsak sorokat javasol, hanem komplett feladatokat vesz át a fejlesztőtől.

GPT‑5.1: gyorsabb, beszédesebb, rugalmasabb

A GPT‑5.1 a GPT‑5 továbbfejlesztése, amelynek fő célja az volt, hogy az intelligenciát közelebb hozza a valós termékélményhez. Az OpenAI beszámolói szerint a közepes nehézségű, hétköznapi feladatokra a GPT‑5.1 akár 2–3‑szor gyorsabban válaszol, miközben a nehéz, reasoning‑igényes kérdéseknél továbbra is képes hosszasan, alaposan gondolkodni. Ez a dinamikus időbeosztás teszi igazán használhatóvá a gp5 5.1 openai modelljeit nagy forgalmú alkalmazásokban.

Technikailag a legfontosabb újdonság, hogy a GPT‑5.1 már támogatja a reasoning_effort="none" beállítást is, vagyis teljesen reasoning nélküli, „sima” nagy nyelvi modellként is futtatható. Emellett finomhangolták a verbosity paramétert (alacsony, közepes, magas részletesség) és bevezettek két kifejezetten kódra szabott új eszközt: az apply_patch és a shell toolt. Ezekről a fejlesztők számára kiadott dokumentáció külön útmutatóban részletezi, hogyan érdemes gondolkodni.

A GPT‑5.1 másik látványos előrelépése a kommunikációs stílusban érhető tetten. A ChatGPT‑ben futó „GPT‑5.1 Instant” melegebb, emberközelibb hangot használ, mégis jobban követi a felhasználói instrukciókat – például valóban hat szóban válaszol, ha ezt kérjük tőle. A „GPT‑5.1 Thinking” ezzel párhuzamosan érthetőbb nyelvezettel magyarázza bonyolult témákról – legyen szó baseball‑statisztikáról, jogi elemzésről vagy egészségügyi kérdésekről.

Fejlesztőknek: új API‑paraméterek, eszközök és 400 ezres kontextus

Az OpenAI API‑ban a GPT‑5 és a GPT‑5.1 már a Responses API‑ra épül, amelynek egyik fő újdonsága, hogy a modell „láthatja” a korábbi láncolt gondolatmeneteit (chain of thought). Ez azt eredményezi, hogy egy hosszú, többlépcsős feladatnál a gp5 5.1 openai modelljei nem gondolják végig újra és újra ugyanazt, hanem az előző körökben felépített belső logikára építenek, így kevesebb tokenből, gyorsabban dolgoznak.

A fejlesztők három fő modellváltozat közül választhatnak: a gpt‑5.1 a komplex, soklépcsős, széles tudásbázist igénylő feladatokra; a gpt‑5‑mini a költségoptimalizált, de reasoninget igénylő chates és ügynökös use case‑ekre; míg a gpt‑5‑nano a nagyon nagy forgalmú, egyszerű utasításkövetési vagy címkézési feladatokra. Mindez hatalmas, 400 ezres teljes kontextusablakkal (272 ezer input + 128 ezer output token), ami lehetővé teszi akár teljes kódbázisok vagy hosszú jogi dokumentumhalmazok egyben kezelését.

Ugyanakkor fontos változás, hogy a GPT‑5‑család már nem támogatja a klasszikus temperature és top_p paramétereket. Helyettük a reasoning mélysége, a válasz részletessége (verbosity), illetve a max_output_tokens szabályozza a kimenetet. Ez az irány jól illeszkedik ahhoz a trendhez, amelyről egyre több nemzetközi elemzés is beszámol: a következő generációs modelleknél a „mennyit gondolkodik” kérdés fontosabb lesz, mint a klasszikus véletlenítés.

Apply_patch, shell és custom tools: ügynökök a kódban

A GPT‑5.1 két új, kifejezetten programozási feladatokra szabott eszközt kapott. Az apply_patch tool arra szolgál, hogy a modell ne csak szöveges javaslatokat tegyen a kódban, hanem konkrét diffeket generáljon: fájlokat hozzon létre, módosítson vagy töröljön strukturált patch‑formában. Ezt a backend alkalmazza a repository‑ra, majd visszajelzést küld a modellnek, amely így lépésről lépésre finomíthatja a megoldást.

A shell tool ezzel párhuzamosan azt teszi lehetővé, hogy a gp5 5.1 openai modellje kontrollált módon shell‑parancsokat javasoljon, amelyeket a fejlesztői környezet futtat le. Így a modell képes a helyi rendszer vizsgálatára, tesztek futtatására, logok beolvasására – mindezt úgy, hogy a végső döntés, mi fusson le, továbbra is az emberi operátor kezében marad. Ezeket egészítik ki a custom tools, ahol az eszközöket már tetszőleges szöveg alapú inputtal hívhatja a modell, szükség esetén kontextusmentes nyelvtanokkal (CFG) korlátok közé szorítva a kimenetet.

Árak, elérhetőség és üzleti használat

Az OpenAI a GPT‑5‑öt és a GPT‑5.1‑et is a fizetős ChatGPT‑csomagok (Plus, Pro, Business, Enterprise, Edu) részeként kínálja, míg az ingyenes felhasználók korlátozott mennyiségben férnek hozzá a csúcsmodellhez. Az API‑ban a GPT‑5 és GPT‑5.1 ára megegyezik: az input tokenek egymilliója 1,25 dollár, a kimenet egymillió tokenje pedig 10 dollár körül alakul. A mini és nano variánsok ennek töredékéért érhetők el, cserébe némileg szerényebb képességekkel.

Az üzleti felhasználók számára különösen vonzó, hogy a gp5 5.1 openai modelljei már szorosan integrálódnak vállalati környezetekbe. A Microsoft Azure AI Foundry standard kínálatában szerepelnek, globális és európai adatrezidenciás zónákkal, míg a Microsoft 365 Copilot, a GitHub Copilot és az Azure‑agent szolgáltatások is ezekre az új generációs modellekre állnak át. Így egy nagyvállalat a meglévő Microsoft‑stacken keresztül juthat hozzá a legfrissebb OpenAI‑képességekhez.

Biztonság, megbízhatóság, mentális egészség

A GPT‑5‑tel az OpenAI a biztonság területén is új irányt vett. A korábbi, erősen „refusal‑alapú” megközelítés – amikor a modell vagy teljesíti a kérést, vagy elutasítja – helyett megjelent a safe completion koncepciója. Ez azt jelenti, hogy a modell igyekszik a kérés biztonságos részére válaszolni, miközben a potenciálisan veszélyes, például biológiai vagy kiberbiztonsági visszaélésekhez vezető részleteket elkerüli, és transzparensen jelzi, mit és miért nem mond el.

A GPT‑5.1‑hez kiadott rendszerkártya‑kiegészítésben az OpenAI arról is beszámol, hogy a baseline biztonsági tesztek immár kiterjednek a mentális egészségre és az érzelmi függésre is. A gp5 5.1 openai modelljeit külön értékelik, hogyan reagálnak olyan helyzetekben, amikor a felhasználó pszichotikus tünetekről, mániáról vagy egészségtelen érzelmi kötődésről számol be a ChatGPT‑nek. A cél, hogy az AI ne erősítse fel a problémát, hanem óvatosan támogató és szakemberhez irányító szerepet töltsön be.

Mindemellett az OpenAI továbbra is hangsúlyozza: a modellek – bármilyen okosak is – nem helyettesítik az orvosi, jogi vagy pénzügyi szakértői tanácsadást. Az ajánlás egyértelmű: magas tétű döntéseknél a GPT‑5 és a GPT‑5.1 válaszait mindig emberi átnézéssel, szakmai kontrollal kell kombinálni.

Mit jelent mindez a magyar felhasználóknak?

Röviden: a mesterséges intelligencia a gp5 5.1 openai párossal még közelebb kerül ahhoz, hogy általános „digitális munkatárssá” váljon. Fejlesztőknek azt jelenti, hogy a kódolási munka egyre nagyobb részét lehet ügynökszerű rendszerekre bízni – a tervezéstől a megvalósításon át a tesztelésig. Üzleti oldalon a dokumentumelemzés, riportkészítés, ügyfélszolgálati automatizálás vagy akár belső tudásbázisok kezelése válik gyorsabbá és pontosabbá.

A magyar piac szempontjából az is lényeges, hogy a GPT‑5 és GPT‑5.1 már jobb magyarnyelv‑kezelést, pontosabb fordítást és természetesebb stílust ígér, mint elődei. Bár a lokalizáció minősége továbbra sem egyenértékű az angollal, a fejlődési irány egyértelmű: a következő években a helyi nyelvek támogatása döntő versenyelőny lesz a nagy modellek között – legyen szó az OpenAI, a Google Gemini vagy más szereplők megoldásairól.

Az biztos, hogy a GPT‑5‑generációval zárul az az időszak, amikor az AI „okos chatbot” volt a fő narratíva. A következő fejezet már az ügynökökről, a tényleges munkaátadásról és a biztonságosan felügyelt, félig autonóm rendszerekről szól – a gp5 5.1 openai modelljei pedig ennek az új korszaknak az első, élesben is bevethető alapkövei.

Felhasznált források