OpenAI o1: Tényleg annyira jó ez az új nyelvi modell mint ahogy a cég és a tesztelők állítják?

Published: Sep 14, 2024 Duration: 00:33:13 Category: Science & Technology

Trending searches: openai o1
Az OpenAI kifejlesztett egy új sorozatot a mesterséges intelligencia modellekből amelyeket úgy terveztek hogy több időt töltsenek gondolkodással mielőtt válaszolnak. Ezeket a modelleket arra képezttek ki hogy több időt töltsenek a problémák átgondolásával mielőtt reagálnának hasonlóan az emberekhez a képzés során megtanulják finomítani a gondolkodási folyamatukat különböző stratégiákat próbálnak ki és felismerik a hibáikat ezek a modellek amiket most bemutat ott az open ai az open ai o1 az o1 preview és az o1 mini jelenleg az o1 preview-t és az o1 minit tudjuk használni egy új elnevezést indítottak ami innen az o1-től indul majd sziasztok pinter zsolth vagyok az mp3pintyo csatornától és nézzük meg hogy mit ír róla az open a természetesen minden link amit most megemlítek az benne lesz a videó leírásában az opennak a web oldalán már elég sok blogbejegyzés született róla itt nagyon részletekbe menően el tudjátok olvasni a technikai részleteket én most csak átfutnék rajta hogy megnézzük hogy hogyan teljesít a való életben amikor használjuk itt például írják azt hogy az open ai a versenyprogogramozási kérdésekben a legjobbak közé tartozik az usa matematikai olimpiájnak kvalifikációs fordulójában az usa legjobb 500 diákja köré sorolható a fizika biológia és kémiai feladatok mércélén pedig meghaladja a phd szintű emberi pontosságot ő az állításuk szerint bár még dolgoznak azon hogy ez az új modell olyan könnyen használható legyen mint a jellegi modellek ennek ellenére azért kiadnak egy ilyen korai verziót az open a o1 previewt amelyet most már azonnal tudtok használni a chatgpt-ben és a megb ó api felhasználók számára is elérhető ez azt jelenti hogy ti5-ösek ami ha jól emlékszem az hogy az utolsó 30 napban minimum 1000 dollárt költöttek el tehát ők az api-on keresztül is elérhetik számukra nincsen korlátozás viszont ha te használod a chat gpt felületén amit úgy tudsz megtenni hogy miután elindítottad és indítottál egy új csevegést ezt lenyitod ki tudod választani illetve látod a régebbi modelleket is ott korlátozás van elméletileg az o1 previewnál heti 30 darab kérés az amit tudunk felé intézni bár most volt egy tweet tegnap hogy resetelték azoknak akik már elhasználták illetve az o1 mini esetén ez a limit tehát nem napi limit van hanem heti tehát még nagyon-nagyon keveset lehet csak használni hogyha nem apion keresztül használod természetesen az open ai oldalán láthattok rengeteg videót arró hogyan teljesít a genetikában a kvantumfizikában tehát egy egy csomó mindent meg tudtok nézni ahol esetleg ilyen promptokat is mutatnak illetve hogy hogyan gondolja hogyan fejti meg azt a problémát amit meg kellene ugy itt kódolás akkor ez mi volt matematika logikai puzzleök tehát rengeteg mindent felvetettek ötletet ami nagyon jó kiindulópont lehet hogy ki tud álni azt hogy mégis mire is képes ez az új modell a az open ai o1 mini arra is van egy külön bog bejegyzés az úgyszintén használható aminek az az előnye hogy 80%-kal olcsóbb mint az o1 preview valószínűleg majd azért ebbe az irányba fognak elmenni hiszen nem mindegy az hogy milyen költségekkel jár nekik a modellnek az üzemeltetése azt tudni kell hogy mind a preview mind az o1 mininek a tudásbázisa az 2023-mal ér véget illetve nem feltétlenül akkora tudásbázisa van nem annyi méretű adaton lett tanítva mint a nagy modell amit eddig használtunk a 4o tehát erre azért figyeljetek oda hogy melyik feladathoz melyiket használjátok az openir amúgy a legtöbb feladthoz a négy t ajánl a komplikáltabb feladatokhoz ahol nagyon fontos a logika illetve az hogy nagyon hosszú érvelés kell esetleg nagyon logikusan kell gondolkodni lépésről lépésre ott inkább már az o1-es modelleket ajánlja a számunkra az o1 minit azt megkapják sőt meg is kapták az ingyenes feliratkozók is tehát akinek nincsen plusz vagy teams előfizetése vagy enterprise azt ugyanúgy az o1 minit már tudja használni tehát nem szükséges előfizetés hozzá itt látunk több statisztikát is mindjárt megkeresem hogy hol is van az milyen eredményeket ér el a gpt4o modellhez látjátok hogy itt mindenféle benchmarkokban mennyivel jobban teljesít az előző modelljüknél főleg itt példá fizikába matematikába nagyságrendekkel jobban teljesített elég minőségbeli ugrást tapasztalhatunk hogyha eddig ilyen feladatokat oldottunk vele itt természetesen nem egy egyszerű kettő meg kettő kérdésre kell gondolni hanem elég komplex matematikai feladatokat is képes most már megválaszolni a számunkra de mit is jelent ez hogy átgondolja a problémákat és többet gondolkodik rajta ez a technika már azért régről is mert ez a chain of toe nevezzük csak most mostantó cotnak tehát a cot az ami egyfajta megközelítés a nyelvi modellek eset ében amikor a feladat megoldása során lépésről lépésre követik a gondolkodás folyamatát és ez a módszer különösen hasznos lehet bonyolult problémák esetén amikor több lépésen keresztül kell érvelni vagy logikai következtetéseket kell levonni a kotos technikával megadott promtok arra késztetik a modellt hogy részletesen mutassa be a gondolkodási folyamatát ezt itt láthatjátok is a weboldalon ennek a linkjét is belerakom a videó leírásába tehát itt van mondjuk egy kódolási feladat amikor gpt forót megkértük hogy itt hajtsa végre ezt a feladatot akkor látjátok hogy utána egyből meg is próbálta ezt létrehozni míg az open ao1 preview változatánál meg tudod nézni hogy mi volt a gondolkodási folyamat és itt egyből látjátok a gördítősávon hogy nagyon-nagyon sok plusz lépés az amit még közbeiktatott hogy sokkal jobb minőségű kimenetet tudjunk a számunkra adni talán itt a matematika feladatnál látni a leginkább hogyha ezt lenyitom akkor akkor látszik hogy ez bizony félelmetesen hosszú lépésől lépésre az a gondolkodási folyamat amin végigmegy azért hogy utána a legvégén kiköpje a végeredményt tehát ezeket itt meg tudjátok nézni ezen a weboldalon csak nyissátok le itt ezt a show chain of toot és akkor látjátok hogy bizony-bizony itt nagyon-nagyon sokáig tart neki a háttérben amíg lépésről lépésre végrehajtja ezt amikor mi használjuk akkor nem fogja ezeket részletekben menne kiírni a számunkra hanem inkább csak ilyen mini összefoglalót a ír ki tehát elhádolja elrejti ezt előlünk hiszen amúgy el is f fogyna a kontextablakunk illetve nem feltétlenül szükséges nekünk ennyire aprólékosan részletről észletre tudni hogy mi is volt az a folyamata ahogy eljutott a végcélig ugye például itt a matematikai probléma esetén ahelyett hogy azonnal megadta volna a választ a modell lépésről lépésre felvezeti a gondolkodást és végigvezeti a felhasználat a megoldás folyamatán és ez a technika hatékony lehet összetett kérdések megválaszolásában mivel lehetőséget ad a modellnek arra hogy részletesebb és alaposabb választ adjon amúgy természetesen megadhatnánk azt is a gpt4o modellnek hogy gondolkodjon így tehát mielőtt feladnánk neki egy problémát hát azelőtt azt a promptot megmondjuk neki hogy figyelj lépésről lépésre gondolk hogy és úgy old meg a feladatot azzal általában amúgy jobb kimeneteket is szoktunk kapni én itt kipróbáltam többször de nem mindig adott jó választ a foró a kotos technikával tehát itt például az volt a kérdés lássuk csak hogy ugye itt megadtam neki k hogy hogyan gondolkodjon a problémáról és hány r van az árvíztűrő kifejezésben és szépen megmondta hogy kettő darab r betű van az árvíztűrőben még ha csak a sima gpt foro modellnek tettem fel hogy mennyi van akkor azt mondta hogy egy darab r betű van benne a strawberryre is azt mondta arra viszont érdekes módon az angol szóra már azt mondta hogy három darab r betű van benne tehát érdekes ott működött hány szó van a válasz promban itt ezt elrontotta mert ez nem nyolc darab még ugyanez az új preview modellnek tökéletesen működik ezt majd mindjárt ki is próbáljuk ezt a bonyolultabb feladatot például amit majd végrehajtunk ez a kis csészés a feladat a az apperrel az működik érdekes mód a gpt4o modellnek is még a legtöbb modell ezen teljesen elhasal tehát azért nem feltétlenül mindenbe fogtok látni változást de ahol esetleg elakadt és nem tudta logikusan átgondolni a feladatot és ti is úgy érzitek hogy sokkal többet kellett volna ötölnie hatolnia rajta akkor ott valószínűleg már jó választ fog adni a preview modell na most nézzük is akkor meg mindegyiknél egy új ablakot fogok nyitni biztos ami biztos azért hogy nehogy az legyen hogy a az addigi kontextus befolyásolja a választ legyen akkor a legelső feladat mondjuk megadhatjuk neki magyarul is nézzük meg hogy mit mond rá ugye elméletileg erre a sima no modell is megadta a választ látjátok itt kiírja hogy gondolkodás folyamatban felhelyezés és figyelés elhelyezés és azt már nem tudtam elolvasni sokkal tovább tart a válasznak a kiírása akár valamikor 3040 másodpercig is gondolkodik mi volt a promptunk tételezzük fel a fizika törvényeit a földön egy k epret egy normál csészébe teszünk és a csész-t fejjel lefelé az asztalra helyezzük ekkor valaki elveszi a csész-t és beteszi a mikrohullámú sütőbe hol van most az eper lépésről lépésre magyarázza el érvelését és szépen itt látjátok ha kinyitjuk akkor itt van a gondolkodás menete az hüm még ümbög is azért ez jó érdekes gondolatok jó elhelyezés oké és akkor itt van a lépésenkénti magyarázat amit tulajdonképp nekünk szükséges az pret a csészébe tesszük tehát ilyenkor az eper a csése belsejében van a csészét fejjel lefelé az asztalra helyezzük a csésze most kupolaként feli az epret amely az asztalon nyugszik a csésze alatt valaki elveszi a csészét beteszi a mikróba amikor a csését felemelik az er az asztalon marad hacsak nem ragadt a csése belsejéhez ami nem valószínű ez is egy nagyon jó következtetés mert mi van ha mondjuk nagyon pici csésza volt a következtetés az eper továbbra is az asztalon van még a éze a mikroban válasz az er az asztalon van tökéletesen jó válasz amúgy nagyon érdekes hogy amikor ezt a kotos technikát használtam a gt gpt4o modellel akkor látjátok hogy érdekes mód sokkal hosszabban érvelt itt a számunkra úgyhogy ez elég furcsa nem véletlenül jó ez a technika hogyha csak szimplán használod bármelyik nyelvi modellt akkor mindenféképp érdemes így kezdeni a odat jó nézzük meg a következő feladatot reméljük nem fog elfogyni itt nekem felvétel közben ezért direkt egyáltalán nem is használtam ez egy bonyolultbb feladat sokkal mint az előző volt a következő a feladat leírására hozzon létre egy 3d-s kígyó jáátékot tehát egy snakeet html és javascript használatával ez a játék némileg eltér egy hagyományos kígyójág tétól a következőkben ez 3d-s a kamera követi a kígyó harmadik személynek a nézőszögét láthatja a térkép széleit és mozoghat egy rácson élelmiszerek jelennek meg te megeszed őket hogy megnőjön a kígyó a játék többi alapelve ugyanolyan mint bármelyik kígyójáték csak 3d-ben nézzük hogy mit adott ki itt van egy html fá amit kiadott itt van egy masszív javascript kód ú elég szép hosszan elmagyarázza hogy hogyan is működik itt vannak a függőségek hogy mire van szükség e szerintem itt biztos bele is rakta a javascriptbe igen itt van a clad fől ezt a three mean js filt letölti ami szükséges neki hozzá nézzük meg fogjuk ezt a kódot kimásoljuk egy index html file-ba a javascriptet az pedig lemegy egy script néven script.gs oké lementettük és akkor most fogjuk és megnyitjuk ezt a html ft oké hogyan lehet irányítani ez itt a kérdés aha hát ez bizony nem működik hiába találtam ezt a jó kis promptot és persze bemutatták hogy mennyire jól megy ezek szerint azért itt is van olyan eset amikor hiába gondolkodik rajta hiába meg lépésről lépésre nem mindig sikerül neki megoldani a feladatot itt megkérdeztem utána hogy most mi a helyzet hiszen nem működik tehát látszólag a játék nem reagál a nyílgombok lenyomására és nagyon érdekes mert általáb ában nem szokott semelyik nyelvi modell ennyi de ennyiféle lehetőséget kiadni hogy mi lehet a lehetséges okok és megoldások tehát látjátok 1 2 3 4 5 6 7 8 k tehát itt tényleg rengeteg rengeteg olyan lehetőséget ad neked ahol elhasanhatott a kód és nagyon szépen elmagyarázza hogy mivel lehet a probléma hát ez példá nekem sokkal jobban tetszik mint az eddigi tehát a gpt4o modell de a cló sem volt olyan hogy ennyi mindent így pluszba kiírt volna lehetséges hibaként bár hiába javítottam bele ezeket hiába írtam be nem működik továbbra sem úgyhogy ezen elbukott és nem sikerült neki de lehet hogy egy másik pillanatában jó kód lenne amit megír azért még kipróbálhatjuk még egyszer megnézzük hogy ha ugyanígy beírom egy másik ablakban akkor ott mondjuk jó lesz-e csak továbbra is nehogy elhasználjam a keretet mert a akkor bizony nem fogom tudni tovább felvenni a videót szépen írja is ki annak ellenére hogy az első napokban nagyon lassan működött tehát tényleg ilyen 30-40 sőt egy perces válaszidőkról számoltak be az emberek úgy látszik úrá lettek ezen és most már sokkalsokkal gyorsabban dolgozik mint ahogy eddig működött ühüm ez is érdekes hogy kiírja kódnak a részleteit tehát ugye itt van egy index html funk az nem egy nagyszá az megjelíti ezt a kanvas és behúzza a gs f utána viszont nagyon szépen elmagyarázza nekünk azokat a részeket ahol felépíti a gridet létrehozza a snakeet hozzáadja a kajákat tehát ez sem jellemző a kódírás közben sőt azt kell hogy mondjam hogy sokkal sokkal hosszabb az a kontextus amit kiír tehát a válaszüzenetnek a hossza az rettentő hosszú ilyenkor már nagyon sokszor a gpto modell azt szokta mondani hogy bizony itt egy folytatás gombot kellene nyomni különben nem képes kiírni a választ hú ez szép lett nézzük is meg akkor hogy működik-e azt mondja igen hogy a nyílgombokat kell has hasnálni jó megnézzük kikopizzuk itt a script funk szépen felülírjuk az előzőt kitöröljük meglátjuk hogy működik-e az index htmelt azt is megnézhetjük de szerintem azon nem változtatott de azért biztos ami biztos felülírjuk azt is igen az nagyjából ugyanaz lett és akkor most frissítsunk rá lássuk egyből gameover hát ez kellemetlen mert egyből vége a játéknakát ezt másodjára sem tudta megugrani most megpróbálom még egyszer egy másik ablakba igen egyből game over ez nem működik jó menjünk tovább következő feladatra következő feladat írjon 10 mondatot és nem 10 szót aminél a legelső szó egy betűs és minden következő szó egy betűvel több mint az előző volt és álljon meg az utolsón nál ami 10 betűből áll és természetesen értelmesnek kell lennie a mondatunknak szó hosszúságok felmérése érdekes hogy ezt itt már magyarul írja ki a szám ra bár néha eléggé katyvasz amit kiír ilyen eléggé magyartalan a szöveg ami megjelenik itt látjátok hogy most sokkalsokkal hosszabban gondolkodik hogy hogyan csináljon egy olyan mondatot ami 10 szóval áll és minden egyes szó ahogy haladunk az egyre hosszabb és hosszabb egy karakterrel megvizsgálja a szóhosszokat logikai gondolkodás szavak számolása lépések útján haladok kinyitjuk meg nézzük hogy ahm jelenleg egy nyolc betűs szót keresek érdekes azt hm nagyon jó nekem egy nyolc betű szó kell ami nem tetszik vagy ami túl bonyolult ez követően egy más sablont keresek hú ez nagyon hosszan történik ez a gondolkodás ezt átpörgetem mert ez ilyen neverending sztorinak tűnik egyelőre amíg ez készül szeretném megemlíteni hogy az mprm pintja youtube csatornának van egy discord szervere ahol egy nagyon jó társaság gyűlt össze több mint 300 ember itt megoszthatsz képet szöveget hangot videót bármit hogyha elakadtál akkor azt is megteheted hogy felteszed a kérdésedet és valaki nagyon rövididőön belül biztosan segíteni fog és válaszol rá hogy hogyan lehet ezt megoldani ugye a youtube comment szekciójában azért nincsenek ilyen lehetőségek hogy képet vagy videót osszál meg itt nyugodtan megteheted a meghívó linkje ott van a videó leírásában természetesen teljesen ingyenes a használata és itt szeretném még megköszönni a pétraonos és a youtube támogatóknak hogy támogatják a csatornát ezt bárki megteheti az npr pintyő youtube csatornán minden videónál a köszönöm vagy a csatlakozás gombnak a használatával hogyha úgy érzed hogy szeretnéd támogatni a munkámat akkor ezt meg tudod tenni illetve iratkozzatok fel hogy minél több hasonló videóról kapjatok értesít ami felkerül folyamatosan a csatornára nézzük meg hogy mi lett a nézzük csak meg akkor ezeket a szavakat h jó-e a mondatunk nem nagyon örülök annak ha az emberek hirtelen teljesen megzavaradva távoznak fogjuk rá hogy értelmes egy betűs szó 2 3 4 5 itt egy hiba mert ez ötbetűs utána van egy hat betű só ez hét betűs ez nyolc betűs 1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 hát nem mondom hogy jól megoldotta a feladatot mert ejtett benne hibát nézzük meg hogy erre a sima gpt 4o az mit mondana lássuk hogy annak megy-e 1 2 3 4 5 itt már el is hasalt mert ez jóval hosszabb tehát ez itt 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 9 aztán rövidebb hosszabb rövidebb teljesen összeevissza van tehát ez bocsánat ez nem annyira jó viszont itt legalább az megvolt hogy folyamatosan nőtt a hossza betűknek még hogy hogyha kétszer hibát is ejtett de aránylag jó kimenetet kaptunk hát erre adok egy félpontot mondjuk nézzük meg a következőt írjon meg egy tetrisz játékot pythonban egy újabb programozási feladat az előzőn elhasalt a tetrisz azért kicsit könnyebb nézzük meg hogy ezt hogyan tetrisz történés tetris kód elkészítése úgy látszik itt nem fog annyit gondolkodni mint az előző szavas példánkon hanem sokkal előbb ki fogja bökni a választ mint látjátok amután letelt a gondolkodási idő tehát ott lépésreő lépésre átgondolta hogy mit csinál és hogyan azután már magát a választ azt nagyon-nagyon gyorsan írja ki a számunkra tehát nem az van hogy akkor ott is nagyon sokat várakoznunk kellene nézzük is meg itt van a teljes kód hogy ez működik-e ja a p game az nekem telepítve van tehát arra nincs szükségünk tetr belemásoljuk és megnézzük hogy működik-e itt a tetriszünk szépen kimozgatom le tökéletes forgatás is jól működik a felfelé lefelé gombbal nem inkább csak a felfelév má lefelé lefelé az felgyorsítja igen hogy hogy an esik lássuk hogy egy sort le tuda venni valami olyan elem kellene és igen nézzük meg hogy működik-e és működik igen tökéletesen jól működik mondjuk a pontszámokat nem írta ki de hogyha egy kicsit hosszabb promptot adtunk volna neki és megkérjük rá hogy természetesen legyen pontszámítás is akkor az is működne láthatjátok hogy tökéletesen jól fut ez a tetriszes kód elsőre ez egy nagy thumbs up ez sikerült neki meg megoldania mehetünk is tovább a következő kérdés amit felteszünk neki írjon nekünk 10 olyan mondatot aminél az utolsó szó az a narancs itt a gpt foró modell általában ilyen kilences eredményre szokott végezni a kotos technikával pedig csak nyolcat sikerült neki összehoznia tehát hot többet rontott mint amikor nem írtam be hogy gondolkodjon lépésről lépésre itt ha megnézitek akkor az összes mondat végén ott a narancs tehát tökéletesen sőt itt még van egy olyan is amikor egy macskának adta ezt a nevet ez nagyon jó ilyet még nem láttam modelltől tehát ez ez egy elég érdekes felvetés a részéről ez jó ez tetszik ez nagyon tetszik ezért adunk neki két pontot nézzük meg a következőt ezen is nagyon sok modell elbukik a feladat nag nagyon egyszerűnek tűnik melyik a nagyobb a 13,11% vagy a 13,7 és itt a legtöbb modell az szokta válaszolni hogy a 13,11 a nagyobb de ő tökéletesen jól látja hogy a 13,7 nagyobb mint a 13,1% ezt látszik is hogy a az ötleteléss a háttérben tényleg csak pár másodperc volt tehát sokkal gyorsabb mint az előbb kedvenc matematika könyvemből egy kérdés ezzel már találkozhat ok hogyha nézitek a csatornát 15 madár ül egy fán az egyiket lelőjük hány madár marad a fán a válasz az rossz a válasz rossz mégpedig azért nagyon érdekes mert mit is mond amikor egy madáat puskával lőnek le a hangos zaj általában elriesztja a többi madárat ja hogy ja ezért az összes é madárra lerepül a fáró és csak a lelőtt madár marad hát igen ha úgy vesz hogy a lelőtt madár egy nagyon vastag ágon ült akkor nem esik le vagy hogyha annak a puskának a golyója nem volt akkora lendületben ami azért elképzelhetetlen hogy lerepítse szerencsétlen madarat akkor ott maradna de ez ez kicsit necces ez fél pont mert akár igaz is lehetne de a jó válasz ennek a nullának kellene lennie hisz egy puskalövéstől az a szerencsétlen madár bőven lerepül arról a faágról amin üldögél de azért egy felet adunk neki a következő feladat az talán a volt a legújabb videó erről a csoda modellről aminél kiderült a reflection 70b hogy mégsem annyira jó mint amennyire mondják de azért nézzétek meg ti is a videót amiben a következő kérdést tettem fel nyolc darab körte van egy kosárban a körtéket úgy kell elosztani nyolc ember között hogy mindenki kapjon egy körtét és a kosárban is mar adjon egy hogyan csinálnád a válasz tökéletes az utolsó személynek a kosarat úgy kell adni hogy benne van a körte nagyon jó a másik feladat amire eddig talán egyszer láttam jó választ az is egyszerűnek tűnik egy ember számára de a nyelvi modellek ennek ellenen mégis elrontják a folyó egyik partján állsz a túlsó oldalon van egy barackva hogyan mész át a másik oldalra nyáron van egy csónakod így át tudsz evezni és télen hogyan mész át a barackot enni a folyó befagyott így nem tudsz csónakkal menni nézzük meg hogy mit válaszolt a nyáron csónakkal átevezhet a folyón és elérheti a második oldalon lévő őszi barack fát és élvezheti a friss őszi barackot télen bár a csónakot nem használhatja mert a folyó befagyott egyszerűen átsétálhat a folyó befagyott felszínén ja azért itt érdekes hogy nem írta ki azt hogy azért vigyázz mert beszakadhat ne feledje azonban hogy az őszi barackfák tényleg nem hoznak gyümölcsöt így nem lesz friss őszi barack ennivaló ha tartósított őszi barackot nyárról akkor inkább azt élvezheti tökéletesen jó a válasz ez nagyon-nagyon jól sikerült oké a következő itt is el szokott hasonni a modelleknek a jó része kirakunk a napra száradni öt inget és ezek négy óra alatt száradnak meg akkor mennyi ideig tart megszáradni a 20 ingnek logikusan gondold át a választ lépésről lépésre magyarázd el. Ugye a válasz az hogy ugyanúgy 4 óráig szárad az 5 ing. ITT NEM HIBÁZOTT! Ez nagyon érdekes mert hogyha ugyanezt beírjuk a gpt for onak itt megnézem hogy igen nyitok egy új ablakot amiben a 4o-t használom és feladom neki ugyanezt a feladat akkor ő nekem eddig azt írta ki a szimpla 4o modell hogy bizony ugyanannyi ideig tart. 4 tehát így van ugyanannyi ideig tart a szárítás az állandó marad mindaddig amíg a körülmények napfény levegő hely lehetővé teszik és az összes ing azonos sebességű egyidejű száradását. Tehát érdekes mód a 4o modell ezt jobban válaszolta meg mint az o1 preview ITT NEM HIBÁZOTT! modell. Ezt teljesen elrontotta és 16 órát írt ki ami nem igaz. Ez furcsa, ez furcsa, itt elhasalt. Jó ez egy nagyon nehéz feladat ezt a sima 4o modell nem tudja rendesen megválaszolni méghozzá azt hogy hány szó van a abban a promtban ami majd a válasz lesz tehát nézzük meg meg vagyis rosszul mondtam hány szó van a válaszban erre a promptra igen nézzük meg azt mondja hogy ez öt szó tartalmaz 1 2 3 4 5 tökéletesen jó nézzük meg egy még egyszer beírjuk itt teljesen rossz válaszokat szokott kiadni lényege szinte mindegyik nyelvi modell mertogy itt nem feltétlenül igen ugyanazt a választ írta ki amúgy érdekes és ugyanúgy az ött teljesen jó a válasza menjünk tovább hány r van az árvíztűrő kifejezésben most magyarul tesszük fel hátha ezzel sikerül kibillenteni őt a gondolkodásból kettő darab r betű van benne ez tökéletesen jó úgyhogy érdekes a vég eredmény itt látjátok hogy például ezen az egyszerűbbnek tűnő példán elhasalt hogy mennyi ideig száradnak az ingek illetve a programozásban csak a tetriszt tudta megcsinálni amikor azt kértük tőle hogy ezt a 3d snakeet készítse el de kétszer is nekifutottunk a feladatnak akkor ez nem működött neki pedig aztán tényleg látszólag nagyon nagyon jól kifejtette sokat is gondolkodott rajta bár itt mondjuk négy másodpercet írt ki é érdekes hogy amikor azt a mondatot kellett előállítania aminél a mondatban lévő szavak mindig egyre hosszabbak ott 95 másodpercig tartott amíg a folyamat ment a háttérben és utána is elrontotta úgyhogy felemás a végeredmény nagyon-nagyon lenyűgözte az embereket a twitteren és máshol is a youtube tesztereket hogy mennyire jól működik én azt látom hogy kérdé a válogat és valamikor ugyanúgy mint a foró modell jól válaszol valamikor rosszul válaszol mivel ez csak egy preview változat tehát valószínűleg a következő iteráció amit már kihoznak a következő változata az sokkal jobb lesz úgyhogy reméljük hogy ez hogyha majd a legközelebbi változatnál feltesszük a kérdéseinket akkor mindegyiknél 100%-ban jól fog válaszolni írjátok meg a kommentekben hogy ti teszteltétek- és hogyha teszteltétek akkor nektek milyen eredményeket hozott ki mennyire működött jól ha tetszett a videó akkor lájkoljátok illetve osszátok meg másokkal köszönöm hogy itt voltatok sziasztok

Share your thoughts

Related Transcripts

Top Aktien Picks! | Coinbase, Biontech, Palantir, Paypal & Co. | Zinsen & Sparpläne thumbnail
Top Aktien Picks! | Coinbase, Biontech, Palantir, Paypal & Co. | Zinsen & Sparpläne

Category: Education

Willkommen zurück leute zu einem neuen video auf meinem kanal wir wollen heute noch mal eine aktienanalyse machen zu den aktien die wir uns in den letzten wochen angekuckt haben wo wir einstiege getätigt haben wo wir gegebenenfalls long getradet oder auch geschortet haben und so weiter und so fort ja... Read more

Training the largest LLMs, Cerebras Wafer-Scale Architecture | Keynote 3 | Jean-Philippe Fricker thumbnail
Training the largest LLMs, Cerebras Wafer-Scale Architecture | Keynote 3 | Jean-Philippe Fricker

Category: Science & Technology

[music] thank you thank you so much and thank you for attending this session i know you had uh maybe four days of uh hard labor uh i'm going to try to show you how your labor could be somewhat simplified with what we've done at cerebras um so yes my name is jean philip freer and as you know when you... Read more

Unleashing AI Power: Cerebras' Giant Chip Meets Meta's LLaMA 3.1 Revolution! #shorts #viralreels thumbnail
Unleashing AI Power: Cerebras' Giant Chip Meets Meta's LLaMA 3.1 Revolution! #shorts #viralreels

Category: Science & Technology

Cerebra systems is revolutionizing the world of artificial intelligence with its massive wafer scale computer chip roughly the size of a dinner plate this innovative technology is about to take a significant leap forward as it prepares to integrate me's open source llama 3.1 onto the chip by putting... Read more

Steve Ballmer On The LA Clippers New Home the 'Intuit Dome' thumbnail
Steve Ballmer On The LA Clippers New Home the 'Intuit Dome'

Category: People & Blogs

Introduction here at the 2024 nba allstar game in indiana the 24th annual nba tech summit and i am joined by the ninth richest person in the world steve bomber how you doing sir good good thanks jar i what steve ballmer has learned at the nba tech conference appreciate uh listen i was watching you on... Read more

What’s Next in AI: NVIDIA’s Jensen Huang Talks With WIRED’s Lauren Goode thumbnail
What’s Next in AI: NVIDIA’s Jensen Huang Talks With WIRED’s Lauren Goode

Category: Science & Technology

Hello everyone. welcome, siggraph. it is my first siggraph. i'm so excited to be here. i'm so excited to speak to all of you, and i'm so excited to speak to nvidia founder and ceo jensen huang. thank you. great to see you again. thank you. great to see you. welcome to siggraph lauren. welcome to my... Read more

BREST / SAINT ETIENNE - 11e Journée - Ligue 1 thumbnail
BREST / SAINT ETIENNE - 11e Journée - Ligue 1

Category: Gaming

Salut tout le monde du spectacle au programme aujourd'hui avec un match qui va se jouer dans ces lampes condition que menez pourrait vous assurez les commentaires assis pendant quelques instants un match de ligue 1 ebx le stade brestois contre l'as saint-etienne hamas dont les supporters parlent beaucoup... Read more

Liam Gallagher - The Girl With X-Ray Eyes (Noel Gallagher AI Cover) thumbnail
Liam Gallagher - The Girl With X-Ray Eyes (Noel Gallagher AI Cover)

Category: Music

Foreign [music] yeah we're nowhere down here this heart just swallow like the clue that was twisted on the uptown by the scene of the standing still there was no one to be seen no one left to hit my screaming so she took me left in the sand my god when the day was done in the morning she was tired [music]... Read more

Chamath Palihapitiya Nvidia's Price is Going to Blow Your Mind thumbnail
Chamath Palihapitiya Nvidia's Price is Going to Blow Your Mind

Category: Education

Over the next five years i see nvidia's stock easily reaching a market cap of 50 to 60 trillion do nvidia jumped 12% on some comments made by meta um and microsoft that both said that there's increased ai demand and they're going to continue to uh to build out capacity so chamat i know you've talked... Read more

Jota au SRFC : le coup de génie de Massara (Roazhon FM) thumbnail
Jota au SRFC : le coup de génie de Massara (Roazhon FM)

Category: Sports

Bonjour tout le monde et bienvenue sur rison fm aujourd'hui nous allons parler de joao felipe le portugais de 25 ans a de grandes chances de signer dans les prochains jours au stade renet lui qui est plus communément nommé jota est actuellement au club de al itiad mais sur le dossier frédéric massara... Read more

How the data helps you win Fantasy Football with ESPN's Greeny thumbnail
How the data helps you win Fantasy Football with ESPN's Greeny

Category: Education

Fantasy football has exploded over the years, arguably becoming one of the most popular american pastimes. and as any fan knows, fantasy football is all about that data. so today i want to talk about how data and data preparation really make ai fly, how it makes it soar, but especially as it comes to... Read more

Nvidia's Record-Breaking Revenue thumbnail
Nvidia's Record-Breaking Revenue

Category: Entertainment

Nvidia just reported a staggering $30 billion that's a 122% jump from last year analysts expected only $28.7 billion in revenue but shares dipped over 3% in after hours trading ceo jensen juan is optimistic about the future he expects to ship more chips than ever next year the demand for ai is driving... Read more

Stock Market Winners & Losers: Nvidia Earnings | Boeing's Starliner| Kelce Brothers thumbnail
Stock Market Winners & Losers: Nvidia Earnings | Boeing's Starliner| Kelce Brothers

Category: News & Politics

Time now to talk winners and losers on wall street with financial expert rob black and rob this morning i'm seeing nothing but a sea red uh doesn't look all that hot good morning yeah we've had a great year so we're up almost 20% in the s&p 500 so there's going to be days like this but today's a weird... Read more