OpenAI práve oznámila o3 a o3 mini, ďalšiu generáciu modelov uvažovania.
V priamom prenose ukázal hlavný viceprezident výskumu Mark Chen výkon o3 v určitých benchmarkoch v porovnaní s o1, ako je konkurenčná matematika (96,7 percenta) a veda na úrovni PhD (87,7 percenta). OpenAI a súťaž ARC Prize tiež zdieľali, ako o3 dosiahol 76 percent v benchmarku ARC-AGI, ktorý zahŕňa nové, nepublikované súbory údajov. Benchmark ARC-AGI je navrhnutý tak, aby testoval schopnosť okamžite sa naučiť nové a charakteristické zručnosti s každou novou úlohou.
Tweet mohol byť odstránený
Oznámenie uzatvára maratón 12 dní OpenAI, ktorý každý deň priniesol niečo nové. Za posledných 12 pracovných dní OpenAI spustilo svoj AI video generátor Sora, víziu s pokročilým hlasovým režimom, okrem množstva produktov a funkcií navrhnutých tak, aby bolo používanie ChatGPT bezproblémovejšie v práci aj v každodennom živote.
Mashable rýchlosť svetla
S OpenAI teraz môžete volať ChatGPT na svojom telefóne
Model o3 mini je navrhnutý ako cenovo výhodný model, ktorý vyvažuje výkon. Má tri rôzne úrovne úsilia a množstvo času na uvažovanie sa upravuje podľa náročnosti problému. „Neuveriteľný nárast nákladov a výkonu,“ povedal generálny riaditeľ Sam Altman.
Takže o3 a o3 mini dosiahli úžasné prelomy v inteligencii, podľa OpenAI. Ale ešte nie sú pripravené na zverejnenie. OpenAI však poskytuje skorý prístup k o3 a o3 mini na testovanie bezpečnosti od dnešného dňa. Prihlášky do zúčastniť sa programu testovania modelov sú prijímané priebežne a uzatvárajú sa 10. januára.