Google pristatė dirbtinį intelektą, kuriantį virtualius pasaulius: juos galima valdyti kaip žaidime
Pagrindinis skirtumas nuo ankstesnių versijų – ilgesnė sesijos trukmė.
Dabar pasauliai egzistuoja ne dešimtis sekundžių, bet kelias minutes ir gali įsiminti vizualias detales net tuomet, kai į jas nežiūrima.
Pavyzdžiui, užrašas ant lentos ar dėmė ant sienos liks toje pačioje vietoje, kai vėl į jas pažvelgsite.
Vadinamieji „pasaulio modeliai“ – tai speciali DI klasė, kurianti simuliuotas aplinkas mokymuisi, žaidimams ar kitų neuroninių tinklų ir robotų treniruotėms.
Iš esmės, jūs pateikiate tekstinę užklausą, o DI sugeneruoja erdvę, panašią į žaidimą, tačiau ne sukurtą rankiniu būdu, o pilnai dirbtinio intelekto.
Praėjusių metų gruodį buvo pristatytas Genie 2, gebantis paversti paveikslėlius interaktyviais pasauliais.
Tuo tarpu naująją sistemą kuria komanda, kuriai vadovauja buvęs „Sora“ (OpenAI vaizdo generavimo įrankio) kūrėjas.
Genie 3 pasauliai veikia 720p raiška, 24 kadrų per sekundę greičiu, gali išlaikyti vaizdinius elementus maždaug minutę ir palaiko dinamiškus pokyčius.
Pavyzdžiui, galima pakeisti orą ar pridėti personažų pasitelkus teksto užklausas (promtus).
Tačiau kol kas modelis prieinamas tik ribotam skaičiui tyrėjų, kaip uždaro testavimo dalis. „Google“ pabrėžia, kad pirmiausia nori įvertinti rizikas ir apribojimus, prieš suteikdama prieigą plačiajai visuomenei.
Tarp dabartinių trūkumų – scenose esantis tekstas teisingai rodomas tik tuo atveju, jei jis buvo aiškiai nurodytas užklausoje, o patys pasauliai vis dar nesuteikia visiškos veiksmų laisvės.

Rašyti komentarą