Programuotojai taps nereikalingi? Sukurtas dirbtinis intelektas, galintis programuoti užduotis pilnai
(1)Vartotojams tereikia įvesti teksto užklausą į „Devin” sąsają, o tada jis perims kodo rašymą, klaidų taisymą ir testavimą. Pavyzdžiui, „Devin” gali kurti programas arba optimizuoti didelius kalbos modelius. Kol kas prieiga prie šios priemonės yra ribota.
Rinkoje jau yra keletas dirbtinio intelekto kodo rašymo pagalbininkų, įskaitant „Github Copilot”. Tačiau „Devin” iš jų išsiskiria tuo, kad gali visiškai valdyti projektų kūrimą – nuo kodo rašymo ir susijusių klaidų taisymo iki galutinio vykdymo.
Devin taip pat tvarko projektus populiarioje „Upwork” platformoje. AI gali naudotis kūrėjų įrankiais, įskaitant savo apvalkalą, kodo redaktorių ir naršyklę, izoliuotoje kompiuterinėje aplinkoje.
Naudotojui tereikia į „Devin” sąsają įvesti teksto užklausą, o tada dirbtinio intelekto programuotojas pradeda kurti laipsnišką problemos sprendimo planą. Tada „Devin” pradeda projektą naudodamasis programuotojo priemonėmis taip, kaip jomis naudotųsi žmogus: rašydamas kodą, spręsdamas problemas ir atlikdamas bandymus.
Dirbdamas jis realiuoju laiku praneša apie pažangą. Jei žmogus pastebi netikslumą, jis gali eiti į pokalbių sąsają ir duoti dirbtiniam intelektui komandą jį ištaisyti. Tai leidžia inžinierių komandoms dalį projektų perduoti dirbtiniam intelektui ir sutelkti dėmesį į kūrybiškesnes užduotis, kurioms reikia žmogaus intelekto.
Remiantis pateiktomis demonstracijomis, dabartinės formos „Devin” gali atlikti daugybę užduočių. Jis gali vykdyti įprastus inžinerinius projektus: kurti ir tobulinti taikomąsias programas ir (arba) interneto svetaines nuo nulio, rasti ir taisyti kodo klaidas.
Sudėtingesnės užduotys apima didelių kalbos modelių optimizavimą naudojant nuorodą į mokslinių tyrimų saugyklą „GitHub” arba nepažįstamų technologijų tyrinėjimą.
Pavyzdžiui, Devinas išstudijavęs tinklaraščio straipsnį sužinojo, kaip sukurti kodą, skirtą paveikslėliams su paslėptomis žinutėmis kurti. Kitu atveju jis kūrė kompiuterinės regos modelį rašydamas ir derindamas atitinkamą kodą.
Devinas taip pat išsprendė „SWE-bench” testą, kuriame dirbtinio intelekto pagalbininkams pateikiamos realios problemos iš „GitHub” atvirojo kodo projektų. Dirbtinio intelekto programuotojas sugebėjo išspręsti sudėtingas problemas 13,86% atvejų be žmogaus įsikišimo.
Palyginimui, „Claude 2” sugebėjo išspręsti tik 4,80% problemų, o „SWE-Llama-13b” ir „GPT-4” – atitinkamai 3,97% ir 1,74%. Visiems šiems modeliams reikėjo žmogaus pagalbos.
„Cognition” tiksliai nenurodo, kaip pasiekė šį rezultatą ir ar naudoja savo modelį. Pradedančioji įmonė ankstyvąją prieigą prie „Devin” siūlo tik atrinktiems naudotojams. Tikimasi, kad platesnė prieiga bus suteikta vėliau. Įmonė jau gavo 21 mln. dolerių finansavimą.
Rašyti komentarą