Nacionalinis lietuvių kalbos garsynas (projektas LIEPA-3) jau eina į pabaigą, tačiau kad dirbtinis intelektas (DI) ne tik atpažintų, bet ir išties suprastų gyvą, autentišką lietuvių kalbą, mokslininkai kviečia įrašyti bent kelias minutes savo balso.
„Pažangiausi technologiniai sprendimai turi būti prieinami visiems, todėl turime mokyti dirbtinį intelektą suprasti lietuvių kalbą.
Tik taip galėsime su technologijomis bendrauti sava kalba ir užtikrinti, kad lietuvių kalba skaitmeniniame pasaulyje būtų lygiavertė kitoms“, – teigia „Telia“ skaitmeninės įtraukties vadovė Julija Markeliūnė.
Pasak Vytauto Didžiojo universiteto Informatikos fakulteto prof. dr. Gailiaus Raškinio, projekto LIEPA-3 veiklų koordinatoriaus, kuriamas 10 tūkst. valandų apimties garsynas yra būtinas tiek esamų, tiek būsimų technologijų plėtrai.
„Be pakankamo kiekio realių žmonių balso duomenų neįmanoma sukurti tiksliai lietuviškai veikiančių sprendimų.
Kiekviena papildoma valanda didina technologijų gebėjimą suprasti skirtingus kalbėjimo stilius, regioninius skirtumus ir natūralią kasdienę kalbą“, – sako prof. dr. G. Raškinis.
Gyva kalba – išbandymas DI
Nors lietuvių kalbos atpažinimo sistemų kokybė sparčiai auga, klaidų išvengti vis dar nepavyksta.
Vilniaus universiteto 2025 m. paskelbto tyrimo duomenimis, geriausių įrankių paklaida siekia apie 5,1 proc., o kitų populiarių modelių svyruoja tarp 8,7 ir 9,2 proc.
Visgi technologijos dažniau klysta, kai girdi natūralią kasdienę kalbą, skirtingus akcentus ar tarmes. Tai rodo, kad be didelio kiekio realių, gyvų balsų pavyzdžių DI negali perprasti visų lietuvių kalbos subtilybių.
„Įsivaizduokite, kad kas dešimtą jūsų žodį telefonas supranta klaidingai – būtent toks dabar yra geriausių lietuviškų technologijų lygis. Jos puikiai atpažįsta aiškią diktoriaus kalbą, bet juk realiai žmonės taip nešneka.
Todėl technologijos stringa, kai klausosi gyvų pokalbių, nesupranta akcentų. Kad šių klaidų neliktų, mums reikia pamokyti technologijas naudojant tūkstančius tikrų balsų iš visos Lietuvos“, – paaiškina J. Markeliūnė.
Anot projekto vykdytojų, garsyno sukūrimas leis ateityje tiksliau atpažinti lietuviškas balso komandas išmaniuosiuose įrenginiuose, pagerins automatinį subtitravimą, vertimą bei prieinamumo sprendimus žmonėms turintiems regos ar klausos negalią.
Atviras garsynas taip pat sudarys sąlygas tiek startuoliams, tiek didesnėms technologijų bendrovėms greičiau kurti lietuviškai veikiančius produktus.
Kviečia prisidėti: ypač trūksta vyrų balsų
Prie nacionalinio garsyno kūrimo prisideda ne tik akademinė bendruomenė ir pavieniai gyventojai, bet ir organizacijos.
Viena iš jų – telekomunikacijų bendrovė „Telia“, per kurios iniciatyvas iki šiol surinktos 53 balso įrašų valandos.
Prie jų prisidėjo įvairaus amžiaus darbuotojai, jų artimieji ir klientai iš daugiau nei 30 Lietuvos savivaldybių nuo Vilniaus iki Palangos.
„Tai bendras mokslininkų, verslo ir visuomenės darbas. Net kelių minučių balso įrašas gali tapti svarbia dalimi kuriant technologijas, kurios ateityje natūraliai supras lietuvių kalbą“, – pabrėžia prof. dr. G. Raškinis.
Šiuo metu projektas artėja prie pabaigos, tačiau iki galutinio tikslo dar trūksta tik tūkstančio valandų įrašų. Nors nacionalinis garsynas atspindės visą Lietuvos kalbų įvairovę, šiuo metu dar trūksta berniukų, vyresnio amžiaus vyrų ir senjorų balsų įrašų. Technologijoms suteikti balsą galite užsiregistravę kurkgarsyna.lt.
Projekto vykdytojai paaiškina, kad galutiniame garsyne balsai bus visiškai atskirti nuo bet kokių asmens duomenų, tad nebus jokios galimybės atpažinti ar susieti įrašą su konkrečiu žmogumi.
Rašyti komentarą