„Gemini“ ar „ChatGPT“: paskelbtas geriausias 2025 metų pokalbių robotas

VE.LT

2025-12-27 19:01

2025 metų pabaigoje dirbtinio intelekto (DI) rinka sulaukė esminių atnaujinimų. „OpenAI“ išleido GPT-5.2 modelį, o kiek anksčiau „Google“ pristatė Gemini 3 Pro. Abi sistemos gavo pažangų mąstymo režimą („Thinking“) ir neįtikėtinas galimybes, tačiau kuris asistentas pasirodė esąs geresnis?

Pateikiame funkcijų, lyginamųjų testų ir nepriklausomų tyrimų apžvalgą, padėsiančią nustatyti stipriąsias ir silpnąsias šių konkurentų puses.

Charakteristikos ir prieinamumas

Modeliai skiriasi naudojimo sąlygomis, duomenų aktualumu ir atminties tūriu. „GPT-5.2“ turi tris versijas: „Instant“ (greitoji), „Thinking“ (samprotaujanti) ir „Pro“ (gilioji analizė). Jo konteksto langas siekia 400000 tokenų, o žinių bazė apima įvykius iki 2025 m. rugpjūčio 31 d. Modelis prieinamas nemokamai „ChatGPT“ svetainėje su tam tikrais ribojimais, kuriuos galima panaikinti įsigijus „Plus“ (20 USD/mėn.) arba „Pro“ (200 USD/mėn.) prenumeratą.

Google Gemini 3 Pro pozicionuojamas kaip geriausias įvairaus tipo turinio – ne tik teksto, bet ir vaizdų bei vaizdo įrašų – kūrimo įrankis. Jo konteksto langas gerokai didesnis – 1000000 tokenų, o tai ypač naudinga dirbant su didelės apimties dokumentais. Šis DI turi informaciją iki 2025 m. sausio mėnesio. Nemokamai leidžiama pateikti iki 5 užklausų, vėliau sistema persijungia į „Gemini 2.5 Flash“ versiją. „AI Pro“ prenumerata kainuoja 19.99 USD/mėn.

Sintetiniai testai (OpenAI duomenys)

Remiantis oficialia dokumentacija, naujesnis „GPT-5.2 Thinking“ modelis lenkia „Google“ kūrinį daugumoje pagrindinių scenarijų:

GPQA Diamond (doktorantūros lygio mokslinės žinios): GPT-5.2 – 92,4%, Gemini 3 Pro – 91,9%.

AIME 2025 (olimpinė matematika): GPT-5.2 pasiekė absoliutų 100% rezultatą, Gemini 3 Pro – 95,0%.

GDPval (taikomosios darbinės užduotys): GPT-5.2 – 70,9%, Gemini 3 Pro – 53,5%.

ARC-AGI-2 (vizualinė logika): GPT-5.2 – 52,9%, Gemini 3 Pro – 31,1%.

SWE-bench Verified (programavimas): GPT-5.2 – 80,0%, Gemini 3 Pro – 76,2%.

Vienintelis testas, kuriame „GPT-5.2“ nežymiai nusileido, buvo „FrontierMath“ (itin sudėtingi matematiniai uždaviniai).

Nepriklausomi vertinimai

Nepriklausomi reitingai rodo jėgų pusiausvyrą. „Artificial Analysis“ indekse abu modeliai dalijasi pirmąją vietą, surinkę po 73 balus.

Praktiniuose scenarijuose (programavimas, darbas su vaizdais) pastebimi skirtingi požiūriai. „GPT-5.2 Thinking“ rašo sudėtingesnį kodą (pavyzdžiui, kuria 3D efektus) ir rengia detalias instrukcijas pagal nuotraukas, tačiau dirba lėčiau. „Gemini 3 Pro“ generuoja lakonišką kodą su mokomaisiais paaiškinimais ir greičiau supranta kontekstą pagal failų pavadinimus, tačiau gali praleisti smulkias detales.

Cenzūra ir saugumas

Esminį skirtumą atskleidė „Sansa Censorship“ testas, vertinantis atsakymų laisvę (kuo balas aukštesnis, tuo modelis laisvesnis):

Gemini 3 Pro: 0,824 balo (aukštas laisvės lygis).

GPT-5.2: 0,324 balo (griežtas filtravimas).

„OpenAI“ modelis užėmė paskutinę vietą dėl dažno atsisakymo vykdyti užklausas, kurios jam atrodo nesaugios, net jei jos skirtos edukacijai. „Google“ modelis šiuo klausimu yra kur kas lankstesnis.

Išvados

„GPT-5.2“ – idealus pasirinkimas korporatyvinėms užduotims, tiksliesiems mokslams ir sudėtingam programavimui. Tai „nuobodus“, bet itin tikslus asistentas.

„Gemini 3 Pro“ geriau tinka gyvam bendravimui, kūrybai ir darbui su vaizdiniais. Jis geriau supranta kultūrinį kontekstą, memus ir madingas tendencijas.

Šaltinis: focus.ua