జెమిని 2.5 ప్రశంసించబడుతోంది గూగుల్ డీప్ మైండ్ ఇప్పటి వరకు దాని “అత్యంత తెలివైన AI మోడల్” గా.
ఈ తాజా తరం నుండి వచ్చిన మొదటి మోడల్ జెమిని 2.5 ప్రో యొక్క ప్రయోగాత్మక వెర్షన్, ఇది విస్తృత శ్రేణి బెంచ్మార్క్లలో అత్యాధునిక ఫలితాలను సాధించిందని డీప్మైండ్ చెప్పారు.
గూగుల్ డీప్మైండ్ యొక్క CTO కోరే కవుకుగ్లు ప్రకారం, జెమిని 2.5 మోడల్స్ “ఆలోచనా నమూనాలు”. ఇది ప్రతిస్పందనను సృష్టించే ముందు వారి ఆలోచనల ద్వారా వారి సామర్థ్యాన్ని సూచిస్తుంది, ఇది మెరుగైన పనితీరు మరియు మెరుగైన ఖచ్చితత్వానికి దారితీస్తుంది.
“తార్కికం” యొక్క సామర్థ్యం కేవలం వర్గీకరణ మరియు అంచనాకు మించి విస్తరించి ఉంది, కవుకుక్లు వివరించాడు. ఇది సమాచారాన్ని విశ్లేషించడానికి, తార్కిక తీర్మానాలను తగ్గించడానికి, సందర్భం మరియు స్వల్పభేదాన్ని పొందుపరచడానికి మరియు చివరికి సమాచార నిర్ణయాలు తీసుకునే వ్యవస్థ యొక్క సామర్థ్యాన్ని కలిగి ఉంటుంది.
డీప్మైండ్ కొంతకాలంగా AI యొక్క తెలివితేటలు మరియు తార్కిక సామర్థ్యాలను పెంచే పద్ధతులను అన్వేషిస్తోంది, ఉపబల అభ్యాసం మరియు గొలుసు-ఆలోచన ప్రాంప్టింగ్ వంటి పద్ధతులను ఉపయోగిస్తోంది. ఈ పునాది ఇటీవల వారి మొదటి ఆలోచనా నమూనా జెమిని 2.0 ఫ్లాష్ థింకింగ్ ప్రవేశపెట్టడానికి దారితీసింది.
“ఇప్పుడు, జెమిని 2.5 తో,” మేము గణనీయంగా మెరుగైన బేస్ మోడల్ను మెరుగైన పోస్ట్-ట్రైనింగ్తో కలపడం ద్వారా కొత్త స్థాయి పనితీరును సాధించాము. “
గూగుల్ ఈ ఆలోచనా సామర్థ్యాలను దాని భవిష్యత్ మోడళ్లలో నేరుగా అనుసంధానించాలని యోచిస్తోంది-మరింత సంక్లిష్టమైన సమస్యలను పరిష్కరించడానికి మరియు మరింత సమర్థవంతమైన, సందర్భ-అవగాహన ఏజెంట్లకు మద్దతు ఇవ్వడానికి వాటిని ప్రారంభిస్తుంది.
జెమిని 2.5 ప్రో LMarena లీడర్బోర్డ్ టాప్ స్పాట్ను భద్రపరుస్తుంది
జెమిని 2.5 ప్రో ప్రయోగాత్మక క్లిష్టమైన పనులను నిర్వహించడానికి డీప్మైండ్ యొక్క అత్యంత అధునాతన మోడల్గా ఉంచబడింది. వ్రాసేటప్పుడు, ఇది LMarena లీడర్బోర్డ్లో అగ్రస్థానాన్ని దక్కించుకుంది-మానవ ప్రాధాన్యతలను అంచనా వేయడానికి కీలకమైన మెట్రిక్-గణనీయమైన తేడాతో, అధిక-నాణ్యత శైలితో అధిక సామర్థ్యం గల మోడల్ను ప్రదర్శిస్తుంది:

జెమిని 2.5 అనేది మ్యాథ్స్, సైన్స్, కోడింగ్ మరియు రీజనింగ్ వద్ద ‘ప్రో’
జెమిని 2.5 ప్రో అధునాతన తార్కికతను కోరుతున్న వివిధ బెంచ్మార్క్లలో అత్యాధునిక పనితీరును ప్రదర్శించింది.
ముఖ్యంగా, ఇది గణితం మరియు సైన్స్ బెంచ్మార్క్లలో-GPQA మరియు AIME 2025 వంటివి-మెజారిటీ ఓటింగ్ వంటి ఖర్చులను పెంచే పరీక్ష-సమయ పద్ధతులపై ఆధారపడకుండా. ఇది మానవత్వం యొక్క చివరి పరీక్షలో అత్యాధునిక స్కోరును 18.8% సాధించింది, జ్ఞానం మరియు తార్కికం యొక్క మానవ సరిహద్దును అంచనా వేయడానికి సబ్జెక్ట్ నిపుణులు రూపొందించిన డేటాసెట్.
డీప్మైండ్ కోడింగ్ పనితీరుపై గణనీయమైన ప్రాధాన్యతనిచ్చింది, మరియు జెమిని 2.5 పైప్లైన్లో మరింత మెరుగుదలలతో దాని పూర్వీకుడైన 2.0 తో పోలిస్తే గణనీయమైన లీపు ఫార్వర్డ్ను సూచిస్తుంది. 2.5 PRO దృశ్యపరంగా బలవంతపు వెబ్ అనువర్తనాలు మరియు ఏజెంట్ కోడ్ అనువర్తనాలు, అలాగే కోడ్ పరివర్తన మరియు ఎడిటింగ్ను సృష్టించడంలో ఉత్సాహంగా ఉంది.
స్వీ-బెంచ్ ధృవీకరించబడినప్పుడు, ఏజెంట్ కోడ్ మూల్యాంకనాల కోసం పరిశ్రమ ప్రమాణం, జెమిని 2.5 ప్రో కస్టమ్ ఏజెంట్ సెటప్ను ఉపయోగించి 63.8% స్కోరు సాధించింది. మోడల్ యొక్క తార్కిక సామర్థ్యాలు సింగిల్-లైన్ ప్రాంప్ట్ నుండి ఎక్జిక్యూటబుల్ కోడ్ను రూపొందించడం ద్వారా వీడియో గేమ్ను సృష్టించడానికి కూడా వీలు కల్పిస్తాయి.
దాని పూర్వీకుల బలాన్ని నిర్మించడం
జెమిని 2.5 మునుపటి జెమిని మోడళ్ల యొక్క ప్రధాన బలాన్ని పెంచుతుంది, వీటిలో స్థానిక మల్టీమోడాలిటీ మరియు సుదీర్ఘ సందర్భ విండోతో సహా. 2.5 ప్రో ఒక మిలియన్ టోకెన్ కాంటెక్స్ట్ విండోతో లాంచ్ అవుతుంది, దీనిని త్వరలో రెండు మిలియన్ టోకెన్లకు విస్తరించే ప్రణాళికలు ఉన్నాయి. ఇది విస్తారమైన డేటాసెట్లను అర్థం చేసుకోవడానికి మరియు విభిన్న సమాచార వనరుల నుండి సంక్లిష్ట సమస్యలను నిర్వహించడానికి మోడల్ను అనుమతిస్తుంది, స్పానింగ్ టెక్స్ట్, ఆడియో, ఇమేజెస్, వీడియో మరియు మొత్తం కోడ్ రిపోజిటరీలు.
డెవలపర్లు మరియు సంస్థలు ఇప్పుడు గూగుల్ AI స్టూడియోలో జెమిని 2.5 ప్రోతో ప్రయోగాలు చేయడం ప్రారంభించవచ్చు. జెమిని అధునాతన వినియోగదారులు డెస్క్టాప్ మరియు మొబైల్ ప్లాట్ఫామ్లపై మోడల్ డ్రాప్డౌన్ ద్వారా కూడా దీన్ని యాక్సెస్ చేయవచ్చు. రాబోయే వారాల్లో మోడల్ వెర్టెక్స్ AI లో విడుదల చేయబడుతుంది.
గూగుల్ డీప్మైండ్ వినియోగదారులను అభిప్రాయాన్ని అందించమని ప్రోత్సహిస్తుంది, ఇది జెమిని యొక్క సామర్థ్యాలను మరింత పెంచడానికి ఉపయోగించబడుతుంది.
(ఫోటో అన్షిత నాయర్)
ఇవి కూడా చూడండి: డీప్సీక్ V3-0324 మొదట ఓపెన్-సోర్స్లో నాన్-రీజినింగ్ AI మోడళ్లను అగ్రస్థానంలో నిలిపింది

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్పో.
టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్నార్లను అన్వేషించండి ఇక్కడ.