Hot News

గూగుల్ ఇప్పటి వరకు తన ‘అత్యంత తెలివైన’ AI మోడల్‌ను ఉడికించాలి

జెమిని 2.5 ప్రశంసించబడుతోంది గూగుల్ డీప్ మైండ్ ఇప్పటి వరకు దాని “అత్యంత తెలివైన AI మోడల్” గా.

ఈ తాజా తరం నుండి వచ్చిన మొదటి మోడల్ జెమిని 2.5 ప్రో యొక్క ప్రయోగాత్మక వెర్షన్, ఇది విస్తృత శ్రేణి బెంచ్‌మార్క్‌లలో అత్యాధునిక ఫలితాలను సాధించిందని డీప్‌మైండ్ చెప్పారు.

గూగుల్ డీప్‌మైండ్ యొక్క CTO కోరే కవుకుగ్లు ప్రకారం, జెమిని 2.5 మోడల్స్ “ఆలోచనా నమూనాలు”. ఇది ప్రతిస్పందనను సృష్టించే ముందు వారి ఆలోచనల ద్వారా వారి సామర్థ్యాన్ని సూచిస్తుంది, ఇది మెరుగైన పనితీరు మరియు మెరుగైన ఖచ్చితత్వానికి దారితీస్తుంది.

“తార్కికం” యొక్క సామర్థ్యం కేవలం వర్గీకరణ మరియు అంచనాకు మించి విస్తరించి ఉంది, కవుకుక్లు వివరించాడు. ఇది సమాచారాన్ని విశ్లేషించడానికి, తార్కిక తీర్మానాలను తగ్గించడానికి, సందర్భం మరియు స్వల్పభేదాన్ని పొందుపరచడానికి మరియు చివరికి సమాచార నిర్ణయాలు తీసుకునే వ్యవస్థ యొక్క సామర్థ్యాన్ని కలిగి ఉంటుంది.

డీప్‌మైండ్ కొంతకాలంగా AI యొక్క తెలివితేటలు మరియు తార్కిక సామర్థ్యాలను పెంచే పద్ధతులను అన్వేషిస్తోంది, ఉపబల అభ్యాసం మరియు గొలుసు-ఆలోచన ప్రాంప్టింగ్ వంటి పద్ధతులను ఉపయోగిస్తోంది. ఈ పునాది ఇటీవల వారి మొదటి ఆలోచనా నమూనా జెమిని 2.0 ఫ్లాష్ థింకింగ్ ప్రవేశపెట్టడానికి దారితీసింది.

“ఇప్పుడు, జెమిని 2.5 తో,” మేము గణనీయంగా మెరుగైన బేస్ మోడల్‌ను మెరుగైన పోస్ట్-ట్రైనింగ్‌తో కలపడం ద్వారా కొత్త స్థాయి పనితీరును సాధించాము. “

గూగుల్ ఈ ఆలోచనా సామర్థ్యాలను దాని భవిష్యత్ మోడళ్లలో నేరుగా అనుసంధానించాలని యోచిస్తోంది-మరింత సంక్లిష్టమైన సమస్యలను పరిష్కరించడానికి మరియు మరింత సమర్థవంతమైన, సందర్భ-అవగాహన ఏజెంట్లకు మద్దతు ఇవ్వడానికి వాటిని ప్రారంభిస్తుంది.

జెమిని 2.5 ప్రో LMarena లీడర్‌బోర్డ్ టాప్ స్పాట్‌ను భద్రపరుస్తుంది

జెమిని 2.5 ప్రో ప్రయోగాత్మక క్లిష్టమైన పనులను నిర్వహించడానికి డీప్‌మైండ్ యొక్క అత్యంత అధునాతన మోడల్‌గా ఉంచబడింది. వ్రాసేటప్పుడు, ఇది LMarena లీడర్‌బోర్డ్‌లో అగ్రస్థానాన్ని దక్కించుకుంది-మానవ ప్రాధాన్యతలను అంచనా వేయడానికి కీలకమైన మెట్రిక్-గణనీయమైన తేడాతో, అధిక-నాణ్యత శైలితో అధిక సామర్థ్యం గల మోడల్‌ను ప్రదర్శిస్తుంది:

గూగుల్ డీప్‌మైండ్ నుండి కొత్త జెమిని 2.5 ప్రో ప్రయోగాత్మక AI మోడల్ ఇప్పుడే అగ్రస్థానంలో నిలిచింది.

జెమిని 2.5 అనేది మ్యాథ్స్, సైన్స్, కోడింగ్ మరియు రీజనింగ్ వద్ద ‘ప్రో’

జెమిని 2.5 ప్రో అధునాతన తార్కికతను కోరుతున్న వివిధ బెంచ్‌మార్క్‌లలో అత్యాధునిక పనితీరును ప్రదర్శించింది.

ముఖ్యంగా, ఇది గణితం మరియు సైన్స్ బెంచ్‌మార్క్‌లలో-GPQA మరియు AIME 2025 వంటివి-మెజారిటీ ఓటింగ్ వంటి ఖర్చులను పెంచే పరీక్ష-సమయ పద్ధతులపై ఆధారపడకుండా. ఇది మానవత్వం యొక్క చివరి పరీక్షలో అత్యాధునిక స్కోరును 18.8% సాధించింది, జ్ఞానం మరియు తార్కికం యొక్క మానవ సరిహద్దును అంచనా వేయడానికి సబ్జెక్ట్ నిపుణులు రూపొందించిన డేటాసెట్.

డీప్‌మైండ్ కోడింగ్ పనితీరుపై గణనీయమైన ప్రాధాన్యతనిచ్చింది, మరియు జెమిని 2.5 పైప్‌లైన్‌లో మరింత మెరుగుదలలతో దాని పూర్వీకుడైన 2.0 తో పోలిస్తే గణనీయమైన లీపు ఫార్వర్డ్ను సూచిస్తుంది. 2.5 PRO దృశ్యపరంగా బలవంతపు వెబ్ అనువర్తనాలు మరియు ఏజెంట్ కోడ్ అనువర్తనాలు, అలాగే కోడ్ పరివర్తన మరియు ఎడిటింగ్‌ను సృష్టించడంలో ఉత్సాహంగా ఉంది.

స్వీ-బెంచ్ ధృవీకరించబడినప్పుడు, ఏజెంట్ కోడ్ మూల్యాంకనాల కోసం పరిశ్రమ ప్రమాణం, జెమిని 2.5 ప్రో కస్టమ్ ఏజెంట్ సెటప్‌ను ఉపయోగించి 63.8% స్కోరు సాధించింది. మోడల్ యొక్క తార్కిక సామర్థ్యాలు సింగిల్-లైన్ ప్రాంప్ట్ నుండి ఎక్జిక్యూటబుల్ కోడ్‌ను రూపొందించడం ద్వారా వీడియో గేమ్‌ను సృష్టించడానికి కూడా వీలు కల్పిస్తాయి.

https://www.youtube.com/watch?v=rlcbspgos6s

దాని పూర్వీకుల బలాన్ని నిర్మించడం

జెమిని 2.5 మునుపటి జెమిని మోడళ్ల యొక్క ప్రధాన బలాన్ని పెంచుతుంది, వీటిలో స్థానిక మల్టీమోడాలిటీ మరియు సుదీర్ఘ సందర్భ విండోతో సహా. 2.5 ప్రో ఒక మిలియన్ టోకెన్ కాంటెక్స్ట్ విండోతో లాంచ్ అవుతుంది, దీనిని త్వరలో రెండు మిలియన్ టోకెన్లకు విస్తరించే ప్రణాళికలు ఉన్నాయి. ఇది విస్తారమైన డేటాసెట్లను అర్థం చేసుకోవడానికి మరియు విభిన్న సమాచార వనరుల నుండి సంక్లిష్ట సమస్యలను నిర్వహించడానికి మోడల్‌ను అనుమతిస్తుంది, స్పానింగ్ టెక్స్ట్, ఆడియో, ఇమేజెస్, వీడియో మరియు మొత్తం కోడ్ రిపోజిటరీలు.

డెవలపర్లు మరియు సంస్థలు ఇప్పుడు గూగుల్ AI స్టూడియోలో జెమిని 2.5 ప్రోతో ప్రయోగాలు చేయడం ప్రారంభించవచ్చు. జెమిని అధునాతన వినియోగదారులు డెస్క్‌టాప్ మరియు మొబైల్ ప్లాట్‌ఫామ్‌లపై మోడల్ డ్రాప్‌డౌన్ ద్వారా కూడా దీన్ని యాక్సెస్ చేయవచ్చు. రాబోయే వారాల్లో మోడల్ వెర్టెక్స్ AI లో విడుదల చేయబడుతుంది.

గూగుల్ డీప్‌మైండ్ వినియోగదారులను అభిప్రాయాన్ని అందించమని ప్రోత్సహిస్తుంది, ఇది జెమిని యొక్క సామర్థ్యాలను మరింత పెంచడానికి ఉపయోగించబడుతుంది.

(ఫోటో అన్షిత నాయర్)

ఇవి కూడా చూడండి: డీప్సీక్ V3-0324 మొదట ఓపెన్-సోర్స్‌లో నాన్-రీజినింగ్ AI మోడళ్లను అగ్రస్థానంలో నిలిపింది

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్‌పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్‌పో.

టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్‌నార్లను అన్వేషించండి ఇక్కడ.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Top