Hot News

GPT-5.5 అనేది OpenAI యొక్క అత్యంత సామర్థ్యం గల ఏజెంట్ AI మోడల్ – API ధర కంటే రెండింతలు

OpenAI ఏప్రిల్ 23న GPT-5.5ని ప్రారంభించింది, ఇది “నిజమైన పని మరియు శక్తినిచ్చే ఏజెంట్ల కోసం కొత్త తరగతి మేధస్సు” అని పిలుస్తుంది మరియు ఫ్రేమింగ్ ఉద్దేశపూర్వకంగా ఉంది. OpenAI ఇది ఇప్పటి వరకు అత్యంత సామర్థ్యం గల ఏజెంట్ AI మోడల్ అని చెబుతుంది, ఇది భూమి నుండి ప్లాన్ చేయడానికి, సాధనాలను ఉపయోగించడానికి, దాని స్వంత అవుట్‌పుట్‌ను తనిఖీ చేయడానికి మరియు స్వతంత్రంగా పని చేయడానికి రూపొందించబడింది.

GPT-5.5 అనేది GPT-4.5 తర్వాత తిరిగి శిక్షణ పొందిన మొదటి మోడల్, ఇది NVIDIA యొక్క GB200 మరియు GB300 NVL72 ర్యాక్-స్కేల్ సిస్టమ్‌లతో కలిసి రూపొందించబడింది. కంపెనీ ఆచరణాత్మక వ్యత్యాసం ఏమిటంటే, GPT5.5ని ఉపయోగిస్తున్నప్పుడు, ఇంతకుముందు బహుళ ప్రాంప్ట్‌లు మరియు మానవ ‘కోర్సు-కరెక్షన్’ అవసరమయ్యే పనులు ఇప్పుడు పూర్తిగా అప్పగించబడవచ్చు. ChatGPT మరియు కోడెక్స్‌లోని ప్లస్, ప్రో, బిజినెస్ మరియు ఎంటర్‌ప్రైజ్ వినియోగదారులకు మోడల్ అందుబాటులోకి వస్తోంది. ఏప్రిల్ 24న API యాక్సెస్ అనుసరించబడింది.

బెంచ్‌మార్క్‌లు

OpenAI యొక్క బలమైన పనితీరు దావా టెర్మినల్-బెంచ్ 2.0పై ఉంది, ఇది శాండ్‌బాక్స్డ్ వాతావరణంలో ప్లానింగ్ మరియు టూల్ కోఆర్డినేషన్ అవసరమయ్యే కమాండ్-లైన్ వర్క్‌ఫ్లోలను పరీక్షించే బెంచ్‌మార్క్. GPT-5.5 స్కోర్‌లు 82.7%, GPT-5.4 యొక్క 75.1% మరియు క్లాడ్ ఓపస్ 4.7 యొక్క 69.4%.

GitHub సమస్య పరిష్కారాన్ని మూల్యాంకనం చేసే SWE-బెంచ్ ప్రోలో, GPT-5.5 58.6%కి చేరుకుంటుంది, మునుపటి సంస్కరణల కంటే ఒకే పాస్‌లో ఎక్కువ సమస్యలను పరిష్కరిస్తుంది. OpenAI ఎక్స్‌పర్ట్-SWEని కూడా పరిచయం చేసింది, ఇది ఒక అంతర్గత ప్రమాణం, ఇక్కడ టాస్క్‌లు 20 గంటల మధ్యస్థ అంచనా వేసిన మానవ పూర్తి సమయాన్ని కలిగి ఉంటాయి. GPT-5.5 స్కోర్‌లు 73.1%, GPT-5.4 యొక్క 68.5% నుండి.

దీర్ఘ-సందర్భ తార్కికంలో, ఒక మిలియన్ టోకెన్‌ల వద్ద MRCR v2, ఒక మోడల్ ఒక పెద్ద డాక్యుమెంట్‌లో ఖననం చేయబడిన నిర్దిష్ట సమాధానాన్ని గుర్తించగలదా అని తిరిగి పొందే బెంచ్‌మార్క్ పరీక్ష, GPT-5.5 స్కోర్‌లు 74.0%, GPT-5.4 యొక్క 36.6%.

అయినప్పటికీ, MCP అట్లాస్‌లో, స్కేల్ AI యొక్క మోడల్ కాంటెక్స్ట్ ప్రోటోకాల్ టూల్-యూజ్ బెంచ్‌మార్క్, క్లాడ్ ఓపస్ 4.7 79.1% వద్ద ఆధిక్యంలో ఉంది మరియు GPT-5.5 ద్వారా ఎటువంటి స్కోర్ నమోదు కాలేదు. OpenAI దాని స్వంత బెంచ్‌మార్క్ పట్టికలో ఆ లేకపోవడాన్ని చేర్చింది, ఇది కనీసం మొత్తం చిత్రంపై దాని విశ్వాసాన్ని సూచిస్తుంది.

టోకెన్ సామర్థ్యం, ​​ధర వాస్తవికత

API యాక్సెస్ ప్రతి మిలియన్ ఇన్‌పుట్ టోకెన్‌లకు US$5 మరియు ప్రతి మిలియన్ అవుట్‌పుట్ టోకెన్‌లకు US$30 ధర నిర్ణయించబడుతుంది, GPT-5.4 ధరల కంటే రెట్టింపు. OpenAI యొక్క రక్షణ ఏమిటంటే, GPT-5.5 అదే కోడెక్స్ పనులను GPT-5.4 కంటే తక్కువ టోకెన్‌లతో పూర్తి చేస్తుంది, దాని సామర్థ్యం కారకం అయిన తర్వాత ప్రభావవంతమైన ఖర్చులు దాదాపు 20% ఎక్కువగా ఉంటాయి, స్వతంత్ర పరీక్ష ల్యాబ్ ఆర్టిఫిషియల్ అనాలిసిస్ ధృవీకరించబడింది.

GPT-5.5 Pro, ప్రో, బిజినెస్ మరియు ఎంటర్‌ప్రైజ్ వినియోగదారులకు అందుబాటులో ఉంది, దీని ధర మిలియన్ ఇన్‌పుట్ టోకెన్‌లకు US$30 మరియు ప్రతి మిలియన్ అవుట్‌పుట్ టోకెన్‌లకు US$180. ఇది కష్టతరమైన సమస్యలపై అదనపు సమాంతర పరీక్ష-సమయ గణనను వర్తింపజేస్తుంది మరియు 90.1% వద్ద ఓపెన్‌ఏఐ యొక్క ఏజెంట్ వెబ్-బ్రౌజింగ్ బెంచ్‌మార్క్ అయిన బ్రౌజ్‌కాంప్‌లో పబ్లిక్‌గా అందుబాటులో ఉన్న మోడల్‌ల జాబితాను అందిస్తుంది.

మోడల్ స్విచ్‌కు పాల్పడే ముందు వాస్తవ పనిభారానికి వ్యతిరేకంగా టోకెన్ సామర్థ్యం ఒత్తిడిని పరీక్షించడం విలువైనది. నెలకు 10 మిలియన్ అవుట్‌పుట్ టోకెన్‌ల వద్ద, GPT-5.5 స్టాండర్డ్ క్లాడ్ ఓపస్ 4.7 యొక్క US$250కి వ్యతిరేకంగా US$300 ఖర్చవుతుంది, 20% మోడల్ యొక్క అత్యుత్తమ ఏజెంట్ పనితీరు తక్కువ టాస్క్ పునరావృత్తులు మరియు తక్కువ మళ్లీ ప్రయత్నించినట్లయితే మాత్రమే చెల్లించబడుతుంది.

ఆచరణలో

ఓపెన్ AI ప్రకారం 85% కంటే ఎక్కువ మంది ఉద్యోగులు ఇప్పుడు ఇంజినీరింగ్ మరియు మార్కెటింగ్‌తో సహా వారి విభాగాలలో కోడెక్స్‌ను వారానికోసారి ఉపయోగిస్తున్నారు. ఒక ఉదాహరణలో, కమ్యూనికేషన్స్ బృందం GPT-5.5ని ఆరు నెలల స్పీకింగ్ రిక్వెస్ట్ డేటాను ప్రాసెస్ చేయడానికి ఉపయోగించింది, ఇక్కడ మోడల్ తక్కువ-రిస్క్ ఆమోదాలను ఆటోమేట్ చేయడంలో స్కోరింగ్ మరియు రిస్క్ ఫ్రేమ్‌వర్క్‌ను రూపొందించగలిగింది.

గ్రెగ్ బ్రోక్‌మాన్ విడుదలను “భవిష్యత్తులో మనం ఆశించే రకమైన కంప్యూటింగ్ వైపు నిజమైన ముందడుగు” అని అభివర్ణించారు మరియు గత రెండు సంవత్సరాల మోడల్ పురోగతి “ఆశ్చర్యకరంగా నెమ్మదిగా” అనిపించిందని ప్రధాన శాస్త్రవేత్త జాకుబ్ పచోకీ పేర్కొన్నారు.

GPT-5.5 మేధస్సు యొక్క ఉన్నత స్థాయిలో పని చేస్తున్నప్పుడు ఉత్పత్తి సేవలలో GPT-5.4 యొక్క ప్రతి-టోకెన్ జాప్యంతో సరిపోలుతుందని OpenAI చెప్పింది; పెద్ద, మరింత సామర్థ్యం గల మోడల్‌లు తరచుగా సేవ చేయడంలో నెమ్మదిగా ఉంటాయి, కానీ ఇక్కడ ఆ ట్రేడ్-ఆఫ్ నివారించబడింది.

బెంచ్‌మార్క్ లీడ్‌లు నిజమైన ఏజెంట్ పైప్‌లైన్‌లను నడుపుతున్న టీమ్‌లకు ఉత్పత్తి లాభాలుగా అనువదిస్తాయా అనేది సరైన సమాధానం ఇవ్వడానికి రాబోయే కొన్ని వారాలు పట్టే ప్రశ్న. టెర్మినల్-బెంచ్ స్కోర్ గమనింపబడని టెర్మినల్ ఏజెంట్లు మరియు DevOps ఆటోమేషన్ కోసం ఆశాజనకంగా ఉంది. MCP అట్లాస్ గ్యాప్ టూల్-యూజ్ ఆర్కెస్ట్రేషన్‌లో ఎక్కువగా నిర్మించే ఎవరైనా చూడదగినది.

ఇవి కూడా చూడండి: OpenAI కోడింగ్ టాస్క్‌ల కోసం GPT-5.5ని కోడెక్స్‌కు తీసుకువస్తుంది

TechEx ఈవెంట్‌ల ద్వారా AI & బిగ్ డేటా ఎక్స్‌పో కోసం బ్యానర్.

పరిశ్రమ ప్రముఖుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & బిగ్ డేటా ఎక్స్‌పో ఆమ్‌స్టర్‌డామ్, కాలిఫోర్నియా మరియు లండన్‌లో జరుగుతున్నాయి. సమగ్ర కార్యక్రమం ఇందులో భాగమే టెక్ఎక్స్ మరియు సహా ఇతర ప్రముఖ సాంకేతిక ఈవెంట్‌లతో కలిసి ఉంది సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్‌పో. క్లిక్ చేయండి ఇక్కడ మరింత సమాచారం కోసం.

AI వార్తలు ఆధారితం టెక్ఫోర్జ్ మీడియా. రాబోయే ఇతర ఎంటర్‌ప్రైజ్ టెక్నాలజీ ఈవెంట్‌లు మరియు వెబ్‌నార్‌లను అన్వేషించండి ఇక్కడ.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Top