OpenAI ఏప్రిల్ 23న GPT-5.5ని ప్రారంభించింది, ఇది “నిజమైన పని మరియు శక్తినిచ్చే ఏజెంట్ల కోసం కొత్త తరగతి మేధస్సు” అని పిలుస్తుంది మరియు ఫ్రేమింగ్ ఉద్దేశపూర్వకంగా ఉంది. OpenAI ఇది ఇప్పటి వరకు అత్యంత సామర్థ్యం గల ఏజెంట్ AI మోడల్ అని చెబుతుంది, ఇది భూమి నుండి ప్లాన్ చేయడానికి, సాధనాలను ఉపయోగించడానికి, దాని స్వంత అవుట్పుట్ను తనిఖీ చేయడానికి మరియు స్వతంత్రంగా పని చేయడానికి రూపొందించబడింది.
GPT-5.5 అనేది GPT-4.5 తర్వాత తిరిగి శిక్షణ పొందిన మొదటి మోడల్, ఇది NVIDIA యొక్క GB200 మరియు GB300 NVL72 ర్యాక్-స్కేల్ సిస్టమ్లతో కలిసి రూపొందించబడింది. కంపెనీ ఆచరణాత్మక వ్యత్యాసం ఏమిటంటే, GPT5.5ని ఉపయోగిస్తున్నప్పుడు, ఇంతకుముందు బహుళ ప్రాంప్ట్లు మరియు మానవ ‘కోర్సు-కరెక్షన్’ అవసరమయ్యే పనులు ఇప్పుడు పూర్తిగా అప్పగించబడవచ్చు. ChatGPT మరియు కోడెక్స్లోని ప్లస్, ప్రో, బిజినెస్ మరియు ఎంటర్ప్రైజ్ వినియోగదారులకు మోడల్ అందుబాటులోకి వస్తోంది. ఏప్రిల్ 24న API యాక్సెస్ అనుసరించబడింది.
బెంచ్మార్క్లు
OpenAI యొక్క బలమైన పనితీరు దావా టెర్మినల్-బెంచ్ 2.0పై ఉంది, ఇది శాండ్బాక్స్డ్ వాతావరణంలో ప్లానింగ్ మరియు టూల్ కోఆర్డినేషన్ అవసరమయ్యే కమాండ్-లైన్ వర్క్ఫ్లోలను పరీక్షించే బెంచ్మార్క్. GPT-5.5 స్కోర్లు 82.7%, GPT-5.4 యొక్క 75.1% మరియు క్లాడ్ ఓపస్ 4.7 యొక్క 69.4%.
GitHub సమస్య పరిష్కారాన్ని మూల్యాంకనం చేసే SWE-బెంచ్ ప్రోలో, GPT-5.5 58.6%కి చేరుకుంటుంది, మునుపటి సంస్కరణల కంటే ఒకే పాస్లో ఎక్కువ సమస్యలను పరిష్కరిస్తుంది. OpenAI ఎక్స్పర్ట్-SWEని కూడా పరిచయం చేసింది, ఇది ఒక అంతర్గత ప్రమాణం, ఇక్కడ టాస్క్లు 20 గంటల మధ్యస్థ అంచనా వేసిన మానవ పూర్తి సమయాన్ని కలిగి ఉంటాయి. GPT-5.5 స్కోర్లు 73.1%, GPT-5.4 యొక్క 68.5% నుండి.
దీర్ఘ-సందర్భ తార్కికంలో, ఒక మిలియన్ టోకెన్ల వద్ద MRCR v2, ఒక మోడల్ ఒక పెద్ద డాక్యుమెంట్లో ఖననం చేయబడిన నిర్దిష్ట సమాధానాన్ని గుర్తించగలదా అని తిరిగి పొందే బెంచ్మార్క్ పరీక్ష, GPT-5.5 స్కోర్లు 74.0%, GPT-5.4 యొక్క 36.6%.
అయినప్పటికీ, MCP అట్లాస్లో, స్కేల్ AI యొక్క మోడల్ కాంటెక్స్ట్ ప్రోటోకాల్ టూల్-యూజ్ బెంచ్మార్క్, క్లాడ్ ఓపస్ 4.7 79.1% వద్ద ఆధిక్యంలో ఉంది మరియు GPT-5.5 ద్వారా ఎటువంటి స్కోర్ నమోదు కాలేదు. OpenAI దాని స్వంత బెంచ్మార్క్ పట్టికలో ఆ లేకపోవడాన్ని చేర్చింది, ఇది కనీసం మొత్తం చిత్రంపై దాని విశ్వాసాన్ని సూచిస్తుంది.
టోకెన్ సామర్థ్యం, ధర వాస్తవికత
API యాక్సెస్ ప్రతి మిలియన్ ఇన్పుట్ టోకెన్లకు US$5 మరియు ప్రతి మిలియన్ అవుట్పుట్ టోకెన్లకు US$30 ధర నిర్ణయించబడుతుంది, GPT-5.4 ధరల కంటే రెట్టింపు. OpenAI యొక్క రక్షణ ఏమిటంటే, GPT-5.5 అదే కోడెక్స్ పనులను GPT-5.4 కంటే తక్కువ టోకెన్లతో పూర్తి చేస్తుంది, దాని సామర్థ్యం కారకం అయిన తర్వాత ప్రభావవంతమైన ఖర్చులు దాదాపు 20% ఎక్కువగా ఉంటాయి, స్వతంత్ర పరీక్ష ల్యాబ్ ఆర్టిఫిషియల్ అనాలిసిస్ ధృవీకరించబడింది.
GPT-5.5 Pro, ప్రో, బిజినెస్ మరియు ఎంటర్ప్రైజ్ వినియోగదారులకు అందుబాటులో ఉంది, దీని ధర మిలియన్ ఇన్పుట్ టోకెన్లకు US$30 మరియు ప్రతి మిలియన్ అవుట్పుట్ టోకెన్లకు US$180. ఇది కష్టతరమైన సమస్యలపై అదనపు సమాంతర పరీక్ష-సమయ గణనను వర్తింపజేస్తుంది మరియు 90.1% వద్ద ఓపెన్ఏఐ యొక్క ఏజెంట్ వెబ్-బ్రౌజింగ్ బెంచ్మార్క్ అయిన బ్రౌజ్కాంప్లో పబ్లిక్గా అందుబాటులో ఉన్న మోడల్ల జాబితాను అందిస్తుంది.
మోడల్ స్విచ్కు పాల్పడే ముందు వాస్తవ పనిభారానికి వ్యతిరేకంగా టోకెన్ సామర్థ్యం ఒత్తిడిని పరీక్షించడం విలువైనది. నెలకు 10 మిలియన్ అవుట్పుట్ టోకెన్ల వద్ద, GPT-5.5 స్టాండర్డ్ క్లాడ్ ఓపస్ 4.7 యొక్క US$250కి వ్యతిరేకంగా US$300 ఖర్చవుతుంది, 20% మోడల్ యొక్క అత్యుత్తమ ఏజెంట్ పనితీరు తక్కువ టాస్క్ పునరావృత్తులు మరియు తక్కువ మళ్లీ ప్రయత్నించినట్లయితే మాత్రమే చెల్లించబడుతుంది.
ఆచరణలో
ఓపెన్ AI ప్రకారం 85% కంటే ఎక్కువ మంది ఉద్యోగులు ఇప్పుడు ఇంజినీరింగ్ మరియు మార్కెటింగ్తో సహా వారి విభాగాలలో కోడెక్స్ను వారానికోసారి ఉపయోగిస్తున్నారు. ఒక ఉదాహరణలో, కమ్యూనికేషన్స్ బృందం GPT-5.5ని ఆరు నెలల స్పీకింగ్ రిక్వెస్ట్ డేటాను ప్రాసెస్ చేయడానికి ఉపయోగించింది, ఇక్కడ మోడల్ తక్కువ-రిస్క్ ఆమోదాలను ఆటోమేట్ చేయడంలో స్కోరింగ్ మరియు రిస్క్ ఫ్రేమ్వర్క్ను రూపొందించగలిగింది.
గ్రెగ్ బ్రోక్మాన్ విడుదలను “భవిష్యత్తులో మనం ఆశించే రకమైన కంప్యూటింగ్ వైపు నిజమైన ముందడుగు” అని అభివర్ణించారు మరియు గత రెండు సంవత్సరాల మోడల్ పురోగతి “ఆశ్చర్యకరంగా నెమ్మదిగా” అనిపించిందని ప్రధాన శాస్త్రవేత్త జాకుబ్ పచోకీ పేర్కొన్నారు.
GPT-5.5 మేధస్సు యొక్క ఉన్నత స్థాయిలో పని చేస్తున్నప్పుడు ఉత్పత్తి సేవలలో GPT-5.4 యొక్క ప్రతి-టోకెన్ జాప్యంతో సరిపోలుతుందని OpenAI చెప్పింది; పెద్ద, మరింత సామర్థ్యం గల మోడల్లు తరచుగా సేవ చేయడంలో నెమ్మదిగా ఉంటాయి, కానీ ఇక్కడ ఆ ట్రేడ్-ఆఫ్ నివారించబడింది.
బెంచ్మార్క్ లీడ్లు నిజమైన ఏజెంట్ పైప్లైన్లను నడుపుతున్న టీమ్లకు ఉత్పత్తి లాభాలుగా అనువదిస్తాయా అనేది సరైన సమాధానం ఇవ్వడానికి రాబోయే కొన్ని వారాలు పట్టే ప్రశ్న. టెర్మినల్-బెంచ్ స్కోర్ గమనింపబడని టెర్మినల్ ఏజెంట్లు మరియు DevOps ఆటోమేషన్ కోసం ఆశాజనకంగా ఉంది. MCP అట్లాస్ గ్యాప్ టూల్-యూజ్ ఆర్కెస్ట్రేషన్లో ఎక్కువగా నిర్మించే ఎవరైనా చూడదగినది.
ఇవి కూడా చూడండి: OpenAI కోడింగ్ టాస్క్ల కోసం GPT-5.5ని కోడెక్స్కు తీసుకువస్తుందిఇ

పరిశ్రమ ప్రముఖుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & బిగ్ డేటా ఎక్స్పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లో జరుగుతున్నాయి. సమగ్ర కార్యక్రమం ఇందులో భాగమే టెక్ఎక్స్ మరియు సహా ఇతర ప్రముఖ సాంకేతిక ఈవెంట్లతో కలిసి ఉంది సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్పో. క్లిక్ చేయండి ఇక్కడ మరింత సమాచారం కోసం.
AI వార్తలు ఆధారితం టెక్ఫోర్జ్ మీడియా. రాబోయే ఇతర ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్లు మరియు వెబ్నార్లను అన్వేషించండి ఇక్కడ.