డీప్‌సీక్ V3.2 GPT-5 పనితీరును 90% తక్కువ శిక్షణ ఖర్చులతో సరిపోల్చుతుంది

టెక్ దిగ్గజాలు సరిహద్దు AI మోడల్‌లకు శిక్షణ ఇవ్వడానికి గణన శక్తికి బిలియన్ల కొద్దీ ఖర్చు చేస్తున్నప్పుడు, చైనా యొక్క DeepSeek కష్టతరంగా కాకుండా తెలివిగా పని చేయడం ద్వారా పోల్చదగిన ఫలితాలను సాధించింది. డీప్‌సీక్ V3.2 AI మోడల్ ‘తక్కువ మొత్తం శిక్షణ FLOPలను’ ఉపయోగిస్తున్నప్పటికీ తార్కిక బెంచ్‌మార్క్‌లలో OpenAI యొక్క GPT-5తో సరిపోలింది – ఇది అధునాతన కృత్రిమ మేధస్సును నిర్మించడం గురించి పరిశ్రమ ఏ విధంగా ఆలోచిస్తుందో మార్చగలదు.

ఎంటర్‌ప్రైజెస్ కోసం, సరిహద్దు AI సామర్థ్యాలకు సరిహద్దు-స్థాయి కంప్యూటింగ్ బడ్జెట్‌లు అవసరం లేదని విడుదల నిరూపిస్తుంది. DeepSeek V3.2 యొక్క ఓపెన్-సోర్స్ లభ్యత విస్తరణ నిర్మాణంపై నియంత్రణను కొనసాగిస్తూనే అధునాతన తార్కికం మరియు ఏజెంట్ సామర్థ్యాలను మూల్యాంకనం చేయడానికి సంస్థలను అనుమతిస్తుంది – వ్యయ-సమర్థత AI అడాప్షన్ స్ట్రాటజీలకు ఎక్కువగా కేంద్రంగా మారినందున ఆచరణాత్మక పరిశీలన.

Hangzhou-ఆధారిత ప్రయోగశాల సోమవారం రెండు వెర్షన్‌లను విడుదల చేసింది: బేస్ DeepSeek V3.2 మరియు DeepSeek-V3.2-Speciale, 2025 ఇంటర్నేషనల్ మ్యాథమెటికల్ ఒలింపియాడ్ మరియు ఇంటర్నేషనల్ ఒలింపియాడ్ ఇన్ఫర్మేటిక్స్‌లో గోల్డ్ మెడల్ పనితీరును సాధించడంతో – అంతకుముందు US AI మోడల్‌ల బెంచ్‌మార్క్‌లు అంతకుముందు అమెరికాకు చెందిన అంతర్గత మోడల్‌లు మాత్రమే చేరుకున్నాయి.

ఎగుమతి పరిమితుల కారణంగా అధునాతన సెమీకండక్టర్ చిప్‌లకు డీప్‌సీక్ పరిమిత ప్రాప్యతను అందించినందున ఈ సాధన చాలా ముఖ్యమైనది.

పోటీ ప్రయోజనంగా వనరుల సామర్థ్యం

డీప్‌సీక్ యొక్క విజయం సరిహద్దు AI పనితీరుకు గణన వనరులను ఎక్కువగా స్కేలింగ్ చేయడం అవసరమని పరిశ్రమలో ఉన్న ఊహకు విరుద్ధంగా ఉంది. కంపెనీ ఈ సామర్థ్యాన్ని ఆర్కిటెక్చరల్ ఆవిష్కరణలకు ఆపాదించింది, ముఖ్యంగా డీప్‌సీక్ స్పార్స్ అటెన్షన్ (DSA), ఇది మోడల్ పనితీరును కాపాడుతూ గణన సంక్లిష్టతను గణనీయంగా తగ్గిస్తుంది.

బేస్ డీప్‌సీక్ V3.2 AI మోడల్ AIME 2025 గణిత సమస్యలపై 93.1% ఖచ్చితత్వాన్ని సాధించింది మరియు 2386 కోడ్‌ఫోర్స్ రేటింగ్‌ను రీజనింగ్ బెంచ్‌మార్క్‌లలో GPT-5తో పాటు ఉంచింది.

స్పెషలే వేరియంట్ మరింత విజయవంతమైంది, అమెరికన్ ఇన్విటేషనల్ మ్యాథమెటిక్స్ ఎగ్జామినేషన్ (AIME) 2025లో 96.0%, హార్వర్డ్-MIT మ్యాథమెటిక్స్ టోర్నమెంట్ (HMMT) ఫిబ్రవరి 2025లో 99.2% స్కోర్ సాధించింది మరియు అంతర్జాతీయంగా 2025 అంతర్జాతీయ మ్యాథమెటిక్ మరియు Ompia రెండింటిలోనూ గోల్డ్-మెడల్ పనితీరును సాధించింది. ఇన్ఫర్మేటిక్స్.

చైనాను ప్రభావితం చేసే సుంకాలు మరియు ఎగుమతి పరిమితుల తెప్పకు డీప్‌సీక్ పరిమిత ప్రాప్యత కారణంగా ఫలితాలు చాలా ముఖ్యమైనవి. టెక్నికల్ రిపోర్ట్ ప్రకారం, కంపెనీ శిక్షణా-పూర్తి ఖర్చులలో 10% కంటే ఎక్కువ పోస్ట్-ట్రైనింగ్ కంప్యూటేషనల్ బడ్జెట్‌ను కేటాయించింది – బ్రూట్-ఫోర్స్ స్కేలింగ్ కంటే రీన్‌ఫోర్స్‌మెంట్ లెర్నింగ్ ఆప్టిమైజేషన్ ద్వారా అధునాతన సామర్థ్యాలను ప్రారంభించే గణనీయమైన పెట్టుబడి.

సాంకేతిక ఆవిష్కరణ డ్రైవింగ్ సామర్థ్యం

DSA మెకానిజం సాంప్రదాయ శ్రద్ధ నిర్మాణాల నుండి నిష్క్రమణను సూచిస్తుంది. అన్ని టోకెన్‌లను సమాన గణన తీవ్రతతో ప్రాసెస్ చేయడానికి బదులుగా, DSA ఒక “మెరుపు సూచిక” మరియు ప్రతి ప్రశ్నకు అత్యంత సంబంధిత సమాచారాన్ని మాత్రమే గుర్తించి మరియు ప్రాసెస్ చేసే ఒక సూక్ష్మమైన టోకెన్ ఎంపిక యంత్రాంగాన్ని ఉపయోగిస్తుంది.

ఈ విధానం O(L²) నుండి O(Lk)కి కోర్ అటెన్షన్ కాంప్లెక్సిటీని తగ్గిస్తుంది, ఇక్కడ k ఎంచుకున్న టోకెన్‌ల సంఖ్యను సూచిస్తుంది – మొత్తం సీక్వెన్స్ లెంగ్త్ Lలో కొంత భాగం. DeepSeek-V3.1-Terminus చెక్‌పాయింట్ నుండి ముందస్తు శిక్షణను కొనసాగించినప్పుడు, కంపెనీ 943.7 బిలియన్ టోకెన్ల శిక్షణను ఉపయోగించి 48028 బిలియన్ టోకెన్ల స్టెప్‌ల శిక్షణను అందించింది.

ఆర్కిటెక్చర్ టూల్-కాలింగ్ దృశ్యాలకు అనుకూలమైన సందర్భ నిర్వహణను కూడా పరిచయం చేస్తుంది. ప్రతి వినియోగదారు సందేశం తర్వాత థింకింగ్ కంటెంట్‌ను విస్మరించిన మునుపటి రీజనింగ్ మోడల్‌ల మాదిరిగా కాకుండా, డీప్‌సీక్ V3.2 AI మోడల్ సాధన సంబంధిత సందేశాలను మాత్రమే జోడించినప్పుడు రీజనింగ్ ట్రేస్‌లను కలిగి ఉంటుంది, పునరావృత రీ-రీజనింగ్‌ను తొలగించడం ద్వారా మల్టీ-టర్న్ ఏజెంట్ వర్క్‌ఫ్లోలలో టోకెన్ సామర్థ్యాన్ని మెరుగుపరుస్తుంది.

ఎంటర్ప్రైజ్ అప్లికేషన్లు మరియు ఆచరణాత్మక పనితీరు

AI అమలును మూల్యాంకనం చేసే సంస్థల కోసం, డీప్‌సీక్ యొక్క విధానం బెంచ్‌మార్క్ స్కోర్‌లను మించి నిర్దిష్ట ప్రయోజనాలను అందిస్తుంది. కోడింగ్ వర్క్‌ఫ్లో సామర్థ్యాలను అంచనా వేసే టెర్మినల్ బెంచ్ 2.0లో, డీప్‌సీక్ V3.2 46.4% ఖచ్చితత్వాన్ని సాధించింది.

మోడల్ SWE-వెరిఫైడ్, సాఫ్ట్‌వేర్ ఇంజనీరింగ్ సమస్య-పరిష్కార బెంచ్‌మార్క్‌లో 73.1% మరియు SWE బహుభాషలో 70.2% స్కోర్ చేసింది, అభివృద్ధి పరిసరాలలో ఆచరణాత్మక ప్రయోజనాన్ని ప్రదర్శిస్తుంది.

స్వయంప్రతిపత్త సాధన వినియోగం మరియు బహుళ-దశల తార్కికం అవసరమయ్యే ఏజెంట్ పనులలో, మోడల్ మునుపటి ఓపెన్-సోర్స్ సిస్టమ్‌ల కంటే గణనీయమైన మెరుగుదలలను చూపించింది. కంపెనీ ఒక పెద్ద-స్థాయి ఏజెంట్ టాస్క్ సింథసిస్ పైప్‌లైన్‌ను అభివృద్ధి చేసింది, ఇది 1,800 విభిన్న వాతావరణాలను మరియు 85,000 సంక్లిష్ట ప్రాంప్ట్‌లను రూపొందించింది, ఇది మోడల్‌కు తెలియని సాధన-వినియోగ దృశ్యాలకు తార్కిక వ్యూహాలను సాధారణీకరించడానికి వీలు కల్పిస్తుంది.

డీప్‌సీక్ హగ్గింగ్ ఫేస్‌లో బేస్ V3.2 మోడల్‌ను ఓపెన్ సోర్స్ చేసింది, విక్రేత డిపెండెన్సీలు లేకుండా ఎంటర్‌ప్రైజెస్ అమలు చేయడానికి మరియు అనుకూలీకరించడానికి అనుమతిస్తుంది. అధిక టోకెన్ వినియోగ అవసరాల కారణంగా ప్రత్యేక వేరియంట్ API ద్వారా మాత్రమే అందుబాటులో ఉంటుంది – గరిష్ట పనితీరు మరియు విస్తరణ సామర్థ్యం మధ్య ట్రేడ్-ఆఫ్.

పరిశ్రమ చిక్కులు మరియు అంగీకారం

విడుదల AI పరిశోధన సంఘంలో గణనీయమైన చర్చను సృష్టించింది. గూగుల్ డీప్‌మైండ్‌లోని ప్రిన్సిపల్ రీసెర్చ్ ఇంజనీర్ సుసాన్ జాంగ్, డీప్‌సీక్ యొక్క వివరణాత్మక సాంకేతిక డాక్యుమెంటేషన్‌ను ప్రశంసించారు, శిక్షణ తర్వాత మోడల్‌లను స్థిరీకరించడం మరియు ఏజెంట్ సామర్థ్యాలను పెంచడం వంటి సంస్థ యొక్క పనిని ప్రత్యేకంగా హైలైట్ చేసింది.

న్యూరల్ ఇన్ఫర్మేషన్ ప్రాసెసింగ్ సిస్టమ్స్‌పై కాన్ఫరెన్స్‌కు ముందు సమయం దృష్టిని విస్తరించింది. శాన్ డియాగోలోని NeurIPSకి హాజరవుతున్న చైనా యొక్క ఓపెన్-సోర్స్ AI పర్యావరణ వ్యవస్థపై నిపుణుడు ఫ్లోరియన్ బ్రాండ్ తక్షణ ప్రతిస్పందనను గుర్తించారు: “ఈరోజు అన్ని గ్రూప్ చాట్‌లు డీప్‌సీక్ ప్రకటన తర్వాత నిండిపోయాయి.”

పరిమితులు మరియు అభివృద్ధి మార్గం గుర్తించబడింది

డీప్‌సీక్ యొక్క సాంకేతిక నివేదిక సరిహద్దు నమూనాలతో పోలిస్తే ప్రస్తుత అంతరాలను పరిష్కరిస్తుంది. టోకెన్ సామర్థ్యం సవాలుగా ఉంది – DeepSeek V3.2 AI మోడల్‌కు సాధారణంగా Gemini 3 Pro వంటి సిస్టమ్‌ల అవుట్‌పుట్ నాణ్యతతో సరిపోలడానికి ఎక్కువ తరం పథాలు అవసరం. తక్కువ మొత్తం శిక్షణ గణన కారణంగా ప్రపంచ పరిజ్ఞానం యొక్క విస్తృతి ప్రముఖ యాజమాన్య నమూనాల కంటే వెనుకబడి ఉందని కంపెనీ అంగీకరించింది.

భవిష్యత్ అభివృద్ధి ప్రాధాన్యతలలో ప్రపంచ పరిజ్ఞానాన్ని విస్తరించడానికి శిక్షణకు ముందు గణన వనరులను స్కేలింగ్ చేయడం, టోకెన్ వినియోగాన్ని మెరుగుపరచడానికి తార్కిక గొలుసు సామర్థ్యాన్ని ఆప్టిమైజ్ చేయడం మరియు క్లిష్టమైన సమస్య-పరిష్కార పనుల కోసం పునాది నిర్మాణాన్ని మెరుగుపరచడం వంటివి ఉన్నాయి.

ఇవి కూడా చూడండి: AI బిజినెస్ రియాలిటీ – ఎంటర్‌ప్రైజ్ లీడర్‌లు తెలుసుకోవలసినది

పరిశ్రమ ప్రముఖుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & బిగ్ డేటా ఎక్స్‌పో ఆమ్‌స్టర్‌డామ్, కాలిఫోర్నియా మరియు లండన్‌లో జరుగుతున్నాయి. సమగ్ర కార్యక్రమం ఇందులో భాగమే టెక్ఎక్స్ మరియు ఇతర ప్రముఖ సాంకేతిక ఈవెంట్‌లతో కలిసి ఉంది, క్లిక్ చేయండి ఇక్కడ మరింత సమాచారం కోసం.

AI వార్తలు ఆధారితం టెక్ఫోర్జ్ మీడియా. రాబోయే ఇతర ఎంటర్‌ప్రైజ్ టెక్నాలజీ ఈవెంట్‌లు మరియు వెబ్‌నార్‌లను అన్వేషించండి ఇక్కడ.

Source link

Useful _Links

EMEA CIOలు AI రోల్‌అవుట్‌లను ఎలా జంప్‌స్టార్ట్ చేయగలవు

GPT-5.5 అనేది OpenAI యొక్క అత్యంత సామర్థ్యం గల ఏజెంట్ AI మోడల్ – API ధర కంటే రెండింతలు

SDLC ఖర్చులను నియంత్రించడానికి IBM AI ప్లాట్‌ఫారమ్ బాబ్‌ను ప్రారంభించింది

ఎన్‌కోడర్‌ల పరిణామం: సాధారణ నమూనాల నుండి మల్టీమోడల్ AI వరకు

భౌతిక AI కోసం కకావో మొబిలిటీ వివరాలు లెవల్ 4 అటానమస్ డ్రైవింగ్ రోడ్‌మ్యాప్

ఆప్టికల్ ఇంటర్‌కనెక్ట్ అంటే ఏమిటి మరియు లైట్‌టెలిజెన్స్ యొక్క $10B అరంగేట్రం ఎందుకు AIకి ముఖ్యమని చెప్పింది

హానికరమైన వెబ్ పేజీలు AI ఏజెంట్లను విషపూరితం చేస్తున్నాయని Google హెచ్చరించింది

AI ఏజెంట్లకు ఇంటరాక్షన్ ఇన్‌ఫ్రాస్ట్రక్చర్ ఎందుకు అవసరం

మార్కెట్ ప్రవర్తనను అర్థం చేసుకోవడానికి AI మోడల్‌లు నిజ-సమయ క్రిప్టోకరెన్సీ డేటాను ఎలా ఉపయోగిస్తాయి

AI కోసం భిన్నమైన ఆలోచనతో బిలియన్-డాలర్ స్టార్టప్