టెక్ దిగ్గజాలు సరిహద్దు AI మోడల్లకు శిక్షణ ఇవ్వడానికి గణన శక్తికి బిలియన్ల కొద్దీ ఖర్చు చేస్తున్నప్పుడు, చైనా యొక్క DeepSeek కష్టతరంగా కాకుండా తెలివిగా పని చేయడం ద్వారా పోల్చదగిన ఫలితాలను సాధించింది. డీప్సీక్ V3.2 AI మోడల్ ‘తక్కువ మొత్తం శిక్షణ FLOPలను’ ఉపయోగిస్తున్నప్పటికీ తార్కిక బెంచ్మార్క్లలో OpenAI యొక్క GPT-5తో సరిపోలింది – ఇది అధునాతన కృత్రిమ మేధస్సును నిర్మించడం గురించి పరిశ్రమ ఏ విధంగా ఆలోచిస్తుందో మార్చగలదు.
ఎంటర్ప్రైజెస్ కోసం, సరిహద్దు AI సామర్థ్యాలకు సరిహద్దు-స్థాయి కంప్యూటింగ్ బడ్జెట్లు అవసరం లేదని విడుదల నిరూపిస్తుంది. DeepSeek V3.2 యొక్క ఓపెన్-సోర్స్ లభ్యత విస్తరణ నిర్మాణంపై నియంత్రణను కొనసాగిస్తూనే అధునాతన తార్కికం మరియు ఏజెంట్ సామర్థ్యాలను మూల్యాంకనం చేయడానికి సంస్థలను అనుమతిస్తుంది – వ్యయ-సమర్థత AI అడాప్షన్ స్ట్రాటజీలకు ఎక్కువగా కేంద్రంగా మారినందున ఆచరణాత్మక పరిశీలన.
Hangzhou-ఆధారిత ప్రయోగశాల సోమవారం రెండు వెర్షన్లను విడుదల చేసింది: బేస్ DeepSeek V3.2 మరియు DeepSeek-V3.2-Speciale, 2025 ఇంటర్నేషనల్ మ్యాథమెటికల్ ఒలింపియాడ్ మరియు ఇంటర్నేషనల్ ఒలింపియాడ్ ఇన్ఫర్మేటిక్స్లో గోల్డ్ మెడల్ పనితీరును సాధించడంతో – అంతకుముందు US AI మోడల్ల బెంచ్మార్క్లు అంతకుముందు అమెరికాకు చెందిన అంతర్గత మోడల్లు మాత్రమే చేరుకున్నాయి.
ఎగుమతి పరిమితుల కారణంగా అధునాతన సెమీకండక్టర్ చిప్లకు డీప్సీక్ పరిమిత ప్రాప్యతను అందించినందున ఈ సాధన చాలా ముఖ్యమైనది.
పోటీ ప్రయోజనంగా వనరుల సామర్థ్యం
డీప్సీక్ యొక్క విజయం సరిహద్దు AI పనితీరుకు గణన వనరులను ఎక్కువగా స్కేలింగ్ చేయడం అవసరమని పరిశ్రమలో ఉన్న ఊహకు విరుద్ధంగా ఉంది. కంపెనీ ఈ సామర్థ్యాన్ని ఆర్కిటెక్చరల్ ఆవిష్కరణలకు ఆపాదించింది, ముఖ్యంగా డీప్సీక్ స్పార్స్ అటెన్షన్ (DSA), ఇది మోడల్ పనితీరును కాపాడుతూ గణన సంక్లిష్టతను గణనీయంగా తగ్గిస్తుంది.
బేస్ డీప్సీక్ V3.2 AI మోడల్ AIME 2025 గణిత సమస్యలపై 93.1% ఖచ్చితత్వాన్ని సాధించింది మరియు 2386 కోడ్ఫోర్స్ రేటింగ్ను రీజనింగ్ బెంచ్మార్క్లలో GPT-5తో పాటు ఉంచింది.
స్పెషలే వేరియంట్ మరింత విజయవంతమైంది, అమెరికన్ ఇన్విటేషనల్ మ్యాథమెటిక్స్ ఎగ్జామినేషన్ (AIME) 2025లో 96.0%, హార్వర్డ్-MIT మ్యాథమెటిక్స్ టోర్నమెంట్ (HMMT) ఫిబ్రవరి 2025లో 99.2% స్కోర్ సాధించింది మరియు అంతర్జాతీయంగా 2025 అంతర్జాతీయ మ్యాథమెటిక్ మరియు Ompia రెండింటిలోనూ గోల్డ్-మెడల్ పనితీరును సాధించింది. ఇన్ఫర్మేటిక్స్.
చైనాను ప్రభావితం చేసే సుంకాలు మరియు ఎగుమతి పరిమితుల తెప్పకు డీప్సీక్ పరిమిత ప్రాప్యత కారణంగా ఫలితాలు చాలా ముఖ్యమైనవి. టెక్నికల్ రిపోర్ట్ ప్రకారం, కంపెనీ శిక్షణా-పూర్తి ఖర్చులలో 10% కంటే ఎక్కువ పోస్ట్-ట్రైనింగ్ కంప్యూటేషనల్ బడ్జెట్ను కేటాయించింది – బ్రూట్-ఫోర్స్ స్కేలింగ్ కంటే రీన్ఫోర్స్మెంట్ లెర్నింగ్ ఆప్టిమైజేషన్ ద్వారా అధునాతన సామర్థ్యాలను ప్రారంభించే గణనీయమైన పెట్టుబడి.
సాంకేతిక ఆవిష్కరణ డ్రైవింగ్ సామర్థ్యం
DSA మెకానిజం సాంప్రదాయ శ్రద్ధ నిర్మాణాల నుండి నిష్క్రమణను సూచిస్తుంది. అన్ని టోకెన్లను సమాన గణన తీవ్రతతో ప్రాసెస్ చేయడానికి బదులుగా, DSA ఒక “మెరుపు సూచిక” మరియు ప్రతి ప్రశ్నకు అత్యంత సంబంధిత సమాచారాన్ని మాత్రమే గుర్తించి మరియు ప్రాసెస్ చేసే ఒక సూక్ష్మమైన టోకెన్ ఎంపిక యంత్రాంగాన్ని ఉపయోగిస్తుంది.
ఈ విధానం O(L²) నుండి O(Lk)కి కోర్ అటెన్షన్ కాంప్లెక్సిటీని తగ్గిస్తుంది, ఇక్కడ k ఎంచుకున్న టోకెన్ల సంఖ్యను సూచిస్తుంది – మొత్తం సీక్వెన్స్ లెంగ్త్ Lలో కొంత భాగం. DeepSeek-V3.1-Terminus చెక్పాయింట్ నుండి ముందస్తు శిక్షణను కొనసాగించినప్పుడు, కంపెనీ 943.7 బిలియన్ టోకెన్ల శిక్షణను ఉపయోగించి 48028 బిలియన్ టోకెన్ల స్టెప్ల శిక్షణను అందించింది.
ఆర్కిటెక్చర్ టూల్-కాలింగ్ దృశ్యాలకు అనుకూలమైన సందర్భ నిర్వహణను కూడా పరిచయం చేస్తుంది. ప్రతి వినియోగదారు సందేశం తర్వాత థింకింగ్ కంటెంట్ను విస్మరించిన మునుపటి రీజనింగ్ మోడల్ల మాదిరిగా కాకుండా, డీప్సీక్ V3.2 AI మోడల్ సాధన సంబంధిత సందేశాలను మాత్రమే జోడించినప్పుడు రీజనింగ్ ట్రేస్లను కలిగి ఉంటుంది, పునరావృత రీ-రీజనింగ్ను తొలగించడం ద్వారా మల్టీ-టర్న్ ఏజెంట్ వర్క్ఫ్లోలలో టోకెన్ సామర్థ్యాన్ని మెరుగుపరుస్తుంది.
ఎంటర్ప్రైజ్ అప్లికేషన్లు మరియు ఆచరణాత్మక పనితీరు
AI అమలును మూల్యాంకనం చేసే సంస్థల కోసం, డీప్సీక్ యొక్క విధానం బెంచ్మార్క్ స్కోర్లను మించి నిర్దిష్ట ప్రయోజనాలను అందిస్తుంది. కోడింగ్ వర్క్ఫ్లో సామర్థ్యాలను అంచనా వేసే టెర్మినల్ బెంచ్ 2.0లో, డీప్సీక్ V3.2 46.4% ఖచ్చితత్వాన్ని సాధించింది.
మోడల్ SWE-వెరిఫైడ్, సాఫ్ట్వేర్ ఇంజనీరింగ్ సమస్య-పరిష్కార బెంచ్మార్క్లో 73.1% మరియు SWE బహుభాషలో 70.2% స్కోర్ చేసింది, అభివృద్ధి పరిసరాలలో ఆచరణాత్మక ప్రయోజనాన్ని ప్రదర్శిస్తుంది.
స్వయంప్రతిపత్త సాధన వినియోగం మరియు బహుళ-దశల తార్కికం అవసరమయ్యే ఏజెంట్ పనులలో, మోడల్ మునుపటి ఓపెన్-సోర్స్ సిస్టమ్ల కంటే గణనీయమైన మెరుగుదలలను చూపించింది. కంపెనీ ఒక పెద్ద-స్థాయి ఏజెంట్ టాస్క్ సింథసిస్ పైప్లైన్ను అభివృద్ధి చేసింది, ఇది 1,800 విభిన్న వాతావరణాలను మరియు 85,000 సంక్లిష్ట ప్రాంప్ట్లను రూపొందించింది, ఇది మోడల్కు తెలియని సాధన-వినియోగ దృశ్యాలకు తార్కిక వ్యూహాలను సాధారణీకరించడానికి వీలు కల్పిస్తుంది.
డీప్సీక్ హగ్గింగ్ ఫేస్లో బేస్ V3.2 మోడల్ను ఓపెన్ సోర్స్ చేసింది, విక్రేత డిపెండెన్సీలు లేకుండా ఎంటర్ప్రైజెస్ అమలు చేయడానికి మరియు అనుకూలీకరించడానికి అనుమతిస్తుంది. అధిక టోకెన్ వినియోగ అవసరాల కారణంగా ప్రత్యేక వేరియంట్ API ద్వారా మాత్రమే అందుబాటులో ఉంటుంది – గరిష్ట పనితీరు మరియు విస్తరణ సామర్థ్యం మధ్య ట్రేడ్-ఆఫ్.
పరిశ్రమ చిక్కులు మరియు అంగీకారం
విడుదల AI పరిశోధన సంఘంలో గణనీయమైన చర్చను సృష్టించింది. గూగుల్ డీప్మైండ్లోని ప్రిన్సిపల్ రీసెర్చ్ ఇంజనీర్ సుసాన్ జాంగ్, డీప్సీక్ యొక్క వివరణాత్మక సాంకేతిక డాక్యుమెంటేషన్ను ప్రశంసించారు, శిక్షణ తర్వాత మోడల్లను స్థిరీకరించడం మరియు ఏజెంట్ సామర్థ్యాలను పెంచడం వంటి సంస్థ యొక్క పనిని ప్రత్యేకంగా హైలైట్ చేసింది.
న్యూరల్ ఇన్ఫర్మేషన్ ప్రాసెసింగ్ సిస్టమ్స్పై కాన్ఫరెన్స్కు ముందు సమయం దృష్టిని విస్తరించింది. శాన్ డియాగోలోని NeurIPSకి హాజరవుతున్న చైనా యొక్క ఓపెన్-సోర్స్ AI పర్యావరణ వ్యవస్థపై నిపుణుడు ఫ్లోరియన్ బ్రాండ్ తక్షణ ప్రతిస్పందనను గుర్తించారు: “ఈరోజు అన్ని గ్రూప్ చాట్లు డీప్సీక్ ప్రకటన తర్వాత నిండిపోయాయి.”
పరిమితులు మరియు అభివృద్ధి మార్గం గుర్తించబడింది
డీప్సీక్ యొక్క సాంకేతిక నివేదిక సరిహద్దు నమూనాలతో పోలిస్తే ప్రస్తుత అంతరాలను పరిష్కరిస్తుంది. టోకెన్ సామర్థ్యం సవాలుగా ఉంది – DeepSeek V3.2 AI మోడల్కు సాధారణంగా Gemini 3 Pro వంటి సిస్టమ్ల అవుట్పుట్ నాణ్యతతో సరిపోలడానికి ఎక్కువ తరం పథాలు అవసరం. తక్కువ మొత్తం శిక్షణ గణన కారణంగా ప్రపంచ పరిజ్ఞానం యొక్క విస్తృతి ప్రముఖ యాజమాన్య నమూనాల కంటే వెనుకబడి ఉందని కంపెనీ అంగీకరించింది.
భవిష్యత్ అభివృద్ధి ప్రాధాన్యతలలో ప్రపంచ పరిజ్ఞానాన్ని విస్తరించడానికి శిక్షణకు ముందు గణన వనరులను స్కేలింగ్ చేయడం, టోకెన్ వినియోగాన్ని మెరుగుపరచడానికి తార్కిక గొలుసు సామర్థ్యాన్ని ఆప్టిమైజ్ చేయడం మరియు క్లిష్టమైన సమస్య-పరిష్కార పనుల కోసం పునాది నిర్మాణాన్ని మెరుగుపరచడం వంటివి ఉన్నాయి.
ఇవి కూడా చూడండి: AI బిజినెస్ రియాలిటీ – ఎంటర్ప్రైజ్ లీడర్లు తెలుసుకోవలసినది

పరిశ్రమ ప్రముఖుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & బిగ్ డేటా ఎక్స్పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లో జరుగుతున్నాయి. సమగ్ర కార్యక్రమం ఇందులో భాగమే టెక్ఎక్స్ మరియు ఇతర ప్రముఖ సాంకేతిక ఈవెంట్లతో కలిసి ఉంది, క్లిక్ చేయండి ఇక్కడ మరింత సమాచారం కోసం.
AI వార్తలు ఆధారితం టెక్ఫోర్జ్ మీడియా. రాబోయే ఇతర ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్లు మరియు వెబ్నార్లను అన్వేషించండి ఇక్కడ.