డీప్‌సీక్-R1 రీజనింగ్ మోడల్‌లు పనితీరులో OpenAIకి ప్రత్యర్థి

డీప్‌సీక్ సంక్లిష్టమైన తార్కిక పనులను పరిష్కరించడానికి రూపొందించబడిన దాని మొదటి తరం DeepSeek-R1 మరియు DeepSeek-R1-జీరో మోడల్‌లను ఆవిష్కరించింది.

డీప్‌సీక్-ఆర్1-జీరో ప్రాథమిక దశగా పర్యవేక్షించబడిన ఫైన్-ట్యూనింగ్ (SFT)పై ఆధారపడకుండా పెద్ద-స్థాయి ఉపబల అభ్యాసం (RL) ద్వారా మాత్రమే శిక్షణ పొందుతుంది. డీప్‌సీక్ ప్రకారం, ఈ విధానం స్వీయ-ధృవీకరణ, ప్రతిబింబం మరియు విస్తృతమైన ఆలోచనల శ్రేణి (CoT) సహా “అనేక శక్తివంతమైన మరియు ఆసక్తికరమైన తార్కిక ప్రవర్తనల” సహజ ఆవిర్భావానికి దారితీసింది.

“ముఖ్యంగా, (DeepSeek-R1-Zero) అనేది SFT అవసరం లేకుండా, LLMల తార్కిక సామర్థ్యాలను పూర్తిగా RL ద్వారా ప్రోత్సహించవచ్చని ధృవీకరించే మొదటి బహిరంగ పరిశోధన,” అని డీప్‌సీక్ పరిశోధకులు వివరించారు. ఈ మైలురాయి మోడల్ యొక్క వినూత్న పునాదులను నొక్కిచెప్పడమే కాకుండా AIని తార్కికం చేయడంలో RL-కేంద్రీకృత పురోగతికి మార్గం సుగమం చేస్తుంది.

అయితే, DeepSeek-R1-Zero యొక్క సామర్థ్యాలు కొన్ని పరిమితులతో వస్తాయి. ప్రధాన సవాళ్లలో “అంతులేని పునరావృతం, పేలవమైన చదవడం మరియు భాషా కలయిక” ఉన్నాయి, ఇవి వాస్తవ-ప్రపంచ అనువర్తనాల్లో ముఖ్యమైన అడ్డంకులను కలిగిస్తాయి. ఈ లోపాలను పరిష్కరించడానికి, DeepSeek దాని ఫ్లాగ్‌షిప్ మోడల్‌ను అభివృద్ధి చేసింది: DeepSeek-R1.

DeepSeek-R1ని పరిచయం చేస్తున్నాము

డీప్‌సీక్-ఆర్1 RL శిక్షణకు ముందు కోల్డ్-స్టార్ట్ డేటాను పొందుపరచడం ద్వారా దాని పూర్వీకుల ఆధారంగా రూపొందించబడింది. ఈ అదనపు ముందస్తు శిక్షణ దశ మోడల్ యొక్క తార్కిక సామర్థ్యాలను మెరుగుపరుస్తుంది మరియు DeepSeek-R1-Zeroలో గుర్తించబడిన అనేక పరిమితులను పరిష్కరిస్తుంది.

ముఖ్యంగా, DeepSeek-R1 గణితం, కోడింగ్ మరియు సాధారణ రీజనింగ్ టాస్క్‌లలో OpenAI యొక్క చాలా ప్రశంసలు పొందిన o1 సిస్టమ్‌తో పోల్చదగిన పనితీరును సాధిస్తుంది, ఇది ఒక ప్రముఖ పోటీదారుగా దాని స్థానాన్ని సుస్థిరం చేస్తుంది.

DeepSeek ఆరు చిన్న డిస్టిల్డ్ మోడల్‌లతో పాటు DeepSeek-R1-Zero మరియు DeepSeek-R1 రెండింటినీ ఓపెన్ సోర్స్‌గా ఎంచుకుంది. వీటిలో, DeepSeek-R1-Distill-Qwen-32B అసాధారణమైన ఫలితాలను ప్రదర్శించింది-బహుళ బెంచ్‌మార్క్‌లలో OpenAI యొక్క o1-మినీని మించిపోయింది.

MATH-500 (Pass@1): DeepSeek-R1 97.3% సాధించింది, OpenAI (96.4%) మరియు ఇతర ముఖ్య పోటీదారులను అధిగమించింది.
LiveCodeBench (Pass@1-COT): డిస్టిల్డ్ వెర్షన్ DeepSeek-R1-Distill-Qwen-32B 57.2% స్కోర్ చేసింది, ఇది చిన్న మోడళ్లలో అత్యుత్తమ పనితీరు.
AIME 2024 (Pass@1): DeepSeek-R1 79.8% సాధించింది, గణిత సమస్య పరిష్కారంలో అద్భుతమైన ప్రమాణాన్ని నెలకొల్పింది.

Source link

Useful _Links

AI యొక్క పేలవమైన అమలు శ్రామిక శక్తి తగ్గింపు వెనుక ఉండవచ్చు

ఫైనాన్స్ వర్క్‌ఫ్లోల కోసం ఏజెంట్ AIని అప్‌గ్రేడ్ చేస్తోంది

గోల్డ్‌మన్ సాచ్స్ మరియు డ్యుయిష్ బ్యాంక్ ట్రేడింగ్‌లో ఏజెంట్ AIని పరీక్షించాయి

ASML యొక్క అధిక-NA EUV సాధనాలు తదుపరి తరం AI చిప్‌ల కోసం రన్‌వేని క్లియర్ చేస్తాయి

రియల్ టైమ్ 5G నెట్‌వర్క్ స్లైసింగ్ కోసం Nokia మరియు AWS పైలట్ AI ఆటోమేషన్

క్లాడ్ ‘పారిశ్రామిక స్థాయి’ AI మోడల్ స్వేదనం ఎదుర్కొంటుంది

డిస్‌కనెక్ట్ చేయబడిన క్లౌడ్‌లు AI డేటా గవర్నెన్స్‌ని ఎలా మెరుగుపరుస్తాయి

తక్షణ వ్యాపారం ROI కోసం ఏజెంట్ ఫైనాన్స్ AIని అమలు చేస్తోంది

Basware నుండి Agentic AI ప్రారంభం మాత్రమే

మీ బ్యాంక్‌ను నడుపుతున్న 60 ఏళ్ల నాటి కోడ్ దాని AI సరిపోలికను అందుకుంది

డీప్‌సీక్-R1 రీజనింగ్ మోడల్‌లు పనితీరులో OpenAIకి ప్రత్యర్థి

DeepSeek-R1ని పరిచయం చేస్తున్నాము

విస్తృత పరిశ్రమకు ప్రయోజనం చేకూర్చే పైప్‌లైన్

స్వేదనం యొక్క ప్రాముఖ్యత

Leave a Reply Cancel reply

Useful Links

DeepSeek-R1ని పరిచయం చేస్తున్నాము

విస్తృత పరిశ్రమకు ప్రయోజనం చేకూర్చే పైప్‌లైన్

స్వేదనం యొక్క ప్రాముఖ్యత

Leave a Reply Cancel reply

Related News

Useful _Links