Hot News

డీప్‌సీక్-R1 రీజనింగ్ మోడల్‌లు పనితీరులో OpenAIకి ప్రత్యర్థి

డీప్‌సీక్ సంక్లిష్టమైన తార్కిక పనులను పరిష్కరించడానికి రూపొందించబడిన దాని మొదటి తరం DeepSeek-R1 మరియు DeepSeek-R1-జీరో మోడల్‌లను ఆవిష్కరించింది. డీప్‌సీక్-ఆర్1-జీరో ప్రాథమిక దశగా పర్యవేక్షించబడిన ఫైన్-ట్యూనింగ్ (SFT)పై ఆధారపడకుండా పెద్ద-స్థాయి ఉపబల అభ్యాసం (RL) ద్వారా మాత్రమే శిక్షణ పొందుతుంది. డీప్‌సీక్ ప్రకారం, ఈ విధానం స్వీయ-ధృవీకరణ, ప్రతిబింబం మరియు విస్తృతమైన ఆలోచనల శ్రేణి (CoT) సహా “అనేక శక్తివంతమైన మరియు ఆసక్తికరమైన తార్కిక ప్రవర్తనల” సహజ ఆవిర్భావానికి దారితీసింది. “ముఖ్యంగా, (DeepSeek-R1-Zero) అనేది SFT అవసరం…

Read More

ఓపెన్ లాంగ్వేజ్ మోడల్స్ కోసం బార్‌ను పెంచడం

Ai2 OLMo 2ని విడుదల చేస్తోంది, ఇది AI యొక్క ప్రజాస్వామ్యీకరణను అభివృద్ధి చేసే మరియు బహిరంగ మరియు యాజమాన్య పరిష్కారాల మధ్య అంతరాన్ని తగ్గించే ఓపెన్-సోర్స్ భాషా నమూనాల కుటుంబం. 7B మరియు 13B పారామీటర్ వెర్షన్‌లలో అందుబాటులో ఉన్న కొత్త మోడల్‌లు 5 ట్రిలియన్ టోకెన్‌ల వరకు శిక్షణ పొందాయి మరియు ఇంగ్లీష్ అకడమిక్ బెంచ్‌మార్క్‌లలో లామా 3.1 వంటి ఓపెన్-వెయిట్ మోడల్‌లతో పోటీగా ఉండగా, పోల్చదగిన పూర్తి ఓపెన్ మోడల్‌లతో సరిపోలే లేదా…

Read More
Top