అలీబాబాకు చెందిన క్వెన్ బృందం వారి ఓపెన్-సోర్స్ రీజనింగ్ AI మోడల్ యొక్క కొత్త వెర్షన్ను కొన్ని అద్భుతమైన బెంచ్మార్క్లతో విడుదల చేసింది.
QWEN3-235B-A22B-థింకింగ్ -2507 ను కలవండి. గత మూడు నెలల్లో, క్వెన్ బృందం వారు తమ AI యొక్క “థింకింగ్ సామర్ధ్యం” అని పిలిచే వాటిని పని చేయడం చాలా కష్టం, దాని తార్కికం యొక్క నాణ్యత మరియు లోతు రెండింటినీ మెరుగుపరచడం లక్ష్యంగా పెట్టుకుంది.
వారి ప్రయత్నాల ఫలితం నిజంగా కఠినమైన విషయాలలో రాణించే మోడల్: తార్కిక తార్కికం, సంక్లిష్ట గణితాలు, సైన్స్ సమస్యలు మరియు అధునాతన కోడింగ్. సాధారణంగా మానవ నిపుణుడు అవసరమయ్యే ఈ ప్రాంతాలలో, ఈ కొత్త Qwen మోడల్ ఇప్పుడు ఓపెన్-సోర్స్ మోడళ్ల కోసం ప్రమాణాన్ని సెట్ చేస్తోంది.
రీజనింగ్ బెంచ్మార్క్లలో, క్వెన్ యొక్క తాజా ఓపెన్-సోర్స్ AI మోడల్ కోడింగ్ కోసం లైవ్కోడ్బెంచ్ V6 పై AIME25 మరియు 74.1 లో 92.3 సాధించింది. ఇది మరింత సాధారణ సామర్ధ్య పరీక్షలలో కూడా దాని స్వంతదానిని కలిగి ఉంది, అరేనా-హార్డ్ V2 లో 79.7 స్కోరు చేస్తుంది, ఇది మానవ ప్రాధాన్యతలతో ఎంతవరకు సమం చేస్తుందో కొలుస్తుంది.

దాని హృదయంలో, ఇది క్వెన్ జట్టు నుండి భారీ తార్కిక AI మోడల్, మొత్తం 235 బిలియన్ పారామితులు. ఏదేమైనా, ఇది మిశ్రమం-ఆఫ్-ఎక్స్పర్ట్స్ (MOE) ను ఉపయోగిస్తుంది, అంటే ఇది ఆ పారామితులలో కొంత భాగాన్ని మాత్రమే సక్రియం చేస్తుంది-సుమారు 22 బిలియన్లు-ఏ సమయంలోనైనా. కాల్లో 128 మంది నిపుణుల భారీ బృందాన్ని కలిగి ఉన్నట్లు ఆలోచించండి, కాని ఒక నిర్దిష్ట పని కోసం అత్యధికంగా సరిపోయే ఎనిమిది మాత్రమే దానిపై పని చేయడానికి తీసుకువస్తారు.
బహుశా దాని అత్యంత ఆకర్షణీయమైన లక్షణాలలో ఒకటి దాని భారీ జ్ఞాపకం. క్వెన్ యొక్క ఓపెన్-సోర్స్ రీజనింగ్ AI మోడల్ స్థానిక సందర్భ పొడవు 262,144 టోకెన్లను కలిగి ఉంది; విస్తారమైన సమాచారాన్ని అర్థం చేసుకునే పనులకు భారీ ప్రయోజనం.
అక్కడ ఉన్న డెవలపర్లు మరియు టింకరర్ల కోసం, క్వెన్ బృందం ప్రారంభించడం సులభం చేసింది. మోడల్ అందుబాటులో ఉంది ముఖాన్ని కౌగిలించుకోవడం. మీ స్వంత API ఎండ్పాయింట్ను సృష్టించడానికి మీరు Sglang లేదా Vllm వంటి సాధనాలను ఉపయోగించి దీన్ని అమలు చేయవచ్చు. మోడల్ యొక్క టూల్-కాలింగ్ నైపుణ్యాలను ఉపయోగించుకోవడానికి ఉత్తమమైన మార్గంగా బృందం వారి Qwen- ఏజెంట్ ఫ్రేమ్వర్క్ను సూచిస్తుంది.
వారి ఓపెన్ సోర్స్ AI రీజనింగ్ మోడల్ నుండి ఉత్తమ పనితీరును పొందడానికి, క్వెన్ బృందం కొన్ని చిట్కాలను పంచుకుంది. వారు చాలా పనుల కోసం సుమారు 32,768 టోకెన్ల అవుట్పుట్ పొడవును సూచిస్తారు, కాని నిజంగా సంక్లిష్టమైన సవాళ్ళ కోసం, మీరు దానిని 81,920 టోకెన్లకు పెంచాలి, AI కి “ఆలోచించడానికి” తగినంత గది ఇవ్వడానికి. గణిత సమస్యల కోసం “దశల వారీగా కారణం” అని అడగడం, అత్యంత ఖచ్చితమైన మరియు బాగా నిర్మాణాత్మక సమాధానాలను పొందడానికి మీ ప్రాంప్ట్లో మోడల్ నిర్దిష్ట సూచనలను ఇవ్వమని వారు సిఫార్సు చేస్తారు.
ఈ కొత్త క్వెన్ మోడల్ విడుదల శక్తివంతమైన ఇంకా ఓపెన్-సోర్స్ రీజనింగ్ AI ని అందిస్తుంది, ఇది అక్కడ కొన్ని ఉత్తమ యాజమాన్య నమూనాలకు ప్రత్యర్థిగా ఉంటుంది, ప్రత్యేకించి సంక్లిష్టమైన, మెదడు-బెండింగ్ పనుల విషయానికి వస్తే. డెవలపర్లు చివరికి దానితో ఏమి నిర్మిస్తారో చూడటం ఉత్తేజకరమైనది.
(చిత్రం తుంగ్ లామ్)
ఇవి కూడా చూడండి: AI కార్యాచరణ ప్రణాళిక: యుఎస్ నాయకత్వం తప్పనిసరిగా ‘సవాలు చేయబడదు’

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్పో.
టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్నార్లను అన్వేషించండి ఇక్కడ.