అలీబాబా యొక్క కొత్త క్వెన్ రీజనింగ్ AI మోడల్ ఓపెన్ సోర్స్ రికార్డులను సెట్ చేస్తుంది

అలీబాబాకు చెందిన క్వెన్ బృందం వారి ఓపెన్-సోర్స్ రీజనింగ్ AI మోడల్ యొక్క కొత్త వెర్షన్‌ను కొన్ని అద్భుతమైన బెంచ్‌మార్క్‌లతో విడుదల చేసింది.

QWEN3-235B-A22B-థింకింగ్ -2507 ను కలవండి. గత మూడు నెలల్లో, క్వెన్ బృందం వారు తమ AI యొక్క “థింకింగ్ సామర్ధ్యం” అని పిలిచే వాటిని పని చేయడం చాలా కష్టం, దాని తార్కికం యొక్క నాణ్యత మరియు లోతు రెండింటినీ మెరుగుపరచడం లక్ష్యంగా పెట్టుకుంది.

వారి ప్రయత్నాల ఫలితం నిజంగా కఠినమైన విషయాలలో రాణించే మోడల్: తార్కిక తార్కికం, సంక్లిష్ట గణితాలు, సైన్స్ సమస్యలు మరియు అధునాతన కోడింగ్. సాధారణంగా మానవ నిపుణుడు అవసరమయ్యే ఈ ప్రాంతాలలో, ఈ కొత్త Qwen మోడల్ ఇప్పుడు ఓపెన్-సోర్స్ మోడళ్ల కోసం ప్రమాణాన్ని సెట్ చేస్తోంది.

రీజనింగ్ బెంచ్‌మార్క్‌లలో, క్వెన్ యొక్క తాజా ఓపెన్-సోర్స్ AI మోడల్ కోడింగ్ కోసం లైవ్‌కోడ్‌బెంచ్ V6 పై AIME25 మరియు 74.1 లో 92.3 సాధించింది. ఇది మరింత సాధారణ సామర్ధ్య పరీక్షలలో కూడా దాని స్వంతదానిని కలిగి ఉంది, అరేనా-హార్డ్ V2 లో 79.7 స్కోరు చేస్తుంది, ఇది మానవ ప్రాధాన్యతలతో ఎంతవరకు సమం చేస్తుందో కొలుస్తుంది.

ప్రత్యర్థులతో పోలిస్తే వారి తాజా QWEN3-235B-A22B-థింకింగ్ -2507 ఓపెన్-సోర్స్ రీజనింగ్ AI మోడల్ కోసం అలీబాబా క్వెన్ జట్టు నుండి బెంచ్‌మార్క్‌లు.

దాని హృదయంలో, ఇది క్వెన్ జట్టు నుండి భారీ తార్కిక AI మోడల్, మొత్తం 235 బిలియన్ పారామితులు. ఏదేమైనా, ఇది మిశ్రమం-ఆఫ్-ఎక్స్‌పర్ట్స్ (MOE) ను ఉపయోగిస్తుంది, అంటే ఇది ఆ పారామితులలో కొంత భాగాన్ని మాత్రమే సక్రియం చేస్తుంది-సుమారు 22 బిలియన్లు-ఏ సమయంలోనైనా. కాల్‌లో 128 మంది నిపుణుల భారీ బృందాన్ని కలిగి ఉన్నట్లు ఆలోచించండి, కాని ఒక నిర్దిష్ట పని కోసం అత్యధికంగా సరిపోయే ఎనిమిది మాత్రమే దానిపై పని చేయడానికి తీసుకువస్తారు.

బహుశా దాని అత్యంత ఆకర్షణీయమైన లక్షణాలలో ఒకటి దాని భారీ జ్ఞాపకం. క్వెన్ యొక్క ఓపెన్-సోర్స్ రీజనింగ్ AI మోడల్ స్థానిక సందర్భ పొడవు 262,144 టోకెన్లను కలిగి ఉంది; విస్తారమైన సమాచారాన్ని అర్థం చేసుకునే పనులకు భారీ ప్రయోజనం.

అక్కడ ఉన్న డెవలపర్లు మరియు టింకరర్ల కోసం, క్వెన్ బృందం ప్రారంభించడం సులభం చేసింది. మోడల్ అందుబాటులో ఉంది ముఖాన్ని కౌగిలించుకోవడం. మీ స్వంత API ఎండ్‌పాయింట్‌ను సృష్టించడానికి మీరు Sglang లేదా Vllm వంటి సాధనాలను ఉపయోగించి దీన్ని అమలు చేయవచ్చు. మోడల్ యొక్క టూల్-కాలింగ్ నైపుణ్యాలను ఉపయోగించుకోవడానికి ఉత్తమమైన మార్గంగా బృందం వారి Qwen- ఏజెంట్ ఫ్రేమ్‌వర్క్‌ను సూచిస్తుంది.

వారి ఓపెన్ సోర్స్ AI రీజనింగ్ మోడల్ నుండి ఉత్తమ పనితీరును పొందడానికి, క్వెన్ బృందం కొన్ని చిట్కాలను పంచుకుంది. వారు చాలా పనుల కోసం సుమారు 32,768 టోకెన్ల అవుట్పుట్ పొడవును సూచిస్తారు, కాని నిజంగా సంక్లిష్టమైన సవాళ్ళ కోసం, మీరు దానిని 81,920 టోకెన్లకు పెంచాలి, AI కి “ఆలోచించడానికి” తగినంత గది ఇవ్వడానికి. గణిత సమస్యల కోసం “దశల వారీగా కారణం” అని అడగడం, అత్యంత ఖచ్చితమైన మరియు బాగా నిర్మాణాత్మక సమాధానాలను పొందడానికి మీ ప్రాంప్ట్‌లో మోడల్ నిర్దిష్ట సూచనలను ఇవ్వమని వారు సిఫార్సు చేస్తారు.

ఈ కొత్త క్వెన్ మోడల్ విడుదల శక్తివంతమైన ఇంకా ఓపెన్-సోర్స్ రీజనింగ్ AI ని అందిస్తుంది, ఇది అక్కడ కొన్ని ఉత్తమ యాజమాన్య నమూనాలకు ప్రత్యర్థిగా ఉంటుంది, ప్రత్యేకించి సంక్లిష్టమైన, మెదడు-బెండింగ్ పనుల విషయానికి వస్తే. డెవలపర్లు చివరికి దానితో ఏమి నిర్మిస్తారో చూడటం ఉత్తేజకరమైనది.

(చిత్రం తుంగ్ లామ్)

ఇవి కూడా చూడండి: AI కార్యాచరణ ప్రణాళిక: యుఎస్ నాయకత్వం తప్పనిసరిగా ‘సవాలు చేయబడదు’

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్‌పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్‌పో.

టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్‌నార్లను అన్వేషించండి ఇక్కడ.

Source link

Useful _Links

EMEA CIOలు AI రోల్‌అవుట్‌లను ఎలా జంప్‌స్టార్ట్ చేయగలవు

GPT-5.5 అనేది OpenAI యొక్క అత్యంత సామర్థ్యం గల ఏజెంట్ AI మోడల్ – API ధర కంటే రెండింతలు

SDLC ఖర్చులను నియంత్రించడానికి IBM AI ప్లాట్‌ఫారమ్ బాబ్‌ను ప్రారంభించింది

ఎన్‌కోడర్‌ల పరిణామం: సాధారణ నమూనాల నుండి మల్టీమోడల్ AI వరకు

భౌతిక AI కోసం కకావో మొబిలిటీ వివరాలు లెవల్ 4 అటానమస్ డ్రైవింగ్ రోడ్‌మ్యాప్

ఆప్టికల్ ఇంటర్‌కనెక్ట్ అంటే ఏమిటి మరియు లైట్‌టెలిజెన్స్ యొక్క $10B అరంగేట్రం ఎందుకు AIకి ముఖ్యమని చెప్పింది

హానికరమైన వెబ్ పేజీలు AI ఏజెంట్లను విషపూరితం చేస్తున్నాయని Google హెచ్చరించింది

AI ఏజెంట్లకు ఇంటరాక్షన్ ఇన్‌ఫ్రాస్ట్రక్చర్ ఎందుకు అవసరం

మార్కెట్ ప్రవర్తనను అర్థం చేసుకోవడానికి AI మోడల్‌లు నిజ-సమయ క్రిప్టోకరెన్సీ డేటాను ఎలా ఉపయోగిస్తాయి

AI కోసం భిన్నమైన ఆలోచనతో బిలియన్-డాలర్ స్టార్టప్

అలీబాబా యొక్క కొత్త క్వెన్ రీజనింగ్ AI మోడల్ ఓపెన్ సోర్స్ రికార్డులను సెట్ చేస్తుంది

Leave a Reply Cancel reply

Useful Links

Leave a Reply Cancel reply

Related News

Useful _Links