Hot News

Qwen 2.5-max కొన్ని బెంచ్‌మార్క్‌లలో డీప్‌సీక్ V3 ను అధిగమిస్తుంది

డీప్సీక్‌కు అలీబాబా యొక్క ప్రతిస్పందన Qwen 2.5-max, ఇది సంస్థ యొక్క తాజా మిశ్రమం-ఆఫ్-ఎక్స్‌పర్ట్స్ (MOE) పెద్ద-స్థాయి మోడల్.

క్వెన్ 2.5-మాక్స్ 20 ట్రిలియన్ టోకెన్లకు పైగా ప్రీట్రైనింగ్ కలిగి ఉంది మరియు పర్యవేక్షించబడిన ఫైన్-ట్యూనింగ్ (SFT) మరియు మానవ అభిప్రాయం (RLHF) నుండి ఉపబల అభ్యాసం వంటి అత్యాధునిక పద్ధతుల ద్వారా చక్కటి ట్యూనింగ్ కలిగి ఉంది.

API ఇప్పుడు ద్వారా అందుబాటులో ఉంది అలీబాబా క్లౌడ్ మరియు క్వెన్ చాట్ ద్వారా అన్వేషణ కోసం ప్రాప్యత చేయగల మోడల్, చైనీస్ టెక్ దిగ్గజం డెవలపర్లు మరియు పరిశోధకులను దాని పురోగతులను ప్రత్యక్షంగా చూడటానికి ఆహ్వానిస్తోంది.

తోటివారిని అధిగమించడం

వివిధ రకాల బెంచ్‌మార్క్‌లపై ప్రముఖ AI మోడళ్లకు వ్యతిరేకంగా QWEN 2.5-MAX యొక్క పనితీరును పోల్చినప్పుడు, ఫలితాలు ఆశాజనకంగా ఉన్నాయి.

మూల్యాంకనాలలో కళాశాల-స్థాయి సమస్య పరిష్కారం కోసం MMLU-PRO, కోడింగ్ నైపుణ్యం కోసం లైవ్‌కోడ్‌బెంచ్, మొత్తం సామర్థ్యాల కోసం లైవ్‌బెంచ్ మరియు మానవ ప్రాధాన్యతలకు వ్యతిరేకంగా నమూనాలను అంచనా వేయడానికి అరేనా-హార్డ్ వంటి ప్రసిద్ధ కొలమానాలు ఉన్నాయి.

అలీబాబా ప్రకారం, “క్వెన్ 2.5-మాక్స్ అరేనా-హార్డ్, లైవ్‌బెంచ్, లైవ్‌కోడ్‌బెంచ్ మరియు GPQA- డైమండ్ వంటి బెంచ్‌మార్క్‌లలో డీప్‌సీక్ వి 3 ను అధిగమిస్తుంది, అదే సమయంలో MMLU-PRO తో సహా ఇతర మదింపులలో పోటీ ఫలితాలను కూడా ప్రదర్శిస్తుంది.”

AI బెంచ్ మార్క్ అలీబాబా Qwen 2.5-max ను డీప్సీక్ V3 వంటి ఇతర కృత్రిమ మేధస్సు నమూనాలతో పోల్చడం.
(క్రెడిట్: అలీబాబా)

ఇన్‌స్ట్రక్ట్ మోడల్-చాట్ మరియు కోడింగ్ వంటి దిగువ పనుల కోసం రూపొందించబడింది-GPT-4O, CLAUDE-3.5-SONNET మరియు డీప్సీక్ V3 వంటి ప్రముఖ మోడళ్లతో నేరుగా పోటీపడుతుంది. వీటిలో, Qwen 2.5-max అనేక కీలక ప్రాంతాలలో ప్రత్యర్థులను అధిగమించగలిగింది.

బేస్ మోడళ్ల పోలికలు కూడా మంచి ఫలితాలను ఇచ్చాయి. యాక్సెస్ పరిమితుల కారణంగా GPT-4O మరియు CLAUDE-3.5-SONNET వంటి యాజమాన్య నమూనాలు అందుబాటులో లేనప్పటికీ, QWEN 2.5-MAX డీప్సీక్ V3, LLAMA-3.1-405B (అతిపెద్ద ఓపెన్-బరువు దట్టమైన మోడల్ వంటి ప్రముఖ పబ్లిక్ ఎంపికలకు వ్యతిరేకంగా అంచనా వేయబడింది. ), మరియు Qwen2.5-72b. మళ్ళీ, అలీబాబా యొక్క క్రొత్తవారు బోర్డు అంతటా అసాధారణమైన పనితీరును ప్రదర్శించారు.

“మా బేస్ మోడల్స్ చాలా బెంచ్‌మార్క్‌లలో గణనీయమైన ప్రయోజనాలను ప్రదర్శించాయి, మరియు ట్రైనింగ్ అనంతర పద్ధతుల్లో పురోగతులు Qwen 2.5-max యొక్క తదుపరి సంస్కరణను కొత్త ఎత్తులకు పెంచుతాయని మేము ఆశాజనకంగా ఉన్నాము.”

Qwen 2.5-max ప్రాప్యత చేయగలిగేలా చేస్తుంది

మోడల్‌ను గ్లోబల్ కమ్యూనిటీకి మరింత ప్రాప్యత చేయడానికి, అలీబాబా దాని క్వెన్ చాట్ ప్లాట్‌ఫామ్‌తో Qwen 2.5-max ను సమగ్రపరిచింది, ఇక్కడ వినియోగదారులు వివిధ సామర్థ్యాలలో మోడల్‌తో నేరుగా సంభాషించవచ్చు-దాని శోధన సామర్థ్యాలను అన్వేషించడం లేదా సంక్లిష్ట ప్రశ్నల గురించి దాని అవగాహనను పరీక్షించినా.

డెవలపర్‌ల కోసం, QWEN 2.5-MAX API ఇప్పుడు అలీబాబా క్లౌడ్ ద్వారా “QWEN-MAX-201025-01-25” అనే మోడల్ పేరుతో లభిస్తుంది. ఆసక్తిగల వినియోగదారులు అలీబాబా క్లౌడ్ ఖాతాను నమోదు చేయడం, మోడల్ స్టూడియో సేవను సక్రియం చేయడం మరియు API కీని ఉత్పత్తి చేయడం ద్వారా ప్రారంభించవచ్చు.

API ఓపెనాయ్ యొక్క పర్యావరణ వ్యవస్థతో కూడా అనుకూలంగా ఉంటుంది, ఇది ఇప్పటికే ఉన్న ప్రాజెక్టులు మరియు వర్క్‌ఫ్లోలకు అనుసంధానించబడుతుంది. ఈ అనుకూలత మోడల్ యొక్క సామర్థ్యాలతో వారి అనువర్తనాలను పరీక్షించడానికి ఆసక్తి ఉన్నవారికి అవరోధాన్ని తగ్గిస్తుంది.

అలీబాబా Qwen 2.5-max తో బలమైన ఉద్దేశం చేసింది. AI మోడళ్లను స్కేలింగ్ చేయడానికి సంస్థ కొనసాగుతున్న నిబద్ధత పనితీరు బెంచ్‌మార్క్‌లను మెరుగుపరచడం మాత్రమే కాదు, ఈ వ్యవస్థల యొక్క ప్రాథమిక ఆలోచన మరియు తార్కిక సామర్థ్యాలను పెంచడం గురించి కూడా.

“డేటా మరియు మోడల్ పరిమాణం యొక్క స్కేలింగ్ మోడల్ ఇంటెలిజెన్స్‌లో పురోగతిని ప్రదర్శించడమే కాక, మార్గదర్శక పరిశోధనపై మా అచంచలమైన నిబద్ధతను ప్రతిబింబిస్తుంది” అని అలీబాబా పేర్కొంది.

ముందుకు చూస్తే, ఉపబల అభ్యాసం యొక్క సరిహద్దులను మరింత అధునాతన తార్కిక నైపుణ్యాలను పెంపొందించడానికి బృందం లక్ష్యంగా పెట్టుకుంది. ఇది వారి మోడళ్లను సరిపోల్చడానికి మాత్రమే కాకుండా క్లిష్టమైన సమస్యలను పరిష్కరించడంలో మానవ తెలివితేటలను అధిగమిస్తుందని వారు చెప్పారు.

పరిశ్రమకు చిక్కులు లోతుగా ఉండవచ్చు. స్కేలింగ్ పద్ధతులు మెరుగుపడుతున్నప్పుడు మరియు క్వెన్ నమూనాలు కొత్త మైదానాన్ని విచ్ఛిన్నం చేస్తున్నప్పుడు, ఇటీవలి వారాల్లో మేము చూసిన ప్రపంచవ్యాప్తంగా AI- నడిచే రంగాలలో మరింత అలలు చూసే అవకాశం ఉంది.

(ఫోటో మైకో అమోరిమ్)

ఇవి కూడా చూడండి: చాట్‌గ్ప్ట్ గోవ్ యుఎస్ ప్రభుత్వ సంస్థలను ఆధునీకరించడం లక్ష్యంగా పెట్టుకుంది

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్‌పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్‌పో.

టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్‌నార్లను అన్వేషించండి ఇక్కడ.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Top