Hot News

Baidu ERNIE మల్టీమోడల్ AI బెంచ్‌మార్క్‌లలో GPT మరియు జెమినిని అధిగమించింది

Baidu యొక్క తాజా ERNIE మోడల్, ఒక సూపర్-ఎఫెక్టివ్ మల్టీమోడల్ AI, GPT మరియు మిధునరాశి కీలకమైన బెంచ్‌మార్క్‌లు మరియు లక్ష్యాలపై ఎంటర్‌ప్రైజ్ డేటా తరచుగా టెక్స్ట్-ఫోకస్డ్ మోడల్‌లచే విస్మరించబడుతుంది.

అనేక వ్యాపారాల కోసం, ఇంజనీరింగ్ స్కీమాటిక్స్, ఫ్యాక్టరీ-ఫ్లోర్ వీడియో ఫీడ్‌లు, మెడికల్ స్కాన్‌లు మరియు లాజిస్టిక్స్ డ్యాష్‌బోర్డ్‌లలో విలువైన అంతర్దృష్టులు లాక్ చేయబడ్డాయి. Baidu యొక్క కొత్త మోడల్, ERNIE-4.5-VL-28B-A3B-థింకింగ్, ఈ ఖాళీని పూరించడానికి రూపొందించబడింది.

ఎంటర్‌ప్రైజ్ ఆర్కిటెక్ట్‌లకు ఆసక్తికరమైన విషయం ఏమిటంటే దాని మల్టీమోడల్ సామర్ధ్యం మాత్రమే కాదు, దాని ఆర్కిటెక్చర్. ఇది “తేలికపాటి” మోడల్‌గా వర్ణించబడింది, ఆపరేషన్ సమయంలో కేవలం మూడు బిలియన్ పారామితులను మాత్రమే యాక్టివేట్ చేస్తుంది. ఈ విధానం AI- స్కేలింగ్ ప్రాజెక్ట్‌లను తరచుగా నిలిపివేసే అధిక అనుమితి ఖర్చులను లక్ష్యంగా చేసుకుంటుంది. Baidu దత్తత తీసుకోవడానికి ఒక మార్గంగా సమర్థతపై పందెం వేస్తోంది, వ్యవస్థను “మల్టీమోడల్ ఏజెంట్ల” కోసం ఒక పునాదిగా శిక్షణ ఇస్తుంది, అది కేవలం గ్రహించడం మాత్రమే కాదు.

AI బెంచ్‌మార్క్‌లచే సపోర్ట్ చేయబడిన సంక్లిష్ట దృశ్య డేటా విశ్లేషణ సామర్థ్యాలు

Baidu యొక్క మల్టీమోడల్ ERNIE AI మోడల్ దట్టమైన, నాన్-టెక్స్ట్ డేటాను హ్యాండిల్ చేయడంలో అత్యుత్తమంగా ఉంది. ఉదాహరణకు, లాజిస్టిక్స్ లేదా రిటైల్‌లో రిసోర్స్-షెడ్యూలింగ్ సవాళ్లను ప్రతిబింబించే టాస్క్, సరైన సందర్శన గంటలను కనుగొనడానికి ఇది “పీక్ టైమ్ రిమైండర్” చార్ట్‌ను అన్వయించగలదు.

ERNIE 4.5 సాంకేతిక డొమైన్‌లలో ఓం మరియు కిర్చోఫ్ చట్టాలను వర్తింపజేయడం ద్వారా వంతెన సర్క్యూట్ రేఖాచిత్రాన్ని పరిష్కరించడం వంటి సామర్థ్యాన్ని కూడా చూపుతుంది. R&D మరియు ఇంజనీరింగ్ ఆయుధాల కోసం, భవిష్యత్ సహాయకుడు డిజైన్‌లను ధృవీకరించవచ్చు లేదా కొత్త నియామకాలకు సంక్లిష్టమైన స్కీమాటిక్‌లను వివరించవచ్చు.

ఈ సామర్థ్యానికి Baidu యొక్క బెంచ్‌మార్క్‌లు మద్దతు ఇస్తున్నాయి, ఇది ERNIE-4.5-VL-28B-A3B-థింకింగ్ GPT-5-High మరియు Gemini 2.5 Pro వంటి కొన్ని కీలక పరీక్షల్లో పోటీదారుల కంటే మెరుగైన పనితీరును చూపుతుంది:

  • MathVista: ERNIE (82.5) vs జెమిని (82.3) మరియు GPT (81.3)
  • ChartQA: ERNIE (87.1) vs జెమిని (76.3) మరియు GPT (78.2)
  • VLMలు అంధులు: ERNIE (77.3) vs జెమిని (76.5) మరియు GPT (69.6)

AI బెంచ్‌మార్క్‌లు గైడ్‌ను అందిస్తాయి కానీ లోపభూయిష్టంగా ఉండవచ్చని గమనించాలి. మిషన్-క్రిటికల్ అప్లికేషన్‌ల కోసం ఏదైనా AI మోడల్‌ని అమలు చేయడానికి ముందు మీ అవసరాల కోసం ఎల్లప్పుడూ అంతర్గత పరీక్షలను నిర్వహించండి.

Baidu దాని తాజా ERNIE AI మోడల్‌తో అవగాహన నుండి ఆటోమేషన్‌కు మారుతుంది

ఎంటర్‌ప్రైజ్ AIకి ఉన్న ప్రాథమిక అడ్డంకి అవగాహన (“ఇది ఏమిటి?”) నుండి ఆటోమేషన్‌కు (“ఇప్పుడు ఏమిటి?”) మారడం. ERNIE 4.5 విజువల్ గ్రౌండింగ్‌ని టూల్ వాడకంతో ఏకీకృతం చేయడం ద్వారా దీనిని పరిష్కరించాలని పేర్కొంది.

చిత్రంలో సూట్లు ధరించిన వ్యక్తులందరినీ కనుగొని, JSON ఫార్మాట్‌లో వారి కోఆర్డినేట్‌లను తిరిగి ఇవ్వమని మల్టీమోడల్ AIని అడగడం. మోడల్ నిర్మాణాత్మక డేటాను ఉత్పత్తి చేస్తుంది, దృశ్య తనిఖీ కోసం ప్రొడక్షన్ లైన్‌కు లేదా భద్రతా సమ్మతి కోసం సిస్టమ్ ఆడిటింగ్ సైట్ ఇమేజ్‌లకు సులభంగా బదిలీ చేయగల ఫంక్షన్.

మోడల్ బాహ్య సాధనాలను కూడా నిర్వహిస్తుంది మరియు చిన్న వచనాన్ని చదవడానికి ఫోటోగ్రాఫ్‌పై స్వయంప్రతిపత్తితో జూమ్ చేయవచ్చు. ఇది తెలియని వస్తువును ఎదుర్కొంటే, దానిని గుర్తించడానికి చిత్ర శోధనను ప్రారంభించవచ్చు. ఇది AI యొక్క తక్కువ నిష్క్రియ రూపాన్ని సూచిస్తుంది, ఇది డేటా సెంటర్ లోపాన్ని ఫ్లాగ్ చేయడానికి మాత్రమే కాకుండా, కోడ్‌పై జూమ్ ఇన్ చేయడానికి, అంతర్గత నాలెడ్జ్ బేస్‌ను శోధించడానికి మరియు పరిష్కారాన్ని సూచించడానికి ఏజెంట్‌కు శక్తినిస్తుంది.

మల్టీమోడల్ AIతో వ్యాపార మేధస్సును అన్‌లాక్ చేస్తోంది

Baidu యొక్క తాజా ERNIE AI మోడల్ శిక్షణా సెషన్‌లు మరియు సమావేశాల నుండి సెక్యూరిటీ ఫుటేజ్ వరకు కార్పొరేట్ వీడియో ఆర్కైవ్‌లను కూడా లక్ష్యంగా చేసుకుంటుంది. ఇది అన్ని ఆన్-స్క్రీన్ ఉపశీర్షికలను సంగ్రహించగలదు మరియు వాటిని వాటి ఖచ్చితమైన టైమ్‌స్టాంప్‌లకు మ్యాప్ చేయగలదు.

ఇది దృశ్య సూచనలను విశ్లేషించడం ద్వారా నిర్దిష్ట దృశ్యాలను (“వంతెనపై చిత్రీకరించినవి”) కనుగొనడం ద్వారా తాత్కాలిక అవగాహనను కూడా ప్రదర్శిస్తుంది. స్పష్టమైన ముగింపు లక్ష్యం ఏమిటంటే, విస్తారమైన వీడియో లైబ్రరీలను శోధించగలిగేలా చేయడం, ఒక ఉద్యోగి రెండు గంటల వెబ్‌నార్‌లో నిర్దిష్ట అంశాన్ని చర్చించిన ఖచ్చితమైన క్షణాన్ని కనుగొనడానికి వీలు కల్పిస్తుంది.

Baidu ట్రాన్స్‌ఫార్మర్లు, vLLM మరియు FastDeployతో సహా అనేక మార్గాల కోసం విస్తరణ మార్గదర్శకత్వాన్ని అందిస్తుంది. అయితే, హార్డ్‌వేర్ అవసరాలు ప్రధాన అవరోధంగా ఉన్నాయి. సింగిల్ కార్డ్ డిప్లాయ్‌మెంట్‌కు 80GB GPU మెమరీ అవసరం. ఇది సాధారణ ప్రయోగం కోసం సాధనం కాదు, కానీ ఇప్పటికే ఉన్న మరియు అధిక-పనితీరు గల AI ఇన్‌ఫ్రాస్ట్రక్చర్ ఉన్న సంస్థలకు.

హార్డ్‌వేర్ ఉన్నవారి కోసం, Baidu యొక్క ERNIEKit టూల్‌కిట్ యాజమాన్య డేటాపై ఫైన్-ట్యూనింగ్‌ను అనుమతిస్తుంది; అధిక-విలువ వినియోగ సందర్భాలలో చాలా అవసరం. Baidu దాని తాజా ERNIE AI మోడల్‌ను Apache 2.0 లైసెన్స్‌తో అందిస్తోంది, ఇది వాణిజ్య వినియోగాన్ని అనుమతించింది, ఇది దత్తత తీసుకోవడానికి అవసరం.

మార్కెట్ చివరకు మల్టీమోడల్ AI వైపు కదులుతోంది, అది నిర్దిష్ట వ్యాపార సందర్భంలో చూడగలదు, చదవగలదు మరియు పని చేయగలదు మరియు బెంచ్‌మార్క్‌లు ఆకట్టుకునే సామర్థ్యంతో అలా చేస్తున్నాయని సూచిస్తున్నాయి. మీ స్వంత ఆపరేషన్‌లో అధిక-విలువైన విజువల్ రీజనింగ్ ఉద్యోగాలను గుర్తించడం మరియు వాటిని గణనీయమైన హార్డ్‌వేర్ మరియు గవర్నెన్స్ ఖర్చులతో పోల్చడం తక్షణ పని.

ఇవి కూడా చూడండి: విజ్: గ్లోబల్ AI రేస్ మధ్య భద్రతా లోపాలు ఉద్భవించాయి

TechEx ఈవెంట్‌ల ద్వారా AI & బిగ్ డేటా ఎక్స్‌పో కోసం బ్యానర్.

పరిశ్రమ ప్రముఖుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & బిగ్ డేటా ఎక్స్‌పో ఆమ్‌స్టర్‌డామ్, కాలిఫోర్నియా మరియు లండన్‌లో జరుగుతున్నాయి. సమగ్ర కార్యక్రమం ఇందులో భాగమే టెక్ఎక్స్ మరియు సహా ఇతర ప్రముఖ సాంకేతిక ఈవెంట్‌లతో కలిసి ఉంది సైబర్ సెక్యూరిటీ ఎక్స్‌పో. క్లిక్ చేయండి ఇక్కడ మరింత సమాచారం కోసం.

AI వార్తలు ఆధారితం టెక్ఫోర్జ్ మీడియా. రాబోయే ఇతర ఎంటర్‌ప్రైజ్ టెక్నాలజీ ఈవెంట్‌లు మరియు వెబ్‌నార్‌లను అన్వేషించండి ఇక్కడ.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Top