కొత్త మోడల్ డిజైన్ అధిక ఎంటర్‌ప్రైజ్ AI ఖర్చులను పరిష్కరించగలదు

AI మోడళ్లను అమలు చేయడానికి చాలా ఖర్చుతో పోరాడుతున్న ఎంటర్‌ప్రైజ్ నాయకులు కొత్త ఆర్కిటెక్చర్ డిజైన్‌కు కృతజ్ఞతలు తెలుపుతారు.

ఉత్పాదక AI యొక్క సామర్థ్యాలు ఆకర్షణీయంగా ఉన్నప్పటికీ, శిక్షణ మరియు అనుమితి రెండింటికీ వారి అపారమైన గణన డిమాండ్లు నిషేధిత ఖర్చులు మరియు పెరుగుతున్న పర్యావరణ ఆందోళనలకు దారితీస్తాయి. ఈ అసమర్థత మధ్యలో టోకెన్-బై-టోకెన్‌తో వరుసగా వచనాన్ని ఉత్పత్తి చేసే ఆటోరిగ్రెసివ్ ప్రక్రియ యొక్క మోడల్‌ల “ఫండమెంటల్ అడ్డంకి” ఉంది.

నుండి విస్తారమైన డేటా స్ట్రీమ్‌లను ప్రాసెస్ చేసే ఎంటర్‌ప్రైజెస్ కోసం IoT నెట్‌వర్క్‌లు ఆర్థిక మార్కెట్లకు, ఈ పరిమితి దీర్ఘ-రూప విశ్లేషణను నెమ్మదిగా మరియు ఆర్థికంగా సవాలుగా చేస్తుంది. అయితే, నుండి ఒక కొత్త పరిశోధనా పత్రం టెన్సెంట్ AI మరియు సింగువా విశ్వవిద్యాలయం ప్రత్యామ్నాయాన్ని ప్రతిపాదిస్తుంది.

AI సామర్థ్యానికి కొత్త విధానం

పరిశోధన కంటిన్యూయస్ ఆటోరెగ్రెసివ్ లాంగ్వేజ్ మోడల్స్ (CALM)ని పరిచయం చేసింది. ఈ పద్ధతి వివిక్త టోకెన్ కంటే నిరంతర వెక్టర్‌ను అంచనా వేయడానికి ఉత్పత్తి ప్రక్రియను మళ్లీ ఇంజనీర్ చేస్తుంది.

అధిక-విశ్వసనీయ ఆటోఎన్‌కోడర్ “K టోకెన్‌ల భాగాన్ని ఒకే నిరంతర వెక్టర్‌గా కుదించు(లు)”, ఇది చాలా ఎక్కువ సెమాంటిక్ బ్యాండ్‌విడ్త్‌ను కలిగి ఉంటుంది.

“ది”, “పిల్లి”, “కూర్చుని” వంటి వాటిని మూడు దశల్లో ప్రాసెస్ చేయడానికి బదులుగా, మోడల్ వాటిని ఒకటిగా కుదించింది. ఈ డిజైన్ నేరుగా “ఉత్పత్తి దశల సంఖ్యను తగ్గిస్తుంది”, గణన లోడ్‌పై దాడి చేస్తుంది.

ప్రయోగాత్మక ఫలితాలు మెరుగైన పనితీరు-కంప్యూట్ ట్రేడ్-ఆఫ్‌ను ప్రదర్శిస్తాయి. ఒక CALM AI మోడల్ నాలుగు టోకెన్‌లను సమూహపరచడం వలన ఒక ఎంటర్‌ప్రైజ్ కోసం “బలమైన వివిక్త బేస్‌లైన్‌లతో పోల్చవచ్చు, కానీ గణనీయంగా తక్కువ గణన ఖర్చుతో” పనితీరును అందించింది.

ఉదాహరణకు, ఒక CALM మోడల్‌కు, సారూప్య సామర్థ్యం గల బేస్‌లైన్ ట్రాన్స్‌ఫార్మర్ కంటే 44 శాతం తక్కువ శిక్షణ FLOPలు మరియు 34 శాతం తక్కువ అనుమితి FLOPలు అవసరం. ఇది శిక్షణ యొక్క ప్రారంభ మూలధన వ్యయం మరియు అనుమితి యొక్క పునరావృత కార్యాచరణ వ్యయం రెండింటిపై పొదుపును సూచిస్తుంది.

నిరంతర డొమైన్ కోసం టూల్‌కిట్‌ను పునర్నిర్మించడం

పరిమిత, వివిక్త పదజాలం నుండి అనంతమైన, నిరంతర వెక్టార్ స్పేస్‌కి మారడం ప్రామాణిక LLM టూల్‌కిట్‌ను విచ్ఛిన్నం చేస్తుంది. కొత్త మోడల్‌ను ఆచరణీయంగా చేయడానికి పరిశోధకులు “సమగ్ర సంభావ్యత లేని ఫ్రేమ్‌వర్క్”ని అభివృద్ధి చేయాల్సి వచ్చింది.

శిక్షణ కోసం, మోడల్ ప్రామాణిక సాఫ్ట్‌మాక్స్ లేయర్ లేదా గరిష్ట సంభావ్యత అంచనాను ఉపయోగించదు. దీనిని పరిష్కరించడానికి, బృందం ఎనర్జీ ట్రాన్స్‌ఫార్మర్‌తో “సంభావ్యత-రహిత” లక్ష్యాన్ని ఉపయోగించింది, ఇది స్పష్టమైన సంభావ్యతలను గణించకుండా ఖచ్చితమైన అంచనాల కోసం మోడల్‌కు రివార్డ్ చేస్తుంది.

ఈ కొత్త శిక్షణా పద్ధతికి కొత్త మూల్యాంకన మెట్రిక్ కూడా అవసరం. పర్‌ప్లెక్సిటీ వంటి ప్రామాణిక బెంచ్‌మార్క్‌లు వర్తించవు ఎందుకంటే అవి మోడల్ ఇకపై గణించని అదే సంభావ్యతపై ఆధారపడతాయి.

బృందం BrierLMను ప్రతిపాదించింది, ఇది పూర్తిగా మోడల్ నమూనాల నుండి అంచనా వేయబడే Brier స్కోర్ ఆధారంగా ఒక నవల మెట్రిక్. ధృవీకరణ BrierLMని నమ్మదగిన ప్రత్యామ్నాయంగా నిర్ధారించింది, సాంప్రదాయ నష్ట కొలమానాలతో “స్పియర్‌మ్యాన్ ర్యాంక్ సహసంబంధం -0.991″ని చూపుతుంది.

చివరగా, ఫ్రేమ్‌వర్క్ నియంత్రిత ఉత్పత్తిని పునరుద్ధరిస్తుంది, ఇది ఎంటర్‌ప్రైజ్ ఉపయోగం కోసం కీలకమైన లక్షణం. సంభావ్యత పంపిణీ లేకుండా ప్రామాణిక ఉష్ణోగ్రత నమూనా అసాధ్యం. అవుట్‌పుట్ ఖచ్చితత్వం మరియు వైవిధ్యం మధ్య ట్రేడ్-ఆఫ్‌ను నిర్వహించడానికి, ప్రాక్టికల్ బ్యాచ్ ఉజ్జాయింపు పద్ధతితో సహా కొత్త “సంభావ్యత లేని నమూనా అల్గోరిథం”ను పేపర్ పరిచయం చేస్తుంది.

ఎంటర్‌ప్రైజ్ AI ఖర్చులను తగ్గించడం

ఉత్పాదక AI అనేది ఎప్పుడూ పెద్ద పారామితి గణనల ద్వారా మాత్రమే నిర్వచించబడని, నిర్మాణ సామర్థ్యం ద్వారా భవిష్యత్తు గురించి ఒక సంగ్రహావలోకనాన్ని అందిస్తుంది.

స్కేలింగ్ మోడల్స్ యొక్క ప్రస్తుత మార్గం తగ్గుతున్న రాబడి మరియు పెరుగుతున్న ఖర్చుల గోడను తాకుతోంది. CALM ఫ్రేమ్‌వర్క్ “LLM స్కేలింగ్ కోసం కొత్త డిజైన్ యాక్సిస్‌ను ఏర్పాటు చేస్తుంది: ప్రతి ఉత్పాదక దశ యొక్క సెమాంటిక్ బ్యాండ్‌విడ్త్‌ను పెంచడం”.

ఇది పరిశోధనా ఫ్రేమ్‌వర్క్ మరియు ఆఫ్-ది-షెల్ఫ్ ఉత్పత్తి కానప్పటికీ, ఇది అల్ట్రా-ఎఫెక్టివ్ లాంగ్వేజ్ మోడల్‌ల వైపు శక్తివంతమైన మరియు స్కేలబుల్ మార్గాన్ని సూచిస్తుంది. విక్రేత రోడ్‌మ్యాప్‌లను మూల్యాంకనం చేస్తున్నప్పుడు, టెక్ లీడర్‌లు మోడల్ పరిమాణానికి మించి చూడాలి మరియు నిర్మాణ సామర్థ్యం గురించి అడగడం ప్రారంభించాలి.

ఉత్పత్తి చేయబడిన ప్రతి టోకెన్‌కు FLOPలను తగ్గించే సామర్థ్యం నిర్వచించే పోటీ ప్రయోజనంగా మారుతుంది, డేటా సెంటర్ నుండి డేటా-హెవీ ఎడ్జ్ అప్లికేషన్‌ల వరకు ఖర్చులను తగ్గించడానికి AIని మరింత ఆర్థికంగా మరియు స్థిరంగా ఎంటర్‌ప్రైజ్ అంతటా అమలు చేయడానికి వీలు కల్పిస్తుంది.

ఇవి కూడా చూడండి: లోపభూయిష్ట AI బెంచ్‌మార్క్‌లు ఎంటర్‌ప్రైజ్ బడ్జెట్‌లను ప్రమాదంలో పడేస్తాయి

TechEx ఈవెంట్‌ల ద్వారా AI & బిగ్ డేటా ఎక్స్‌పో కోసం బ్యానర్.

పరిశ్రమ ప్రముఖుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & బిగ్ డేటా ఎక్స్‌పో ఆమ్‌స్టర్‌డామ్, కాలిఫోర్నియా మరియు లండన్‌లో జరుగుతున్నాయి. సమగ్ర కార్యక్రమం ఇందులో భాగమే టెక్ఎక్స్ మరియు సహా ఇతర ప్రముఖ సాంకేతిక ఈవెంట్‌లతో కలిసి ఉంది సైబర్ సెక్యూరిటీ ఎక్స్‌పోక్లిక్ చేయండి ఇక్కడ మరింత సమాచారం కోసం.

AI వార్తలు ఆధారితం టెక్ఫోర్జ్ మీడియా. రాబోయే ఇతర ఎంటర్‌ప్రైజ్ టెక్నాలజీ ఈవెంట్‌లు మరియు వెబ్‌నార్‌లను అన్వేషించండి ఇక్కడ.

Source link

Useful _Links

AI యొక్క పేలవమైన అమలు శ్రామిక శక్తి తగ్గింపు వెనుక ఉండవచ్చు

ఫైనాన్స్ వర్క్‌ఫ్లోల కోసం ఏజెంట్ AIని అప్‌గ్రేడ్ చేస్తోంది

గోల్డ్‌మన్ సాచ్స్ మరియు డ్యుయిష్ బ్యాంక్ ట్రేడింగ్‌లో ఏజెంట్ AIని పరీక్షించాయి

ASML యొక్క అధిక-NA EUV సాధనాలు తదుపరి తరం AI చిప్‌ల కోసం రన్‌వేని క్లియర్ చేస్తాయి

రియల్ టైమ్ 5G నెట్‌వర్క్ స్లైసింగ్ కోసం Nokia మరియు AWS పైలట్ AI ఆటోమేషన్

క్లాడ్ ‘పారిశ్రామిక స్థాయి’ AI మోడల్ స్వేదనం ఎదుర్కొంటుంది

డిస్‌కనెక్ట్ చేయబడిన క్లౌడ్‌లు AI డేటా గవర్నెన్స్‌ని ఎలా మెరుగుపరుస్తాయి

తక్షణ వ్యాపారం ROI కోసం ఏజెంట్ ఫైనాన్స్ AIని అమలు చేస్తోంది

Basware నుండి Agentic AI ప్రారంభం మాత్రమే

మీ బ్యాంక్‌ను నడుపుతున్న 60 ఏళ్ల నాటి కోడ్ దాని AI సరిపోలికను అందుకుంది

కొత్త మోడల్ డిజైన్ అధిక ఎంటర్‌ప్రైజ్ AI ఖర్చులను పరిష్కరించగలదు

AI సామర్థ్యానికి కొత్త విధానం

నిరంతర డొమైన్ కోసం టూల్‌కిట్‌ను పునర్నిర్మించడం

ఎంటర్‌ప్రైజ్ AI ఖర్చులను తగ్గించడం

Leave a Reply Cancel reply

Useful Links

AI సామర్థ్యానికి కొత్త విధానం

నిరంతర డొమైన్ కోసం టూల్‌కిట్‌ను పునర్నిర్మించడం

ఎంటర్‌ప్రైజ్ AI ఖర్చులను తగ్గించడం

Leave a Reply Cancel reply

Related News

Useful _Links