ANT గ్రూప్ AI మోడళ్లకు శిక్షణ ఇవ్వడానికి మరియు ఖర్చులను తగ్గించడానికి దేశీయ చిప్‌లను ఉపయోగిస్తుంది

ఈ విషయం తెలిసిన వ్యక్తుల ప్రకారం, ఖర్చులను తగ్గించడానికి మరియు పరిమితం చేయబడిన యుఎస్ టెక్నాలజీపై ఆధారపడటాన్ని తగ్గించడానికి ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ మోడళ్లకు శిక్షణ ఇవ్వడానికి యాంట్ గ్రూప్ చైనీస్-మేడ్ సెమీకండక్టర్లపై ఆధారపడుతోంది.

అలీబాబా యాజమాన్యంలోని సంస్థ దేశీయ సరఫరాదారుల నుండి చిప్‌లను ఉపయోగించింది, వీటిలో దాని తల్లిదండ్రులు, అలీబాబా మరియు హువావే టెక్నాలజీలతో ముడిపడి ఉన్నవి నిపుణుల మిశ్రమాన్ని (MOE) పద్ధతిని ఉపయోగించి పెద్ద భాషా నమూనాలకు శిక్షణ ఇవ్వడానికి ఉన్నాయి. ఫలితాలు ఎన్విడియా యొక్క H800 చిప్‌లతో ఉత్పత్తి చేయబడిన వాటితో పోల్చితే, మూలాలు పేర్కొన్నాయి. ANT దాని AI అభివృద్ధికి NVIDIA చిప్‌లను ఉపయోగిస్తూనే ఉండగా, ఒక వర్గాలు సంస్థ తన తాజా మోడళ్ల కోసం AMD మరియు చైనీస్ చిప్ తయారీదారుల నుండి ప్రత్యామ్నాయాల వైపు ఎక్కువగా మారుతోందని తెలిపింది.

ఈ అభివృద్ధి చైనీస్ మరియు యుఎస్ టెక్ సంస్థల మధ్య పెరుగుతున్న AI రేసులో యాంట్ యొక్క లోతైన ప్రమేయాన్ని సూచిస్తుంది, ప్రత్యేకించి కంపెనీలు మోడళ్లకు శిక్షణ ఇవ్వడానికి ఖర్చుతో కూడుకున్న మార్గాల కోసం చూస్తాయి. దేశీయ హార్డ్‌వేర్‌తో చేసిన ప్రయోగం ఎన్విడియా యొక్క H800 వంటి హై-ఎండ్ చిప్‌లకు ప్రాప్యతను నిరోధించే ఎగుమతి పరిమితుల చుట్టూ పనిచేయడానికి చైనీస్ సంస్థలలో విస్తృత ప్రయత్నాన్ని ప్రతిబింబిస్తుంది, ఇది చాలా అభివృద్ధి చెందినది కానప్పటికీ, చైనీస్ సంస్థలకు అందుబాటులో ఉన్న శక్తివంతమైన GPU లలో ఒకటి.

యాంట్ దాని పనిని వివరించే ఒక పరిశోధనా పత్రాన్ని ప్రచురించింది, దాని నమూనాలు, కొన్ని పరీక్షలలో, మెటా అభివృద్ధి చేసిన వాటి కంటే మెరుగ్గా పనిచేస్తున్నాయని పేర్కొంది. బ్లూమ్‌బెర్గ్ న్యూస్ఇది మొదట్లో ఈ విషయాన్ని నివేదించింది, సంస్థ ఫలితాలను స్వతంత్రంగా ధృవీకరించలేదు. నమూనాలు దావా వేసినట్లుగా పనిచేస్తే, ANT యొక్క ప్రయత్నాలు AI దరఖాస్తులను నడిపే ఖర్చును తగ్గించడానికి మరియు విదేశీ హార్డ్‌వేర్‌పై ఆధారపడటాన్ని తగ్గించడానికి చైనా చేసిన ప్రయత్నంలో ఒక అడుగు ముందుకు వేయవచ్చు.

MOE నమూనాలు ప్రత్యేక భాగాలచే నిర్వహించబడే చిన్న డేటా సెట్‌లుగా పనులను విభజిస్తాయి మరియు AI పరిశోధకులు మరియు డేటా శాస్త్రవేత్తలలో దృష్టిని ఆకర్షించాయి. ఈ సాంకేతికతను గూగుల్ మరియు హాంగ్జౌ-ఆధారిత స్టార్టప్, డీప్సీక్ ఉపయోగించాయి. MOE కాన్సెప్ట్ నిపుణుల బృందాన్ని కలిగి ఉండటానికి సమానంగా ఉంటుంది, మోడళ్లను ఉత్పత్తి చేసే ప్రక్రియను మరింత సమర్థవంతంగా చేయడానికి ఒక పని యొక్క ప్రతి నిర్వహించడం. ANT తన హార్డ్‌వేర్ మూలాలకు సంబంధించి దాని పనిపై వ్యాఖ్యానించడానికి నిరాకరించింది.

శిక్షణ MOE నమూనాలు అధిక-పనితీరు గల GPU లపై ఆధారపడి ఉంటాయి, ఇవి చిన్న కంపెనీలకు సంపాదించడానికి లేదా ఉపయోగించడానికి చాలా ఖరీదైనవి. చీమల పరిశోధన ఆ ఖర్చు అవరోధాన్ని తగ్గించడంపై దృష్టి పెట్టింది. కాగితం యొక్క శీర్షిక స్పష్టమైన లక్ష్యంతో ప్రత్యయం చేయబడింది: స్కేలింగ్ మోడల్స్ “ప్రీమియం GPU లు లేకుండా.” (మా కొటేషన్ మార్కులు)

ANT తీసుకున్న దిశ మరియు శిక్షణ ఖర్చులను తగ్గించడానికి MOE వాడకం NVIDIA యొక్క విధానానికి విరుద్ధంగా. డీప్సీక్ యొక్క R1 వంటి మరింత సమర్థవంతమైన నమూనాలను ప్రవేశపెట్టడంతో కూడా, కంప్యూటింగ్ విద్యుత్ కోసం డిమాండ్ పెరుగుతూనే ఉంటుందని CEO ఆఫీసర్ జెన్సన్ హువాంగ్ చెప్పారు. అతని అభిప్రాయం ఏమిటంటే, కంపెనీలు చౌకైన ప్రత్యామ్నాయాలతో ఖర్చులను తగ్గించే లక్ష్యంతో కాకుండా, ఆదాయ వృద్ధిని పెంచడానికి మరింత శక్తివంతమైన చిప్‌లను కోరుకుంటాయి. ఎన్విడియా యొక్క వ్యూహం GPU లను ఎక్కువ కోర్లు, ట్రాన్సిస్టర్లు మరియు జ్ఞాపకశక్తితో నిర్మించడంపై దృష్టి పెట్టింది.

చీమల సమూహ పేపర్ ప్రకారం, ఒక ట్రిలియన్ టోకెన్లకు శిక్షణ ఇవ్వడం-డేటా AI మోడల్స్ నేర్చుకోవడానికి ఉపయోగించే ప్రాథమిక యూనిట్లు-సాంప్రదాయిక అధిక-పనితీరు హార్డ్‌వేర్‌ను ఉపయోగించి 6.35 మిలియన్ యువాన్ల (సుమారు 80 880,000) ఖర్చు అవుతుంది. సంస్థ యొక్క ఆప్టిమైజ్ చేసిన శిక్షణా పద్ధతి తక్కువ-స్పెసిఫికేషన్ చిప్‌లను ఉపయోగించడం ద్వారా ఆ ఖర్చును సుమారు 5.1 మిలియన్ యువాన్లకు తగ్గించింది.

ఈ విధంగా ఉత్పత్తి చేయబడిన దాని నమూనాలను-లింగ్-ప్లస్ మరియు లింగ్-లైట్-పారిశ్రామిక AI ఆరోగ్య సంరక్షణ మరియు ఫైనాన్స్ వంటి కేసులను ఉపయోగించుకోవాలని యాంట్ చెప్పారు. ఈ సంవత్సరం ప్రారంభంలో, ఆరోగ్య సంరక్షణలో AI- ఆధారిత పరిష్కారాలను అమలు చేయాలన్న ANT యొక్క ఆశయాన్ని మరింతగా మార్చడానికి కంపెనీ చైనీస్ ఆన్‌లైన్ మెడికల్ ప్లాట్‌ఫామ్ HAODF.com ను కొనుగోలు చేసింది. ఇది ఇతర AI సేవలను కూడా నిర్వహిస్తుంది, వీటిలో జిక్సియాబావో అని పిలువబడే వర్చువల్ అసిస్టెంట్ అనువర్తనం మరియు మాక్సియాకాయ్ అని పిలువబడే ఆర్థిక సలహా వేదికతో సహా.

“ప్రపంచంలోని ఉత్తమమైన వాటిని ఓడించటానికి మీరు ఒక పాయింట్ యొక్క పాయింట్ కనుగొంటే కుంగ్ ఫూ మాస్టర్, మీరు వారిని ఓడించారని మీరు ఇప్పటికీ చెప్పవచ్చు, అందుకే వాస్తవ ప్రపంచ అనువర్తనం ముఖ్యమైనది ”అని బీజింగ్ ఆధారిత AI సంస్థ షెంగ్‌షాంగ్ టెక్ యొక్క చీఫ్ టెక్నాలజీ ఆఫీసర్ రాబిన్ యు అన్నారు.

చీమ దాని మోడళ్లను ఓపెన్ సోర్స్ చేసింది. లింగ్-లైట్ 16.8 బిలియన్ పారామితులను కలిగి ఉంది-మోడల్ ఎలా పనిచేస్తుందో నిర్ణయించడంలో సహాయపడే సెట్టింగులు-లింగ్-ప్లస్ 290 బిలియన్లు. పోలిక కోసం, క్లోజ్డ్ సోర్స్ జిపిటి -4.5 లో 1.8 ట్రిలియన్ పారామితులు ఉన్నాయని అంచనాలు సూచిస్తున్నాయి MIT టెక్నాలజీ సమీక్ష.

పురోగతి ఉన్నప్పటికీ, శిక్షణ నమూనాలు సవాలుగా ఉన్నాయని యాంట్ పేపర్ గుర్తించింది. మోడల్ శిక్షణ సమయంలో హార్డ్‌వేర్ లేదా మోడల్ నిర్మాణానికి చిన్న సర్దుబాట్లు కొన్నిసార్లు అస్థిర పనితీరుకు దారితీస్తాయి, వీటిలో లోపం రేటులో వచ్చే చిక్కులు ఉన్నాయి.

(ఫోటో అన్‌స్ప్లాష్)

ఇవి కూడా చూడండి: డీప్సీక్ V3-0324 మొదట ఓపెన్ సోర్స్‌లో నాన్-రీజనింగ్ AI మోడళ్లను అగ్రస్థానంలో నిలిపింది

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్‌పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్‌పో.

టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్‌నార్లను అన్వేషించండి ఇక్కడ.

(Tagstotranslate) ai

Source link

Useful _Links

EMEA CIOలు AI రోల్‌అవుట్‌లను ఎలా జంప్‌స్టార్ట్ చేయగలవు

GPT-5.5 అనేది OpenAI యొక్క అత్యంత సామర్థ్యం గల ఏజెంట్ AI మోడల్ – API ధర కంటే రెండింతలు

SDLC ఖర్చులను నియంత్రించడానికి IBM AI ప్లాట్‌ఫారమ్ బాబ్‌ను ప్రారంభించింది

ఎన్‌కోడర్‌ల పరిణామం: సాధారణ నమూనాల నుండి మల్టీమోడల్ AI వరకు

భౌతిక AI కోసం కకావో మొబిలిటీ వివరాలు లెవల్ 4 అటానమస్ డ్రైవింగ్ రోడ్‌మ్యాప్

ఆప్టికల్ ఇంటర్‌కనెక్ట్ అంటే ఏమిటి మరియు లైట్‌టెలిజెన్స్ యొక్క $10B అరంగేట్రం ఎందుకు AIకి ముఖ్యమని చెప్పింది

హానికరమైన వెబ్ పేజీలు AI ఏజెంట్లను విషపూరితం చేస్తున్నాయని Google హెచ్చరించింది

AI ఏజెంట్లకు ఇంటరాక్షన్ ఇన్‌ఫ్రాస్ట్రక్చర్ ఎందుకు అవసరం

మార్కెట్ ప్రవర్తనను అర్థం చేసుకోవడానికి AI మోడల్‌లు నిజ-సమయ క్రిప్టోకరెన్సీ డేటాను ఎలా ఉపయోగిస్తాయి

AI కోసం భిన్నమైన ఆలోచనతో బిలియన్-డాలర్ స్టార్టప్

ANT గ్రూప్ AI మోడళ్లకు శిక్షణ ఇవ్వడానికి మరియు ఖర్చులను తగ్గించడానికి దేశీయ చిప్‌లను ఉపయోగిస్తుంది

ఇవి కూడా చూడండి: డీప్సీక్ V3-0324 మొదట ఓపెన్ సోర్స్‌లో నాన్-రీజనింగ్ AI మోడళ్లను అగ్రస్థానంలో నిలిపింది

Leave a Reply Cancel reply

Useful Links

ఇవి కూడా చూడండి: డీప్సీక్ V3-0324 మొదట ఓపెన్ సోర్స్‌లో నాన్-రీజనింగ్ AI మోడళ్లను అగ్రస్థానంలో నిలిపింది

Leave a Reply Cancel reply

Related News

Useful _Links