ఈ విషయం తెలిసిన వ్యక్తుల ప్రకారం, ఖర్చులను తగ్గించడానికి మరియు పరిమితం చేయబడిన యుఎస్ టెక్నాలజీపై ఆధారపడటాన్ని తగ్గించడానికి ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ మోడళ్లకు శిక్షణ ఇవ్వడానికి యాంట్ గ్రూప్ చైనీస్-మేడ్ సెమీకండక్టర్లపై ఆధారపడుతోంది.
అలీబాబా యాజమాన్యంలోని సంస్థ దేశీయ సరఫరాదారుల నుండి చిప్లను ఉపయోగించింది, వీటిలో దాని తల్లిదండ్రులు, అలీబాబా మరియు హువావే టెక్నాలజీలతో ముడిపడి ఉన్నవి నిపుణుల మిశ్రమాన్ని (MOE) పద్ధతిని ఉపయోగించి పెద్ద భాషా నమూనాలకు శిక్షణ ఇవ్వడానికి ఉన్నాయి. ఫలితాలు ఎన్విడియా యొక్క H800 చిప్లతో ఉత్పత్తి చేయబడిన వాటితో పోల్చితే, మూలాలు పేర్కొన్నాయి. ANT దాని AI అభివృద్ధికి NVIDIA చిప్లను ఉపయోగిస్తూనే ఉండగా, ఒక వర్గాలు సంస్థ తన తాజా మోడళ్ల కోసం AMD మరియు చైనీస్ చిప్ తయారీదారుల నుండి ప్రత్యామ్నాయాల వైపు ఎక్కువగా మారుతోందని తెలిపింది.
ఈ అభివృద్ధి చైనీస్ మరియు యుఎస్ టెక్ సంస్థల మధ్య పెరుగుతున్న AI రేసులో యాంట్ యొక్క లోతైన ప్రమేయాన్ని సూచిస్తుంది, ప్రత్యేకించి కంపెనీలు మోడళ్లకు శిక్షణ ఇవ్వడానికి ఖర్చుతో కూడుకున్న మార్గాల కోసం చూస్తాయి. దేశీయ హార్డ్వేర్తో చేసిన ప్రయోగం ఎన్విడియా యొక్క H800 వంటి హై-ఎండ్ చిప్లకు ప్రాప్యతను నిరోధించే ఎగుమతి పరిమితుల చుట్టూ పనిచేయడానికి చైనీస్ సంస్థలలో విస్తృత ప్రయత్నాన్ని ప్రతిబింబిస్తుంది, ఇది చాలా అభివృద్ధి చెందినది కానప్పటికీ, చైనీస్ సంస్థలకు అందుబాటులో ఉన్న శక్తివంతమైన GPU లలో ఒకటి.
యాంట్ దాని పనిని వివరించే ఒక పరిశోధనా పత్రాన్ని ప్రచురించింది, దాని నమూనాలు, కొన్ని పరీక్షలలో, మెటా అభివృద్ధి చేసిన వాటి కంటే మెరుగ్గా పనిచేస్తున్నాయని పేర్కొంది. బ్లూమ్బెర్గ్ న్యూస్ఇది మొదట్లో ఈ విషయాన్ని నివేదించింది, సంస్థ ఫలితాలను స్వతంత్రంగా ధృవీకరించలేదు. నమూనాలు దావా వేసినట్లుగా పనిచేస్తే, ANT యొక్క ప్రయత్నాలు AI దరఖాస్తులను నడిపే ఖర్చును తగ్గించడానికి మరియు విదేశీ హార్డ్వేర్పై ఆధారపడటాన్ని తగ్గించడానికి చైనా చేసిన ప్రయత్నంలో ఒక అడుగు ముందుకు వేయవచ్చు.
MOE నమూనాలు ప్రత్యేక భాగాలచే నిర్వహించబడే చిన్న డేటా సెట్లుగా పనులను విభజిస్తాయి మరియు AI పరిశోధకులు మరియు డేటా శాస్త్రవేత్తలలో దృష్టిని ఆకర్షించాయి. ఈ సాంకేతికతను గూగుల్ మరియు హాంగ్జౌ-ఆధారిత స్టార్టప్, డీప్సీక్ ఉపయోగించాయి. MOE కాన్సెప్ట్ నిపుణుల బృందాన్ని కలిగి ఉండటానికి సమానంగా ఉంటుంది, మోడళ్లను ఉత్పత్తి చేసే ప్రక్రియను మరింత సమర్థవంతంగా చేయడానికి ఒక పని యొక్క ప్రతి నిర్వహించడం. ANT తన హార్డ్వేర్ మూలాలకు సంబంధించి దాని పనిపై వ్యాఖ్యానించడానికి నిరాకరించింది.
శిక్షణ MOE నమూనాలు అధిక-పనితీరు గల GPU లపై ఆధారపడి ఉంటాయి, ఇవి చిన్న కంపెనీలకు సంపాదించడానికి లేదా ఉపయోగించడానికి చాలా ఖరీదైనవి. చీమల పరిశోధన ఆ ఖర్చు అవరోధాన్ని తగ్గించడంపై దృష్టి పెట్టింది. కాగితం యొక్క శీర్షిక స్పష్టమైన లక్ష్యంతో ప్రత్యయం చేయబడింది: స్కేలింగ్ మోడల్స్ “ప్రీమియం GPU లు లేకుండా.” (మా కొటేషన్ మార్కులు)
ANT తీసుకున్న దిశ మరియు శిక్షణ ఖర్చులను తగ్గించడానికి MOE వాడకం NVIDIA యొక్క విధానానికి విరుద్ధంగా. డీప్సీక్ యొక్క R1 వంటి మరింత సమర్థవంతమైన నమూనాలను ప్రవేశపెట్టడంతో కూడా, కంప్యూటింగ్ విద్యుత్ కోసం డిమాండ్ పెరుగుతూనే ఉంటుందని CEO ఆఫీసర్ జెన్సన్ హువాంగ్ చెప్పారు. అతని అభిప్రాయం ఏమిటంటే, కంపెనీలు చౌకైన ప్రత్యామ్నాయాలతో ఖర్చులను తగ్గించే లక్ష్యంతో కాకుండా, ఆదాయ వృద్ధిని పెంచడానికి మరింత శక్తివంతమైన చిప్లను కోరుకుంటాయి. ఎన్విడియా యొక్క వ్యూహం GPU లను ఎక్కువ కోర్లు, ట్రాన్సిస్టర్లు మరియు జ్ఞాపకశక్తితో నిర్మించడంపై దృష్టి పెట్టింది.
చీమల సమూహ పేపర్ ప్రకారం, ఒక ట్రిలియన్ టోకెన్లకు శిక్షణ ఇవ్వడం-డేటా AI మోడల్స్ నేర్చుకోవడానికి ఉపయోగించే ప్రాథమిక యూనిట్లు-సాంప్రదాయిక అధిక-పనితీరు హార్డ్వేర్ను ఉపయోగించి 6.35 మిలియన్ యువాన్ల (సుమారు 80 880,000) ఖర్చు అవుతుంది. సంస్థ యొక్క ఆప్టిమైజ్ చేసిన శిక్షణా పద్ధతి తక్కువ-స్పెసిఫికేషన్ చిప్లను ఉపయోగించడం ద్వారా ఆ ఖర్చును సుమారు 5.1 మిలియన్ యువాన్లకు తగ్గించింది.
ఈ విధంగా ఉత్పత్తి చేయబడిన దాని నమూనాలను-లింగ్-ప్లస్ మరియు లింగ్-లైట్-పారిశ్రామిక AI ఆరోగ్య సంరక్షణ మరియు ఫైనాన్స్ వంటి కేసులను ఉపయోగించుకోవాలని యాంట్ చెప్పారు. ఈ సంవత్సరం ప్రారంభంలో, ఆరోగ్య సంరక్షణలో AI- ఆధారిత పరిష్కారాలను అమలు చేయాలన్న ANT యొక్క ఆశయాన్ని మరింతగా మార్చడానికి కంపెనీ చైనీస్ ఆన్లైన్ మెడికల్ ప్లాట్ఫామ్ HAODF.com ను కొనుగోలు చేసింది. ఇది ఇతర AI సేవలను కూడా నిర్వహిస్తుంది, వీటిలో జిక్సియాబావో అని పిలువబడే వర్చువల్ అసిస్టెంట్ అనువర్తనం మరియు మాక్సియాకాయ్ అని పిలువబడే ఆర్థిక సలహా వేదికతో సహా.
“ప్రపంచంలోని ఉత్తమమైన వాటిని ఓడించటానికి మీరు ఒక పాయింట్ యొక్క పాయింట్ కనుగొంటే కుంగ్ ఫూ మాస్టర్, మీరు వారిని ఓడించారని మీరు ఇప్పటికీ చెప్పవచ్చు, అందుకే వాస్తవ ప్రపంచ అనువర్తనం ముఖ్యమైనది ”అని బీజింగ్ ఆధారిత AI సంస్థ షెంగ్షాంగ్ టెక్ యొక్క చీఫ్ టెక్నాలజీ ఆఫీసర్ రాబిన్ యు అన్నారు.
చీమ దాని మోడళ్లను ఓపెన్ సోర్స్ చేసింది. లింగ్-లైట్ 16.8 బిలియన్ పారామితులను కలిగి ఉంది-మోడల్ ఎలా పనిచేస్తుందో నిర్ణయించడంలో సహాయపడే సెట్టింగులు-లింగ్-ప్లస్ 290 బిలియన్లు. పోలిక కోసం, క్లోజ్డ్ సోర్స్ జిపిటి -4.5 లో 1.8 ట్రిలియన్ పారామితులు ఉన్నాయని అంచనాలు సూచిస్తున్నాయి MIT టెక్నాలజీ సమీక్ష.
పురోగతి ఉన్నప్పటికీ, శిక్షణ నమూనాలు సవాలుగా ఉన్నాయని యాంట్ పేపర్ గుర్తించింది. మోడల్ శిక్షణ సమయంలో హార్డ్వేర్ లేదా మోడల్ నిర్మాణానికి చిన్న సర్దుబాట్లు కొన్నిసార్లు అస్థిర పనితీరుకు దారితీస్తాయి, వీటిలో లోపం రేటులో వచ్చే చిక్కులు ఉన్నాయి.
(ఫోటో అన్స్ప్లాష్)
ఇవి కూడా చూడండి: డీప్సీక్ V3-0324 మొదట ఓపెన్ సోర్స్లో నాన్-రీజనింగ్ AI మోడళ్లను అగ్రస్థానంలో నిలిపింది

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్పో.
టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్నార్లను అన్వేషించండి ఇక్కడ.
(Tagstotranslate) ai