Hot News

తేలికపాటి LLM జపనీస్ ఎంటర్‌ప్రైజ్ AI విస్తరణలకు శక్తినిస్తుంది

ఎంటర్‌ప్రైజ్ AI విస్తరణ ప్రాథమిక ఉద్రిక్తతను ఎదుర్కొంటోంది: సంస్థలకు అధునాతన భాషా నమూనాలు అవసరమవుతాయి, అయితే సరిహద్దు వ్యవస్థల మౌలిక సదుపాయాల ఖర్చులు మరియు శక్తి వినియోగాన్ని పరిగణనలోకి తీసుకుంటాయి.

NTT Inc. ఇటీవలిది ప్రయోగ tsuzumi 2, ఒకే GPUపై నడుస్తున్న తేలికపాటి లార్జ్ లాంగ్వేజ్ మోడల్ (LLM), వ్యాపారాలు ఈ అడ్డంకిని ఎలా పరిష్కరిస్తున్నాయో ప్రదర్శిస్తుంది-ప్రారంభ విస్తరణలతో కార్యాచరణ వ్యయంలో కొంత భాగానికి పెద్ద మోడల్‌లకు సరిపోయే పనితీరును చూపుతుంది.

వ్యాపార కేసు సూటిగా ఉంటుంది. సాంప్రదాయ పెద్ద భాషా నమూనాలకు డజన్ల కొద్దీ లేదా వందల కొద్దీ GPUలు అవసరమవుతాయి, విద్యుత్ వినియోగం మరియు అనేక సంస్థలకు AI విస్తరణ అసాధ్యమైన కార్యాచరణ వ్యయ అడ్డంకులు సృష్టించడం.

(GPU ధర పోలిక)

నిర్బంధిత పవర్ ఇన్‌ఫ్రాస్ట్రక్చర్ లేదా గట్టి కార్యాచరణ బడ్జెట్‌లతో మార్కెట్‌లో పనిచేస్తున్న సంస్థల కోసం, ఈ అవసరాలు AIని ఆచరణీయ ఎంపికగా తొలగిస్తాయి. టోక్యో ఆన్‌లైన్ విశ్వవిద్యాలయం యొక్క విస్తరణతో తేలికపాటి LLM స్వీకరణను నడిపించే ఆచరణాత్మక పరిశీలనలను కంపెనీ యొక్క పత్రికా ప్రకటన వివరిస్తుంది.

విశ్వవిద్యాలయం దాని క్యాంపస్ నెట్‌వర్క్‌లో విద్యార్థి మరియు సిబ్బంది డేటాను ఉంచే ఆన్-ప్రిమైజ్ ప్లాట్‌ఫారమ్‌ను నిర్వహిస్తుంది-విద్యా సంస్థలు మరియు నియంత్రిత పరిశ్రమలలో డేటా సార్వభౌమాధికారం అవసరం.

tsuzumi 2 సంక్లిష్టమైన సందర్భ అవగాహనను మరియు ఉత్పత్తి-సిద్ధమైన స్థాయిలలో సుదీర్ఘ-డాక్యుమెంట్ ప్రాసెసింగ్‌ను నిర్వహిస్తుందని ధృవీకరించిన తర్వాత, విశ్వవిద్యాలయం దానిని కోర్సు Q&A మెరుగుదల, బోధనా సామగ్రి సృష్టి మద్దతు మరియు వ్యక్తిగతీకరించిన విద్యార్థి మార్గదర్శకత్వం కోసం ఉపయోగించింది.

ఒకే-GPU ఆపరేషన్ అంటే విశ్వవిద్యాలయం GPU క్లస్టర్‌ల కోసం మూలధన వ్యయం మరియు కొనసాగుతున్న విద్యుత్ ఖర్చులు రెండింటినీ నివారిస్తుంది. మరింత ముఖ్యమైనది, ఆన్-ప్రాంగణ విస్తరణ అనేది సున్నితమైన విద్యార్థుల సమాచారాన్ని ప్రాసెస్ చేసే క్లౌడ్-ఆధారిత AI సేవలను ఉపయోగించకుండా అనేక విద్యా సంస్థలను నిరోధించే డేటా గోప్యతా సమస్యలను పరిష్కరిస్తుంది.

స్కేల్ లేకుండా పనితీరు: సాంకేతిక ఆర్థికశాస్త్రం

ఆర్థిక వ్యవస్థ విచారణ నిర్వహణ కోసం NTT యొక్క అంతర్గత మూల్యాంకనం నాటకీయంగా చిన్న మౌలిక సదుపాయాల అవసరాలు ఉన్నప్పటికీ సుజుమి 2 సరిపోలిక లేదా ప్రముఖ బాహ్య నమూనాలను మించిపోయింది. ఈ పనితీరు-నుండి-వనరుల నిష్పత్తి యాజమాన్యం యొక్క మొత్తం ఖర్చు నిర్ణయాలను నడిపించే సంస్థల కోసం AI స్వీకరణ సాధ్యతను నిర్ణయిస్తుంది.

విజ్ఞానం, విశ్లేషణ, సూచనలను అనుసరించడం మరియు భద్రతకు ప్రాధాన్యమిచ్చే వ్యాపార డొమైన్‌లలో ప్రత్యేక బలంతో, జపనీస్ భాషా పనితీరులో “పోల్చదగిన పరిమాణంలో ఉన్న మోడల్‌లలో ప్రపంచ-అత్యున్నత ఫలితాలు”గా NTT వర్ణించే మోడల్‌ను అందిస్తుంది.

ప్రధానంగా జపనీస్ మార్కెట్‌లలో పనిచేస్తున్న సంస్థల కోసం, ఈ భాషా ఆప్టిమైజేషన్ గణనీయంగా ఎక్కువ గణన వనరులు అవసరమయ్యే పెద్ద బహుభాషా నమూనాలను అమలు చేయవలసిన అవసరాన్ని తగ్గిస్తుంది.

కస్టమర్ డిమాండ్ ఆధారంగా అభివృద్ధి చేయబడిన ఆర్థిక, వైద్య, మరియు ప్రభుత్వ రంగాలలో పటిష్ట జ్ఞానం-విస్తృతమైన ఫైన్-ట్యూనింగ్ లేకుండా డొమైన్-నిర్దిష్ట విస్తరణలను ప్రారంభిస్తుంది.

మోడల్ యొక్క RAG (పునరుద్ధరణ-అగ్మెంటెడ్ జనరేషన్) మరియు ఫైన్-ట్యూనింగ్ సామర్థ్యాలు యాజమాన్య నాలెడ్జ్ బేస్‌లు లేదా పరిశ్రమ-నిర్దిష్ట పదజాలం కలిగిన ఎంటర్‌ప్రైజెస్ కోసం ప్రత్యేకమైన అప్లికేషన్‌లను సమర్థవంతంగా అభివృద్ధి చేయడానికి అనుమతిస్తాయి, ఇక్కడ సాధారణ నమూనాలు తక్కువగా పని చేస్తాయి.

వ్యాపార డ్రైవర్లుగా డేటా సార్వభౌమాధికారం మరియు భద్రత

వ్యయ పరిగణనలకు అతీతంగా, డేటా సార్వభౌమాధికారం నియంత్రిత పరిశ్రమల్లో తేలికైన LLM స్వీకరణను నడిపిస్తుంది. విదేశీ అధికార పరిధికి లోబడి బాహ్య AI సేవల ద్వారా డేటాను ప్రాసెస్ చేస్తున్నప్పుడు రహస్య సమాచారాన్ని నిర్వహించే సంస్థలు ప్రమాదానికి గురవుతాయి.

వాస్తవానికి, NTT జపాన్‌లో మొదటి నుండి అభివృద్ధి చేయబడిన “పూర్తిగా దేశీయ మోడల్”గా సుజుమి 2ని ఉంచింది, ఆవరణలో లేదా ప్రైవేట్ క్లౌడ్‌లలో పనిచేస్తుంది. ఇది డేటా రెసిడెన్సీ, రెగ్యులేటరీ సమ్మతి మరియు సమాచార భద్రత గురించి ఆసియా-పసిఫిక్ మార్కెట్‌లలో ప్రబలంగా ఉన్న సమస్యలను పరిష్కరిస్తుంది.

NTT DOCOMO BUSINESSతో FUJIFILM బిజినెస్ ఇన్నోవేషన్ భాగస్వామ్యం ప్రస్తుత డేటా మౌలిక సదుపాయాలతో తేలికపాటి మోడల్‌లను ఎలా మిళితం చేస్తుందో చూపిస్తుంది. FUJIFILM యొక్క REiLI సాంకేతికత నిర్మాణాత్మకంగా లేని కార్పొరేట్ డేటా-ఒప్పందాలు, ప్రతిపాదనలు, మిశ్రమ వచనం మరియు చిత్రాలను-నిర్మాణాత్మక సమాచారంగా మారుస్తుంది.

సుజుమి 2 యొక్క ఉత్పాదక సామర్థ్యాలను ఏకీకృతం చేయడం వలన బాహ్య AI ప్రొవైడర్‌లకు సున్నితమైన కార్పొరేట్ సమాచారాన్ని ప్రసారం చేయకుండా అధునాతన పత్ర విశ్లేషణను ప్రారంభిస్తుంది. ఈ ఆర్కిటెక్చరల్ అప్రోచ్-ఆన్-ప్రెమిస్ డేటా ప్రాసెసింగ్‌తో తేలికపాటి మోడళ్లను కలపడం-భద్రత, సమ్మతి మరియు వ్యయ పరిమితులతో సామర్థ్య అవసరాలను సమతుల్యం చేసే ప్రాక్టికల్ ఎంటర్‌ప్రైజ్ AI వ్యూహాన్ని సూచిస్తుంది.

మల్టీమోడల్ సామర్థ్యాలు మరియు ఎంటర్‌ప్రైజ్ వర్క్‌ఫ్లోలు

tsuzumi 2లో అంతర్నిర్మిత మల్టీమోడల్ సపోర్ట్ హ్యాండ్లింగ్ టెక్స్ట్, ఇమేజ్‌లు మరియు ఎంటర్‌ప్రైజ్ అప్లికేషన్‌లలో వాయిస్ ఉన్నాయి. ప్రత్యేక ప్రత్యేక నమూనాలను అమలు చేయకుండా బహుళ డేటా రకాలను ప్రాసెస్ చేయడానికి AI అవసరమయ్యే వ్యాపార వర్క్‌ఫ్లోల కోసం ఇది ముఖ్యమైనది.

తయారీ నాణ్యత నియంత్రణ, కస్టమర్ సేవా కార్యకలాపాలు మరియు డాక్యుమెంట్ ప్రాసెసింగ్ వర్క్‌ఫ్లోలు సాధారణంగా టెక్స్ట్, ఇమేజ్‌లు మరియు కొన్నిసార్లు వాయిస్ ఇన్‌పుట్‌లను కలిగి ఉంటాయి. విభిన్న కార్యాచరణ అవసరాలతో బహుళ ప్రత్యేక వ్యవస్థలను నిర్వహించడం కంటే ఈ మూడింటిని నిర్వహించే ఒకే నమూనాలు ఏకీకరణ సంక్లిష్టతను తగ్గిస్తాయి.

మార్కెట్ సందర్భం మరియు అమలు పరిగణనలు

NTT యొక్క తేలికపాటి విధానం హైపర్‌స్కేలర్ వ్యూహాలతో విభేదిస్తుంది, ఇది విస్తృత సామర్థ్యాలతో భారీ నమూనాలను నొక్కి చెబుతుంది. గణనీయమైన AI బడ్జెట్‌లు మరియు అధునాతన సాంకేతిక బృందాలు కలిగిన సంస్థల కోసం, OpenAI, Anthropic మరియు Google నుండి సరిహద్దు నమూనాలు అత్యాధునిక పనితీరును అందిస్తాయి.

ఏదేమైనా, ఈ విధానం ఈ వనరులు లేని సంస్థలను మినహాయించింది-ఎంటర్‌ప్రైజ్ మార్కెట్‌లో ముఖ్యమైన భాగం, ప్రత్యేకించి ఆసియా-పసిఫిక్ ప్రాంతాలలో వివిధ మౌలిక సదుపాయాల నాణ్యతతో. ప్రాంతీయ పరిగణనలు ముఖ్యమైనవి.

శక్తి విశ్వసనీయత, ఇంటర్నెట్ కనెక్టివిటీ, డేటా సెంటర్ లభ్యత మరియు నియంత్రణ ఫ్రేమ్‌వర్క్‌లు మార్కెట్‌లలో గణనీయంగా మారుతూ ఉంటాయి. స్థిరమైన క్లౌడ్ ఇన్‌ఫ్రాస్ట్రక్చర్ యాక్సెస్ అవసరమయ్యే విధానాల కంటే ఆన్-ప్రిమైజ్ డిప్లాయ్‌మెంట్‌ని ఎనేబుల్ చేసే లైట్‌వెయిట్ మోడల్‌లు ఈ వైవిధ్యాలకు మెరుగ్గా ఉంటాయి.

తేలికపాటి LLM విస్తరణను అంచనా వేసే సంస్థలు అనేక అంశాలను పరిగణించాలి:

డొమైన్ స్పెషలైజేషన్: ఆర్థిక, వైద్య మరియు ప్రభుత్వ రంగాలలో tsuzumi 2 యొక్క రీన్ఫోర్స్డ్ నాలెడ్జ్ నిర్దిష్ట డొమైన్‌లను పరిష్కరిస్తుంది, అయితే ఇతర పరిశ్రమలలోని సంస్థలు అందుబాటులో ఉన్న డొమైన్ పరిజ్ఞానం వారి అవసరాలను తీరుస్తుందో లేదో అంచనా వేయాలి.

భాషా పరిగణనలు: జపనీస్ భాషా ప్రాసెసింగ్ కోసం ఆప్టిమైజేషన్ జపనీస్-మార్కెట్ కార్యకలాపాలకు ప్రయోజనం చేకూరుస్తుంది కానీ స్థిరమైన భాషా పనితీరు అవసరమయ్యే బహుభాషా సంస్థలకు సరిపోకపోవచ్చు.

ఇంటిగ్రేషన్ సంక్లిష్టత: ఆన్-ప్రాంగణ విస్తరణకు సంస్థాపన, నిర్వహణ మరియు నవీకరణల కోసం అంతర్గత సాంకేతిక సామర్థ్యాలు అవసరం. ఈ సామర్థ్యాలు లేని సంస్థలు అధిక ఖర్చులు ఉన్నప్పటికీ క్లౌడ్-ఆధారిత ప్రత్యామ్నాయాలను కార్యాచరణలో సరళంగా కనుగొనవచ్చు.

పనితీరు ట్రేడ్‌ఆఫ్‌లు: tsuzumi 2 నిర్దిష్ట డొమైన్‌లలో పెద్ద మోడళ్లతో సరిపోలుతుండగా, సరిహద్దు మోడల్‌లు ఎడ్జ్ కేసులు లేదా నవల అప్లికేషన్‌లలో మెరుగైన పనితీరును కనబరుస్తాయి. డొమైన్-నిర్దిష్ట పనితీరు సరిపోతుందా లేదా విస్తృత సామర్థ్యాలు అధిక మౌలిక సదుపాయాల ఖర్చులను సమర్థిస్తాయా అని సంస్థలు మూల్యాంకనం చేయాలి.

ముందుకు ఆచరణ మార్గం?

NTT యొక్క tsuzumi 2 విస్తరణ అధునాతన AI అమలుకు హైపర్‌స్కేల్ ఇన్‌ఫ్రాస్ట్రక్చర్ అవసరం లేదని నిరూపిస్తుంది-కనీసం తక్కువ బరువున్న మోడల్ సామర్థ్యాలతో అవసరాలు సరిపోయే సంస్థలకు. ప్రారంభ ఎంటర్‌ప్రైజ్ స్వీకరణలు ఆచరణాత్మక వ్యాపార విలువను చూపుతాయి: తగ్గిన కార్యాచరణ ఖర్చులు, మెరుగైన డేటా సార్వభౌమాధికారం మరియు నిర్దిష్ట డొమైన్‌ల కోసం ఉత్పత్తి-సిద్ధమైన పనితీరు.

ఎంటర్‌ప్రైజెస్ AI స్వీకరణను నావిగేట్ చేస్తున్నందున, సామర్థ్య అవసరాలు మరియు కార్యాచరణ పరిమితుల మధ్య ఉద్రిక్తత విస్తృతమైన అవస్థాపన అవసరమయ్యే సాధారణ-ప్రయోజన వ్యవస్థల కంటే సమర్థవంతమైన, ప్రత్యేక పరిష్కారాల కోసం డిమాండ్‌ను పెంచుతుంది.

AI విస్తరణ వ్యూహాలను మూల్యాంకనం చేసే సంస్థలకు, సరిహద్దు వ్యవస్థల కంటే తేలికైన మోడల్‌లు “మెరుగైనవి” కాదా అనేది ప్రశ్న కాదు-ప్రత్యామ్నాయ విధానాలను అసాధ్యమైన ఖర్చు, భద్రత మరియు కార్యాచరణ పరిమితులను పరిష్కరించేటప్పుడు నిర్దిష్ట వ్యాపార అవసరాలకు అవి సరిపోతాయా అనేది.

టోక్యో ఆన్‌లైన్ యూనివర్సిటీ మరియు FUJIFILM బిజినెస్ ఇన్నోవేషన్ డిప్లాయ్‌మెంట్‌లు ప్రదర్శించినట్లుగా, సమాధానం ఎక్కువగా అవును.

ఇవి కూడా చూడండి: లెవీ స్ట్రాస్ తన DTC-మొదటి వ్యాపార నమూనా కోసం AIని ఎలా ఉపయోగిస్తోంది

TechEx ఈవెంట్‌ల ద్వారా AI & బిగ్ డేటా ఎక్స్‌పో కోసం బ్యానర్.

పరిశ్రమ ప్రముఖుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & బిగ్ డేటా ఎక్స్‌పో ఆమ్‌స్టర్‌డామ్, కాలిఫోర్నియా మరియు లండన్‌లో జరుగుతున్నాయి. సమగ్ర కార్యక్రమం ఇందులో భాగమే టెక్ఎక్స్ మరియు సహా ఇతర ప్రముఖ సాంకేతిక ఈవెంట్‌లతో కలిసి ఉంది సైబర్ సెక్యూరిటీ ఎక్స్‌పో. క్లిక్ చేయండి ఇక్కడ మరింత సమాచారం కోసం.

AI వార్తలు ఆధారితం టెక్ఫోర్జ్ మీడియా. రాబోయే ఇతర ఎంటర్‌ప్రైజ్ టెక్నాలజీ ఈవెంట్‌లు మరియు వెబ్‌నార్‌లను అన్వేషించండి ఇక్కడ.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Top