ఎంటర్ప్రైజ్ AI విస్తరణ ప్రాథమిక ఉద్రిక్తతను ఎదుర్కొంటోంది: సంస్థలకు అధునాతన భాషా నమూనాలు అవసరమవుతాయి, అయితే సరిహద్దు వ్యవస్థల మౌలిక సదుపాయాల ఖర్చులు మరియు శక్తి వినియోగాన్ని పరిగణనలోకి తీసుకుంటాయి.
NTT Inc. ఇటీవలిది ప్రయోగ tsuzumi 2, ఒకే GPUపై నడుస్తున్న తేలికపాటి లార్జ్ లాంగ్వేజ్ మోడల్ (LLM), వ్యాపారాలు ఈ అడ్డంకిని ఎలా పరిష్కరిస్తున్నాయో ప్రదర్శిస్తుంది-ప్రారంభ విస్తరణలతో కార్యాచరణ వ్యయంలో కొంత భాగానికి పెద్ద మోడల్లకు సరిపోయే పనితీరును చూపుతుంది.
వ్యాపార కేసు సూటిగా ఉంటుంది. సాంప్రదాయ పెద్ద భాషా నమూనాలకు డజన్ల కొద్దీ లేదా వందల కొద్దీ GPUలు అవసరమవుతాయి, విద్యుత్ వినియోగం మరియు అనేక సంస్థలకు AI విస్తరణ అసాధ్యమైన కార్యాచరణ వ్యయ అడ్డంకులు సృష్టించడం.

నిర్బంధిత పవర్ ఇన్ఫ్రాస్ట్రక్చర్ లేదా గట్టి కార్యాచరణ బడ్జెట్లతో మార్కెట్లో పనిచేస్తున్న సంస్థల కోసం, ఈ అవసరాలు AIని ఆచరణీయ ఎంపికగా తొలగిస్తాయి. టోక్యో ఆన్లైన్ విశ్వవిద్యాలయం యొక్క విస్తరణతో తేలికపాటి LLM స్వీకరణను నడిపించే ఆచరణాత్మక పరిశీలనలను కంపెనీ యొక్క పత్రికా ప్రకటన వివరిస్తుంది.
విశ్వవిద్యాలయం దాని క్యాంపస్ నెట్వర్క్లో విద్యార్థి మరియు సిబ్బంది డేటాను ఉంచే ఆన్-ప్రిమైజ్ ప్లాట్ఫారమ్ను నిర్వహిస్తుంది-విద్యా సంస్థలు మరియు నియంత్రిత పరిశ్రమలలో డేటా సార్వభౌమాధికారం అవసరం.
tsuzumi 2 సంక్లిష్టమైన సందర్భ అవగాహనను మరియు ఉత్పత్తి-సిద్ధమైన స్థాయిలలో సుదీర్ఘ-డాక్యుమెంట్ ప్రాసెసింగ్ను నిర్వహిస్తుందని ధృవీకరించిన తర్వాత, విశ్వవిద్యాలయం దానిని కోర్సు Q&A మెరుగుదల, బోధనా సామగ్రి సృష్టి మద్దతు మరియు వ్యక్తిగతీకరించిన విద్యార్థి మార్గదర్శకత్వం కోసం ఉపయోగించింది.
ఒకే-GPU ఆపరేషన్ అంటే విశ్వవిద్యాలయం GPU క్లస్టర్ల కోసం మూలధన వ్యయం మరియు కొనసాగుతున్న విద్యుత్ ఖర్చులు రెండింటినీ నివారిస్తుంది. మరింత ముఖ్యమైనది, ఆన్-ప్రాంగణ విస్తరణ అనేది సున్నితమైన విద్యార్థుల సమాచారాన్ని ప్రాసెస్ చేసే క్లౌడ్-ఆధారిత AI సేవలను ఉపయోగించకుండా అనేక విద్యా సంస్థలను నిరోధించే డేటా గోప్యతా సమస్యలను పరిష్కరిస్తుంది.
స్కేల్ లేకుండా పనితీరు: సాంకేతిక ఆర్థికశాస్త్రం
ఆర్థిక వ్యవస్థ విచారణ నిర్వహణ కోసం NTT యొక్క అంతర్గత మూల్యాంకనం నాటకీయంగా చిన్న మౌలిక సదుపాయాల అవసరాలు ఉన్నప్పటికీ సుజుమి 2 సరిపోలిక లేదా ప్రముఖ బాహ్య నమూనాలను మించిపోయింది. ఈ పనితీరు-నుండి-వనరుల నిష్పత్తి యాజమాన్యం యొక్క మొత్తం ఖర్చు నిర్ణయాలను నడిపించే సంస్థల కోసం AI స్వీకరణ సాధ్యతను నిర్ణయిస్తుంది.
విజ్ఞానం, విశ్లేషణ, సూచనలను అనుసరించడం మరియు భద్రతకు ప్రాధాన్యమిచ్చే వ్యాపార డొమైన్లలో ప్రత్యేక బలంతో, జపనీస్ భాషా పనితీరులో “పోల్చదగిన పరిమాణంలో ఉన్న మోడల్లలో ప్రపంచ-అత్యున్నత ఫలితాలు”గా NTT వర్ణించే మోడల్ను అందిస్తుంది.
ప్రధానంగా జపనీస్ మార్కెట్లలో పనిచేస్తున్న సంస్థల కోసం, ఈ భాషా ఆప్టిమైజేషన్ గణనీయంగా ఎక్కువ గణన వనరులు అవసరమయ్యే పెద్ద బహుభాషా నమూనాలను అమలు చేయవలసిన అవసరాన్ని తగ్గిస్తుంది.
కస్టమర్ డిమాండ్ ఆధారంగా అభివృద్ధి చేయబడిన ఆర్థిక, వైద్య, మరియు ప్రభుత్వ రంగాలలో పటిష్ట జ్ఞానం-విస్తృతమైన ఫైన్-ట్యూనింగ్ లేకుండా డొమైన్-నిర్దిష్ట విస్తరణలను ప్రారంభిస్తుంది.
మోడల్ యొక్క RAG (పునరుద్ధరణ-అగ్మెంటెడ్ జనరేషన్) మరియు ఫైన్-ట్యూనింగ్ సామర్థ్యాలు యాజమాన్య నాలెడ్జ్ బేస్లు లేదా పరిశ్రమ-నిర్దిష్ట పదజాలం కలిగిన ఎంటర్ప్రైజెస్ కోసం ప్రత్యేకమైన అప్లికేషన్లను సమర్థవంతంగా అభివృద్ధి చేయడానికి అనుమతిస్తాయి, ఇక్కడ సాధారణ నమూనాలు తక్కువగా పని చేస్తాయి.
వ్యాపార డ్రైవర్లుగా డేటా సార్వభౌమాధికారం మరియు భద్రత
వ్యయ పరిగణనలకు అతీతంగా, డేటా సార్వభౌమాధికారం నియంత్రిత పరిశ్రమల్లో తేలికైన LLM స్వీకరణను నడిపిస్తుంది. విదేశీ అధికార పరిధికి లోబడి బాహ్య AI సేవల ద్వారా డేటాను ప్రాసెస్ చేస్తున్నప్పుడు రహస్య సమాచారాన్ని నిర్వహించే సంస్థలు ప్రమాదానికి గురవుతాయి.
వాస్తవానికి, NTT జపాన్లో మొదటి నుండి అభివృద్ధి చేయబడిన “పూర్తిగా దేశీయ మోడల్”గా సుజుమి 2ని ఉంచింది, ఆవరణలో లేదా ప్రైవేట్ క్లౌడ్లలో పనిచేస్తుంది. ఇది డేటా రెసిడెన్సీ, రెగ్యులేటరీ సమ్మతి మరియు సమాచార భద్రత గురించి ఆసియా-పసిఫిక్ మార్కెట్లలో ప్రబలంగా ఉన్న సమస్యలను పరిష్కరిస్తుంది.
NTT DOCOMO BUSINESSతో FUJIFILM బిజినెస్ ఇన్నోవేషన్ భాగస్వామ్యం ప్రస్తుత డేటా మౌలిక సదుపాయాలతో తేలికపాటి మోడల్లను ఎలా మిళితం చేస్తుందో చూపిస్తుంది. FUJIFILM యొక్క REiLI సాంకేతికత నిర్మాణాత్మకంగా లేని కార్పొరేట్ డేటా-ఒప్పందాలు, ప్రతిపాదనలు, మిశ్రమ వచనం మరియు చిత్రాలను-నిర్మాణాత్మక సమాచారంగా మారుస్తుంది.
సుజుమి 2 యొక్క ఉత్పాదక సామర్థ్యాలను ఏకీకృతం చేయడం వలన బాహ్య AI ప్రొవైడర్లకు సున్నితమైన కార్పొరేట్ సమాచారాన్ని ప్రసారం చేయకుండా అధునాతన పత్ర విశ్లేషణను ప్రారంభిస్తుంది. ఈ ఆర్కిటెక్చరల్ అప్రోచ్-ఆన్-ప్రెమిస్ డేటా ప్రాసెసింగ్తో తేలికపాటి మోడళ్లను కలపడం-భద్రత, సమ్మతి మరియు వ్యయ పరిమితులతో సామర్థ్య అవసరాలను సమతుల్యం చేసే ప్రాక్టికల్ ఎంటర్ప్రైజ్ AI వ్యూహాన్ని సూచిస్తుంది.
మల్టీమోడల్ సామర్థ్యాలు మరియు ఎంటర్ప్రైజ్ వర్క్ఫ్లోలు
tsuzumi 2లో అంతర్నిర్మిత మల్టీమోడల్ సపోర్ట్ హ్యాండ్లింగ్ టెక్స్ట్, ఇమేజ్లు మరియు ఎంటర్ప్రైజ్ అప్లికేషన్లలో వాయిస్ ఉన్నాయి. ప్రత్యేక ప్రత్యేక నమూనాలను అమలు చేయకుండా బహుళ డేటా రకాలను ప్రాసెస్ చేయడానికి AI అవసరమయ్యే వ్యాపార వర్క్ఫ్లోల కోసం ఇది ముఖ్యమైనది.
తయారీ నాణ్యత నియంత్రణ, కస్టమర్ సేవా కార్యకలాపాలు మరియు డాక్యుమెంట్ ప్రాసెసింగ్ వర్క్ఫ్లోలు సాధారణంగా టెక్స్ట్, ఇమేజ్లు మరియు కొన్నిసార్లు వాయిస్ ఇన్పుట్లను కలిగి ఉంటాయి. విభిన్న కార్యాచరణ అవసరాలతో బహుళ ప్రత్యేక వ్యవస్థలను నిర్వహించడం కంటే ఈ మూడింటిని నిర్వహించే ఒకే నమూనాలు ఏకీకరణ సంక్లిష్టతను తగ్గిస్తాయి.
మార్కెట్ సందర్భం మరియు అమలు పరిగణనలు
NTT యొక్క తేలికపాటి విధానం హైపర్స్కేలర్ వ్యూహాలతో విభేదిస్తుంది, ఇది విస్తృత సామర్థ్యాలతో భారీ నమూనాలను నొక్కి చెబుతుంది. గణనీయమైన AI బడ్జెట్లు మరియు అధునాతన సాంకేతిక బృందాలు కలిగిన సంస్థల కోసం, OpenAI, Anthropic మరియు Google నుండి సరిహద్దు నమూనాలు అత్యాధునిక పనితీరును అందిస్తాయి.
ఏదేమైనా, ఈ విధానం ఈ వనరులు లేని సంస్థలను మినహాయించింది-ఎంటర్ప్రైజ్ మార్కెట్లో ముఖ్యమైన భాగం, ప్రత్యేకించి ఆసియా-పసిఫిక్ ప్రాంతాలలో వివిధ మౌలిక సదుపాయాల నాణ్యతతో. ప్రాంతీయ పరిగణనలు ముఖ్యమైనవి.
శక్తి విశ్వసనీయత, ఇంటర్నెట్ కనెక్టివిటీ, డేటా సెంటర్ లభ్యత మరియు నియంత్రణ ఫ్రేమ్వర్క్లు మార్కెట్లలో గణనీయంగా మారుతూ ఉంటాయి. స్థిరమైన క్లౌడ్ ఇన్ఫ్రాస్ట్రక్చర్ యాక్సెస్ అవసరమయ్యే విధానాల కంటే ఆన్-ప్రిమైజ్ డిప్లాయ్మెంట్ని ఎనేబుల్ చేసే లైట్వెయిట్ మోడల్లు ఈ వైవిధ్యాలకు మెరుగ్గా ఉంటాయి.
తేలికపాటి LLM విస్తరణను అంచనా వేసే సంస్థలు అనేక అంశాలను పరిగణించాలి:
డొమైన్ స్పెషలైజేషన్: ఆర్థిక, వైద్య మరియు ప్రభుత్వ రంగాలలో tsuzumi 2 యొక్క రీన్ఫోర్స్డ్ నాలెడ్జ్ నిర్దిష్ట డొమైన్లను పరిష్కరిస్తుంది, అయితే ఇతర పరిశ్రమలలోని సంస్థలు అందుబాటులో ఉన్న డొమైన్ పరిజ్ఞానం వారి అవసరాలను తీరుస్తుందో లేదో అంచనా వేయాలి.
భాషా పరిగణనలు: జపనీస్ భాషా ప్రాసెసింగ్ కోసం ఆప్టిమైజేషన్ జపనీస్-మార్కెట్ కార్యకలాపాలకు ప్రయోజనం చేకూరుస్తుంది కానీ స్థిరమైన భాషా పనితీరు అవసరమయ్యే బహుభాషా సంస్థలకు సరిపోకపోవచ్చు.
ఇంటిగ్రేషన్ సంక్లిష్టత: ఆన్-ప్రాంగణ విస్తరణకు సంస్థాపన, నిర్వహణ మరియు నవీకరణల కోసం అంతర్గత సాంకేతిక సామర్థ్యాలు అవసరం. ఈ సామర్థ్యాలు లేని సంస్థలు అధిక ఖర్చులు ఉన్నప్పటికీ క్లౌడ్-ఆధారిత ప్రత్యామ్నాయాలను కార్యాచరణలో సరళంగా కనుగొనవచ్చు.
పనితీరు ట్రేడ్ఆఫ్లు: tsuzumi 2 నిర్దిష్ట డొమైన్లలో పెద్ద మోడళ్లతో సరిపోలుతుండగా, సరిహద్దు మోడల్లు ఎడ్జ్ కేసులు లేదా నవల అప్లికేషన్లలో మెరుగైన పనితీరును కనబరుస్తాయి. డొమైన్-నిర్దిష్ట పనితీరు సరిపోతుందా లేదా విస్తృత సామర్థ్యాలు అధిక మౌలిక సదుపాయాల ఖర్చులను సమర్థిస్తాయా అని సంస్థలు మూల్యాంకనం చేయాలి.
ముందుకు ఆచరణ మార్గం?
NTT యొక్క tsuzumi 2 విస్తరణ అధునాతన AI అమలుకు హైపర్స్కేల్ ఇన్ఫ్రాస్ట్రక్చర్ అవసరం లేదని నిరూపిస్తుంది-కనీసం తక్కువ బరువున్న మోడల్ సామర్థ్యాలతో అవసరాలు సరిపోయే సంస్థలకు. ప్రారంభ ఎంటర్ప్రైజ్ స్వీకరణలు ఆచరణాత్మక వ్యాపార విలువను చూపుతాయి: తగ్గిన కార్యాచరణ ఖర్చులు, మెరుగైన డేటా సార్వభౌమాధికారం మరియు నిర్దిష్ట డొమైన్ల కోసం ఉత్పత్తి-సిద్ధమైన పనితీరు.
ఎంటర్ప్రైజెస్ AI స్వీకరణను నావిగేట్ చేస్తున్నందున, సామర్థ్య అవసరాలు మరియు కార్యాచరణ పరిమితుల మధ్య ఉద్రిక్తత విస్తృతమైన అవస్థాపన అవసరమయ్యే సాధారణ-ప్రయోజన వ్యవస్థల కంటే సమర్థవంతమైన, ప్రత్యేక పరిష్కారాల కోసం డిమాండ్ను పెంచుతుంది.
AI విస్తరణ వ్యూహాలను మూల్యాంకనం చేసే సంస్థలకు, సరిహద్దు వ్యవస్థల కంటే తేలికైన మోడల్లు “మెరుగైనవి” కాదా అనేది ప్రశ్న కాదు-ప్రత్యామ్నాయ విధానాలను అసాధ్యమైన ఖర్చు, భద్రత మరియు కార్యాచరణ పరిమితులను పరిష్కరించేటప్పుడు నిర్దిష్ట వ్యాపార అవసరాలకు అవి సరిపోతాయా అనేది.
టోక్యో ఆన్లైన్ యూనివర్సిటీ మరియు FUJIFILM బిజినెస్ ఇన్నోవేషన్ డిప్లాయ్మెంట్లు ప్రదర్శించినట్లుగా, సమాధానం ఎక్కువగా అవును.
ఇవి కూడా చూడండి: లెవీ స్ట్రాస్ తన DTC-మొదటి వ్యాపార నమూనా కోసం AIని ఎలా ఉపయోగిస్తోంది

పరిశ్రమ ప్రముఖుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & బిగ్ డేటా ఎక్స్పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లో జరుగుతున్నాయి. సమగ్ర కార్యక్రమం ఇందులో భాగమే టెక్ఎక్స్ మరియు సహా ఇతర ప్రముఖ సాంకేతిక ఈవెంట్లతో కలిసి ఉంది సైబర్ సెక్యూరిటీ ఎక్స్పో. క్లిక్ చేయండి ఇక్కడ మరింత సమాచారం కోసం.
AI వార్తలు ఆధారితం టెక్ఫోర్జ్ మీడియా. రాబోయే ఇతర ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్లు మరియు వెబ్నార్లను అన్వేషించండి ఇక్కడ.