Hot News

ఓపెన్ సోర్స్ AIని మెరుగుపరచడం మరియు డేటా గవర్నెన్స్‌ని మెరుగుపరచడం

AI & బిగ్ డేటా ఎక్స్‌పో యూరప్‌కు ముందు, AI న్యూస్ ఐవో ఎవర్ట్స్, సీనియర్ సొల్యూషన్స్ ఆర్కిటెక్ట్‌తో పట్టుబడింది డేటాబ్రిక్స్ఓపెన్ సోర్స్ AI మరియు డేటా గవర్నెన్స్ యొక్క భవిష్యత్తును రూపొందించడానికి సెట్ చేయబడిన అనేక కీలక పరిణామాలను చర్చించడానికి.

డేటాబ్రిక్స్ యొక్క గుర్తించదగిన విజయాలలో ఒకటి DBRX మోడల్, ఇది ఓపెన్ లార్జ్ లాంగ్వేజ్ మోడల్స్ (LLMలు) కోసం కొత్త ప్రమాణాన్ని సెట్ చేసింది.

“విడుదల తర్వాత, DBRX స్టాండర్డ్ బెంచ్‌మార్క్‌లలో అన్ని ఇతర ప్రముఖ ఓపెన్ మోడల్‌లను అధిగమించింది మరియు Llama2-70B వంటి మోడల్‌ల కంటే 2x వేగవంతమైన అనుమితిని కలిగి ఉంది” అని Everts వివరిస్తుంది. “వివిధ సాంకేతిక పురోగతుల కారణంగా ఇది మరింత సమర్థవంతంగా శిక్షణ పొందింది.

“నాణ్యత దృక్కోణం నుండి, DBRX అత్యుత్తమ ఓపెన్-సోర్స్ మోడల్‌లలో ఒకటి అని మేము విశ్వసిస్తున్నాము మరియు మేము ‘ఉత్తమ’ని సూచించినప్పుడు, భాషా అవగాహన (MMLU), ప్రోగ్రామింగ్ (HumanEval)తో సహా అనేక రకాల పరిశ్రమ బెంచ్‌మార్క్‌లను సూచిస్తుంది. మరియు గణితం (GSM8K).”

ఓపెన్-సోర్స్ AI మోడల్ “కొద్దిమంది మోడల్ ప్రొవైడర్‌లకు మించి కస్టమ్ LLMల శిక్షణను ప్రజాస్వామ్యీకరించడం మరియు ప్రపంచ స్థాయి LLMలకు తమ డేటాపై తక్కువ ఖర్చుతో కూడిన మార్గంలో శిక్షణ ఇవ్వగలదని సంస్థలను చూపించడం” లక్ష్యంగా పెట్టుకుంది.

ఓపెన్ ఎకోసిస్టమ్స్ పట్ల వారి నిబద్ధతకు అనుగుణంగా, డేటాబ్రిక్స్ ఓపెన్ సోర్స్ కూడా చేసింది యూనిటీ కేటలాగ్.

“ఓపెన్-సోర్సింగ్ యూనిటీ కాటలాగ్ క్లౌడ్ ప్లాట్‌ఫారమ్‌లలో (ఉదా, AWS, అజూర్) మరియు ఆన్-ప్రిమిస్ ఇన్‌ఫ్రాస్ట్రక్చర్‌లలో దాని స్వీకరణను మెరుగుపరుస్తుంది,” అని Everts పేర్కొంది. “ఈ ఫ్లెక్సిబిలిటీ డేటా ఎక్కడ నిల్వ చేయబడిందో లేదా ప్రాసెస్ చేయబడిందనే దానితో సంబంధం లేకుండా డేటా గవర్నెన్స్ విధానాలను ఏకరీతిగా వర్తింపజేయడానికి సంస్థలను అనుమతిస్తుంది.”

యూనిటీ కేటలాగ్ వివిధ లక్షణాల ద్వారా డేటా విస్తరణ మరియు అస్థిరమైన యాక్సెస్ నియంత్రణల సవాళ్లను పరిష్కరిస్తుంది:

  1. కేంద్రీకృత డేటా యాక్సెస్ నిర్వహణ: “యూనిటీ కేటలాగ్ డేటా ఆస్తుల పాలనను కేంద్రీకరిస్తుంది, సంస్థలు ఏకీకృత పద్ధతిలో యాక్సెస్ నియంత్రణలను నిర్వహించడానికి అనుమతిస్తుంది,” అని ఎవర్ట్స్ పేర్కొంది.
  2. రోల్-బేస్డ్ యాక్సెస్ కంట్రోల్ (RBAC): Everts ప్రకారం, యూనిటీ కేటలాగ్ “రోల్-బేస్డ్ యాక్సెస్ కంట్రోల్ (RBAC)ని అమలు చేస్తుంది, యూజర్ ప్రొఫైల్‌ల ఆధారంగా పాత్రలు మరియు అనుమతులను కేటాయించడానికి సంస్థలను అనుమతిస్తుంది.”
  3. డేటా వంశం మరియు ఆడిటింగ్: ఈ ఫీచర్ “డేటా వినియోగం మరియు డిపెండెన్సీలను పర్యవేక్షించడానికి సంస్థలకు సహాయపడుతుంది, అనవసరమైన లేదా పాత డేటాను గుర్తించడం మరియు తొలగించడం సులభం చేస్తుంది” అని ఎవర్ట్స్ వివరిస్తుంది. ఇది “అన్ని డేటా యాక్సెస్ మరియు మార్పులను లాగ్ చేస్తుంది, డేటా భద్రతా విధానాలకు అనుగుణంగా ఉండేలా ఒక వివరణాత్మక ఆడిట్ ట్రయల్‌ను అందిస్తుంది” అని అతను జోడించాడు.
  4. క్రాస్ క్లౌడ్ మరియు హైబ్రిడ్ సపోర్ట్: యూనిటీ కేటలాగ్ “బహుళ క్లౌడ్ మరియు హైబ్రిడ్ పరిసరాలలో డేటా గవర్నెన్స్‌ని నిర్వహించడానికి రూపొందించబడింది” మరియు “డేటా ఎక్కడ ఉన్నా అది ఏకరీతిగా నిర్వహించబడుతుందని నిర్ధారిస్తుంది” అని ఎవర్ట్స్ అభిప్రాయపడ్డారు.

సంస్థ ప్రవేశపెట్టింది డేటాబ్రిక్స్ AI/BIడేటా అన్వేషణ మరియు విజువలైజేషన్‌ను మెరుగుపరచడానికి ఉత్పాదక AIని ప్రభావితం చేసే కొత్త వ్యాపార మేధస్సు ఉత్పత్తి. “వ్యాపార వినియోగదారుల ప్రశ్నలకు ప్రభావవంతంగా సమాధానం ఇవ్వడానికి నిజంగా తెలివైన BI సొల్యూషన్ వ్యాపారం యొక్క ప్రత్యేకమైన సెమాంటిక్స్ మరియు సూక్ష్మ నైపుణ్యాలను అర్థం చేసుకోవాలి” అని Everts అభిప్రాయపడ్డారు.

AI/BI వ్యవస్థ రెండు కీలక భాగాలను కలిగి ఉంటుంది:

  1. డాష్‌బోర్డ్‌లు: Everts దీనిని “వేగవంతమైన, ఇంటరాక్టివ్ డ్యాష్‌బోర్డ్‌లను సృష్టించడం మరియు పంపిణీ చేయడం కోసం AI-శక్తితో కూడిన, తక్కువ-కోడ్ ఇంటర్‌ఫేస్”గా వివరిస్తుంది. వీటిలో “విజువలైజేషన్‌లు, క్రాస్-ఫిల్టరింగ్ మరియు అదనపు నిర్వహణ సేవలు అవసరం లేకుండా ఆవర్తన నివేదికలు వంటి ప్రామాణిక BI ఫీచర్లు” ఉన్నాయి.
  2. జెనీ: ఎవర్ట్స్ దీనిని “సహజ భాష ద్వారా తాత్కాలిక మరియు తదుపరి ప్రశ్నలను పరిష్కరించడానికి సంభాషణ ఇంటర్‌ఫేస్”గా వివరిస్తుంది. ఇది “వినియోగదారు ప్రశ్నలకు ప్రతిస్పందనగా అనుకూల విజువలైజేషన్‌లు మరియు సూచనలను రూపొందించడానికి అంతర్లీన డేటా నుండి నేర్చుకుంటుంది, ఫీడ్‌బ్యాక్ ద్వారా కాలక్రమేణా మెరుగుపడుతుంది మరియు విశ్లేషకులకు దాని అవుట్‌పుట్‌లను మెరుగుపరచడానికి సాధనాలను అందజేస్తుంది” అని ఆయన జోడించారు.

డేటాబ్రిక్స్ AI/BI “మీ డేటా సెమాంటిక్స్‌పై లోతైన అవగాహనను అందించడానికి, సంస్థలోని ప్రతి ఒక్కరికీ స్వీయ-సేవ డేటా విశ్లేషణను” అందించడానికి రూపొందించబడిందని Everts పేర్కొంది. ఇది “ETL పైప్‌లైన్‌లు, వంశం మరియు ఇతర ప్రశ్నలతో సహా సంస్థ యొక్క మొత్తం డేటా స్టాక్‌లో వినియోగం నుండి నిరంతరం నేర్చుకునే సమ్మేళనం AI సిస్టమ్” ద్వారా శక్తిని పొందుతుందని అతను పేర్కొన్నాడు.

డేటాబ్రిక్స్‌ను కూడా ఆవిష్కరించారు మొజాయిక్ AIఇది “మెషిన్ లెర్నింగ్ మరియు ఉత్పాదక AI అప్లికేషన్‌లను నిర్మించడం, అమలు చేయడం మరియు నిర్వహించడం, మెరుగైన పనితీరు మరియు పాలన కోసం ఎంటర్‌ప్రైజ్ డేటాను సమగ్రపరచడం కోసం ఒక సమగ్ర వేదిక”గా Everts వివరిస్తుంది.

మొజాయిక్ AI అనేక కీలక భాగాలను అందిస్తుంది, ఇది Everts రూపురేఖలు:

  1. ఏకీకృత సాధనం: “AI మరియు ML సొల్యూషన్‌లను నిర్మించడం, అమలు చేయడం, మూల్యాంకనం చేయడం మరియు నియంత్రించడం, ప్రిడిక్టివ్ మోడల్‌లు మరియు ఉత్పాదక AI అప్లికేషన్‌లకు మద్దతు ఇవ్వడం కోసం సాధనాలను అందిస్తుంది.
  2. ఉత్పాదక AI నమూనాలు: “ప్రాంప్ట్ ఇంజనీరింగ్, రిట్రీవల్ ఆగ్మెంటెడ్ జనరేషన్ (RAG), ఫైన్-ట్యూనింగ్ మరియు ప్రీ-ట్రైనింగ్‌కు మద్దతు ఇస్తుంది, వ్యాపార అవసరాలు అభివృద్ధి చెందుతున్నప్పుడు వశ్యతను అందిస్తాయి.”
  3. కేంద్రీకృత నమూనా నిర్వహణ: “మోడల్ సర్వింగ్ కస్టమ్ ML మోడల్‌లు మరియు ఫౌండేషన్ మోడల్‌లతో సహా AI మోడల్‌ల యొక్క కేంద్రీకృత విస్తరణ, పాలన మరియు ప్రశ్నలను అనుమతిస్తుంది.”
  4. పర్యవేక్షణ మరియు పాలన: “లేక్‌హౌస్ మానిటరింగ్ మరియు యూనిటీ కేటలాగ్ AI జీవితచక్రం అంతటా సమగ్ర పర్యవేక్షణ, పాలన మరియు వంశ ట్రాకింగ్‌ని నిర్ధారిస్తుంది.”
  5. ఖర్చుతో కూడుకున్న కస్టమ్ LLMలు: “నిర్దిష్ట సంస్థాగత డొమైన్‌లకు అనుగుణంగా తక్కువ ఖర్చుతో కస్టమ్ లార్జ్ లాంగ్వేజ్ మోడల్‌లకు శిక్షణ ఇవ్వడం మరియు అందించడం ప్రారంభిస్తుంది.”

ఫౌండేషన్ మోడల్‌లను ఫైన్-ట్యూనింగ్ చేయడానికి మరియు అనుకూలీకరించడానికి మొజాయిక్ AI యొక్క విధానం “ఇన్-క్లస్టర్ బేస్ మోడల్ క్యాచింగ్‌ను ఉపయోగించడం,” “లైవ్ ప్రాంప్ట్ మూల్యాంకనం” ద్వారా “వేగవంతమైన ప్రారంభ సమయాలు” వంటి ప్రత్యేక లక్షణాలను కలిగి ఉందని Everts హైలైట్ చేస్తుంది, ఇక్కడ వినియోగదారులు “మోడల్ ప్రతిస్పందనలు ఎలా మారుతున్నాయో ట్రాక్ చేయవచ్చు. శిక్షణ ప్రక్రియ,” మరియు “కస్టమ్ ప్రీ-ట్రైన్డ్ చెక్‌పాయింట్‌లకు” మద్దతు.

ఈ ఆవిష్కరణల గుండె వద్ద ఉంది డేటా ఇంటెలిజెన్స్ ప్లాట్‌ఫారమ్ఇది “ఎంటర్‌ప్రైజ్ డేటా సెమాంటిక్స్‌లో లోతైన అంతర్దృష్టులను పొందడానికి AI మోడల్‌లను ఉపయోగించడం ద్వారా డేటా మేనేజ్‌మెంట్‌ను మారుస్తుంది” అని ఎవర్ట్స్ చెప్పింది. ప్లాట్‌ఫారమ్ డేటా లేక్‌లు మరియు డేటా వేర్‌హౌస్‌ల లక్షణాలను మిళితం చేస్తుంది, రియల్ టైమ్ డేటా ప్రాసెసింగ్ కోసం డెల్టా లేక్ టెక్నాలజీని ఉపయోగిస్తుంది మరియు సంస్థాగత సరిహద్దుల్లో సురక్షితమైన డేటా మార్పిడి కోసం డెల్టా షేరింగ్‌ను కలిగి ఉంటుంది.

అందించడం ద్వారా కొత్త AI మరియు డేటా-షేరింగ్ కార్యక్రమాలకు మద్దతు ఇవ్వడంలో డేటా ఇంటెలిజెన్స్ ప్లాట్‌ఫారమ్ కీలక పాత్ర పోషిస్తుందని Everts వివరిస్తుంది:

  1. ఏకీకృత డేటా మరియు AI ప్లాట్‌ఫారమ్ “డేటా లేక్‌లు మరియు డేటా వేర్‌హౌస్‌ల లక్షణాలను ఒకే ఆర్కిటెక్చర్‌గా మిళితం చేస్తుంది.”
  2. రియల్ టైమ్ డేటా ప్రాసెసింగ్ కోసం డెల్టా లేక్“విశ్వసనీయమైన డేటా గవర్నెన్స్, ACID లావాదేవీలు మరియు నిజ-సమయ డేటా ప్రాసెసింగ్”ను నిర్ధారిస్తుంది.
  3. సహకారం మరియు డేటా భాగస్వామ్యం డెల్టా షేరింగ్ ద్వారా, “సంస్థ సరిహద్దుల్లో సురక్షితమైన మరియు ఓపెన్ డేటా షేరింగ్”ని ప్రారంభిస్తుంది.
  4. మెషిన్ లెర్నింగ్ మరియు AI మోడల్ డెవలప్‌మెంట్ కోసం ఇంటిగ్రేటెడ్ సపోర్ట్ MLflow, PyTorch మరియు TensorFlow వంటి ప్రసిద్ధ లైబ్రరీలతో.
  5. స్కేలబిలిటీ మరియు పనితీరు దాని క్లౌడ్-నేటివ్ ఆర్కిటెక్చర్ మరియు ఫోటాన్ ఇంజిన్ ద్వారా, “ఒక ఆప్టిమైజ్డ్ క్వెరీ ఎగ్జిక్యూషన్ ఇంజిన్.”

కీలక స్పాన్సర్‌గా AI & బిగ్ డేటా ఎక్స్‌పో యూరోప్డేటాబ్రిక్స్ ఈవెంట్ సమయంలో వారి ఓపెన్ సోర్స్ AI మరియు డేటా గవర్నెన్స్ సొల్యూషన్‌లను ప్రదర్శించాలని యోచిస్తోంది.

“మా స్టాండ్‌లో, హగ్గింగ్ ఫేస్ నుండి ఓపెన్ సోర్స్ మోడల్‌లు మరియు యూనిటీ కేటలాగ్ నుండి డేటాను ఉపయోగించి మొదటి నుండి కస్టమ్ GenAI యాప్ – Lakehouse యాప్‌లతో ఎలా సృష్టించాలో మరియు అమలు చేయాలో కూడా మేము ప్రదర్శిస్తాము” అని Everts చెప్పారు.

“మా GenAI యాప్‌తో మీరు మీ స్వంత కార్టూన్ చిత్రాన్ని రూపొందించవచ్చు, అన్నీ డేటా ఇంటెలిజెన్స్ ప్లాట్‌ఫారమ్‌లో నడుస్తాయి.”

డేటాబ్రిక్స్ ఈ సంవత్సరం వారి నైపుణ్యాన్ని మరింత పంచుకుంటారు AI & బిగ్ డేటా ఎక్స్‌పో యూరోప్. ఓపెన్ AI మరియు డేటా గవర్నెన్స్‌ని మెరుగుపరచడం గురించి మరింత తెలుసుకోవడానికి స్టాండ్ #280 వద్ద డేటాబ్రిక్స్ బూత్ ద్వారా స్వింగ్ చేయండి.

TechForge ద్వారా అందించబడే ఇతర రాబోయే ఎంటర్‌ప్రైజ్ టెక్నాలజీ ఈవెంట్‌లు మరియు వెబ్‌నార్‌లను అన్వేషించండి ఇక్కడ.

టాగ్లు: AI, AI ఎక్స్‌పో, కృత్రిమ మేధస్సు, డేటా ఇంటెలిజెన్స్ ప్లాట్‌ఫారమ్, డేటాబ్రిక్స్, dbrx, ivo everts, పెద్ద భాషా నమూనాలు, llm, మొజాయిక్ AI, ఓపెన్ సోర్స్, ఓపెన్-సోర్స్, యూనిటీ కేటలాగ్

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Top