AI సర్వత్రా అనిపించవచ్చు, ఇది ప్రధానంగా ప్రపంచంలోని 7,000 భాషలలో ఒక చిన్న భాగంలో పనిచేస్తుంది, ప్రపంచ జనాభాలో చాలా భాగాన్ని వదిలివేస్తుంది. ఎన్విడియా ముఖ్యంగా ఐరోపాలో, ఈ మెరుస్తున్న గుడ్డి ప్రదేశాన్ని పరిష్కరించడం లక్ష్యంగా పెట్టుకుంది.
25 వేర్వేరు యూరోపియన్ భాషలకు అధిక-నాణ్యత ప్రసంగం AI ని డెవలపర్లకు ఇచ్చే శక్తిని ఇచ్చే లక్ష్యంతో కంపెనీ ఓపెన్ సోర్స్ సాధనాల యొక్క శక్తివంతమైన కొత్త సెట్ను విడుదల చేసింది. ఇది ప్రధాన భాషలను కలిగి ఉంది, కానీ మరీ ముఖ్యంగా, క్రొయేషియన్, ఎస్టోనియన్ మరియు మాల్టీస్ వంటి పెద్ద టెక్ చేత తరచుగా పట్టించుకోని వారికి ఇది లైఫ్లైన్ను అందిస్తుంది.
కస్టమర్ సర్వీస్ బాట్లు మరియు కంటి రెప్పలో పనిచేసే అనువాద సేవలకు మిమ్మల్ని అర్థం చేసుకునే బహుభాషా చాట్బాట్ల నుండి, మనలో చాలా మందికి తీసుకునే వాయిస్-శక్తితో కూడిన సాధనాలను సృష్టించడం డెవలపర్లను అనుమతించడం లక్ష్యం.
ఈ చొరవ యొక్క కేంద్ర భాగం ధాన్యాగారంమానవ ప్రసంగం యొక్క అపారమైన లైబ్రరీ. ఇది సుమారు మిలియన్ గంటల ఆడియోను కలిగి ఉంది, ఇవన్నీ ప్రసంగ గుర్తింపు మరియు అనువాదం యొక్క సూక్ష్మ నైపుణ్యాలను నేర్పించడంలో సహాయపడతాయి.
ఈ ప్రసంగ డేటాను ఉపయోగించుకోవడానికి, ఎన్విడియా భాషా పనుల కోసం రూపొందించిన రెండు కొత్త AI మోడళ్లను కూడా అందిస్తోంది:
- కానరీ -1 బి-వి 2సంక్లిష్ట ట్రాన్స్క్రిప్షన్ మరియు అనువాద ఉద్యోగాలపై అధిక ఖచ్చితత్వం కోసం నిర్మించిన పెద్ద మోడల్.
- పారాకీట్-టిడిటి -0.6 బి-వి 3ఇది రియల్ టైమ్ అనువర్తనాల కోసం రూపొందించబడింది, ఇక్కడ వేగం ప్రతిదీ.
మీరు దాని వెనుక ఉన్న శాస్త్రంలోకి ప్రవేశించడానికి ఆసక్తి కలిగి ఉంటే, ధాన్యాగారంపై కాగితం ఈ నెలలో నెదర్లాండ్స్లో జరిగే ఇంటర్స్పీచ్ సమావేశంలో ప్రదర్శించబడుతుంది. డెవలపర్లు తమ చేతులను మురికిగా ఉండటానికి ఆసక్తిగా ఉన్నవారికి, డేటాసెట్ మరియు రెండు మోడల్స్ ఇప్పటికే ముఖాన్ని కౌగిలించుకోవడంలో అందుబాటులో ఉన్నాయి.
నిజమైన మేజిక్, అయితే, ఈ డేటా ఎలా సృష్టించబడిందనే దానిపై ఉంది. AI శిక్షణకు చాలా ఎక్కువ డేటా అవసరమని మనందరికీ తెలుసు, కాని దీనిని పొందడం సాధారణంగా మానవ ఉల్లేఖన యొక్క నెమ్మదిగా, ఖరీదైన మరియు స్పష్టంగా శ్రమతో కూడుకున్న ప్రక్రియ.
దీని చుట్టూ తిరగడానికి, ఎన్విడియా యొక్క ప్రసంగం AI బృందం – పరిశోధకులతో కలిసి పనిచేస్తోంది కార్నెగీ మెల్లన్ విశ్వవిద్యాలయం మరియు ఫోండాజియోన్ బ్రూనో కెస్లర్ – ఆటోమేటెడ్ పైప్లైన్ను నిర్మించారు. వారి స్వంత నెమో టూల్కిట్ను ఉపయోగించి, వారు ముడి, లేబుల్ చేయని ఆడియోను తీసుకొని, AI నుండి నేర్చుకోగల అధిక-నాణ్యత, నిర్మాణాత్మక డేటాగా కొట్టగలిగారు.
ఇది కేవలం సాంకేతిక సాధన కాదు; ఇది డిజిటల్ చేరిక కోసం భారీ ఎత్తు. దీని అర్థం రిగా లేదా జాగ్రెబ్లోని డెవలపర్ చివరకు వారి స్థానిక భాషలను సరిగ్గా అర్థం చేసుకునే వాయిస్-పవర్డ్ AI సాధనాలను నిర్మించగలడు. మరియు వారు దీన్ని మరింత సమర్థవంతంగా చేయగలరు. పరిశోధనా బృందం వారి ధాన్యాగార డేటా చాలా ప్రభావవంతంగా ఉందని కనుగొంది, ఇతర ప్రసిద్ధ డేటాసెట్లతో పోలిస్తే లక్ష్య ఖచ్చితత్వ స్థాయిని చేరుకోవడానికి దాని కంటే సగం మొత్తం పడుతుంది.
రెండు కొత్త నమూనాలు ఈ శక్తిని ప్రదర్శిస్తాయి. కానరీ స్పష్టంగా ఒక మృగం, అనువాదం మరియు ట్రాన్స్క్రిప్షన్ నాణ్యతను అందిస్తుంది, ఇది మోడళ్లను మూడు రెట్లు దాని పరిమాణానికి మూడు రెట్లు, కానీ పది రెట్లు వేగంతో ఉంటుంది. పారాకీట్, అదే సమయంలో, ఒకేసారి 24 నిమిషాల సమావేశ రికార్డింగ్ ద్వారా నమలవచ్చు, ఏ భాష మాట్లాడుతుందో స్వయంచాలకంగా గుర్తించడం. రెండు నమూనాలు విరామచిహ్నాలు, క్యాపిటలైజేషన్ మరియు వర్డ్-లెవల్ టైమ్స్టాంప్లను అందించడానికి తగినంత స్మార్ట్, ఇది ప్రొఫెషనల్-గ్రేడ్ అనువర్తనాలను నిర్మించడానికి అవసరం.
ఈ శక్తివంతమైన సాధనాలను మరియు వాటి వెనుక ఉన్న పద్ధతులను గ్లోబల్ చేతుల్లో పెట్టడం ద్వారా డెవలపర్ సంఘంఎన్విడియా కేవలం ఉత్పత్తిని విడుదల చేయలేదు. ఇది కొత్త ఆవిష్కరణను కిక్స్టార్టింగ్ చేస్తోంది, మీరు ఎక్కడ నుండి అయినా AI మీ భాష మాట్లాడే ప్రపంచాన్ని సృష్టించాలని ఆశతో.
(ఫోటో ఈడ్రియన్ సాలజర్)
ఇవి కూడా చూడండి: హువావే ఐ చిప్ విఫలమైన తర్వాత డీప్సీక్ ఆర్ 2 మోడల్ కోసం ఎన్విడియాకు తిరిగి వస్తుంది

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్పో.
టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్నార్లను అన్వేషించండి ఇక్కడ.