Hot News

ఎన్విడియా అనేక భాషలతో AI యొక్క సమస్యలను పరిష్కరించడం లక్ష్యంగా పెట్టుకుంది

AI సర్వత్రా అనిపించవచ్చు, ఇది ప్రధానంగా ప్రపంచంలోని 7,000 భాషలలో ఒక చిన్న భాగంలో పనిచేస్తుంది, ప్రపంచ జనాభాలో చాలా భాగాన్ని వదిలివేస్తుంది. ఎన్విడియా ముఖ్యంగా ఐరోపాలో, ఈ మెరుస్తున్న గుడ్డి ప్రదేశాన్ని పరిష్కరించడం లక్ష్యంగా పెట్టుకుంది.

25 వేర్వేరు యూరోపియన్ భాషలకు అధిక-నాణ్యత ప్రసంగం AI ని డెవలపర్‌లకు ఇచ్చే శక్తిని ఇచ్చే లక్ష్యంతో కంపెనీ ఓపెన్ సోర్స్ సాధనాల యొక్క శక్తివంతమైన కొత్త సెట్‌ను విడుదల చేసింది. ఇది ప్రధాన భాషలను కలిగి ఉంది, కానీ మరీ ముఖ్యంగా, క్రొయేషియన్, ఎస్టోనియన్ మరియు మాల్టీస్ వంటి పెద్ద టెక్ చేత తరచుగా పట్టించుకోని వారికి ఇది లైఫ్‌లైన్‌ను అందిస్తుంది.

కస్టమర్ సర్వీస్ బాట్‌లు మరియు కంటి రెప్పలో పనిచేసే అనువాద సేవలకు మిమ్మల్ని అర్థం చేసుకునే బహుభాషా చాట్‌బాట్‌ల నుండి, మనలో చాలా మందికి తీసుకునే వాయిస్-శక్తితో కూడిన సాధనాలను సృష్టించడం డెవలపర్‌లను అనుమతించడం లక్ష్యం.

ఈ చొరవ యొక్క కేంద్ర భాగం ధాన్యాగారంమానవ ప్రసంగం యొక్క అపారమైన లైబ్రరీ. ఇది సుమారు మిలియన్ గంటల ఆడియోను కలిగి ఉంది, ఇవన్నీ ప్రసంగ గుర్తింపు మరియు అనువాదం యొక్క సూక్ష్మ నైపుణ్యాలను నేర్పించడంలో సహాయపడతాయి.

ఈ ప్రసంగ డేటాను ఉపయోగించుకోవడానికి, ఎన్విడియా భాషా పనుల కోసం రూపొందించిన రెండు కొత్త AI మోడళ్లను కూడా అందిస్తోంది:

  • కానరీ -1 బి-వి 2సంక్లిష్ట ట్రాన్స్క్రిప్షన్ మరియు అనువాద ఉద్యోగాలపై అధిక ఖచ్చితత్వం కోసం నిర్మించిన పెద్ద మోడల్.
  • పారాకీట్-టిడిటి -0.6 బి-వి 3ఇది రియల్ టైమ్ అనువర్తనాల కోసం రూపొందించబడింది, ఇక్కడ వేగం ప్రతిదీ.

మీరు దాని వెనుక ఉన్న శాస్త్రంలోకి ప్రవేశించడానికి ఆసక్తి కలిగి ఉంటే, ధాన్యాగారంపై కాగితం ఈ నెలలో నెదర్లాండ్స్‌లో జరిగే ఇంటర్‌స్పీచ్ సమావేశంలో ప్రదర్శించబడుతుంది. డెవలపర్లు తమ చేతులను మురికిగా ఉండటానికి ఆసక్తిగా ఉన్నవారికి, డేటాసెట్ మరియు రెండు మోడల్స్ ఇప్పటికే ముఖాన్ని కౌగిలించుకోవడంలో అందుబాటులో ఉన్నాయి.

నిజమైన మేజిక్, అయితే, ఈ డేటా ఎలా సృష్టించబడిందనే దానిపై ఉంది. AI శిక్షణకు చాలా ఎక్కువ డేటా అవసరమని మనందరికీ తెలుసు, కాని దీనిని పొందడం సాధారణంగా మానవ ఉల్లేఖన యొక్క నెమ్మదిగా, ఖరీదైన మరియు స్పష్టంగా శ్రమతో కూడుకున్న ప్రక్రియ.

దీని చుట్టూ తిరగడానికి, ఎన్విడియా యొక్క ప్రసంగం AI బృందం – పరిశోధకులతో కలిసి పనిచేస్తోంది కార్నెగీ మెల్లన్ విశ్వవిద్యాలయం మరియు ఫోండాజియోన్ బ్రూనో కెస్లర్ – ఆటోమేటెడ్ పైప్‌లైన్‌ను నిర్మించారు. వారి స్వంత నెమో టూల్‌కిట్‌ను ఉపయోగించి, వారు ముడి, లేబుల్ చేయని ఆడియోను తీసుకొని, AI నుండి నేర్చుకోగల అధిక-నాణ్యత, నిర్మాణాత్మక డేటాగా కొట్టగలిగారు.

ఇది కేవలం సాంకేతిక సాధన కాదు; ఇది డిజిటల్ చేరిక కోసం భారీ ఎత్తు. దీని అర్థం రిగా లేదా జాగ్రెబ్‌లోని డెవలపర్ చివరకు వారి స్థానిక భాషలను సరిగ్గా అర్థం చేసుకునే వాయిస్-పవర్డ్ AI సాధనాలను నిర్మించగలడు. మరియు వారు దీన్ని మరింత సమర్థవంతంగా చేయగలరు. పరిశోధనా బృందం వారి ధాన్యాగార డేటా చాలా ప్రభావవంతంగా ఉందని కనుగొంది, ఇతర ప్రసిద్ధ డేటాసెట్లతో పోలిస్తే లక్ష్య ఖచ్చితత్వ స్థాయిని చేరుకోవడానికి దాని కంటే సగం మొత్తం పడుతుంది.

రెండు కొత్త నమూనాలు ఈ శక్తిని ప్రదర్శిస్తాయి. కానరీ స్పష్టంగా ఒక మృగం, అనువాదం మరియు ట్రాన్స్క్రిప్షన్ నాణ్యతను అందిస్తుంది, ఇది మోడళ్లను మూడు రెట్లు దాని పరిమాణానికి మూడు రెట్లు, కానీ పది రెట్లు వేగంతో ఉంటుంది. పారాకీట్, అదే సమయంలో, ఒకేసారి 24 నిమిషాల సమావేశ రికార్డింగ్ ద్వారా నమలవచ్చు, ఏ భాష మాట్లాడుతుందో స్వయంచాలకంగా గుర్తించడం. రెండు నమూనాలు విరామచిహ్నాలు, క్యాపిటలైజేషన్ మరియు వర్డ్-లెవల్ టైమ్‌స్టాంప్‌లను అందించడానికి తగినంత స్మార్ట్, ఇది ప్రొఫెషనల్-గ్రేడ్ అనువర్తనాలను నిర్మించడానికి అవసరం.

ఈ శక్తివంతమైన సాధనాలను మరియు వాటి వెనుక ఉన్న పద్ధతులను గ్లోబల్ చేతుల్లో పెట్టడం ద్వారా డెవలపర్ సంఘంఎన్విడియా కేవలం ఉత్పత్తిని విడుదల చేయలేదు. ఇది కొత్త ఆవిష్కరణను కిక్‌స్టార్టింగ్ చేస్తోంది, మీరు ఎక్కడ నుండి అయినా AI మీ భాష మాట్లాడే ప్రపంచాన్ని సృష్టించాలని ఆశతో.

(ఫోటో ఈడ్రియన్ సాలజర్)

ఇవి కూడా చూడండి: హువావే ఐ చిప్ విఫలమైన తర్వాత డీప్సీక్ ఆర్ 2 మోడల్ కోసం ఎన్విడియాకు తిరిగి వస్తుంది

పరిశ్రమ నాయకుల నుండి AI మరియు పెద్ద డేటా గురించి మరింత తెలుసుకోవాలనుకుంటున్నారా? తనిఖీ చేయండి AI & పెద్ద డేటా ఎక్స్‌పో ఆమ్స్టర్డామ్, కాలిఫోర్నియా మరియు లండన్లలో జరుగుతోంది. సమగ్ర సంఘటనతో సహా ఇతర ప్రముఖ సంఘటనలతో సహ-స్థాపించబడింది ఇంటెలిజెంట్ ఆటోమేషన్ కాన్ఫరెన్స్, బ్లాక్ఎక్స్, డిజిటల్ ట్రాన్స్ఫర్మేషన్ వీక్మరియు సైబర్ సెక్యూరిటీ & క్లౌడ్ ఎక్స్‌పో.

టెక్ఫోర్జ్ చేత శక్తినిచ్చే ఇతర రాబోయే ఎంటర్ప్రైజ్ టెక్నాలజీ ఈవెంట్స్ మరియు వెబ్‌నార్లను అన్వేషించండి ఇక్కడ.

Source link

Leave a Reply

Your email address will not be published. Required fields are marked *

Top