మీకు ఒక సంస్థ ఉంది నువ్వులు మాయకు శక్తినిచ్చే బేస్ మోడల్‌ను విడుదల చేసింది రియలిస్టిక్ వాయిస్ అసిస్టెంట్.

1 బిలియన్ పారామితుల పరిమాణంలో ఉన్న మోడల్ (మోడల్ యొక్క వ్యక్తిగత భాగాలను సూచించే “పారామితులు”), అపాచీ 2.0 లైసెన్స్ క్రింద ఉంది, అంటే దీనిని కొన్ని పరిమితులతో వాణిజ్యపరంగా ఉపయోగించవచ్చు. CSM-1B అని పిలుస్తారు, మోడల్ టెక్స్ట్ మరియు ఆడియో ఇన్‌పుట్‌ల నుండి “RVQ ఆడియో కోడ్‌లు” ను ఉత్పత్తి చేస్తుంది AI దేవ్ ప్లాట్‌ఫాం కౌగిలించుకునే ముఖం మీద నువ్వుల వివరణ.

RVQ “అవశేష వెక్టర్ క్వాంటైజేషన్” ను సూచిస్తుంది, ఆడియోను కోడ్‌లు అని పిలువబడే వివిక్త టోకెన్లుగా ఎన్కోడింగ్ చేసే సాంకేతికత. RVQ ఉపయోగించబడుతుంది ఇటీవలి అనేక AI ఆడియో టెక్నాలజీలలోగూగుల్ యొక్క సౌండ్‌స్ట్రీమ్ మరియు మెటా యొక్క ఎన్‌కోడెక్‌తో సహా.

CSM-1B నుండి ఒక మోడల్‌ను ఉపయోగిస్తుంది మెటా యొక్క లామా కుటుంబం దాని వెన్నెముక ఆడియో “డీకోడర్” భాగం తో జతచేయబడింది. CSM పవర్స్ మాయ యొక్క చక్కటి ట్యూన్ వేరియంట్, సెసేమ్ చెప్పారు.

“ఇక్కడ ఓపెన్-సోర్స్డ్ మోడల్ బేస్ జనరేషన్ మోడల్,” సెసేమ్ CSM-1B లలో రాశాడు ముఖాన్ని కౌగిలించుకోవడం మరియు గిరబ్ రిపోజిటరీలు. “ఇది అనేక రకాల స్వరాలను ఉత్పత్తి చేయగలదు, కానీ శిక్షణ డేటాలో డేటా కాలుష్యం కారణంగా మోడల్ ఆంగ్లేతర భాషలకు కొంత సామర్థ్యాన్ని కలిగి ఉంది, కానీ ఇది బాగా చేయదు.”

CSM-1B కి శిక్షణ ఇవ్వడానికి డేటా నువ్వులు ఏవి అని అస్పష్టంగా ఉంది. సంస్థ చెప్పలేదు.

మోడల్ మాట్లాడటానికి నిజమైన భద్రతలు లేవు. సెసేమ్ ఒక గౌరవ వ్యవస్థను కలిగి ఉంది మరియు డెవలపర్లు మరియు వినియోగదారులను ఒక వ్యక్తి యొక్క స్వరాన్ని వారి అనుమతి లేకుండా అనుకరించటానికి, నకిలీ వార్తలు వంటి తప్పుదోవ పట్టించే కంటెంట్‌ను సృష్టించడానికి లేదా “హానికరమైన” లేదా “హానికరమైన” కార్యకలాపాలలో పాల్గొనడానికి మోడల్‌ను ఉపయోగించవద్దని కోరుతుంది.

నేను ప్రయత్నించాను డెమో ముఖాన్ని కౌగిలించుకుని, నా గొంతును క్లోనింగ్ చేయడానికి ఒక నిమిషం కన్నా తక్కువ సమయం పట్టింది. అక్కడ నుండి, ఎన్నికలు మరియు రష్యన్ ప్రచారం వంటి వివాదాస్పద అంశాలతో సహా నా హృదయ కోరికకు ప్రసంగం చేయడం చాలా సులభం.

వినియోగదారుల నివేదికలు ఇటీవల మార్కెట్లో అనేక ప్రసిద్ధ AI- శక్తితో కూడిన వాయిస్ క్లోనింగ్ సాధనాలు “అర్ధవంతమైన” భద్రతలు లేవు మోసం లేదా దుర్వినియోగాన్ని నివారించడానికి.

ఓకులస్ కో-సృష్టికర్త బ్రెండన్ ఇరిబే సహ-స్థాపించబడిన సెసేమ్, ఫిబ్రవరి చివరలో దాని అసిస్టెంట్ టెక్ కోసం వైరల్ అయ్యింది, ఇది అసాధారణమైన వ్యాలీ భూభాగాన్ని క్లియర్ చేయడానికి దగ్గరగా వస్తుంది. మాయ మరియు సెసేమ్ యొక్క ఇతర సహాయకుడు మైల్స్, శ్వాసలు తీసుకోండి మరియు నిరాశతో మాట్లాడండి మరియు మాట్లాడేటప్పుడు అంతరాయం కలిగించవచ్చు, ఓపెనాయ్ యొక్క వాయిస్ మోడ్ వంటిది.

సెసేమ్ ఆండ్రీసెన్ హొరోవిట్జ్, స్పార్క్ క్యాపిటల్ మరియు మ్యాట్రిక్స్ భాగస్వాముల నుండి తెలియని మూలధనాన్ని పెంచింది. వాయిస్ అసిస్టెంట్ టెక్‌ను నిర్మించడంతో పాటు, AI గ్లాసులను ప్రోటోటైప్ చేయడం “రోజంతా ధరించడానికి రూపొందించబడింది” దాని అనుకూల మోడళ్లతో అమర్చబడి ఉంటుంది.



Source link