మీకు ఒక సంస్థ ఉంది నువ్వులు మాయకు శక్తినిచ్చే బేస్ మోడల్ను విడుదల చేసింది రియలిస్టిక్ వాయిస్ అసిస్టెంట్.
1 బిలియన్ పారామితుల పరిమాణంలో ఉన్న మోడల్ (మోడల్ యొక్క వ్యక్తిగత భాగాలను సూచించే “పారామితులు”), అపాచీ 2.0 లైసెన్స్ క్రింద ఉంది, అంటే దీనిని కొన్ని పరిమితులతో వాణిజ్యపరంగా ఉపయోగించవచ్చు. CSM-1B అని పిలుస్తారు, మోడల్ టెక్స్ట్ మరియు ఆడియో ఇన్పుట్ల నుండి “RVQ ఆడియో కోడ్లు” ను ఉత్పత్తి చేస్తుంది AI దేవ్ ప్లాట్ఫాం కౌగిలించుకునే ముఖం మీద నువ్వుల వివరణ.
RVQ “అవశేష వెక్టర్ క్వాంటైజేషన్” ను సూచిస్తుంది, ఆడియోను కోడ్లు అని పిలువబడే వివిక్త టోకెన్లుగా ఎన్కోడింగ్ చేసే సాంకేతికత. RVQ ఉపయోగించబడుతుంది ఇటీవలి అనేక AI ఆడియో టెక్నాలజీలలోగూగుల్ యొక్క సౌండ్స్ట్రీమ్ మరియు మెటా యొక్క ఎన్కోడెక్తో సహా.
CSM-1B నుండి ఒక మోడల్ను ఉపయోగిస్తుంది మెటా యొక్క లామా కుటుంబం దాని వెన్నెముక ఆడియో “డీకోడర్” భాగం తో జతచేయబడింది. CSM పవర్స్ మాయ యొక్క చక్కటి ట్యూన్ వేరియంట్, సెసేమ్ చెప్పారు.
“ఇక్కడ ఓపెన్-సోర్స్డ్ మోడల్ బేస్ జనరేషన్ మోడల్,” సెసేమ్ CSM-1B లలో రాశాడు ముఖాన్ని కౌగిలించుకోవడం మరియు గిరబ్ రిపోజిటరీలు. “ఇది అనేక రకాల స్వరాలను ఉత్పత్తి చేయగలదు, కానీ శిక్షణ డేటాలో డేటా కాలుష్యం కారణంగా మోడల్ ఆంగ్లేతర భాషలకు కొంత సామర్థ్యాన్ని కలిగి ఉంది, కానీ ఇది బాగా చేయదు.”
CSM-1B కి శిక్షణ ఇవ్వడానికి డేటా నువ్వులు ఏవి అని అస్పష్టంగా ఉంది. సంస్థ చెప్పలేదు.
మోడల్ మాట్లాడటానికి నిజమైన భద్రతలు లేవు. సెసేమ్ ఒక గౌరవ వ్యవస్థను కలిగి ఉంది మరియు డెవలపర్లు మరియు వినియోగదారులను ఒక వ్యక్తి యొక్క స్వరాన్ని వారి అనుమతి లేకుండా అనుకరించటానికి, నకిలీ వార్తలు వంటి తప్పుదోవ పట్టించే కంటెంట్ను సృష్టించడానికి లేదా “హానికరమైన” లేదా “హానికరమైన” కార్యకలాపాలలో పాల్గొనడానికి మోడల్ను ఉపయోగించవద్దని కోరుతుంది.
నేను ప్రయత్నించాను డెమో ముఖాన్ని కౌగిలించుకుని, నా గొంతును క్లోనింగ్ చేయడానికి ఒక నిమిషం కన్నా తక్కువ సమయం పట్టింది. అక్కడ నుండి, ఎన్నికలు మరియు రష్యన్ ప్రచారం వంటి వివాదాస్పద అంశాలతో సహా నా హృదయ కోరికకు ప్రసంగం చేయడం చాలా సులభం.
వినియోగదారుల నివేదికలు ఇటీవల మార్కెట్లో అనేక ప్రసిద్ధ AI- శక్తితో కూడిన వాయిస్ క్లోనింగ్ సాధనాలు “అర్ధవంతమైన” భద్రతలు లేవు మోసం లేదా దుర్వినియోగాన్ని నివారించడానికి.
ఓకులస్ కో-సృష్టికర్త బ్రెండన్ ఇరిబే సహ-స్థాపించబడిన సెసేమ్, ఫిబ్రవరి చివరలో దాని అసిస్టెంట్ టెక్ కోసం వైరల్ అయ్యింది, ఇది అసాధారణమైన వ్యాలీ భూభాగాన్ని క్లియర్ చేయడానికి దగ్గరగా వస్తుంది. మాయ మరియు సెసేమ్ యొక్క ఇతర సహాయకుడు మైల్స్, శ్వాసలు తీసుకోండి మరియు నిరాశతో మాట్లాడండి మరియు మాట్లాడేటప్పుడు అంతరాయం కలిగించవచ్చు, ఓపెనాయ్ యొక్క వాయిస్ మోడ్ వంటిది.
సెసేమ్ ఆండ్రీసెన్ హొరోవిట్జ్, స్పార్క్ క్యాపిటల్ మరియు మ్యాట్రిక్స్ భాగస్వాముల నుండి తెలియని మూలధనాన్ని పెంచింది. వాయిస్ అసిస్టెంట్ టెక్ను నిర్మించడంతో పాటు, AI గ్లాసులను ప్రోటోటైప్ చేయడం “రోజంతా ధరించడానికి రూపొందించబడింది” దాని అనుకూల మోడళ్లతో అమర్చబడి ఉంటుంది.