చైనా సంస్థలు OpenAI మరియు ఇతర US-ఆధారిత AI కంపెనీలు అభివృద్ధి చేసిన సిస్టమ్ల సామర్థ్యాలకు పోటీగా AI మోడల్లను విడుదల చేస్తూనే ఉన్నాయి.
ఈ వారం, మినీమాక్స్ఆలీబాబా- మరియు టెన్సెంట్-ఆధారిత స్టార్టప్ కలిగి ఉంది పెంచారు వెంచర్ క్యాపిటల్లో దాదాపు $850 మిలియన్లు మరియు దీని విలువ $2.5 బిలియన్ల కంటే ఎక్కువ, రంగప్రవేశం చేసింది మూడు కొత్త మోడల్లు: MiniMax-Text-01, MiniMax-VL-01, మరియు T2A-01-HD. MiniMax-Text-01 అనేది టెక్స్ట్-మాత్రమే మోడల్, అయితే MiniMax-VL-01 ఇమేజ్లు మరియు టెక్స్ట్ రెండింటినీ అర్థం చేసుకోగలదు. T2A-01-HD, అదే సమయంలో, ఆడియోను ఉత్పత్తి చేస్తుంది — ప్రత్యేకంగా ప్రసంగం.
456 బిలియన్ పారామీటర్ల పరిమాణంలో ఉన్న MiniMax-Text-01, Google ఇటీవల ఆవిష్కరించిన మోడల్ల కంటే మెరుగ్గా పనిచేస్తుందని MiniMax పేర్కొంది. జెమిని 2.0 ఫ్లాష్ MATH మరియు SimpleQA వంటి బెంచ్మార్క్లపై, ఇది గణిత సమస్యలు మరియు వాస్తవ-ఆధారిత ప్రశ్నలకు సమాధానం ఇవ్వగల మోడల్ సామర్థ్యాన్ని కొలుస్తుంది. పారామితులు దాదాపుగా మోడల్ యొక్క సమస్య-పరిష్కార నైపుణ్యాలకు అనుగుణంగా ఉంటాయి మరియు ఎక్కువ పారామీటర్లు కలిగిన మోడల్లు సాధారణంగా తక్కువ పారామీటర్లు ఉన్న వాటి కంటే మెరుగ్గా పని చేస్తాయి.
MiniMax-VL-01 విషయానికొస్తే, ఇది ఆంత్రోపిక్లకు ప్రత్యర్థిగా ఉందని మినీమాక్స్ చెప్పింది క్లాడ్ 3.5 సొనెట్ చార్ట్క్యూఏ వంటి మల్టీమోడల్ అవగాహన అవసరమయ్యే మూల్యాంకనాలపై, ఇది గ్రాఫ్- మరియు రేఖాచిత్రం సంబంధిత ప్రశ్నలకు సమాధానమిచ్చే మోడల్లను టాస్క్ చేస్తుంది (ఉదా “ఈ గ్రాఫ్లోని నారింజ రేఖ యొక్క గరిష్ట విలువ ఏమిటి?”). నిజమే, MiniMax-VL-01 ఈ పరీక్షల్లో చాలా వరకు జెమిని 2.0 ఫ్లాష్ని ఉత్తమంగా చేయలేదు. OpenAI లు GPT-4o మరియు మెటాస్ లామా 3.1 అనేక మందిపై కూడా కొట్టారు.
గమనించదగినది, MiniMax-Text-01 చాలా పెద్ద సందర్భ విండోను కలిగి ఉంది. మోడల్ యొక్క సందర్భం లేదా సందర్భ విండో, అవుట్పుట్ (అదనపు వచనం) ఉత్పత్తి చేయడానికి ముందు మోడల్ పరిగణించే ఇన్పుట్ను (ఉదాహరణకు, టెక్స్ట్) సూచిస్తుంది. 4 మిలియన్ టోకెన్ల సందర్భ విండోతో, MiniMax-Text-01 దాదాపు 3 మిలియన్ పదాలను ఒకేసారి విశ్లేషించగలదు — లేదా “వార్ అండ్ పీస్” యొక్క ఐదు కాపీలకు పైగా.
సందర్భం కోసం (పన్ ఉద్దేశించబడలేదు), MiniMax-Text-01 యొక్క కాంటెక్స్ట్ విండో GPT-4o మరియు Llama 3.1ల పరిమాణం కంటే దాదాపు 31 రెట్లు ఎక్కువ.
ఈ వారంలో విడుదలైన MiniMax మోడల్లలో చివరిది, T2A-01-HD, ప్రసంగం కోసం ఆప్టిమైజ్ చేయబడిన ఆడియో జనరేటర్. T2A-01-HD ఇంగ్లీషు మరియు చైనీస్తో సహా దాదాపు 17 విభిన్న భాషలలో సర్దుబాటు చేయదగిన స్వరం, టోన్ మరియు టేనర్తో సింథటిక్ వాయిస్ని రూపొందించగలదు మరియు ఆడియో రికార్డింగ్లో కేవలం 10 సెకన్ల నుండి వాయిస్ని క్లోన్ చేస్తుంది.
MiniMax T2A-01-HDని ఇతర ఆడియో-ఉత్పత్తి మోడల్లతో పోల్చి బెంచ్మార్క్ ఫలితాలను ప్రచురించలేదు. కానీ ఈ రిపోర్టర్ చెవికి, T2A-01-HD అవుట్పుట్లు ఆడియో మోడల్లతో సమానంగా ధ్వనిస్తాయి మెటా మరియు స్టార్టప్లు వంటివి PlayAI.
MiniMax యొక్క API మరియు Hailuo AI ప్లాట్ఫారమ్ ద్వారా ప్రత్యేకంగా లభించే T2A-01-HD మినహా, MiniMax యొక్క కొత్త మోడల్లను GitHub మరియు AI dev ప్లాట్ఫారమ్ హగ్గింగ్ ఫేస్ నుండి డౌన్లోడ్ చేసుకోవచ్చు.
మోడల్లు “బహిరంగంగా” అందుబాటులో ఉన్నందున అవి కొన్ని అంశాలలో లాక్ చేయబడలేదని అర్థం కాదు. MiniMax-Text-01 మరియు MiniMax-VL-01 నిజంగా ఓపెన్ సోర్స్ కాదు మినీమాక్స్ వాటిని మొదటి నుండి పునఃసృష్టించడానికి అవసరమైన భాగాలను (ఉదా శిక్షణ డేటా) విడుదల చేయలేదు. అంతేకాకుండా, వారు MiniMax యొక్క నిర్బంధ లైసెన్స్లో ఉన్నారు, ఇది ప్రత్యర్థి AI మోడల్లను మెరుగుపరచడానికి మోడల్లను ఉపయోగించకుండా డెవలపర్లను నిషేధిస్తుంది మరియు 100 మిలియన్ల కంటే ఎక్కువ నెలవారీ క్రియాశీల వినియోగదారులతో ఉన్న ప్లాట్ఫారమ్లు MiniMax నుండి ప్రత్యేక లైసెన్స్ను అభ్యర్థించడం అవసరం.
మినీమాక్స్ 2021లో చైనా యొక్క అతిపెద్ద AI సంస్థల్లో ఒకటైన SenseTime మాజీ ఉద్యోగులచే స్థాపించబడింది. కంపెనీ ప్రాజెక్ట్లలో టాకీ వంటి యాప్లు ఉన్నాయి, ఇది AI- పవర్డ్ రోల్-ప్లేయింగ్ ప్లాట్ఫారమ్. అక్షరం AIమరియు MiniMax Hailuoలో విడుదల చేసిన టెక్స్ట్-టు-వీడియో మోడల్లు.
MiniMax యొక్క కొన్ని ఉత్పత్తులు చిన్నపాటి వివాదానికి దారితీశాయి.
పేర్కొనబడని “సాంకేతిక” కారణాల వల్ల డిసెంబర్లో Apple యాప్ స్టోర్ నుండి తీసివేయబడిన టాకీ, డోనాల్డ్ ట్రంప్, టేలర్ స్విఫ్ట్, ఎలోన్ మస్క్ మరియు లెబ్రాన్ జేమ్స్తో సహా పబ్లిక్ ఫిగర్స్ యొక్క AI అవతార్లను కలిగి ఉంది, వీరిలో ఎవరూ కూడా ఇందులో కనిపించడానికి అంగీకరించినట్లు కనిపించలేదు. అనువర్తనం.
డిసెంబరులో, ప్రసార పత్రిక నివేదించారు మినీమాక్స్ యొక్క వీడియో జనరేటర్లు బ్రిటిష్ టెలివిజన్ ఛానెల్ల లోగోలను పునరుత్పత్తి చేయగలవు, మినీమాక్స్ మోడల్లు ఆ ఛానెల్ల నుండి కంటెంట్పై శిక్షణ పొందాయని సూచిస్తున్నాయి. మరియు MiniMax నివేదించబడింది దావా వేయబడుతోంది iQIYI ద్వారా, iQIYI యొక్క కాపీరైట్ రికార్డింగ్లపై మినీమాక్స్ అక్రమంగా శిక్షణ పొందిందని ఆరోపించిన చైనీస్ వీడియో స్ట్రీమింగ్ సర్వీస్.
మినీమాక్స్ యొక్క కొత్త మోడల్లు అవుట్గోయింగ్ బిడెన్ అడ్మినిస్ట్రేషన్ తర్వాత కొన్ని రోజులకు వస్తాయి ప్రతిపాదించారు చైనీస్ వెంచర్ల కోసం AI సాంకేతికతలపై కఠినమైన ఎగుమతి నియమాలు మరియు పరిమితులు. చైనాలోని కంపెనీలు ఇప్పటికే అధునాతన AI చిప్లను కొనుగోలు చేయకుండా నిరోధించబడ్డాయి, అయితే కొత్త నియమాలు వ్రాసినట్లుగా అమలులోకి వస్తే, కంపెనీలు అధునాతన AI సిస్టమ్లను బూట్స్ట్రాప్ చేయడానికి అవసరమైన సెమీకండక్టర్ టెక్ మరియు మోడల్స్ రెండింటిపై కఠినమైన పరిమితులను ఎదుర్కొంటాయి.
బుధవారం, బిడెన్ అడ్మినిస్ట్రేషన్ ప్రకటించారు చైనా నుండి అధునాతన చిప్లను ఉంచడంపై దృష్టి సారించిన అదనపు చర్యలు. నిర్దిష్ట చిప్లను ఎగుమతి చేయాలనుకునే చిప్ ఫౌండరీలు మరియు ప్యాకేజింగ్ కంపెనీలు తమ ఉత్పత్తులను చైనీస్ క్లయింట్లకు చేరకుండా నిరోధించడానికి ఎక్కువ పరిశీలన మరియు తగిన శ్రద్ధతో వ్యవహరించనంత వరకు విస్తృత లైసెన్స్ అవసరాలకు లోబడి ఉంటాయి.