ప్రపంచ నమూనాలు – నిజ సమయంలో అనుకరణ వాతావరణాన్ని రూపొందించగల AI అల్గారిథమ్లు – మెషిన్ లెర్నింగ్ యొక్క మరింత ఆకర్షణీయమైన అప్లికేషన్లలో ఒకటి. గత సంవత్సరంలో, ఫీల్డ్లో చాలా కదలికలు ఉన్నాయి మరియు ఆ దిశగా, Google DeepMind ప్రకటించింది బుధవారం జెనీ 2. దాని పూర్వీకులు 2D ప్రపంచాలను రూపొందించడానికి పరిమితం చేయబడిన చోట, కొత్త మోడల్ 3D వాటిని సృష్టించగలదు మరియు వాటిని ఎక్కువ కాలం కొనసాగించగలదు.
జెనీ 2 గేమ్ ఇంజిన్ కాదు; బదులుగా, ఇది సాఫ్ట్వేర్ అనుకరిస్తున్న ప్రపంచంలో ఆటగాడు (మానవుడు లేదా మరొక AI ఏజెంట్) కదులుతున్నప్పుడు చిత్రాలను రూపొందించే ఒక వ్యాప్తి నమూనా. ఇది ఫ్రేమ్లను రూపొందిస్తున్నందున, Genie 2 పర్యావరణం గురించి ఆలోచనలను ఊహించగలదు, ఇది నీరు, పొగ మరియు భౌతిక ప్రభావాలను మోడల్ చేయగల సామర్థ్యాన్ని ఇస్తుంది – అయితే ఆ పరస్పర చర్యలలో కొన్ని చాలా గేమ్గా ఉంటాయి. మోడల్ మూడవ వ్యక్తి దృక్కోణం నుండి దృశ్యాలను అందించడానికి మాత్రమే పరిమితం కాదు, ఇది మొదటి వ్యక్తి మరియు ఐసోమెట్రిక్ దృక్కోణాలను కూడా నిర్వహించగలదు. Google స్వంత ఇమేజెన్ 3 మోడల్ లేదా వాస్తవ ప్రపంచంలోని ఏదైనా చిత్రం ద్వారా అందించబడిన ఒక ఇమేజ్ ప్రాంప్ట్ మాత్రమే దీన్ని ప్రారంభించాలి.
Genie 2ని పరిచయం చేస్తున్నాము: మా AI మోడల్, ఇది అంతులేని వైవిధ్యమైన ప్లే చేయగల 3D ప్రపంచాలను సృష్టించగలదు – అన్నీ ఒకే చిత్రం నుండి. 🖼️
ఈ రకమైన పెద్ద-స్థాయి ఫౌండేషన్ ప్రపంచ నమూనాలు భవిష్యత్ ఏజెంట్లకు అంతులేని సంఖ్యలో వర్చువల్ పరిసరాలలో శిక్షణ ఇవ్వడానికి మరియు మూల్యాంకనం చేయడానికి వీలు కల్పిస్తాయి. →… pic.twitter.com/qHCT6jqb1W
— Google DeepMind (@GoogleDeepMind) డిసెంబర్ 4, 2024
ముఖ్యంగా, Genie 2 ఆటగాడి వీక్షణ క్షేత్రాన్ని వదిలిపెట్టిన తర్వాత కూడా అనుకరణ దృశ్యంలోని భాగాలను గుర్తుంచుకోగలదు మరియు అవి మళ్లీ కనిపించిన తర్వాత వాటిని ఖచ్చితంగా పునర్నిర్మించగలదు. ఇది ఇతర ప్రపంచ మోడళ్లకు భిన్నంగా ఉంటుంది ఒయాసిస్అక్టోబరులో డెకార్ట్ ప్రజలకు చూపించిన సంస్కరణలో, దీని లేఅవుట్ను గుర్తుంచుకోవడంలో సమస్య ఉంది Minecraft ఇది నిజ సమయంలో ఉత్పత్తి చేసే స్థాయిలు.
అయితే, ఈ విషయంలో జెనీ 2 ఏమి చేయగలదో కూడా పరిమితులు ఉన్నాయి. DeepMind మోడల్ 60 సెకన్ల వరకు “స్థిరమైన” ప్రపంచాలను రూపొందించగలదని చెప్పింది, కంపెనీ బుధవారం పంచుకున్న ఉదాహరణలలో చాలా తక్కువ సమయం వరకు నడుస్తుంది; ఈ సందర్భంలో, చాలా వీడియోలు 10 నుండి 20 సెకన్ల నిడివిని కలిగి ఉంటాయి. అంతేకాకుండా, కళాఖండాలు ప్రవేశపెట్టబడ్డాయి మరియు స్థిరమైన ప్రపంచం యొక్క భ్రాంతిని కొనసాగించడానికి జెనీ 2కి అవసరమైనంత ఎక్కువ సమయం చిత్ర నాణ్యతను మృదువుగా చేస్తుంది.
డీప్మైండ్ అది “పెద్ద-స్థాయి వీడియో డేటాసెట్పై” ఆధారపడి ఉందని చెప్పడం మినహా జీనీ 2కి ఎలా శిక్షణ ఇచ్చిందో వివరించలేదు. డీప్మైండ్ ఎప్పుడైనా జెనీ 2ని ప్రజలకు విడుదల చేస్తుందని ఆశించవద్దు. ప్రస్తుతానికి, కంపెనీ తన స్వంత SIMA అల్గారిథమ్తో సహా ఇతర AI ఏజెంట్లకు శిక్షణ ఇవ్వడానికి మరియు మూల్యాంకనం చేయడానికి మోడల్ను ప్రాథమికంగా ఒక సాధనంగా చూస్తుంది మరియు ఏదైనా కళాకారులు మరియు డిజైనర్లు ప్రోటోటైప్ చేయడానికి మరియు ఆలోచనలను వేగంగా ప్రయత్నించడానికి ఉపయోగించవచ్చు. భవిష్యత్తులో, Genie 2 వంటి ప్రపంచ నమూనాలు కృత్రిమ సాధారణ మేధస్సు మార్గంలో ముఖ్యమైన పాత్ర పోషిస్తాయని డీప్మైండ్ సూచిస్తుంది.
“తగినంత సమృద్ధిగా మరియు విభిన్నమైన శిక్షణా వాతావరణాల లభ్యత ద్వారా మరింత సాధారణ మూర్తీభవించిన ఏజెంట్లకు శిక్షణ ఇవ్వడం సాంప్రదాయకంగా అడ్డంకిగా ఉంది” అని డీప్మైండ్ తెలిపింది. “మేము చూపినట్లుగా, జెనీ 2 భవిష్యత్ ఏజెంట్లను నవల ప్రపంచాల యొక్క అపరిమితమైన పాఠ్యాంశాల్లో శిక్షణ పొందేందుకు మరియు మూల్యాంకనం చేయడానికి వీలు కల్పిస్తుంది.”