omnihuman

ആര്‍ട്ടിഫിഷ്യല്‍ ഇന്‍റലിജന്‍സ് രംഗം ദിനം പ്രതി പുതിയ പരീക്ഷണങ്ങള്‍ക്കും കണ്ടുപിടിത്തങ്ങള്‍ക്കും സാക്ഷ്യം വഹിക്കുന്ന കാലമാണ്. ഡീപ് ഫെയ്ക്ക് വീഡിയോകള്‍ നിര്‍മിക്കുന്ന ഒട്ടേറെ ടൂളുകള്‍ നിലവിലുണ്ടെങ്കിലും, അവയെ എല്ലാം കടത്തിവെട്ടുന്ന ടൂള്‍ പുറത്തിറക്കി ടിക്‌ടോക്കിന്‍റെ മാതൃകമ്പനിയായ ബൈറ്റ്ഡാന്‍സ്. ഒരു ഫോട്ടോ നല്‍കിയാല്‍ ജീവനുള്ള വീഡിയോ നിര്‍മിക്കാന്‍ കഴിയുന്ന ഈ എഐ മോഡല്‍ നിര്‍മിച്ച സാമ്പിള്‍ വീഡിയോകള്‍ അതിശയിപ്പിക്കുന്നവയാണ് എന്നാണ് ഫോബ്സിന്‍റെ റിപ്പോര്‍ട്ട്. ഒമ്നിഹ്യൂമണ്‍-1 (OmniHuman-1) എന്നാണ് ഈ എഐ ടൂളിന്‍റെ പേര്.

18,700 മണിക്കൂറിലധികം ദൈർഘ്യമുള്ള വീഡിയോകളാണ് പുതിയ AI ടൂളിനെ പരിശീലിപ്പിക്കാൻ ഉപയോഗിച്ചത്. ടെക്സ്റ്റ്, ഓഡിയോ, ഫിസിക്കൽ പോസുകൾ പോലെ നിരവധി ഇൻപുട്ടുകളും ഈ ടൂളുകൾക്ക് നൽകിയിരുന്നു. ഇമേജ്-ടു-വീഡിയോ ജനറേറ്റർ ആയ ആദ്യത്തെ AI ടൂൾ ഓമ്നിഹ്യൂമൻ-1 അല്ലെങ്കിലും ടിക് ടോക്കിൽ നിന്നുള്ള നിരവധി വീഡിയോകളിൽ നിന്ന് പരിശീലനം ലഭിച്ചിട്ടുണ്ട് എന്ന പ്രത്യേകതയും ഉണ്ട്.

ഒമ്നിഹ്യൂമണ്‍-1 എഐ ടൂളിന്‍റെ മികവ് എത്രത്തോളമുണ്ട് എന്ന് കാണിക്കാന്‍ ഉദാഹരണ വീഡിയോ ഒമ്നിഹ്യൂമണ്‍-1ന്‍റെ പ്രൊജക്റ്റ് പേജില്‍ നല്‍കിയിട്ടുണ്ട്. വിഖ്യാത ഭൗതികശാസ്ത്രജ്ഞനായ ആൽബർട്ട് ഐൻസ്റ്റൈന്‍റെ ഒരു ചിത്രം ഉപയോഗിച്ച് അദേഹം ക്ലാസെടുക്കുന്ന വീഡിയോ സൃഷ്ടിച്ചതിന്‍റെ സാമ്പിള്‍ ഒമ്നിഹ്യൂമണ്‍ പങ്കുവെച്ചു. ഐൻസ്റ്റൈന്‍ സംസാരിക്കുന്നതിന് പുറമെ, അദേഹത്തിന്‍റെ കൈകളുടെ ചലനവും വൈകാരികതയും വ്യക്തമാവുന്ന തരത്തിലാണ് ഈ വീഡിയോ ഒമ്നിഹ്യൂമണ്‍-1 സൃഷ്ടിച്ചിരിക്കുന്നത്.

ഒരു ഫോട്ടോ മാത്രം ഉപയോഗിച്ച് ആളുകൾ സംസാരിക്കുന്നതിന്റെയും സംഗീത ഉപകരണങ്ങൾ വായിക്കുന്നതിന്റെയും മറ്റു പ്രവർത്തികളിൽ ഏർപ്പെടുന്നതിന്റെയും വീഡിയോ ശബ്ദമടക്കം ഉപയോഗിച്ച് നിർമിക്കാനാവും. ആളുകളുടെ ശബ്ദത്തിന്റെ സാമ്പിളുകൾ കൊടുത്താൽ ആ ശബ്ദത്തിന് അനുസരിച്ചുള്ള ശാരീരിക ചലനങ്ങൾ അടക്കം ഉൾപ്പെടുത്തിയാണ് AI ടൂൾ വീഡിയോ നിർമിക്കുന്നത്. ഏത് തരം ചിത്രങ്ങളിൽ നിന്നും ഇത്തരത്തിൽ വീഡിയോ നിർമിക്കാൻ സാധിക്കുമെന്നാണ് ബൈറ്റ്ഡാൻസ് പറയുന്നത്. മറ്റ് AI ടൂളുകളെക്കാൾ മികച്ചതാണ് ണ് ഓമ്‌നിഹ്യൂമൻ-1 വിവിധ ഭാഗങ്ങളിൽ നിന്നുള്ള ആംഗ്യങ്ങളും ശബ്ദവ്യത്യാസങ്ങളും വീഡിയോയിൽ ഉൾപ്പെടുത്താൻ ഓമ്‌നിഹ്യൂമന് കഴിയും.

ഏത് ആസ്പെക്റ്റ് റേഷ്വോയിലുള്ള ചിത്രവും ഈ ടൂളിൽ അപ്‌ലോഡ് ചെയ്യാം. പോർട്രെയ്റ്റ്, ഹാഫ്-ബോഡി, ഫുൾ-ബോഡി ചിത്രങ്ങൾ ഒക്കെ ഒമ്നിഹ്യൂമൺ-1 സ്വീകരിക്കും. ഈ ചിത്രം വിശകലനം ചെയ്തുകൊണ്ട്, അതിനെ ജീവസ്സുറ്റ വീഡിയോകളാക്കി മാറ്റാൻ ഒമ്നിഹ്യൂമൺ-1ന് കഴിയും.

ENGLISH SUMMARY:

ByteDance, the parent company of TikTok, has unveiled OmniHuman-1, an advanced AI tool that surpasses existing deepfake video generators. This model can create lifelike videos from a single photo, producing astonishingly realistic results. According to a Forbes report, the sample videos generated by OmniHuman-1 have impressed experts.