Reps Mona Liza? Jaunais Microsoft AI animē sejas no fotoattēliem

Ana Ryu/Visual China Group/Getty Images

Microsoft zīme ir redzama uzņēmuma galvenajā mītnē 2023. gada 19. martā Sietlā, Vašingtonas štatā.


Ņujorka
CNN

Pateicoties jaunajai Microsoft mākslīgā intelekta tehnoloģijai, Mona Lisa tagad var darīt vairāk, nekā tikai smaidīt.

Pagājušajā nedēļā Microsoft pētnieki detalizēti izstrādāja jaunu AI modeli, ko viņi ir izstrādājuši, kas var uzņemt nekustīgu sejas attēlu un audio klipu, kurā kāds runā, un automātiski izveidot reālistisku video, kurā šī persona runā. Videoklipi, kurus var izveidot no reālām sejām, kā arī karikatūrām vai mākslas darbiem, ir papildināti ar pārliecinošu lūpu sinhronizāciju un dabiskām sejas un galvas kustībām.

Kādā eksperimentālā videoklipā pētnieki parādīja, kā viņi animēja Monu Lizu, lai tā deklamētu aktrises Annes Hetavejas komisku repa dziesmu.

Tiek izsaukti AI modeļa izvadi Vasa-1, gan uzjautrinoši, gan savā realitātē zināmā mērā pretrunīgi. Microsoft teica, ka tehnoloģiju varētu izmantot izglītībai, “uzlabojot pieejamību personām ar komunikācijas problēmām” vai, iespējams, lai radītu virtuālus pavadoņus cilvēkiem. Taču ir arī viegli saprast, kā šo rīku var ļaunprātīgi izmantot un izmantot, lai uzdotos par reāliem cilvēkiem.

Tā ir problēma, kas pārsniedz Microsoft: parādās arvien vairāk rīku, lai izveidotu pārliecinošus AI ģenerētus attēlus, videoklipus un audio klipus, Eksperti ir nobažījušies Un to ļaunprātīga izmantošana var izraisīt jaunas dezinformācijas formas. Daži arī uztraucas, ka tehnoloģijas var vēl vairāk traucēt radošās industrijas, sākot no filmām līdz reklāmai.

Šobrīd Microsoft paziņoja, ka neplāno nekavējoties izlaist VASA-1 modeli sabiedrībai. Šis solis ir līdzīgs tam, kā Microsoft partneris OpenAI risina apkārtējās bažas Mākslīgā intelekta ģenerēts video rīksSora: OpenAI ķircināja Sora februārī, taču līdz šim testēšanas nolūkos tas ir pieejams tikai dažiem profesionāliem lietotājiem un kiberdrošības profesoriem.

READ  LG saka, ka jaunais CineBeam Qube 4K projektors ir "elegants mākslas objekts"

“Mēs iebilstam pret jebkādu rīcību, lai radītu maldinošu vai kaitīgu saturu reāliem cilvēkiem,” savā emuāra ierakstā teica Microsoft pētnieki. Taču viņi piebilda, ka uzņēmums “nav plānos izlaist” produktu publiski “kamēr mēs nodrošināsim, ka tehnoloģija tiek izmantota atbildīgi un saskaņā ar atbilstošiem noteikumiem”.

Pētnieki teica, ka Microsoft jaunais mākslīgā intelekta modelis tika apmācīts vairākos video, kuros redzamas cilvēku sejas runāšanas laikā, un ir izstrādāts, lai atpazītu dabiskas sejas un galvas kustības, tostarp “lūpu kustības, (bez lūpu) izteiksmi, acu skatienu un mirkšķināšanu. ” citas lietas”. Rezultāts ir reālistiskāks video, kad VASA-1 panoramē nekustīgu attēlu.

Piemēram, vienā testa videoklipā, kurā redzams kāds satraukts cilvēks, šķietami spēlējot videospēles, runājošajai sejai bija sarauktas uzacis un savilktas lūpas.

AI rīku var arī novirzīt, lai izveidotu video, kurā objekts skatās noteiktā virzienā vai pauž noteiktas emocijas.

Skatoties uzmanīgi, joprojām ir pazīmes, kas liecina, ka videoklipi ir ģenerēti ar mašīnu, piemēram, reta mirkšķināšana un pārspīlētas uzacu kustības. Taču Microsoft paziņoja, ka tā uzskata, ka tā modelis “ievērojami pārspēj” citus līdzīgus rīkus un “paver ceļu reāllaika mijiedarbībai ar reālistiskiem iemiesojumiem, kas atdarina cilvēku sarunvalodas uzvedību”.

Alexis Wells

"Televīzijas speciālists. Lepna kafijas duncis. Tieksme uz apātijas lēkmēm. Interneta eksperts. Ceļojumu nindzja." <pre id="tw-target-text" class="tw-data-text tw-text-large XcVN5d tw-ta" data-placeholder="Translation"></pre>

Atbildēt

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti kā *

Back to top