Šoreiz pagājušajā gadā sociālajos tīklos dega MyHeritage vīruss “Deep Nostalgia”, kura AI burvība atdzīvina mūsu vecās ģimenes fotogrāfijas ar satraucošu reālismu. Ja jūs tas satrauc, pagaidiet, līdz redzat jauno funkciju, kuru es tikko izsaucu LiveStory.
Šoreiz tiešsaistes ģenealoģijas uzņēmuma tehnoloģija nerada mazu klipu ar 10–20 klipiem, pamatojoties uz vecu jūsu radinieka fotoattēlu. Tā vietā LiveStory iet tālāk, izveidojot garāku animētu video par jūsu senci, kas stāsta par visu viņa dzīvi, papildinot to ar lūpu sinhronizācijas audio un vecu fotoattēlu slaidrādi.
Tāpat kā iepriekš, tas darbojas, izmantojot AI darbinātu “atkārtotas darbības” tehnoloģiju, kas animē jūsu radinieka sejas attēlu. Taču šoreiz jūs saņemat arī balsi, kas tiek automātiski ģenerēta no MyHeritage ciltskoka vai ievadīta manuāli. Tad teksta pārvēršanas runā tehnoloģija atdzīvina stāstu, un balss tiek sinhronizēta ar jūsu radinieka kustīgo skaļruni.
Kā tas strādā?
Tāpat kā pagājušā gada “Deep Nostalgia” tehnoloģija, arī LiveStory animācijas tiek veidotas, izmantojot lielu “draiveru video” kolekciju. Kad pakalpojuma algoritmi ir analizējuši jūsu augšupielādēto attēlu, tā nozīmīgākās iezīmes vai sejas “iezīmes” tiek kartētas vadītāja video, lai radītu kustības iespaidu. Algoritmi arī aizpilda visas trūkstošās detaļas. Sintētiskais balss ģenerators arī veido stāstījumu, pamatojoties uz personas profilā esošo informāciju, vai arī varat izveidot savu skriptu no jauna. Varat arī augšupielādēt savu audio ierakstu.
MyHeritage un D-ID, Izraēlas uzņēmums, kas rada un licencē tehnoloģiju, saka, ka gala rezultāts ir pilnībā pielāgojams, sniedzot iespēju mainīt stāstījumu, attēlus un audio pirms to nosūtīšanas uz ģimeni vai sociālajiem medijiem. Šķiet, ka LiveStory atbalsta arī 31 valodu, desmitiem dialektu un simtiem balss rakstzīmju, kā arī dažādas vīriešu un sieviešu balss iespējas.
Neskatoties uz visu, nav šaubu, ka tehnoloģija ir nedaudz rāpojoša un ved mūs vēl lielākā ceļojumā neparastajā ielejā. Dažiem audio pievienošana varētu būt pārāk tālu, un MyHeritage bija jāpievieno dažas atrunas, lai nodrošinātu, ka tehnoloģija netiek ļaunprātīgi izmantota. Tajā teikts, ka LiveStory “ir paredzēts izmantot tikai mirušu personu, parasti viņu senču, fotogrāfijās” un ka to “nekad nedrīkst izmantot dzīvas personas fotogrāfijās bez viņu atļaujas”.
Tomēr daudzi sociālajos tīklos atklāja, ka pagājušā gada “dziļās nostalģijas” tehnika bija mierinošs vai pat sildošs veids, kā veidot attiecības, kuras viņi nekad agrāk nebija redzējuši dzīvē. Tāpat kā šī funkcija, LiveStory pašlaik ir pieejams bezmaksas izmēģināšanai galddatoros un mobilajā tīmeklī (gan izmantojot Vietne MyHeritage) un mobilajā lietotnē MyHeritage. Jūs varat izveidot vairākus LiveStories bez maksas, bet pēc tam jums būs jāmaksā par abonementu (no USD 119 / £ 89 gadā).
Analīze: drosmīgāka virzība uz neparasto ieleju
Tāpat kā pagājušā gada “Deep Nostalgia”, mēs esam nedaudz satraukti par MyHeritage jauno “LiveStory” funkciju. Nav šaubu, ka tehnoloģija ir lieliska, un fakts, ka tā var automātiski ģenerēt 90 sekunžu video biogrāfiju no fotoattēla, ciltskoka un teksta, ir gan iespaidīgs, gan biedējošs.
Tomēr mēs nevaram nejust, ka liela daļa no tehnoloģijas iepriekšējiem panākumiem (kas radīja 100 miljonus animāciju) ir saistīta ar tās precizitāti. Kustīgās sejas, ko radīja Deep Nostalgia, laiku pa laikam mirkšķināja vai nolieca galvas, taču tā tas bija – un šis ierobežojums palīdzēja radīt ilūziju, vienlaikus maskējot tehnoloģijas ierobežojumus.
Skaņas pievienošana ir loģisks solis, un tas, bez šaubām, izrādīsies populārs rīks tiem, kam nenoliedzami slīdēšanas faktors nedrebē. Taču no līdz šim redzētajiem piemēriem intonācija dažkārt ir automatizēta, un fakts, ka skaņa netiek ņemta no oriģināla, padara to nedaudz mākslīgu.
Pašlaik LiveStory šķiet piemērotāks muzejiem vai izglītībai, kur tā spēja atdzīvināt vēsturiskas personas (nevis personiskās attiecības), varētu būt noderīgs veids, kā padarīt vēsturi interesantāku apmeklētājiem un bērniem.
Protams, pastāv arī ļaunprātīgas izmantošanas iespēja, lai gan D-ID (tehnoloģijas veidotājs) ir izveidojis dažus šķēršļus, lai tas nenotiktu. Visiem lietotājiem ir jāpiekrīt noteikumiem, tostarp solījumam, ka viņi to neizmantos dzīviem cilvēkiem, pirms viņi var izveidot LiveStory. Ir arī teksta modifikācijas algoritms, lai pārbaudītu, vai nav aizskaroša, apmelojoša vai nepatiesa informācija, lai gan nav skaidrs, kā šī informācija tiek pārbaudīta.
kad Mēs runājām ar D-ID pagājušajā gadā ekskluzīvā intervijāMūs iespaido viņas apņemšanās nodrošināt, lai viņas mākslīgā intelekta tehnoloģija netiktu izmantota ļaunos veidos, kaut arī viņu nedaudz kaitina viņas prognoze, ka lielākā daļa no tiešsaistē redzamajiem vizuālajiem medijiem būs sintētiski “5–10 gadu laikā”. LiveStory nepārprotami ir vēl viens solis uz līnijas. Šis ieraksts, ja ne solis, ir vīruss, kas pagājušajā gadā bija “dziļa nostalģija”.