Microsoft presenterar tekniken, som kallas Vasa-1, på sin hemsida med en rad exempel där porträttliknande bilder har genererats med hjälp av AI-bildverktyg. Dessa "personer" har sedan matchats ihop med ett ljudklipp, resultatet är en trovärdig och realistisk "person" som säger det som klippet innehåller. Komplett med blinkningar, ögon som rör sig och ansiktsuttryck som förändras. "Personerna" klarar även av att trovärdigt staka sig eller famla i en mening, likt riktiga människor.
Enligt Microsoft är tekniken i förlängningen menad att hjälpa till att upptäcka fejkat innehåll online, men även kunna användas av privatpersoner eller företag som vill skapa en "AI-kompanjon".
Techjätten tänker dock inte släppa in vem som helst för att testa verktyget, av rädsla för hur lätt det skulle vara att skapa trovärdig desinformation med hjälp av det. På sin hemsida skriver Microsoft vidare att de i nuläget inte planerar någon produkt kopplad till Vasa-1.