Посљедњих година, вријеме слушања током којег је вјештачкој интелигенцији било потребно да клонира нечији глас је постајало све краће и краће.
Некада су за то били потребни сати, потом минути, а сада то може да се обави у секундама.
Компанија ОпенАИ је недавно открила да је њиховој технологији клонирања гласа потребно свега 15 секунди аудио материјала како би репродуковала нечији глас.
У објави на свом сајту, ОпенАИ је понудио и кратак увид у модел под називом Воице Енгине, који је у развоју од краја 2022.
Воице Енгине ради тако што му се нуди миниимално 15 секунди говорног материјала. Корисник потом може да унесе текст како би се креирало оно што ОпенАИ описује као "емотивни и реалистични" говор који блиско опонаша оригиналног говорника.
Из компаније ОпенАИ тврде да пажљиво и информативно приступају опцији да ова технологија постане широко доступна, јер постоји могућност злоупотребе синтетичких гласова.
Према њиховим ријечима, циљ је да се покрене дијалог о разумном развоју синтетичких гласова и како друштво може да се прилагоди овим новим могућностима.