Google vyvinul hlas umělé inteligence, který nelze rozlišit od mluveného slova

Google vyvinul nový systém hlasové syntézy, který má být v budoucnu použit u hlasových asistentů budoucnosti. Nový engine má označení Tacotron 2 a podle doposud zveřejněných výsledků testování je jeho hlasový výstup nerozlišitelný od skutečného lidského hlasu. Jak již napovídá číslovka 2 v názvu, jedná se o druhou generaci syntetizační technologie, která se skládá ze dvou neurálních sítí.

První se stará o převod textu do speciální spektrogramu, druhá s označením WaveNet, která jej převádí do skutečného „mluveného“ slova. Engine zatím funguje pouze v angličtině, a to zatím pouze s ženským hlasem. Podle textové předlohy umí Tacotron 2 přidat nuanci i akcent (pokud je slovo převedeno do kapitálek). Dokonce se zvládne vyvarovat i některých „překliků“ v písmenech, takže nakonec přečte slova správně.

Ukázky Tacotronu 2 v angličtině:

„He Reads books.“ - wav

„Thisss isrealy awhsome“ - wav (eliminace chyb)

„This is your personal assistant, Google Home.“ - wav (dělení vět čárkami)

„The buses aren't the PROBLEM, they actually provide a SOLUTION.“ - wav (důraz)

„The buses aren't the problem, they actually provide a solution.“ - wav (důraz chybí)

„Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?“ - wav (jazykolam)

„That girl did a video about Star Wars lipstick.“ - wav (věta čtená člověkem)

„That girl did a video about Star Wars lipstick.“ - wav (věta čtená syntézou)

Představení funkce Google Assistant:

Nová verze hlasové syntézy bude zřejmě v následujících letech nasazena u hlasového asistenta Google Assistant. Prvním krokem však bude rozšíření syntézy o další světové jazyky. Samotná angličtina totiž nestačí.

Zdroj Google github via Phonearena

Diskuze (6) Další článek: Navzdory veškerému poprasku. Bude iPhone X přece jen prodejní zklamání? Akcie už ochabují

Témata článku: Google, Umělá inteligence, Google Assistant, Hlasové ovládání, Hlasový asistent, Google Now, Virtuální asistent, Hlas, Angličtina, Následující rok, Nový systém, První krok, GitHub, Druhá generace, Neurální síť, Syntéza, Inteligence, Nová verze, Nový engine, Hlasový výstup, Star Wars, Ženský hlas, Mluvené slovo, Hlasová syntéza


Určitě si přečtěte

RECENZE: Nokia 8 Sirocco — luxusně nepraktická

RECENZE: Nokia 8 Sirocco — luxusně nepraktická

** Vzhled na prvním místě, vše ostatní se musí podrobit ** Nejedná se však pouze o převlečenou Nokii 8, nabídne víc ** Za nevšední design platí samozřejmě jistou daň, a ne jednu **

Milan Měchura | 10

RECENZE: Xiaomi Redmi Note 5 je téměř bez chyby a má skvělou cenu

RECENZE: Xiaomi Redmi Note 5 je téměř bez chyby a má skvělou cenu

** Kvalitně zpracovaný telefon, na kterém se obtížně hledají chyby ** NFC je zejména v ČR klíčovým parametrem, který zde bohužel chybí ** Povedený mix funkcí si může držet přijatelnou cenovku

Martin Herodek | 80

RECENZE: Honor 10 drtí konkurenci nejen duhovými odlesky, ale i výbavou a cenou

RECENZE: Honor 10 drtí konkurenci nejen duhovými odlesky, ale i výbavou a cenou

** Honor 10 opět přichází se skvělým poměrem ceny a výkonu ** Za přijatelnou cenu nabízí bohatou ochutnávku ze světa nejlepších ** Nastávající tuctovost displejů s výřezem zahání zády s odlesky duhy

Jakub Vrbacký | 40

RECENZE: Xiaomi Redmi 5 Plus — znovu trefa do černého

RECENZE: Xiaomi Redmi 5 Plus — znovu trefa do černého

** Redmi 5 Plus nabízí velký 6palcový FullHD+ displej i dostatečný výkon ** Oproti minulé generaci dokázalo Xiaomi zapracovat na fotoaparátu ** Celková vyváženost vč. rozumné ceny ho předurčuje k úspěchu

Milan Měchura | 34