Google vyvinul hlas umělé inteligence, který nelze rozlišit od mluveného slova

Google vyvinul nový systém hlasové syntézy, který má být v budoucnu použit u hlasových asistentů budoucnosti. Nový engine má označení Tacotron 2 a podle doposud zveřejněných výsledků testování je jeho hlasový výstup nerozlišitelný od skutečného lidského hlasu. Jak již napovídá číslovka 2 v názvu, jedná se o druhou generaci syntetizační technologie, která se skládá ze dvou neurálních sítí.

První se stará o převod textu do speciální spektrogramu, druhá s označením WaveNet, která jej převádí do skutečného „mluveného“ slova. Engine zatím funguje pouze v angličtině, a to zatím pouze s ženským hlasem. Podle textové předlohy umí Tacotron 2 přidat nuanci i akcent (pokud je slovo převedeno do kapitálek). Dokonce se zvládne vyvarovat i některých „překliků“ v písmenech, takže nakonec přečte slova správně.

Ukázky Tacotronu 2 v angličtině:

„He Reads books.“ - wav

„Thisss isrealy awhsome“ - wav (eliminace chyb)

„This is your personal assistant, Google Home.“ - wav (dělení vět čárkami)

„The buses aren't the PROBLEM, they actually provide a SOLUTION.“ - wav (důraz)

„The buses aren't the problem, they actually provide a solution.“ - wav (důraz chybí)

„Peter Piper picked a peck of pickled peppers. How many pickled peppers did Peter Piper pick?“ - wav (jazykolam)

„That girl did a video about Star Wars lipstick.“ - wav (věta čtená člověkem)

„That girl did a video about Star Wars lipstick.“ - wav (věta čtená syntézou)

Představení funkce Google Assistant:

Nová verze hlasové syntézy bude zřejmě v následujících letech nasazena u hlasového asistenta Google Assistant. Prvním krokem však bude rozšíření syntézy o další světové jazyky. Samotná angličtina totiž nestačí.

Zdroj Google github via Phonearena

Diskuze (6) Další článek: Navzdory veškerému poprasku. Bude iPhone X přece jen prodejní zklamání? Akcie už ochabují

Témata článku: Google, Umělá inteligence, Hlasový asistent, Google Assistant, Hlasové ovládání, Virtuální asistent, Google Now, Google, Angličtina, Hlasová syntéza, Neurální síť, Druhá generace, Inteligence, GitHub, Mluvené slovo, Syntéza, Nový engine, Hlasový výstup, Star Wars, Ženský hlas, Následující rok, Nová verze, Hlas, Nový systém, Pepper


Určitě si přečtěte

RECENZE: Huawei Nova 3i — když se po hvězdě zrodí i hvězdička

RECENZE: Huawei Nova 3i — když se po hvězdě zrodí i hvězdička

** Levnější odvozenina od Huawei Nova 3 má jen málo ústupků ** Zařadila se však do plného rybníka konkurence, včetně té vlastní ** Doufejme, že jí to nesrazí vaz, jedná se o povedený smartphone

Jakub Vrbacký | 31

Vybrali jsme 13 povedených chytrých hodinek a náramků. Nejen pod vánoční stromek

Vybrali jsme 13 povedených chytrých hodinek a náramků. Nejen pod vánoční stromek

** Nositelnosti jsou specifická kategorie, vybírají se jinak než mobily. ** Co model, to charakter, unikátní mix vlastností, parametrů a funkcí. ** Začneme jednoduchým náramkem, skončíme našlapanými Apple Watch.

Filip Kůžel | 29

Ani Samsung, ani Huawei. První skládací telefon na světě představila bezejmenná čínská firma

Ani Samsung, ani Huawei. První skládací telefon na světě představila bezejmenná čínská firma

** Rok 2019 má být rokem skládacích hybridů, Nová éra však načala trochu s předstihem ** Royole FlexPai je první skládací hybrid na světě, ale počítejte hned s několika kompromisy ** Tím hlavním je velká tloušťka zařízení při jeho složení...

Martin Chroust | 33