Microsoft se pochlubil nejlepším rozpoznáváním lidské řeči s nejnižší chybovostí v historii

Microsoft se pochlubil nejlepším rozpoznáváním lidské řeči s nejnižší chybovostí v historii

Rozpoznávání lidské řeči pomocí počítačových systémů se v poslední době velmi rychle zlepšuje hlavně díky použití hlubokých neuronových sítí v kombinaci s velkým množstvím dat. Microsoft se pochlubil, že jeho systém rozpoznání řeči má nejnižší chybovost ze všech.

Na oficiálním blogu Microsoftu jsou k dispozici i konkrétní výsledky testů, které se používají jako měřící standard schopnosti systému rozpoznat lidskou řeč.

V rámci chybovosti (WER – word error rate) se Microsoft pyšní pouze 6,3 %, což je dle tvrzení zatím nejnižší hodnota, která byla při těchto testech dosažena. IBM nedávno představilo vlastní systém, který má chybovost 6,6 %, což je velmi blízko.

Klepněte pro větší obrázek
Vývoj chybovosti v průběhu historie (Zdroj: Microsoft)

Jak je vidět na obrázku, pokrok v této oblasti oproti minulosti je značný – chybovost před dvaceti lety byla 43 %, což je pochopitelně i značně nepoužitelné pro reálné nasazení, když polovina slov není správně rozpoznaná.

Inženýři mohou nyní cvičit systémy umělé inteligence velmi rychle a mnohem přesněji. Cílem je posunout schopnosti rozpoznávání lidské řeči na stejnou nebo lepší úroveň, než kterou má i sám člověk.

Aby ale bylo možné dosáhnout perfektního rozpoznávání řeči třeba u Cortany, Siri, Alexy a dalších hlasových systémů, je nutné počítat se zahrnutím i dalších dat, které se netýkají samotného hlasu. Aby bylo možné rozpoznat vyšší úrovně, je nutné chápat větší souvislosti a vědět co nejvíce informací o samotném uživateli jak v reálném čase, tak i z pohledu minulosti a budoucnosti.

Microsoft v tomto směru již dříve představil Caap (Conversation as a Platform), který se skládá právě z těchto částí nejen u chytrých asistentek, ale i chytrých chatbotů a podobně.

Díky tomu, že všichni hlavní technologičtí hráči jako Microsoft, IBM, Apple nebo Google vyvíjí systémy na bázi hlubokých neuronových sítí, konkurenční předností je co největší množství dat a rychlost, se kterou se umělá inteligence učí vše rozpoznávat.

Z pohledu celosvětového nasazení pro různé jazyky má jistě nejvíce navrch hlavně Google, který si pro rychlé a efektivní zpracování dat vytvořil i vlastní hardware v podobě procesoru TensorFlow.

Zdroj obrázku: Flickr (CC BY-SA 2.0)

Diskuze (4) Další článek: Apple kopíruje Samsung Note 7. iPhone 7 Plus vybouchnul ještě v krabičce při transportu [galerie]

Témata článku: Microsoft, Mobilní aplikace, Technologie, Umělá inteligence, Rozpoznávání, TensorFlow, Počítačový systém, Řeč, Trigger, Nejnižší hodnota, Chytrý asistent, Micro


Určitě si přečtěte

Vybrali jsme 13 povedených chytrých hodinek a náramků. Nejen pod vánoční stromek

Vybrali jsme 13 povedených chytrých hodinek a náramků. Nejen pod vánoční stromek

** Nositelnosti jsou specifická kategorie, vybírají se jinak než mobily. ** Co model, to charakter, unikátní mix vlastností, parametrů a funkcí. ** Začneme jednoduchým náramkem, skončíme našlapanými Apple Watch.

Filip Kůžel | 40

RECENZE: Huawei Nova 3i — když se po hvězdě zrodí i hvězdička

RECENZE: Huawei Nova 3i — když se po hvězdě zrodí i hvězdička

** Levnější odvozenina od Huawei Nova 3 má jen málo ústupků ** Zařadila se však do plného rybníka konkurence, včetně té vlastní ** Doufejme, že jí to nesrazí vaz, jedná se o povedený smartphone

Jakub Vrbacký | 31

RECENZE: Sony Xperia XZ3 — Japonci jsou zpátky v extralize

RECENZE: Sony Xperia XZ3 — Japonci jsou zpátky v extralize

** Sony výrazně zmodernizovalo vlajkový model ** OLED displej patří mezi nejlepší na trhu ** Opět se zlepšil i fotoaparát

Jan Láska | 102

RECENZE: Huawei P Smart – kovové dvojče má o jedno oko méně

RECENZE: Huawei P Smart – kovové dvojče má o jedno oko méně

** Kvalitní střední třída s protáhlým displejem ** Stejný jako Honor 9 Lite, přesto se liší v drobnostech ** Fotoaparát už se barev nebojí

Martin Herodek | 11

RECENZE: Honor 8X — obr téměř bez chyb

RECENZE: Honor 8X — obr téměř bez chyb

** 6,5" displej nemusí nezbytně znamenat nepoužitelně velkou plácačku ** Výbava nezklame, až na zastaralý microUSB konektor ** Zásadní inovace nečekejte, ale ve střední třídě to (zatím) nevadí

Martin Herodek | 60