Hirdetés

Áttörést ért el a beszédfelismerésben a Microsoft

|

Az emberek esetén megszokott hatékonysággal működik az új rendszere.

Hirdetés

Jelentős áttörésről számolt be az emberi beszédfelismerés terén a Microsoft, a legújabb technológiája ugyanis az emberek esetében megszokott hatékonysággal képes felismerni a beszélgetéseket. Az áttörés a szavak puszta felismerése terén történt, a beszélgetés tartalmát nem képes értelmezni a szoftver.


Hirdetés


A Microsoft szerint a szabványos Switchboard beszédfelismerési teszten 5,9 százalékos szófelismerési hibaarányt (WER, Word Error Rate) produkált a megoldása, összehasonlítási alapul az IBM rivális rendszere legutóbb 6,6 százalékos eredményt ért el. A rekord beállítása ellenére a Microsoft kutatócsapatának (nyitóképünkön) még van hova fejlesztenie a beszédfelismerőt, ugyanis a teszt "CallHome" részében 11,9 százalékos WER-t ért el. Ez a legnehezebb rész, ugyanis a szoftvernek az élőbeszéd során megszokott, nyílt végű mondatokat használó beszélgetést kell "leírnia". A fenti érték ettől függetlenül szintén rekord, de egy picivel elmarad a tipikusan 11,3 százalékos emberi hatékonyságtól.



A Microsoft beszédfelismerő rendszerének legújabb változata nem marad sokáig akadémiai jellegű érdekesség, első körben valószínűleg a Cortana hangasszisztens fog profitálni a technológiából.


(Forrás: Neowin, Cornell)

Komolyabban érdekel az IT? Informatikai, infokommunikációs döntéshozóknak szóló híreinket és elemzéseinket itt találod.

Hirdetés
Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://pcworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.