Hirdetés

Diktálj magyarul PC-dnek!

|

Létezik egy magyar fejlesztésű program, amely négy nyelven is villámgyorsan tud beszédhangot írott szöveggé alakítani - akár időkódokkal is.

Hirdetés

Egyszer talán eljön majd az a nap, amikor az Apple Sirije vagy az Amazon Alexája megérti, mit beszél a Kárpát-medence egyszerű gyermeke, de egyelőre hiába szólunk hozzájuk magyarul, ők az általuk ismert nyelvek valamelyikébe próbálják majd elhelyezni szavainkat, valószínűleg sikertelenül. Egyelőre be kell érnünk a diktálással, ami viszont iOS-en és Androidon is egész korrekt; a rendszerek viszonylag pontosan gépelik le mondanivalónkat még akkor is, ha neveket, idegen vagy mozaikszavakat használunk.

A mesterséges intelligenciák jól állnak beszédfelismerés terén; ha csak üzenetet akarunk küldeni vagy gyors jegyzetet készíteni a mindennapi rohanás közben, megtehetjük anélkül, hogy külső szolgáltatás után kutatnánk. A magyar székhelyű Régens által fejlesztett Alrite viszont ennél jóval többre képes: videósoknak, újságíróknak, tartalomgyártóknak egyaránt értékes időt spórolhat - meg mindenkinek, aki nem akar őrülten jegyzetelni a meetingek, előadások során.

Hirdetés

Figyeljen, diktálok!

Én személy szerint nem tudnék úgy cikket írni, hogy diktálok, sokkal kevésbé gördülékenyen jönnek belőlem a szavak, ha ki kell mondanom őket, ráadásul minden harmadik szót visszatörlök, ha eszembe jut, hogyan tudnék választékosabban is fogalmazni - meg is válaszolom a mindenkit foglalkoztató kérdést: nem, ezeket a sorokat sem diktálva juttatom be a virtuális térbe (de egyébként jó tudni, hogy megtehetném). Ugyanakkor kétségtelen, hogy a szövegfelismerés egy hasznos dolog; az utcán sétálva még biztonságosabb is tollba mondani az üzeneteket, mint a telefonunkat bámulva kockáztatni azt, hogy a villamos alá lépünk.

Az Alrite elsősorban azoknak lesz hasznos, akik munkájuk során olyan helyzetbe kerülnek, hogy beszélt szöveget kell írássá változtatniuk.

A több mint 25 éve működő Régens egyéb tevékenységei mellett hat éven át kutatott a mesterséges intelligencia területén, hogy megalkothassa a szolgáltatást, amit első körben magyar felhasználóknak szántak, ma azonban már több nyelvet is támogat. A háttérben deep learning algoritmusok pörögnek, amelyek nemcsak a szavakat ismerik fel meglepő precizitással, de azt is, hova kell vesszőt tenni, vagy hol ér véget egy mondat, bekezdés.

Apró kulisszatitok: interjút általában úgy készítünk, hogy a beszélgetést rögzítjük, majd vagy szó szerint legépeljük az elhangzottakat, vagy kijegyzeteljük a fontos gondolatokat, mondatokat attól függően, hogy a szöveget később milyen formában szeretnénk publikálni. Ha magyarul beszélgetünk, akkor is legalább másfélszer, olykor kétszer annyi időbe telik mindent leírni, mint amilyen hosszú maga a felvétel volt, ha meg angolul, akkor fordítani is kell, és ez még keményebb, időigényesebb feladat. Nagyon örülök, hogy az angolul, németül és spanyolul is funkcionáló Alrite-ot pont azelőtt fedeztük fel, hogy két interjút is készítettem külföldi játékfejlesztőkkel, az ismert körülmények miatt ráadásul online, az egyszerűség kedvéért a gépem hangszórójából kiszűrődő hangot a telefonommal felvéve. Kemény kihívás elé tudtam így állítani a programot.

Az első felvétel egy 20 perces beszélgetés volt, amelyben az angolt szinte akcentus nélkül beszélő interjúalanyokon kívül a régió újságírói vettek részt; ki durvábban, ki enyhébben törte a nyelvet. Az Alrite-on a már kész felvételt futtattam át: 2 perc kellett neki feltöltéssel együtt, hogy írott szövegként köpje ki. A nehezítések ellenére 85-90 százalékban azt kaptam, amit kellett; az Aloy névvel (és a nevekkel általában) olyannyira küzdött, hogy minden alkalommal mást dobott rá, de nem vártam el, hogy ezt is ismerje.

Lényegesen kényelmesebb volt visszahallgatni a felvételt és csak olvasni, finomítgatni az előttem lévő szöveget, mint ha nekem kellett volna bepötyögni mindent, különösen úgy, hogy a pontok, a vesszők és a kérdőjelek is a helyükön voltak.

A második felvétel másfajta akadályokkal szolgált: ez 1 óra hosszúságú volt, egy japán úriember válaszolgatott kérdésekre, tolmácsa segítségével. Szintén pillanatok alatt meglett a több tízezer karakteres szöveg, csak ki kellett kaparásznom belőle a japán beszéd egészen bizarr, itt-ott a maga módján mégis értelmes angol leiratát.

Az Alrite egyébként képes a szövegeket helyben lefordítani, ezt is megspórolja nekünk, ha az angol, a magyar és a német nyelvek egyikéből konvertálnánk valamely másikba. A feltöltéseket egy évig tudja tárolni, de ha mindent letöltünk, ez egyáltalán nem probléma.

Akadálymentesítés a YouTube-on

Nem pusztán a hallásukban akadályozott személyeknek segíthet, ha egy videó feliratozva van, és különösen igaz ez az idegen nyelvű anyagokra. Az Alrite képes egy, már feltöltött videót is feliratozni, a leirat mellé ugyanis kapunk egy időkódos verziót is (exportálást követően SRT formátumban), aminél csak a szöveget kell javítgatnunk (ezt megtehetjük az appban vagy online is), de igazítanunk már nem szükséges.

Ezt egy játékról szóló, magyar nyelvű történet-összefoglaló videóval próbáltuk ki, amiben a Sony nevét például gond nélkül felismerte, sőt a Horizon Forbidden West játék címével is elboldogult, de a Horizon Zero Dawnból Horizons Irodán lett, a Killzone-ból pedig Killson. Ez még mindig apróság, és ahogy korábban is írtam, nem várható el egy rendszertől, hogy minden ilyet pontosan tudjon - az ugyanakkor külön dicséretes, hogy a magyar szövegben elrejtett idegen szavakat nagy betűvel kezdte, feltételezve, hogy azok tulajdonnevek.

Az Alrite élő adások feliratozására is bevethető, egy-két másodperces késéssel, de precízen működik

- ilyenkor nyilván megvan az a veszély, hogy valamit nem jól ír le, mindenkinek magának kell eldöntenie, hogy vállalja-e ezt a kockázatot. A szolgáltatásban a Euronews, a Deutsche Welle vagy épp az M1 Híradó adásával tesztelhetjük, mielőtt ajánlatot kérnénk saját műsorainkhoz.

A program egyébként ingyenesen kipróbálható bárki számára; ha másért nem, azért megéri, hogy rácsodálkozzunk, hol tart a technológia. A felhasználók száma már átlépte a tizenötezret, minden adott ahhoz, hogy ez lesz a következő Ustream vagy Prezi - szorítunk a sikerének.

Mennyibe kerül az Alrite?

A szolgáltatásnak jelenleg négy szintje elérhető:

- A Starter az ingyenes, havonta 30 percnyi szöveget írathatunk le vele.
- A Prime-ért percenként nettó 36 forintot kell fizetnünk. A fájlok egy évig tárolódnak, a fordítás és a YouTube-videók leiratozása is használható.
- A Premium már 58 forintba kerül percenként, de kiemelt ügyfélszolgálat tartozik hozzá, továbbá a YT-videókat nemcsak leiratozhatjuk, de feliratot is készíthetünk.
- A Professional az üzleti felhasználóknak egyedi árazást kínál.

Ha szeretnél hasonló tippeket kapni, akkor érdemes megvenned a 2022/03-as PC World magazint, és ha így teszel, értékes szoftvereket és PC-s játékot is kapsz hozzá ajándékba. 

Komolyabban érdekel az IT? Informatikai, infokommunikációs döntéshozóknak szóló híreinket és elemzéseinket itt találod.

Hirdetés

Úgy tűnik, AdBlockert használsz, amivel megakadályozod a reklámok megjelenítését. Amennyiben szeretnéd támogatni a munkánkat, kérjük add hozzá az oldalt a kivételek listájához, vagy támogass minket közvetlenül! További információért kattints!

Engedélyezi, hogy a https://pcworld.hu értesítéseket küldjön Önnek a kiemelt hírekről? Az értesítések bármikor kikapcsolhatók a böngésző beállításaiban.