Gépekkel - emberi nyelven
| Mohai Szilvia - 2008. 12. 06. 14:38:52 |
|
Pár éven belül a gépi hang már nem csak sms-eket olvas fel, ismerteti a számlaegyenlegünket, vagy közli, hogy vonat érkezik a hatos vágányra. Beszélgetni fog velünk, úgy, mint egy ember; megkérdezi, hogy vagyunk, vagy mit ettünk reggelire. S mindez nincs is már olyan mesze.
Hiszen Kempelen Farkas már 1770-ben feltalálta a beszélőgépet, azóta pedig több mint kétszáz év eltelt. December 2-án rendezték meg a Gépekkel - emberi nyelven. Bemutatkozik a Nyelv- és beszédtechnológiai Platform című konferenciát, ahol kiderült, mennyire tudták elsajátítani nyelvünket mostanáig a gépek, és mire számíthatunk a jövőben. Dr. Váradi Tamás, a platform elnöke és az MTA Nyelvtudományi Intézetének igazgatóhelyettese elmondta, hogy a nyelv mindig is az ember legtermészetesebb kifejezési módja volt, és ma is az. A mobiltelefon, az sms, az e-mail vagy a chat csak közvetítő eszköz; s amit közvetítenek, az a beszéd, illetve a szöveg.
Olyan új technológiákra van hát szükség, amelyek megkönnyítik a gépekkel való kommunikációt: a gépek kapacitásával nincs is gond; az intelligenciájukat, a "nyelvi tudásukat" kell növelni. Ehhez tehát számítástechnikai szakemberek és nyelvészek közös munkájára volt szükség: a platform négy ipari és öt egyetemi központ összefogásával alakult. Steven Krauwer, az Utrechti Egyetem vezető kutatója előadásának kezdetén megjegyezte: reméli, hogy tíz év múlva, a tizedik konferencián a saját hangján, de magyarul hallgathatjuk majd őt, nem angolul; ugyanis nem kizárt, hogy addigra léteznek majd olyan fordítógépek, melyek az eredeti hangot használják a lefordított szöveghez. Steven Krauwer szerint a mai világban a politikai határok már kezdenek eltűnni, de a nyelvi határok még mindig léteznek. Pedig a globalizációval olyan megoldásokra lenne szükség, melyek nem nyelvspecifikusak, hiszen így az információhoz való hozzáférésünk limitált: az interneten a legtöbb szöveg nem magyarul van.
A globális felmelegedés mellett itt van a "szociális klímaváltozás" is, melyet a mobilitás és a migráció okozott: a nyelvek ma már nem olyan elszigetelten léteznek, mint régebben. A nyelvi határok megszüntetése azonban azzal a veszéllyel fenyeget, hogy - mivel a nyelv kulturális örökségünk része - elveszíthetjük kulturális identitásunkat. Úgy kell tehát egyenlővé tenni a nyelveket, hogy közben megőrizzük sajátosságaikat. Vicsi Klára, a BME Távközlési és Médiainformatikai Tanszéke Beszédakusztikai Laboratóriumának munkatársa a gépi beszédfelismerésről tartott előadást. A cél az ember és a gép közötti kommunikáció tökéletesítése: az, hogy a gép ne csak a szöveg tartalmát ismerje fel, hanem a beszélőt, annak hangulatát, egészségi és érzelmi állapotát, és az általa beszélt nyelvet is.
A jövő számítástechnikájában a beszéd nagyobb szerepet fog játszani: az emberi hang helyettesítheti az egeret és a billentyűzetet. A bankok és egyéb szolgáltatók telefonos ügyfélszolgálatán már "találkozhatunk" gépekkel, melyek emberi hangon beszélnek. Ez a megoldás költséghatékonyabb, mint a hús-vér diszpécserek alkalmazása. A beszédfelismerő rendszerek hatékonyságát csökkenti, ha a felismerendő szöveg nagy háttérzajban hangzik el, illetve a beszélő más tempóban, nagyobb vagy kisebb szünetekkel mondja el; így az erősen különbözik a gép memóriájában rögzített hanganyagtól, tehát nem biztos, hogy fel tudja ismerni. Ezért nagyobb beszédadatbázis létrehozására van szükség, illetve "meg kell tanítani" a gépeknek az egyes nyelvi szintek (fonéma, szó, szókapcsolat, mondat) jellemzőit, hogy "emberibben" tudják kezelni a nyelvünket.
Németh Géza, a a BME Távközlési és Médiainformatikai Tanszéke Beszédakusztikai Laboratóriumának vezetője előadása közben két videót is mutatott a közönségnek: az egyiken egy beszélőgép társalog egy fiatalemberrel a reggelizőasztalnál, a másikon pedig a robotokkal való párkapcsolat kialakításának ehetőségeiről van szó. Ez lenne a jövő? Majd meglátjuk. Ez után egy kis szövegfelolvasógép-történetet hallhattunk, és saját fülünkkel tapasztalhattuk a különbséget a 2002-es szaggatott "az ön egyen-lege három-ezer-hat forint" és az emberi hangtól szinte megkülönböztethetetlen gépi felolvasás között. A beszélő gépek ma már számtalan területen helyettesítik az embert: itt a beszélő ATM, a képernyő- és e-mailfelolvasás vakoknak, a gyógyszerek mellékhatásait ismertető Gyógyszervonal szolgálat, vagy a videó- és hanganyagban való gyors keresés lehetősége.
Prószéky Gábor, a PPKE Információs Technológiai Karának munkatársa a többnyelvűségről, a fordítóprogramokról, az elektronikus szótárakról beszélt. Szerencsére az idegen nyelveket beszélőknek nem kell attól tartaniuk, hogy a gépek elveszik a kenyerüket. Ha fordításról van szó, még mindig az ember vezet: lehet, hogy a gép gyorsabban megcsinálja, de az apró finomságok észrevételére csak az ember képes. A többnyelvű elektronikus szótárak bemutatására előadónk le- és visszafordított egy-egy holland, román és japán mondatot; a visszafordításra az ellenőrzés végett volt szükség, és a fordítóprogram jól vizsgázott: az eredeti mondat nem deformálódott el, értelme ugyanaz maradt.
Végezetül - a legújabb technológiákat bemutató konferenciáról lévén szó - Kornai András, a BME Média Oktató és Kutató Központjának munkatársa jelentkezett be a Massachusetts állambeli Cambridge-ből, s miután egy kamera segítségével láthattuk őt, és ő is közönségét, egy előre felvett hanganyag segítségével megtartotta előadását. A bemutató végén Kornai András megjegyezte: ha már nem tudjuk eldönteni egy szövegről, hogy ember vagy gép "szájából" hangzik-e el, akkor eljött a mesterséges intelligencia kora. Szerencsére ez a "távelőadás" még emberi volt. A konferencia végén közelebbről is megismerkedhettünk az emberi nyelvet használó gépekkel: a beszélőazonosító-rendszerrel, a tulajdonnév-felismerővel, a már említett Gyógyszervonallal, az orvosi diktálórendszerrel, és Kempelen Farkas beszélőgépét (azaz annak modelljét) is kipróbálhattuk.
Fotó: -a-
|