Terminus | Leírás |
beszédfelismerés (speech recognition)
|
A gépi beszédészlelés legalapvetőbb feladata; beszéd-szöveg átalakítás, vagyis a beszéd tartalmának felismerése és lejegyzése.
|
beszédszintézis (speech synthesis)
|
A beszéd gépi előállításának legfőbb alkalmazása, célja, hogy a leírt szöveget hangzó beszéddé alakítsák, azaz mintegy felolvassák a szöveget.
|
döntési fa
|
Olyan, a döntéshozatalban használt grafikus modell, amit az optimális tevékenység határoz meg olyan esetekben, amikor több alternatíva is rendelkezésre áll, és a kimeneteik bizonytalanok. A döntési fa egy tesztsorozat elvégzése során jut el a döntéshez. A fa minden egyes belső csomópontja valamely tulajdonság értékére vonatkozó tesztnek felel meg, a csomópontból kilépő ágakat pedig a teszt lehetséges kimeneteivel címkézzük. Minden egyes levélcsomópont megadja azt az értéket, amelyet vissza kell adnunk, ha ezt a levelet elértük.
|
entrópia |
A kommunikációs csatorna információs kapacitásának mérőeszköze, általánosabban az információ mennyisége. Eredetileg Claude Shannon kölcsönözte a fogalmat a termodinamikából. Mértékegysége a bit. |
grep (Global/Regular Expression/Print) |
Parancssorból futtatható program, a Unix operációs rendszerhez írta eredetileg Ken Thompson. A paraméterként megadott fájl(ok) vagy a standard input szövegére illeszt reguláris kifejezéseket. A dokumentum azon sorával tér vissza, amelyre illeszkedik a megadott keresési minta. |
információelmélet |
Matematikai, illetve hírközlési tudományterület, amely az információ mérésével, feldolgozásával, elérésével, továbbításával, tárolásával foglalkozik. Megalapítása Claude Shannon nevéhez köthető. |
lineáris algebra |
A matematika egyik ága, tárgya a vektorok, vektorterek és lineáris leképezések vizsgálata. Jelentős geometriai, fizikai és mérnöki alkalmazásokkal rendelkezik. |
mátrix |
A matematikában gyűrűk (olyan struktúrák, melynek elemeit összeadni és szorozni lehet) elemeinek táblázata. Mátrixokat szoktak használni lineáris egyenletek leírására, lineáris transzformációk együtthatóinak és olyan adatoknak a tárolására, melyek két paramétertől függenek. A mátrixokat összeadni, szorozni és felbontani lehet különböző módokon, így a lineáris algebra és a mátrixelmélet központi fogalmát alkotják. A mátrix vízszintes vonalban elhelyezkedő elemei sorokat, függőleges vonalban elhelyezkedő elemei oszlopokat alkotnak. Egy n sorból és m oszlopból álló mátrixot n-szer m-es mátrixnak neveznek (n×m), az n és m pozitív egész számok a mátrix dimenziói. A mátrix dimenzióit mindig először a sorok számával majd azt követően az oszlopok számával adják meg. A mátrixnak az i-edik sorában és j-edik oszlopában lévő elemét a mátrix i,j-edik elemének nevezik, jelölése Ai,j. |
nyelvtani transzformáció |
A transzformációs generatív grammatika alapeleme. Noam Chomsky szavaival: "Egy nyelvtani transzformáció egy meghatározott összetevős szerkezettel bíró meghatározott láncon hajt végre műveletet, azt egy új lánccá alakítja át, amelynek új, származtatott összetevős szerkezete van." Egy mondat összetevős szerkezeti leírása megadja, hogy a mondat milyen kisebb szerkezetekből áll össze (főnévi csoport, igei csoport stb.). Ez a mondat ún. elsődleges szerkezete, amelyből a transzformációk segítségével előáll a mondat felszíni szerkezete, ahogy az a valóságban megjelenik. |
optikai karakterfelismerés (optical character recognition, OCR) |
Géppel vagy kézzel írott karakterek automatikus felismerése. Az átalakított szöveg ezután a számítógép számára értelmezhetővé, felhasználhatóvá válik. |
rejtett Markov-modell |
Átmeneti és megfigyelési valószínűségekkel súlyozott automata. |
Turing-gép |
A legáltalánosabb absztrakt számítógép. Bár eszköztára roppant egyszerű, elemi műveletekből áll, segítségével minden kiszámítható, ami egyáltalán kiszámítható. Egy Turing-gép nemcsak olvasni tud, hanem írni is, és nemcsak egy irányban képes a bemeneti füzéren végigmenni, hanem balra és jobbra egyaránt mozoghat az író-olvasó feje. Tartozik még hozzá egy kockákra osztott végtelennek tekintett szalag, melynek minden kockáján egy-egy szimbólum áll. Az olvasó-író fejnek különböző állapotai vannak, amelyek megszabják, hogy az éppen leolvasott szimbólumot átírja-e, vagy pedig lépjen át valamelyik szomszédos kockára. |
véges (vagy véges állapotú) automata |
Egy olyan absztrakt gép, amely szimbólumfüzéreket fogad, amelyekre egy program által egyértelműen meghatározott módon reagál. Az automata részei: állapotok halmaza (kezdő- és végállapotokkal), ábécé, átmenetek halmaza. Az átmenetek relációk, melyek meghatározzák, hogy az ábécé mely elemével melyik állapotból melyik állapotba léphetünk tovább. Az automata az ábécé fölötti füzérhalmazok elfogadásával tulajdonképpen egy nyelv helyes elemeit fogadja el. |
Viterbi-algoritmus |
Olyan dinamikus programozási algoritmus, amely lehetővé teszi az összes feldolgozandó egység szimultán számításba vételét, és kiválasztja a legvalószínűbb utat, vagyis a megfigyelt jelenségek egy adott sorrendjével tér vissza. |
“zajos csatorna”-modell
|
Claude Shannon 1949-ben felállított modellje a kommunikációról mint általános hírközlési rendszerről. Bizonyos természetesnyelv-feldolgozási problémák megfeleltethetők dekódolási problémáknak egy zajos kommunikációs csatornában. A modellt a beszédfelismerésben először Fred Jelinek használta az 1970-es években az IBM laboratóriumában. Eszerint a gép által hallott akusztikai egység az eredeti, korrektül ejtett szó átnyomva a zajos csatornán. A zajforrások lehetnek a kiejtésbeli változatok vagy a csatorna fizikai változatai (mikrofon, telefonhálózat stb.). A cél, hogy az eredeti szót dekódoljuk.
|