Jak mluvit jako Iráčan

Překonání jazykových bariér může být v Iráku otázkou života nebo smrti. Vojáci, zdravotnický personál a iráčtí občané mají každý den potíže s předáváním zásadních informací. Zatímco lidské překladatele se používají v mnoha situacích, prostě není dost těch, kteří jsou ochotni asistovat v každé důležité konverzaci.





IraqComm, software, který dokáže přeložit anglicko-iráckou arabštinu během několika sekund, lze nahrát do komerčního notebooku. Ke zlepšení kvality zvuku a zvýšení přesnosti lze použít sluchátka a mikrofony. (Kredit: SRI International)

Minulý měsíc sídlící v Menlo Parku Mezinárodní SRI oznámila, že nasadila 32 notebooků se systémem Windows XP nabitých pokročilým překladatelským softwarem pro vojenské hodnocení v Iráku. Software, nazvaný IraqComm, usnadňuje anglicko-arabskou konverzaci tím, že zaznamenává mluvená slova osoby, překládá je a přehraje překlad během několika sekund.

předchůdce IraqComm, Frázelátor , je kapesní zařízení nabité frázemi. Uživatel vybere anglickou frázi a zařízení přehraje její překlad například v irácké arabštině. I když je tento systém užitečný, má své nevýhody. Počet možných frází je omezený a nemůže překládat fráze do angličtiny, což vede ke konverzaci, která do značné míry závisí na gestech.



Naproti tomu IraqComm může usnadnit improvizovanou, obousměrnou konverzaci. Osoba mluví do mikrofonu a slova shromažďuje a analyzuje software pro rozpoznávání řeči, nazvaný DynaSpeak, systém vyvinutý v SRI. Na obrazovce notebooku se pak zobrazí fráze tak, jak ji slyšel počítač. Poklepáním (klávesy T) se fráze vysloví v irácké arabštině. Pokud software špatně zaslechl některá slova, mluvčí si může vybrat ze seznamu dalších pravděpodobných frází, vysvětluje Kristin Precoda, ředitelka Laboratoř technologie a výzkumu řeči (STAR). ve společnosti SRI a vedoucího vývojáře projektu.

Text lze také zadat přímo do stroje a přeložit; ale vědci se domnívají, že schopnost překládat řeč bude zvláště užitečná pro vojáky, kteří potřebují sledovat své okolí. Díky překládání mluvených frází je systém užitečný i pro telefonické rozhovory.

Poté, co DynaSpeak převede mluvená slova na text, software provede překlad. Software se skládá ze dvou komponent, vyvinutých s pomocí Ústav informačních věd (ISI) na University of Southern California (USC) v Los Angeles. První modul používá algoritmy založené na pravidlech, vysvětluje Precoda, napsaný tak, aby rozpoznával specifická pravidla gramatiky a použití. Jsou však poněkud omezené, protože lidé používají k vyjádření myšlenek tolik různých slov.



U komplikovanějších vět se tedy překladatelský software obrací na typ algoritmu, který provádí určitý druh statistické analýzy jazyka. Funguje tak, že přiřadí pravděpodobnost, že slovo nebo fráze bude následovat za jiným slovem nebo frází, jako je tomu u komplikované verze prediktivních textových zpráv používaných na některých mobilních telefonech.

Algoritmus funguje tak, že vstupní věty rozsekává na frázové jednotky, říká Kevin Knight, vedoucí výzkumný pracovník na ISI. Například fráze Ukaž mi své povolení nosit tu zbraň by se dala rozlousknout na ukaž mi, tvoje povolení, nosit a tu zbraň. Pak se tyto jednotky přeloží a přeobjednají, vysvětluje Knight, podle pravděpodobnosti, že budou umístěny vedle sebe v irácké arabské větě. Statistický algoritmus rychle prochází miliony možných překladů a hodnotí každý z nich, říká.

Aby měl algoritmus rychlý přístup ke všem možným větným strukturám a slovům, má mnoho možností, které může posoudit najednou, vysvětluje Knight. Je to podobné šachovému programu, říká, protože prohledává mnoho různých cest, aby našel tu nejlepší. Překladový algoritmus hledá cestu, která vede ke správné sekvenci slov, a během několika sekund přehraje nejpravděpodobnější frázi na reproduktorech notebooku. V současné době může IraqComm čerpat ze slovní zásoby 40 000 slov v angličtině a 50 000 v irácké arabštině – není divu, s velkým důrazem na vojenskou a lékařskou terminologii.



IraqComm byl vyvinut v rámci mluveného jazyka komunikačního a překladového systému pro taktické použití, programu Agentury pro pokročilé obranné výzkumné projekty (DARPA). SRI je jednou ze šesti organizací vyvíjejících anglicko-irácko-arabské překladové systémy, které jsou mobilní a dokážou překládat vojenské a lékařské konverzace v přítomnosti okolního hluku. Podobné výzkumné projekty probíhají na USC, Carnegie Mellon University, IBM, BBN Technologies a Sehda, Inc.

Zda bude IraqComm nejpřesnějším systémem, který vzejde z iniciativy DARPA, se teprve uvidí, říká Craig Schlenoff, elektronický inženýr z Národního institutu pro standardy a technologie v Boulderu. On a tým výzkumníků začnou během příštího roku testovat všechny překladatelské systémy, aby je bylo možné vzájemně měřit. Systém SRI má však brzký start a získal pozitivní zpětnou vazbu od vojenských představitelů, kteří jej již použili. Minulý týden si podle SRI armáda objednala dalších 21 svých překladových systémů.

Cílem IraqComm není vyřadit lidské překladatele z podnikání, zdůrazňuje Precoda SRI. K posouzení řeči těla a hovorových jemností, které by mohly odhalit informace, které nejsou pro počítač, který není tak chytrý jako lidský překladatel, budou potřeba odborníci na jazyky, říká.



Na rozdíl od lidských překladačů však lze IraqComm nasadit kdekoli a všude. V konečném důsledku tedy, říká Precoda, může dát armádě více možností překladu a pomoci zmírnit válečné nebezpečí pro irácké překladatele.

skrýt