211service.com
Počítače se učí nová ABC
Pro desítky milionů lidí po celém světě – od západní Afriky přes jihovýchodní Asii až po Blízký východ – není internet tak přátelským místem. Je to proto, že mnoho světových systémů psaní stále není zakódováno v softwaru, což znamená, že miliony lidí nemohou psát e-maily, vytvářet webové stránky nebo prohledávat databáze ve svých nativních skriptech. Skupina lingvistů z Kalifornské univerzity v Berkeley se to snaží změnit tím, že zajistí, aby téměř 100 dalších skriptů mělo místo v klíčovém mezinárodním standardu, který počítačům umožňuje vykreslovat, zpracovávat a odesílat textová data.
Iniciativa univerzity je snahou napravit často přehlížený aspekt digitální propasti: mnoho písem používaných v jazycích pod pěti miliony mluvčích dnes na světě není zastoupeno v mezinárodním standardu, říká Deborah Anderson, lingvistka z Berkeley, která vede úsilí. Tento standard se nazývá Unicode, který přiřazuje jedinečné ID číslo každému psanému znaku, symbolu a interpunkčnímu znaménku v psaném jazyce. ID čísla znamenají, že znaky nebudou špatně interpretovány při pohybu dat mezi softwarovými programy nebo přes internet – problém, který se někdy objeví jako řetězec otazníků na vaší obrazovce a může ochromit schopnost celé populace komunikovat přes internet. . Například Unicode umožňuje radikální ekonomické transformace ve Vietnamu. Před tímto rokem přišli výrobci počítačů a softwaru se 43 různými způsoby kódování vietnamského textu, což znamenalo, že počítače si nemohly spolehlivě vyměňovat data. Začátkem tohoto roku pak vietnamská vláda přijala Unicode jako svůj národní standard.
Tento příběh byl součástí našeho vydání ze září 2003
- Viz zbytek čísla
- předplatit
Problém je v tom, že obskurnější systémy psaní ještě nejsou zakódovány ve standardu Unicode. Přidání dalších 100 skriptů je velký úkol; dnes je zakódováno pouze 52. Berkeley za tímto účelem najímá a financuje lingvisty a také uživatele skriptů jako N'Ko (používaný v západní Africe), balijština (používaný v Indonésii) a tifinagh (používaný v částech severní Afriky), aby zjistili, jak mnoho znaků, které každý skript obsahuje, navrhujte písma a provádějte návrhy byrokratickým bludištěm vládních agentur a orgánů pro počítačové standardy. Výhoda bude viditelná pro uživatele internetu, jako je Mamady Doumbouya, vydavatel z Philadelphie, který by mohl poprvé nabízet online verzi svých novin v N'Ko. Bez Unicode je potřeba tolik nastavit počítač, aby četl noviny v N'Ko, říká Doumbouya.
Takové změny neproběhnou přes noc. Anderson odhaduje, že dokončení projektu, který byl zahájen v loňském roce, bude trvat 10 let. Počítačové společnosti donedávna vydržely úsilí o kódování, ale jejich zájem klesá, protože uživatelé nekódovaných abeced představují příliš malý trh. Projekt v Berkeley je součástí většího úsilí o globálnější dostupnost internetu; již World Wide Web Consortium umožnilo registrovat názvy domén v těchto nových skriptech, což mimo jiné znamená, že adresy URL webových stránek mohou odrážet systémy psaní lidí, kteří je vlastní.
Zájem mají i američtí experti na národní bezpečnost. Everette Jordan, vedoucí National Virtual Translation Center, nově vzniklého úřadu vlády USA, který poskytuje cizojazyčné zdroje pro zpravodajskou komunitu, poukazuje na to, že technologicky jsme hluší, němí a slepí, pokud neumíme číst tyto věci. . Brzy by se však americké bezpečnostní agentury a afričtí vydavatelé novin mohli sjednotit na nový standard.
