Zilele trecute am
participat la a doua ediţie a conferinţei "eLiberatica",
dedicată tehnologiilor libere şi deschise. De fapt, tematica
evenimentului este în principal softul liber şi open source, dar
admite şi alte subiecte legate de libertate şi deschidere în
tehnologiile IT. Aşa se face că printre invitaţi s-a aflat şi
Matthew "Chewy" Trewhella de la Google, care poartă o titulatură
mai neobişnuită, Developer Advocate, rolul său fiind să facă
chestiunile tehnice accesibile şi relevante persoanelor non-tehnice.
Fiind prima prezenţă Google la o astfel de manifestare în România,
se pare că Chewy s-a aşteptat la un alt gen de audienţă şi a
fost surprins să constate că publicul era departe de a fi
"non-tehnic". În schimb, pentru mine Chewy era exact cum mă
aşteptam să fie un om de la Google: tânăr, degajat, uşor
excentric, dar stăpân pe problemele domeniului său. A vorbit
frumos şi repede despre "mashups", OpenSocial şi alte subiecte,
cu diferenţa că în locul obişnuitelor slide-uri prezentarea sa a
fost ilustrată "pe viu" cu paginile internet relevante. Dintre
subiectele abordate, singurul de care nu am vorbit încă în această
pagină se referă la noile unelte lingvistice.
Probabil că aţi
observat în ultima vreme că alături de rezultatele furnizate de
motorul de căutare Google apare un link pe care scrie "Tradu
această pagină". Dacă aţi avut curiozitatea să-l încercaţi,
aţi obţinut o traducere oribilă în limba română a conţinutului
paginii originale. Dacă în schimb veţi încerca să traduceţi în
engleză un text sau o pagină web românească, veţi avea surpriza
să obţineţi un text cel puţin acceptabil. De unde provine
asimetria? Cu siguranţă şi din caracteristicile limbilor
implicate, dar în principal din faptul că tehnologia utilizată
este de natură statistică. Spre deosebire de alte procedee de
traducere automată, care se bazează pe vocabulare, sisteme de
reguli şi tehnici de inteligenţă artificială, Google s-a bazat pe
volumele uriaşe de date pe care le indexează şi şi-a "antrenat"
sistemul furnizându-i mari cantităţi de texte bilingve, deducând
de aici un mare număr de şabloane, de tipare lingvistice.
Funcţionează şi din franceză în română, dar textul tradus
cuprinde unele cuvinte franţuzeşti şi englezeşti, ceea ce
înseamnă că traducerea se face mai întâi în engleză şi apoi
din engleză în română, de unde se poate deduce că sistemul este
mult mai bine antrenat să se exprime în engleză decât în alte
limbi mai puţin prezente în web.
Însă aspectul cel mai
spectaculos este că fiecare dintre noi putem să contribuim la
îmbunătăţirea sistemului. Pe de-o parte, dacă dispunem de
colecţii de materiale bilingve, Google se va bucura să le
folosească. Pe de altă parte, pentru orice frază tradusă, Google
ne pune la dispoziţie un procedeu simplu de a sugera o traducere mai
bună, îmbogăţindu-şi astfel "repertoriul". Am încercat o
traducere în engleză a articolul de săptămâna trecută şi
atracţia de a corecta greşelile flagrante ale versiunii engleze a
fost irezistibilă, aşa că am contribuit şi eu cu ceva la succesul
noii tehnologii Google. Apoi m-am întrebat de ce am făcut-o. Dacă
vânzătorul dintr-un magazin mi-ar cere să-mi împachetez singur
cămaşa pe care tocmai am cumpărat-o, cu siguranţă aş refuza.
Dar aici e vorba de un soi de parteneriat: chiar aş vrea ca un
cititor de limbă engleză să aibă parte de o traducere mai bună a
textelor româneşti (poate chiar şi ale mele). Cred că motivaţii
la fel de difuze, combinând altruism, o doză de egoism şi ceva
amuzament, sunt cele care determină milioane de oameni să participe
la proiecte open source, să finiseze articole din Wikipedia sau să
recenzeze cărţi la Amazon. Iar companiile sunt la rândul lor
interesate de această nouă formă de outsourcing: în loc să
angajeze lucrători, încredinţează sarcini publicului.
Se cheamă
"crowdsourcing" şi chiar funcţionează. Fascinant este că nu
doar în lumea virtuală. în 2000, un tânăr pe nume Jake Nickell a
avut ideea să propună un concurs membrilor unei reţele sociale
populară printre designeri: oricine poate să publice un imprimeu
pentru tricouri, comunitatea votează, Nickell îl imprimă iar
câştigătorul capătă două tricouri gratuite. Nickell a fondat
apoi compania Threadless şi produce tricouri create şi votate de o
comunitate de 700.000 de membri, cărora le place enorm să-şi vadă
desenele apreciate şi apoi imprimate. Anul trecut compania a făcut
profituri de circa 12 milioane de dolari şi continuă să crească.