Twitterrek euskara detektatuko du txioetan, PuntuEUS eta CodeSyntax-ekin lankidetzan

2015/06/19
Gaur egun, Twitterrek ez du euskara ezagutzen, interfazea euskaraz izan arren 2012. urtetik. PuntuEUS Fundazioarekin adostuta, hori konpontzeko lanean ari da Twitter, eta, laster, euskaraz idatzitako txioak identifikatuko ditu. Horretarako, CodeSyntax enpresaren laguntza izan dute PuntuEUS Fundazioak eta Twitter-ek.
PuntuEUSeko Josu Waliño eta Twitter Españako marketin arduradun Alex Gibelalde (argazkia: PuntuEUS)

PuntuEUSeko Josu Waliño eta Twitter Españako marketin arduradun Alex Gibelalde (argazkia: PuntuEUS)

Horixe iragarri dute gaur Twitter Españak eta PuntuEus Fundazioak ohar batean, non beste iragarpen inportante bat ere egin duten, Twitter.eus domeinua funtzionatzen hasi dela gaur: "Twitter sare sozialak salto egin du euskal hizkuntzaren komunitatearen adierazgarri den .EUS domeinura, PuntuEUS Fundazioarekin adostutako lankidetzari esker."

Horrekin batera, beste iragarpena, Twitterrek euskara detektatu ahal izango duela laster. Horretarako, gugana jo dute, eta logikoa da, zeren eta CodeSyntax-ek garatutako Umap webguneak 2011. urtetik dihardu txiolari euskaldunen jarduna jasotzen eta iragazten. Denbora errealean egiten dugu bertan euskararen detekzioa, eta ateratzen ditugun datuen artean, denbora errealeko joeren edo Trending Topic detekzioa dago, espezifikoa euskaldunon komunitatekoa, eta Twitterrek eskaintzen ez duena.



Euskararen detekzioa egin ahal izateko Twitterren, milaka batzuk txio etiketatu eskatu zizkiguten, Twitterreko ingeniariek detekzio prozesua abiatu ahal izan zezaten. Bada, 200.000 bidali genizkien. Horrekin, Twitterrek bere lana egiten duenean, txio bakoitzaren metadatuetan euskara gehitu ahal izango du Twitterrek.

Horrela, zenbait ingurunetan agertzen diren itzulpen aukera paradoxikoak ("traducir del indonesio") desagertuko dira Twitterren, baina horrek ez du esan nahi euskaratik itzulpen automatikoa eskainiko duenik Twitterrek. Hori beste enpresa baten zerbitzuekin egiten dute, Bing-ekin (Microsoft-en bilatzailea), eta hor euskara ez dago oraingoz (eta CodeSyntax-en jakintzatik at dago itzulpen automatikoarena).

Euskararekin bezala, beste hizkuntza gutxitu batekin ere egiten du detekzioa eta zerbitzu sorta bat CodeSyntaxek: Galesarekin, Ffrwti proiektuan.

Erantzun

Erantzuna emateko identifikatu egin behar zara, gure webgunean erabiltzaile bat sortuz edo zure Twitter edo Facebook kontua erabiliz.

Luistxo Fernandez

Proiektu asmatzailea. Diplomaziaren guru bat.