2011/03/02
Duela hilabete ireki zen Umap Cymraeg, Galesen egindako hacker bilkura batean, Hacio'r Iaith. Lagun bat dugu Galesen proiektua bultzatzen, Rhodri ap Dyfrig, eta berak nahiago izan du astetxo batzuk tresna nola dabilen ikusi, iragarpena egin baino lehen.

Rhodri ap Dyfrigek dagoeneko idatzi du bere blogean galesez zein ingelesez, eta guri ere badagokigu beraz, webguneaz berri ematea.

Umap da Twitterreko mezuak eta erabiltzaileak hizkuntzaren arabera detektatu eta metatzeko tresna bat, automatikoki funtzionatzen duena. Metaketa horretatik, informazio gehigarria ateratzen da, hala nola eguneko gakoak, edo unean uneko albisteedo webgunerik esanguratsuenak. Lehenbizi euskarazko Umap atera genuen, gero Umap.cat katalanezkoa, eta orain iritsi da Galesezkoa, cy.umap.eu.


Argazkiak.org | Umap Cymraeg © cc-by-sa: codesyntax

Euskarazko webgunea azarotik hona 1.100 erabiltzailetik 1.600era igo da. Lau astean, galesez kopuru berean igo da: 600etik 1.100era. Harrapatuko ote gaituzte? Soziolinguistikoki, kopuruak ez dira hain desberdinak euskararen eta galesaren artean, eta oro har, hizkuntza gutxituen eremuan geurekin alderatuta parekideenak eurak ditugu Europan. Twitterreko erabilpenari dagokionez, aste hauetako geure inpresioa da agian galesal gutxixeago direla, baina gehiagotan darabiltela, bai Twitter oro har (barneratuagoa dagoela tresnaren erabilpena Galesen), eta bai, bereziki, galesez jarduteko ohitura handiagoa dutela (geuk errejistro aldaketa gehiago egiten ote dugun susmoa... erdara gehiago erabiltzen dugula euskaraz dihardugun tuiterlariok).

Rhodri ap Dyfrig doktoradutza egiten ari da. Galeserazko kultura kontsumoa eta komunikazioa sare sozialetan, horrelako zerbait du gaitzat hartuta, eta hurbildu gintzaionean Umap galeseratzeko ideiarekin, kontua primeran zetorkiela ikusi zuen, baita bere lan akademikorako ere. Aste gutxi batzuetako lana izan zen itzulpena prestatzea eta makinaria doitzea. Hobekuntza beharrak ere baditugu: %60-65 da galeseraren detekzio maila une honetan. Gutxiegi da, eta zuzenduko dugu hori denbora apur bat hartzen dugunean.

Rhodrik idatzitako analisitik, puntu batzuk itzuliko ditugu jarraian:

  • Twitterren eremu elebakar batean barneratzeaz gain, tresnak beste abantaila batzuk ere eskaintzen dizkigu:
  • Lehen aldia da hau trend edo gakoak deskubritzen ditugunak Galeseraz. Interesgune horiez gain, erabil daiteke potentzialki marketinerako, gauzak deskubritzeko, marka eta albisteen monitorizaziorako...
  • Umap-eko albisteen sekzioak eta bere jarioak elkarrizketan non eta zertan den deskubritzen digu uneoro. Ezerk ez du orain arte automatikoki detektatu sarean Galeseraz zertaz ari ginen. Eralisten duena akaso ez da asko, edo gaien zabaleraren aldetik ere, Galeseraren eremu murritza dela erakuts dezake horrek, baina hori ona da Galeseraren inguruko eztabaida zentratzeko. Hutsuneak non dauden ikusi, eta horiek betetzen saiatu.
  • Twitter erabiltzaileentzako aukera da, ikusteko zein ari den bere hizkuntza tuiteatzen,
  • Tuit guztiak artxibatuta daude. Twitterren tarte baterako daude, baina Umap-ek denak gordetzen ditu. Artxibo horrek aukerak ematen ditu corpus gisa etorkizunerako. Horren gainean bigarren mailako aplikazioak sor daitezke etorkizunean, horixe espero dut.

Ez bakarrik dago Rhodri pozik. Galesko Interneteko esparruko beste ahots batzuen animoak ere jaso ditugu. Eskerrik asko denei eta bereziki, Rhodri ap Dyfrigi (beheko hau duzue).

Espero dugu ez dela Galesezkoa Umap-en azken hizkuntza-bertsioa izango... Motiboren bategatik hizkuntza jakin batekin kontaktua baduzu, atzerrian zaudelako edo beste zerbaitegatik, agian garatu dezakegu beste bertsio bat hizkuntza horretan. Jarri kontaktuan geurekin lasai.

Agian interesatuko zaizkizu beste artikulu hauek