Umapen berregituratzean lehen fasea

2015/10/16
CodeSyntaxen aspaldidanik gabiltza sarean euskaldunok ditugun joera ezberdinak aztertzen eta helburu horri erantzunez sortu genuen Umap. Lehen bertsioaz geroztik proiektua Python lenguaian eta konkretuki Django frameworkean berridaztea izan da aldaketa tekniko nabarmenetarikoa, baina azken aldian berriz ere tripak berriztu dizkiogu.
Umapen dauzkagun hainbat rankinen adibidea

Umapen dauzkagun hainbat rankinen adibidea

Orain arte, Twitter sareak eskaintzen digun jarioa aprobetxatuz erabiltzaile interesgarrienen sailkapen bat (ranking bat) osatu behar izan dugu hainbat informazio erauzteko: sareko joerak eta albiste komentatuenak, euskaldunontzat norbanako eta entitate esanguratsuenak nortzuk diren... Guztia beti ere, asteroko laginari lotuta eta uneko informazio garrantzitsu eta freskoena eskaintzeko asmoarekin.

Hala baina, gaurkotasunarekin batera luzera begirako datu esanguratsuak ere eskuratu nahi genituen. Eta gainera, ranking orokor horretan zeuden erabiltzaileak ere ez ziren guztiak berdinak. Hor ditugu hedabideak, norbanakoak, gizarte eragileak, administrazioa... eta hauek bereiztea interesgarria iruditzen zitzaigun.

Astero, 7000-8000 erregistro berri gehitzen genituen. Erabiltzailearen datu orokorrak eta gure rankinari zegozkionak gordetzen genituelarik erregistro bakoitzean. Asteroko rankigari dagozkion estatistikak atera eta lagin horren bestelako hainbat informazio biltzeko kontsulta azkarrak egin behar ziren, eta egitura egokia zen hori. Hasierako enfokerako baliagarria zitzaigun.

Baina hileroko txostena ateratzeko edota erabiltzaile bakoitzaren profila osatzerakoan egitura astuna zen eta ranking ezberdinak osatzeko ere ez zigun balio. Erabiltzaile gehienen datu orokorrak, astetik astera gordetzen genituen. Komeni zitzaigun erabiltzaileen instantzia bakar bat eduki eta berau eguneratzen ibiltzea. Ranking entitate hori beraz, bitan zatitu dugu: Umap erabiltzaileak eta asteroko ranking erregistroa bereiztuz.

Tripa aldaketa aprobetxatuz, rankingaren kalkuluan eta berau gordetzeko prozesuan optimizazio batzuk ere gauzatu ditugu. Kontutan eduki orain astero 8000 bat ranking eta beste 8000 erabiltzaile erregistro eguneratzen ditugula. Guztiak astelehen goizaldetan.


Sustatu.eus | Umap profila © cc-by-sa: urtzai

Horrela, Umap erabiltzaile bakoitzak asteroko ranking datuak lotuta izateaz gain, erabiltzaile horri ranking mota bat ere lotu ahal izan diogu (Hedabidea, Norbanakoa, Administrazioa...). Lan hau oraingoz eskuz egiten da, ezinezkoa baita erabiltzaile izen eta deskribapenetik bakoitza zer motatako Twitter kontua den jakin eta automatikoki sailkatzea. Hala ere, sistemak astero rankingaren lehen postuetan sartzen diren erabiltzaile berrien berri ematen digu eta editoreek pixkanaka pixkanaka sailkatzeko lana hartuko dute.

Egitura hau aurrekoa baino flexibleagoa da eta asteko rankingari begira baino, erabiltzailearen eboluzioari eta datu orokorren historikoak lortzeko perspektibarekin egina dago. Gainera, esparru berdineko hainbat Twitter kontu konparatzeko ere balio digu. Informazio berri interesgarri asko atera daiteke bertatik eta hurrengo egunetan honen berri idatziko dugu sarean.

Esan bezala, datozen hilabeteetan ikusiko dugu emaitza, baina honekin batera etorriko diren beste aldaketa batzuekin batera, ziur gaude, Twitterren dagoen euskal komunitatearen argazki gardenago bat eraikitzeko gai izango garela.

Erantzun

Erantzuna emateko identifikatu egin behar zara, gure webgunean erabiltzaile bat sortuz edo zure Twitter edo Facebook kontua erabiliz.

Urtzi Odriozola

Python programatzailea 'Gamer' euskaltzale bat.