Snowball-erako euskarazko lematizatzailea: sistema eta lengoaia orotarako eramangarria
Snowball-erako euskarazko lematizatzailea: sistema eta lengoaia orotarako eramangarria Eusko Jaurlaritzaren Euskalgintza 2003 dirulaguntzekin garatu da.

Stemmer edo lematizatzaile ireki bat da Snowball. Kodeketarako lengoaia propioa du (sbl) eta integratu egiten da beste hainbat lengoaia informatikorekin: zubiak eginak daude, C lengoaian, Python, Perl eta Java lengoaietan Snowball aplikatu ahal izateko.
Snowball-ek euskara ere lematizatzeko kodeketa sortzea zen proiektu honen helburua. Horretarako, hurbilpen praktiko heuristikoa erabili da, ez euskarazko gramatikaren eta hiztegiren konbinazio posible guztiak tratatuz, baizik eta kasu-marka ugarienak detektatzeko adinako lana, kasuen %95eko estaldura iritsi arte.
Euskarazko lematizatzaile eramangarri eta konpleto bat egitea. Eramangarria, diogunean, bi zentzutan:
- Arina izan dadila, gramatika eta hiztegi osoari erantzun gabe, kasuen %95 estaltzeko gauza izan dadila.
- Sistema batean zein bestean ezartzeko modukoa. C, Perl, Python eta Java lengoaien bidez erabiltzeko modukoa izango da garapena.
Aplikazioa martxan dago hainbat euskal webguneetan. Hala nola:








Informazio gehiago hemen (204 Kb)
