PDFak automatikoki sortzen Ahotsak.com-erako

2011/07/14
Interneten kudeatutako informazioarekin automatikoki pdf-ak sortzea, ez da beste munduko nobedadea. Ahotsak.com-erako hori egin dugu, baina pare bat gauza aipagarri dituenez, hona ekarri ditugu kontu teknikook.

PDFak

Berez, ahotsak-eko datubasean daukagun edozer elementu bihurtu dezakegu PDF batera. Aski dugu, horretarako, erakutsi nahi dugun informazioarekin txantiloia prestatzea.

Momentuz, 3 elementu moten pdf-ak sortzen dira:

  • Herri baten pdf-a, bertako oinarrizko informazio, hizlari zerrenda eta transkripzio guztiekin. Batez ere herri bateko pasadizoak irakurri nahi dituenarentzat. Adibidez, Bergarako pdf-a.
  • Hizlari baten pdf-a. Norbaiten inguruan daukagun informazio guztiarekin. Adibidez, Maria Ixabel Garaterena.
  • Zinta baten pdf-a. Teknikoentzat, batez ere, falta den informazioa eta landu beharrek pasarteak zein diren kolpe batean ikusteko. Adibidez, Azkoitiko zinta bat

PDFak automatikoki nola sortu

PDFauk automatikoki sortzeko libreria asko dago. Python-en, ReportLab da oso ezaguna, aukera asko eta oso onak dituena. Dena den, askotan astun xamarra da libreria honekin lan egitea.

Oraingoan, PISA izeneko libreria erabili dugu (azpitik berak darabil ReportLab). HTML egiturako edozein orri bihurtzen du, automatikoki, PDF formatura. (Edozein HTML egitura esan dugu, baina hori ez da zehatza ere, HTML agindu guztiak ez baititu ulertzen eta estilo kontuekin eta kontuz ibili behar baita)

Libreria honek baditu nabarmentzeko kontu batzuk, gure ustez:

  • HTML dei bereziak, aurkibideak egiteko. HTML orriko h1, h2 eta h3ak modu automatikoan bihurtzen ditu aurkibidera, bakoitzari dagokion orri zenbakia eta gainerakoak gehituz.
  • Orri oinak eta orri buruak sortzeko aukera desberdinak, orri zenbakiarekin, adibidez.
  • Orri mota diferenteak sortzeko modua du, txantiloi bat baino gehiago konbinatuz. Era berean, orri salto eta txantiloi-saltoak kontrolatzeko nahikoa modu intuitiboa du.

PDFak 'katxeatzen'

Beste arazo batekin egin dugu topo ahotsak.com-en: PDFak sortzeko prozesua, zenbait kasutan, oso astuna da. Herri batzuk, adibidez, ia 1000 transkripzio dituzte, ehun hizlaritik gora. Hori guztiaren HTML momentuan sortzea, astuna izan daiteke. Eta, hori guztia PDFra bihurtzea, are gehiago. Kontuan izan, zenbait kasutan 500 orritik gorako pdf-ak sortzen direla.

Beraz, PDFak nolabait aurrez sortu eta erabiltzaileari sortuta eman beharra genuen, makina ez kargatzeko.

Modurik sinpleena PDF guztiak noizean behin geuk sortu eta haiek eskegitzea izan zitekeen. Baina, eskuz momentuan edozein PDF berriro sortzeko agindua emateko gai ere izan nahi genuen, beti egoten baita azken orduan egindako transkripzioa ere 'liburuan' agertu beharra, egileak hala eskatu duelako. Beraz, eskuz sortzeko modua behar genuen eta, behin hori sortuta, ba erabiltzaileari berari utzi diogu PDFak 'katxeatzen'.

Alegia, norbaitek pdf bat eskatzen duenean lehenbizi aurrez sortuta al dagoen begiratzen da. Aurrez sortuta badago, ea noiz sortua den. Sortu gabeko pdf-a bada edo pdf zaharra, hura ezabatu eta berriro sortzen da berria. Bestela, sortutako huraxe eman (modu askoz bizkorragoan). Erabiltzaileak eskaria behin baino gehiagotan errepika ez dezan, jquery eta ajax minimo-minimo bat sartu dugu pdf-en orrietan. Eta lixto. PDFaren itxuran edo aldaketarik egiten dugunean, hurrengo sorrerara arte PDF zaharra ikusiko du erabiltzaileak.

Ahotsak.com, kolpera, editorial bihurtu dugu: ia 9000 liburu ditu bere katalogoan, tablet edo ebook berrietan irakurtzeko moduan. Edo, norbaitek nahi badu, liburu modura inprimatzeko moduan horretarako diren zerbitzuetan baliatuta (LuluBlurbBubok) edo etxean bertan.

Mikel Larreategi
2011/07/15 11:36
Berrikuntza eta aukera ederra PDFa automatikoki sortzeko hau! Googleren bisorea ere erraza eta sinplea!

Erantzun

Erantzuna emateko identifikatu egin behar zara, gure webgunean erabiltzaile bat sortuz edo zure Twitter edo Facebook kontua erabiliz.

Josu Azpillaga

Ingeniaria. Bertsolari txarra, bertsozale ona.