Analítica de los sitios web multilingües

20/10/2008
Si usas Google Analytics para conocer datos estadísticos de uso de idiomas en un sitio web multilingüe, es más posible que obtengas una foto errónea de cómo se usa tu web. El problema tiene causas concretas conocidas, pero también tiene solución.

En una reciente intervención en un congreso sobre lenguas minoritarias en la era de la globalización tuve la oportunidad de destacar un aspecto concreto que afecta a la visibilidad de estos idiomas en Internet: su presencia minoritaria en las estadísticas de los sitios web, con un peso específico menor que el que les corresponde de por sí.

Nosotros en CodeSyntax vemos que esto ocurre así porque muchos de nuestros clientes tienen webs multilingües, con una versión en euskera (entre otras), y también webs hechos únicamente en euskera. La herramienta de análisis del uso de esos webs que utilizamos normalmente, y en la que procuramos instruir a nuestros clientes, es Google Analytics. Es sabido que Analytics dispone, en su panel de datos de visitantes, de una estadística de idioma que los webmasters solemos consultar. Pero ahí está el quid de la cuestión: sabemos positiviamente que ese dato estadístico del idioma de los usuarios no corresponde con la realidad de los mismos, ni con el uso que dan a las distintas secciones (en una lengua u otra) del sitio web en cuestión.

Digo que lo sabemos a ciencia cierta, porque salta a la vista: tenemos sitios web hechos sólo en euskera, con un tráfico apreciable y mensurable, donde toda la interacción ocurre en este idioma. Por ejemplo, Uztarria.com, una comunidad local de noticias e interacción que sirve a Azpeitia, una localidad guipuzcoana. Sus 90.000 páginas vistas al mes son, salvo aterrizajes equivocados vía Google de búsquedas raras, signo del interés que este contenido en euskera genera entre los azpeitiarras. Pues bien, mirando al dato estadístico de Analytics, como lengua de los usuarios, obtenemos sólo 14 por ciento en euskera, 80 por ciento en castellano.

La explicación es bien sencilla: los ordenadores vienen configurados al mercado, y en España ello significa que el idioma del navegador suele ser el castellano. Ello es así independientemente del idioma de interfaz del sistema operativo, o del mismo navegador. Puedes tener Windows en euskera y el interfaz de Internet Explorer también sale en euskera, y lo mismo puedes instalarte un bonito Firefox vascófono. Pero debajo del interfaz, si el usuario (o el administrador de sistemas de la institución implicada) no actúa adrede, la lengua de configuración seguirá siendo el castellano, y ése será el idioma que quedará grabado en las métricas y estadísticas de los sitios web visitados.

Si eso ocurre con los webs monolingües en euskera, imaginemos lo que pasa con los bilingües o multilingües. La estadística de idiomas (languages) de Analytics dirá una cosa, pero ello no tienen nada que ver, a buen seguro, con el porcentaje real de uso de ese web en un idioma u otro. ¿Qué dato podemos estudiar para saber eso?

Usando las opciones de Google Analytics en principio sólo se podría saber el uso porcentual de un idioma u otro en el caso de que todo el contenido de un web esté configurado en URLs claras que empiezan con la marca de idioma. Es decir, si en foo.com, todo el contenido en castellano estuviera bajo foo.com/es tal que foo.com/es/blog o foo.com/es/contact y lo mismo en euskera, todo bajo foo.com/eu... En este caso, los datos estadísticos de content drilldown (una de las opciones de Analytics) podrían indicarnos el dato real.

Por lo tanto, si las URLs del sitio web siguen ese patrón concreto, se puede saber algo. Pero ¿y si no? ¿si hay otros sistema de URLs basado en slugs o en variables tras interrogante? En este caso, las opciones por defecto de Analytics no sirven. Lo que hay que hacer es configurar tanto el sitio web como Analytics para marcar con un código específicas todas las páginas, según el contenido lingüístico que sirvan, y medir eso específicamente en Analytics mediante una de los llamadas estadísticas user-defined.

En CodeSyntax hacemos eso ya con los sitios multilingües de nuestros clientes que pueden saber, por fin, cual es el uso real que los usuarios dan a las distintas versiones lingüísticas de su presencia en Internet.

Comentar

Para dejar un comentario tiene que identificarse. Para ello puede utilizar su cuenta de Facebook, Twitter o Google+

Luistxo Fernandez

Inventor de proyectos. Un gurú de la diplomacia.