Siguiendo con los temas de SEO para liferay
explicados en anteriores posts,
vamos a dar unas cuantas reglas para el apache web
que pueden ser de interés para impedir duplicidades relacionados con
el idioma. En este caso el modelo de idioma que se va
a utilizar es el basado en la url, es decir la url de castellano
irá precedida de /es, la de inglés de /en etc..
Esto es necesario porque el modelo basado en la misma url pero una
cookie de idioma hace que los motores de indexación solo indexen un
único idioma (tal como se explicó en los primeros posts). El problema
en liferay vuelve a ser el mismo, es decir cuando activas el
modelo de urls internacionalizadas siguen funcionando las urls sin
/es etc.. lo cual penaliza el posicionamiento (esto se ha
mejorado y ahora mismo la mayoría de las urls sin mandan un 302 a la
url con /es), aún así las siguientes reglas permiten controlar esto
desde el frontal web. Habría dos estrategias, una
primera para enviar las urls sin /es a urls con /es y
otra enviar directamente a un 404.
RewriteCond %{REQUEST_URI}
!(^/html|^/.*-theme|^/image|^/js|^/es|^/eu|^/combo)
RewriteCond
%{HTTP_COOKIE} GUEST_LANGUAGE_ID=([^;]+)
RewriteCond %1 ^en_US$
RewriteCond %{REQUEST_URI} !^/en/
RewriteRule
(.*) /en$1 [R=301,L]
Con este conjunto de reglas estamos indicando que las urls
que no contengan /en se redirijan
a la misma con /en, excluyendo las urls que no tiene
que cumplir este criterio (css, js etc..)
El mismo concepto pero mandando la urls a un 404
quedaría como sigue
RewriteCond %{REQUEST_URI}
!(.css$|.jpg$|.png$|.gif$|.jsp$|.js$) [NC]
RewriteCond
%{REQUEST_URI} !(^/html|^/image|^/js|^/combo|^/c/|^/poller)
[NC]
RewriteCond %{REQUEST_URI} !(^/es|^/eu|^/en)
RewriteRule (.*) $1 [R=404,L]
Nosotros solemos usar la segunda durante el
desarrollo y la primera para sites que ya han sido creado, ya
que nos permite en un caso identificar que urls están incorrectas y en
el segundo arreglarlas aunque lo ideal es arreglarlas desde el gestor
de contenidos. Hay que tener en cuenta que estas reglas son
propias de cada desarrollo y hay que adaptarlas en cada caso.