Controlando la indexacion de contenido en Alfresco

La característica de indexado automático de los contenidos y metadatos de un documento, es normalmente bienvenida en un gestor documental. Sin embargo, en ciertos casos es deseable no indexar ese contenido, por ejemplo si una aplicación "no hace uso de ese contenido indexado".
 
En Alfresco 4.2 EE tenemos un par de opciones para gestionar el indexado de los documentos:
  • La primera es a través del aspecto cm:indexControl que tiene dos propiedades, cm:isIndexed y cm:isContentIndexed, que por defecto están a true. En este link, tenemos la matriz de combinaciones para controlar los índices de un determinado documento, y podemos indexar metadatos y contenido (por defecto), solo metadatos (cm:isContentIndexed=false) o nada (cm:isIndexed=false). Por supuesto, estas propiedad(es) deben ser seteadas en una carga masiva en donde se controlan estas propiedades via API, o via bulk con el indexador desactivado hasta aplicar la propiedad. También podrían gestionarse a través de una regla o un behaviour.
  • Un segundo método es más global y atiende a modificaciones de ciertas propiedades del servidor SOLR. En SOLR podemos desactivar la indexación del contenido de los documentos global en el archivo solrcore.properties mediante la propiedad (alfresco.index.transformContent=false). De esta manera se deshabilitan las indexaciones "full-text" de todos los documentos puesto que para la indexación Alfresco realiza una transformación previa a texto plano. Añadiendo (alfresco.ignore.datatype.1=d:content) se dejaría sin indexar ni documentos ni metadatos en Alfresco. Además existen propiedades en el solrcore.properties para ignorar tipos, aspectos o propiedades como:
alfresco.ignore.type=<type_name>
alfresco.ignore.aspect=<aspect_name> 
alfresco.ignore.field=<property_name> 
alfresco.ignore.store=<store_name> 
alfresco.ignore.tenant=<tenant_name> 
 
En cualquier caso, es necesario siempre probar bien estos cambios, en el comportamiento por defecto de la indexación de Alfresco, con una herramienta como Luke.
 
Por último, desde el punto de vista del modelo de contenidos es posible siempre setear las propiedades de indexación de cada propiedad o metadato.
 
 
Enlaces:
00

Más entradas de blog

Añadir comentarios