La característica de indexado automático de los contenidos y
metadatos de un documento, es normalmente bienvenida en un gestor
documental. Sin embargo, en ciertos casos es deseable no indexar ese
contenido, por ejemplo si una aplicación "no hace uso de ese
contenido indexado".
metadatos de un documento, es normalmente bienvenida en un gestor
documental. Sin embargo, en ciertos casos es deseable no indexar ese
contenido, por ejemplo si una aplicación "no hace uso de ese
contenido indexado".
En Alfresco 4.2 EE tenemos un par de opciones para gestionar el
indexado de los documentos:
indexado de los documentos:
- La primera es a través del aspecto
cm:indexControl que tiene dos propiedades,
cm:isIndexed y cm:isContentIndexed, que
por defecto están a true. En
este link, tenemos la matriz de combinaciones para controlar
los índices de un determinado documento, y podemos indexar metadatos
y contenido (por defecto), solo metadatos
(cm:isContentIndexed=false) o nada (cm:isIndexed=false). Por
supuesto, estas propiedad(es) deben ser seteadas en una carga masiva
en donde se controlan estas propiedades via API, o
via bulk con el indexador desactivado hasta aplicar la
propiedad. También podrían gestionarse a través de una regla o un behaviour. - Un segundo método es más global y atiende a modificaciones de ciertas
propiedades del servidor SOLR. En SOLR podemos desactivar la
indexación del contenido de los documentos global en el archivo
solrcore.properties mediante la propiedad
(alfresco.index.transformContent=false). De esta
manera se deshabilitan las indexaciones "full-text" de
todos los documentos puesto que para la indexación Alfresco
realiza una transformación previa a texto plano. Añadiendo
(alfresco.ignore.datatype.1=d:content) se dejaría sin indexar ni
documentos ni metadatos en Alfresco. Además existen propiedades en
el solrcore.properties para ignorar tipos, aspectos o propiedades como:
alfresco.ignore.type=<type_name> alfresco.ignore.aspect=<aspect_name> alfresco.ignore.field=<property_name> alfresco.ignore.store=<store_name> alfresco.ignore.tenant=<tenant_name>
En cualquier caso, es necesario siempre probar bien estos cambios,
en el comportamiento por defecto de la indexación de Alfresco, con una
herramienta como Luke.
en el comportamiento por defecto de la indexación de Alfresco, con una
herramienta como Luke.
Por último, desde el punto de vista del modelo de contenidos es
posible siempre setear las propiedades de indexación de cada propiedad
o metadato.
posible siempre setear las propiedades de indexación de cada propiedad
o metadato.
Enlaces: