Open IT Experts for Enterprise

Zylk empresa de desarrollo de ecommerce

Controlando la indexacion de contenido en Alfresco

Cesar Capillas
Cesar Capillas
La característica de indexado automático de los contenidos y
metadatos de un documento, es normalmente bienvenida en un gestor
documental. Sin embargo, en ciertos casos es deseable no indexar ese
contenido, por ejemplo si una aplicación "no hace uso de ese
contenido indexado".
 
En Alfresco 4.2 EE tenemos un par de opciones para gestionar el
indexado de los documentos:
  • La primera es a través del aspecto
    cm:indexControl
    que tiene dos propiedades,
    cm:isIndexed y cm:isContentIndexed, que
    por defecto están a true. En
    este link
    , tenemos la matriz de combinaciones para controlar
    los índices de un determinado documento, y podemos indexar metadatos
    y contenido (por defecto), solo metadatos
    (cm:isContentIndexed=false) o nada (cm:isIndexed=false). Por
    supuesto, estas propiedad(es) deben ser seteadas en una carga masiva
    en donde se controlan estas propiedades via API, o
    via bulk con el indexador desactivado
    hasta aplicar la
    propiedad. También podrían gestionarse a través de una regla o un behaviour.
  • Un segundo método es más global y atiende a modificaciones de ciertas
    propiedades del servidor SOLR
    . En SOLR podemos desactivar la
    indexación del contenido de los documentos global en el archivo
    solrcore.properties mediante la propiedad
    (alfresco.index.transformContent=false). De esta
    manera se deshabilitan las indexaciones "full-text" de
    todos los documentos
    puesto que para la indexación Alfresco
    realiza una transformación previa a texto plano. Añadiendo
    (alfresco.ignore.datatype.1=d:content) se dejaría sin indexar ni
    documentos ni metadatos en Alfresco. Además existen propiedades en
    el solrcore.properties para ignorar tipos, aspectos o propiedades como:
alfresco.ignore.type=<type_name>
alfresco.ignore.aspect=<aspect_name> 
alfresco.ignore.field=<property_name> 
alfresco.ignore.store=<store_name> 
alfresco.ignore.tenant=<tenant_name> 
 
En cualquier caso, es necesario siempre probar bien estos cambios,
en el comportamiento por defecto de la indexación de Alfresco, con una
herramienta como Luke.
 
Por último, desde el punto de vista del modelo de contenidos es
posible siempre setear las propiedades de indexación de cada propiedad
o metadato.
 
 
Enlaces:

Si te ha parecido interesante comparte este post en RRS

Facebook
LinkedIn
Telegram
Email

Leer más sobre temas relacionados

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *