Documentation:Organisation du stockage

Un article de AlfrescoWiki.

Sommaire

[modifier] Organisation du stockage
[modifier] Volumétrie
  • La taille de la base de donnée augmente surtout en fonction des propriétés
  • L'index du moteur de recherche prend environ 30% de la taille des documents.
[modifier] Répartition des données
  • la racine du système de stockage est alf_data à la racine de l'installation d'alfresco.
  • Les index du moteur de recherche (lucene) se trouvent dans lucene-indexes
  • Les documents sont stockés physiquement sur le disque dans contentstore
  • Le reste est (en gros) dans la base de donnée.


On notera donc que contrairement à certaines GED, les documents ne sont pas "montés en base". On trouve un sous-répertoire par année, un autre pour chaque mois de l'année, un autre pour chaque jour du mois, et enfin les fichiers placés en fonction de leur date de création.

Les fichiers sont nommé avec un identifiant unique, et terminés par une extension ".bin", mais si vous regardez bien, ce sont les documents originaux simplement renommés.

On peut le vérifier avec la commande "file" sous linux :

$ file alf_data/contentstore/2006/4/5/*
2006/4/5/0c56287f-c4a2-11da-be8a-2954bf1ba394.bin: ASCII text
2006/4/5/129c2568-c4a2-11da-be8a-2954bf1ba394.bin: UTF-8 Unicode text
2006/4/5/1a901de4-c493-11da-be8a-2954bf1ba394.bin: Microsoft Office Document
2006/4/5/2242a606-c4a2-11da-be8a-2954bf1ba394.bin: PDF document, version 1.4

Ne jamais tenter une édition directe de ces fichiers !

[modifier] Changer le paramétrage par défaut

Il est parfaitement possible de déporter tout ou partie du stockage sur plusieurs disques, plusieurs machines, des baies de disques, etc ... et même d'intégrer des mécanisme de réplication/haute disponibilité. Voir à ce propos la documentation disponible sur le wiki Alfresco et qui donne des exemples.

Ceci dit pour rester simple, le fichier "repository.properties" est assez clair en ce qui concerne la valeur par défaut des répertoires de stockage.

# Directory configuration
dir.root=./alf_data
dir.contentstore=${dir.root}/contentstore

# The location for lucene index files
dir.indexes=${dir.root}/lucene-indexes

# The location for lucene index locks
dir.indexes.lock=${dir.indexes}/locks

Pour de bonnes performances, conserver les index en local si possible.