L'indexation automatique

L'indexation automatique permet de suggérer des descripteurs en fonction des termes trouvés dans la notice et des descripteurs présents dans votre thésaurus. Cette fonctionnalité est accessible depuis la grille de catalogage.

Activer l'indexation automatiqueâš“

Deux paramètres sont à renseigner pour activer l'indexation automatique. Depuis Administration > Outils > Paramètres > Catégories, thésaurus et plans de classements. Complétez les paramètres comme, par exemple, ci-dessous.

Paramètre

Valeur par défaut

Explication

auto_index_notice_fields

tit1=1.00;n_resume=0.5;

Liste des champs de notice à utiliser pour l'indexation automatique.

Syntaxe: nom_champ=poids_indexation;

Les noms des champs sont ceux précisés dans le fichier XML "pmb/includes/notice/notice.xml"

Le poids de l'indexation est une valeur de 0.00 à 1. (Si rien n'est précisé, le poids est de 1)

Exemple :

tit1=1.00;n_resume=0.5;

auto_index_search_param

max_relevant_words = 20;autoindex_deep_ratio = 0.05;autoindex_stem_ratio = 0.80;autoindex_max_up_distance = 2;autoindex_max_up_ratio = 0.01;

autoindex_max_down_distance = 2;autoindex_max_down_ratio = 0.01;

autoindex_distance_type = 1;autoindex_distance_ratio = 0.50;max_relevant_terms = 10;

Surchage des paramètres de recherche de l'indexation automatique.

Syntaxe: param=valeur;

Listes des parametres:

max_relevant_words = 20 (nombre maximum de mots et de lemmes de la notice à prendre en compte pour le calcul)

autoindex_deep_ratio = 0.05 (ratio sur la profondeur du terme dans le thésaurus)

autoindex_stem_ratio = 0.80 (ratio de pondération des lemmes / aux mots)

autoindex_max_up_distance = 2 (distance maximum de recherche dans les termes génériques du thésaurus)

autoindex_max_up_ratio = 0.01 (pondération sur les termes génériques)

autoindex_max_down_distance = 2 (distance maximum de recherche dans les termes spécifiques du thésaurus)

autoindex_max_down_ratio = 0.01 (pondération sur les termes spécifiques)

autoindex_see_also_ratio = 0.01 (surpondération sur les termes voir aussi du thésaurus)

autoindex_distance_type = 1 (calcul de distance de 1 à 4)

autoindex_distance_ratio = 0.50 (ratio de pondération sur la distance entre les mots trouvés et les termes d'une expression du thésaurus)

max_relevant_terms = 10 (nombre maximum de termes retournés)