(blog.mistike)

Reflexions et bidouillages généalogiques et hors sujet

Ma gestion des sources : nommage et classement

Maïwenn a posté récemment sa description en tant que généalogiste. Dans ce post, et dans ceux qui lui répondent chez Raphaël et chez … Raphaël encore, un des problèmes communs qui ressort est celui de la gestion des sources, et en particulier leur « nommage » et leur classement, que ce soit pour les documents numériques ou physiques.

Et donc, comme je cherche à gagner du temps pour faire mon propre portrait suis sympa, je lance officiellement le débat en présentant la façon dont je fonctionne.

Quand j’ai commencé ma généalogie, en 2003, j’ai tout de suite « sourcé » mes infos, mais j’ai mis un peu de temps avant de trouver un système qui me convient. Comment nommer les documents (principalement papiers à l’époque, quasiment exclusivement électroniques aujourd’hui), comment les classer, comment les exploiter ? Je n’y connaît rien en archivistique, mais par contre, étant informaticienne, j’ai quelques « bonnes pratiques » qui me viennent du monde de la conception de bases de données.

Au début, j’ai fait comme beaucoup, c’est-à-dire que j’ai nommé mes documents avec le nom de la personne concernée, le numéro sosa, la génération, le type de document. Ca donnait des choses du genre « 197G8 – AB – FOURNIER Cécile » pour un baptême, ou encore « 392G9-393G9 – AM – CHASTAN Antoine et DUMAS Catherine » pour un mariage.

Le tout était scanné, les documents papier rangés dans des classeurs (branche paternelle, branche maternelle), dans l’ordre des générations, et les documents scannés étaient stockés avec une arborescence similaire.

Mais je me suis très vite heurtée aux limites de ce système.

  • D’abord, impossible de classer ça dans un ordre ou dans un autre, puisque le nom n’est pas strictement identique.
  • Le classement utilisé n’a pas vraiment de logique
  • C’est encore pire pour les actes concernant plusieurs personnes, comme les actes de mariage
  • Et je ne vous parle pas de ceux qui ne concernent pas des SOSAs (fratries par exemple).
  • Ca fonctionne à peu près pour les actes d’état-civil, mais ça devient vite ingérable dès qu’on va taper dans d’autres collections : comment appliquer celà à une entrée de cadastre, à une photo, à un jugement, à un acte notarié passé par toute une famille ?

Il me fallait donc normaliser tout ça. Après avoir presque appris par coeur les infos de Généalogie Standard (site mort, repris depuis par FranceGenWeb), je suis arrivée à quelque chose qui me convient bien, et qui fonctionne depuis 5 ans sans modification.

La toute première règle, c’est qu’un document doit être nommé indépendamment de son contenu. Exit les sosas, noms de personnes, etc. Un peu comme c’est le cas dans les archives. Un document n’est jamais décrit par son contenu, la côte se fiche complètement de savoir qu’il s’agit du testament de Mr Arsène Bidule.

La seconde, c’est qu’il faut quand même que ça me parle un minimum.

Bref, j’ai donc listé toutes les caractéristiques importantes (à mes yeux) d’un document, et qui seraient « universelles ». Voici voilà :

  1. L’origine (géographique) du document : le lieu où il a été créé
  2. La date de création
  3. Et un numéro unique qui différencie deux docs créés le même jour au même endroit

Question subsidiaire : comment les classer ? Pour ma part, c’est d’abord par lieu, ensuite par date.

En affinant un peu, ça donne ça : PAYS_COMMUNE_SOUSLIEU_AAAAMMJJ_XXX

  • Pays : code officiel INSEE (exemple pour l’Algérie : 99352. Pour la France : 99FRA (ben oui, y a pas de code pour la France ;-) )
  • Commune : code officiel INSEE. Pour les communes étrangères, je me creuse la tête en essayant de trouver l’équivalent local. Avantage pour moi, j’ai très peu d’actes étrangers, sauf l’Algérie (Française à l’époque), et qui dispose de codes INSEE ^^
  • SOUSLIEU : Un bête numéro incrémental sur 3 caractères, pour différencier par exemple les paroisses
  • AAAAMMJJ : la date normalisée. Je convertis depuis peu les dates révolutionnaires parce que ça mettait le bazar dans mes tris.
  • XXX : Numéro incrémental unique sur 3 caractères.
  • Pour les documents de plusieurs pages, je rajoute une extension « _pxx » à la fin.

Résultat :

« 197G8 – AB – FOURNIER Cécile » est devenu « 99FRA_05026_001_17650328_001« 
« 392G9-393G9 – AM – CHASTAN Antoine et DUMAS Catherine » est devenu « 99FRA_05065_001_17520214_001« 

Avantages :

  • Ca marche pour tous les documents possibles. Si je ne connais pas la date, par exemple, je mets des 0.
  • Ca se trie tout seul dans le bon ordre
  • Ca facilite les recherches, puisque j’ai tendance à rechercher souvent par date
  • C’est facile à ranger

Inconvénients

  • Ca me parle à moi, mais pas forcément aux autres. Ce qui n’est un inconvénient que très relatif
  • Ca nécessite quand même un outil à part pour les gérer (pas obligatoire mais bien pratique). Un peu comme les inventaires des Archives.

Et donc je ne les gère pas dans Hérédis, mais je me suis fait une base de données séparée. Dans Hérédis, je rentre le nom de la source, et une brève description. Ce qui fera l’objet d’un autre post, celui-ci étant déjà bien long !

Et enfin, le rangement

Déjà, toutes mes sources « physiques » sont scannées. Je ne gère plus que des documents électroniques.

Tout ça est rangé dans une arborescence particulière :

\sources\<code_pays> – <nom_pays>\<code_commune> – <nom_commune>\<document>.jpg

Petite copie d’écran :


Arborescence


Taggé avec:

11 Commentaires

  1. ahhhhhhh j’ai l’impression de voir des centaines et des centaines d’images de lots d’archives numérisées..
    Je m’incline devant tant de rigueur ! Chapeau !
    Moi et ma nomenclature sosa et ma nomenclature « autre »… et mes non nomenclatures pour les autres documents.
    Comment gères-tu justement ces autres documents, genre matricules militaires, actes notariés (ceux-là doivent survivre à ta charte de nommage), les extraits d’ouvrages Gallica, etc etc… parce qu’au niveau du lieu, c’est difficile non ?

    PS : j’aime beaucoup les dossiers « à ranger » et « à traiter ». J’espère qu’ils sont moins volumineux que les miens :)

    • Bah, question rigueur, j’ai des progès à faire, mais nommer un fichier « toto » ou « 99FRA_05065_001_17520214_001″ c’est pas beaucoup plus compliqué ;-)

      Pour les autres documents, on doit avoir à peu près la même « non-nomenclature » ;-) Mon système permet d’en gérer beaucoup : tout ce qui est état-civil et associés, actes notariés, matricules, etc… Quand je n’ai pas de date, ou pas de lieu, je mets des 0.

      Pour les bouquins, ils sont dans un répertoire à part, et je les nomme « Auteur – Titre ». Pour l’instant je n’ai pas trop d’extraits, mais je ne sais pas comment je vais les gérer, car je gallicalise de plus en plus.

      Et au final, ça ce sont les noms des fichiers, qui me servent à les retrouver et à les identifier de visu, mais j’ai quand même une base de données où je les indexe tous. Et là, si besoin, j’utilise l’ID automatique (incrément) assigné par la BD à chaque nouvelle entrée.

      Et tout ce que je ne peux pas ranger avec le reste, ça va dans « à ranger » ;-) ou « autres ».

      Mon dossier « à ranger » est généralement vide (il me servait plus, avant, quand je scannais des 10aines de docs). Par contre, celui « à traiter »…. pfiou ! Plein trop de trucs dedans :-(

  2. Je m’incline ! :wink:

    Très bonnes idées et réflexions concernant le nommage. Merci pour le billet et cette suite fructueuse de discussions autour des « bonnes pratiques » en généalogie. Maïwenn va pouvoir nous réunir en symposium !

    Je crois que je vais finir par me laisser tenter, entre la charte de nommage suggérée par Maïwenn (http://www.archivesdefrance.culture.gouv.fr/static/358) et la tienne. Il faudra bien que je passe par un système de base de donnée aussi alors.

    Vous utilisez quels logiciels pour cela ? (la première qui me sort Gaïa je l’occis !).

    • Pas de Gaïa pour moi, un bidule développé avec mes petites mimines il y a longtemps (2003) et récemment remis au goût du jour.

      Inconvénient ? Super chiant à faire, et à faire évoluer quand ça me prend.
      Avantages ? Totalement customisé ;-) et portable (puisque c’est une appli « web » développée en php et mysql). Du coup j’en ai plusieurs exemplaires, sur mon portable et sur une section privée de mon domaine web. Et je peux accéder à mes sources de n’importe où dans l’univers lol

      • Bonjour,

        C’est par hasard que je suis arrivé sur votre blog… et je ne le regrette pas du tout ! En plus, je vais (enfin) pouvoir présenter ma méthode de nommage et classement. Je la trouve suffisament pratique et fiable pour la présenter. Chacun pourra se forger un avis…

        Je précise (et la suite vous le montrera ; au risque d’être « hors sujet ») que je ne partage absolument pas votre point de vue lorsque vous écrivez « qu’un document doit être nommé indépendamment de son contenu. Exit les sosas, noms de personnes, etc. Un peu comme c’est le cas dans les archives. Un document n’est jamais décrit par son contenu, la côte se fiche complètement de savoir qu’il s’agit du testament de Mr Arsène Bidule. »

        Je pense tout au contraire qu’une archive est absolument et totalement indissociable de l’individu (ou du couple, ou de la personne morale, etc…) dont elle relate un instant de l’existence. Pas de sujet = pas d’archive = pas de source à utiliser et à classer. Et, en outre, puisqu’on fait de la généalogie, puisqu’on finit par s’attacher à nos ancêtres, autant leur rendre un petit hommage supplémentaire en faisant que même les noms / cotes des ressources documentaires « parlent » d’eux. La généalogie c’est déjà beaucoup de morts, alors autant y remettre un peu de vie…

        Même centrée sur un individu, l’opération de nommage d’une source n’est pas incompatible avec une normalisation / standardisation des cotes. Bien au contraire. Je vous en donne quelques exemples ci-dessous avant de vous en détailler la structure (méthode de création) :

        Ex : BAILLON Pierre. Acte de naissance. PRAHECQ 15.06.1858. AD79 N1836-1862 2MI180 P12-1
        Ex : BAILLON Ignace et INGRAND Marie . Acte de mariage. PRAHECQ 12.11.1679. AD79 BMS1675-1700 3RI480 P185
        Ex : CHATAIGNEAU Joseph Pierre. Inventaire décès. SOUCHÉ 28.03.1844. AD79 NOT-Collin
        Ex : DEFAYE Georges. Registre matricule. NIORT 1917. AD79
        Ex : BAUDIN Joseph Jules Maximin. Photographie. LIEU 00.00.0000. Sophie Valois
        Ex : DEFAYE Georges et CREDIT DE L’OUEST. Bon au porteur. LIEU 00.00.1922. Micheline Defaye

        Déjà, en lisant la référence, vous voyez à qui / quoi vous aurez à faire : un (des) individu(s) + un type d’acte + un lieu + une date + une référence officielle ou personnelle.

        Mes références d’actes comportent 4 parties, séparées par un point puis un espace (sans point final). A savoir :

        1) Une Identification, sous la forme NOM + Prénom. On peut noter l’ensemble des prénoms si on le souhaite, ou plusieurs personnes si on souhaite leur associer un même acte. Il est aussi possible de donner au document le nom d’une personne autre que celle dont il est principalement question… comme dans le cas où un ancêtre est simplement témoin ou cité.
        Par exemple : BAILLON Pierre, ou BAILLON Joseph Pierre, ou BAILLON Ignace et INGRAND Marie.

        Je n’ai pas retenu le nommage par SOSAs car on ne sait pas à l’avance si l’individu dont il est question aura un SOSA, ni lequel.

        2) Un type d’acte. Ex : Acte de naissance ; Acte de mariage ; Recensement, Testament, etc…
        Ici, ce qui compte c’est de standardiser / normaliser le nom des divers documents que l’on peut rencontrer et utiliser dans une généalogie. En règle général, on trouve surtout des actes de BMS ou NMD (avant ou après 1792), des archives notariales, des recensements… Une liste peut être définie et proposée, mais chacun peut aussi se faire son système.

        3) Une localisation spatio-temporelle (ça fait science-fiction !) de l’acte. Ex : PRAHECQ 12.11.1679
        Un temps, je notais le nom de lieu sur 4 ou 5 lettres mais je me suis rendu compte que c’était une cause d’erreurs. Donc, autant noter le nom entier (au choix dans le cas de noms composés : soit SAINT-MAIXENT-L-ECOLE, soit SAINTMAIXENTLECOLE, ou autre…). Si on ignore le lieu, on écrira LIEU. Cela semble préférable à l’utilisation d’un code postal ou INSEE car c’est moins parlant et plus facile à retenir !

        Pour la date de l’acte, on saisira JJ.MM.AAAA, ou 00.00.AAAA quand on ne connait que l’année, ou 00.MM.AAAA quand c’est le jour qu’on ignore. Avec 00.00.0000, on ne sait rien !

        4) Enfin, une référence qui peut être personnelle ou rependre les cotes d’un document. Dans mon cas et puisque j’effectue surtout mes recherches aux AD des Deux-Sèvres, il faut lire la référence « AD79 N1836-1862 2MI180 P12-1 » de la manière suivante : Archives départementales des Deux-Sèvres, registre des actes de naissance de 1836 à 1862, registre coté 2MI180, page 12, vue n°1 (s’il y a plus d’une vue ou copie d’écran). Avec cette notation, les personnes qui disposent de mes références peuvent très facilement retrouver l’acte.

        Pour le cas d’archives familiales, on pourra citer la personne, par exemple : Sophie Valois Il est rare que des particuliers aient un système de cotation élaboré.

        Quel est, selon moi, l’intérêt et l’avantage de ce système ?

        Il permet le nommage de n’importe quel type de document sous n’importe quelle forme (image, document Word, PDF, note manuscrite). Le classement alphabétique sur le nom de personne, puis le ou les prénoms, puis le type d’acte est très facile et explicite. Dans le cas de copies d’écran (en jpeg ou autre) cela facilitera d’autant une recherche au sein des images (et on peut rapidement en avoir des centaines !). Les actes, qu’ils concernent une personne physique ou morale, seront regroupés à la suite… ce qui ne serait pas le cas avec un autre système dans le cas d’un individu né, marié et décédé dans trois départements différents ! (idem avec les SOSA pour les très vieux ancêtres dont on descend plusieurs fois).

        Autre avantage, en utilisant toujours la même structure, on sera immédiatement avisé de l’existence d’un doublon, lors de l’enregistrement, en cas de conservation sur un PC. Idem en différé pour un classement manuel.

        Si, comme je le fais, on conserve dans un dossier des centaine voire des milliers de copies d’écrans (ou de scans, ou de photographies), il arrive un moment où on utilise ces documents. A ce moment là, je saisis « U.» devant ceux utilisés et « 000 » (triple zéro) devant ceux que je ne parviens pas à rattacher à un individu en particulier (pour le moment). Cela permet éventuellement de trier les documents : ceux utilisés et ceux en attente de l’être.

        En cas d’homonymie, d’erreur de saisie sur un patronyme, un lieu ou une référence, on peut renommer le document sans modifier fondamentalement sa référence. Au contraire, on gagnera en précision lors des recherches. Cela forcera à être plus rigoureux pour sa généalogie (ex : on pourra écrire VALLEAU pour toutes les références les concernant, même si au niveau du patronyme saisi dans son logiciel de généalogie, on tape VALLAU ou encore VALLAULT pour tenir compte de l’évolution du nom à travers le temps).

        On peut enfin utiliser ce système de nommage dans une base de données ou n’importe quel « bidule » d’enregistrement.

        Je suis désolé d’avoir été si long. J’espèce que cela vous aura convaincu. Si ce n’est pas le cas, je suis à l’écoute de vos commentaires. N’hésitez pas à me contacter si vous le souhaitez.

        Bien cordialement.

        • Bonjour ! Merci pour votre commentaire.

          Il est évident que nous ne sommes pas d’accord sur le principe, mais votre système, s’il fonctionne pour vous, est bon. Le mien necessite effectivement d’indexer les sources.

          Je vais relire votre méthode plus posément, pour bien tout comprendre.

          Merci encore :-)

          • Merci à vous d’avoir pris le temps de me lire (et de me relire à tête reposée).

            J’attends de voir ce que vous penserez de ma méthode car, jusqu’à présent, les quelques (rares) personnes à qui j’en ai parlé, l’ont adoptée. Elle a un avantage : elle ne parle pas qu’à moi et une référence / cote est très facile à composer une fois qu’on a (facilement) mémoriser leur structure.

            Bon dimanche.

            Bien cordialement.

  3. Pour gérer la liste de mes sources j’utilise tout simplement mon logiciel de généalogie en l’occurrence Hérédis aussi, qui possède un dictionnaire des sources. Le tri se fait sur les dates que je retrouve facilement pour associer une source à plusieurs individus.

    Pour le classement des actes j’ai un classeur par catégorie (Naissance, Décès et Mariage) puis un tri par date aussi. Le dictionnaire des sources y fait référence. Chaque document est identifié.

    Pour les actes numérisés le classement se fait sur le nom, ce qui me permet quand j’utilise l’explorateur de mon système d’exploitation (Windows) d’avoir un tri natif avec tous les actes d’un individu regroupés.

    Plus d’explication sur mon blog : http://pierre.caylus.free.fr/wordpressfr/index.php/genealogie/gestion-des-sources/21/

    Dans le système de mistike, l’inconvénient que je vois aussi c’est la redondance de l’information, à la fois dans la création de dossier et sous-dossier de l’exploration windows, et le début du nom du fichier. Mais ce n’est pas grave j’en conviens car le tri par date recherché est bien obtenu.

    • En fait la redondance ici n’est pas gênante car elle permet avant tout de faciliter l’accès à une source ou à un lot de sources, par le biais dont je me sers le plus souvent : le lieu, puis la date. En fait ça me permet de retrouver ce que je cherche très vite, selon plusieurs axes de recherche.

      Là où elle est nettement plus lourde, c’est que j’utilise aussi le dictionnaire des sources Hérédis, pour lier sources et événements. Et pour que ça reste intelligible dans Hérédis, je me retape un certain nombre d’infos, en double donc.

      J’ai un problème avec les cases vides. Faut que je les remplisse, même si c’est pas la peine ^^

Trackbacks

  1. Tweets that mention Ma gestion des sources : nommage et classement | (blog.mistike) -- Topsy.com
  2. Quel généalogiste suis-je ? (moi aussi !) | Papiers et poussières