Réflexions et bidouillages généalogiques
Tag Archives: Toolbox
Tenir un journal de recherche

Dans la série “Quel Généalogiste Suis-Je”, Raphaël se demande sur Twitter quel logiciel de dépouillement nous utilisons, dans le but de tenir un journal de recherche :

Quel logiciel de dépouillement d’actes (relevés systématiques) utilisez-vous ? J’avais l’habitude de Nimègue, ms il y a p-ê mieux depuis ?

Personnellement, je ne systémadépouille pas, par manque de temps et de courage. Les rares fois où je l’ai fait, sur des communes où j’avais de nombreux ancêtres et où je passais ma vie à lire et relire les registres, je l’ai fait dans Hérédis. Dans ce cas de figure, il me semblait intéressant de reconstituer les familles, plutôt que de tenir une liste d’actes.

Mais le but ici n’est pas forcément de faire un relevé au sens habituel du terme. Il s’agit plutôt de trouver le meilleur outil pour tenir son propre journal de recherche.

Le journal de recherche permet :

  • De ne pas avoir à relire un registre 12.000 fois, soit quand on y a fait chou blanc, soit au fur et à mesure que nos pelotes se déroulent
  • De savoir où l’on en est de nos recherches sur une commune / une famille / un patronyme lorsque l’on se repenche dessus plusieurs semaines ou mois plus tard

Ce journal est à mon sens une des choses les plus importantes dans une recherche généalogique, et bien souvent celle qui pêche le plus. Combien d’entre nous en tiennent un, et le maintiennent à jour ? Combien d’entre nous ont passé des heures / jours / nuits / week-ends à se retaper les BMS complets d’une commune, pour se rendre compte qu’on l’avait déjà fait ? Combien d’entre nous se reposent encore et toujours les mêmes questions à propos d’un ancêtre “perdu” ((ou plutôt pas trouvé)), sans se rappeler que ces questions ont déjà trouvé une réponse oubliée ?

Et quand on transpose ces problèmes à une famille entière, quand on doit se dépatouiller avec 12 homonymes, des graphies différentes dans tous les actes, et des familles recomposées, on se rend vite compte que si on ne note pas les recherches déjà effectuées et surtout les certitudes et questions toujours en suspens, on n’y arrivera jamais.

Je ne suis très rigoureuse sur ce journal que depuis peu de temps, mais ça me sauve la vie régulièrement. Mon journal de recherche est constitué de plusieurs parties :

  • La liste des registres étudiés, que j’y ais trouvé quelque chose ou pas, avec dates de début et de fin,
  • Un “dépouillement” des actes qui “pourraient servir un jour”, par exemple les homonymes dont je ne sais ni s’ils sont liés à mon arbre, ni comment,
  • Des fiches qui posent, pour chaque individu / couple / famille / commune / etc…, les faits connus, les questions sans réponse, les recherches déjà effectuées, les recherches à faire, et les pistes. Voire, les idées en vrac.

Le second point peut parfaitement être géré avec un logiciel spécifique, comme un logiciel spécialisé (Nimègue), ou un tableur (Excel). Ca présente l’énorme avantage de pouvoir faire des recherches, et d’éditer des listes et états personnalisés, et surtout d’avoir des relevés qui sont tous indentiques, et donc comparables.

Personnellement, avant de me tenir aussi aux points 1 et 3, j’ai testé plusieurs solutions :

  • Nimègue : le seul logiciel de relevé systématique que je connaisse. Certainement le plus répandu aussi. Il permet des exports sous différentes formes, dont Généabank (c’est un logiciel d’association), et des états divers et variés, avec plein de fonctions assez sympas. Malheureusement, il pêche ((pour moi)) par une ergonomie assez lourde, et vieillote. Il n’est tout simplement pas adapté à ce besoin particulier de noter tous les actes “potentiellement intéressants” que l’on rencontre lors d’une recherche, simplement parce que chaque acte est trop long à entrer. Quand je parcours un registre, je le lis souvent “en diagonale” et je vais assez vite. Sinon, je meurs. Si je dois passer 5 minutes à enregistrer un acte qui m’a fait de l’oeil, je me décourage très vite. Surtout quand ledit registre fait 600 pages et que tout le monde a le même nom.
  • Excel : premier reflexe. Je suis une furieuse de l’industrialisation, et il faut que tout ce que je note ait le même format ((on est informaticienne ou on ne l’est pas, hein)). Malheureusement, je souffre aussi du syndrôme de la case vide et du trop détaillé. S’il y a une case à remplir, je ne peux pas la laisser vide. Et quand je la remplis, je note tout. Du coup, je me retrouve dans Excel avec les mêmes problèmes que dans Nimègue. Trop de cases. Impossible de ne noter que l’essentiel. Je vais quand même plus vite qu’avec Nimègue, mais ça marche quand même pas.

Et donc, je suis revenue toute penaude à un simple outil au format texte :

  • Ca va vite. Je tape un paragraphe à la vitesse de l’éclair, sans avoir à naviguer de case en case. Quelques secondes à peine pour un acte.
  • Ce me permet de noter remarques et infos diverses (qui n’ont alors pas besoin d’avoir une case. Je vous le dit, je devrais me faire soigner).

Maintenant, j’aime bien avoir tout sous les yeux en même temps, et naviguer rapidement dans les informations. Un logiciel de traitement de texte comme Word ne convient donc pas (à quand les docs avec onglet comme dans Excel ?). J’utilise donc un petit soft dont je disposais déjà au boulot : Treepad. J’ai la version payante (business), mais la version gratuite convient tout aussi bien. Il y a une version Linux. Attention c’est en anglais.

Les avantages :

  • Navigation dans un panel à gauche, sur le même modèle que le navigateur Windows (des dossiers, des sous-dossiers, des documents).
  • Edition en mode RTF, donc avec mise en forme “de base” (couleurs, gras, titres, etc…)
  • Possibilité d’insérer des images “inline”
  • Gestion des liens hypertexte entre documents ou vers des documents externes (y compris, bien sûr, internet).
  • Tout mon “journal” est au même endroit : registres étudiés, dépouillements partiels, fiches de recherche. Et tout ça dans un seul et unique fichier.

Les inconvénients :

  • Ergonomie qui n’a évidemment pas le niveau d’un Word ou d’un Open-Office.
  • Format propriétaire, bien que l’on puisse exporter en format texte, RTF, etc… sans problème. Il existe aussi un “viewer” et un utilitaire pour créer un “ebook” au format exe, que n’importe qui pourra ouvrir.
  • Les inconvénients du texte… pas de recherche par champs, pas d’automatisation des traitements, pas d’export possible pour partager (mais ce n’est pas le but en l’occurrence), organisation statique.

Quelques copies d’écran de my journal :


Où je copie les actes que j'ai envie de garder parce qu'ils sortent de l'ordinaire


 


Registres étudiés dans le 04



Actes divers relevés dans les registres, et qui pourront servir "un jour"



Recensements



Fiche d'un couple qui me donne du fil à retordre



Recherches à faire sur le couple en question


 

J’ai quand même en projet de développer un module pour mon site local qui me permettrait de faire la même chose, avec les avantages d’une base de données… un jour, peut-être, quand j’aurais fini tout le reste !

Et vous, tenez-vous un journal de recherche ? Avec quel(s) outil(s) ?

Mon logiciel de généalogie idéal

Je ne sais pas pourquoi, mais j’ai eu envie de décrire ce qui serait pour moi, le logiciel de généalogie idéal. Bon, à la relecture, ça ressemble plutôt à la liste de ce que je reproche à Hérédis, mais bon 😉

En vrac, hein.

Les caractéristiques de base

  • Il existe en versions Windows (32 et 64-bits).
  • Il existe en version Linux.
  • Les versions pour différents OS sont identiques en termes de fonctionalités et de qualité.
  • Il possède une interface graphique agréable et surtout fonctionnelle.
  • Ladite interface est presque entièrement paramétrable (position des différents éléments, barres d’outils, choix des éléments à afficher…).
  • La navigation est facile et intuitive, dans le logiciel, comme dans la généalogie.
  • L’édition (création, modification, suppression) des données est rapide (rien de pire que de passer 10 minutes par nouveau personnage, avec douze écrans différents ((suivez mon regard)) ).
  • La gestion des données se fait dans une base… de données.
  • Support de l’UTF-8 / Unicode (par défaut ?)

Les fonctionalités critiques

  • Gestion des sources complète et paramétrable.
  • Gestion des lieux standardisée (avec codes INSEE pour la France) avec lieux-dits/paroisses, voire évolutions au cours du temps.
  • Tout élément est “sourçable”, et pas que les événements : liens (même les liens familiaux de base), dates, lieux, professions, titres, surnoms et noms d’usage, signatures, et même les noms et prénoms.
  • Certains éléments, sinon tous, sont datables : profession par exemple.
  • Export GEDCOM respectueux à 100% des spécifications du standard, y compris pour les éléments spécifiques au logiciel, et y compris pour les dates en calendrier révolutionaire ou exotique ((suivez mon regard)) et y copris les spécificités locales (accents par exemple) .
  • Gestion des informations complémentaires individuelles et familiales.
  • Gestion des doublons à cascade (genre si deux personnes sont des doublons, quand on les fusionne, ça identifie les enfants et autres personnes liées comme doublons potentiels et ça demande ce qu’on veut en faire).
  • Edition d’arbres graphiques simples (des cases, des traits) et paramétrables, pour avoir une vue globale simplifiée, et des roues aussi simples. Du fonctionnel, quoi.
  • Création et enregistrement d’états et statistiques personnalisés ((voir le coup de la base de données plus haut)).
  • Export des listes, états et statistiques au format adéquat (un tableau, ça s’exporte en csv ou dans un tableur. Pas dans un traitement de texte. ((suivez mon regard)).
  • Recherche multicritère ((et qui ne s’arrête pas à 4 critères, suivez mon regard)) avec affichage des données recherchées, pas juste les noms des gens.

Les fonctionalités qui-sont-ou-seraient-bien-sympas-quand-même

  • Gestion des recherches en cours et à faire (et des trucs qu’on a cherchés mais pas trouvés, et des pistes à explorer), que l’on peut rattacher à un ou plusieurs éléments (personne, famille, source…). Rhooo, un wiki !
  • Raccourcis clavier paramétrables.
  • Navigation dans les données via liste éclair.
  • Recherche multicritère avec possibilité d’utiliser des expressions régulière ((là, si on me sort ça, j’épouse le développeur)).
  • Edition web dynamique en php/mysql ou équivalent ((j’avoue ne pas avoir trouvé mieux que Geneweb en la matière)) et respectueuse des standards actuels.
  • Les données sont utilisables dans les versions d’OS différentes sans passer par un un gedcom et sans perte de données.
  • Gestion des modifications (versioning).

Les fonctionalités qui ne (me) servent à rien

  • Edition d’arbres graphiques tordus ((et moches))
  • Arbres 3D, 12D, luniens, martiens, à l’envers, à l’endroit, en diagonale et qui peuvent chanter ((suivez … bon, vous avez compris)) ((éventuellement, je suis pas sectaire, j’accepte quand même ceux qui feraient le café)).
  • Edition web au format Web 1998 avec trois millions de fichiers statiques et navigation pourrie.
  • Edition web totalement propriétaire ((suivez… bref)) ((mais j’admet que ça puisse intéresser les autres)).

Voilà. J’en oublie sûrement…
A vous !

Les cartes de cassini dans Google Earth

J’utilise beaucoup Google Earth dans mes recherches généalogiques. Etant en plein développement de mon (vrai) site web, qui incluera ce blog, je me suis repenchée sur les formats de géolocalisation de Google, que ce soit Earth, ou Maps et ses APIs.

Et j’ai trouvé un trésor : les collections de cartes anciennes de David Rumsey [en]. Je vous conseille très vivement de visiter le site, qui présente un nombre incroyable de cartes anciennes du monde entier, visualisables dans diverses applications, dont Luna, qui me semble spécifique, et Google Earth. Attention, le site est en anglais.

Parmi ces cartes, on trouvera en particulier les éditions 1750 et 1790 des cartes de Cassini (la seconde étant nettement moins détaillée), mais beaucoup d’autres qui peuvent intéresser le généalogiste : cartes de Paris en 1716 et 1834, carte de l’Europe en 1787, cartes d’Allemagne, d’Irlande, d’Amérique, et plein plein d’autres. Chaque carte est, cerise sur le gâteau, accompagnée d’une notice descriptive détaillée.

Avant de détailler l’utilisation avec Google Earth, un petit mot sur Luna. Ce visualiseur online, développé en Javascript, je crois, permet non seulement de rechercher et de visualiser des cartes en ligne, mais aussi de les télécharger, jusqu’à très haute résolution. Une fois la carte désirée choisie, cliquer sur “Export”, choisir la résolution (jusqu’à 12288px !!!), attendre quelques instants (ça peut prendre plusieurs minutes), et hop, la carte est prête à être téléchargée. Magique.



Export d'une carte avec Luna



Mais le mieux du mieux, c’est l’export Google Earth. Qui n’a pas rêvé de pouvoir utiliser toutes les fonctionalités de G.E. sur une carte ancienne ? Pour ceux qui n’ont pas encore downloadé l’application, faites-le, d’autant que c’est gratuit et en français. C’est un outil absolument indispensable pour le généalogiste de base 😉 Allez, allez, je vous attend.

(…….)

Maintenant que vous avez installé le logiciel, rendez-vous sur la page http://www.davidrumsey.com, et dans le menu “View Collection” choisissez “Google Earth”. Puis cliquez sur “Launch Google Earth Application” :

Normalement, GE s’ouvre, avec à gauche un menu “Rumsey historical Maps” (en vrai, vous avez téléchargé un fichier KMZ, pour ceux qui connaissent) :

Dans ce menu, choisir Europe –> France –> France 1750 (ou 1790). Le chargement peut-être un peu long, en fonction de votre connexion internet.

Après, on peut travailler normalement, par exemple chercher le village de Mamie Odette ((non je n’ai pas de mamie nommée Odette, encore moins à Abriès)), zoomer, et profiter des fonctionalités avancées. A noter que la géolocalisation des cartes est parfaite, ça colle exactement.



Abriès (05) - vue Google Earth normale



De là, en cochant et décochant les cases à gauche, on bascule d’une carte à l’autre :



Abriès (05) - Cassini 1750





Abriès (05) - Cassini 1790



On voit par exemple la frontière Italienne, pratique, et version 1790 + 2010 😉 De même on peut afficher les frontières (actuelles) des départements, par exemple. Ce qui pour moi, dont les ancêtres avaient une fâcheuse tendance à vivre en bordure de département, est super pratique.

Cette application permet d’enregistrer ses lieux favoris, de placer des marqueurs, de connaître les coordonnées géographiques, etc…

Vous allez me dire, on peut faire la même chose sur le site de l’IGN, mais moi, je préfère une appli installée localement, même si les cartes de Rumsey elles-mêmes ne le sont pas (il faut donc une connexion internet pour que ça fonctionne). Google Earth offre un million de possibilité de personalisation (on peut même “importer” des images de Picasa, pratique pour y afficher photos et images d’actes, par exemple (voir l’article de Jordi sur l’utilisation de Picasa 3 en généalogie).

Ou encore : liste éclair dans la carte ((ça c’était avant mon voyage à Rouen, depuis ils sont plus nombreux)) :



Mes ancêtres Normands à Criquebeuf



Prochaine étape : liste éclair avec les noms, et animation pour visualiser les flux migratoires de mes ancêtres au fil des années :mrgreen:

Sauvegardez vos données : les supports


Il existe un nombre important de supports possibles pour sauvegarder ou dupliquer les données présentes sur un ordinateur. Chacun a ses avantages et ses inconvénients, et le mieux est de toujours diversifier et donc, utiliser plusieurs supports simultanément.

1. Les CD et DVD

C’étaient les rois de la sauvegarde il y a quelques années. Malheureusement, si on s’en doutait déjà à l’époque, on le sait aujourd’hui. Ils sont fragiles, et leur durée de vie est très courte. A moins d’utiliser des disques en or, et encore, ça ne fera gagner que quelques années. Un CD, ça se raye trèèèès facilement, ça se casse sans problèmes, ça se perd. Et surtout, même pour les plus soigneux, ça s’use. Très vite. Surtout quand les versions réinscriptibles. Ils ne doivent donc être considérés que comme des supports temporaires, utiles pour partager et tranférer ses données (quoique pour ce dernier usage, la clé USB est aujourd’hui bien plus pratique).

Et en plus, ça prend de la place. Bref, on oublie.

2. Les disques durs

Les disques durs sont les plus évidents. Evidemment, ne pas utiliser le même que le disque interne à son PC, sinon ça ne sert pas à grand chose 😆

Le prix au giga est aujourd’hui très bas, et on trouve des disques de plusieurs centaines de Go à moins de 100€. On a le choix :

  • Les disques de 2″5, petits, légers, portables. Ce sont les disques utilisés en interne dans la plupart des ordinateurs portables, et on en trouve pléthore comme “disque externe”. Pour un prix parfois un peu plus élevé, on a le disque, et un boîtier, qu’il suffit de connecter à son PC par une prise USB le plus souvent. Ils sont fiables, faciles à transporter et peu encombrants. Certains sont “auto-alimentés”, c’est-à-dire qu’ils ne nécessitent pas d’alimentation électrique externe, celle-ci passe par la prise USB. Pour un usage nomade, c’est l’idéal, mais attention, ça pompe sérieusement la batterie du portable 😉
  • Les disques  3″5 : plus gros, ce sont ceux-là qui sont montés dans les PC “de bureau”. Ils offrent aussi généralement une plus grande capacité, et surtout une plus grande rapidité (qui s’exprime en tours par minutes, ou RPM). Et surtout, ils sont nettement moins chers. Pour une solution de sauvegarde non nomade, c’est l’idéal. Un disque de 1 Tera, avec un boîtier externe, et hop. Ca coûte moins cher qu’un disque externe de 2″5 déjà monté, il suffit d’avoir un tournevis. Ceci dit, on en trouve maintenant déjà montés.

Personnellement, j’ai les deux. Un disque USB 2″5 de 500Go, que je trimbale partout, et un disque de 3″5 de 1To, monté dans un boîtier, qui me sert à la fois de stockage (vidéos, audio, photos…) et de disque de sauvegarde. Ce dernier est branché en USB ou SATA2. Il ne lui manque que le réseau, c’est la prochaine étape :)

Un conseil important : pour un disque de 3″5 utilisé en externe, ne lésinez pas sur le prix du boîtier. J’en ai fait l’expérience, et après plusieurs essais, j’ai finalement acheté un boîtier de marque (Antec), très solide, très bien fini, et dont les connexions “tiennent”. C’est-à-dire que le disque ne se débranche pas dès qu’on le bouge d’un millimètre, et qu’il n’y a aucun faux contact qui pourrait l’âbimer ou corrompre les données. Tant que j’y suis, prenez un boîtier avec ventilateur.

Idem pour le disque lui-même… toujours, TOUJOURS, choisir une grande marque, et lire les avis de consommateurs, prendre un modèle reconnu. Même s’il coûte 10€ de plus.

Les critères de choix :

  • La taille du disque (2″5 ou 3″5), à choisir selon l’usage (nomade ou pas)
  • La capacité : dans une optique de sauvegarde et vu les prix actuels, 500Go est un minimum.
  • La vitesse : exprimée en RPM (classiquement, 5000, 7200 ou 10000). Plus le chiffre est élevé, plus le disque est rapide. En général, les gros disques (en taille, pas en capacité) sont plus rapides que les petits (logique). Ca n’a l’air de rien comme ça, mais la différence entre un 5000RPM et un 1000RPM, c’est un monde, quand on copie beaucoup de fichiers, ou des gros.
  • Le bruit : lire les avis consos. A l’usage, un disque “qui gratte” devient vite insupportable 😉
  • La température : comme ci-dessus, lire les avis. Un disque chauffe, mais point trop n’en faut. Bien faire attention à la solution de ventilation utilisée par le “contenant” (boîtier, tour du PC, ordinateur portable). Tant qu’on y est, choisir cette solution SILENCIEUSE !
  • La marque : oui, c’est important, même si ce n’est pas une garantie absolue.

Leur inconvénient principal étant leur fragilité. L’usure se détecte relativement facilement (quand un disque silencieux commence à sérieusement gratter, il est temps d’en changer).  Leurs avantages sont nombreux (coût, capacité, facilité d’en changer, permettant de mettre en place des solutions assez complexes de haute disponibilité facilement (RAID, …)). Ils restent la meilleure solution actuelle pour une sauvegarde chez les particuliers.

3. Les clés USB

La technologie est différente de celle du disque dur. Pour simplifier, dans un disque dur, les données sont écrites sur un support physique, et dans une clé USB elles sont écrites dans une “mémoire”.

Les clés USB sont toutes petites, super pratiques à transporter (et à perdre ;)), et en théorie relativement rapides (en fait c’est surtout bridé par la norme USB).  Elles sont aussi moins fragiles et moins susceptibles à la corruption de données, que les disques durs (une clé USB qui tombe, c’est généralement pas grave), et très peu chères. L’inconvénient, c’est leur capacité encore trop faible (de 2/3 Go à 16Go pour les plus courantes).

De nouveaux disques durs, dits SSD, utilisent la même technologie. Mais leur capacité et leur prix en font de mauvaises solutions de sauvegarde.

Personnellement, je m’en sers pour le transfert/transport/partage de données, pas la sauvegarde en tant que telle.

4. Sauvegarde “en ligne”

Les fournisseurs d’accès et les hébergeurs fournissant de plus en plus d’espace disque disponible, il est tentant de sauvegarder ses données, du moins une partie, sur leurs serveurs. Et c’est aussi une trèèèès bonne idée !

Les hébergeurs payants, offrent une solution peu chère (si si), de grande capacité en général, et surtout très sûre, car ils mettent en place des systèmes de haute-disponibilité de type professionnels. Vos sites sont généralement hébergés sur des baies de disques mirrorées, ou au pire en RAID, avec systèmes d’alertes de défaillance, et surtout, ils sont eux-mêmes backupés.

Par exemple, mon nom de domaine est hébergé chez OVH, sur un serveur mutualisé. Mon espace est sauvegardé régulièrement sans que je ne fasse rien, ainsi que mes diverses bases de données (ce qui ne m’empêche pas d’avoir moi-même planifié des sauvegardes du blog toutes les semaines, qui me sont automatiquement envoyées par mail, comme Jordi).

Outre ces avantages considérables, on peut en ajouter d’autres :

  • Une disponibilité de vos données depuis n’importe quelle connexion internet dans le monde. Qui a dit nomade ?
  • Vos données sont sauvegardées de façon distante, externalisée. En clair, si la maison brûle, vous en aurez toujours une copie. C’est une des règles de base à respecter : ne pas mettre ses oeufs dans le même panier, ça veut dire plusieurs supports, et ces supports dans des lieux différents, si possible éloignés en kilomètres.

5. Les cassettes spécialisées et autres supports magnétiques

Bon, là, on tombe dans la solution “pro”, je ne m’y étendrai pas trop.

  • Avantages : prévues pour ça, elles permettent des capacités assez importantes car généralements couplées à la compression des données. Faciles à externaliser.
  • Inconvénients : coûtent cher, nécessitent une solution spécifique (matérielle et logicielle) à la fois pour effectuer la sauvegarde, et pour la restorer ensuite. Les données ne sont en général pas lisibles directement.

Il existe d’autres supports, mais ils ne nous concernent pas trop. Prochain article : les solutions matérielles et logicielles possibles, et puis après, un exemple en live, avec ce que je fais, moi, et ce que vous faites, vous 😉

Sauvegardez vos données : la stratégie

Partie 1 : le problème

Maintenant qu’on a décidé de sauvegarder nos données, se pose la question de la stratégie de backup à mettre en place ((oui, je parle bizarrement, déformation professionnelle)) . Il existe plusieurs types de sauvegardes ((j’essaye de faire un effort pour parler français, mais j’avoue que j’ai un peu de mal à ne pas écrire “backup”)) , à choisir en fonction de ses besoins. Le mieux étant bien entendu de les combiner 😉

Définissez vos besoins

La sauvegarde doit évidemment, en premier lieu, permettre de récupérer des données perdues ou corrompues. Mais ce n’est pas tout. On peut aussi en profiter pour pouvoir accéder à ses données depuis un autre poste : soit le PC du salon, soit un portable, soit carrément le PC de la tante Marcelle, ou celui du boulot ((ahem. Non, non, rien.)).

Ensuite, quelle est la criticité de vos données ? Pensez par exemple au temps qu’il serait nécessaire pour repartir de zéro quand c’est possible (un fichier généalogique, les comptes de la famille), ou aux conséquences d’une perte sèche quand ça ne l’est pas (photos de vacances jamais imprimées).

Une stratégie de sauvegarde doit répondre aux questions suivantes :

  • Que doit permettre la sauvegarde (récupération de données, mobilité des données, partage…) ?
  • A quelle fréquence faire mes sauvegardes ?

Les différents types de sauvegarde

Une fois ses besoins définis, en fonction de ses propres habitudes et de la criticité des données, on peut choisir un type de backup sauvegarde à mettre en place. Il en existe plusieurs, qui répondent à différents besoins, chacun ayant ses avantages et ses inconvénients.

  • Sauvegarde complète (full backup ((aaaah)) ) : c’est une copie exacte de l’intégralité des fichiers, prise à un instant T.
  • Sauvegarde incrémentale : basée sur une première sauvegarde complète, on ne copie alors que les fichiers ayant été modifiés (ou créés, ou supprimés), depuis cette dernière. L’avantage est sa rapidité, le gain d’espace disque nécessaire. L’inconvénient est que pour récupérer les données, il faudra disposer de la sauvegarde complète, plus toutes les sauvegardes incrémentales intermédiaires. Ce qui peut rendre l’opération de récupération longue et périlleuse.
  • Sauvegarde différentielle : Comme l’incrémentale, mais la comparaison ne se fait plus au niveau des opérations sur les fichiers, mais dans leur *contenu*. Bon, là, celle-là, on va l’oublier.

Enfin, la synchronisation : elle permet d’avoir toujours deux images strictement identiques d’un même fichier/dossier. C’est celle qui permettra la mobilité des données, en synchronisant par exemple sur un disque externe ou une clé USB.

Fréquence des sauvegardes

Là, ça dépendra de votre utilisation des données. Mais en général, on conseille de faire une sauvegarde complète à intervalles réguliers mais assez espacés (hebdomadaire, mensuelle), plus une autre (incrémentale, ou juste de certains fichiers critiques) plus régulièrement (tous les jours par exemple).

Exemple

* Le premier de chaque mois, on fait une image complète de tout le disque dur (sans la partie OS)

* Chaque dimanche, on sauvegarde les fichiers les plus critiques, ou ceux qui sont modifiés souvent

* Chaque jour, on sauvegarde les fichiers critiquissimes, ou ceux qu’on sait avoir modifiés dans la journée, et pour lesquels on serait bien embêtés de devoir récupérer la version du dimanche précédent.

Partie 3 : les supports (ça vient, ça vient)

Sauvegardez vos données : le problème

Le sujet de la sauvegarde de nos données généalogiques a été rapidement évoqué dans les différents posts “Quel Généalogiste Suis-Je“. Un récent tweet de Maiwenn m’a enfin décidée à écrire une petite série d’articles pour y voir plus clair.

Certains d’entre vous le savent, je travaille dans l’informatique, et gère des serveurs de production. La problématique du backup y est donc quelque chose de super critique. Mais combien d’entre nous pensent à ça dans le cadre de leur informatique personnelle ?

Pourquoi a t-on besoin de sauvegardes ? Quelle stratégie adopter, et comment s’y prendre ? Quels outils utiliser ? Quels supports ?

Le besoin

Pourquoi faire des sauvegardes ? La sagesse populaire dit qu’il ne faut jamais mettre tous ses oeufs dans le même panier. Eh bien ça vaut aussi pour vos données informatiques. Il existe de nombreux risques de pertes de données, bien plus nombreux quand on travaille sur support électronique que sur papier. Imaginez que vous perdiez toute votre généalogie ? Des années de travail, et *pouf* ! Tout est perdu en quelques minutes.

Je sais ce que vous allez me dire “bof, franchement, je vois pas comment ça peut arriver !” et “moi j’ai jamais rien perdu, mon PC marche super bien !”.

1. Les pannes matérielles et logicielles


Vos fichiers sont stockés avec amour sur votre disque dur. Malheureusement, un disque dur n’a pas une durée de vie illimitée. Rien qu’avec l’usure normale, elle ne dépasse pas quelques années.

Il arrive très souvent qu’un disque dur tombe en panne, même neuf.

Encore plus courante, la corruption de données. Qu’elle soit due à un problème matériel sur le disque, ou à un problème logiciel lors de l’écriture, elle rend un fichier parfaitement inutilisable. Nous avons tous eu droit, un jour ou l’autre, à un message du genre “fichier illisible”.

Si ça arrive sur une photo d’acte, c’est pas très grave. Si c’est sur votre fichier généalogique, là, c’est nettement plus embêtant. Combien de temps vous faudra t-il pour le refaire ? Pour retraiter vos 1513 actes BMS et recréer l’arbre ?

2. Les accidents de la vie

Ouille.

Un incendie peut toujours arriver, même à la maison (sinon, pourquoi payer l’assurance ?). Bon, ok, ce n’est pas le plus courant. Autre exemple : on trébuche, et paf, le portable est par terre, explosé sur le carrelage. N’ayez pas de doute, dans ces cas-là c’est toujours le carrelage qui gagne. Avec un peu de bol, le disque dur sera récupérable, mais c’est loin d’être sûr.

Ah oui, et le café sur le clavier du portable. Le petit dernier qui s’amuse à démonter l’ordinateur et son disque dur, pour voir comment ça marche (et puis un disque dur démonté, c’est rigolo, ça tourne comme un mange-disque !).

Et le dernier, le truc que tout le monde sait, mais dont personne ne pense à se protéger : l’orage. Un bon petit coup de foudre qui passe dans la prise électrique, et vient griller tout ce qui se trouve au bout. La télé, le modem, le PC, le téléphone, la cafetière (relisez la clause “dommages électriques” de votre contrat d’assurance). Plus courant, plus insidieux, la surtension qui grille aussi le PC, et la bête coupure électrique qui intervient pile au moment où votre fichier généalogique est en train d’être écrit sur le disque.


3. Les vols

Aujourd’hui, les ordinateurs portables sont presque plus nombreux que les PC de bureau, surtout chez les généalogistes qui se déplacent aux AD. Ils sont aussi très faciles à voler.


4. Les fausses manips

De loin le problème le plus courant. On clique sur le mauvais bouton, et on supprime un fichier. Ou encore, et là je peux vous dire que ça sent le vécu très frais, on fait n’importe quoi et on se retrouve avec un fichier qui contient des données erronnées, ou encore on a supprimé la mauvaise personne et toute sa famille, et on ne se rappelle plus trop bien à quel moment on a commencé à faire des bêtises (note personnelle : la généalogie à trois heures du matin, c’est pas toujours une bonne idée).


Je pourrais continuer comme ça pendant des heures, mais je vais m’arrêter là pour cette première partie. Maintenant que vous avez tous compris qu’il est indispensable de sauvegarder vos données, même si c’est super chiant, la question est : comment s’y prendre ?

Boîte à Outils : quelques liens

Ce post est à but purement utilitaire, histoire de répertorier les sites que j’utilise pour mes propres recherches, parce que je suis faignante et que je me laisse dépasser par mes bookmarks. Il est forcément appelé à évoluer au fil de l’eau.

Archives Départementales

Cette liste ne présente que celles qui concernent ma généalogie perso. La liste exhaustive de toutes les AD en ligne se trouve sur Généawiki.

Archives Nationales

Autres