Process

From d'Aïeux et d'Ailleurs
Jump to navigation Jump to search

Après le vertige de la base blanche, voici un aperçu des étapes suivies.

Au début...

Le but premier de cette base est de migrer ma photothèque généalogie (voir article sur ce projet initié en 2015, avec modèle de description proposé sur Google Forms / Framaforms).

Cette photothèque créée avec Fabrik (composant Joomla), quoi que très souple d'utilisation et d'administration, ne me satisfait que moyennement (la recherche avancée est peu opérante). Fabrik ne sera pas utilisable sous Joomla 4.0... et depuis plusieurs années je suis devenue addict à Wikidata. Restait la solution d'une wikibase personnelle. L'installation d'une instance perso me semblait trop complexe techniquement et chronophage (j'ai tenté Docker en vain)... jusqu'à ce qu'arrive [httpː//wikibase.cloud wikibase.cloud].

Par quoi commencer dans une wikibase vide ?

Après quelques tâtonnements (et quelques erreurs sur le choix du type de propriété ː la plupart des propriétés sont de type élément), j'ai créé les propriétés de base, avec en tête un maximum d'alignement sur Wikidata afin d'avoir un pivot permettant de lier les concepts, récupérer des données(coordonnées géographiques, article Wikipédia, etc.)

  • propriété de base ː nature de l'élément, ID Wikidata, URI Wikidata.
  • propriétés de type individu ː sexe, nom, prénom, date et lieu de naissance, etc. Modèles utilisés ː Wikidata bien sûr, DataCegeSoma et bien sûr un individu dans mon logiciel de généalogie

Une fois ceci fait, création de 2 items (un individu et une photographie, ensembles principaux attendus dans la wikibase) ː cela a permis d'ajuster et de créer des propriétés manquantes.

> ̼Item:Q26 (individu)

> Item:Q10 (photographie)

Premières requêtes

[...]


Import des termes d'indexation

Création en masse des éléments d'indexation (matière, lieu) avec OpenRefine (le contenu de photothèque existe en fichier csv) et Quickstatements

CREATE

LAST Lfr {{jsonize(cells["Lfr"].value)}}

LAST Dfr {{jsonize(cells["Dfr"].value)}}

LAST P18 Q18

LAST P56 {{jsonize(cells["image"].value)}}

LAST P17 {{jsonize(cells["id"].value)}}

LAST P55 {{jsonize(cells["url"].value)}}


Ajustements réguliers sur l'organisation et la hiérarchie des propriétés et des termes d'indexation (but ː pouvoir utiliser "sous-classe" / "partie de" pour plein de types de requêtes)

Echec sur l'import des coordonnées géographiques > à la main


[...]


To do list

  • Création en masse des activités (liste consolidée phototheque.csv / logiciel de généalogie > Openrefine > alignement Wikidata > QuickStatements)
  • Création en masse des personnes (uniquement personnes nécessaires dans la photothèque dans un premier temps)
  • Création en masse des lieux > OK
  • Création en masse des items photographies (par collection)
  • Homogénéisation des lieux : vérifier à partir des requêtes SPARQL qu'il y a imageCommons, localisation administrative (rattachement commune / département / pays)

A creuser ː

Requêtes SPARQL

Médias (pas d'affichage des médias car hébergés ailleurs). Viewer ?

Modèle Entité

Manifest OpenRefine pour pouvoir alimenter en masse, sans forcément passer par QuickStatements (doc OpenRefine et doc Github OpenRefine