Diffuser des données archéologiques

Par Viktoria Christoforides | 30 Avril 2026 | Formation à la recherche archéologique
Comment transformer une base conçue pour un usage individuel en un corpus structuré, réutilisable et diffusable en ligne ? Cet article issu de mes travaux sur les objets en bronze des palafittes suisses présente les étapes de migration vers SQLite et les bonnes pratiques de diffusion via Zenodo, HAL et Academia.

De FileMaker à la science ouverte
structurer et diffuser des données archéologiques

Introduction : pourquoi diffuser ses données ?

Dans la recherche scientifique, une gestion rigoureuse des données est essentielle afin d’en garantir la pérennité, la transparence et la réutilisabilité. Au-delà de leur organisation, la diffusion des données constitue aujourd’hui un enjeu central de la science ouverte. Elle permet d’accroître la visibilité des travaux, de favoriser leur citabilité grâce à l’attribution d’identifiants pérennes (DOI) et de faciliter la réutilisation des données par d’autres chercheurs.

En rendant les jeux de données accessibles, la diffusion permet à d’autres chercheurs de vérifier les résultats, de reproduire les analyses et de réutiliser les données dans de nouveaux travaux. Le cas de ma base de données de recherche initialement compilée sous FileMaker Pro illustre cette démarche ainsi que la facilité que donnent les outils open source pour la diffusion puisque, convertie en SQLite, elle a ensuite été diffusée sur des plateformes de science ouverte, où elle est désormais accessible et réutilisable par la communauté scientifique.

Mobilier en bronze de la station palafittique Bronze final de Grandson Corcelettes (Vaud, Suisse), conservé dans les dépôts du Musée cantonal d’archéologie et d’histoire de Lausanne : parures annulaires, haches à ailerons, faucilles, gouges à douille, pendentif et applique © Viktoria Christoforides
Mobilier en bronze de la station palafittique Bronze final de Grandson Corcelettes (Vaud, Suisse), conservé dans les dépôts du Musée cantonal d’archéologie et d’histoire de Lausanne : épingles, phalères, petits anneaux, boutons, fil torsadé et mors © Viktoria Christoforides

Étape 1 : nettoyer et structurer

La base de données initialement développée sous FileMaker Pro est une base relationnelle composée de trois tables, conçue pour l’enregistrement d’objets archéologiques en bronze, associés à des sites et, pour certains, à des groupements d’objets. Elle comprend 17 222 objets en bronze et n’a été que partiellement publiée en 2012, sous la forme d’un extrait de catalogue accompagnant un travail de thèse, dont elle constituait le principal support d’analyse (Fischer, 2012).

Dans un premier temps, les trois tables (Bronzes, Sites et Groupes) ont été exportées séparément au format Excel. Les données ont ensuite fait l’objet d’un nettoyage approfondi : correction des erreurs, harmonisation des formats, suppression des champs inutiles et structuration des colonnes.

Des clés primaires numériques explicites (primary key ou PK) ont été introduites (id_bronze, id_site et id_groupe) afin d’identifier chaque enregistrement de manière unique. Ces identifiants sont utilisés comme clés étrangères (foreign key ou FK) lorsqu’ils apparaissent dans d’autres tables (par exemple, id_site et id_groupe dans la table Bronzes), permettant ainsi de relier les tables entre elles, tout en évitant la redondance des informations.

Les tables ont ensuite été exportées au format CSV, utilisé comme format intermédiaire pour l’importation dans un système de gestion de base de données.

Étape 2 : construire la base

Les trois tables au format CSV ont été importées dans une base SQLite, à l’aide du logiciel open source DB Browser for SQLite.

Cette étape correspond à la formalisation de la structure relationnelle : les clés primaires ont été déclarées explicitement et les relations entre les tables ont été établies par l’assignation des clés étrangères. Des vérifications ont également été effectuées afin de contrôler l’intégrité des données et la cohérence des relations.

Schéma de la structure de la base relationnelle, explicitant les relations entre les tables grâce aux clés primaires (PK) et étrangères (FK) © Viktoria Christoforides
Exemple de fiche issue de FileMaker Pro, graphiques réalisés à partir de la base et visualisation de la version SQLite dans DB Browser for SQLite. Les photographies n’ont pas été reprises, leur migration nécessitant la recréation manuelle des liens avec les notices © Viktoria Christoforides

Étape 3 : documenter le jeu de données

La diffusion des données nécessite une documentation précise afin d’en garantir la compréhension et la réutilisation. Un fichier README a ainsi été rédigé pour présenter l’origine des données, la structure de la base, les relations entre les tables et les conditions d’utilisation.

La base de données est diffusée sous licence CC BY-ND 4.0, qui autorise la consultation, la réutilisation et la citation tout en préservant l’intégrité du corpus scientifique (pas de modifications autorisées).

Les données sont proposées sous plusieurs formats : trois tables CVS (Bronzes-Tableau 1.csv, Groupes-Tableau 1.csv et Sites-Tableau 1.csv) et une base SQLite (base_palafittes.db).

Étape 4 : diffuser et valoriser

Le jeu de données (trois tables CSV, une base SQLite et un fichier README) a été déposé sur Zenodo afin d’assurer un archivage pérenne, une citabilité formelle, grâce à l’attribution d’un DOI, et une diffusion dans l’écosystème de la science ouverte.

Il a ensuite été référencé sur HAL Science et Academia via un document PDF renvoyant vers le dépôt Zenodo. Ce dispositif permet à la communauté scientifique d’identifier, d’accéder, de citer et de réutiliser les données.

Séquence d’utilisation des outils, depuis la constitution du corpus d’étude, jusqu'à sa diffusion ouverte et pérenne © Viktoria Christoforides

Conclusion

Cet exemple concret illustre la façon dont la structuration, la documentation et l’utilisation de formats ouverts permettent de transformer une base de données personnelle en un jeu de données diffusable, pérenne et réutilisable par la communauté scientifique. Inscrite dans une démarche de science ouverte, cette approche favorise la visibilité, la citabilité et la valorisation des données de recherche, qui sont des aspects incontournables de la recherche actuelle et future (en accord avec les recommandations du Ministère de la recherche et de l’Unesco).

Sources et notes

[Fischer, 2012] : Viktoria Fischer Les bronzes en contexte palafittique sur les rives du Léman et des Trois-Lacs (Suisse occidentale), Cahiers d’archéologie romande 128, 2012, p. 141-147.