De FileMaker à la science ouverte
structurer et diffuser des données archéologiques
Introduction : pourquoi diffuser ses données ?
Dans la recherche scientifique, une gestion rigoureuse des données est essentielle afin d’en garantir la pérennité, la transparence et la réutilisabilité. Au-delà de leur organisation, la diffusion des données constitue aujourd’hui un enjeu central de la science ouverte. Elle permet d’accroître la visibilité des travaux, de favoriser leur citabilité grâce à l’attribution d’identifiants pérennes (DOI) et de faciliter la réutilisation des données par d’autres chercheurs.
En rendant les jeux de données accessibles, la diffusion permet à d’autres chercheurs de vérifier les résultats, de reproduire les analyses et de réutiliser les données dans de nouveaux travaux. Le cas de ma base de données de recherche initialement compilée sous FileMaker Pro illustre cette démarche ainsi que la facilité que donnent les outils open source pour la diffusion puisque, convertie en SQLite, elle a ensuite été diffusée sur des plateformes de science ouverte, où elle est désormais accessible et réutilisable par la communauté scientifique.
Étape 1 : nettoyer et structurer
La base de données initialement développée sous FileMaker Pro est une base relationnelle composée de trois tables, conçue pour l’enregistrement d’objets archéologiques en bronze, associés à des sites et, pour certains, à des groupements d’objets. Elle comprend 17 222 objets en bronze et n’a été que partiellement publiée en 2012, sous la forme d’un extrait de catalogue accompagnant un travail de thèse, dont elle constituait le principal support d’analyse (Fischer, 2012).
Dans un premier temps, les trois tables (Bronzes, Sites et Groupes) ont été exportées séparément au format Excel. Les données ont ensuite fait l’objet d’un nettoyage approfondi : correction des erreurs, harmonisation des formats, suppression des champs inutiles et structuration des colonnes.
Des clés primaires numériques explicites (primary key ou PK) ont été introduites (id_bronze, id_site et id_groupe) afin d’identifier chaque enregistrement de manière unique. Ces identifiants sont utilisés comme clés étrangères (foreign key ou FK) lorsqu’ils apparaissent dans d’autres tables (par exemple, id_site et id_groupe dans la table Bronzes), permettant ainsi de relier les tables entre elles, tout en évitant la redondance des informations.
Les tables ont ensuite été exportées au format CSV, utilisé comme format intermédiaire pour l’importation dans un système de gestion de base de données.
Étape 2 : construire la base
Les trois tables au format CSV ont été importées dans une base SQLite, à l’aide du logiciel open source DB Browser for SQLite.
Cette étape correspond à la formalisation de la structure relationnelle : les clés primaires ont été déclarées explicitement et les relations entre les tables ont été établies par l’assignation des clés étrangères. Des vérifications ont également été effectuées afin de contrôler l’intégrité des données et la cohérence des relations.
Étape 3 : documenter le jeu de données
La diffusion des données nécessite une documentation précise afin d’en garantir la compréhension et la réutilisation. Un fichier README a ainsi été rédigé pour présenter l’origine des données, la structure de la base, les relations entre les tables et les conditions d’utilisation.
La base de données est diffusée sous licence CC BY-ND 4.0, qui autorise la consultation, la réutilisation et la citation tout en préservant l’intégrité du corpus scientifique (pas de modifications autorisées).
Les données sont proposées sous plusieurs formats : trois tables CVS (Bronzes-Tableau 1.csv, Groupes-Tableau 1.csv et Sites-Tableau 1.csv) et une base SQLite (base_palafittes.db).
Étape 4 : diffuser et valoriser
Le jeu de données (trois tables CSV, une base SQLite et un fichier README) a été déposé sur Zenodo afin d’assurer un archivage pérenne, une citabilité formelle, grâce à l’attribution d’un DOI, et une diffusion dans l’écosystème de la science ouverte.
Il a ensuite été référencé sur HAL Science et Academia via un document PDF renvoyant vers le dépôt Zenodo. Ce dispositif permet à la communauté scientifique d’identifier, d’accéder, de citer et de réutiliser les données.
Conclusion
Cet exemple concret illustre la façon dont la structuration, la documentation et l’utilisation de formats ouverts permettent de transformer une base de données personnelle en un jeu de données diffusable, pérenne et réutilisable par la communauté scientifique. Inscrite dans une démarche de science ouverte, cette approche favorise la visibilité, la citabilité et la valorisation des données de recherche, qui sont des aspects incontournables de la recherche actuelle et future (en accord avec les recommandations du Ministère de la recherche et de l’Unesco).
Sources et notes
- Viktoria Fischer Les bronzes en contexte palafittique sur les rives du Léman et des Trois-Lacs (Suisse occidentale), Cahiers d’archéologie romande 128, 2012, p. 141-147.
- Viktoria Fischer Christoforides, Dataset: Late Bronze Age metalwork from the pile-dwelling settlements of Western Switzerland (v1.0), 2026, [Data set] Zenodo: https://doi.org/10.5281/zenodo.18432073
[Fischer, 2012] : Viktoria Fischer Les bronzes en contexte palafittique sur les rives du Léman et des Trois-Lacs (Suisse occidentale), Cahiers d’archéologie romande 128, 2012, p. 141-147.











