đĄ Une nouvelle documentation est disponible !
Découvrez la nouvelle version beta des guides et de la documentation de data.gouv.fr
Publier un jeu de données
La publication dâun jeu de donnĂ©es sur data.gouv.fr nĂ©cessite la crĂ©ation dâun compte gratuit.
Pour mettre en ligne un nouveau jeu de données :
- Connectez-vous Ă votre compte ;
- Rendez-vous sur la page de crĂ©ation dâun jeu de donnĂ©es, en cliquant sur le bouton Publiez un jeu de donnĂ©es dans le bandeau Participez en bas de page.
à partir de là , la publication se déroule en 4 étapes.
1. Définir qui publie les données
Sur data.gouv.fr, vous pouvez mettre en ligne des jeux de données :
- sous votre propre nom, Ă titre individuel ;
- pour le compte dâune organisation, Ă titre collectif.
LâĂ©tape 1 de la publication dâun jeu de donnĂ©es vous permet de choisir si les donnĂ©es doivent ĂȘtre publiĂ©es Ă votre nom ou sous la banniĂšre de votre organisation. Si vous ĂȘtes membre dâune organisation, nous vous conseillons de publier vos jeux de donnĂ©es en son nom, lorsque cela vous semble pertinent, dans le but dâĂ©viter lâĂ©parpillement de vos publications.
2. Décrire votre jeu de données
LâĂ©tape 2 de la publication dâun jeu de donnĂ©es vous permet de dĂ©crire les donnĂ©es que vous publiez. Cette Ă©tape est cruciale pour que vos donnĂ©es soient bien rĂ©fĂ©rencĂ©es et facile Ă rĂ©utiliser.
Titre
La plupart des utilisateurs de data.gouv.fr trouvent des jeux de donnĂ©es grĂące Ă un moteur de recherche. Afin que vos donnĂ©es soient faciles Ă trouver, employez le mĂȘme vocabulaire que le public pour les dĂ©crire. Cela commence par un titre spĂ©cifique et prĂ©cis, car le titre est lâĂ©lĂ©ment qui a le plus dâimportance aux yeux des moteurs de recherche.
- Mauvais titre : Horaires des cars
- Bon titre : Horaires des autobus de la ville de Brive pour la pĂ©riode 2018 â 2019
La prĂ©sence dâun titre est obligatoire.
Sigle
Vous pouvez associer un sigle Ă votre jeu de donnĂ©es. Par exemple, Ă la base des entreprises et de leurs Ă©tablissements, produite par lâINSEE, est associĂ© le sigle SIRENE. Les lettres qui composent votre sigle nâont pas besoin dâĂȘtre sĂ©parĂ©es par des points.
- Mauvais sigle : I.R.V.E.
- Bon sigle : IRVE
La prĂ©sence dâun sigle est facultative.
Description
Chaque jeu de donnĂ©es publiĂ© sur data.gouv.fr doit ĂȘtre accompagnĂ© dâune description. Cette derniĂšre permet aux personnes qui consultent votre jeu de donnĂ©es de comprendre, en quelques lignes, ce quâil est possible de faire avec vos donnĂ©es, pourquoi elles sont utiles, et comment les manipuler. La description est importante, car câest gĂ©nĂ©ralement la premiĂšre chose que les gens lisent quand ils dĂ©couvrent vos donnĂ©es.
Les descriptions répondent généralement aux questions suivantes :
- Que contient le jeu de données ? Combien y a-t-il de fichiers ?
- Comment les données sont-elles structurées ? à quoi correspondent les colonnes des fichiers CSV ou les tables de la base ?
- Ă quoi sert le jeu de donnĂ©es ? Quelle est sa raison dâĂȘtre ?
- Qui est Ă lâorigine du jeu de donnĂ©es ? Qui le tient Ă jour ?
- Comment lire le jeu de données ? Comment ouvrir les fichiers ?
- Comment contacter le producteur des donnĂ©es ? Ă qui sâadresser en cas de problĂšme ?
Répondre à ces questions dans votre description permet aux utilisateurs de récupérer et manipuler vos données facilement.
La syntaxe Markdown est prise en charge dans le champ de saisie de la description. Elle vous permet de mettre en forme le texte de votre description, pour y ajouter des titres, des sous-titres, des listes Ă puces, du gras, ou encore des liens vers dâautres pages web.
La prĂ©sence dâune description est obligatoire.
Licence
Nous vous conseillons de choisir une licence sous laquelle publier vos donnĂ©es, mais rien ne vous y oblige. Si vos donnĂ©es sont ouvertes, nous vous recommandons la licence ouverte ; si elle contiennent une obligation de rĂ©ciprocitĂ©, la licence oDbL convient bien. En choisissant une licence, vous permettez au public de savoir sâil peut adapter et rĂ©utiliser vos donnĂ©es et sous quelles conditions. Si vous ne choisissez pas de licence, vos donnĂ©es sont alors soumises au cadre lĂ©gal dĂ©finit dans le Code des relations entre le public et lâadministration.
La prĂ©sence dâune licence est facultative.
Voir comment bien choisir une licence
Fréquence de mise à jour
Vous devez dĂ©finir une frĂ©quence thĂ©orique de mise Ă jour pour votre jeu de donnĂ©es. Il sâagit de la frĂ©quence Ă laquelle vous prĂ©voyez de vous reconnecter sur data.gouv.fr pour mettre Ă vos donnĂ©es. Cette frĂ©quence est indicative.
La fréquence de mise à jour est obligatoire. La date de derniÚre mise à jour des données est facultative.
Mots clefs
Vous pouvez ajouter des mots clefs Ă votre jeu de donnĂ©es. Les mots clefs peuvent indiquer votre secteur dâactivitĂ© (par exemple agriculture
), votre type de structure (par exemple ministĂšre
), ou encore votre sujet (par exemple élevage
). Les mots clefs apparaissent sur la page de prĂ©sentation de votre jeu de donnĂ©es. Vous pouvez cliquer sur un mots clef pour voir la liste des autres jeux de donnĂ©es auquel le mot clef en question a Ă©tĂ© assignĂ©. Dit autrement, câest un moyen de dĂ©couvrir de nouveaux jeux de donnĂ©es.
Les mots clefs sont facultatifs.
Couverture temporelle
Vous avez la possibilitĂ© de prĂ©ciser la pĂ©riode couverte par vos donnĂ©es, câest-Ă -dire les dates quâelles concernent. Par exemple, si vous publiez un calendrier, utilisez ce champ pour prĂ©ciser les annĂ©es couvertes par votre calendrier.
La couverture temporelle est facultative.
Couverture spatiale
La couverture spatiale de vos donnĂ©es correspond aux zones gĂ©ographiques quâelles couvrent et pour lesquelles elles sont pertinentes. Si vos donnĂ©es concernent une ville ou un pays en particulier, câest ici que vous prĂ©cisez le nom de la ville ou celui du pays en question. Si vos donnĂ©es concernent plusieurs zones gĂ©ographiques, vous pouvez les ajouter les unes Ă la suite des autres, comme sâil sâagissait de mots clefs.
La couverture spatiale est facultative.
Granularité spatiale
La granularitĂ© spatiale complĂšte la couverture spatiale. Si la couverture spatiale fixe le cadre de la zone gĂ©ographique couverte par les donnĂ©es, la granularitĂ© spatiale dĂ©crit le niveau de zoom auquel il est possible de descendre Ă lâintĂ©rieur des donnĂ©es en question. Dit autrement, il sâagit du niveau de finesse de vos donnĂ©es, du plus petit dĂ©nominateur quâelles contiennent.
Par exemple, si vous avez un fichier CSV qui contient les coordonnées géographiques de tous les gymnases du territoire français, alors :
- votre couverture spatiale correspond Ă la France, car vos donnĂ©es couvrent lâensemble du territoire ;
- votre granularitĂ© spatiale se situe au niveau du point dâintĂ©rĂȘt (le gymnase Ă©tant ici considĂ©rĂ© comme un point dâintĂ©rĂȘt).
La granularité spatiale est facultative.
Privé
Si vous souhaitez crĂ©er un jeu de donnĂ©es, mais que vous ne souhaitez pas le mettre en ligne tout de suite, vous pouvez cocher la case PrivĂ©. Quand votre jeu de donnĂ©es est prĂȘt pour le grand soir, dĂ©cochez la case.
Une fois lâĂ©tape 2 complĂ©tĂ©e, cliquez sur le bouton Suivant, prĂ©sent en bas Ă droite de la page, pour passer Ă la derniĂšre Ă©tape de la publication : celle de lâimportation de vos fichiers.
3. Importer vos fichiers
Une fois votre jeu de donnĂ©es dĂ©crit, vient le temps dâimporter les fichiers ou ressources qui le composent. Pour importer votre premier fichier, cliquez sur le bouton Choisissez un fichier de votre ordinateur. Une fois votre fichier importĂ©, vous pouvez le dĂ©crire en complĂ©tant le formulaire qui apparaĂźt alors sur votre Ă©cran. Si votre jeu de donnĂ©es contient plusieurs fichiers, remplissez un formulaire par fichier.
Titre
Le titre de votre fichier doit ĂȘtre descriptif. Par dĂ©faut, nous reprenons le titre quâavait votre fichier au moment de lâimportation, mais rien ne vous empĂȘche de le modifier Ă cette Ă©tape si vous souhaitez le prĂ©ciser.
Si vous référencez un fichier hébergé ailleurs que sur data.gouv.fr, ce champ correspond au nom donné à votre fichier lors de sa mise en ligne.
Le titre est obligatoire.
Type
Pour chaque fichier importé sur data.gouv.fr, vous devez choisir une catégorie dans laquelle le ranger, parmi :
- fichier principal : désigne tous les fichiers qui contiennent vos données brutes ;
- documentation : désigne les fichiers annexes, qui contiennent généralement des explications au sujet de vos fichiers principaux ;
- mise Ă jour : permet dâindiquer que le fichier importĂ© met Ă jour un fichier principal prĂ©cĂ©dement mis en ligne ;
- API : dĂ©signe lâAPI qui permet dâaccĂ©der Ă vos donnĂ©es et vers laquelle vous ajoutez un lien dans le champ URL qui se trouve plus bas ;
- dépÎt de code : désigne le dépÎt de code (repository en anglais) qui contient vos données et vers lequel vous ajoutez un lien dans le champ URL qui se trouve plus bas ;
- autre : pour tous les autres types de fichier.
La désignation du type de fichier est obligatoire.
Description
Vous pouvez dĂ©crire votre fichier pour indiquer ce quâil contient. La description prend en compte la syntaxe Markdown.
La description est facultative, mais conseillée.
Date de publication
Par dĂ©faut, il sâagit de la date Ă laquelle vous importez votre fichier sur data.gouv.fr, mais vous ĂȘtes libre de la changer.
Si vous rĂ©fĂ©rencez un fichier hĂ©bergĂ© ailleurs que sur data.gouv.fr, il sâagit de la date Ă laquelle votre fichier a Ă©tĂ© mis en ligne.
La date de publication est facultative.
Schéma
Les schémas de données permettent de décrire des modÚles de données : quels sont les différents champs, comment sont représentées les données, quelles sont les valeurs possibles etc. Pour en savoir plus sur les schémas, consultez schema.data.gouv.fr.
Il sâagit pour ce champ de lâidentifiant du schĂ©ma auquel la ressource adhĂšre, le cas Ă©chĂ©ant.
Deux cas possibles :
- si vous importez un fichier, une validation sera effectuĂ©e sur la ressource pour sâassurer quâelle correspond bien au fichier indiquĂ©.
- si vous rĂ©fĂ©rencez un fichier hĂ©bergĂ© ailleurs, sur un autre site, aucune validation de correspondance au schĂ©ma nâest effectuĂ©e.
Le schéma est facultatif.
URL
Deux cas possibles :
- si vous importez un fichier, vous ne pouvez pas modifier ce champ, car il sâagit alors de lâURL assignĂ©e par data.gouv.fr Ă votre ressource ;
- si vous rĂ©fĂ©rencez un fichier hĂ©bergĂ© ailleurs, sur un autre site, ajoutez ici lâURL canonique (qui ne varie pas) permettant dâaccĂ©der directement au fichier en question.
LâURL est obligatoire.
Taille
LĂ encore, deux cas Ă distinguer :
- si vous importez votre fichier, vous nâavez rien Ă faire, car nous calculons la taille de votre ressource pour vous ;
- si vous référencez un fichier hébergé ailleurs, indiquez ici sa taille (en octets).
La taille est facultative.
Format
Le format du fichier que vous ajoutez. Deux possibilités :
- si vous importez votre fichier, nous dĂ©tectons automatiquement son format, vous nâavez donc rien Ă faire ;
- si vous référencez un fichier externe, précisez ici son format.
Le format est obligatoire.
Type MIME
Le type MIME est un identifiant de format de données à la syntaxe assez stricte.
LĂ encore :
- si vous importez votre fichier, votre type MIME est prĂ©-rempli, vous nâavez donc rien Ă faire ;
- si vous rĂ©fĂ©rencez un fichier externe, sĂ©lectionnez le type MIME qui sây rapporte parmi la liste des types MIME.
Le type MIME est facultatif.
Somme de contrĂŽle
La somme de contrĂŽle permet de calculer lâempreinte dâun fichier, pour sâassurer que ce dernier ne varie pas au grĂ© des copies, transferts, ou restaurations.
Deux cas doivent ici ĂȘtre distinguĂ©s :
- si vous importez votre fichier, vous nâavez rien Ă faire, car la somme de contrĂŽle est créée par data.gouv.fr ;
- si vous rĂ©fĂ©rencez un fichier externe, vous pouvez indiquer ici votre propre somme de contrĂŽle. Le menu dĂ©roulant permet de sĂ©lectionner lâalgorithme utilisĂ© pour crĂ©er la somme de contrĂŽle, parmi :
sha1
,sha2
,sha256
,md5
,crc
(nous vous conseillons dâutilisersha256
si vous en avez la possibilité).
La somme de contrĂŽle est facultative.
Une fois votre fichier dĂ©crit, cliquez sur le bouton Suivant qui se trouve en bas Ă droite de la page pour lâimporter et publier votre jeu de donnĂ©es.
4. Voir et compléter un jeu de données existant
Une fois votre premiÚre ressource publiée, votre jeu de données devient accessible en ligne, vous pouvez alors :
- voir votre jeu de données sur data.gouv.fr en cliquant sur le bouton Voir sur le site ;
- ajouter dâautres ressources Ă votre jeu de donnĂ©es en cliquant sur le bouton Voir dans lâadministration ;
- partager votre jeu de donnĂ©es sur les rĂ©seaux sociaux en cliquant sur lâicĂŽne associĂ©e au rĂ©seau social qui vous concerne.
Ajouter dâautres ressources Ă un jeu de donnĂ©es existant
Pour ajouter des ressources supplémentaires à un jeu de données déjà en ligne, cliquez sur le nom du jeu de données que vous souhaitez enrichir quand vous vous situez sur la page Moi.
Une fois sur la page du jeu de données à modifier :
- Naviguez jusquâau bloc intitulĂ© Ressources ;
- Cliquez sur le bouton Ajouter ;
- Cliquez sur le bouton Choisissez un fichier de votre ordinateur ;
- ComplĂ©tez les informations associĂ©es Ă votre ressources, comme vous lâavez fait Ă lâĂ©tape 3 de la crĂ©ation de votre jeu de donnĂ©es ;
- Cliquez sur le bouton Enregistrer.
Refaites la procédure ci-dessus autant de fois que vous souhaitez ajouter de ressources à votre jeu de données.