Description
Publications officielles numérisées
Aperçu
Ce jeu de données contient des publications officielles numérisées hébergées par les Archives fédérales suisses, couvrant la période de 1798 à 2021. Les données ont été extraites de amtsdruckschriften.bar.admin.ch par des méthodes de web scraping.
Structure du jeu de données
Le jeu de données est organisé comme suit :
- Chaque publication est contenue dans un dossier séparé dans le fichier ZIP
- Chaque dossier contient :
- Fichier PDF du document original
- Fichier CSV avec les métadonnées
- Fichier TXT contenant le texte extrait par OCR
- Le répertoire racine contient :
metadata_ads.csv: Métadonnées complètes pour tous les documents- Liste des fichiers manquants du processus d'extraction
Collections disponibles
La plateforme héberge les collections suivantes (🟢 indique inclus dans ce jeu de données) :
Assemblée fédérale (Bulletin, Procès-verbaux, Instruments de recherche)
- 🟢 Bulletin officiel de l'Assemblée fédérale (1891-1999) - 46 916 documents
- 🟢 Procès-verbaux de l'Assemblée fédérale (1921-1970) - 7 126 documents
- 🟢 Répertoire des délibérations (1848-1891) - 2 documents
- 🟢 Résumé des délibérations (1891-1995) - 842 documents
Droit fédéral
- 🟢 Feuille fédérale (1849-2008) - 58 988 documents
- 🟢 Recueil systématique (1848-1947) - 65 documents
- ❌ Recueil officiel (1948-1998)
- 🟢 Jurisprudence des autorités administratives de la Confédération (1987-2017) - 2 502 documents
Conseil fédéral
- 🟢 Procès-verbaux du Conseil fédéral (1848-1973) - 18 255 documents
- 🟢 Rapports de gestion du Conseil fédéral (1848-1995) - 443 documents
Autres collections
- 🟢 Annuaire fédéral (1849-2021) - 4 254 documents
- ❌ Compte d'État et budget (1848-2006)
- ❌ Documents Diplomatiques Suisses (1848-1946)
- ❌ Études et Sources (1975-2005)
- ❌ Collection d'actes de l'époque de la République helvétique (1798-1803)
Identification des documents
Chaque document est identifié par un ID à huit chiffres (pdfnum/ais_id) qui combine :
- Identifiant du type de publication (premiers chiffres)
- Numéro séquentiel au sein du type de publication
Détails techniques
- Format : Archive ZIP contenant des dossiers avec fichiers PDF, CSV et TXT
- OCR : Tous les documents texte ont été traités par technologie OCR
- Métadonnées : Structurées au format CSV
- Période : 1798-2021 (varie selon la collection)
- Langues : Allemand, Français, Italien (documents originaux dans leurs langues respectives)
Notes d'utilisation
- Le jeu de données est destiné à la recherche et à des fins de référence
- Certains documents peuvent manquer de la collection originale
- La qualité OCR peut varier selon l'état du document original
- Les métadonnées incluent des informations contextuelles supplémentaires pour chaque document
Informations complémentaires
- Identifier
- ads-zip
- Date de publication
- 25 février 2025
- Date de modification
- -
- Langues
- Indépendant de la langue
- URL d'accès
- https://sfa-laboratory.ch/data/ads/ADS.zip
- URL de téléchargement
- https://sfa-laboratory.ch/data/ads/ADS.zip
- Taille du fichier
- 90.6 GB
- Format
- ZIP
- Documentation
-