Thésaurus & vocabulaires contrôlés
Utilisés par notre moteur d'expansion sémantique pour étendre vos requêtes (ex : « licenciement » → « mise à pied », « licenciement abusif »...). 19 138 concepts unifiés.
Thésaurus multilingue de l'Union européenne. Couvre droit UE, économie, social, politique. Mis à jour 1-2 fois par an.
Thésaurus de l'information publique française. Politiques publiques, action gouvernementale, droit positif. Maintenu par la DILA.
Matières civiles, pénales, commerciales (Cass + cours d'appel + tribunaux judiciaires). Hiérarchie NAC officielle.
Reconstitué à partir des balises <ANALYSES> de 298 720 décisions JADE. Hiérarchie 7 niveaux et fréquences d'usage incluses. Le Conseil d'État ne publiant pas ce plan au format SKOS, il s'agit à ce jour de l'unique version structurée disponible en données ouvertes.
Tous les thésaurus ci-dessus parsés et fusionnés dans une seule base SQLite indexée par label normalisé (unidecode + uppercase). Tables : thesaurus_concepts, thesaurus_labels, thesaurus_relations. Prêt à requêter pour vos propres expansions sémantiques.
Jeux de données bruts
Les fichiers massifs d'origine officielle faisant l'objet d'un traitement quotidien. Données publiques, gratuites et librement redistribuables.
JADE (admin), CASS, CAPP, CONSTIT, KALI, LEGI, JORF, INCA, CNIL. Mises à jour quotidiennes + archives complètes Freemium.
L'intégralité des décisions admin (CE + CAA + 40 TAs), y compris celles non publiées au Recueil Lebon - donc absentes de Légifrance.
Toute la jurisprudence de la Cour européenne des droits de l'homme depuis 1959.
CJUE + Tribunal UE + conclusions des avocats généraux. Format CELEX/ECLI.
API REST officielle (inscription gratuite). Quotas serrés mais utile pour les mises à jour incrémentielles.
Code source et interfaces d'accès
Le code source et les données dérivées de JusticeLibre sont publiés sous licence libre (MIT). Disponibles pour duplication, auto-hébergement ou contribution.
Code source du serveur MCP, des analyseurs (parsers DILA), du moteur de recherche fédérée et de l'interface utilisateur. Les signalements d'anomalies (issues) et propositions de modifications (pull requests) sont bienvenus.
Connecteur direct (Model Context Protocol) pour modèles de langage (Claude, ChatGPT, Perplexity...). Accès aux 6,5 millions de décisions sans authentification préalable ni restriction de volume.
Écosystème des données ouvertes - dépôts tiers
Sélection de dépôts publics et associatifs pertinents (formats JSON, parsers XML, schémas normalisés) concernant le droit français.
Dump JSON quotidien des codes (Travail, Sécurité sociale, CRPM, CRPA) construit depuis l'API Légifrance. Format unist arborescent.
L'intégralité de KALI (conventions collectives + accords de branche) en JSON arborescent prêt à l'emploi.
Code source de l'API officielle Judilibre. Référence pour les mappings Elasticsearch et les schémas de champs des décisions Cass.
Pipeline de normalisation des décisions de justice + schéma officiel de la base DBSDER. Règles de nettoyage/parsing officielles.
Collecte des décisions des tribunaux de commerce (extension Judilibre). Encore peu indexées chez nous - à intégrer.
Référence absolue pour parser les dumps DILA bruts. Documentation complète des DTD/RNG officielles.
L'histoire complète de la loi française versionnée en Git. Vue diachronique des codes article par article.
Pipeline ETL prêt à l'emploi pour importer les dumps DILA (LEGI/JORF) dans PostgreSQL.
Fiches "Vos droits et démarches" service-public.fr + fiches travail-emploi.gouv.fr en JSON. Vulgarisation officielle.
Données non diffusées par les autorités publiques
Ressources techniques dont la publication par les autorités compétentes fait actuellement défaut. Certaines existent en interne mais ne sont pas exposées en données ouvertes.
• PCJA au format SKOS-RDF. Le Conseil d'État maintient le Plan de Classement en interne mais ne publie pas la version SKOS associée à des URI stables. Notre version reconstituée (4 093 concepts) couvre environ 80 % du plan officiel.
• Absence de dépôts de code institutionnels pour le Conseil d'État, le Conseil constitutionnel, la CNIL, la CADA et le Défenseur des droits. Ces institutions exposent uniquement des API propriétaires (Sinequa, OpenCNIL) sans miroir code ou données associées sur GitHub.
• Absence de schéma ECLI unifié et de table de correspondance entre la norme ECLI et les identifiants nationaux. JusticeLibre tente de combler cette lacune via son moteur de résolution croisée.
Appel à contributions : pour signaler une ressource manquante, ouvrez un ticket sur notre dépôt GitHub ou utilisez le formulaire de contact.