Aller au contenu principal

Méthodologie

Capture

Chaque corps policier de l'archive est exploré selon une cadence fixe (hebdomadaire pour le palier-priorité 1, aux deux semaines pour le 2, mensuelle pour le 3). Chaque URL capturée est rendue dans un navigateur Chromium sans tête, hachée (SHA-256), stockée dans MinIO, soumise à la Wayback Machine et archive.today, puis épinglée à IPFS. Les sous-ressources sont sérialisées en WARC. La capture est en ajout uniquement — une nouvelle requête produit une nouvelle ligne, pas une mutation.

Extraction

Les captures passent à travers trois paliers d'extracteurs. Les adaptateurs Palier A sont ajustés à la main par source (rapports du directeur de l'UES Ontario, fiches d'enquête du BEI Québec, décisions du directeur civil en chef de l'IIO BC, rapports du directeur SIRT-NL, décisions de l'OCPC sur CanLII). Les modèles Palier B couvrent les familles de documents municipaux. Le Palier C est un repli LLM (Anthropic Claude) qui traite chaque document capturé sans adaptateur dédié.

Détection des suppressions

Quatre familles de détecteurs surveillent les retraits de dossiers. Le Registre exécute les quatre :

Note de transparence

La note de chaque corps policier est calculée quotidiennement à partir des incidents extraits et des suppressions détectées. Le barème est explicite :

Anonymisation

Le produit public ne publie jamais de noms d'agents. Chaque incident porte un jeton HMAC-SHA256 dérivé d'un sel conservé hors de la base de données applicative ; la rotation du sel re-tokenise tout le corpus, ce qui fait qu'une compromission de la base d'application ne compromet pas la liaison nom→jeton. Les dates sont publiées à la précision trimestrielle seulement ; les dossiers attendent au moins 60 jours après disposition avant publication ; les cellules contenant moins de cinq dossiers similaires sont supprimées ou agrégées vers le haut. Les corps policiers de moins de 50 agents assermentés ne publient que des agrégats annuels. Les ordonnances de non-publication sont respectées sans exception.