Archives familiales de la cinéaste en train d’être numérisées. Image tirée du film, avec la permission de l’Office national du film du Canada.
Archives familiales de la cinéaste en train d’être numérisées. Image tirée du film, avec la permission de l’Office national du film du Canada.

DOSSIER | Au-delà du papier – Archiver à l’ère du numérique

Dans le cadre de notre magazine d’automne 2023 ayant pour thématique Nature morte, j’ai eu l’occasion de rédiger un article sur sur les pratiques d’archivage et de conservation et la pérennité des oeuvres et des contenus en contexte numérique et  militant, et ce, en m’appuyant sur une série d’entretiens – d’abord avec Ermance Dhermy, étudiante dans le domaine de la valorisation des archives cinématographiques et spécialiste des affiches de cinéma, avec René Audet, professeur titulaire au Département de littérature, théâtre et cinéma de l’Université Laval, spécialiste de littérature contemporaine et de culture numérique, directeur du Laboratoire Ex situ et du pôle Québec du projet Littérature québécoise mobile, puis finalement avec Alexis Lafleur-Paiement, chargé de cours et doctorant à l’Université de Montréal en philosophie politique, membre fondateur et animateur du collectif Archives Révolutionnaires depuis 2017. Le présent article se veut une suite, un complément à ce précédent texte, devrais-je plutôt dire, afin d’encore mieux répondre à certaines questions soulevées, d’en saisir l’étendue et la complexité. Cette fois, je me suis entretenue avec Sonia Lachance,  archiviste-coordonnatrice aux archives numériques à Bibliothèque et Archives nationales du Québec, ici même, à l’Université Laval.

Par Frédérik Dompierre-Beaulieu (elle), cheffe de pupitre aux arts

 

Bibliothèque et archives nationales du Québec : préserver et rendre accessible

Ma liste de questions était longue avant que je ne m’entretienne avec Sonia, parce qu’au Québec, c’est justement Bibliothèque et Archives nationales du Québec (BAnQ) qui est responsable de rassembler, traiter, conserver et mettre en valeur le patrimoine documentaire québécois. D’emblée, mon intervenante m’explique que BAnQ se compose de trois entités fusionnées qui, si elles ont des missions, des spécialités et des expertises qui leur sont propres, travaillent en étroite collaboration. Il s’agit de la Grande Bibliothèque, de la Bibliothèque nationale et des Archives nationales. 

« La Bibliothèque nationale est responsable de recevoir les publications et elle gère le dépôt légal. De notre côté, pour ce qui est du pilier “archives”, notre mission est de recevoir les archives qui émanent des ministères et des organismes. L’appareil gouvernemental a l’obligation de nous verser ces archives, qu’on acquiert et qu’on diffuse. On acquiert aussi tout ce qui touche le judiciaire, en plus d’avoir des fonds d’archives privés. D’ailleurs, tous les fonds n’ont pas nécessairement les mêmes droits d’accès, mais comme notre mission en est une de diffusion, on essaie de faciliter cet accès-là. »

Ce travail de complémentarité, plutôt que de tout réaliser en silo, chacun de son côté, ne concerne pas uniquement les trois instances qui composent BAnQ, mais également les autres bibliothèques et centres d’archives du Québec, les musées, les librairies, les éditeurs et même les écoles, de sorte que se tisse un vaste réseau de partenariat. 

« De notre côté, on travaille entre autres avec les ministères et les organismes, comme ce sont eux qui nous fournissent notre matière première. On travaille également avec ce que nous on appelle les SAPA ou les RSAPAQ, c’est-à-dire le Regroupement des services d’archives privées agréés. Il y a des services d’archives privées sur tout le territoire québécois. Mais pourquoi agréés ? C’est que les archives doivent rencontrer certaines exigences en ce qui concerne la conservation des documents. BAnQ, en plus de se charger du respect de ces exigences, subventionne ces services. Ce sont eux qui peuvent nous aider à travers le Québec. Par exemple, si on acquiert des archives de Rouyn-Noranda, on ne veut pas que ces archives viennent ici à Québec ou à Montréal. Ce qu’on veut, c’est qu’elles restent sur place. Il y a donc un pôle d’archives à Rouyn-Noranda qui travaille avec les services d’archives privées pour qu’ils recueillent les archives de leur communauté, notamment en ce qui concerne des projets avec les communautés autochtones de la région. Du côté des écoles, on a également un espace éducation. On travaille avec les enseignant.es pour leur fournir du matériel didactique, par exemple des cartes anciennes pour les cours d’histoire, mais même du côté de cours de français. On travaille aussi avec des artistes, par exemple.»

Renouveler l’archivage grâce au numérique

Le numérique, néanmoins, semble opérer un changement de paradigme en ce qui a trait aux pratiques d’archivage et de conservation. Bien que le chamboulement ne soit pas total – si cela vous dit, cet article de Stéphane Vial interroge justement de quoi la révolution numérique est-elle la révolution, parce que vraiment, la question se pose – et sans nécessairement parler d’une fragilisation de la mission de conservation des centres d’archives (quoique), les archivistes se voient, sans surprise, obligé.es d’adapter leurs méthodes à cette nouvelle réalité.

« Mon mandat, en tant qu’archiviste, en est aussi un d’acquisition et de traitement. Avec le papier, on conservait les archives dans nos magasins. Tout ça, c’est un peu un art : dans les magasins, il y a par exemple des températures, des taux d’humidité précis, etc. Avec le numérique, on a dû s’allier à d’autres partenaires au sein de notre institution. Personnellement, ma principale collègue est une informaticienne, parce que c’est elle qui a comme mandat la préservation numérique. Évidemment, on travaille toujours en collaboration. La conservation numérique n’est plus l’apanage de l’archiviste. De son côté, elle gère des objets, des fichiers ou des données numériques. Une archive, néanmoins, ça ne représente pas un seul objet: ça peut être plusieurs fichiers inclus dans un dossier, plusieurs sous-répertoires et sous-dossiers. Il faut que moi je comprenne la réalité numérique et technologique et son infrastructure, et, qu’elle, elle comprenne la réalité au niveau archivistique. C’est une partie de mon métier que je trouve super enrichissante, parce que ça m’a ouvert à d’autres collègues et à d’autres pratiques que je ne connaissais pas au sein de mon institution. Avant, je n’avais pas affaire à la conservation numérique, parce que ça n’existait tout simplement pas.

C’est sûr qu’en termes de “fragilisation” de la mission de conservation”, c’est plus difficile de conserver des fichiers numériques. C’est beaucoup de processus et de migrations. Il faut non seulement que le contenu soit accessible, mais il doit rester intègre. Avec le papier, on n’a pas besoin d’un intermédiaire pour lire le contenu, alors qu’avec le numérique, on a besoin d’intermédiaire pour lire l’information et les données numériques, avec des logiciels, des infrastructures. Si on n’investit pas les efforts nécessaires pour les conserver, ça peut effectivement fragiliser la mission de conservation. On ne peut pas seulement enregistrer des fichiers sur un disque dur et ensuite l’entreposer dans un magasin. La priorité, quand on reçoit des fichiers sur des supports externes comme des clés USB ou des disquettes, c’est d’extraire les fichiers pour les sécuriser sur nos serveurs. De mon point de vue d’archiviste, le numérique n’a pas fragilisé mon métier, qui je pense s’avère d’autant plus pertinent, surtout qu’on s’est enrichi de nouveaux collègues. Par contre, au niveau matériel, c’est en effet plus compliqué de conserver des fichiers numériques.»

Le numérique, assurément, bouleverse cette hégémonie du support papier, bien qu’il faille être prudent.e dans notre manière d’aborder ces changements. Si l’imaginaire de la fin du livre est populaire et fortement entretenu de toutes parts, il serait probablement plus juste de parler de continuum que de rupture. Il s’agit plutôt, pour le moment du moins, d’une coexistence des médiums, qui peuvent même entretenir un lien de complémentarité et non d’incompatibilité, permettant l’apparition de formes nouvelles et la création de contenus pluriels, hétéroclites, hybrides. « Nous avons plus affaire à un décentrement du processus de création, d’édition et des modes d’appréhension qu’à un effacement d’une forme au profit d’une autre » (Dompierre-Beaulieu et Pépin, 2022), question explorée dans un précédent article sur les arts littéraires. D’ailleurs, lorsque l’on parle de contenus dits numériques, et, dans le cas qui nous intéresse, d’archives, elles se déclinent en trois grandes catégories : les contenus papier numérisés, la déclinaison numérique dite identique d’un contenu papier, et finalement les contenus natifs du numérique, c’est-à-dire qui ont été créés grâce au support numérique et qui n’existent que par ce dernier.

Il faut aussi comprendre qu’il peut y avoir un délai entre la création et la production d’un contenu et son acquisition et son traitement par les archivistes. Sonia m’explique que lorsque BAnQ reçoit les archives, elles peuvent avoir entre 15 et 25 ans. « Il y a 20 ans, il n’y avait pas beaucoup de contenus numériques. On commence à plus en recevoir, mais au départ, il était beaucoup question de numérisation. »

Numérisation et migration des contenus

La numérisation, bien qu’elle puisse sembler signer la mort du livre et du papier au profit d’un paradigme 100% numérique, recouvre en fait une fonction de préservation des archives « physiques » et papier.

« On a, par exemple, des cartes anciennes qu’il n’est pas possible de sortir et de manipuler comme bon nous semble, car elles se détériorent. On les a numérisées pour préserver leur intégrité physique, mais aussi pour les rendre accessibles sur nos plateformes. On fait beaucoup de numérisation en ce sens. On peut aussi avoir recours à la numérisation lorsqu’on a un fonds d’archives particulièrement populaire, mais qui, physiquement, est dans une autre ville, et que l’on souhaite le rendre accessible et disponible partout au Québec. On conserve donc à la fois les archives papier et les fichiers numériques qui sont liés à leur numérisation.

Notre premier versement 100% numérique date de 2014 avec la commission Charbonneau. Ils ont produit tous leurs documents de manière numérique, il n’y avait pas de papier, rien. On avait déjà cette conscience par rapport aux enjeux du numérique, mais c’est à partir de ce moment-là qu’on s’est davantage mis à travailler à leur protection, puisqu’on avait seulement les fichiers, et non pas les supports. Il y a une norme à ce sujet d’ailleurs : c’est la norme OAIS [Open Archival Information System]. Elle nous donne un cadre pour la préservation numérique. De notre côté, on conserve les fichiers sur plusieurs serveurs, dans des endroits différents. Quand je travaille au traitement d’un fichier numérique, je ne travaille jamais directement sur le fichier d’origine, mais bien sur une copie. Il y a ce qu’on appelle des paquets d’informations, c’est-à-dire un fichier avec toutes les métadonnées de l’archive, pour savoir, par exemple, avec quel logiciel le lire pour que l’on puisse la faire migrer éventuellement vers d’autres formats. Encore une fois, en ce qui concerne les scripts, par exemple, on a besoin d’informaticiens. »

Pourquoi passer par un processus de migration ? Encore une fois, c’est une question d’accessibilité. L’objectif est d’avoir le plus d’informations possible au sujet du fichier. Ces migrations permettent, nous l’avons compris, de contourner, dans une certaine mesure, le problème de l’obsolescence des logiciels, des plateformes, ou des modalités technologiques plus largement qui permettent de lire les fichiers et les archives, en sont leur support, constituent leur forme et leur matérialité. Sonia m’explique que pour les archivistes, le plus important reste justement le contenu, même s’il faut être prudent.e avec les migrations, puisqu’elles peuvent impliquer des pertes de données.

Risques des migrations

La migration des contenus peut certes s’avérer une solution, pour le moment, aux enjeux d’obsolescence, mais ne pas conserver de manière systématique les logiciels ou les technologies d’origines et évacuer totalement la question de la forme comporte un risque de dénaturation des œuvres, par exemple. Effectivement, la forme et la matérialité impactent de manière très forte et directe l’expérience de lecture et les potentialités sémiotiques, donc de sens, des œuvres, Les migrations ne permettent pas de « reconstruire chacune des configurations de serveurs et des systèmes d’exploitation de chacune de ces œuvres sur le web, les destinant à sombrer dans un oubli technologique » (Dompierre-Beaulieu, 2023).  Selon René Audet, « Dans l’absolu, on préfère une méthode de conception qui sépare les données de leur engin de rendu (structure de site web, logiciel d’affichage), mais pour des œuvres numériques, c’est souvent cette combinaison qui est au cœur de ce qui fait l’œuvre… D’où leur pérennité très problématique. » 

« Les émulateurs, des applications logicielles, permettent quant à eux de reproduire et de recréer ces conditions d’existence et d’expérimentation des œuvres en interprétant le code original – on peut le voir avec le cas d’Adobe Flash Player sur ordinateur, ou avec les émulateurs de consoles de jeux vidéo qui offrent aux joueur.euses un saut dans le passé, par exemple (douce nostalgie, quand tu nous tiens!) –  conditions qui, malgré tout, demeurent à tout le moins encore imparfaites : « sinon l’œuvre est perdue, ou considérablement amputée de son rendu initial », ajoute René. À défaut de pouvoir conserver les œuvres, certain.es ont, par le passé, proposé des captations (dans le cas de performance) ou des navigations (dans le cas de sites web ou d’œuvres et contenus numériques) filmées. Celles-ci cherchent à en donner un aperçu, notamment en ce qui a trait au graphisme et à la facture visuelle, aux interactions et actions possibles, etc., et ce, dans le but de se rapprocher le plus possible de l’expérience des spectateur.rices ou des utilisateur.rices, expérience qui reste malheureusement limitée par rapport à la complexité de la performance, de l’œuvre ou du site. 

Comme si ce n’était pas déjà assez compliqué, un facteur supplémentaire complexifie encore plus les pratiques de conservation, en plus de mettre au jour des enjeux d’identité et d’authenticité des œuvres : qu’elles soient de nature allographe ou autographe. Les premières correspondent à des œuvres qui ont la même valeur au fil des copies, comme c’est le cas pour le livre, m’explique René : « Les œuvres littéraires sont allographes : on peut les reproduire sans perte et elles ne dépendent pas, dans leur format livresque, d’une seule incarnation (comme la toile de La Joconde). Les œuvres numériques peuvent parfois circuler (format ePub, par exemple), mais plusieurs sont limitées à un seul « exemplaire », à savoir la combinaison de logiciels et de données qui permet de l’activer. Alors elle devient autographe – d’où sa fragilité et le fort risque de sa disparition. » 

Les œuvres autographes, quant à elles, et nous l’avons brièvement abordé plus tôt, font référence à une œuvre qui n’existe que dans un seul exemplaire, une seule version : pas de copies multiples, pas de duplication. D’autres œuvres peuvent à la fois être allographes et autographes, puisque l’un n’exclut pas l’autre. On pense, par exemple, aux performances et aux arts vivants : la partition ou le texte demeurent les mêmes, mais la performance, elle, se module de représentation en représentation et risque de changer lors de réappropriations futures. Pareil pour les transferts d’un contenu ou d’un certain texte vers un nouveau support ou vers une technologie plus récente : ce sont toutes des modalités qui permettent au texte, par exemple, d’exister, et qui ont une incidence sur notre façon de le lire et d’interagir avec lui, de se l’approprier. Ces éléments agissent sur l’acte de lecture, dans le cas du texte, et en influencent son expérience et sa réception. Toujours, la question se pose : quelles parties de l’œuvre conserver, et comment ? Il faut faire des choix, et ces choix – conserver le code et non seulement le contenu, conserver les technologies d’origine, changer la forme et le support de l’œuvre, la faire migrer vers une nouvelle technologie – ont tous le potentiel de changer à la fois l’expérience de l’œuvre et l’œuvre elle-même, voire carrément de la dénaturer.” (Dompierre-Beaulieu, 2023).

Pour l’instant, me confie Sonia,  BAnQ n’a pas encore recours à ces genres de méthodes, mais cela pourrait éventuellement être le cas, dépendamment des moyens dont l’organisation dispose et des problématiques rencontrées.

Nouvelles possibilités archivistiques du numérique et intelligence artificielle

Mais outre la question de la protection des archives papier et de leur accessibilité, la numérisation des contenus et leur traitement numérique peut faciliter le travail des archivistes et des lecteur.rices / utilisateur.rices en leur permettant de mieux les comprendre et les lire, comme cela peut être le cas pour de vieux documents manuscrits écrits en vieux français, par exemple, ou dont la graphie s’avère plus difficilement déchiffrable, soulevant en ce sens des enjeux de lisibilité.

« C’est un autre aspect intéressant des technologies actuelles. En ce moment, on travaille beaucoup avec l’intelligence artificielle. On a de vieux manuscrits plus ou moins lisibles et lorsqu’on fait de la recherche plein texte, c’est utile pour les documents PDF, notamment, mais ça ne fonctionne pas avec ce qui est manuscrit. On travaille à alimenter l’intelligence artificielle, par exemple d’écrits de notaires qui ont toujours un peu la même écriture, afin que l’IA reconnaisse les caractères manuscrits pour éventuellement en arriver à rendre disponible sur le web de vieux manuscrits en vieux français avec une “traduction”, non seulement en termes de langue, mais de lisibilité de la calligraphie pour les lecteurs. »

Le numérique soulève beaucoup d’enjeux, certes, mais il s’avère aussi particulièrement stimulant.

Curation et moissonnage du web : comment sélectionner les contenus numériques à conserver ?

Auparavant, le dépôt légal obligeait de remettre deux publications dans le cas du papier, mais il n’obligeait rien pour le numérique : aucune loi n’encadrait sa préservation. Depuis peu – depuis 2022, pour être exacte – un règlement quant au dépôt légal des publications numériques donne à BAnQ le levier souhaitépour rassembler cette portion incontournable du patrimoine documentaire québécois. Il s’applique à différents types de publications, liste qui semble, à certains égards, concorder avec le dépôt légal des publications analogiques, à quelques exceptions près. Voici, selon le site web de BAnQ, les publications concernées par le dépôt légal numérique :

  • Affiches
  • Livres et brochures
  • Publications en série (revues, journaux, magazines, rapports annuels, etc.)
  • Sites Web gouvernementaux
  • Sites Web de médias couvrant l’actualité nationale
  • Cartes géographiques et plans
  • Enregistrements sonores
  • Films
  • Partitions musicales
  • Programmes de spectacles

« De notre côté, ce sont des robots qui s’occupent du moissonnage, avec, par exemple, le programme de collecte de sites web. Dans notre règlement, tout ce qui est sites web gouvernementaux doit obligatoirement être conservé, mais il peut y avoir d’autres sites web intéressants : ceux de certaines industries, de municipalités, de centres de services scolaires ou au niveau des hôpitaux, pour qui la conservation n’est pas systématique. On ne peut pas moissonner tout ça, parce que c’est gigantesque sur le plan quantitatif. Là où on intervient, c’est au niveau d’un de nos mandats qui est l’évaluation archivistique. On travaille avec toute une équipe pour établir des critères qui nous permettent d’aller chercher une représentativité de ces sites-là. Une fois que les sites sont identifiés, on contacte les organismes et c’est un robot qui va chercher leurs sites web. On a une plateforme qui permet de voir les sites conservés. Ce qu’on collecte, ce sont les URL. Notre objectif c’est d’avoir une idée, une image de comment était le site web à une certaine époque. Si on prend l’exemple des sites de partis politiques, à chaque changement et à chaque élection, on vient les collecter. Il y a des fréquences de collecte dépendamment de la durée d’activité du site web. »

C’est tout un travail de curation qui est fait. Cependant, faire des choix quant aux contenus à conserver, impliquer de faire des choix, de garde, mais aussi d’exclure. Ainsi, les contenus et les œuvres ne correspondant pas à la précédente liste pourraient être portés à disparaître. Malgré que cette catégorisation permette aux archivistes de ratisser large, l’étendue de cette conservation numérique à ses limites.

Initiatives et projets

La numérisation à elle-seule exige beaucoup de ressources, en termes de financement, de temps, de personnel. BAnQ qui fait constamment des veilles pour voir les initiatives qui sont mises en place à travers le monde :

« Oui, il faut beaucoup de moyens et de ressources, mais on essaie de regarder ce qui se passe ailleurs. Au niveau des archives, il y a un exemple de site qui a permis de recréer une bibliothèque qui avait été détruite en Irlande suite à des bombardements. Grâce à des simulateurs, ils ont été capables de recréer virtuellement non seulement la bibliothèque et son architecture en 3D, mais tous ses contenus, notamment en faisant un appel mondial et en retraçant certaines transcriptions.

Pour l’instant, de notre côté, on est surtout dans la mise en valeur. On travaille aussi à la consolidation de nos bases de données, c’est-à-dire à leur préservation. On parlait de la norme OAIS : un peu dans la même lignée, on travaille à mettre en place un dépôt numérique fiable, comme on a des millions et des millions de fichiers numériques. C’est un énorme système, surtout qu’on sait que par rapport à la quantité de fichiers numériques, dans 5, 10, 15 ans, ça va être exponentiel. Pour l’instant, nos efforts sont principalement mis là-dessus. On commence aussi à explorer avec l’IA, comme on l’a vue plus tôt. »

Sonia m’explique qu’il ne faut pas céder à la tentation de partir de tous bords tous côtés quand de nouveaux projets voient le jour : se concentrer d’abord sur la consolidation, et voir après quelle sera la ligne directrice. « Ce qui nous guide, ce sont nos mandats fondamentaux de préservation et de diffusion de ces contenus. Après, c’est un extra, disons, mais j’ai certainement hâte d’en arriver là ! C’est pour ça que je me suis plus spécialisée dans le numérique : il amène tellement de possibilités, de nouveaux enjeux et défis, de nouvelles réflexions ! Mais évidemment, tout passe par la mise en place de processus, par l’uniformité, l’indexation et le référencement, pour systématiser. On ne peut pas être dans l’approximation, au risque de perdre des contenus. »

Le numérique ne représente pas uniquement des opérations abstraites : il y a tout un lot de processus derrière ce qui nous est présenté, un énorme travail en coulisses dont les lecteur.rices et les utilisateur.rices ne se rendent pas toujours compte. C’est déjà une grosse étape pour la découvrabilité des contenus, d’autant plus que pendant que s’effectue ce travail, les publications, tant sur support papier que numériques, ne cessent pas pour autant de « rentrer », d’exister, d’être produites.

Internet Archives est un exemple intéressant et emblématique lorsque vient le temps de conjuguer conservation et numérique. Il s’agit d’une initiative datant de 1996 consacrée à l’archivage de sites web et à l’édification d’une bibliothèque numérique, et ce, en accès libre. Leur Wayback Machine permet par ailleurs de consulter près de 869 milliards de pages web à divers moments de leur existence, de sorte que l’on puisse être témoin, à retardement, de leur évolution et de leurs différentes occurrences et actualisations.

Au-delà du papier

Si cela vous intéresse, Oana Suteu Khintirian a réalisé un long-métrage documentaire, Au-delà du papier, explorant justement les enjeux de la conservation de la mémoire à l’ère du numérique, soulevant des inquiétudes tout en proposant des pistes de solution.

« À un moment charnière de l’histoire de l’écrit, où les archives de l’humanité migrent vers l’infonuagique, une cinéaste entreprend un périple à travers la planète pour mieux comprendre comment préserver son propre patrimoine, roumain et arménien, mais aussi notre mémoire collective. Mêlant intellect et poésie, sa quête personnelle aux accents universels parcourt le continuum entre papier et numérique, nous rappelant que la connaissance humaine est avant tout affaire d’âme et d’esprit. »

 

 

Consulter le magazine