Aller au contenu
shutterstock 1099747703 600

Tech Tuesday : Premiers pas avec la classification

L’un des éléments les plus importants d’un programme de gouvernance des informations est la bonne classification de vos données. Il est essentiel de disposer d’un plan de classification central et formel, en particulier lorsque la majeure partie des informations (structurées et non structurées) est utilisée par différents services et équipes dans toute l’organisation. Si les données sont l’essence de votre organisation, un bon plan de classification vous garantit que chacun pourra trouver et utiliser les données dont il a besoin pour travailler au quotidien. Cela signifie aussi que vous devez disposer d’une stratégie éprouvée afin de gérer correctement ces données.

Les avantages de la classification

Imaginez devoir trouver un document parmi des milliers de documents répartis sur plusieurs partages de fichiers ou applications de partage de fichiers. Vous connaissez peut-être le nom du document, ou seulement ce qu’il contient. Il existe peut-être plusieurs versions du document ou plusieurs copies stockées par d’autres services. Vous trouvez ça frustrant ? C’est normal.

Non seulement vous devez passer d’un référentiel à l’autre pour tenter de trouver votre document, mais lorsque vous le cherchez dans des référentiels qui disposent d’une fonction de recherche, vous obtenez une multitude de résultats dont le tri vous prendra une éternité.

Pour vous aider, vous avez deux possibilités, et l’une d’entre elles consiste à disposer d’un plan de classification à l’échelle de l’entreprise. (Dans cet article, je m’intéresserai avant tout à la classification de vos documents et autres contenus non structurés.)

Avant d’aller plus loin, n’imaginez pas que j’attends de vous que vous laissiez toutes vos activités en plan pour vous lancer dans un projet d’un an pour documenter l’ensemble de la taxonomie de votre entreprise. Ça ne serait pas raisonnable, et cela pourrait aussi mettre un frein à vos efforts en matière de gouvernance de l’information.

Au lieu de cela, nous aimerions que vous suiviez en termes de planification de votre classification et de votre taxonomie les mêmes recommandations que pour la gouvernance de l’information : à savoir que vous les pensiez par phases ou par projets. Développez votre plan de classification comme vous développez votre programme de gouvernance : une étape après l’autre. En créant votre taxonomie de cette façon, vous pouvez ajouter de nouveaux types de contenu, ou développer les types de contenu déjà présents dans la taxonomie, et ainsi développer lentement et soigneusement un plan de classification qui conviendra à tous.

Revenons à notre sujet.

Une classification efficace de vos contenus offre de nombreux avantages, dont l’un des plus importants est une meilleure visibilité sur vos informations :

–       Identifiez les informations sensibles, telles que les données à caractère personnel et de paiement, et autres informations personnelles ;

–       Séparez les bonnes informations des contenus redondants, obsolètes ou inutiles ;

–       Répondez plus rapidement aux demandes d’informations ;

–       Attribuez des niveaux de stockage économiques ;

–       Appliquez des contrôles de sécurité adaptés pour empêcher la divulgation accidentelle ou le cyber-piratage des données.

Les avantages de la classification sont nombreux. En voici deux exemples :

  1. Le premier est le fait de répondre aux demandes de personnes fichées de la part de réglementations de confidentialité telles que le CCPA et le RGPD. Ces deux réglementations exigent que vous fournissiez à un individu toutes les informations que vous stockez sur lui, dans un certain délai (30 jours pour le RGPD, 45 pour le CCPA). Si vous stockez les informations des clients sur de nombreux référentiels différents, et que chaque référentiel utilise son propre plan de classification, il sera très difficile de trouver toutes les informations en peu de temps (à moins bien sûr d’affecter à cette tâche de nombreux employés, ce qui représente alors d’énormes dépenses en ressources pour chaque demande de personne fichée).
  2. Le second est le risque de cyber-piratage, et tout le monde s’accorde à dire que la question n’est pas « si » cela se produira, mais « quand ». Selon un sondage Harris réalisé pour Symantec en janvier 2018, 60 millions d’Américains ont été touchés par l’usurpation d’identité. La majeure partie des données nécessaires pour usurper une identité sont volées à des entreprises qui stockent ou protègent mal les informations client. Le même article explique que « On estime que les cybercriminels voleront 33 milliards d’archives en 2023, selon une étude réalisée en 2018 par Juniper Research. Et comparé aux 12 milliards d’archives dont le vol est attendu en 2018. » Si vous ne classez pas vos informations et que vous ne les protégez pas à l’aide de politiques de sécurité adaptées, vous pourriez bien être l’une des entreprises touchées par ces vols d’informations.

Premiers pas avec la classification

Certains pensent que la première étape de la classification est l’acquisition d’un outil. Mais c’est faux. La première étape consiste à rassembler les principales parties prenantes qui créent, stockent et travaillent avec les informations de votre organisation, afin d’avoir une vue d’ensemble exhaustive de la façon dont ces informations sont utilisées, non seulement dans un service ou une division, mais aussi dans d’autres services ou divisions. Gardez à l’esprit que vous pouvez le faire de manière itérative pendant que vous travaillez sur des projets de gouvernance.

En prenant le temps de parler avec toutes les personnes concernées, vous pourrez créer un plan de classification adapté aux besoins de chacun. Et c’est essentiel, car il n’est pas souhaitable que les différents services classent les contenus de façons différentes. Cela rendrait impossible le respect de réglementations telles que le CCPA. Cela ne plaira peut-être pas à tout le monde, mais ce n’est pas exactement le but d’une stratégie de classification centrale.

Une fois que vous aurez recueilli les opinions des principales parties prenantes vous pourrez commencer à définir des catégories de contenus (ou types de contenus) et les métadonnées correspondantes. Diffusez le plan de classification dans toute l’entreprise, et assurez-vous qu’il est respecté par tous.

Je ne dis pas que vous n’avez pas besoin d’outils pour commencer, mais il peut être avantageux d’investir dans des outils adaptés. Tout d’abord, lorsque vous définirez votre taxonomie, vous aurez besoin d’un emplacement où stocker cette taxonomie, qui indique où et comment elle est appliquée. Une solution telle qu’everteam.policy peut vous y aider.

Notre produit, everteam.discover, connecte la totalité de vos référentiels non structurés, indexe vos contenus et applique automatiquement votre plan de classification. Il s’intègre de façon transparente à everteam.policy pour extraire le plan de classification à appliquer.

everteam.discover vous permet de classer le contenu selon trois méthodes : manuellement, en utilisant des règles (correspondances de requêtes) ou au moyen de l’apprentissage automatique (en analysant le contenu d’un élément de contenu). Une classification automatique utilisant des règles ou l’apprentissage automatique est nécessaire lorsque la quantité de contenu à classer est très importante. Cela vous permettra de respecter les exigences réglementaires plus rapidement (et avec plus de précision) qu’avec une classification manuelle. Mais dans certains cas, une classification manuelle est nécessaire.

L’apprentissage automatique permet d’analyser des données non structurées de façon sémantique, afin de suggérer des classifications basées sur le texte trouvé. Vous pouvez ensuite ajouter ces classifications recommandées à everteam.policy.

Classification de contenu avec everteam.discover

Vous savez comment vous souhaitez classer vos informations, mais elles sont trop nombreuses pour les classer manuellement (un document après l’autre). C’est là qu’everteam.discover entre en jeu. everteam.discover connecte tous vos référentiels et en indexe le contenu. Vous pouvez ensuite consulter ce contenu depuis différents aspects ou vues, ou rechercher du contenu avec une gamme de paramètres. Pour classer manuellement un groupe de documents, vous les sélectionnez et appliquez une catégorie de classification ou un type de contenu à l’aide de la taxonomie que vous avez au préalable ajoutée à l’outil.

Une fois que vous avez identifié les règles de classification des documents, vous pouvez facilement définir des étapes et commencer leur automatisation. Ajoutez ces règles à un classifieur basé sur des règles everteam. Le classifieur s’exécute automatiquement chaque fois qu’un nouveau document est ajouté, et applique une catégorie à tous les documents qui correspondent aux règles. Tout nouveau document ajouté est automatiquement classé, éliminant le processus manuel.

L’apprentissage automatique est la troisième méthode de classification du contenu dans everteam.discover. Il vous permet d’analyser votre contenu, et vous suggère des classifications. Pour que l’apprentissage automatique fonctionne, vous devez fournir à everteam.discover des ensembles de documents d’apprentissage pour chaque classification, qui lui permettront d’apprendre. Plus il indexe et classe de contenus, mieux il parvient à attribuer la bonne classification à chaque document.

Voici un aperçu de la fonctionnalité de classifieur d’everteam.discover :

Il n’est pas toujours possible de laisser la machine appliquer vos classifications ; vous devez permettre à certains employés d’appliquer la classification manuellement. C’est important, par exemple, lors de l’identification et du traitement des contenus redondants, obsolètes ou inutiles. Vous pourrez peut-être commencer avec la classification automatique, mais vous devez prévoir une intervention humaine afin de vous assurer que vous ne vous débarrassez que d’informations dont vous n’avez plus besoin.

J’ai fait ici uniquement d’une présentation rapide de la façon dont everteam.discover peut vous aider à appliquer votre taxonomie à votre contenu. L’utilisation des classifieurs et la formation d’un classifieur à apprentissage automatique sont des sujets complexes, qui seront traités dans les prochains articles de blog. Alors inscrivez-vous à notre newsletter pour savoir quand nous publions de nouveaux articles de blog.

La classification n’est pas une tâche unique

Que vous la réalisiez en une seule fois (ce qui n’est pas conseillé si vous voulez continuer à travailler) ou en plusieurs phases, par des initiatives, la classification n’est pas une tâche unique. Vous ne pouvez pas la définir une fois, et supposer qu’elle fonctionnera indéfiniment. La gestion des classifications (la taxonomie) est un processus continu : vous ajoutez de nouveaux types de contenus à vos informations, d’autres contenus changent, et les règles de gestion de vos informations changent (nouvelles réglementations, modification des réglementations existantes). La façon dont vous souhaitez utiliser vos informations pour soutenir la prise de décision affectera également la façon dont vous classez vos informations.

everteam.policy peut vous aider à gérer votre taxonomie en continu. Il vous permet non seulement de définir et de gérer votre taxonomie actuelle, mais aussi de définir des règles de gestion de la conservation et du cycle de vie, d’identifier les autorisations d’accès et de partager toutes ces informations avec les collaborateurs et systèmes au sein de l’entreprise qui doivent connaître et respecter ces règles de classification.

Pour terminer, je souhaite faire une dernière remarque au sujet de la classification de vos informations. Un type de contenu de classification (ou une catégorie, selon le terme que vous utilisez) doit offrir les informations suivantes :

–     La description du type de contenu et de toutes les métadonnées et tous les attributs associés ;

–     Les règles de traitement de ces informations ;

–     Comment/où les stocker ;

–     Comment les supprimer lorsqu’elles ne sont plus utiles ;

–     Les autorisations/la sécurité à appliquer aux informations pour s’assurer que seules les personnes autorisées peuvent y accéder.

Si vous souhaitez en apprendre davantage sur comment everteam.discover peut vous aider à classer vos informations (y compris les 80 % de dark data cachés dans vos référentiels), contactez-vous pour demander une démonstration, ou téléchargez notre fiche produit everteam.discover.