Faire gagner du temps aux utilisateurs métiers dans la recherche documentaire : tel est le but des techniques de cognitive search déployées dans des outils de gestion de l’information tels que .discover. Ce dernier offre une recherche multisource et va chercher l’information dans le SAE, mais également dans les drives, les boîtes mail, les disques réseaux, les sharepoints, etc.
De la recherche par mots-clés à la recherche par concepts
Pour répondre aux besoins des multinationales qui doivent souvent effectuer des recherches dans différentes langues, l’outil saura également extraire des concepts sémantiques. Il saura ainsi trouver un document quelle que soit la langue avec laquelle ont été remplies les métadonnées. Si, par exemple, un utilisateur cherche un contrat, il pourra le retrouver même si, dans le système d’information, on parle de “contract”, de “contrato”, de “contratto” ou même d’”agreement”. On n’effectue plus une recherche par mots-clés mais une recherche par concept. On utilise ici des techniques de NLP (natural language processing), l’une des branches de l’IA (intelligence artificielle).
Par ailleurs, pour améliorer la partie recherche, l’outil est doté de facettes que l’on peut sélectionner à partir d’un premier résultat. Des propositions sont effectuées en fonction de ce dernier. Ces facettes peuvent être déjà intégrées à l’outil (nom de personne, numéro de sécurité sociale, etc.) ou bien être paramétrées par l’entreprise en fonction de ses besoins (numéro de facture, numéro de client, etc.).
En raison de cette recherche multisource, par concepts et par facettes, l’outil offre une vue à 360° de votre capital informationnel à l’utilisateur qui pourra non seulement exceller dans son métier mais également gagner un temps précieux.
Le cercle vertueux du machine learning
Par ailleurs, .discover dispose de la technologie de machine learning. Si, au départ, c’est un professionnel de la gestion de l’information qui va lui fournir les différentes catégories de documents, l’outil dispose de mécanismes d’autoclassification par apprentissage. Au fur et à mesure, le logiciel saura reconnaître le type de document que l’on entre dans le système d’information (est-ce un contrat ? Une facture ? Une fiche de paie ?) après qu’on lui a fourni plusieurs documents du même type. L’utilisateur autorisé effectuera ensuite des recommandations au logiciel pour que celui-ci affine sa classification.
La classification s’effectue donc de deux manières : par règles et par apprentissage. Dans le premier cas, il s’agit de satisfaire aux obligations légales. Par exemple, un document engageant devra peut-être être classé dans le SAE pour être sécurisé. Un document contenant des données personnelles et soumis à RGPD devra être détruit au bout d’un certain temps, et donc être placé à un endroit adéquat. Ces règles doivent être maintenues par le gestionnaire de l’information. Dans le second cas, il s’agit de rendre le système d’information de plus en plus performant. L’enjeu est de taille à l’heure où l’information est un véritable capital pour l’entreprise.
Inscrivez-vous à notre matinale sur “les techniques cognitives au service de la gouvernance de l’information” qui se déroulera à Paris, le 24 janvier, de 9 heures à 11h30.