Start Trial

8 June 2020

Comprendre l’écosystème du Document Understanding

8 June 2020

Comprendre l’écosystème du Document Understanding

George Roth est Responsable senior des partenariats technologiques chez UiPath.

 

La compréhension des documents (Document Understanding) se propose d’extraire les données enfouies dans les documents de manière à ce que votre organisation améliore sensiblement la précision des informations extraites, accroisse sa productivité et élève le ROI de l’automatisation robotisée des processus (RPA). Elle se trouve au carrefour du traitement de documents et de l’intelligence artificielle (IA), qui tous deux, contribuent à façonner un avenir où pourront être automatisées la quasi-totalité des opérations.

 

L’écosystème de compréhension des documents comprend des technologies capables d’interpréter les informations et les significations dans un vaste éventail de types de documents, y compris les textes manuscrits, les cases à cocher et les tampons par exemple. L’apprentissage machine ou Machine Learning (ML), par exemple, entraîne une innovation continue dans la compréhension des documents, l’un des domaines d’automatisation enregistrant la plus forte croissance.

 

Il est probable que certaines organisations travaillent déjà avec des solutions ou des prestataires spécifiques. Cela dit, elles peuvent très bien avoir besoin de technologies supplémentaires ou d’une nouvelle expertise pour élargir la compréhension des documents à d’autres fonctions opérationnelles. Or il est parfois difficile de trouver un fournisseur commercialisant une formule universelle compatible avec toutes les catégories de documents. La majorité se concentre en effet sur des types de documents ou des industries ciblés, comme l’assurance, la finance ou la santé. Il existe aussi des fournisseurs proposant des solutions basées sur du Machine Learning, telles que les modèles préformés pour documents spécifiques. Pour autant, ces modèles ne peuvent être facilement modifiés pour traiter les documents extérieurs à ces domaines.

 

De fait, il est actuellemeologies de cet écosystème et leurs principaux prestataires.

  1.  

Plusieurs technologies pour libérer le potentiel du Document Understanding

 

Dans cette catégorie, on trouve certaines des technologies les plus couramment utilisées dans la compréhension des documents, autour desquelles s’articulent les solutions des partenaires de UiPath :

 

Reconnaissance optique des caractères (OCR)

L’OCR convertit les images de textes dactylographiés, manuscrits ou imprimés en un texte codé par une machine, qui peut ensuite être traité pour extraire les données souhaitées. La technologie extrait normalement des informations sur la mise en page et la structure des contenus. Peut-être avez-vous déjà été ralenti en travaillant avec des documents PDF dans lesquels il n’était pas possible de copier du texte ou d’effectuer une recherche parce que les pages prenaient la forme d’images. De même, il est probable que vous tombiez sur un document numérisé, une photo ou une capture d’écran de facture, par exemple, sous un format graphique courant, comme JPEG ou TIFF. L’OCR présente l’intérêt de pouvoir recueillir facilement des informations dans ces fichiers sans que l’humain doive lui-même parcourir tous les documents.

 

 

La plupart des moteurs d’OCR les plus connus du marché sont intégrés à UiPath : c’est notamment le cas de FineReader (ABBYY), de Tesseract (OCR open source fourni par Google), d’OmniPage (Kofax), ou encore des OCR de Microsoft et de Google. L’OCR UiPath, qui sort cette année, constitue une nouvelle solution de choix pour les clients.

 

Extracteurs à base de modèles (Template-based Extractors ou TBE)

Les TBE extraient les données au moyen de règles fixes qui sont appliquées à des modèles créés par un utilisateur ou une machine. Il leur arrive de ne pas fonctionner avec des documents dont la structure varie fréquemment ou nécessite plusieurs ajustements du modèle. Ils ne sauraient donc représenter une solution lorsqu’on travaille avec un grand nombre d’organisations différentes et que l’on est amené à manipuler plusieurs modèles de factures ou de reçus. En revanche, la technologie convient idéalement en présence d’un nombre relativement faible de modèles de documents stables. N’hésitez pas à opter pour elle si vous devez traiter une série prédéfinie de modèles fixes et qu’aucune exception n’est à prévoir. Lorsqu’un changement de format de document s’impose, il est facile de modifier manuellement le modèle.

Nombreux sont les fournisseurs de TBE. Avant de faire votre choix, il vous faut prêter attention au degré de facilité de la configuration d’un modèle et savoir si la qualité de l’image influe beaucoup sur les résultats de l’extraction. Certaines des meilleures entreprises proposent des technologies qui créent les modèles semi-automatiquement en faisant intervenir l’humain dans la boucle pour confirmer le choix. 

Un excellent exemple de TBE est ABBYY FlexiCapture, intégré à UiPath Studio. Un extracteur de modèles UiPath est également prévu dans le cadre de UiPath Document Understanding.

 

Extracteurs d’apprentissage automatique basés sur l’apprentissage supervisé (SMLE)

Les SMLE sont employés à la fois avec des documents structurés et des documents semi-structurés. Ces derniers peuvent ne pas présenter une mise en page aussi rigoureuse que celle des documents structurés, tout en comportant des contenus similaires. Les factures et les bons de commande en sont des exemples illustratifs. Les SMLE fonctionnent en étiquetant une série d’échantillons de documents, c’est-à-dire en associant les éléments de données à extraire à la partie du document dont sont extraites les données.

 

 

Actuellement, UiPath dispose d’extracteurs de factures, reçus et bons de commande faisant appel au Machine Learning. D’autres modèles préformés ont été ajoutés. Ajoutons que UiPath s’intègre aussi à ABBYY FlexiCapture Distributed et FlexiCapture for Invoices, qui s’appuient sur des modèles ML préformés prenant en charge les factures et les documents similaires, ainsi qu’à Hyperscience, Ephesoft, Vidado, Rossum, Omnius, Microsoft Form Recognizer, et Amazon Textract. Toutes les intégrations proposent des techniques applicables aux documents structurés et semi-structurés.

Avant de choisir vos options de SMLE, demandez au fournisseur le nombre d’échantillons nécessaire à la formation des modèles. Si celui-ci est élevé, le processus risque de s’avérer onéreux du fait des tâches d’étiquetage et du besoin d’échantillons multiples.

 

Apprentissage non supervisé (Unsupervised Learning ou USL)

Cette technique consiste à analyser une série de données sans avoir besoin d’informations de pré-étiquetage. L’USL recourt à des modèles préformés ou à différentes représentations de connaissances informatisées pour traiter les documents non structurés. Entre autres cas d’utilisation courants, on peut citer l’analyse des états financiers, les contrats et les emails.

UiPath possède plusieurs partenaires proposant des solutions USL, comme Indico, SortSpoke, Botminds AI Technologies et Xtracta. Indico, par exemple, met à disposition un outil d’étiquetage assisté par ordinateur qui suggère les étiquettes associées aux données dans les documents. Tout ce que l’utilisateur doit faire, c’est les approuver ou les écraser.

 

Traitement du langage naturel (Natural Language Processing ou NLP)

Les technologies NLP permettent aux ordinateurs de comprendre le langage humain. Le NLP est souvent combiné à d’autres technologies pour accomplir un éventail de tâches. Il permet aux organisations de procéder à l’analyse de textes, à l’extraction d’entités, et à l’automatisation de processus en identifiant une intention dans les documents non structurés, du genre emails. Si vous souhaitez extraire la date de commencement et la date d’achèvement d’un document non structuré, vous devez par exemple reconstituer le déroulement du travail, puisque de nombreuses dates sont synonymes. C’est précisément ce que le NLP vous aide à faire, puisqu’il peut déterminer et analyser les synonymes. Au-delà de ça, il lui arrive de pouvoir catégoriser le sentiment d’un texte, en d’autres termes, de savoir s’il présente un caractère positif, négatif ou neutre. Cela peut notamment être précieux lorsqu’il s’agit d’interpréter le contenu des actualités, des médias sociaux ou de correspondances. Les partenaires et technologies NLP intégrés à UiPath se nomment Expert System, Amazon Comprehend et Stanford NLP Group.

Les alternatives émergentes : externalisation des processus métiers et Human-in-the-loop (« un humain dans la boucle »)

À côté des technologies et des entreprises dominantes précédemment évoquées, on note l’émergence de fournisseurs proposant des processus BPO (externalisation des processus métiers) et Human in the Loop ou HITL (« un humain dans la boucle ») visant à perfectionner la compréhension des documents.

À titre d’illustration, Ocrolus et Contract Wrangler ont mis au point de puissantes technologies Machine Learning pour la compréhension des documents. Cela dit, ces acteurs font appel à une main-d’œuvre humaine en crowdsourcing, qui prend part à la correction des résultats d’extraction ne satisfaisant pas le seuil de précision souhaité. Les deux entreprises sont disruptives dans le sens où elles garantissent une précision pouvant aller jusqu’à 99,99 % et le respect de la date de livraison convenue. À l’évidence, toute demande d’augmentation de la précision et de raccourcissement des délais risque néanmoins d’entraîner un renchérissement du coût pour le client.

 

UiPath Validation Station-1

 

Ajoutons pour finir que la solution UiPath Document Understanding comprend une Station de validation, outil permettant à l’utilisateur de réviser et, si nécessaire, de corriger les résultats de classification des documents et d’extraction automatique des données.

 

Dernières considérations sur le choix d’une solution

Le choix d’une solution répondant à tous vos besoins opérationnels de compréhension des documents peut poser un défi de taille. Il conduit généralement à évaluer différentes options pour mettre en œuvre plusieurs solutions simultanément et trouver les meilleurs moyens de les intégrer. C’est pourquoi UiPath pratique une collaboration et une intégration poussées avec une large panoplie de fournisseurs de référence dans l’industrie. Le riche écosystème de compréhension des documents (Document Understanding) que nous avons mis sur pied vient ainsi compléter la Plateforme RPA de UiPath.

 

Pour compléter votre compréhension de l’offre Document Understanding, vous pouvez réécouter le Webinaire que notre équipe UiPath France a enregistré sur le sujet !

 

Et n’hésitez pas à nous contacter pour examiner quelle solution serait pertinente pour vos jeux de données ou vos propres cas d’usage.

  1.  

by George Roth

TOPICS: RPA, Machine Learning, RPA + AI, Document Processing

Show sidebar