L'océrisation, c'est quoi ?

La reconnaissance optique de caractères (ROC), en anglais optical character recognition (OCR), ou océrisation, désigne les procédés informatiques pour la traduction d’images de textes imprimés ou dactylographiés en fichiers de texte.

Un ordinateur réclame pour l’exécution de cette tâche un logiciel d’OCR. Celui-ci permet de récupérer le texte dans l’image d’un texte imprimé et de le sauvegarder dans un fichier pouvant être exploité dans un traitement de texte pour enrichissement, et stocké dans une base de données ou sur un autre support exploitable par un système informatique.

Comment utiliser le logiciel OCR ?

Quand vous scannez un document, vous en faites une photo que votre PC ne peut pas interpréter en texte. C’est un logiciel OCR qui va s’en charger. La technologie OCR (Optical Character Recognition) reconnaît chaque caractère dans les documents scannés.

Microsoft Onenote
  1. Une fois Microsoft OneNote ouvert, cliquez sur Insertion, puis sélectionnez Insérer une image à partir d’un fichier.

  2. Une fois l’image insérée, cliquez avec le bouton droit de la souris et sélectionnez l’option Copier le texte de l’image.

  3. Le texte est désormais copié dans le Presse-papiers et il suffit maintenant de le coller dans un éditeur de texte, tel que le Bloc-notes ou Microsoft Word.

Google Docs

Préparer le fichier

En suivant les conseils ci-dessous, vous obtiendrez de meilleurs résultats :

  • Format : vous pouvez convertir des fichiers .JPEG, .PNG ou .PDF (documents composés de plusieurs pages).
  • Taille des fichiers : elle ne doit pas dépasser 2 Mo.
  • Résolution : la hauteur du texte doit être d’au moins 10 pixels.
  • Orientation : les documents doivent être dans le bon sens. Si l’image n’est pas correctement orientée, faites-la pivoter avant de l’importer dans Google Drive.
  • Langues : Google Drive détecte la langue du document.
  • Police et jeu de caractères : pour obtenir de meilleurs résultats, utilisez des polices courantes telles qu’Arial ou Times New Roman.
  • Qualité de l’image : les images nettes avec une luminosité homogène et un bon contraste donnent les meilleurs résultats.

Convertir une image

  1. Sur votre ordinateur, accédez au site drive.google.com.
  2. Cliquez avec le bouton droit de la souris sur le fichier souhaité.
  3. Cliquez sur Ouvrir avec puis Google Docs.
  4. L’image est alors convertie en document Google, mais il se peut qu’une partie de la mise en forme ne soit pas répercutée dans le nouveau document.
    • Les contenus en gras ou en italique, la taille de police, le type de police et les sauts de ligne sont la plupart du temps conservés.
    • Les listes, les tableaux, les colonnes, les notes de bas de page et les notes de fin sont rarement détectés correctement.
360 Converter

360converter est un petit utilitaire en ligne gratuit qui permet de transcrire en texte des fichiers multimédia de toute sorte. Il s’agit d’une trousse à outils qui ne fera pas de miracles mais qui devrait bien vous aider si vous avez besoin de transcrire en texte un extrait de vidéo ou en enregistrement sonore. Petite cerise sur le gâteau, vous pourrez aussi extraire le texte présent dans une image.

360converter peut-être utilisée sans inscription préalable. Il suffit de se rendre sur la page d’accueil du service et de choisir le convertisseur adapté à votre besoin. Vous avez le choix entre six modules.

Si vous utilisez 360Converter sans vous inscrire les transcriptions sont limitées à une durée de 3 minutes maximum. La création d’un compte permet de lever cette limitation. Vous pouvez aussi opter pour un outil à installer directement sur votre machine. Ce logiciel plus rapide et plus efficace aussi est payant. Il faut compter une cinquantaine d’euros pour une licence.