MacNOMODO

Où on cause du Mac - A consommer sans modération

 
PortailPortailAccueilRechercherRechercherFAQS'enregistrerMembresConnexion

Partagez | 
 

 Aperçu fait de la reconnaissance de caractère ?

Voir le sujet précédent Voir le sujet suivant Aller en bas 
AuteurMessage
hr
Légende vivante
Légende vivante


Nombre de messages : 6308
Age : 62
Planète : Creuse
Matos : iMac alu en OS 10.10 - G4 en OS 10.5 - MacBook Pro (90% en Ubuntu, 10% en OS X 10.6) - PC en Ubuntu 16.04
Date d'inscription : 19/11/2006

MessageSujet: Aperçu fait de la reconnaissance de caractère ?    8/21/2015, 21:08

Circonspect je suis perplexe.

J’ai reçu par mail un PDF contenant une page imprimée, annotée à la main puis scannée et convertie en PDF.
Aucun doute, c’est bien l’image d’une feuille de papier scannée incluse dans un PDF comme le montrent les petites taches par-ci par-là et de nombreuses annotations au crayon. Le contenu est aussi très légèrement de travers.

Moi, bêtement, par automatisme, je sélectionne une ligne, pomme-C puis pomme-V dans un document et c’est bon, j’ai ma copie de ligne. Et c’est là que je me rends compte de ce que j’ai fait…
T'es sûr !?
J’ai copié l’image d’un texte et j’ai eu le texte, comme si Aperçu faisait de la reconnaissance de caractère… La sélection s’est faite avec le pointeur de souris comme lors de la sélection dans un traitement de texte ce que j’aurais déjà dû trouver louche.

J’ai fait un essai avec deux nombres 450 qui étaient légèrement biffés d’un coup de crayon : j’ai pu copier mais j’ai obtenu §O-l)Ef sur un échantillon et 45O-i)O le trait de crayon étant plus costaud sur le premier et léger sur le second. Ce qui veut dire que c’est bien Aperçu qui a reconnu qu’il s’agissait de caractères, cette fois en se trompant mais ce n’est pas si mal pour un nombre barré. Le texte n’est donc pas inclus dans le PDF sous forme de texte et la ligne que j’ai recopiée a forcément dû être reconnue, et parfaitement en plus puisqu’elle était propre, sans trace de crayon, dans l’image.

J’ai essayé de faire le même coup dans d’autres documents images mais ça ne donne rien. J’ai converti ces images en PDF, rien. Ça dépend peut-être de la police, je ne sais pas. Ou de la qualité du scannage ? Les autres n’avaient pas l’air mal pourtant.

Rien trouvé dans l’aide d’Aperçu.

Ça vous paraît normal ? C’est effectivement une fonction incluse dans Aperçu ?

_______________
On ne fait jamais d’erreur sans se tromper !
L’affaire est dans le sac de Prévert et Prévert
Revenir en haut Aller en bas
TG
Légende vivante
Légende vivante


Nombre de messages : 5477
Age : 53
Planète : Paradis n°2
Matos : MacBook Pro Unibody 2.54 late 2008 Mountain Lion • MacPlus • PIXMA iP4300 • Scanner Epson Photo 330
Date d'inscription : 12/11/2006

MessageSujet: Re: Aperçu fait de la reconnaissance de caractère ?    8/22/2015, 06:36

As-tu essayé avec un autre reader, notamment AR ?

Je pense, en réalité, que le document contient déjà le résultat d'une passe OCR.
En effet, certains outils de numérisation, dont Adobe Acrobat, savent faire de l'OCR sur les documents scannés qu'on leur confie avant de les enregistrer en PDF.

Demande à ton expéditeur quels outils il utilise.

_______________
[MacJams] [RouteBuddy] [Winckler] [Panoramio] [ePhotos]
Revenir en haut Aller en bas
http://www.panoramio.com/user/616684
hr
Légende vivante
Légende vivante


Nombre de messages : 6308
Age : 62
Planète : Creuse
Matos : iMac alu en OS 10.10 - G4 en OS 10.5 - MacBook Pro (90% en Ubuntu, 10% en OS X 10.6) - PC en Ubuntu 16.04
Date d'inscription : 19/11/2006

MessageSujet: Re: Aperçu fait de la reconnaissance de caractère ?    8/22/2015, 10:01

TG a écrit:
As-tu essayé avec un autre reader, notamment AR ?

Je pense, en réalité, que le document contient déjà le résultat d'une passe OCR.

Bonne idée, en effet Reader fait la même chose et les erreurs dues aux coups de crayon donnent les mêmes résultats. Ça semble bien être des données contenues dans le document.
Du coup j’ai essayé dans Evince qui est l’équivalent d’Aperçu dans Ubuntu et c’est encore pareil, même résultats.

TG a écrit:
En effet, certains outils de numérisation, dont Adobe Acrobat, savent faire de l'OCR sur les documents scannés qu'on leur confie avant de les enregistrer en PDF.

Dans le cas d’un tableau de chiffres comme c’est le cas dans ce document, c’est drôlement pratique. Toutes les parties suffisamment propres de la page sont disponibles pour faire des copier/coller dans un tableur, ce qui était le but de ma manip.

TG a écrit:
Demande à ton expéditeur quels outils il utilise.
Oh la la, ça je ne peux pas, elle est comptable dans une agence immobilière avec laquelle nous étions en conflit jusqu’à il y a quelques jours, le document en question clôturant enfin une très vieille affaire… De toute façon je pense que cette dame se sert des outils informatiques sans avoir la moindre idée technique sur la question. Genre grosse imprimante/photocopieur en réseau, tu mets la liasse dans la machine et tu retrouves tout sur ton PC, le reste est un mystère dont la seule chose claire est que quand ça ne marche pas, on appelle le numéro écrit sur le postit collé sur la machine.

_______________
On ne fait jamais d’erreur sans se tromper !
L’affaire est dans le sac de Prévert et Prévert
Revenir en haut Aller en bas
TG
Légende vivante
Légende vivante


Nombre de messages : 5477
Age : 53
Planète : Paradis n°2
Matos : MacBook Pro Unibody 2.54 late 2008 Mountain Lion • MacPlus • PIXMA iP4300 • Scanner Epson Photo 330
Date d'inscription : 12/11/2006

MessageSujet: Re: Aperçu fait de la reconnaissance de caractère ?    8/22/2015, 16:49

Regarde alors dans les propriétés du document.
On y trouve souvent des traces intéressantes.

_______________
[MacJams] [RouteBuddy] [Winckler] [Panoramio] [ePhotos]
Revenir en haut Aller en bas
http://www.panoramio.com/user/616684
hr
Légende vivante
Légende vivante


Nombre de messages : 6308
Age : 62
Planète : Creuse
Matos : iMac alu en OS 10.10 - G4 en OS 10.5 - MacBook Pro (90% en Ubuntu, 10% en OS X 10.6) - PC en Ubuntu 16.04
Date d'inscription : 19/11/2006

MessageSujet: Re: Aperçu fait de la reconnaissance de caractère ?    8/22/2015, 20:26

Pas grand chose, justement. Je pensais aussi pouvoir repérer quelque chose mais non, rien de significatif, même pas l’appli qui a créé le pdf :



Bon, ce n’est pas grave, on explique tout de même comment c’est possible. En résumé, l’appli ayant créée le fichier a placé dans l’image des champs de texte générés par OCR et on peut les copier. Ces champs doivent être invisibles mais sélectionnables et voilà tout. Dit comme ça, ça a l’air beaucoup moins étrange !
Encore une chose à retenir.

_______________
On ne fait jamais d’erreur sans se tromper !
L’affaire est dans le sac de Prévert et Prévert
Revenir en haut Aller en bas
Contenu sponsorisé




MessageSujet: Re: Aperçu fait de la reconnaissance de caractère ?    

Revenir en haut Aller en bas
 
Aperçu fait de la reconnaissance de caractère ?
Voir le sujet précédent Voir le sujet suivant Revenir en haut 
Page 1 sur 1

Permission de ce forum:Vous ne pouvez pas répondre aux sujets dans ce forum
MacNOMODO :: A i d e  &  d é p a n n a g e :: Aspects logiciels-
Sauter vers: