<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
		>
<channel>
	<title>Commentaires sur : Xsane et tesseract, l&#8217;OCR qui marche très bien sous Linux</title>
	<atom:link href="http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/feed/" rel="self" type="application/rss+xml" />
	<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/</link>
	<description>DIY Lab</description>
	<lastBuildDate>Thu, 09 Feb 2012 09:36:10 +0000</lastBuildDate>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=</generator>
	<item>
		<title>Par : Lenadi</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-14316</link>
		<dc:creator>Lenadi</dc:creator>
		<pubDate>Sat, 02 Apr 2011 22:33:03 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-14316</guid>
		<description>J&#039;ai fait la même configuration de Xsane sous Mandriva après chargement banal de tesseract avec le gestionnaire de logiciel (graphique) et tout fonctionne à merveille.
J&#039;ai scanné un vieux livre jauni de 1920 avec des résultats tout à fait exploitables, et d&#039;autres scans sur des sorties d&#039;imprimante, qui ne nécessitent eux quasiment aucune retouche.
Vraiment très bien!
LM.</description>
		<content:encoded><![CDATA[<p>J&#8217;ai fait la même configuration de Xsane sous Mandriva après chargement banal de tesseract avec le gestionnaire de logiciel (graphique) et tout fonctionne à merveille.<br />
J&#8217;ai scanné un vieux livre jauni de 1920 avec des résultats tout à fait exploitables, et d&#8217;autres scans sur des sorties d&#8217;imprimante, qui ne nécessitent eux quasiment aucune retouche.<br />
Vraiment très bien!<br />
LM.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Ranger</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-14204</link>
		<dc:creator>Ranger</dc:creator>
		<pubDate>Sun, 13 Feb 2011 12:35:02 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-14204</guid>
		<description>Bonjour,
Pour Croa, en consultant le manuel &lt;code&gt; man tesseract &lt;/code&gt; on voit que la commande &lt;code&gt; tesseract inputfile.tif outputfile &lt;/code&gt; devrait suffire (tesseract rajoute le suffixe .txt sans que vous ayez besoin de préciser). Vous pouvez également préciser la langue (à condition d&#039;avoir téléchargé le fichier qui y correspond) avec, par exemple, &lt;code&gt; tesseract inputfile.tif outputfile -l fra &lt;/code&gt;
(Vous pouvez consulter le code complet du fichier laissé par Equinoxe ici http://www.equinoxefr.org/wp-content/uploads/2008/07/xsane2tess.pl en ouvrant le fichier avec un éditeur de texte. Mais en ce qui concerne tesseract seul, le code donné ci-dessus suffira!)</description>
		<content:encoded><![CDATA[<p>Bonjour,<br />
Pour Croa, en consultant le manuel <code> man tesseract </code> on voit que la commande <code> tesseract inputfile.tif outputfile </code> devrait suffire (tesseract rajoute le suffixe .txt sans que vous ayez besoin de préciser). Vous pouvez également préciser la langue (à condition d&#8217;avoir téléchargé le fichier qui y correspond) avec, par exemple, <code> tesseract inputfile.tif outputfile -l fra </code><br />
(Vous pouvez consulter le code complet du fichier laissé par Equinoxe ici <a href="http://www.equinoxefr.org/wp-content/uploads/2008/07/xsane2tess.pl" rel="nofollow">http://www.equinoxefr.org/wp-content/uploads/2008/07/xsane2tess.pl</a> en ouvrant le fichier avec un éditeur de texte. Mais en ce qui concerne tesseract seul, le code donné ci-dessus suffira!)</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Croa</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-14198</link>
		<dc:creator>Croa</dc:creator>
		<pubDate>Mon, 07 Feb 2011 17:10:30 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-14198</guid>
		<description>Bonjour,

Merci pour vos infos. Je vais essayer cet OCR.
Pouvez-vous donner des exemples d&#039;utilisation à partir d&#039;un fichier image (*.tif par exemple) car xsane ne sait évidemment pas faire (sans scanner branché il ne s&#039;ouvre même pas.) ?
Quels sont les types de fichiers image qui fonctionnent avec cette solution ?

S&#039;il vous plaît, donnez les détails (codes complets) car je ne suis pas spécialiste !

D&#039;avance MERCI !</description>
		<content:encoded><![CDATA[<p>Bonjour,</p>
<p>Merci pour vos infos. Je vais essayer cet OCR.<br />
Pouvez-vous donner des exemples d&#8217;utilisation à partir d&#8217;un fichier image (*.tif par exemple) car xsane ne sait évidemment pas faire (sans scanner branché il ne s&#8217;ouvre même pas.) ?<br />
Quels sont les types de fichiers image qui fonctionnent avec cette solution ?</p>
<p>S&#8217;il vous plaît, donnez les détails (codes complets) car je ne suis pas spécialiste !</p>
<p>D&#8217;avance MERCI !</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Ranger</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-13606</link>
		<dc:creator>Ranger</dc:creator>
		<pubDate>Fri, 05 Nov 2010 18:53:45 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-13606</guid>
		<description>Je reviens à la charge, pour confirmer, comme Dominique, que le fichier .pl fonctionne sous 10.10, en 300, 600 ou 1200 dpi. Merci, Equinoxe!</description>
		<content:encoded><![CDATA[<p>Je reviens à la charge, pour confirmer, comme Dominique, que le fichier .pl fonctionne sous 10.10, en 300, 600 ou 1200 dpi. Merci, Equinoxe!</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Ranger</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-13604</link>
		<dc:creator>Ranger</dc:creator>
		<pubDate>Fri, 05 Nov 2010 18:23:13 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-13604</guid>
		<description>J&#039;ai le même souci que Dominque: &lt;code&gt;Not a TIFF or MDI file, bad magic number 13136 (0x3350)&lt;/code&gt; le passage de 10.04 à 10.10 semble avoir détraqué le fonctionnement de xsane2tess. En revanche, tesseract fonctionne bien en ligne de commande, à partir d&#039;un fichier .tif : c&#039;est donc bien le script xsane2tess qui est en cause. Je l&#039;ai regardé, d&#039;un oeil peu expert, mais je ne vois rien a priori qui puisse poser problème. Toute aide sera la bienvenue!</description>
		<content:encoded><![CDATA[<p>J&#8217;ai le même souci que Dominque: <code>Not a TIFF or MDI file, bad magic number 13136 (0x3350)</code> le passage de 10.04 à 10.10 semble avoir détraqué le fonctionnement de xsane2tess. En revanche, tesseract fonctionne bien en ligne de commande, à partir d&#8217;un fichier .tif : c&#8217;est donc bien le script xsane2tess qui est en cause. Je l&#8217;ai regardé, d&#8217;un oeil peu expert, mais je ne vois rien a priori qui puisse poser problème. Toute aide sera la bienvenue!</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Dominique Meeùs</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-13446</link>
		<dc:creator>Dominique Meeùs</dc:creator>
		<pubDate>Sat, 23 Oct 2010 21:22:50 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-13446</guid>
		<description>J’avais toujours utilisé xsane2tess sans problème avec Ubuntu (en scannant en trait à 300 dpi). Ce soir, je découvre qu’il ne fonctionne plus. C&#039;est sans doute la première fois que j&#039;ai essayé depuis le passage à Ubuntu 10.10. Erreur (que je ne comprends pas assez pour avoir le courage d’essayer de corriger xsane2tess ou le reste) :
&lt;code&gt; /home/mic/tmp/xsane-conversion-plustek:libusb:002:002.tif: Not a TIFF or MDI file, bad magic number 13136 (0x3350).
tesseract:Error:Read of file failed:/home/mic/tmp/xsane-conversion-plustek:libusb:002:002.tif
/usr/bin/xsane2tess: line 78:  4799 Erreur de segmentation  tesseract &quot;$TIF_FILE&quot; &quot;$TXT_FILE&quot; -l &quot;$TES_LANG&quot; 1&gt;&amp;2
cat: /home/mic/tmp/xsane-conversion-plustek:libusb:002:002.txt: Aucun fichier ou dossier de ce type
rm: ne peut enlever `/home/mic/tmp/xsane-conversion-plustek:libusb:002:002.txt&#039;: Aucun fichier ou dossier de ce type&lt;/code&gt;
Par contre, ça marche avec xsane2tess.pl en gris à 300 dpi. Le script écrit le log dans /tmp par défaut. Il n’est donc pas indispensable de l’écrire dans la commande.</description>
		<content:encoded><![CDATA[<p>J’avais toujours utilisé xsane2tess sans problème avec Ubuntu (en scannant en trait à 300 dpi). Ce soir, je découvre qu’il ne fonctionne plus. C&#8217;est sans doute la première fois que j&#8217;ai essayé depuis le passage à Ubuntu 10.10. Erreur (que je ne comprends pas assez pour avoir le courage d’essayer de corriger xsane2tess ou le reste) :<br />
<code> /home/mic/tmp/xsane-conversion-plustek:libusb:002:002.tif: Not a TIFF or MDI file, bad magic number 13136 (0x3350).<br />
tesseract:Error:Read of file failed:/home/mic/tmp/xsane-conversion-plustek:libusb:002:002.tif<br />
/usr/bin/xsane2tess: line 78:  4799 Erreur de segmentation  tesseract "$TIF_FILE" "$TXT_FILE" -l "$TES_LANG" 1&gt;&amp;2<br />
cat: /home/mic/tmp/xsane-conversion-plustek:libusb:002:002.txt: Aucun fichier ou dossier de ce type<br />
rm: ne peut enlever `/home/mic/tmp/xsane-conversion-plustek:libusb:002:002.txt': Aucun fichier ou dossier de ce type</code><br />
Par contre, ça marche avec xsane2tess.pl en gris à 300 dpi. Le script écrit le log dans /tmp par défaut. Il n’est donc pas indispensable de l’écrire dans la commande.</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : cmm</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-12801</link>
		<dc:creator>cmm</dc:creator>
		<pubDate>Mon, 19 Jul 2010 09:17:14 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-12801</guid>
		<description>Merci beaucoup, je viens de tester l&#039;installation faite selon vos indications
sur mon ordinateur sous debian stable.
J&#039;ai utilisé les paquets tesseract-ocr et tesseract-ocr-fra des dépôts debian.
çà marche très bien!

cmm</description>
		<content:encoded><![CDATA[<p>Merci beaucoup, je viens de tester l&#8217;installation faite selon vos indications<br />
sur mon ordinateur sous debian stable.<br />
J&#8217;ai utilisé les paquets tesseract-ocr et tesseract-ocr-fra des dépôts debian.<br />
çà marche très bien!</p>
<p>cmm</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Veralinux</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-12588</link>
		<dc:creator>Veralinux</dc:creator>
		<pubDate>Wed, 09 Jun 2010 17:52:16 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-12588</guid>
		<description>Magnifique OCR réalisée sous Ubuntu 10.04.
Une seule faute relevée sur 21 lignes de texte ( &quot;partemires&quot; au lieu de &quot;partenaires&quot; ) mais, précision, cette ligne est écrite en bleu marine.

Grand MERCI pour ce tuto
@lain</description>
		<content:encoded><![CDATA[<p>Magnifique OCR réalisée sous Ubuntu 10.04.<br />
Une seule faute relevée sur 21 lignes de texte ( &laquo;&nbsp;partemires&nbsp;&raquo; au lieu de &laquo;&nbsp;partenaires&nbsp;&raquo; ) mais, précision, cette ligne est écrite en bleu marine.</p>
<p>Grand MERCI pour ce tuto<br />
@lain</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : JF</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-8400</link>
		<dc:creator>JF</dc:creator>
		<pubDate>Sun, 19 Jul 2009 10:01:12 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-8400</guid>
		<description>Salut, merci mille fois pour le tuyau et le script :)

Bonne continuation</description>
		<content:encoded><![CDATA[<p>Salut, merci mille fois pour le tuyau et le script <img src='http://www.equinoxefr.org/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>Bonne continuation</p>
]]></content:encoded>
	</item>
	<item>
		<title>Par : Sorbus</title>
		<link>http://www.equinoxefr.org/post/2008/07/05/xsane-et-tesseract-locr-qui-marche-tres-bien-sous-linux/comment-page-1/#comment-5272</link>
		<dc:creator>Sorbus</dc:creator>
		<pubDate>Wed, 15 Apr 2009 19:59:40 +0000</pubDate>
		<guid isPermaLink="false">http://www.equinoxefr.org/?p=119#comment-5272</guid>
		<description>Salut EquinoxeFR,

Ici Sorbus, du forum (et de la doc) Ubuntu. Merci pour ce tuto qui complète la diffusion de bonnes infos au sujet de l&#039;OCR sous Linux.

Ce petit message pour plusieurs choses :

- nous avons remarqué, sur le forum Ubuntu, qu&#039;une espace mal placée dans la configuration de xsane (avant le &quot;-i&quot;, ou après le &quot;-l fra&quot; empêche le fonctionnement correct de xsane2tess.
cf. ici : http://forum.ubuntu-fr.org/viewtopic.php?pid=2535312#p2535312

- quel problème avais-tu rencontré avec le script xsane2tess de la doc Ubuntu ? (n&#039;était-ce pas aussi ce problème d&#039;espace ?)

- quelles sont les modifs de ton fichier xsane2tess.pl par rapport au script xsane2tess de la doc Ubuntu ? (je vois que la commande OCR indiquée dans la configuration de xsane comporte en plus un &quot;-log&quot; et un chemin commençant par le répertoire tmp.)

En OCR, sous Linux, il nous faudrait maintenant commencer à tester Ocropus... Que les premiers qui testeront tiennent au courant les autres ;)

A bientôt !</description>
		<content:encoded><![CDATA[<p>Salut EquinoxeFR,</p>
<p>Ici Sorbus, du forum (et de la doc) Ubuntu. Merci pour ce tuto qui complète la diffusion de bonnes infos au sujet de l&#8217;OCR sous Linux.</p>
<p>Ce petit message pour plusieurs choses :</p>
<p>- nous avons remarqué, sur le forum Ubuntu, qu&#8217;une espace mal placée dans la configuration de xsane (avant le &laquo;&nbsp;-i&nbsp;&raquo;, ou après le &laquo;&nbsp;-l fra&nbsp;&raquo; empêche le fonctionnement correct de xsane2tess.<br />
cf. ici : <a href="http://forum.ubuntu-fr.org/viewtopic.php?pid=2535312#p2535312" rel="nofollow">http://forum.ubuntu-fr.org/viewtopic.php?pid=2535312#p2535312</a></p>
<p>- quel problème avais-tu rencontré avec le script xsane2tess de la doc Ubuntu ? (n&#8217;était-ce pas aussi ce problème d&#8217;espace ?)</p>
<p>- quelles sont les modifs de ton fichier xsane2tess.pl par rapport au script xsane2tess de la doc Ubuntu ? (je vois que la commande OCR indiquée dans la configuration de xsane comporte en plus un &laquo;&nbsp;-log&nbsp;&raquo; et un chemin commençant par le répertoire tmp.)</p>
<p>En OCR, sous Linux, il nous faudrait maintenant commencer à tester Ocropus&#8230; Que les premiers qui testeront tiennent au courant les autres <img src='http://www.equinoxefr.org/wp-includes/images/smilies/icon_wink.gif' alt=';)' class='wp-smiley' /> </p>
<p>A bientôt !</p>
]]></content:encoded>
	</item>
</channel>
</rss>

