Xsane et tesseract, l’OCR qui marche très bien sous Linux

Voici comment utiliser l’OCR (reconnaissance de caractères) avec Xsane sous Ubuntu hardy.

Il faut tout d’abord installer Xsane, imagemagick (avec synaptic ou apt-get) et tesseract. Pour installer ce dernier, il faut utiliser le tutoriel situé ici. Faites bien attention à suivre le tutoriel « Par les deb de « b52″ (32 et 64 bits) ».

Afin d’interfacer Xsane et tesseract, il faut un script. J’en ai trouvé un nommé xsane2tess mais il ne fonctionne pas chez moi. J’en ai donc créé un autre que vous pouvez installer comme ceci:

[code lang= »bash »]

cd /usr/bin

sudo wget https://www.equinoxefr.org/wp-content/uploads/2008/07/xsane2tess.pl

sudo chmod +x xsane2tess.pl

[/code]

Ensuite lancez Xsane et allez dans Préférence / Configuration (ALT+s) pour entrer les options suivantes

Xsane

Après avoir validé les bonnes options, il faut mettre les paramètres Sane comme suit:

Xsane

  1. Mode enregistrer
  2. Nom de fichier sans extension
  3. Type de fichier TXT
  4. Mode de scan: GRIS
  5. Résolution: 300 dpi donne de bons résultats
  6. Sélectionnez la zone de texte
  7. La sélection
  8. Effectuez une rotation si nécessaire
  9. Lancez le scan

Voilà, vous avez maintenant un beau fichier TXT qu’il vous faudra vérifier avec openoffice et son correcteur d’orthographe par exemple.

Les résultat sont assez étonnants, j’avais essayé GOCR il y a quelques temps mais j’en étais très déçu. Là, il y a avec tesseract, une véritable alternative aux outils propriétaires.

Bonne OCR 😉

Ubuntu, 3G et Nokia N95 avec Orange

Voici comment connecter très facilement un PC Linux ( Ubuntu 8.04 sur eeepc ) à internet avec un téléphone 3G.

nokia n95

J’ai un nokia N95 qui est parfaitement supporté sur Ubuntu. Pour se connecter, j’utilise le cable USB, mon EEEPC n’ayant pas de bluetooth. Lors du branchement du téléphone, il faut sélectionner le mode

PC SUITE sur NOKIA. Sous Linux, un petit dmesg nous en dit plus:

[code]

[   65.528724] usb 2-1: new full speed USB device using uhci_hcd and address 2
[   65.545353] usb 2-1: configuration #1 chosen from 1 choice
[   67.050935] cdc_acm 2-1:1.10: ttyACM0: USB ACM device
[   67.060398] usbcore: registered new interface driver cdc_acm
[   67.060858] /home/adamm/git/ubuntu-hardy/debian/build/custom-source-eeepc/drivers/usb/class/cdc-acm.c: v0.25:USB Abstract Control Model driver for USB modems and ISDN adapters
[   67.094186] usbcore: registered new interface driver cdc_ether
[   67.104548] usb 2-1: bad CDC descriptors
[   67.104988] usbcore: registered new interface driver rndis_host

[/code]

Pour établir la connexion, nous avons besoin de wvdial.

[code]

sudo apt-get install wvdial

[/code]

Ensuite, pour le paramétrer, créez le fichier /etc/wvdial.conf contenant ceci:

[code]

[Dialer Defaults]
Modem = /dev/ttyACM0
Baud = 460800
Init1 = ATZ
Init2 = ATQ0 V1 E1 S0=0 &C1 &D2 +FCLASS=0
Init5 = AT+CGDCONT=1, »IP », »orange »;
ISDN = 0
Modem Type = Analog Modem
Phone = *99***1#
username = orange
password = orange
Stupid Mode = 1

[/code]

Pour établir le lien, branchez le téléphone puis tapez

[code]

sudo wvdial

[/code]

et hop à vous internet mobile.

Je précise que j’ai un abonnement Orange et que ça marche sans surfacturation (Internet Max). Le même principe marche chez SFR (en modifiant le useragent du navigateur) et Bouygues. S’il n’y a pas d’abus avec ces connexions, il n’y a pas vraiment de raison que les opérateurs verrouillent le système.

« FullCircle Magazine », le mag des utilisateurs d’Ubuntu

Pour ceux qui ne connaissent pas, il existe un petit magazine gratuit, appelé « FullCircle Magazine », dédié à notre distribution Ubuntu. Le numéro 14 vient de sortir.

Ubuntu fullcircle magazine

Les différents numéros sortent régulièrement en anglais puis sont traduits en différentes langues dont le français dans les semaines suivant la sortie.

Je vous invite à le lire, les articles sont pas mal du tout.

Pour ceux qui ont du retard, voilà un petit script permettant de récupérer les numéros 5 à 14 en anglais.

mkdir fullcircle ; cd fullcircle ;  for i in 5 6 7 8 9 10 11 12 13 14  ; do  wget http://dl.fullcirclemagazine.org/issue${i}_en.pdf ; done

Bonne lecture.

Framabook ou le « livre libre »

Le site framabook

Pour ceux qui ne connaissent pas, le site Framabook regroupe des livres libres. Ils sont librement téléchargeables en PDF, ou achetables pour environ 15 €.

Cette initiative, montre que le libre ne s’applique pas qu’aux logiciels. Les ouvrages présentés sont d’excellente qualité, vous pouvez par exemple trouver un livre sur la migration d’office à openoffice ou un livre sur l’utilisation d’Ubuntu.

Bonne lecture 🙂

Logo FramaBook