Drukarki i skanery
Artykuł
Marcin Brzozowski, Czwartek, 4 listopada 2010, 14:15

Skanowanie i eksperymenty

Sama procedura skanowania jest bardzo prosta. Aby rozpocząć digitalizację dokumentu, ustawiamy skaner blisko krawędzi kartki, tak by skanowany materiał zmieścił się pomiędzy białymi strzałkami.

Naciskamy na ten sam przycisk, którym uruchomiliśmy skaner, ale tym razem krótko, i staramy się przesuwać równomiernie urządzeniem wzdłuż skanowanego materiału. Urządzenie samo rozpozna koniec czynności – wyłączy się po dłuższym postoju lub po oderwaniu skanera od powierzchni.

Jeżeli kolory wynikowego pliku JPEG są przekłamane, a komuś zależy na tym, aby były w miarę wierne, nie obejdzie się bez ustawienia balansu bieli. W tym celu na początku skanowanej strony kładziemy szary pasek dostarczony wraz ze skanerem i skanowanie zaczynamy właśnie od niego. Urządzenie będzie miało dzięki temu punkt odniesienia i zeskanuje kolory poprawnie.

Posługiwanie się tym media-techem wymaga wprawy. Oczywiście, nie pozwala osiągnąć jakości skanera płaskiego, wyposażonego w świetlówkę, ale na potrzeby nauki czy do zapisania ciekawego artykułu z czasopisma jakość MT4090 w zupełności wystarczy. Trzeba tylko umieć go obsłużyć.

Kliknij, żeby powiększyć

Po lewej – okładka zeskanowana modelem Scanline MT4090, po prawej – modelem Epson Stylus CX3200. Różnica w jakości jest widoczna na pierwszy rzut oka. Obraz z konstrukcji Media-Techa jest przekontrastowany i niezbyt ostry. Widać też, że skaner nie radzi sobie ze wszystkimi odcieniami.

Kliknij, żeby powiększyć

Powiększenie 1:1 ujawnia jeszcze większą różnicę.

Jeśli nie będzie się przesuwać skanera równomiernie, wynikowy obraz będzie miał przekłamania. Poniżej zobaczycie kilka przykładów „złych” skanów i dowiecie się, jak powstały błędy oraz w jaki sposób wpłynęły na działanie oprogramowania do rozpoznawania tekstu.

Częstochowski poseł jest z wykształcenia
polonistą, dzięki czemu umie układać peany
na cześć prezesa, co bywa źródłem zazdrości
partyjnych kolegów. Swój kunszt zaprezento-
wał w i >. ■ i 11. ■ | krasie |kk1czhk sejmowej debaty
nad expose Jarosława Kaczyńskiego. — Czy
zyska przychyl no Ac pana premiera pogląd, ze
przyczyni) hermci w litycznych kłopotów, u tym
samym niemożności zrozumienia pańskiego
przemówienia przez liderów opozycji, pozo-
staje fakt. iż nikt od z górą siedemdziesięciu lat
w randze premiera rządu i o charyzmie męża
stanu nie przemówi! w ten sposób do narodu
polskiego jak pan dzisiaj? - pytał. Siedem-
dziesiąt lat pojawiło się tu nieprzypadkowo,
bo zdaniem Giżyńskiego XX wiek miał trzech
wybitnych polityków. Józefa Piłsudskiego, gen
Franco i Jarosława Kaczyńskiego.

Jeśli przesunie się skaner za szybko, tekst ulegnie spłaszczeniu. Program OCR w takiej sytuacji zaczyna robić dużo błędów, które trzeba poprawić ręcznie.

Kliknij, żeby powiększyć

Jeśli skaner nie będzie przesuwany równolegle do krawędzi strony i nie będą co chwilę korygowane jego ustawienia, wynik może być tyleż zabawny, co trudny do odczytania.

Program OCR jest w stanie odczytać lekko pochylony tekst, ale gdy do pochylenia dochodzi rozciągnięcie, litery przestają być rozpoznawalne.

Próba zeskanowania monitora daje zaskakujący efekt.

Skanowanie grubszej, otwartej książki to nie lada wyzwanie, z którym zresztą nie poradzi sobie żaden skaner – strony w otwartej książce są zbyt dalekie od płaszczyzny. Żaden? Tutaj uwidacznia się przewaga MT4090 nad skanerami płaskimi: możemy nim przesunąć z lewa na prawo zamiast z góry na dół strony, a wtedy głowica cały czas pozostaje w kontakcie z płaszczyzną strony.

Jak wiadomo, skanery nie zawsze są używane zgodnie z przeznaczeniem, zwłaszcza w biurach :) Niestety, media-techem nie zrobicie sobie zdjęcia do paszportu, ale na facebokowy profil – czemu nie!

Oprogramowanie z innej bajki? Nie!

Wśród programów OCR prym wiedzie ABBYY FineReader. Po otwarciu opakowania skanera i ujrzeniu znajomego logo serca nam zamarły. „To niemożliwe” – pomyśleliśmy. I słusznie. Zamiast FineReadera, chociaż w wersji Sprint, Media-Tech dorzucił do urządzenia program ABBYY ScreenShot Reader. Szybki rzut oka na stronę ABBYY nie wyjaśnił wiele, za to zainstalowanie programu rozwiało wszelkie wątpliwości.

Screenshot Reader wyposażony jest w te same mechanizmy rozpoznawania tekstu co jego starsi bracia, ale wykorzystanie programu ograniczono do sczytywania wybranych obszarów ekranu. Innymi słowy, aby „zoceerować” uzyskany przez skaner plik JPEG, trzeba go otworzyć, uruchomić Screenshot Readera, zaznaczyć fragment ekranu, na którym widać tekst, i poczekać. Za chwilę rozpoznany tekst znajdzie się w schowku. Metoda jest nieco skomplikowana, ale podkreślamy: ten skaner służy do użytku okazjonalnego, a nie do digitalizacji książek na czas :) Co więcej, program jest na tyle mądrze napisany, że umie rozpoznać łamanie strony na szpalty. Jeśli więc skanujemy stronę z czasopisma, tekst zachowuje płynność.

Należy pamiętać, że skomplikowany proces rozpoznawania tekstu jest ceną, jaką płacimy za możliwość wykorzystania algorytmów ABBYY. Gdyby Media-Tech dorzucił pełnego FineReadera, cena skanera wzrosłaby znacznie. Gdyby w zestawie znalazła się wersja próbna, nikt nie byłby zadowolony.

Ocena artykułu:
Ocen: 6
Zaloguj się, by móc oceniać
Artykuły spokrewnione
Facebook
Ostatnio komentowane