Szkenneléstől a kész pdf fájlig

Nov. 21

Rengeteg rossz minőségű szkennelt könyvvet találni az interneten. Ha rászánjuk magunkat egy könyv feldolgozására, legyünk igényesek, igyekezzünk a legjobbat kihozni belőle.

Egy könyv digitalizálása nem csak arról szól, hogy valamilyen módon digitális képekké alakítjuk. A beolvasás során a lapok elfordulnak, a margók eltolódnak, a soregyenek elcsúsznak. Ezeket korrigálni kell! Ha igényes dokumentumot szeretnénk kiadni a kezünkből, akkor az oldalcimkéket és a tartalomjegyzéket is rendbe kell tennünk. Későbbi nyomtatás szempontjából kényelmes, ha szabványos papírméretre nagyítjuk.

A feldolgozáshoz szükségünk lesz a scantailor programra. A képeket a pdfbeads segítségével alakítjuk pdf fájllá. Végül a latex segítségével létrehozzuk az oldalcimkéket és a tartalomjegyzéket is. Ehhez a pdfpages és hyperref csomagokra lesz szükségünk.

Beolvasás

  • Ha lehetőségünk van könyvszkenner használatára, mindenkép érdemes azzal dolgozni. Én egy OptiBook 3600 készüléket használok erre a célra.
  • Az oldalakat különálló képként mentsük el.
  • Lehetőleg veszteségmentes formátumot használjunk. Például png-t.
  • 300 dpi tökéletes. A kisebb felbontás kevés, a nagyobb pedig fölösleges.

Oldalak igazítása

A képfájlokat töltsük be a scantailor programba. Ezzel elvégezhetjük a méretre vágást, a margók igazítását, automatikusan korrigálja a ferdén beolvasott oldalakat, stb.

Összefűzés egy pdf fájlba

A scantailor által legyártott .tif fájlokat

pdfbeads *.tif > all.pdf

Papírméret, lapcimkék, tartalomjegyzék

A következő példában a könyvet A4-es méretűre alakítjuk, és tartalomjegyzék bejegyzésekkel látjuk el. A könyv a borítókat és a fülszövegeket is tartalmazza. Az oldalak számozása a 3. oldalon kezdődik, római számokkal 1-től indulva, majd a 11. oldaon arab számokkal folytatódik a számozás 1-től kezdődően, majd végül a függelék oldalait az ABC betűivel jelöljük.

\documentclass[a4paper]{article}
\usepackage[utf8]{inputenc}
\usepackage{t1enc}
\usepackage{pdfpages}
\usepackage[pdfpagelabels,unicode]{hyperref}
\begin{document}

\renewcommand{\thepage}{Első borító}
\includepdf[pages=1]{all.pdf}

\renewcommand{\thepage}{Első fülszöveg}
\includepdf[pages=2]{all.pdf}

\renewcommand{\thepage}{\roman{page}}
\setcounter{page}{1}
\includepdf[pages=3-10,
            addtotoc={8,subsection,2,Tartalomjegyzék,x0}
           ]{all.pdf}

\renewcommand{\thepage}{\arabic{page}}
\setcounter{page}{1}
\includepdf[pages=11-64,
            addtotoc={
               11,subsection,2,Bevezetés,x1,
               16,section,1,Első fejezet,x2,
               31,subsection,2,Első szakasz,x3,
               35,subsection,2,Második szakasz,x4,
               43,subsection,2,Harmadik szakasz,x5,
               50,section,1,Második fejezet,x6
            }
           ]{all.pdf}

\renewcommand{\thepage}{\Alph{page}}
\setcounter{page}{1}
\includepdf[pages=65-72,
            addtoc={65,section,1,Függelék,x7}
           ]{all.pdf}

\renewcommand{\thepage}{Hátsó fülszöveg}
\includepdf[pages=73]{all.pdf}

\renewcommand{\thepage}{Hátsó borító}
\includepdf[pages=74]{all.pdf}

\end{document}

Következő bejegyzés Előző bejegyzés