Online időszaki kiadványok megőrzése az OSZK Webarchívumában és az EPA-ban

Online időszaki kiadványok megőrzése az OSZK Webarchívumában és az EPA-ban Online időszaki kiadványok megőrzése az OSZK Webarchívumában és az EPA-ban
Ipacs Eszter
epa-info@mek.oszk.hu
OSZK -Információ-és Tartalomszolgáltatási Főosztály,
Digitálistartalom-fejlesztési és -szolgáltatási Osztálya
Elektronikus Periodika Archívum és Adatbázis
Az Elektronikus Periodika Archívum és Adatbázis a Magyar Elektronikus Könyvtár kezdeményezése, mely a magyar vonatkozású elektronikus időszaki kiadványok könyvtári igényű nyilvántartására, illetve egyes folyóiratok archiválására irányul. A szolgáltatás célja, hogy létre jöjjön és minél tovább rendelkezésre álljon az elektronikus időszaki kiadványok szervezett, több szempontból visszakereshető katalógusa, illetve hogy minél több digitális periodika juthasson stabil hozzáférésű megjelenési módhoz és szakmai támogatáshoz; a felhasználók pedig minél könnyebben tájékozódjanak az e-periodikumok világában.
https://epa.oszk.hu
Elektronikus Periodika Archívum és Adatbázis
Visszamenőlegesen digitalizált anyagok
- Archiválás
- Megőrzés
- Szolgáltatás
Jellemzően a régi digitalizált anyagok, OSZK-s és külső forrásokból is gyarapodó állományrész
Online tartalmak
- Feltérképezés
- Nyilvántartás
- Archiválás
- Megőrzés
- Szolgáltatás
Jellemzően a kurrensen megjelenő online tartalmak, külső forrásokból, együttműködési megállapodás után kerülnek archiválásra
EPA - nyitólap
https://epa.oszk.hu
EPA - kiadványoldal
https://epa.oszk.hu/04100/04139/
EPA - kardexoldal
https://epa.oszk.hu/html/vgi/kardexlap.phtml?id=4139
EPA - tartalomjegyzékhttps://epa.oszk.hu/04100/04139/00073/pdf/
Dokumentumok szolgáltatási előkészítése 1.
A PDF egyben kerül az adatbázisba
Felhasznált programok:
Total Commander
Adobe Acrobat
Notepad++
Arachnophilia
excel táblázatok
Fine Reader
Programok elérése:
- https://www.ghisler.com/download.htm
- https://acrobat.adobe.com/
- https://notepad-plus-plus.org/downloads/
- https://arachnoid.com/arachnophilia/
- https://ocrszoftver.hu/
Dokumentumok szolgáltatási előkészítése 2.
A PDF-et szeleteljük és tartalomjegyzék készül hozzá
Felhasznált programok:az előbb felsoroltak mellett:
A-PDF Split
XML Copy Editor
Programok elérése:
- http://www.a-pdf.com/split/
- https://xml-copy-editor.sourceforge.io/
Dokumentumok csoportos átnevezése
Total Commander
A letöltött PDF-ek elnevezése sokféle lehet, ezért érdemes a munka elkezdése előtt egységes elnevezést kialakítani. Total Commander programban lehetőség van a név elemeinek, a számozásnak, vagy ezek egy-egy elemének cseréjére.
[N] az eredeti elnevezés,ebben az esetben pedig "Keresés-cserével" távolítjuk el a név felesleges elemeit és cseréljük ki a megfelelőre.
Fájlméret csökkentése
FineReader 14
A feldolgozás alatt álló fájlok méretcsökkentésének egyik lehetőségét a FR kínálja.
A program különösebb külső beavatkozás nélkül vizsgálja és csökkenti a fájlméretet.
Ehhez a PDF fájlt első lépésben megnyitjuk.
Fájlméret csökkentése
FineReader 14
Ezután kiválasztjuk a fájlméret csökkentését
Fájlméret csökkentése
FineReader 14
A felajánlott lehetőségek közül kiválasztjuk a "tömör méret"-et és a nyelvet értelemszerűen, majd mehet a feldolgozás az "alkalmaz" gomb megnyomásával.
Fájlméret csökkentése
FineReader 14
A csökkentési folyamat ideje a fájl méretétől függ. A feldolgozás folyamata a képernyőn figyelemmel kísérhető.
Fájlméret csökkentése
FineReader 14
A feldolgozási folyamat végén a létrejövő új fájlt PDF formátumban elmentjük. Innentől ezzel a méretében már megfelelő fájllal dolgozhatunk.
Metaadatok PDF-be helyezése - batch fájlok
Ha nem 1-2 folyóiratszám metaadatait kell megadnunk, hanem 50-100, akár még több számnak kell kitölteni az adatait, akkor segítségünkre lehetnek az előre meghatározott paraméterekkel dolgozó batch fájlok.
https://epa.oszk.hu/html/irattar/EPA_index_htm_feldolg_tutorial.pdf
Dokumentum metaadatainak megadása Adobe Acrobat
Ha csak 1-2 frissen beérkezett folyóirat metaadatait kell elhelyeznünk a PDF-ben, akkor az történhet kézzel. A batch a tömeges feldolgozás remek eszköze, kevesebb részegység esetén manuálisan is gyorsan megadhatóak a metaadatok.
CTRL-D billentyűkombináció
vagy
Fájl -tulajdonságok
Dokumentum metaadatainak megadása Adobe Acrobat
Amennyiben elmulasztjuk a tulajdonságok kitöltését a szeletelés előtt, vagy később kiegészítenénk még további adatokkal akkor lehetőség van az ún. kötegelt feldolgozásra.
Speciális - dokumentum feldolgozás - kötegelt feldolgozás
Dokumentum szeletelése A-PDF Split
A PDF fájl darabokra bontásához, szeleteléséhez több programot is használhatunk.
Munkánk során mi az A-PDF Split programot használjuk. Ez képes az összes oldal kibontásra, képes a könyvjelzők mentén szétszedni az anyagot és alkalmas arra is hogy kézzel megadjuk a szeletek oldaltulajdonságait.
Kimeneti elnevezésekben is változatos lehetőségeket kínál.
Dokumentum szeletelése A-PDF Split
Amikor megadtuk a szeletelni kívánt fájlt akkor van lehetőségünk kiválasztani, hogy milyen módon bontsa egységekre a PDFet a program.
A később elkészülő tartalomjegyzék XML fájl miatt érdemes a haladó módot választani.
Dokumentum szeletelése A-PDF Split
Az első sorban a PDF fizikai oldalszámait kell megadni (tól-ig, vagy vesszővel elválasztva)
A második sorban a cikkek valódi oldalszámát kell megadni, tizedesjegyre kerekítve. Ezt a számozást használjuk majd a szeletek elnevezésénél és ez kerül be tartalomjegyzék mezőjébe is.
Dokumentum szeletelése A-PDF Split
A szeletek számát a PDF oldalainak száma és a feldolgozás mélysége adja. Ha a PDF végére értünk akkor "ok" és "split"
A program létrehozza a kívánt szeleteket abba a mappába ahol az eredeti dokumentum van.
Fájlok átnevezése Total Commander
A létrejövő szelet-fájloknak ahogy említettem a neve kialakul a szeletelés során. Ahhoz, hogy a rendszerben egységesen kezeljük és egyértelműen megadjuk melyik dokumentum részegységei szükség van a fájlok átnevezésére.
Csoportos átnevezés vagy CTRL-M billentyűkombináció
Tartalomjegyzék szerkesztés
XML Copy Editor
Az XML Copy Editor egy ingyenes XML szerkesztő program. Meglehetősen felhasználóbarát, jól az igényeinkre szabható. Az EPA tartalomjegyzékei ebben készülnek.
Más szerkesztőkhöz hasonlóan működik, az EPÁban egy üres struktúrát szoktunk kialakítani, és aztán ezt az adott folyóiratra szabjuk.
Tartalomjegyzék szerkesztés
XML Copy Editor
Az XML Copy Editor egy ingyenes XML szerkesztő program. Meglehetősen felhasználóbarát, jól az igényeinkre szabható. Az EPA tartalomjegyzékei ebben készülnek.
Más szerkesztőkhöz hasonlóan működik, az EPÁban egy üres struktúrát szoktunk kialakítani, és aztán ezt az adott folyóiratra szabjuk.
Tartalomjegyzék szerkesztés
XML Copy Editor
A kezdő tagben adjuk meg a szerkezetleíró fájlt, az határozza meg EPA tartalomjegyzékek stílusadatait
http://mek.oszk.hu/mekdtd/epax/epax.xsd
A tartalomjegyzék "head" részébe kerülnek a kiadvány részegységének pontos adatai, cím, számozás, az EPA mappastruktúrában lévő helye és mappája
Ezután következik a "content", a cikkek listája, az első a nyelvi kód, aztán a cikk pontos PDF neve, a cikk közreműködőjének/közreműködőinek neve, a cikk címe, végül az oldalszám
Tartalomjegyzék szerkesztés
XML Copy Editor
A kezdő tagben adjuk meg a szerkezetleíró fájlt, az határozza meg EPA tartalomjegyzékek stílusadatait
http://mek.oszk.hu/mekdtd/epax/epax.xsd
A tartalomjegyzék "head" részébe kerülnek a kiadvány részegységének pontos adatai, cím, számozás, az EPA mappastruktúrában lévő helye és mappája
Ezután következik a "content", a cikkek listája, az első a nyelvi kód, aztán a cikk pontos PDF neve, a cikk közreműködőjének / közreműködőinek neve, a cikk címe, végül az oldalszám
Tartalomjegyzék szerkesztés
XML Copy Editor
A tartalomjegyzék készülhet szeletelés után, de letölthetünk anyagot cikkekként is az internetről.
Ha rendelkezésünkre áll egy kiinduló PDF fájl, amin a szeletelést is elvégeztük akkor ezt a fájlt itt is elérhetővé tesszük az olvasók számára.
Így az egyes cikkek külön-külön, de az egész szám egyben is letölthető lesz.
Tartalomjegyzék feltöltése
EPAX
Az elkészült XML fájlt egy saját fejlesztésű program alakítja át HTML-é, teszi alkalmassá az EPÁban való megjelenítésre. De az elkészült XML lényege, hogy strukturált szövegű visszakereshetőséget tesz lehetővé.
Tartalomjegyzék az EPÁban HTML és XML változatban
Köszönöm a figyelmet!
http://www.oszk.hu
https://epa.oszk.hu magyar