Rozdíly
Zde můžete vidět rozdíly mezi vybranou verzí a aktuální verzí dané stránky.
Obě strany předchozí revize Předchozí verze | |||
znalostni_baze:archivni_formaty [2023/11/24 14:02] – odstraněno - upraveno mimo DokuWiki (Unknown date) 127.0.0.1 | znalostni_baze:archivni_formaty [2023/11/24 14:02] (aktuální) – ↷ Stránka přesunuta z 'playgroud:archivni_formaty' do 'znalostni_baze:archivni_formaty' Tomáš Šedivec | ||
---|---|---|---|
Řádek 1: | Řádek 1: | ||
+ | ======Národní standard formátů pro archivaci====== | ||
+ | |||
+ | <WRAP center round info 60%> | ||
+ | Standard stanovený Národní archivem ve verzi k 6. 6. 2023. | ||
+ | </ | ||
+ | |||
+ | Zpracovávání omezené množiny vybraných formátů v rámci životního cyklu dokumentu u původce nebo případně posléze archiválie v archivu – tzv. formátová normalizace – se ukázalo efektivním nástrojem řešení středně- a dlouhodobého uložení a zpřístupňování digitálních objektů dle mezinárodního standardu Otevřeného archivačního informačního systému (ČSN ISO 14721: | ||
+ | |||
+ | Tato strategie se odráží v definici druhů dokumentů a stanovených formátů, prezentovaných v § 23 vyhlášky č. 259/ | ||
+ | |||
+ | Zároveň však tato skupina formátů nemůže ve své úplnosti postihnout komplexní digitální objekty, které původci vytvářejí mimo elektronické systémy spisové služby, zejm. ve (specializovaných) informačních systémech, a to mnohdy i již historických s omezenými možnostmi exportu, či spravovaných nebo dokonce zveřejňovaných prostřednictvím různých dalších aplikací v podobě webových stránek/ | ||
+ | |||
+ | Podrobný popis jednotlivých formátů využívá údaje Kongresové knihovny ve Washingtonu ([[https:// | ||
+ | |||
+ | Informaci, zda příslušný formát v elektronickém systému spisové služby je vhodný při exportu do digitálního archivu, obsahují Formátová pravidla jako součást kontroly vstupních datových balíčků (Submission Information Package, SIP) na adrese [[https:// | ||
+ | |||
+ | Při přípravě byly využity konzultace s Archivem Českého rozhlasu (M.A. Miloslav Novák, Dipl.Tech. et Ph.D.), Národním filmovým archivem (Mgr. et BcA. Adéla Kudlová), Archivem České televize (Pavel Přibil) a Českým vysokým učením technickým (Ing. Karel Fliegel, Ph.D.). | ||
+ | |||
+ | Legenda k následujícím tabulkám: | ||
+ | |||
+ | formát – název formátu souboru nebo jeho kontejneru | ||
+ | |||
+ | verze – verze formátu souboru/ | ||
+ | |||
+ | PUID – identifikátor formátu, příp. jeho verze) v technickém registru PRONOM ([[https:// | ||
+ | |||
+ | kódování – vyžadované kódování | ||
+ | |||
+ | standard – zveřejněná specifikace formátu souboru | ||
+ | |||
+ | výstup eSSL – formáty/ | ||
+ | |||
+ | archivace – formát je vhodný pro dlouhodobé uchovávání | ||
+ | |||
+ | SIP – Submission Information Package | ||
+ | |||
+ | AIP – Archival Information Package (v oblasti multimédií termín MAP – Master Archive Package) | ||
+ | |||
+ | IAP – Intermediate Access Package (v oblasti multimédií se používá jako tzv. mezaninový formát pro označení meziproduktu-intermediátu vhodného pro vytváření dalších DIP) | ||
+ | |||
+ | DIP – Dissemination Information Package (v oblasti multimédií termín DAP – Distribution Access Package) | ||
+ | |||
+ | ===== Audio ===== | ||
+ | |||
+ | Zahrnuje formáty používané ke kódování nahraného zvuku, k uložení informací se využívají ztrátové či bezztrátové metody kódování. | ||
+ | |||
+ | Obecné požadavky: | ||
+ | |||
+ | Bitová hloubka min. 16 bitů, doporučeno 24 bitů, vzorkovací frekvence alespoň 44,1 kHz, doporučuje se vzorkování 96 kHz. V případě převodu archivních zvukových záznamů nebo zvukové složky audiovizuálních záznamů se doporučuje min. 48 kHz s hloubkou 24 bitů a bez ekvalizační křivky (v případě jejího použití alespoň uchovat v metadatech její profil). V případě již existujících zvukových záznamů s nižším vzorkovacím kmitočtem nebo hloubkou kvantizace je však vhodnější tyto záznamy rovněž uchovat a nijak je softwarově neupravovat. | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |Broadcast wave format\\ (WAV/ | ||
+ | |Free Lossless Audio Codec\\ (FLAC) | ||
+ | |Waveform audio format\\ (WAV) | ||
+ | |MPEG-1 Audio Layer II nebo MPEG-2 Audio Layer II\\ (MP2) | | ||
+ | |MPEG-1 Audio Layer III nebo MPEG-2 Audio Layer III\\ (MP3)| | ||
+ | |||
+ | ===== Binární soubory (spustitelné) ===== | ||
+ | |||
+ | Spustitelné binární soubory se doporučuje ponechat v původní podobě. | ||
+ | |||
+ | ===== Databáze a strukturovaná data ===== | ||
+ | |||
+ | Kategorie zahrnuje databázové formáty, tabulky, statistická či vědecká data. Vzhledem ke komplexnosti rozsáhlých databázových systémů je vhodné upřesnit způsob exportu pro trvalé uložení v archivu s příslušným digitálním archivem/ | ||
+ | |||
+ | |**formát** | ||
+ | |Extensible Markup Language\\ \\ (XML)/ XML Schema Definition\\ \\ (XSD)|1.0 | ||
+ | |Document Type Definition\\ (DTD) | ||
+ | |SIARD | ||
+ | |Comma Separated Values\\ (CSV) | ||
+ | |JSON Data Interchange Format\\ (JSON) vč. JSON-LD | ||
+ | |Microsoft Excel\\ \\ (XLS) | ||
+ | |Microsoft Excel\\ (XLSX) | ||
+ | |OpenDocument Spreadsheet\\ (ODS, OTS) |1.2 |fmt/ | ||
+ | |||
+ | ===== E-mail ===== | ||
+ | |||
+ | Kategorie zahrnuje zprávy zasílané s využitím výpočetní techniky, zejména protokolu SMTP. Primárně se pro ukládání e-mailových zpráv využije formát PDF/A. Přílohy e-mailů je nutné převést dle požadavků na ostatní formáty. Původní elektronická podání se mohou zároveň předat navíc v původním formátu. Celé e-mailové účty se předávají ve formátu PST/MBOX (nutné zohlednit ochranu soukromí a u veřejnoprávních původců umožnit odstranění informací soukromé povahy). | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |Portable Document Format – PDF/A\\ \\ (PDF) |1-4 |fmt/95, fmt/354, fmt/476, fmt/477, fmt/478, fmt/479, fmt/480, fmt/ | ||
+ | |Internet Message Format\\ (EML) | | ||
+ | |Microsoft Outlook Item Message Format\\ (MSG)|97-2003 | ||
+ | |Microsoft Personal Folders Format\\ (PST) |2003-2007|x-fmt/ | ||
+ | |MBOX Email Format\\ (MBOX) | ||
+ | |||
+ | ===== Fonty ===== | ||
+ | |||
+ | Fonty se ponechávají v původní podobě, pokud není stanoveno jinak. | ||
+ | |||
+ | ===== Internetové a intranetové stránky (web) ===== | ||
+ | |||
+ | Webové stránky mohou zahrnovat jak obsah přístupný v síti Internet, tak i obsah, který je prezentován v rámci lokální sítě intranet. | ||
+ | |||
+ | Již při designu webových stránek je vhodné dodržet zásady přístupnosti – viz např. Metodický pokyn k zákonu č. 99/ | ||
+ | |||
+ | Primárním způsobem uložení webových stránek v prostředí Internet je harvesting, kdy rozsah a frekvenci je nutné dopředu domluvit s příslušným archivem. Tento způsob však nedokáže zahrnout export databází, autorizovaného obsahu, komplexních JAVA skriptů nebo třeba streamovaného videa, které musí být při exportu předány způsobem odpovídajícím charakteru těchto dat (dle kategorizace výše). | ||
+ | |||
+ | Lokálně vytvořený export by měl zahrnout obsah celé domény včetně vnitřně odkazovaných URL. | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |Portable Document Format – PDF/A\\ \\ (PDF)\\ \\ (pouze pro export jednotlivých stránek)|1-4 | ||
+ | |HTML/HTM aj. vzniklé exportem (např. pomocí HTTrack) | ||
+ | |WARC (pro harvesting archivem) | ||
+ | |||
+ | ===== Komprimace dat ===== | ||
+ | |||
+ | U souborů pro komprimaci dat se vyžaduje jejich dekomprimace a uplatnění požadovaných formátových převodů na obsažené soubory. V původní podobě se předává pouze ve vybraných případech (kontejnery ASiC). | ||
+ | |||
+ | ===== Kontejner ===== | ||
+ | |||
+ | Kategorie zahrnuje elektronické dokumenty využívající elektronické autentizační prvky (např. FO/ZFO, ASiC). U většiny se vyžaduje převod obsažených dokumentů do výstupního datového formátu a zároveň předání originálu. | ||
+ | |||
+ | ===== Obraz disku ===== | ||
+ | |||
+ | U obrazů disku se vyžaduje jejich dekomprimace a uplatnění požadovaných formátových převodů na obsažené soubory. Zároveň se předává obraz disku v původní podobě. | ||
+ | |||
+ | ===== Obrázek (rastrový) ===== | ||
+ | |||
+ | Formáty pro zaznamenávání, | ||
+ | |||
+ | V případě nové digitalizace archivních fotografických záznamů v paměťových institucích se doporučuje uchovat jak mateční záznam v podobě surových dat obvykle v závislém barevném prostoru, s barevným profilem (.icc/3d lut) a bez ořezu snímací okeničky (Digital Source Negative, DSN), tak postprodukčně upravený, níže doporučený standardní formát vhodný k dlouhodobé archivaci již s rozlišením a velikostí obrazu jako má distribuční formát. V případě potřeby časté výroby distribučních formátů v různém rozlišení podle účelu prezentace se doporučuje z akvizičního formátu (SIP) vytvořit tzv. mezaninový formát-intermediát (Intermediate Access Package, IAP), který je vhodný pro výrobu distribučních formátů (DIP). Soubor pro dlouhodobé uložení by měl být v nejvyšší originální dostupné bitové hloubce/ | ||
+ | |||
+ | Pokud nejsou obrazová data uložena v nezávislém barevném prostoru (device independent color space) např. CIE XYZ, CIE LAB, pak je žádoucí použitý barevný prostor jasně specifikovat a u závislých prostorů připojit také barevné profily (International Color Consortium - ICC profile). | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |Tagged Image File Format\\ (TIFF) | ||
+ | |Jpeg2000\\ (JP2) |Part 1 (JP2)|x-fmt/ | ||
+ | |Portable Network Graphics\\ (PNG) | ||
+ | |Joint Photographic Experts Group File Interchange Format\\ (JPEG/ | ||
+ | |Adobe Digital Negative\\ (DNG) |1.6 | ||
+ | |||
+ | ===== Obrázek (vektorový) ===== | ||
+ | |||
+ | U grafiky využívající vektorové algoritmy se vyžaduje převod do PDF/A v podobě náhledu a zároveň předání souboru v původní podobě. | ||
+ | |||
+ | ===== Prezentace ===== | ||
+ | |||
+ | Uplatňuje se postup dle požadavků pro Textové dokumenty. | ||
+ | |||
+ | ===== Prostorová data (GIS) ===== | ||
+ | |||
+ | Kategorie zahrnuje formáty pro zaznamenání prostorových, | ||
+ | |||
+ | Vzhledem ke své komplexnosti může být řešením exportu z informačního systému spravujícího prostorová data datový balíček tzv. GeoSIP dle metodiky Transformace digitálních prostorových dat pro účely trvalého uložení v digitálním archivu ([[https:// | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |Geographic Tagged Image File Format GeoTIFF\\ (TIF, TIFF)|1.0 | ||
+ | |Geography Markup Language\\ (GML) |3.2.1.- | ||
+ | |GeoPackage\\ \\ (GPKG) | ||
+ | |GeoJSON\\ \\ (GEOJSON) | ||
+ | |LiDAR Point Cloud\\ \\ (LAS) |1.2 -1.4 |fmt/370 (pro 1.2)| |LAS Specification 1.4,\\ \\ [[http:// | ||
+ | |||
+ | ===== Sociální sítě (média) ===== | ||
+ | |||
+ | Obsah prezentovaný skrze sociální média (např. Facebook, Twitter, Slack, LinkedIn, Instagram atd.). | ||
+ | |||
+ | Primárním způsobem uložení webových stránek v prostředí Internet je harvesting, kdy rozsah a frekvenci je nutné dopředu domluvit s příslušným archivem. | ||
+ | |||
+ | Při lokálním exportu z účtu příslušného sociálního média je vhodné vybrat možnost exportu v HTML (+ CSV). | ||
+ | |||
+ | Postup dále dle kategorie Webové stránky. | ||
+ | |||
+ | ===== Technické výkresy a modely (CAD, BIM atd.) ===== | ||
+ | |||
+ | Zahrnuje formáty 2D a 3D zobrazení využívané při tvorbě a výměně dat v oblasti grafických, | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |Portable Document Format – PDF/A\\ \\ (PDF)|1-4 | ||
+ | |AutoCAD Drawing\\ (DWG) |2018/ | ||
+ | |Industry Foundation Classes\\ (IFC) |2x2/2x3/ 4 | ||
+ | |Extensible 3D\\ (X3D) |3.0-3.3 | ||
+ | |||
+ | ===== Textové dokumenty ===== | ||
+ | |||
+ | Kategorie zahrnuje formáty reprezentující soubory textové a kombinované textové a obrazové dokumenty. Jedná se zpravidla o vyjádření ve strukturované nebo nestrukturované podobě, ve značkovacím jazyce nebo např. reprezentace zdrojových kódů. | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |Portable Document Format – PDF/A\\ \\ (PDF)|1-4 | ||
+ | |ASCII\\ (TXT) | | ||
+ | |||
+ | ===== Účetní záznamy ===== | ||
+ | |||
+ | Kategorie zahrnuje účetní záznamy v elektronické podobě. | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |ISDOC Information System Document\\ \\ (ISDOC)|5.2- | ||
+ | |||
+ | ===== Audiovizuální a kinematografické dokumenty ===== | ||
+ | |||
+ | Formáty pro zaznamenávání, | ||
+ | |||
+ | V případě nové digitalizace archivních kinematografických a některých audiovizuálních záznamů v paměťových institucích se doporučuje uchovat jak mateční záznam v podobě surových dat obvykle v závislém barevném prostoru a bez ořezu snímací okeničky (Digital Source Master, DSM), tak postprodukčně upravený, níže doporučený standardní formát vhodný k dlouhodobé archivaci již v nezávislém barevném prostoru (Digital Cinema Master, DCDM) s rozlišením a velikostí obrazu jako má distribuční formát (DIP). V případě potřeby časté výroby distribučních formátů v různém rozlišení podle účelu prezentace se doporučuje z akvizičního formátu (SIP) vytvořit tzv. mezaninový formát-intermediát (Intermediate Access Package, IAP), který je vhodný pro výrobu distribučních formátů (DIP). | ||
+ | |||
+ | Pro dlouhodobou archivaci a distribuční intermediát (IAP) se doporučuje využít formát založený na vnitrosnímkové kompresi (intra-frame) namísto mezisnímkového prediktivního kódování (inter-frame) vhodného pro distribuční formáty (DIP). | ||
+ | |||
+ | Pokud nejsou obrazová data uložena v nezávislém barevném prostoru (device independent color space) např. CIE XYZ, CIE LAB, pak je žádoucí použitý barevný prostor jasně specifikovat (např. ITU-R BT. 601, 709, 2020, 2100, DCI-P3 SMPTE EG 432-1, SMPTE RP 431-2 apod.) a u závislých prostorů vždy připojit použitý barevný profil, resp. převodní barevnou tabulku (3d lut). | ||
+ | |||
+ | Výstup pro výběr dokumentů za archiválie a jejich uchovávání v digitálním archivu. | ||
+ | |||
+ | |**formát** | ||
+ | |Digital Cinema Distribution Master\\ \\ (DCDM)| | ||
+ | |Interoperable Master Format\\ (IMF) | ||
+ | |Material Exchange Format\\ (MXF) |OP1a, OP1Atom | ||
+ | |Digital Cinema Package\\ (DCP) |DCSS Version 1.4.2| | ||
+ | |Digital Picture Exchange\\ (DPX/ | ||
+ | |MPEG 1 Video\\ (MPEG, MPG) | |x-fmt/ | ||
+ | |MPEG 2 Video\\ (MPEG, MPG) | |x-fmt/ | ||
+ | |MPEG 4 Video\\ (MPEG, MPG) | |fmt/ | ||
+ | |Graphics Interchange Format\\ (GIF) | ||
+ | |JPEG2000\\ \\ (JP2) | ||
+ | |Matroska\\ (MKV) |1-4 | ||
+ | |Apple ProRes in QuickTime\\ (MOV) | ||
+ | |||