Přístup k vědecké literatuře v režimu „Open access“ je již řadu let intenzivně propagován a podporován řadou organizací a institucí po celém světě. Cílem průzkumu a dané případové studie je na konkrétním příkladu oboru Organizace informací a znalostí (angl. Knowledge Organization) zjistit, jak velký objem této literatury je v současnosti skutečně volně dostupný v rámci celkové elektronické dostupnosti (včetně komerční), a analyzovat a vyhodnotit jednotlivé formy této dostupnosti, od forem legálních až po formy nelegální. Analyzovány budou vybrané relevantní příklady zdrojů. Případová studie vychází z rozsáhlejší bibliografické databáze literatury a dalších zdrojů z daného oboru, jež byly publikovány nebo vytvořeny hlavně v posledních 30 letech. Menší množství významných zdrojů pochází z minulosti. Výsledek základní rešerše byl zpracován ve formě pracovní strukturované bibliografické databáze v rámci výzkumného úkolu NAKI -- Znalostní báze pro obor organizace informací a znalostí (DF13P01OVV013). Přídavné údaje o dostupnosti, zejména elektronické, byly doplňovány pomocí vybraných informačních zdrojů (internetových vyhledávačů, souborných katalogů, portálů elektronických zdrojů). Zahrnutá literatura se v jádrové části obsahově týká oboru informační vědy, ale v souladu se současným pojetím oboru Organizace informací a znalostí zasahuje i do příbuzných oborů, jako jsou počítačová věda, lingvistika, sémantika, znalostní management aj. Dostupnost literatury je vyhodnocena bibliometrickou metodou, dílčí formy elektronické dostupnosti, zejména té otevřené, jsou kvalitativně interpretovány.
vědecká literatura, otevřený přístup, obor Organizace informací a znalostí, informační zdroje, dostupnost literatury a zdrojů, bibliometrický výzkum, bibliografická databáze
Open Access to scientific literature has been intensively promoted and supported by many organizations and institutions over the world. The objective of this research and this case study is on the concrete example of Knowledge organization subject area to find out how big volume of this literature is in the present really open accessible within total electronic accessibility (including commercial), and to analyse and evaluate individual forms of this accessibility, from legal to illegal forms. Selected relevant examples of resources will be analysed. The case study is based on extensive bibliographic database of literature and other sources from this subject area published or created mainly in last thirty years. Minor amout of important sources originates from the past. The result of basic information retrieaval was processed in the form of working structured bibliographic database within research project NAKI -- Knowledge base for subject area of knowledge organization (DF13P01OVV013). Added data about accessibility, particularly electronic, were completed using selected information resources (internet search engines, union catalogues, portals of electronic resources). Covered literature concerns in main part the Information science field, but in accord with current approach to Knowledge organization hits associate disciplines like Computer science, Linguistics, Semantics, Knowledge management and others. The accessibility of literature is evaluated by bibliometric method, individual forms of electronic accessibility, particularly open access, are qualitative interpreted.
Scientific literature, Open Access, knowledge organization, Information sources, Bibliometric research, Bibliographic database, Accessibility of literature and sources
RNDr. Miroslav Bartošek, CSc.
PhDr. Jindra Planková, Ph.D.
Cílem průzkumu, jehož výsledky jsou představeny v této případové studii, je zjistit, k jak velkému objemu vědecké literatury z oboru Organizace informací a znalostí (angl. Knowledge Organization, též zkr. KO) a v jakých konkrétních formách mají uživatelé otevřený přístup v globálním měřítku. Souvisejícím cílem také je, budou-li zjištěny takové případy, poukázat na případné porušování autorských a jiných práv při zpřístupňování literatury z tohoto oboru v režimu otevřeného přístupu.
Otevřený přístup (angl. Open Access, též zkr. OA) v oblasti vědy a výzkumu je stále, i po více než dvaceti letech od jeho vzniku1, velmi propagován a podporován na mezinárodní, národních i lokálních úrovních v mnoha zemích světa. Odborné literatury k tématu otevřeného přístupu bylo k dnešnímu datu publikováno velké množství, není tedy nutné v tomto textu znovu předkládat jeho základní charakteristiky. Krátce lze odkázat například na práce Petera Subera, jednoho z lídrů a propagátorů tohoto hnutí. Vývoj otevřeného přístupu, jeho definici, rysy, zdroje a význam představil autor též v četně citovaném textu lokalizovaném na personálním webu2. V rámci publikované literatury byly již představeny také výsledky různých sociologických výzkumů, které sledovaly chování autorů v této oblasti s cílem podnítit jejich aktivitu a přispět tak k navýšení objemu výsledků vědy a výzkumu v otevřeném přístupu. Výzkumy vedoucí ke zjištění objemu literatury s otevřeným přístupem k danému období v oboru Organizace informací a znalostí nebyly doposud zaznamenány.
Průzkum byl realizován na základě počítačové bibliografické databáze. Uplatněna byla bibliometrická metoda s kvalitativním vyhodnocením získaných dat. Bibliografická databáze bude v rámci dále citovaného výzkumného projektu sloužit více účelům, tento průzkum zatím těží z jednoho údaje zachycených záznamů, kterým je údaj o dostupnosti informačních zdrojů3.
Data o libovolném přístupu či dostupnosti literatury a dalších informačních zdrojů z oboru Organizace informací a znalostí4 byla získána v rámci realizace výzkumného projektu Programu aplikovaného výzkumu a vývoje národní a kulturní identity (NAKI) s konkrétním názvem Znalostní báze pro obor organizace informací a znalostí (DF13P01OVV013)5. V první fázi výzkumného projektu byla připravena rozsáhlejší bibliografická rešerše informačních zdrojů z vymezeného oboru. Zjišťovány a vybírány byly zdroje relevantní potřebám a cílům výše citovaného výzkumného projektu, rešerše tak má pragmatický ráz. Účelem rešerše nebylo vytvořit kompletní bibliografickou mapu poznání z daného oboru v celosvětovém záběru6. Excerpční základnou se stala nejenom skupina vybraných relevantních bibliografických a plnotextových databází citovaných níže v poznámce, ale také citační databáze WOK/WOS společnosti Thomson Reuters a internetové vyhledávače (zejména Google), další záznamy byly doplňovány i jinými cestami. Procesy zjišťování, výběru a tvorby záznamů včetně jejich strukturování a ukládání do pracovní počítačové databáze7 probíhaly postupně od ledna do září 2013. Bibliografické záznamy byly opatřovány potřebnými popisnými údaji, ověřovanými ve více zdrojích. Podstatnou roli hrály jedinečné mezinárodní identifikátory, zjišťované v maximálním možném množství, též z důvodu jejich pozdějšího využití při vlastním budování znalostní databáze oboru Organizace informací a znalostí. Navíc byla doplňována autoritní data (také včetně mezinárodních identifikátorů), která by měla ve znalostní databázi při prezentaci zdrojů zajistit spolehlivé vazby mezi tvůrci a jejich díly. Doplňovány byly pro potřeby dalších analýz i jiné údaje, jako jsou abstrakta či anotace, klíčová slova, jednoduché kódy prozatímního pracovního (hrubého) oborového třídění a počet ohlasů z citační databáze WOK/WOS výše zmíněné společnosti.
V neposlední řadě byly zaznamenávány údaje o dostupnosti zdrojů, které budou hrát roli v budované znalostní bázi také. Ty se staly předmětem průzkumu popsaného v této studii. Zaznamenávaná byla, pokud to bylo možné, vícenásobná dostupnost (dílčí typy elektronické dostupnosti i dostupnost tradiční, papírová). Vedle podstatné otevřené dostupnosti (OA) byla zaznamenána také dostupnost komerční včetně licencované (též z důvodu dalšího využití těchto zdrojů v rámci výzkumného úkolu), u které ale bylo nastaveno nutné omezení: šlo o licencované digitální fondy dostupné řešitelskému týmu, a to v rámci regionu Praha (Univerzita Karlova se svými knihovnami, relevantní knihovny dalších pražských univerzit, Národní knihovna ČR, Národní technická knihovna aj.). Šlo o časově náročnou fázi zjišťování těchto dat v různorodých zdrojích, v souborných katalozích, digitálních knihovnách nebo archivech, ve zjištěných nelegálních systémech digitálních dokumentů, především ale v indexu vyhledávače Google. Zařazen byl mimořádně také systém Google Knihy (Google Books). Přítomnost záznamu a popřípadě dokumentu samotného (byť jenom v náhledu vybraných stránek) v digitalizovaném či digitálním tvaru v tomto systému se stala výjimečně zdrojem specifické kategorie dostupnosti. V rámci možností bylo v daných měsících zjištěno maximum veřejně dostupných zdrojů. Ty se staly reprezentativním vzorkem průzkumu pro další zpracování v rámci stanovených cílů.
Dostupnost byla ve strukturované databázi zaznamenána pomocí číselníku. Kategorizace dostupnosti byla připravena na základě znalostí z publikované literatury věnované kategorizaci či typologii zdrojů s otevřeným přístupem a na základě zjištění a otestování výchozí pilotní množiny záznamů zdrojů zahrnutých do rešerše. Zavedeny byly následující kategorie (typy) dostupnosti:
V kontextu již delšího vývoje otevřeného přístupu k publikacím bylo možné od průzkumu očekávat, že se objem vědecké literatury s tímto přístupem (ve všech jeho dílčích kategoriích) v oboru Organizace informací a znalostí v průběhu času zvětšil a že by mohl, též s ohledem na skutečnost, že jde z větší části o literaturu z humanitní a sociální oblasti, dosahovat přibližně 35 %8. V rámci kategorie nelegálního otevřeného přístupu bylo očekáváno malé množství zdrojů zpřístupňovaných protiprávním způsobem, zhruba 8 %. S ohledem na potřeby výzkumného projektu bylo očekáváno, že objem online komerční licencované literatury by mohl dosáhnout přibližně 35 %. Klasicky v papírové formě by mohlo být na celém území ČR k dispozici přibližně 40 % titulů relevantních zvolenému oboru. Tituly, ke kterým nebude zjištěna žádná dostupnost (očekávat lze asi 10 % takových titulů), bude řešitelský tým řešit nákupem, výpůjčními a dodavatelskými službami.
Pracovní databáze záznamů, zpracovaná v rámci již zmíněného výzkumného projektu, dosáhla k 1. září 2013 826 záznamů cíleně vybraných zdrojů. Z hlediska obsahu zahrnuje záznamy zdrojů z oboru Organizace informací a znalostí. Vymezení a definování tohoto nově se formujícího oboru, který zasahuje a úzce souvisí s řadou jiných vědních oborů, je jedním z úkolů zmíněného výzkumného projektu. V tomto okamžiku lze prozatím uvést jeho pracovní definici, která je představena v jiné studii zpracované v rámci tohoto projektu9. Její autorka uvádí, že jde o obor, jehož předmětem zkoumání je proces organizace znalostí a jeho kontext, tj. zdroje, jež jsou v procesu organizace transformovány, a produkty, jež jsou tímto procesem vytvářeny, včetně zúčastněných aktérů – osob, institucí a technologií.
Multioborovost se tudíž musela promítnout i do obsahové struktury zpracované bibliografické databáze. Všem záznamům byl přidělen jeden kód pracovního (hrubého) oborového třídění. Dominantní postavení v celé skladbě zaujímají, jak ukazuje tab. č. 1, zdroje z jádrové části oboru Organizace informací a znalostí. Jde o 58,2 % zdrojů z celkových 826. Cíleně vybrané informační zdroje z lingvistiky, sémantiky, sémiotiky, logiky a kognitivní vědy jsou dohromady zastoupeny 18,4 %. Zdroje z uvedených disciplín tvoří teoretický a filozofický kontext jádra oboru Organizace informací a znalostí. Zdroje z dílčích specializací počítačové vědy včetně umělé inteligence jsou zastoupeny 14,2 %. Vybrané zdroje z oboru informační vědy zaujímají 7,2 % a obory znalostního managementu, podnikové ekonomiky a podnikové informatiky 1,8 %.
Tab. č. 1: Přehled počtu záznamů zdrojů z dílčích oborů zahrnutých do bibliografické databáze oboru Organizace informací a znalostí (uspořádáno podle počtu zahrnutých prací)
Dominantní postavení jádrové části oboru je doloženo také strukturou autorů zdrojů zahrnutých do databáze. V tab. č. 2 je uvedeno prvních 12 autorů, kteří jsou v databázi zastoupeni největším počtem prací. Přidán je celkový počet ohlasů na všechny v databázi zahrnuté práce. Tyto údaje byly snímány ze systému WOK/WOS.
Tab. č. 2: Přehled prvních 12 autorů zdrojů zahrnutých do bibliografické databáze (uspořádáno podle počtu zahrnutých prací), připojeny jsou souhrnně ohlasy na dané práce ze systému WOK/WOS
Jde o autory, kteří výrazným způsobem přispěli a stále přispívají k rozvíjení teorie oboru Organizace informací a znalostí i současné praxi při aplikaci věcných pořádacích soustav systematických i předmětových. Kanaďanka Clare Beghtolová hluboce propracovala teoretické otázky věcného pořádání informací, zejména pak v oblasti klasifikačních soustav, a to též v kontextu účinného vyhledávání informací. Na základě výsledků z analýz pořádacích soustav vyzývala k novým přístupům při řešení klíčových otázek oboru Organizace informací a znalostí, jako například ve studii Objevování nových přístupů k organizaci znalostí10. O rozpracování dílčích teoretických otázek oboru Organizace informací a znalostí (terminologie oboru, sémantické a kognitivní aspekty organizování znalostí, interdisciplinární povaha oboru aj.) se zásadním způsobem zasloužil také významný dánský odborník Birger Hjørland. Je například autorem významné studie z roku 2003 Základy organizace znalostí11. Američanka Rebecca Greenová je autorkou významných analýz věnovaných vztahům v systémech organizace informací a znalostí (systematických i předmětových)12. Angličanka Vanda Broughtonová je autorkou četných studií i monografií věnovaných taktéž významným systematickým i předmětovým soustavám a jejich nové aplikaci v současném digitálním prostředí13. Zásadním způsobem ovlivnila vznik a vývoj nového oboru Organizování informací a znalostí Němka Ingetraut Dahlbergová, která je autorkou řady významných studií věnovaných teoretickým otázkám nového oboru, ale i praktických produktů, jako například klasifikace oboru Organizace znalostí, uveřejněné v příloze článku z roku 199314. Známá dvojice autorek Marcia L. Zengová a Lois M. Chanová (obě z USA) rozpracovaly, mimo jiné otázky, problematiku interoperability v systémech organizace informací a znalostí15. V sestavě autorů v tab. č. 2 je uveden také významný český autor Blahoslav Kovář, jehož práce ze 70-80 let minulého století sehrály důležitou roli v rozvoji této disciplíny v České republice i na Slovensku.
Výzkumný projekt akcentuje literaturu a další informační zdroje zejména z období posledních 30 let vývoje oboru Organizace informací a znalostí (zhruba od roku 1983), největší množství však bylo vybráno z období posledních 20 let – viz tab. č. 3. Právě z roku 1993 pochází již výše citovaný významný článek Ingetraut Dahlbergové Organizace znalostí: její rozsah a možnosti16, ve kterém uvedla poprvé definici tohoto nového oboru.
Tab. č. 3: Časová struktura zdrojů zahrnutých do bibliografické databáze (k 9. 9. 2013, uspořádáno chronologicky sestupně)
Literatura staršího data byla do rešerše zahrnuta v minimálním počtu, a to s ohledem na potřeby řešení výzkumného projektu. Nejstarším dokumentem, zahrnutým v bázi, je práce Nathaniela B. Shurtleffa (1810-1874) Desetinný systém pro uspořádání a správu knihoven17, která je dnes jako volné dílo (Public Domain) k dispozici uživatelům v digitalizované formě v řadě výstupních formátů vynikající kvality v digitálním archivu „Archive.org“. Rok 1870 reprezentuje článek Třídění knih18 Williama Torreye Harrise (1835-1909), jehož autorství je uvedeno pouze na titulním listě celého ročníku (autor byl jeho editorem), jak lze zjistit náhledem v digitálním archivu JSTOR (licence nutná). Předpokládá se, že novinky roku 2013 budou do databáze průběžně doplňovány.
Tab. č. 4: Přehled typů zdrojů zahrnutých do bibliografické databáze (k 9. 9. 2013)
Struktura typů zdrojů, zastoupených v databázi, je představena v tabulce č. 4. Hlavním zaznamenaným typem zdroje je článek z časopisu, zejména impaktovaného a recenzovaného (téměř polovina z celku). Druhým v pořadí (čtvrtina z celku) je ale monografie (kniha, brožura). Knihám byla při zjišťování zdrojů věnována velká pozornost. Podařilo se zjistit maximum hodnotných vědeckých monografií nebo odborných knižních pojednání, v řadě případů laděných také didakticky. Na třetím místě jsou příspěvky ze sborníků (konferenčních nebo tematických). Těchto zdrojů existuje velké množství, do databáze jich ale bylo zařazeno málo, neboť obsahově stejné texty autoři velmi často posunují do impaktovaných nebo recenzovaných časopisů. Jejich článkům byla dána přednost. Další typy tvoří již menší či velmi malé části z celku všech zahrnutých zdrojů: výzkumné nebo technické zprávy, sborníky jako celky stejně jako kapitoly z knih, vybraná hesla nebo články z encyklopedií, vybrané kvalifikační vysokoškolské práce, zejména přínosné zahraniční, systémy organizace znalostí (tištěné nebo online dostupné), technické normy a učební materiály ve výběru.
Seznam časopisů (celkem 116) s největším počtem excerpovaných článků je uveden v kapitole 5 (Tab. č. 6), která je věnovaná vyhodnocení dostupnosti jejich článků.
V této části jsou představeny a vyhodnoceny jednotlivé formy dostupnosti vědecké literatury a dalších zdrojů z oboru Organizace informací a znalostí. Zahrnuta je, s ohledem na potřeby výzkumného projektu, veškerá dostupnost. Podrobnější vyhodnocení zjištěných údajů bude však zaměřeno zejména na dílčí formy otevřeného přístupu (ve dvou kapitolách). Dostupnost byla postupně s předem danými kritérii zjišťována, prověřována a zapisována do počítačové databáze, a to v průběhu měsíců únor – září 2013. Problematické online dostupnosti byly kontrolovány i vícekrát, ve třech případech byla zaznamenána v rozpětí 4 měsíců změna volné webové lokalizace. Výsledné počty jednotlivých typů dostupnosti, které byly získány z databáze na základě SQL dotazů, jsou představeny v tabulce č. 5.
Tab. č. 5: Souhrnný přehled typů dostupnosti zdrojů zahrnutých do bibliografické databáze (k 9. 9. 2013, celkový počet záznamů je 826)
Tradiční přístup k publikacím na papírovém nosiči byl zjišťován cíleně jenom v rámci institucí z ČR. Pokud byl však titul zjištěn v Praze, další výskyty mimo Prahu již nebyly zaznamenávány. Papírová dostupnost článků byla zjišťována jen tehdy, pokud nebyla zjištěna online dostupnost. Zásadním nástrojem zjišťování se stal souborný katalog ČR (pro monografické materiály i seriály). Očekáván byl přibližně 40% přístup k papírovým dokumentům ze sledovaného oboru. Tento předpoklad se také téměř potvrdil, 39 % publikací, tj. 323 titulů je takto skutečně dostupných. Největší počet z tohoto celku zaujímají, jak by se dalo očekávat, knihy (158). Zejména pražské knihovny, ale například i knihovny Masarykovy univerzity aj., mají ve svých fondech podstatné tituly starší i nové vědecké literatury z tohoto oboru. Druhé místo zaujímají s překvapením články z časopisů (85). Ukázalo se, že jde ve velkém počtu také o články z prestižního časopisu Knowledge organization (ISSN 0943-7444). Bohužel, články z let 1993-2007 jsou dostupné jenom na papíře, pokud náhodou neexistuje daný text jako volný preprint někde na internetu (průzkum potvrdil, že v případě tohoto časopisu je preprintů minimálně, zejména pak staršího data). Společnost EBSCO, která zpřístupňuje od nedávné doby tento časopis elektronicky (2010 - současnost), prozatím nezpřístupňuje starší ročníky. Totéž se týká časopisu International classification (ISSN 0340-0050, předchůdce časopisu Knowledge organization), ale týká se to i některých současných časopisů, jako je například významný časopis Cataloging & classification quarterly (ISSN 0163-9374, e-ISSN 1544-4554). Papírová dostupnost se týká také některých českých nebo slovenských periodik, která v minulosti přinášela poznání ze sledované disciplíny.
Menší počty zdrojů, dostupných papírově, se týkají příspěvků ze sborníků (26), sborníků jako celků (14), technických norem (8), vybraných vysokoškolských kvalifikačních prací české provenience ze staršího období (7)19, výzkumných / technických zpráv (6), kapitol z knih (12), systémů organizace znalostí (prameny) (2), hesel z odborných encyklopedií (2) a učebních materiálů (2).
Online komerční licencovaný přístup k vědecké literatuře byl v akademických organizacích ČR i díky státním dotacím po řadu let na solidní úrovni. Řešitelé výzkumného projektu proto odhadovali, že pro obor Organizace informací a znalostí by mohlo být takto dostupných zhruba 35 % zdrojů. Tento předpoklad se zcela nenaplnil, ukázalo se, že online licencovaným způsobem je dostupných necelých 32 % zdrojů. Jednou z příčin může být i zastavení předplatných u některých časopisů spadajících do sledovaného oboru od roku 201320.
Z celku 264 zjištěných zdrojů z oboru Organizace informací a znalostí zajišťuje licencovaný online přístup ze 40 % trojice největších komerčních vydavatelů a jejich sofistikovaných webových portálů: Springer (SpringerLink, celkem 46 zdrojů, tj. 17,4 %), Wiley (Wiley Online Library, celkem 39 zdrojů, tj. 14,7 %) a Elsevier (ScienceDirect, celkem 18 zdrojů, tj. 6,8 %). Dalších 60 % zdrojů je zpřístupňováno na základě licence zejména v rámci portálů společností EBSCO a ProQuest. Některé zdroje jsou, jak bylo prověřeno, souběžně poskytovány více dodavateli. Velký počet článků (39) z prestižního britského časopisu Journal of documentation (ISSN 0022-0418) je v retrospektivě od roku 1997 zajišťován online komerčním vydavatelstvím Emerald v licenci NK ČR (vedle systému ProQuest), starší ročníky (Backfiles) jsou pak zpřístupněny už pouze v licenci NTK (jde o příznivou okolnost). Menší část zdrojů je licenčně zpřístupňována v rámci systému JSTOR21.
Největší část z celku 264 zdrojů zaujímají, co do jejich typů, články z časopisů (202). Zbytek tvoří 11 hesel z prestižní oborové encyklopedie22, 6 kapitol z knih, 3 zahraniční disertační práce dostupné z digitálního fondu ProQuest Dissertations & Theses A&I (licencováno v CERGE UK)23, 18 knih (zejména z fondů e-knih systémů SpringerLink a ProQuest/Ebrary), 7 sborníků, 14 příspěvků ze sborníků, 22 výzkumných zpráv a 1 systém organizace znalostí24.
V rámci zjišťování online přístupů k informačním zdrojům bylo také identifikováno celkem 115 zdrojů, tj. 13,9 %, ke kterým online licenční přístup není zajištěn. Více než polovinu z tohoto množství tvoří články z časopisů (68, tj. 59 %). Jde o případy časopisů s malým počtem zahrnutých článků, často jenom jedním, jako tomu je například u časopisu Scandinavian journal of information systems (ISSN 0905-0167, e-ISSN 1901-0990) aj.
Většina zjištěných článků je však dostupná alespoň v papírové formě (již zmíněný časopis Cataloging & classification quarterly nebo časopis Journal of information science), nebo je zpřístupňuje online navíc licenčním způsobem jiný distributor, anebo je k dispozici volně dostupný preprint (časté případy časopisů z počítačové vědy), takže nejde o vážné ztráty.
K online nedostupným zdrojům patří také 2 sborníky jako celek (1,7 % z celku), z nichž jeden25 byl vyhodnocen jako vysoce relevantní i pro výzkumný projekt, a tak bude předmětem plánované akvizice. V počtu 20 příspěvků nedostupných online (17,3 %) je zahrnuto i 14 dílčích příspěvků z citovaného sborníku. Ze 17 zjištěných monografií (14,7 %) bude rovněž nutné přikročit k nákupu titulů, které nejsou dosud vůbec v ČR lokalizovány ani v papírové formě26. Do komentované statistiky ještě patří 5 hesel z encyklopedií (4,3 %) – jde o vybraná hesla z oblasti znalostí a ontologií ze známé Encyklopedie znalostního managementu27, k níž nemáme přístup, dále 2 kapitoly z knih (1,7 %) a 1 systém organizace znalostí 28 (0,8 %).
V této podkapitole budou představeny výsledky měření jednotlivých typů otevřeného přístupu legální formy u zdrojů zachycených v bibliografické databázi oboru Organizace informací a znalostí. Určité zdroje mohou vykazovat i více typů otevřeného přístupu, a to i opakovaně. Často je k vidění kombinace uložení textu dokumentu v otevřeném digitálním archivu a na personálním webu autora. V principu půjde především o volné zveřejňování vědeckých textů, které končí svoji cestu v komerčních časopisech a sbornících, tedy o zveřejňování formou preprintu, vydavatelského postprintu nebo, pokud to výjimečně nakladatel dovolí, i formou vydavatelské kopie. Vyhodnocování legálnosti se opírá o informace zveřejněné v systému SHERPA/ROMEO29. U zachycených zdrojů, bude-li to možné, tedy bude vyhodnocována tzv. „zelená politika“ vydavatelů a jejich časopisů (lze volně zveřejnit preprinty, postprinty, ale ne vydavatelské kopie), „žlutá politika“ (lze volně zveřejnit preprinty, ale už ne postprinty a vydavatelské kopie a uplatňují se různé variabilní restrikce pro volné zpřístupňování), „modrá politika“ (volné zveřejňování preprintů, postprintů i vydavatelských kopií může mít větší restrikce a situace se liší u jednotlivých nakladatelů) a „politika bílá“ (kdy volné zveřejňování není formálně podporováno).
Ve 2. kapitole je uvedena hypotéza, že zdrojů s otevřeným přístupem v legálním režimu by mohlo být přibližně 35 %.
V rámci zjišťování otevřené dostupnosti k vědecké literatuře a dalším zdrojům bylo nalezeno celkem 152 titulů z celkové množiny všech zdrojů (tj. 18,4 %), které byly uloženy v digitálním nebo digitalizovaném tvaru online v digitálních archivech/repozitářích, popř. digitálních knihovnách s otevřeným přístupem. Jde o největší množství ze všech dílčích typů otevřeného přístupu. Lze předpokládat, že jde o trend a že počet takových uložení bude v dalších letech růst. Jde o optimální formu, neboť systémy digitálních archivů ve většině případů zajišťují dlouhodobou archivaci digitálních materiálů a stabilitu jejich lokalizace na rozdíl od uložení na povrchovém webu.
V celkové množině 152 zdrojů s tímto typem otevřeného přístupu se nachází: 81 článků z časopisů (53,2 %), 27 konferenčních příspěvků (17,7 %), 25 monografií (16,4 %), 6 vysokoškolských kvalifikačních prací, 5 výzkumných nebo technických zpráv, 4 systémy organizace znalostí, 3 kapitoly z knih a 1 sborník příspěvků jako celek.
Zajímavá je sestava digitálních archivů/repozitářů, ve kterých se texty zdrojů zahrnutých do bibliografické databáze sledovaného oboru v otevřeném přístupu nacházejí (uvedeny jsou jenom ty s největším výskytem dokumentů):
Autoři, kteří už ukládají články z časopisů do archivů/repozitářů, většinou dodržují politiku vydavatele. Ponejvíce jsou ukládány preprinty. Několik autorů porušuje „zelenou politiku“ tím, že zveřejňují vydavatelské kopie (ve vzorku 81 článků z časopisů šlo o 9 případů).
Do rešerše byla také zahrnuta vybraná významná díla minulosti z oboru Organizace informací a znalostí, které mají status „volných děl“ a nevztahuje se již na ně autorskoprávní ochrana. Jsou již v řadě případů digitalizována v rámci vyznaných projektů a dostupná globální veřejnosti v sofistikovaných digitálních archivech ve vysoce kvalitních variabilních výstupních formátech. Lze tak získat například slavné dílo Melvila Deweyho z roku 1876 Klasifikace a předmětový rejstřík pro katalogizaci a pořádání knih a brožur v knihovně 30 nebo jedno z významných děl Henryho Evelyna Blisse Organizace znalostí v knihovnách a předmětový přístup ke knihám31 z roku 1933. Ve vysoké kvalitní výstupní prezentaci je v americkém digitálním archivu archive.org dostupné také dílo T. G. Masaryka 32 Základové konkretné logiky: (třídění a soustava věd) vydané v roce 1885. Kvalitu prezentace lze porovnat také s domácím výstupem uloženým v systému Kramerius (NK ČR).
O něco méně výskytů volného zpřístupňování vědecké literatury bylo zjištěno u formy ukládání textů (preprintů, postprintů a vydavatelských kopií) na volném webu. V převážné míře autoři – vědci, členové akademických institucí, ukládají tyto texty na webových serverech svých mateřských organizací nebo na svých osobních personálních webech. Vyskytují se i případy, že vystavené dokumenty stahují a na jiných místech (pravděpodobně neoprávněně) vystavují jiní uživatelé. URL zachycených dokumentů prozrazují, že takto zveřejněné texty jsou často využívány k vysokoškolské výuce. Nejde o optimální a doporučovanou formu otevřeného přístupu, neboť takto uložené dokumenty vykazují malou stabilitu, dokumenty občas mizí, anebo jsou přesunovány na jiné místo (v rámci trvání průzkumu bylo zpozorováno přemístění tří zdrojů).
Z celkové množiny všech zdrojů je touto formou otevřeně zpřístupňováno 141 (17 %) zdrojů. Konkrétně jde o 75 článků z časopisů (53,1 %), 26 konferenčních příspěvků (18,4 %), 17 výzkumných nebo technických zpráv (12,0 %), 4 monografie, 6 vysokoškolských kvalifikačních prací, 4 systémy organizace znalostí, 3 kapitoly z knih, 2 sborníky příspěvků jako celek a 4 učební materiály.
Až 18krát byla porušena politika vydavatele volným zveřejněním vydavatelské kopie.
Do této skupiny patří také dílo Principy klasifikace knih33, jehož autorem je Edward Wyndham Hulme. Dílo bylo publikováno po částech v roce 1911 v časopise Library Association Record. Digitalizované kopie jednotlivých částí jsou zveřejněny na dánském školním serveru s neznámým statusem digitálního zveřejnění.
Do bibliografické báze bylo zařazeno po pečlivém výběru také celkem 62 záznamů čistě online dostupných materiálů (7,5 %) z oboru Organizace informací a znalostí. Ve své většině jde o články zveřejněné v online („zlatých“) časopisech (celkem 44). Mnohé z nich nejsou recenzované. Ze zahraničních lze zmínit například časopis Journal of digital information (ISSN 1368-7506, 3 články)34, americký seriál s konferenčními příspěvky Advances in classification research online (ISSN 2324-9773, 4 příspěvky)35 aj. Zařazeny byly i významnější články z českých časopisů se zaměřením na sledovaný obor, jako jsou časopisy Národní knihovna (ISSN 1214-0678, 5 článků)36, Knihovna (ISSN 1802-8772, 3 články), ProInflow (ISSN 1804-2406, 3 články) nebo také Ikaros (ISSN 1212-5075, 12 článků)37.
Množinu článků doprovází ještě skupina 8 záznamů z online dostupných konferenčních sborníků, například z pravidelné akce organizace americké NASKO38 a skupina 10 různých firemních a jiných na webu dostupných materiálů.
Celkově bylo při zjišťování zdrojů nalezeno několik málo dokumentů – celkem 25 (3,0 %), které byly publikovány komerčními vydavateli, ale byly těmito vydavateli zpřístupněny zároveň mimořádně volně zdarma, a to z důvodu reklamního, z důvodu ujednání mezi autorem a vydavatelem apod. V uvedené celkové množině jsou zahrnuty 4 příspěvky z konferencí nebo jiných akcí, které byly zveřejněny v publikovaných sbornících. Například stať kolektivu 4 významných autorů z oboru Organizování znalostí a informací s názvem Organizace znalostí z tematické konference věnované otázkám profesionální výuky oboru Knihovní a informační vědy v evropském kontextu, která se konala v roce 2005, byla zveřejněna volně v rámci celého sborníku na serveru Americké společnosti pro informační vědu ASIS39. Podobně, text konferenčního příspěvku J. Sophie Visserové věnovaný tématu organizování znalostí, byl mimořádně zveřejněn volně se svolením britského vydavatelství Emerald, který publikoval oficiální sborník, na stránkách britské organizace ISKO40.
Zbytek zjištěné množiny tvoří 21 článků z komerčních časopisů, jejichž texty byly také mimořádně zveřejněny volně. Příkladem může být článek dvojice známých francouzských autorů ze sledovaného oboru s názvem Organizace znalostí a dokumentačních zdrojů: z organizace hierarchicky centralizované k organizaci sociálně distribuované41 – je zveřejněn na serveru vydavatele časopisu. Podobně, vydavatelství Oxford University Press zveřejnilo mimořádně článek Davida C. Blaira Vyhledávání informací a filozofie jazyka z roku 1992 na svém serveru42.
V rámci průzkumu bylo také zaznamenáno několik málo zdrojů nabízených k volnému využití s podmínkou předchozí registrace na serveru časopisu nebo nějaké služby. Z celku všech zjištěných zdrojů jde o 22 titulů (2,6 %), ovšem ve skutečnosti jde o 5 děl. Ve dvou případech jde o článek na pokračování, jedno s 5 částmi43 a druhé se 14 částmi44. Zahrnut je také jeden učební materiál uložený na školním portálu Univerzity Karlovy45 a 2 zahraniční články z komerčních časopisů zpřístupňované s nejasným statusem specifickými službami DeepDyve (http://www.deepdyve.com) a ScriBd (http://it.scribd.com).
Průzkum otevřeného přístupu k vědecké literatuře přinesl určitě jedno velké překvapení – zjištění nelegálního zpřístupňování velkého počtu komerčních dokumentů knižního charakteru a zejména charakteru článkového. Hypotéza průzkumu zněla (viz 2. kapitola): přibližně 8 %. Celkově však bylo zjištěno 122 titulů, tj. 14,7 %, tedy dvojnásobné množství. Jde o celkem 30 knih a 100 článků z časopisů. Největší množství literatury knižního nebo sborníkového charakteru bylo nalezeno v zahraniční digitální knihovně známé pod zkratkou PEEF (stejné tituly se nyní nalézají také v nové elektronické knihovně BookZa). K nim je nutno přiřadit další knižní tituly domácí české provenience dostupné nelegálně v digitalizované formě ze serveru Ulozto.cz.
Vydavatelské digitální kopie vědeckých článků z komerčních časopisů a sborníků pak byly nalezeny v elektronické digitální knihovně BookSC. Obě zahraniční digitální či elektronické knihovny se objevily na internetu nedávno, první počátkem roku 2013, druhá před rokem. Nejsou ze známých důvodů indexovány vyhledávačem Google.
Obr. č. 1: Zobrazení komerčního knižního titulu v digitální formě v digitální knihovně PEEF zpřístupňovaného nelegálně (převzato z webu 9. 9. 2013, http://203.128.31.71/articles/ThesarusConstruction.pdf, nyní také http://bookza.org/book/1068273/cbc43f)
Digitální knihovna s anglickým názvem PEEF's Digital Library: Online Public Access Catalogue má vstupní stránku na různých adresách. Patří k nim také dvě oficiální adresy (http://www.peef.org.pk/DigitalLibrary.asp) nebo http://metro-natshar-31-71.brain.net.pk/).
Stránky informují, že jde o digitální knihovnu Paňdžábského vzdělávacího nadačního fondu (The Punjab Educational Endowment Fund, http://www.peef.org.pk/) v Indii. Vstup do systému knihovny z výše uvedených adres je možný pouze na základě registrace46. Existuje však také další „úniková“ adresa (http://203.128.31.71/) pro vstup do systému a ta již nepožaduje nic (přístup ale bývá občas mimo provoz). Pokud přístup funguje, uživatel může neomezeně knihovnu využívat. K dispozici je jednoduché vyhledávací rozhraní, které nabízí několik málo selekčních polí: typ dokumentu (knižních dokumentů je celkem 16 024), autor, název díla, název časopisu/jméno konference, klíčová slova v angličtině, a rok. Tematická struktura fondu je pestrá.
Fond této knihovny byl v rámci průzkumu prověřen vícenásobně v rozpětí únor až září 2013. Bylo v něm identifikováno celkem 6 knižních titulů a jeden encyklopedický, které spadají profilu bibliografické databáze z oboru Organizace informací a znalostí. Příkladem může být významná knižní publikace britských autorů s názvem Konstrukce a využívání tezaurů: praktická příručka (viz obr. č. 1), kterou vydalo vydavatelství Fitzroy Dearborn Publisher47.
Obr. č. 2: Zobrazení komerčního knižního titulu v nekvalitní digitalizované formě v digitálním fondu serveru Ulozto.cz zpřístupňovaného nelegálně (převzato z webu 9. 9. 2013, http://ulozto.cz/x8pVh2T/umela-inteligence-1-pdf)
Na pověstném českém serveru Ulozto.cz (http://www.ulozto.cz) bylo nalezeno celkem 14 významných knižních děl, zahrnutých do bibliografické báze výzkumného projektu. Šlo vesměs o díla českých autorů anebo o překlady děl zahraničních autorů. Digitální fond tohoto serveru se vyznačuje velmi nízkou kvalitou digitalizovaných kopií a velmi často je vidět označení knihovny, jejíž exemplář se stal předlohou digitalizace. Příkladem může být známý knižní titul kolektivů autorů Umělá inteligence (viz obr. č. 2), který vydán vydavatelstvím Academia48.
Elektronická knihovna BookSC (Electronic library. Download articles free. Finding articles, http://booksc.org/) o sobě sděluje, že je největším skladištěm vědeckých článků zdarma. V jejím fondu, jak je deklarováno, je přibližně 20 000 000 článků, na hlavní stránce se uvádí, že jde přesně o 18 761 578 dokumentů (k 23. 9. 2013).
Knihovna BookSC také oficiálně sděluje, že nemá žádný automatizovaný systém pro získávání nových textů, vyzývá k zaslání dokumentů e-mailem. Podle analytického serveru StatsCrop49 je tato knihovna v provozu přibližně 1 rok, server je lokalizován v Lucembursku a primární využívání je realizováno v Indii. Na internetu je označena za pirátskou knihovnu50. Má velmi jednoduché rozhraní pro vyhledávání (jedno okno), rešeršní formulaci lze také označit jako přesnou (Exact matching). Testování na příkladech z bibliografické databáze potvrdilo, že k nalezení titulu fakticky postačuje přesný název komerčního článku. Zobrazovány jsou velmi jednoduché metadatové záznamy, stahování může být mírně komplikované. Její chod je občas poznamenán zástavou (půl dne apod.). Příklad (na obr. 3) zobrazuje velmi známý článek dánského experta Birgera Hjørlanda s názvem Teorie pojmu (publikován byl v roce 200951), který tato knihovna zpřístupnila nelegálně.
Knihovna byla prověřována na přítomnost titulů z výzkumné bibliografické databáze. Nalezeno bylo celkem 84 titulů článků z komerčních časopisů (jde o poměrně vysoké číslo) z následujících komerčních digitálních knihoven (uvedeny jsou jenom hlavní):
SpringerLink (Springer) – 20 titulů
Wiley Online Library (Wiley) – 33 titulů
ScienceDirect (Elsevier) – 21 titulů
Obr. č. 3: Zobrazení známého článku B. Hjørlanda (z produkce vydavatelství Wiley) v digitální formě nelegálně zpřístupňovaného knihovnou BookSC (převzato z webu 9. 9. 2013, http://booksc.org/book/623716)
Lze vyslovit domněnku, že knihovna BookSC zpřístupňuje velká kvanta digitální produkce zejména tří výše zmíněných komerčních nakladatelů. Testy jiných uživatelů by mohly potvrdit, že tomu tak skutečně je anebo není. Dalšími postiženými vydavateli jsou Emerald (4 články), ACM (3 články), IEEE (2 články), APA (2 články) a někteří jiní s jedním článkem.
Bližší porovnání nelegálně zpřístupňovaných článků s články, které ma výzkumný tým k dispozici na základě licence, vede k závěru, že jde z větší části o duplicitu. Jsou však také tituly, které v licenci nemá k dispozici, například článek52 Role pro sémantické technologie a nástroje v knihovnách z digitálního fondu Taylor & Francis Online.
Elektronická knihovna BookSC měla další novou „sestru“ – projekt elektronické knihovny BookOS (http://bookos.org/), která nabízela knižní tituly (deklarovala cca 2 miliony knih). V průběhu listopadu 2013 byla však knihovna přestěhována na novou adresu (http://bookza.org/) pod názvem BookZa (původní adresa byla obsazena jiným subjektem). Tento nelegální digitální fond již nebyl v rámci průzkumu kompletně prověřován, pouze kontrolní náhledy potvrdily, že obsahem jsou stejné knižní tituly, které má také fond digitální knihovny PEEF, a pravděpodobně ale i další (viz poslední URL uvedené v záznamu poznámky 47, popř. viz konferenční sborník na URL http://bookza.org/book/773945/223277).
Výzkumný tým mimořádně prověřoval přítomnost zaznamenávaných titulů (zejména knižních, encyklopedických a sborníkových děl) v systému Google Knihy (Google Books). V tomto systému jsou v řadě případů k vidění náhledy do digitalizovaných dokumentů, v některých případech poměrně i velký rozsah stran a v určitých případech je k dispozici text celý. Tituly byly identifikovány pomocí mezinárodních identifikátorů (ISBN). Tento kód je také, pokud existuje, součástí jedinečné identifikace titulu v daném URL. V ostatních případech mají tituly přidělen náhradní kód. Celý systém, zdá se, začal plnit, kromě jiných, i významnou bibliografickou funkci. Není vyloučeno, že se může časem změnit na úplný mezinárodní registr knižní produkce.
Z celku všech titulů, zaznamenaných v bibliografické bázi (826) výzkumného projektu, bylo v systému Google Knihy zaznamenáno celkem 268 titulů (32,4 %), z toho 187 knih, 36 příspěvků ze sborníků, 15 kapitol z knih, 13 sborníků jako celek, 8 výzkumných zpráv, 2 encyklopedická hesla, 2 vysokoškolské kvalifikační práce, 2 systémy znalostí, 2 učební materiály a 1 norma.
V této poslední části jsou stručně přestaveny výsledky kontroly otevřeného přístupu u článků z komerčních časopisů, prestižních pro obor Organizace informací a znalostí. V bibliografické databázi se nacházejí záznamy článků z celkem 116 časopisů, tabulka č. 6 zobrazuje 20 časopisů s uvedením počtu zaznamenaných článků.
Předmětem rozboru se staly vybrané zahraniční časopisy.
Prestižní a pro výzkum zvoleného oboru podstatný časopis Knowledge organization, ISSN 0943-7444, vydává nakladatelství Ergon (Německo). Jde o impaktovaný časopis se „žlutou politikou“, v zásadě je možné volně zpřístupňovat jenom preprinty. Z 68 článků, zaznamenaných v databázi, bylo v otevřených repozitářích uloženo celkem 8 autorských preprintů (4 z nich jsou v archivu E-LIS) a 2 vydavatelské kopie (znamenají problém vůči stanovené politice vydavatele). Na volném webu bylo volně vystaveno celkem 9 preprintů a 2 vydavatelské kopie. Ve dvou případech se texty duplikují. Z daného časopisu53 je tedy celkem volně zpřístupněno 19 textů z 68, tj. 27,9 %. Výsledek je s ohledem na vydavatelskou politiku vcelku příznivý, lze však poznamenat, že by autorů ochotných ukládat preprinty, jako je například Jonathan Furner, Jens-Eric Mai nebo Birger Hjørland, mohlo v budoucnu i přibýt.
Tab. č. 6: Přehled počtu záznamů z excerpovaných seriálů (zahrnuty jsou jenom seriály se čtyřmi a více články)
Další prestižní časopis Journal of documentation, ISSN 0022-0418, vydává nakladatelství Emerald (Spojené Království). Jde o impaktovaný časopis se „zelenou politikou“. Je možné volně zveřejňovat preprinty i postprinty (po recenzním řízení), nelze ale zveřejňovat vydavatelské kopie. Ze 40 článků, zaznamenaných v databázi, byly v otevřených repozitářích uloženy jenom 3 preprinty (opět lze například uvést preprinty úspěšného B. Hjørlanda) a 2 vydavatelské kopie (problém vůči stanovené politice). Na volném webu byly volně vystaveny celkem 4 preprinty a 2 vydavatelské kopie (například kopie článků Koraljky Golubové na jejím personálním webu). Z daného časopisu je tedy celkem volně zpřístupněno 11 textů ze 40, tj. 27,5 %. Výsledek je s ohledem na vydavatelskou politiku slabší, přát si do budoucna lze také více „osvícených“ autorů.
Bývalý americký časopis Journal of the American Society for Information Science, ISSN 0002-8231 (Print), 1097-4571 (Online) a jeho aktuální následovník Journal of the American Society for Information Science and Technology, ISSN 1532-2882 (Print), ISSN 1532-2890 (Online) vydává americký nakladatel Wiley (USA). Jde o významné impaktované časopisy se „zelenou politikou“. Je možné volně zveřejňovat preprinty i postprinty (po recenzním řízení), nelze ale zveřejňovat vydavatelské kopie. Z 29 článků, zaznamenaných v databázi z obou časopisů, byl v otevřeném repozitáři uložen jediný preprint (jde fakticky o velmi malé množství). Na webu byly ale volně vystaveny celkem 3 preprinty (opět například preprinty B. Hjørland aj.) a 3 vydavatelské kopie (problém vůči stanovené politice). Z daného časopisu je tedy celkem volně zpřístupněno 7 textů z 29, tj. 24,1 %. Výsledek je s ohledem na vydavatelskou politiku slabší, do budoucna si lze přát, též v kontextu zjištěných výsledků nelegálního šíření produkce tohoto vydavatele, více autorů ochotných uložit preprint článku do otevřených fondů digitálních archivů.
Další významný americký časopis Library Trends, ISSN 0024-2594 (Print), ISSN 1559-0682 (Online), vydává Nakladatelství Univerzity J. Hopkinse (USA). Jde o významný impaktovaný časopis s výraznou „zelenou politikou“. Je možné volně zveřejňovat preprinty i postprinty (po recenzním řízení), status zveřejňování vydavatelských kopií není znám. Z 16 článků, zaznamenaných v databázi z tohoto časopisu, byl v otevřeném repozitáři (skvělý systém IDEAL) uložen celkem 1 preprint a 15 vydavatelských kopií! V tomto případě však pravděpodobně existuje dohoda a povolení vydavatele tyto vydavatelské kopie do repozitáře ukládat. Lze tak bezproblémově využívat významné práce B. H. Kwasnikové, R. P. Smiraglii, C. Beghtolové, E. Svenoniové aj. Na volném webu byl volně vystaven 1 preprint a 1 vydavatelská kopie, jde však o duplicitní texty vůči jmenovanému repozitáři. Z daného časopisu je tedy celkem volně zpřístupněno 16 textů z 16, tj. 100 %. Jde zatím o nejlepší výsledek v otevřeném zpřístupňování.
Významný časopis Cataloging & classification quarterly, ISSN 0163-9374 (Print), ISSN 1544-4554 (Online) distribuuje společnost Taylor & Francis Online (Spojené Království). Jde o recenzovaný časopis se „žlutou politikou“, v zásadě je možné volně zpřístupňovat jenom preprinty, navíc je stanoveno 18 měsíční embargo. V rámci bibliografické databáze není z daného časopisu volně zpřístupněn žádný text z 10, tj. 0 %. Výsledek je pro uživatele velmi nepříznivý. Je to ztráta i pro výzkumný tým, neboť k časopisu nemá online přístup.
Časopis Axiomathes, ISSN 1122-1151 (Print), ISSN 1572-8390 (Online) je vydáván vydavatelem Springer a zpřístupňován v sofistikovaném systému SpringerLink (Německo). Jde o významný impaktovaný časopis se „zelenou politikou“. Je možné volně zveřejňovat preprinty i postprinty (po recenzním řízení), nelze ale zveřejňovat vydavatelské kopie. Z 9 článků, zaznamenaných v databázi, byl v otevřeném repozitáři uložen jenom 1 preprint (preprintům přející autorky Uty Prissové). Na volném webu byla vystavena 1 vydavatelská kopie (na univerzitním webu autora Douglase Tudhopa). Z daného časopisu jsou tedy celkem volně zpřístupněny 2 texty z 9, tj. 22,2 %. Výsledek je s ohledem na vydavatelskou politiku ne příliš příznivý, je ale nutné ho brát již s rezervou, neboť jde celkově o malý vzorek.
Britský časopis Journal of information science, ISSN 0165-5515 (Print), ISSN 1741-6485 (Online) vydává a online zpřístupňuje společnost SAGE. Jde o impaktovaný časopis se standardní „zelenou politikou“. Je možné volně zveřejňovat preprinty i postprinty (po recenzním řízení), nelze ale zveřejňovat vydavatelské kopie. Z 9 článků, zaznamenaných v databázi, byly v otevřeném repozitáři uloženy 3 preprinty (zejména v repozitáři systému CiteSeer). Na volném webu byly vystaveny 2 preprinty a 1 postprint (přepis do kódu HTML). Ve dvou případech ale jde o duplicitu. Z daného časopisu jsou tedy celkem volně zpřístupněny 4 texty z 9, tj. 44,0 %. Výsledek je s ohledem na vydavatelskou politiku velmi příznivý, je třetí nejlepší. Výsledek je ale nutné interpretovat také s rezervou, neboť jde celkově o malý vzorek. Časopis řešitelům schází v online formě s licencí (byla zrušena pro nedostatek financí).
Americká seriálová publikace Annual review of information science and technology, ISSN 0066-4200 (Print), ISSN 1550-8382 (Online) je publikovaná společností Information Today pro Americkou společnost pro informační vědu a technologie. Jde o významný impaktovaný seriál (ročenku) se standardní „zelenou politikou“. Je možné volně zveřejňovat preprinty i postprinty (po recenzním řízení), nelze ale zveřejňovat vydavatelské kopie.
Z 6 článků, zaznamenaných v databázi, byly v otevřeném repozitáři uloženy 2 vydavatelské kopie (problém vůči stanovené politice). Na volném webu byly vystaveny 2 preprinty a jedna vydavatelská kopie. V jednom případě jde o duplicitu. Z daného časopisu jsou tedy celkem volně zpřístupněny 4 texty z 6, tj. 66,0 %. Výsledek je s ohledem na vydavatelskou politiku velmi příznivý, je druhý nejlepší. Výsledek je ale nutné interpretovat také s rezervou, neboť jde celkově o velmi malý vzorek.
V průměru bylo v rámci 8 analyzovaných časopisů volně dostupných 38,9 % článků, a to buď z repozitářů různých institucí (optimální forma), nebo z webů univerzit.
Průzkum dostupnosti informačních zdrojů z oboru Organizace znalostí a informací, zejména pak dostupnosti otevřené, přinesl zajímavá a někdy i překvapivá zjištění. Jeho výsledky jsou předloženy v této případové studii, která je jedním z výstupů v textu citovaného aplikovaného výzkumného projektu. Nejde v žádném případě o komplexní výzkum daného jevu, a proto jeho výsledky nebude možné v optimální míře zevšeobecňovat. Získané výsledky mohou ale posloužit jako hypotéza pro případné další výzkumy v této oblasti.
Měření dostupnosti, nicméně, vychází z poměrně dost rozsáhlé množiny záznamů informačních zdrojů. Reprezentativnost bibliografické databáze je zaručena odbornou kompetencí výzkumného týmu. Z celkového počtu 826 zdrojů je pro řešitele realizované výzkumné úlohy z oboru Organizace informací a znalostí dostupných (uvedená čísla byla získána z databáze na základě SQL dotazů, konkrétně byl uplatněn logický operátor OR):
Sledování komplexní dostupnosti zjištěných a vybraných informačních zdrojů poukázalo vhodně z druhé strany na nedostupnost celkem 69 zdrojů (přes 8 %) pro potřeby výzkumného projektu. Získání těchto titulů bude řešeno různými způsoby (nákupem, mezinárodní meziknihovní výpůjčkou aj.).
Legální otevřený přístup k vědeckým zdrojům podle výsledků měření v konkrétním oboru Organizace znalostí a informací, představených v rámci této případové studie, celkově narůstá. Ne však velkým tempem. Stav není obecně pro uživatele stále uspokojivý. Politika stran otevřeného přístupu u zaznamenaných vydavatelů je příznivá, přesto velké množství autorů svoje preprinty neposunuje do volného prostoru k jejich lepšímu a rychlejšímu využívání. Společnost a akademické komunity čeká ještě mnoho práce v oblasti zvyšování gramotnosti autorů v tomto směru. Bude nutné i nadále analyzovat situaci v této oblasti a posilovat a zavádět další podpůrné formy ke zlepšení stavu v oblasti otevřeného přístupu k výsledkům vědy a výzkumu.
Článek podléhá licenci CC BY-NC-ND (http://creativecommons.org/licenses/by-nc-nd/3.0/cz/)
BRATKOVÁ, Eva. Otevřený přístup k vědecké literatuře: případová studie pro obor Organizace informací a znalostí. ProInflow [online]. 07.01.2014 [cit. 25.08.2014]. Dostupný z WWW: <http://www.phil.muni.cz/journals/index.php/proinflow/article/view/751>. ISSN 1804–2406.