V příspěvku je navržen konceptuální model vnitřní struktury informace jakožto entitní struktury reálného světa. Autoři neusilují o definici informace. Neptají se, co je informace, ale jaká je její struktura. K návrhu struktury informace bylo využito konceptuálního modelování. Je zde proto uveden stručný úvod do konceptuálního modelování ve smyslu počítačové vědy a je ukázáno, že konceptuální modely je možné chápat jako součást Aplikované logiky. Je vytvořen konceptuální model informace. Následně je vymezena určitá analogie mezi Konceptuálním modelem informace a FRBR modelem bibliografického záznamu. Vztah informace a subjektu a dynamická stránka pojmu informace jsou záměrně z modelu vynechány.
vnitřní struktura informace, konceptuální modely, informační věda, informace, FRBR, entitní struktura
The paper proposes a conceptual model of the internal structure of information as the entity structure of the real world. The authors do not seek to define the information. They do not ask what the information is, but what is its structure. For the purpose of the design of the information structure was used the method of conceptual modeling. Therefore, there is a brief introduction to conceptual modeling in terms of computer science, and it is shown that conceptual models can be viewed as part of applied logic. The conceptual model of information is created. Subsequently a certain analogy between the conceptual model of information and FRBR model is defined. The relation of information and a subject and the dynamic aspect of information is deliberately omitted from the model.
internal structure of information, information science, information, FRBR, entity structure, conceptual models
Prof. PhDr. Jela Steinerová, Ph.D.
Dr. Ing. Zdeněk Kadlec
Pojem informace nás provází všemi oblastmi života, má řadu aspektů a lze mu rozumět z mnoha různých pohledů. Člověk si jej přirozeným způsobem interpretuje, ovšem interpretace mohou být navzájem velmi rozdílné a obtížně slučitelné.
Cílem našeho článku není hledat nové nebo inovované definice pojmu informace. Autoři se spíše metodou konceptuálního modelování snaží postihnout vnitřní strukturu informace jakožto entitní struktury reálného světa.
Pro široké pochopení pojmu informace je vhodné vyjít např. z Encyklopedie knihovní a informační vědy. Marcia J. Bates (2009) shrnuje základní kategorie definic pojmu (konceptu) informace do sedmi skupin a rozebírá stanoviska hlavních zástupců jednotlivých definic. Za všechny jmenujme např. významného teoretika informační vědy Michaela Bucklanda, který představil tzv. „trojí pojetí informace“. V tomto konceptu specifikuje informaci chápanou jako znalost, informaci jako věc a informaci jako proces (Buckland, 1991). Tyto tři základní pohledy jsou všechny stejně validní, je třeba jim rozumět jako celku. Richard L. Derr (1985) využil, jak sám konstatuje, filozofických metod konceptuální analýzy k definici informace: informace je abstraktní, smysluplná reprezentace výroků o věcech (information is an abstract, meaningful representation of determinations made of objects).
Rafael Capurro a Birger Hjorland (upd. 2011) shrnují různé pohledy na definice a pojem informace. Nejdůležitější rozdíl vidí v rozlišování informace jakožto „objektu“ nebo „věci“ a informaci jakožto znaku, závisející na interpretaci subjektu. Z českého prostředí je jistě důležité zmínit dílo prof. Cejpka (2. vyd. 2005), který informaci chápal jako fyziologický jev a proces.
Pro úvod je dobré si připomenout též poměrně populární definice triády data-informace-znalost.
Data: Reprezentace informací vhodně formalizovaná pro komunikaci, interpretaci a zpracování lidmi a automaty. Data mohou být reprezentována libovolnými řetězci znaků (čísel, příkazů, vět) uloženými na informačním nosiči. Data nemají zpravidla význam sama o sobě, ale teprve jsou-li pochopena, interpretována, komunikována a využita člověkem nebo počítačem, stávají se smysluplnými informacemi (Jonák aj., KTD).
Informace: V nejobecnějším slova smyslu se informace chápe jako údaj o reálném prostředí, o jeho stavu a procesech v něm probíhajících. Informace snižuje nebo odstraňuje neurčitost systému (např. příjemce informace); množství informace je dáno rozdílem mezi stavem neurčitosti systému (entropie), kterou měl systém před přijetím informace a stavem neurčitosti, která se přijetím informace odstranila. V tomto smyslu může být informace považována jak za vlastnost organizované hmoty vyjadřující její hloubkovou strukturu (varietu), tak za produkt poznání fixovaný ve znakové podobě v informačních nosičích (zkráceno; Jonák, aj., KTD).
Znalost: Schopnost člověka nebo jakéhokoli jiného inteligentního systému uchovávat, komunikovat a zpracovávat informace do systematicky a hierarchicky uspořádaných znalostních struktur. Znalost je charakterizována schopností abstrakce a generalizace dat a informací (Jonák aj., KTD).
V našem článku se zaměříme zejména na statické pojetí informace, tj. nepracujeme s problematikou časovosti informace a rámec našeho zkoumání též přesahuje problematika příjemce informace, interpretace informace a formulování znalosti subjekty.
Naším cílem je analýza vnitřní struktury informace. Rádi bychom upozornili na možná jistou slovní podobnost konceptu informace k našemu pojetí konceptuálního modelu informace. Nesnažíme se nově definovat informaci jako pojem (koncept), ale snažíme se modelovat její vnitřní strukturu pomocí metod konceptuálního modelování, jak jej používá počítačová věda.
Jako výchozí chápeme dvě hlediska na rozsah informace: sémantický obsah informace (myšlenkový obsah) a její syntaktickou formu (řetězec znaků) – např. Bucklandova informace jako znalost a informace jako věc. Ve statickém pojetí je tedy informace definována jako myšlenkový obsah vyjádřený formou syntaktické reprezentace. Třetí pojetí informace (Bucklandova informace jako proces) přináší k dvěma již zmíněným pohledům ještě dynamický a časový rozměr a lze ho chápat jako procesní nadstavbu dvou předchozích přístupů. Protože neuvažujeme procesuální pohled na informaci, nevyužijeme toto třetí pojetí a nevymezujeme se ani vůči např. Cejpkově (2. vyd. 2005) pojetí informace jako fyziologického jevu a procesu.
Pro popis a znázornění vnitřní struktury informace použijeme tedy metodu konceptuálních modelů, které se používají v počítačové vědě. Ukážeme, že informace tak, jak je běžně chápána a používána, je ve své vnitřní struktuře vzájemné propojenou množinou entit.
Po vytvoření konceptuálního modelu informace následně ukážeme ve 4. kapitole, že náš model je do určité (pouze částečné) míry podobný známému modelu FRBR, který se používá v knihovní a informační vědě.
V tomto článku bychom tedy nejprve vyložili obecné principy konceptuálních modelů, pak popíšeme a zdůvodníme základní konceptuální model informace, v další části ukážeme vztah základního konceptuálního modelu informace ke konceptuálnímu modelu FRBR v knihovní a informační vědě.
Konceptuální modely (ve smyslu Počítačové vědy, tj. v rámci tvorby informačních systémů) se zabývají reprezentací nejobecnější struktury výseku reality. Výsek reality je část reálného světa omezená, jak co se týče rozsahu, tak i co se týče úrovně detailnosti (např. výtisk knihy chápeme jako jednotlivinu a nikoliv jako množinu atomů).
Vůbec nejobecnějším pohledem na skutečnost (tj. na výsek reality) je pohled logiky – fakticky úhel pohledu predikátové logiky.
Základním pojmem predikátové logiky je pojem Univerza jednotlivin (tzv. Universum diskurzu). Univerzum U je množina jednotlivin v daném výseku reality. Jednotliviny lze také chápat jako věci v zobecněném smyslu – věci mohou být hmotné i nehmotné (např. myšlenky, koncepty apod.).
Předpokládá se, že pro prvky univerza je dána množina vlastností (tj. predikáty s aritou 1), dále množina vztahů (tj. predikáty s aritou 2) a obecně predikáty s aritou n.
Výchozí představou konceptuálního modelování je idea, že universum sestává z množiny věcí různého druhu a že je možné universum rozdělit na části sestávající z věcí stejného druhu.
Takováto část universa sestávající z věcí stejného druhu se obecně nazývá Entita (ve smyslu konceptuálních modelů v Počítačové vědě).
Definice: Entita je množina prvků universa, které jsou stejného druhu (tj. množina věcí stejného druhu). Prvek entity nazýváme výskytem této entity. Entita je tedy množina věcí (hmotných nebo nehmotných), které reálně existují a které jsou stejného druhu.
V dalším kroku je třeba uvažovat vlastnosti věcí. Pokud by věci neměly určité vlastnosti, nebylo by ani možné je rozlišit mezi sebou. Vlastnosti výskytu entity nazýváme atributy. Atribut A náleží k určité entitě E a ke každému atributu A je určena množina jeho možných hodnot DomA. Potom atribut A nabývá na výskytu v entity E hodnotu:
A ( v ) je prvkem DomA .
Ke každé entitě je tedy popsána sada jejích atributů. Pro každou entitu existuje sada „typických“ atributů. Zatímco sada atributů je vlastností entity, hodnoty těchto atributů jsou vlastností výskytu entity.
Pro konceptuální modely jsou podstatné Vztahy (někdy se nazývají relace – ale my tento termín používat nebudeme). Vztahem se rozumí vztah mezi výskyty jedné entity a výskyty druhé entity. (Lze uvažovat také vztahy mezi výskyty více entit, obecně mezi n entitami, n>2, ale my budeme uvažovat pouze vztahy s aritou 2.)
Příkladem typického vztahu je např. vztah Autorství mezi výskyty entity Autor a mezi výskyty entity Dílo. Určitý autor může být autorem několika děl a určité dílo může mít několik autorů (několik = 0, … až N, N=libovolné přirozené číslo).
Takovýto vztah označujeme jako vztah typu N:N a znázorňujeme jej diagramem
Zde obdélník s nápisem uvnitř znázorňuje příslušnou entitu a spojnice mezi obdélníky znázorňuje vztah.
Konec spojnice typu znamená tzv. kardinalitu 0 až N – tj. několik výskytů.
Vztahy N:N ovšem nejsou nejčastějším typem vztahu. Základním typem vztahu je vztah typu 1:N, který si můžeme představit např. jako vztah mezi vydáním určitého díla a výtiskem tohoto díla. Pro daný výtisk existuje právě jedno vydání, jehož součástí tento výtisk je. Na druhou stranu vydání obsahuje obecně N výtisků (N je nějaké přirozené číslo). Vztah mezi výskyty entity Vydání a výskyty entity Výtisk bychom mohli zobrazit takto:
Diagram vyjadřuje skutečnost, že každý výtisk pochází z určitého vydání nebo více výtisků může pocházet ze stejného vydání.
Tento vztah popisujeme jak vztah 1:N , tj.
1 vydání několik výtisků
Dále pro ilustraci zatímco symbol znamená 0 až N, symbol znamená 0 nebo 1 tj. nejvýše jeden.
Dále je vhodné zavést pojem entitní struktury:
Definice. Entitní strukturou se rozumí množina reálných entit, jejich atributů a jejich vzájemných vztahů.
Konceptuálním modelem rozumíme model entitní struktury reálného světa.
Konceptuální modely jsou nejobecnějšími modely skutečnosti, protože obecnějším modelem může být pouze model predikátové logiky založený na pojmech universa a predikátů.
Konceptuální modely, založené na pojmech Entity, Atributů a Vztahů jsou vhodné pro zachycení specifiky výseku reálného světa. V tomto smyslu je třeba chápat teorii konceptuálních modelů jako část aplikované logiky. Obecně je možné každý konceptuální model vyjádřit pomocí predikátové logiky, ale takové vyjádření je nevhodné a nešikovné pro popis specifiky reálného světa.
Ze studie Bucklanda zmíněné výše a z ostatních přístupů pojmu informace (např. R. Derr, B. Hjorland,R. Capurro) je možné konstatovat, že pojetí informace osciluje mezi pojetím informace jako sémantického obsahu a pojetím informace jako dokumentu.
Výše jsme již dospěli ke zjištění, že informaci není možné modelovat jako model jedné entity. Je tedy nutné uvažovat, že má komplexní strukturu sestávající z několika entit.
Námi předkládaný model informace je statický. Neuvažuje časovou dynamiku informace a jejích reprezentací. Stejně tak kontext informace je v modelu potlačen.
Základní entitou při modelování pojmu informace je entita Obsah informace ( = sémantický obsah informace). Výskyty této entity reprezentují vlastní myšlenkový obsah dané informace. Ke smyslu a nutnosti existence této základní entity se vrátíme později.
Sémantický obsah dané informace může ovšem být vyjádřen různým způsobem vzhledem k použitému jazykovému systému – tj. v různých jazykových mutacích. Jazykový systém je systém umožňující spojovat jazykové výrazy s významy. (Obecněji lze uvažovat znakové systémy umožňující spojovat znaky a znakové řetězce s významy. Znakem může být skoro cokoliv : zvuk, obraz, pohyb atd. (Pro snazší znázornění se omezíme na využívání jazykových systémů). V této souvislosti jako jeden z příkladů je možné uvažovat tzv. „číselníkovou“ entitu Jazyk, která obsahuje seznam použitelných jazykových systémů.
Vyjádření určitého informačního obsahu v různých jazykových systémech budeme uvažovat jako výskyty entity Vyjádření informace. Vyjádřením informace může obecně být nejen text, ale i notový zápis, video, audio apod., záleží na použitém znakovém systému.
Uvedeme příklad: sémantický obsah informace „v Praze prší“ může mít např. tato vyjádření v různých znakových systémech:
Vidíme, že různá vyjádření vyjadřují tentýž sémantický obsah v různých jazykových systémech.
Obsah informace je tedy to, co mají tato různá vyjádření společného.
Další důležitou součástí struktury pojmu informace je zachycení (zaznamenání) určitého vyjádření dané informace na nějaký nosič. Toto zaznamenávání je obecně vícenásobné, tj. je současně vytvořeno N kopií tohoto zaznamenání (např. N = počet výtisků v určitém vydání).
Výskytem entity Zapsání informace je každé takovéto vícenásobné zaznamenání určitého vyjádření určité informace na nějaký nosič. Nosičem může být: potištěný papír, soubor na disku, soubor uložený na síti, nahrávka v rozhlase atd. Zapsání informace můžeme chápat jednak jako proces vytvoření N kopií a jednak jako tuto množinu kopií – není třeba tyto dva významy podrobně rozlišovat.
Každé Zapsání informace obsahuje obecně N kopií. Každá jednotlivá kopie se nazývá záznamem informace a výskyty těchto záznamů informace tvoří entitu Záznam informace. Entita záznam informace odpovídá pojetí informace jakožto „nosiče“ (informace jako věc).
Výskyty entity Obsah informace jsou nehmotné věci a stejné je to i pro výskyty entit Vyjádření informace a Jazyk. Výskyty entity Záznam informace jsou hmotné věci (záznam na elektronickém mediu považujeme za hmotnou věc), zatímco výskyty entity Zapsání informace jsou množiny hmotných věcí.
Vztahy mezi výskyty uvedených entit jsou typu 1:N, a to mezi entitami
Vzájemné vztahy mezi výskyty uvedených entit je možné zobrazit následujícím diagramem:
Tento základní model vnitřní struktury informace je možné rozšířit o vhodné číselníkové entity (ve smyslu uspořádaných seznamů):
Výskytem entity Místo uložení může být např. webová adresa, kde je záznam informace dosažitelný. Dalším možným rozšířením modelu je zahrnutí původců, tj. osob odpovědných za výskyty entity:
Stejně tak je možné model rozšířit o entitu příjemce informace a z ní vyplývajících entit. Zde bychom však vstoupili do oblasti poznávacího procesu a problematiky znalosti, která je výsledkem interpretace Obsahu informace subjektem. Jak jsme uvedli v začátku studie, tuto oblast neuvažujeme a ponecháváme ji dalšímu zkoumání a modelování do budoucna.
My budeme pracovat především se základním strukturálním modelem informace, který tedy sestává z entit:
a ze vztahů mezi nimi znázorněnými v základním konceptuálním modelu informace.
Tyto čtyři entity, jejich atributy a vztahy mezi nimi tvoří entitní strukturu, kterou chápeme jako (objektivní) strukturu informace. Konceptuální model informace obsahuje tuto entitní strukturu.
Model FRBR (Functional Requirements on Bibliographic Records, 1998, v českém jazyce Funkční požadavky na bibliografické záznamy, překl. 2002) je výsledkem analýzy struktury bibliografického záznamu na jedné straně a zejména výsledkem analýzy zájmů uživatelů o jednotlivé údaje bibliografického záznamu. Analýza se soustřeďuje na funkcionální vztahy mezi částmi bibliografického záznamu o určitém díle.
Výsekem reality v případě FRBR je tzv. bibliografické univerzum. Bibliografické univerzum je podle Smiraglii (2001, s. 1) univerzem zaznamenané znalosti, je to reálný svět, který identifikujeme (popisujeme) v bibliografických záznamech.
Technikou konceptuálního modelování byl vytvořen významný model bibliografického záznamu i bibliografického univerza jako celku.
Základ modelu FRBR tvoří tři skupiny entit. Pro potřeby našeho tématu se soustředíme zejména na centrální první skupinu, která obsahuje následující entity:
Dílo je výrazný intelektuální nebo umělecký výtvor. Je to abstraktní entita.
Příklad: Kundera, Milan. Žert
Vyjádření je intelektuální nebo umělecká realizace díla ve významotvorném systému, tj. v systému umožňujícím označovat významy (např. jazykovém systému apod.). Je to též abstraktní entita.
Příklad: Kunderův Žert v českém jazyce
Zhmotnění (provedení) je fyzické zhmotnění vyjádření díla. Entita definovaná jako provedení zahrnuje širokou škálu nosičů, včetně rukopisů, knih, periodik, map, plakátů, zvukových záznamů, filmů, videonahrávek, CD-ROMů, multimédií apod. Je to konkrétní entita
Příklad: Kunderův Žert - vydání u Sixty-Eight Publishers, 1989
Jednotka je jednotlivý exemplář provedení. Jednotka je konkrétní entita.
Příklad: jeden výtisk vydání
Z výše uvedeného v podstatě vyplývá, že část bibliografického záznamu se vždy vztahuje k dílu, část k vyjádření (např. údaje o jazyku díla), část k provedení (např. údaje o vydání) a část k jednotce (pokud součástí záznamu jsou i exemplářové údaje).
Vidíme, že obecný konceptuální model pro informaci a FRBR-model jsou podobné. Model FRBR je zjednodušený v tom, že je obecně definováno poměrně málo entit. Např. běžná entita jazyk je ve FRBR uvedena pouze jako atribut. Entita dílo je odlišná od entity obsah informace. Dílo je především výsledek intelektuální nebo umělecké činnosti tvůrce.
Podobnost mezi entitami lze vyjádřit následujícími vztahy:
V diagramu lze totéž popsat následovně:
Z hlediska konceptuálního modelování lze tedy chápat FRBR-model jako analogii obecného konceptuálního modelu informace.
V této studii jsme analyzovali vnitřní strukturu informace a jako výsledek této analýzy jsme navrhli konceptuální model vnitřní struktury informace sestávající (ve svém základu) ze čtyř entit
Mezi těmito entitami existují vztahy 1:N:
Ukázali jsme vztah podobnosti mezi konceptuálním modelem informace a FRBR-modelem.
Ukázali jsme dále, že klasické pojetí struktury informace, které osciluje mezi informací jako sémantickým obsahem a informací jako dokumentem (v našem příspěvku úmyslně vynecháváme pojetí informace jako znalosti) je třeba rozšířit na čtyři entity a zavést vztahy mezi těmito entitami, tj. vytvořit úplný konceptuální model informace.
Náš konceptuální model vnitřní struktury informace je plně objektivní a neobsahuje subjekt vnímající tuto informaci. (Díky tomu také nemůže obsahovat pojem znalosti, protože ten je subjektivní.) Náš konceptuální model informace obsahuje tu část struktury informace, která má objektivní charakter. Část struktury související s informací a subjektem může být do modelu doplněna, ale to bude předmětem dalšího zkoumání. Domníváme se, že náš model je možným objektivním modelem informace.
Mimo jiné jsme ve druhé části podali stručný úvod do konceptuálního modelování (ve smyslu počítačové vědy) chápaného jako součást aplikované logiky.
Pro ilustraci nabízíme srovnání rozsahu definic entit našeho modelu s pojmy definovanými v kapitole 1.1.
Model Informace |
|
Triáda: data-informace-znalost |
|
Buckland |
Obsah |
= |
Informace |
= |
inf. jako znalost |
Vyjádření |
= |
Informace |
= |
inf. jako znalost |
Zapsání |
= |
Data |
= |
inf. jako věc |
Záznam |
= |
Data |
= |
inf. jako věc |
SOUČEK, Jiří; SOUČEK, Martin; DROBÍKOVÁ, Barbora. Konceptuální model informace a FRBR. ProInflow [online]. 07.01.2014 [cit. 25.08.2014]. Dostupný z WWW: <http://www.phil.muni.cz/journals/index.php/proinflow/article/view/731>. ISSN 1804–2406.