Previous Next
Desátá léta v podobách kritiky podruhé RADEK TOUŠ Když autorský kolektiv pedagogů a studentů ze Slezské univerzity v Opavě představil roku 2013 publikaci Desátá...
Ad maiorem Iosephi Vintr gloriam aneb Jesuitica k narozeninám významného bohemisty ONDŘEJ PODAVKA Josef Vintr je významný bohemista, žijící od roku 1968 ve Vídni, kde po mnoho let působil jako profesor...
Ta Věra vůbec nemluví MIROSLAV KOTÁSEK Veronika Košnarová otevírá svou knihu o tvorbě Věry Linhartové poukazem na rozporné přijímání jejích...

GABRIELA ROMANOVÁ — VOJTĚCH MALÍNEK

Digitální technologie nabízejí čím dál dokonalejší nástroje pro práci s texty a dalšími materiály nejen na poli literární vědy. Bibliografie jako disciplína, která díky technickému pokroku již před delší dobou opustila katalogizaci prostřednictvím papírových lístečků, stojí před čím dál naléhavějším úkolem klást si nové výzkumné otázky, pro jejichž zodpovídání může využívat velké datové soubory a verifikovat tak většinou induktivně vyvozované teze základního výzkumu. Jedním z projektů, který propojuje činnost českých a polských literárních vědců, je spolupráce mezi Českou literární bibliografií (provozovanou Ústavem pro českou literaturu AV ČR) s Centrem Humanistyki Cyfrowej Instytutu Badań Literackich Polskiej Akademii Nauk; právě toto pracoviště mj. provozuje literární bibliografii polskou (Polska Bibliografia Literacka — poznaňská pobočka Instytutu Badań Literackich PAN). V rámci vzájemné spolupráce si oba týmy nejen vyměňují zkušenosti s běžným bibliografickým provozem, řeší důležité metodologické otázky i budoucnost bibliografie jako svébytné disciplíny, ale souběžně prověřují též související možnosti výzkumu velkých dat metodami digital humanities či spolupracují v otázkách studia opoziční kultury v období komunistických diktatur.
Předmětem workshopu pořádaného oběma institucemi dne 17. října 2019 na půdě ÚČL byla prezentace výsledků tříletého mobilitního projektu (2017–2019) s názvem „Future of Polish and Czech Literary Bibliography: towards integration and exploitation in comparative research“, financovaného oběma národními akademiemi, jehož hlavními řešiteli jsou Piotr Wciślik (IBL PAN) a Vojtěch Malínek (ÚČL AV ČR). Odpolední blok prezentací zahájil vedoucí ČLB Vojtěch Malínek, který shrnul intenzivní kooperaci mezi oběma týmy, upozornil především na novinky v portfoliu aktivit ČLB — na zahájení zpracování bibliografie literárního internetu a samizdatu a na připravované webové stránky ČLB s integrovaným vyhledávacím nástrojem VuFind. Průběh projektu a jeho výsledky zhodnotil i Piotr Wciślik, který v rychlém přehledu představil společné aktivity obou pracovišť, ať již v rámci projektu, či mimo něj (společná vystoupení k problematice bibliografie literárního internetu na konferencích o šedé literatuře v Praze či Document Academy v Turíně nebo prezentaci k obecným možnostem kvantitativního výzkumu bibliografických dat na výroční konferenci DH2019 v Utrechtu v červenci tohoto roku). Zároveň též přiblížil aktivity projektu NEP4DISSENT, financovaného z programu COST, který koordinuje společně s Maciejem Marylem, vedoucím CHC IBL PAN a též členem řešitelského týmu projektu. Výzkum problematiky opoziční kultury tvořil vedle bibliografické agendy druhý základní pilíř zmiňovaného mobilitního projektu, který tak byl propojen i s výzkumem ostatních badatelů v oblasti studií východoevropského a středoevropského disentu, např. Petry Loučové, Michala Kopečka, Tomáše Glance, Pawła Sowińského ad., nebo s dlouhodobým výzkumem čtenářství Jiřího Trávníčka.
Tomasz Umerle, zástupce vedoucí Polské literární bibliografie, pak v krátkosti shrnul aktuální situaci PBL a zejména aktivity Bibliographical Data Working Group, jejíž vznik při evropské výzkumné infrastruktuře DARIAH-ERIC iniciovali společně s V. Malínkem a která by se měla stát platformou pro vzájemnou diskuzi producentů bibliografických dat, datových výzkumníků a IT developerů.
Otázky, které před bibliografy stojí jako nová výzva, byly soustředěny zejména ve druhém bloku příspěvků, týkajících se nejprve internetových zdrojů — jejich katalogizace a digitalizace. Tuto problematiku podrobněji popsaly Pavla Hartmanová a Paulina Czwordon-Lisová, přičemž zhodnotily rozdílnou míru archivování polských a českých literárních webů a zaměřily se i na otázku výzkumu a evidence literárních blogů. Existence českého WebArchivu se z této perspektivy jeví jako krok napřed oproti polskému internetovému prostředí, které dosud systematicky archivováno není.
Maciej Maryl seznámil následně publikum se softwarovými nástroji nabízenými evropskou výzkumnou infrastrukturou CLARIN, mj. nástrojem pro automatické rozpoznávání klíčových slov ve fulltextu (Name Entity Recognition). Na jeho přednášku navázal technický výklad Cezaryho Rosińského a jeho praktická ukázka, jak lze v různě strukturovaných bibliografických databázích vyhledávat a sdružovat identické položky, demonstrovaná na příkladu báze PBL a mezinárodní autoritní báze VIAF. Nutno dodat, že v případě jmenných i věcných autorit taková práce u české bibliografie částečně odpadá díky existenci databáze národních autorit (AUT) provozované Národní knihovnou ČR a databáze českých literárních osobností (CLO), která je zpracovávána v bibliografickém archivu ÚČL.
Translatolog a nový člen českého bibliografického týmu v oblasti digital humanities Ondřej Vimr dokladoval na konkrétní případové studii, k čemu se dají využít bibliografická data — porovnáváním četnosti překladů beletrie do různých jazyků zastoupených v analyzovaném datasetu vysledoval mj. postupnou intenzifikaci překladů skandinávské literatury do jiných národních jazyků od 70. let do současnosti či žánrové proměny překladů z jednotlivých národních literatur ve stejném období.
Závěrem byl formou kulatého stolu představen projekt polské stopy v českém samizdatu. Krátké debaty se účastnili jeho představitelé: Jerzy Kandziora, autor knižní bibliografie Bez cenzury 1976–1989. Literatura — ruch wydawniczy — teatr, Piotr Wciślik, Maciej Maryl a Cezary Rosiński, za českou stranu pak dámské osazenstvo Petra Loučová, Anna Gnotová a Gabriela Romanová, jež pohovořily o úskalích při zpracovávání polského drugeho obiegu a českého samizdatu.
Ze všech příspěvků vyplynulo, že velké bibliografické databáze nabízejí obrovské množství různě strukturovaných dat, při jejichž zpracovávání není s ohledem na často odlišnou strukturu jednotlivých bází zcela jednoduché extrahovat a následně spojovat informace stejného druhu. Do budoucna se tedy nabízí otázka po sofistikovanějších nástrojích, které budou schopny spolehlivěji rozpoznávat položky stejné kvality mezi množstvím různorodě strukturovaných dat; zároveň mohou bibliografové přemýšlet o tom, zda nezačít záznamy klasifikovat jiným způsobem, který by digitálním nástrojům umožnil zadaná data lépe třídit pro účely kvantitativního výzkumu, a nabídnout tak značný inovativní potenciál.

Vyšlo v České literatuře 5/2019.