Seznam autorů s jejich datem narození a úmrtí v xls

Text dotazu

Dobrý den, pro potřeby magisterské diplomové práce sháním seznam autorů (českých i zahraničních) u jejichž jmen by byla uvedena i data jejich narození a úmrtí. Kde bych takový seznam mohla najít, nejlépe s možností převedení do excelu? Zkoušela jsem namátkou prohledat nejrůznější weby knihoven, ale nenašla jsem způsob, jak se dostat k jednotnému seznamu jmen a dat.
Předem moc děkuji za odpověď.

Odpověď

Dobrý den,

nejobsáhlejší databází obsahující biografická data autorů je Databáze národních autorit Národní knihovny ČR (https://aleph.nkp.cz/cze/aut), konkrétně její dílčí báze pro jmenné autority (https://aleph.nkp.cz/cze/auj). V databázi můžete vyhledávat konkrétní osobnosti nebo si záznamy prohlížet pomocí rejstříků a vyhledané výsledky je možné uložit v souboru nebo odeslat na e-mailovou adresu. Export databáze do programu excel však možný není.

Databáze národních autorit je také jedním ze zdrojů, které Národní knihovna ČR nabízí v rámci otevřených dat. To znamená, že si kdokoliv může zdarma stáhnout celou databázi nebo její dílčí části (viz https://www.nkp.cz/o-knihovne/odborne-cinnosti/otevrena-data). Data jsou však dostupná ve formátu XML, je proto vhodné mít k dispozici aplikaci, která tento formát umí přečíst a dokáže ho přeformulovat do srozumitelné podoby, aby bylo možné s daty nějak rozumně pracovat. V případě personálních autorit (https://aleph.nkp.cz/data/aut_ja.xml.gz) neobsahují záznamy tolik údajů, takže nám připadá, že i ve formátu XML je možné je při určité snaze číst, v souboru lze také hledat použitím Ctrl+F.

Pokud se ve své práci zaměřujete na literární osobnosti, můžeme Vám doporučit i Databázi českých literárních osobností, kterou buduje Ústav pro českou literaturu AV ČR (http://clo.ucl.cas.cz/). V databázi lze vyhledávat a výsledky ukládat do schránky. Z této schránky si pak vybrané záznamy můžete odeslat na e-mailovou adresu. Export databáze však opět není možný.

 

 

 

 

 

Obor

Jazyk, lingvistika a literatura

Okres

--

Knihovna

Národní knihovna ČR

Datum zadání dotazu

13.02.2023 08:00

Jan Pešula píše:
Středa 15.02.2023 23:56
Znáte Wikidata ( https://www.wikidata.org/ )? Zkusil jsem tam vytvořit tento dotaz (query), snad se ho neleknete: https://w.wiki/6LkH . Spouští se tlačítkem vlevo dole. Vybere položky databáze:
- ke kterým existuje autoritní záznam v Národní knihovně (vlastnost P691)
- s povoláním (P106) v proměnné "job" - spisovatel (Q36180), básník (Q49757) nebo dramatik (Q214917)
- s datem narození v letech 1800 - 1899 (viz FILTER)
- s maximálním počtem 5000 výstupů (LIMIT)
- se sloupci tabulky: kód Wikidat (writer), jméno (writerLabel), datum narození (datebirth, P569), místo narození (placebirthLabel, P19), datum úmrtí (datedeath, P570), místo úmrtí (placedeathLabel, P20), pohlaví (genderLabel, P21), mateřský jazyk (langLabel, P103), autoritní záznam NK ČR (nkcr, P691) a popis (writerDescription).
- (Jako alternativu jsem nechal dva neaktivní řádky - #wdt:P19/wdt:P131* wd:Q838329 , který vybírá autory narozené v okrese Chrudim, a #wdt:P106/wdt:P279* wd:Q36180, kde je výběr povolání podle hierarchie - do nadtřídy "spisovatel" patří také např. scénárista, autor kuchařských knih apod. Aktivovat je můžete smazáním # na začátku řádku, v druhém případě je pak nutné deaktivovat poslední řádek, protože se vzájemně vylučují. Dotaz by se tím ale výrazně zpomalil - viz níže.)

Výstup se dá uložit např. jako csv pomocí tlačítka Stáhnout.

Zkuste, jestli by se Vám to takto hodilo a případně dotaz upravujte. Kódy vlastností (P...) a hodnot (Q...) najdete na některé z položek Wikidat (např. Karel Čapek - https://www.wikidata.org/wiki/Q155855 ), pokud najedete myší na příslušný odkaz nebo si ho přímo otevřete. Nebojte se že něco zkazíte - verze v zaslaném odkazu https://w.wiki/6LkH je fixovaná. Pokud budete naopak chtít uložit Vaši novou verzi, stiskněte tlačítko s řetězem na levé straně a dostanete nový odkaz.

Problémem této aplikace - kromě vzhledu (ze kterého mohou méně technickým uživatelům vstávat vlasy na hlavě) je omezení rozsahu - buď se zodpoví do 1 minuty, nebo se neukáže nic. Pokud se Vám to stane, nezbude než upravit výběr nebo snížit LIMIT. Také počítejte s tím, že se někteří autoři zobrazí víckrát - např. pokud mají v databázi nejednoznačná data (např. https://www.wikidata.org/wiki/Q13020 ) nebo víc autoritních záznamů v Národní knihovně ( https://www.wikidata.org/wiki/Q74864 ). Ty budete muset filtrovat v Excelu na základě kódu Wikidat v prvním sloupci.

Zkuste, jestli Vám to pomůže.

Hodně zdaru.
Jan Pešula píše:
Čtvrtek 16.02.2023 08:14
Ještě jsem o tom trochu přemýšlel a posílám velmi mírně poupravenou novou verzi - https://w.wiki/6Lnr .

- Na začátek jsem zadal filtr, aby dotaz vyhledával pouze lidi (wdt:P31 wd:Q5;). Možná se to tím trochu urychlilo.
- Seznam povolání jsem trochu rozšířil, ale stále budou mnozí literáti unikat. Výběr všech spisovatelských profesí podle nadtřídy ( #wdt:P106/wdt:P279 wd:Q36180. ) je bohužel neúnosně pomalý - možná i proto, že je jich mnoho. Seznam si můžete spustit zde: https://w.wiki/6Lnt .
- Výběr podle místa narození (stále jako příklad okres Chrudim) už funguje docela dobře, pokud ho aktivujete. Totéž pro datum narození (nyní též neaktivní).

Doporučuji si trochu pohrát s výběry (aktivovat a deaktivovat řádky pomocí # , přidávat či odebírat povolání v parametru job, zvyšovat či snižovat limit). Podívejte se na příklady (tlačítko nahoře), třeba vás inspirují - zdrojem pro mne bylo mj. "Humans born in New York City". Dokonalé to není, ale užitečné informace tam získat můžete.

Ještě jednou přeji hodně úspěchů.
Terezie píše:
Čtvrtek 16.02.2023 17:03
Dobrý den,
hrozně moc vám děkuji za tento nápad a že jste si dal tu práci vytvořit několik query! Zkusím to více prozkoumat. Zatím to vypadá jako nejnadějnější způsob, jak získat seznam, který potřebuji.
Ještě jednou moc děkuji a přeji vše dobré!
Jan Pešula píše:
Pátek 17.02.2023 08:46
Dobrý den,

Děkuji Vám za milou odpověď!

Váš dotaz jsem ještě zveřejnil na diskusní stránce Wikidat, kde si ho všiml velmi zkušený kolega, mj. bývalý předseda Wikimedia Czech. Napsal doslova (jen zformátováno):

"Možná že lepší bude použít námi generovaný výpis přímo z národních autorit ve formátu CSV, čili toto: https://autority.wikimedia.cz/output.csv . Případně je možné spustit toto query: https://w.wiki/6Lvk na Query službě s prodlouženým timeoutem - https://query.orb.how/ (ne každý k tomu má ale přístup, takže jsem výstup nahrál sem: https://docs.google.com/spr[…]&rtpof=true&sd=true ). Nemám teď moc čas, nenapsal bys jim to tam případně ty? Dík. Vojtěch Dostál 20:43, 16 February 2023 (UTC)"

Zkuste se na to ještě podívat a případně odpovědět tady nebo na Wikidatech ( https://www.wikidata.org/wi[…]otaz_na_ptejteseknihovny.cz ). Diskuse tam časem zmizí (bude přesunuta do archivu), ale minimálně v řádu dní by měla být aktivní. K lepší query zmíněné v odpovědi také nemám přístup,

Ještě připomínám hlavní rozdíly mezi Wikidaty a Národními autoritami (NK ČR):
- Národní autority jsou zaměřeny hlavně na osoby v knihách uložených v českých knihovnách (autoři, ilustrátoři, redaktoři, některé zmíněné osoby), zatímco Wikidata jsou celosvětová a multioborová.
- Wikidata podporují mnohem víc strukturovaných dat (místo pohřbení, alma mater, mateřský jazyk...). Autority mají některé údaje jen v rámci volného textu (např. jméno, příjmení, přesné datum narození či úmrtí).
- Wikidata mají pro jednu osobu jen jeden záznam, kdežto Autority mívají samostatné záznamy pro každý pseudonym
- Velká část Autorit byla v minulých letech nahrána do Wikidat, tudíž je tu velký překryv. Značná část jich ale ve Wikidatech není - převážně ti, u kterých není známý rok narození ani úmrtí (příklad: http://aut.nkp.cz/jk01023115 ). Volný text se také ne vždy podařilo při nahrání interpretovat (např. nejednoznačný název místa narození či povolání), tudíž ve Wikidatech často daný údaj chybí.
- I když Autority spravuje Národní knihovna, ne každý v této databázi je či byl literárně činný. Například tento: http://aut.nkp.cz/xx0105131 se tam dostal jako "předmět", o kterém někdo jiný psal v knize. Naopak ne každý literárně činný člověk na Wikidatech má spisovatelské povolání, např. https://www.wikidata.org/wiki/Q95075325 . (Někteří nemají vůbec žádné, protože algoritmus nepochopil popis z Autorit a nikdo jiný ho nedoplnil - např. https://www.wikidata.org/wiki/Q95177351 ).
- Autority píší odborníci, kdežto Wikidata amatéři. Ve Wikidatech mnohem častěji na chybějící údaj či chybu. Občas jsou naopak Wikidata napřed, např. při doplňování dat narození a úmrtí.

Bohužel, Váš dotaz není příliš konkrétní. Těch, co mohou být považováni za spisovatele (protože jim třeba jednou v životě vyšla knižně učebnice či kázání), jsou statisíce, většina z nich zapomenutých. Zkuste případně napsat, co konkrétně potřebujete (jaké zaměření, jaké údaje) a pokud bude mít někdo čas a znalosti, pomůžeme.

Snad jsem Vás tím dlouhým textem příliš neunavil, ale považoval jsem to za důležité, pokud je to Váš první kontakt s touto databází. Hodně zdaru při psaní Vaší diplomové práce.
Přidat komentář

Pokud chcete přidat komentář, zadejte jej do formuláře níže. Nejsou povoleny žádné formátovací značky. Adresy na web nebo emailové adresy budou automaticky transformovány na aktivní odkazy. Komentáře jsou moderovány.

Kolik je 4+4 ?

Hledání v archivu