Drobný výklad pravidel

V průběhu uplynulých let krystalizovalo desatero klanu Šemíků, které bych rád okomentoval. Pravidla "od Adama" začala vznikat me...

čtvrtek 2. března 2023

Genetické hodiny

Dnes začnu tam, kde jsem minule skončil. Víme, v čem se Roman s Petrem neshodují. Liší se průměrně ve třech privátních SNP markerech na Y-DNA. Z obr. níže je vidět, že jeden se liší ve třech a druhý ve čtyřech SNP. Ke změně v této části genomu dochází zhruba jednou za 3 až 4 generace nebo jinak ‒ jednou za ~100 roků.
Vysvětlivka s pomocí ChatGPT. Lidský genom obsahuje přibližně 3 miliardy bází DNA, které se skládají ze čtyř základních nukleotidů: adeninu (A), guaninu (G), cytosinu (C) a thyminu (T). Mezi jednotlivými jedinci se vyskytují drobné rozdíly v DNA, které se nazývají polymorfismy jediného nukleotidu neboli SNP (Single Nucleotide Polymorphisms).
V závislosti na definici SNP se odhaduje, že lidský genom obsahuje přibližně 4 až 5 milionů SNP. Nicméně, většina těchto SNP se nachází mimo geny a neovlivňují jejich funkci. Pouze malá část SNP se nachází uvnitř genů a může ovlivnit jejich funkci nebo přispět k riziku vzniku určitých onemocnění.
Privátní "rozdílové" SNP zeleně [1] modře [2]
zdroj: ftDNA
Jedna z teorií o genetických hodinách skrytých v Y-DNA naznačuje, že významnější než počet generací je uplynulý čas mezi současníky a vzdáleným předkem v mužské linii. Z toho mi vychází, že náchylnost k vytváření mutací (soukromých SNP) je spíše u otců po čtyřicítce než u otců dvacátníků.

[1] Následuje řada Romanovy otcovské linie. První číslo je dožitý věk otce a v závorce je jeho věk, kdy se narodil syn. U nejbližšího společného předka (Adama Šemíka) si nejsme jistí datem narození, proto otazník. V jakém věku se narodili jeho synové jen odhaduji. Časový rozestup mezi nimi byl asi 10 let. Řada začíná otcem Romana a končí Adamem.
81(28)  84(25)  70(34)  80(25)  75(28)  61(26)  71(52)  73(54)  ?(28)  ?(23)

[2] Pro srovnání uvádím Petrovu linii, která je o generaci  kratší. Náš vzájemný vztah je 8C1R, osmý bratranec jednou posunutý. Zprava doleva počínaje Adamem, konče Petrovým otcem.
              45(41) ← 80(36) ← 70(33) ← 78(27) ← 79(34) ← 93(59) ← 48(30) ← 60(37) ← ?(33)
Věk otce v době narození potomka jsem pro obě linie zprůměroval a označil medián, který ještě více naznačuje, že více změn SNP u linie [2] je dílem náhody a dílem věku otců.

[1] průměr 32,3 let; medián 28 roků
[2] průměr 36,7 let; medián 34 roků

středa 1. března 2023

Zpátky na zem

Po 28. lednu trvalo necelý týden a na stránkách ftDNA se objevuje odhad doby, kdy žil nejbližší společný předek Romana a Petra. To jsou ty dvě trikolóry s modrým klínem na obrázku.
Time Tree - časový strom  ftDNA, stav k 22.2.2023
Z předchozího dílu známe odhad na základě rozdílů na STR markerech. Rok 1616 pro R-FT174249 je pravděpodobně počítán i s přispěním počtu mutací SNP markerů. Algoritmus neznám, ale přibližný rok, kdy se měl narodit Adam Šemík, je udivující.
Co víme o Adamovi z písemných pramenů? V roce 1651 je uvedeno, že mu je 23 let. Jedná se o zápis v Soupisu poddaných a tento věk je třeba brát s rezervou - nejedná se o matriční údaj. Janu Šemíkovi, předpokládanému Adamovu otci, bylo v roce 1651 kolem 55 let. Dá se tedy předpokládat, že se Adam narodil ve dvacátých letech 17. století.
Pravděpodobnostní graf, který s
 ostatními statistickými možnostmi
ukazuje nejpravděpodobnější
dobu narození společného předka.
Období mezi roky 1620 a 1630 je dobou těsně po bitvě na Bílé hoře. Zároveň to je počátek zmatku a zmaru války dnes zvané třicetileté. Odhad z Y-DNA se bude s přibývajícími otestovanými vzorky měnit. Jen během psaní tohoto článku došlo ke změně odhadu TMRCA o jeden rok (1616 → 1617).
Přesnější údaj o narození Adama Šemíka již zřejmě neobjevíme. Důležitější je potvrzení, že Adam je skutečně společným předkem klanu Šemíků. Otázka, která by mohla být v budoucnu zodpovězena, je jiná. Odkud předci Adama přišli na Hory Vrbické, na Vysočinu, na území dnešních Čech a Moravy, do střední Evropy? Přišli ze Střední Asie po stepní dálnici severně od Kaspického a Černého moře nebo jižní trasou přes Malou Asii?
Čekáme na bratrance v „modré zóně“
(období 1600 n.l. - 1000 př.n.l.)
Je zajímavé, že při současném stavu vědění má celá haploskupina R-Y874 geneticky blíže k Arpádovcům z území dnešního Maďarska, než k jakémukoli nositeli haploskupiny R1a, který si nechal v posledních letech svoje Y-DNA otestovat, a je z Čech nebo Moravy.
Čekáme, až se nechají otestovat další vzdálení bratranci nebo se objeví aDNA vzdálených příbuzných mužů v archeologických nálezech. Čekáme na někoho, kdo se oddělí na jednom ze 41 společných SNP. Čím více společných SNP markerů budeme mít, tím blíže bude náš společný předek. Na základě počtu SNP mutací se objevuje na ftDNA nová podskupina R-FT174249. Na YFull tato podskupina dostala označení R-Y184931. V „modré zóně“ zatím nemáme nikoho, kromě „záhadné“ podskupiny FT172727. Může to být tím, že se v našem genetickém okolí nenechal otestovat dostatečný počet jedinců. Mohlo to být způsobeno i efektem úzkého hrdla láhve při prudkém poklesu počtu jedinců v populaci.
R-M207>M173>M420>M459>M198>M417>PF6162>Z93>Z94>Z2124>Z2125>Z2123>Y934>Y874>FT174249
vlevo Block Tree, vpravo Time Tree haploskupiny R-Y874
FT174249 je tzv. terminální SNP, poslední společný obou vzdálených bratranců. Společných máme s Petrem 41 SNP (veřejných, Public). Lišíme se průměrně ve třech (soukromých, Private) SNP. Ale o tom až příště...
41 veřejných SNP

pondělí 20. února 2023

Malý krůček a velký skok

Přátelé, je to malý krůček pro lidstvo, ale velký skok pro klan Šemíků. Bude to delší text, možná ho rozdělím na dvě části. Na začátek krátké shrnutí.
Postupné zpřesňování výsledků Petra
Během ledna došlo k dokončení testu Petra Šemíka a byla vytvořena nová haploskupina R-FT174249. Bez nadsázky můžeme tuto větvičku na Y-DNA stromě udržovaného na stránkách FamilyTreeDNA (ftDNA) nazvat haploskupinou Šemíků.
A nyní si zkusme představit, že neznáme našeho společného předka Adama Šemíka. Odhlédněme, že jsme v posledním desetiletí vypátrali mnohé z historie našeho klanu počínaje polovinou 17. století po současnost. Před půldruhým rokem jsme dosáhli v projektu Genetika a příjmení hrubé ověření, kteří muži s příjmením Šemík mohou či nemohou mít společného předka v řádu několika málo století. Když jsem si v roce 2019 nechal udělat u společnosti Family Tree DNA test, byl jsem v haploskupině R-Y874 jedním z mála Evropanů na západ a severozápad od Černého moře.
11.1.2023 jsem nahrál výsledky na YFull
Až do roku 2021 to takto zůstalo beze změny. Nejbližší společný předek se vyskytoval téměř před 4 tisíci lety kdesi v širším okolí Kaspického moře. Tehdy si na YFull nahrál někdo s vlaječkou Iránu kit YF82979 a tím nás oba posunul ke společnému předkovi zhruba o 1000 let vpřed. Byl jsem s ním na YFull zařazen do podskupiny R-FT172727. Výsledky vzdáleného bratrance na YFull dnes vidět nejsou, protože si zařazení do haplostromu nazaplatil. Na ftDNA není ani tento vzdálený bratranec, ani tato podskupina.
17.1. na YFull vznikla podskupina R-Y184931
(na ftDNA bude pojmenována jako R-FT174249)
Od roku 2021 až do poloviny ledna tohoto roku jsme se dál nepohnuli. A pak došlo ke skoku. Hrubé Petrovy výsledky jsem nahrál na YFull. Mezitím na ftDNA šlo podle prvních výsledků odhadovat dobu života nejbližšího společného předka Romana a Petra. Na základě čtyřech rozdílů na 111 STR markerech vidíme na starším pravděpodobnostním modelu, že předpokládaný odhad 10 generací ke společnému předkovi je bezmála 99%.
Starší model výpočtu TMRCA
(zdroj ftDNA)
V posledních dnech se na ftDNA objevil nový model odhadu. Místo počtu generací zobrazuje interval roků, kdy mohl žít nejbližší společný předek v mužské linii. Na Y-111 markerech máme s Petrem následující rozdíly:

STR            Roman     Petr
DYF395S1 17-17        17     (pozice 40, 41)
DYS556      14             13     (pozice 77)
DYS712      21             23     (pozice 94)

Na Y-67 je jeden rozdíl a na 37, 25 a 12 STR markerech máme úplnou shodu. Jak je vidět z následující tabulky, je odhad optimisticky laděný k mladšímu termínu TMRCA. Ve skutečnosti máme Adama Šemíka genealogickými metodami určeného o desítky let dříve před rokem 1700.
FTDNATiP™ Report

Více se dozvíme v příštím pokračování, které se zaměří na naše terminální SNP R-FT174249 alias R-Y184931.
Na závěr dnešního přemítání jsem zkusil zadat dotaz na fenomén dnešních dnů, tedy model strojového učení za pomoci metod neuronových sítí, zjednodušeně nazýváno umělou inteligencí. Co odpověděl ChatGPT od OpenAI na otázku: jak se zjišťuje TMRCA u Y-DNA?

TMRCA (Time to the Most Recent Common Ancestor) je čas, který uplynul od nejnovějšího společného předka mezi dvěma nebo více jedinci k současnosti. V případě Y-DNA se TMRCA vypočítává pomocí genetického testování Y chromozomu, který se dědí pouze od otce k synovi.
Existuje několik metod, které umožňují vypočítat TMRCA u Y-DNA. Jednou z nejčastěji používaných metod je použití molekulárních hodin, které určují tempo mutací a vývoj chromozomu Y v průběhu času. Pro výpočet TMRCA lze použít různé statistické modely a programy, které zahrnují různé faktory, jako je průměrná míra mutací a délka generace.
Existuje také několik typů markerů, které mohou být testovány při výpočtu TMRCA, jako jsou STR (short tandem repeats) markery a SNP (single nucleotide polymorphism) markery. STR markery se vyznačují vysokou mírou mutací a používají se pro vypočítání relativně nedávných TMRCA (například před několika stovkami let), zatímco SNP markery se vyznačují nižší mírou mutací a používají se pro vypočítání TMRCA vzdálenějších v minulosti (například před tisíci lety).
Je důležité si uvědomit, že výpočet TMRCA není přesný a může být ovlivněn mnoha faktory, jako je počet testovaných markerů, míra mutací, věk mutací a další faktory. Výsledky TMRCA se proto často uvádějí jako intervaly s určitou pravděpodobností namísto konkrétních čísel.

pátek 3. února 2023

Statistika a pravděpodobnost

Metody klasické genealogie vychází z toho, co je psáno. Čím hlouběji v času jdeme, tím je psáno méně a méně. Ne vždy lze ale spoléhat na předpoklad – co je psáno, to je dáno. Proto přichází genetická genealogie, která může některé dohledané příbuzenské vztahy potvrdit nebo také vyvrátit.
Vezměme si jeden typ rodopisného bádání a tím je vývod, ve kterém hledáme rodiče rodičů. S každou generací se počet předků zdvojnásobuje, pokud nedochází k situaci, které říkáme ztráta předků. Popravdě řečeno, já osobně jsem se k pátrání svého vývodu dostal až po letech, kdy jsem zkoumal rodokmen Šemíků. Impulsem byla až tzv. rekreační genetika. Díky testu autozomální části genomu (atDNA) jsem se v několika případech propojil se vzdálenými bratranci a sestřenicemi.
Užitečnou pomůckou byl i test mé matky a strýce z otcovy strany. Oblasti, odkud pocházejí otcovy (Havlíčkobrodsko) a matčiny (okolí Litomyšle) linie, jsou geograficky odděleny. To mi pomáhá při základní selekci případných genetických shod. Zabývám se především těmi shodami, u kterých dochází k triangulaci se strýcem nebo matkou.

 

db

shoda (%)

shoda (cM)

počet segmentů

nejdelší segment (cM)…

…na společném   chromozomu (Matka/Strýc)

Lenoch Jakub

10 generací

MH

0,30

20,9

2

13

5

dtto

GM

 

12,1

1

12,1

5 (M-)

dtto

FT

 

11,5

1

11,5

5 (M+)

Daniel Jakub

8 generací (4C3R)

MH

0,40

28,8

2

21,6

2 (S+)

dtto

GM

 

20,5

1

20,5

2 (S+)

Souček František

7 generací (5C1R)

GM

 

28,4

7

6,2

8 (S+)

Vodstrčil Jakub

5 generací (4C)

MH

0,80

55,5

1

55,5

17 (M+)

dtto

FT

 

11,9

1

11,9

17 (M+)

Pleskač Václav

5 generací (4C)

MH

0,90

64,5

3

41,7

14 (S-)

Souček Václav

5 generací (3C1R)

MH

0,90

64,2

3

31,9

8 (S+)

dtto

FT

 

61,0

3

31,5

8 (S+)

Souček Jan

5 generací (3C1R)

MH

1,70

119,1

5

40,3

2 (S)

dtto

GM

 

139,2

7

38,9

2 (S+)


V tabulce jsou moje nálezy z posledních let. Všechny tři atDNA testy jsem nechal dělat u Family Tree DNA (FT). Pak jsem výsledky nahrál do databáze MyHeritage (MH) a na GEDmatch (GM). Když se objeví na některém z chromozomů nejdelší segment nad 10 cM a dojde k triangulaci s matkou (M) nebo s bratrem otce (S), zkusím kontaktovat druhou stranu. Jestliže potenciální bratranec či sestřenice zareaguje (není to pravidlem), zkusím zjistit, zda nemáme stejná příjmení a stejnou oblast, kde předci žili. Pokud nemáme dohledány v matrikách a v dalších písemných zdrojích předky, ve kterých bychom se protli, zkusím zapátrat a dostat se ke společnému manželskému páru vzdálenému často 5 i více generací. Ze shody v centimorganech (cM) lze odhadnout vztah dvou jedinců. Odhad vychází ze statistických metod a nabízí pravděpodobnost jednotlivých vztahů.
Triangulace obvykle ukáže u matky nebo strýce větší (M+ / S+) shodu než u mě. Výjimečně je shoda stejná nebo dokonce menší (M- / S-). Čím více generací nás odděluje, tím se zmenšuje velikost shody, a zmenšuje se i pravděpodobnost jakékoli shody. V případě potomka Jakuba Lenocha z matčiny strany je vzdálenost deset generací. Máme velké štěstí, že vůbec nějakou shodu máme. Moje matka ale na MH už s potomkem Jakuba nemá shodu žádnou. To však neznamená, že nejsme příbuzní, byť vzdálení.

úterý 24. ledna 2023

Shoda na MyHeritage

Když jsem v roce 2021 nechal otestovat strýce Jiřího a výsledky jsem přenesl na MyHeritage, objevily se shody s Bártovými a Pleskačovými. Jméno Pleskač jsem měl ve svém vývodu, ale informace, která mě směrovala do Rankova u Chotěboře, byla zavádějící.

Václav Pleskač - 5 generací

Celkem sdílená DNA 0,9% (64,5‎ cM) se 3 sdílenými segmenty, ze kterých je nejdelší segment 41,7‎‎ cM na 14. chromozomu. S mým strýcem Jiřím Šemíkem má vzdálený bratranec 0.7% sdílené DNA (52.8‎ cM) na 4 segmentech a na 14. chromozomu 26,7 cM.
Triangulace tří jedinců na 14. chromozomu
Jednotlivá čísla jsou zajímavá, i když ne velká. Podle pravděpodobnostní tabulky by se mohlo jednat o 4. nebo 3. bratrance. Chuť do pátrání přibývá s triangulací mezi mnou, vzdáleným bratrancem a mým strýcem. Před rokem mi vytipovaný vzdálený bratranec odpověděl, že jeho maminka je z Chotěboře, odkud je i celá část její větve. Kandidáty zůstali Málkovi a Pleskačovi.
Nejnaděnějšími zůstali Pleskačovi (Josef Pleskáč ~ *1831 a jeho otec Václav). Oba z Dobkova. Pak tu byli Málkovi (u mě Čachotín; u bratrance Dolní Vestec). K přesun výsledků atDNA na GEDMatch se mi domnělého bratrance nepodařilo přemluvit. Druhá strana už bohužel na MyHeritage nekomunikovala.
Po nějaké době opět začal věnovat Pleskačům z Dobkova. 2. září 1802 se v Dobkově č. 18 narodil Václav Pleskač. To by mohl být náš společný předek. Václav Pleskač měl s Kateřinou roz. Musilovou syna Josefa (*18.9.1830). V další generaci opět Václav (*20.8.1865), jehož ženě Anně rodem Kredlové se narodila dcera Marie.
2. 12. 1895 nar. Marie Pleskačová ve Vepříkově č. 8
Pro zápis z matriky narozených jsem si dojel do Chotěboře, kde mají knihu narozených z Vepříkova z let 1872-1938. I jiné matriky z okolních vsí, které ještě nejsou předány do oblastního archivu, sahají hluboko do 19. století.
Ještě před cestou do Chotěboře jsem objevil ve sčítání obyvatel z roku 1880 v Dobkově č. 6. V rodině Václava, bratra Josefa, žil na vejminku otec Václav Pleskač. Jeho manželka Kateřina již nežila. Půlník Josef hospodařil v sousedním č. 7. A právě tento Josef a jeho manželka Františka jsou našimi nejbližšími společnými předky. Takto jsem tedy objevil na MyHeritage 4. bratrance (4C), a nevím, zda on o tom ví, protože mi nereaguje na zprávy, které mu posílám. Ještě uvedu ty, kteří nás spojují.
Já - strýc Jiří Šemík - babička Anna Křišťanová - Josef Křišťan - Marie Pleskačová - Josef a Františka Pleskačovi - Václav Pleskač - Marie Pleskačová - Marie Císařová - 3C1R - 4C. Poslední dvě osoby nechávám označeny zkratkou pro 3. sestřenici jednou posunutou a 4. bratrance. Nemám od nich svolení ke zveřejnění jmen.

Mohlo by vás zajímat: Triangulace