Drobný výklad pravidel

V průběhu uplynulých let krystalizovalo desatero klanu Šemíků, které bych rád okomentoval. Pravidla "od Adama" začala vznikat me...

úterý 28. března 2023

Bártovi, Jelínkovi, Zmrhalovi

Šemíkovi přišli do přízně s různými rody. V poslední době jsem se zabýval třemi takovými případy. Vždy mi byla podnětem nalezená shoda atDNA. Shodu jsem ovšem neměl já, ale pouze můj strýc, a tak počet generací za jmény je jeho generační vzdálenost ke společným předkům.

Bártovi - 4 generace

V případě Bártových z č. 32 jsem našel příbuzné 4. sestřenice. Přesto na MyHeritage, kde mám výsledky DNA testu, došlo ke shodě jen u mého strýce. Jeho příbuzenský vztah je 3C1R. Bohužel se mi nezdařilo přemluvit protistranu k exportu dat na GEDmatch.
►1,7% (118,1‎ cM); 4 sdílené segmenty; nejdelší segment 71,9‎ cM na 4. chromozomu◄

Výsek z vývodu Jelínkova rodu

Jelínkovi - 6 generací

Jelínkovi z Ovesné Lhoty jsou rodem, který zde žije po mnoho generací. Původně hospodařili na č. 4. Josef Jelínek byl koncem 18. století lhoteckým rychtářem. O pár generací později se Josef Jelínek přižení na č. 6 do rodiny "horních" Šemíků. Jelínkovi zde žijí dodnes. Kateřina Šemíková byla vnučkou Jakuba Šemíka, který přišel do Ovesné Lhoty ze Smrdova č. 12.
Shody Jiřího Šemíka s J (Jelínek) 
A (matka) a B (dcera) - viz Bártovi
Praděda Kateřiny byl Josef Šemík. Společně s Kateřinou Šancovou, druhou manželkou, byli rodiči Františka a Jakuba. 
Posloupnost od strýce ke společným předkům a zpět ke vzdálenému bratranci: Jiří Šemík - děda František Šemík - Alois Šemík - Jan Šemík - Josef Šemík - František Šemík - Josef Šemík a Kateřina rodem Šancová - Jakub Šemík - František Šemík - Kateřina Šemíková a Josef Jelínek - Jan Jelínek - Jaroslav Jelínek - Jaroslav Jelínek - Jiří Jelínek - J.
Strýcův vztah 5C2R ještě zachoval na 4. chromozomu společný segment. Já jako 6C1R shodu nemám.
►0,3% (18,1‎ cM); 1 sdílený segment; nejdelší segment 18,1‎ cM na 4. chromozomu◄
Shoda Jiřího Šemíka s J je podstatně menší než s A i B. Rozdíl dvou generací se projevil větší ztrátou počtu i délky společných segmentů. Já, o generaci mladší, jsem již bez shod. Pravděpodobně na této části 4. chromozomu převážili u mne segmenty z matčiny strany. Kdyby se potomci Jelínků a Bártů podívali v MyHeritage na shody DNA, našli by také společného předka ve Smrdově na č. 12.

Zmrhalovi - 5 generací

Tímto příjmením jsem se zabýval před rokem. Tehdy to nebylo spojeno s impulsem od shody DNA, ale kontaktem s rodopiscem, jehož oblast zájmu se kryje s mým. Našli jsme tehdy společné předky Jana Zmrhala a jeho ženu Dorotu ze Smrdova č. 8. Jednalo se o evangelický rod, a tak spíše než do matrik ve smrdovské farnosti budeme nahlížet do evangelických záznamů v Opatovicích u Zbýšova.
e-mail z MyHeritage
Koncem února mi přišel e-mailem upozornění na shodu Jiřího Šemíka. U nevelké shody mě při prohlídce zaujala příjmení Bárta a Zmrhal, která mám také ve svém vývodu. I lokality jako Vlkanov nebo Kynice napovídaly, že by se mohlo podařit nalézt společné předky.
Odpíchl jsem se od rodného listu Milady Antonie Bártové narozené 22.4.1919 v Kalabousku nedaleko Čáslavi. Přes její matku Antonii Annu Lebedovou se dostáváme k babičce Marii Zmrhalové z Lohova (dnes Hlohov u Číhoště). V roce 1834 se narodila Anna Zmrhalová ze Smrdova č.8. Tomáš Zmrhal (*1771)  je nejbližším společným předkem Josefa a Jiřího.
Jiří - Alois Šemík - Jan Šemík - Josef Šemík - František Šemík a Barbora Zmrhalová - Tomáš Zmrhal a Anna Aubrechtová - Jan Zmrhal - Anna Zmrhalová - Marie Zmrhalová - Antonie Anna Lebedová - Milada Antonie Bártová - Josef. Vztah mezi Jiřím a Josefem je 4C1R.
0,4% (29,5‎ cM); 2 sdílené segmenty; nejdelší segment 18‎ cM na 6. chromozomu

čtvrtek 2. března 2023

Genetické hodiny

Dnes začnu tam, kde jsem minule skončil. Víme, v čem se Roman s Petrem neshodují. Liší se průměrně ve třech privátních SNP markerech na Y-DNA. Z obr. níže je vidět, že jeden se liší ve třech a druhý ve čtyřech SNP. Ke změně v této části genomu dochází zhruba jednou za 3 až 4 generace nebo jinak ‒ jednou za ~100 roků.
Vysvětlivka s pomocí ChatGPT. Lidský genom obsahuje přibližně 3 miliardy bází DNA, které se skládají ze čtyř základních nukleotidů: adeninu (A), guaninu (G), cytosinu (C) a thyminu (T). Mezi jednotlivými jedinci se vyskytují drobné rozdíly v DNA, které se nazývají polymorfismy jediného nukleotidu neboli SNP (Single Nucleotide Polymorphisms).
V závislosti na definici SNP se odhaduje, že lidský genom obsahuje přibližně 4 až 5 milionů SNP. Nicméně, většina těchto SNP se nachází mimo geny a neovlivňují jejich funkci. Pouze malá část SNP se nachází uvnitř genů a může ovlivnit jejich funkci nebo přispět k riziku vzniku určitých onemocnění.
Privátní "rozdílové" SNP zeleně [1] modře [2]
zdroj: ftDNA
Jedna z teorií o genetických hodinách skrytých v Y-DNA naznačuje, že významnější než počet generací je uplynulý čas mezi současníky a vzdáleným předkem v mužské linii. Z toho mi vychází, že náchylnost k vytváření mutací (soukromých SNP) je spíše u otců po čtyřicítce než u otců dvacátníků.

[1] Následuje řada Romanovy otcovské linie. První číslo je dožitý věk otce a v závorce je jeho věk, kdy se narodil syn. U nejbližšího společného předka (Adama Šemíka) si nejsme jistí datem narození, proto otazník. V jakém věku se narodili jeho synové jen odhaduji. Časový rozestup mezi nimi byl asi 10 let. Řada začíná otcem Romana a končí Adamem.
81(28)  84(25)  70(34)  80(25)  75(28)  61(26)  71(52)  73(54)  ?(28)  ?(23)

[2] Pro srovnání uvádím Petrovu linii, která je o generaci  kratší. Náš vzájemný vztah je 8C1R, osmý bratranec jednou posunutý. Zprava doleva počínaje Adamem, konče Petrovým otcem.
              45(41) ← 80(36) ← 70(33) ← 78(27) ← 79(34) ← 93(59) ← 48(30) ← 60(37) ← ?(33)
Věk otce v době narození potomka jsem pro obě linie zprůměroval a označil medián, který ještě více naznačuje, že více změn SNP u linie [2] je dílem náhody a dílem věku otců.

[1] průměr 32,3 let; medián 28 roků
[2] průměr 36,7 let; medián 34 roků

středa 1. března 2023

Zpátky na zem

Po 28. lednu trvalo necelý týden a na stránkách ftDNA se objevuje odhad doby, kdy žil nejbližší společný předek Romana a Petra. To jsou ty dvě trikolóry s modrým klínem na obrázku.
Time Tree - časový strom  ftDNA, stav k 22.2.2023
Z předchozího dílu známe odhad na základě rozdílů na STR markerech. Rok 1616 pro R-FT174249 je pravděpodobně počítán i s přispěním počtu mutací SNP markerů. Algoritmus neznám, ale přibližný rok, kdy se měl narodit Adam Šemík, je udivující.
Co víme o Adamovi z písemných pramenů? V roce 1651 je uvedeno, že mu je 23 let. Jedná se o zápis v Soupisu poddaných a tento věk je třeba brát s rezervou - nejedná se o matriční údaj. Janu Šemíkovi, předpokládanému Adamovu otci, bylo v roce 1651 kolem 55 let. Dá se tedy předpokládat, že se Adam narodil ve dvacátých letech 17. století.
Pravděpodobnostní graf, který s
 ostatními statistickými možnostmi
ukazuje nejpravděpodobnější
dobu narození společného předka.
Období mezi roky 1620 a 1630 je dobou těsně po bitvě na Bílé hoře. Zároveň to je počátek zmatku a zmaru války dnes zvané třicetileté. Odhad z Y-DNA se bude s přibývajícími otestovanými vzorky měnit. Jen během psaní tohoto článku došlo ke změně odhadu TMRCA o jeden rok (1616 → 1617).
Přesnější údaj o narození Adama Šemíka již zřejmě neobjevíme. Důležitější je potvrzení, že Adam je skutečně společným předkem klanu Šemíků. Otázka, která by mohla být v budoucnu zodpovězena, je jiná. Odkud předci Adama přišli na Hory Vrbické, na Vysočinu, na území dnešních Čech a Moravy, do střední Evropy? Přišli ze Střední Asie po stepní dálnici severně od Kaspického a Černého moře nebo jižní trasou přes Malou Asii?
Čekáme na bratrance v „modré zóně“
(období 1600 n.l. - 1000 př.n.l.)
Je zajímavé, že při současném stavu vědění má celá haploskupina R-Y874 geneticky blíže k Arpádovcům z území dnešního Maďarska, než k jakémukoli nositeli haploskupiny R1a, který si nechal v posledních letech svoje Y-DNA otestovat, a je z Čech nebo Moravy.
Čekáme, až se nechají otestovat další vzdálení bratranci nebo se objeví aDNA vzdálených příbuzných mužů v archeologických nálezech. Čekáme na někoho, kdo se oddělí na jednom ze 41 společných SNP. Čím více společných SNP markerů budeme mít, tím blíže bude náš společný předek. Na základě počtu SNP mutací se objevuje na ftDNA nová podskupina R-FT174249. Na YFull tato podskupina dostala označení R-Y184931. V „modré zóně“ zatím nemáme nikoho, kromě „záhadné“ podskupiny FT172727. Může to být tím, že se v našem genetickém okolí nenechal otestovat dostatečný počet jedinců. Mohlo to být způsobeno i efektem úzkého hrdla láhve při prudkém poklesu počtu jedinců v populaci.
R-M207>M173>M420>M459>M198>M417>PF6162>Z93>Z94>Z2124>Z2125>Z2123>Y934>Y874>FT174249
vlevo Block Tree, vpravo Time Tree haploskupiny R-Y874
FT174249 je tzv. terminální SNP, poslední společný obou vzdálených bratranců. Společných máme s Petrem 41 SNP (veřejných, Public). Lišíme se průměrně ve třech (soukromých, Private) SNP. Ale o tom až příště...
41 veřejných SNP

pondělí 20. února 2023

Malý krůček a velký skok

Přátelé, je to malý krůček pro lidstvo, ale velký skok pro klan Šemíků. Bude to delší text, možná ho rozdělím na dvě části. Na začátek krátké shrnutí.
Postupné zpřesňování výsledků Petra
Během ledna došlo k dokončení testu Petra Šemíka a byla vytvořena nová haploskupina R-FT174249. Bez nadsázky můžeme tuto větvičku na Y-DNA stromě udržovaného na stránkách FamilyTreeDNA (ftDNA) nazvat haploskupinou Šemíků.
A nyní si zkusme představit, že neznáme našeho společného předka Adama Šemíka. Odhlédněme, že jsme v posledním desetiletí vypátrali mnohé z historie našeho klanu počínaje polovinou 17. století po současnost. Před půldruhým rokem jsme dosáhli v projektu Genetika a příjmení hrubé ověření, kteří muži s příjmením Šemík mohou či nemohou mít společného předka v řádu několika málo století. Když jsem si v roce 2019 nechal udělat u společnosti Family Tree DNA test, byl jsem v haploskupině R-Y874 jedním z mála Evropanů na západ a severozápad od Černého moře.
11.1.2023 jsem nahrál výsledky na YFull
Až do roku 2021 to takto zůstalo beze změny. Nejbližší společný předek se vyskytoval téměř před 4 tisíci lety kdesi v širším okolí Kaspického moře. Tehdy si na YFull nahrál někdo s vlaječkou Iránu kit YF82979 a tím nás oba posunul ke společnému předkovi zhruba o 1000 let vpřed. Byl jsem s ním na YFull zařazen do podskupiny R-FT172727. Výsledky vzdáleného bratrance na YFull dnes vidět nejsou, protože si zařazení do haplostromu nazaplatil. Na ftDNA není ani tento vzdálený bratranec, ani tato podskupina.
17.1. na YFull vznikla podskupina R-Y184931
(na ftDNA bude pojmenována jako R-FT174249)
Od roku 2021 až do poloviny ledna tohoto roku jsme se dál nepohnuli. A pak došlo ke skoku. Hrubé Petrovy výsledky jsem nahrál na YFull. Mezitím na ftDNA šlo podle prvních výsledků odhadovat dobu života nejbližšího společného předka Romana a Petra. Na základě čtyřech rozdílů na 111 STR markerech vidíme na starším pravděpodobnostním modelu, že předpokládaný odhad 10 generací ke společnému předkovi je bezmála 99%.
Starší model výpočtu TMRCA
(zdroj ftDNA)
V posledních dnech se na ftDNA objevil nový model odhadu. Místo počtu generací zobrazuje interval roků, kdy mohl žít nejbližší společný předek v mužské linii. Na Y-111 markerech máme s Petrem následující rozdíly:

STR            Roman     Petr
DYF395S1 17-17        17     (pozice 40, 41)
DYS556      14             13     (pozice 77)
DYS712      21             23     (pozice 94)

Na Y-67 je jeden rozdíl a na 37, 25 a 12 STR markerech máme úplnou shodu. Jak je vidět z následující tabulky, je odhad optimisticky laděný k mladšímu termínu TMRCA. Ve skutečnosti máme Adama Šemíka genealogickými metodami určeného o desítky let dříve před rokem 1700.
FTDNATiP™ Report

Více se dozvíme v příštím pokračování, které se zaměří na naše terminální SNP R-FT174249 alias R-Y184931.
Na závěr dnešního přemítání jsem zkusil zadat dotaz na fenomén dnešních dnů, tedy model strojového učení za pomoci metod neuronových sítí, zjednodušeně nazýváno umělou inteligencí. Co odpověděl ChatGPT od OpenAI na otázku: jak se zjišťuje TMRCA u Y-DNA?

TMRCA (Time to the Most Recent Common Ancestor) je čas, který uplynul od nejnovějšího společného předka mezi dvěma nebo více jedinci k současnosti. V případě Y-DNA se TMRCA vypočítává pomocí genetického testování Y chromozomu, který se dědí pouze od otce k synovi.
Existuje několik metod, které umožňují vypočítat TMRCA u Y-DNA. Jednou z nejčastěji používaných metod je použití molekulárních hodin, které určují tempo mutací a vývoj chromozomu Y v průběhu času. Pro výpočet TMRCA lze použít různé statistické modely a programy, které zahrnují různé faktory, jako je průměrná míra mutací a délka generace.
Existuje také několik typů markerů, které mohou být testovány při výpočtu TMRCA, jako jsou STR (short tandem repeats) markery a SNP (single nucleotide polymorphism) markery. STR markery se vyznačují vysokou mírou mutací a používají se pro vypočítání relativně nedávných TMRCA (například před několika stovkami let), zatímco SNP markery se vyznačují nižší mírou mutací a používají se pro vypočítání TMRCA vzdálenějších v minulosti (například před tisíci lety).
Je důležité si uvědomit, že výpočet TMRCA není přesný a může být ovlivněn mnoha faktory, jako je počet testovaných markerů, míra mutací, věk mutací a další faktory. Výsledky TMRCA se proto často uvádějí jako intervaly s určitou pravděpodobností namísto konkrétních čísel.

pátek 3. února 2023

Statistika a pravděpodobnost

Metody klasické genealogie vychází z toho, co je psáno. Čím hlouběji v času jdeme, tím je psáno méně a méně. Ne vždy lze ale spoléhat na předpoklad – co je psáno, to je dáno. Proto přichází genetická genealogie, která může některé dohledané příbuzenské vztahy potvrdit nebo také vyvrátit.
Vezměme si jeden typ rodopisného bádání a tím je vývod, ve kterém hledáme rodiče rodičů. S každou generací se počet předků zdvojnásobuje, pokud nedochází k situaci, které říkáme ztráta předků. Popravdě řečeno, já osobně jsem se k pátrání svého vývodu dostal až po letech, kdy jsem zkoumal rodokmen Šemíků. Impulsem byla až tzv. rekreační genetika. Díky testu autozomální části genomu (atDNA) jsem se v několika případech propojil se vzdálenými bratranci a sestřenicemi.
Užitečnou pomůckou byl i test mé matky a strýce z otcovy strany. Oblasti, odkud pocházejí otcovy (Havlíčkobrodsko) a matčiny (okolí Litomyšle) linie, jsou geograficky odděleny. To mi pomáhá při základní selekci případných genetických shod. Zabývám se především těmi shodami, u kterých dochází k triangulaci se strýcem nebo matkou.

 

db

shoda (%)

shoda (cM)

počet segmentů

nejdelší segment (cM)…

…na společném   chromozomu (Matka/Strýc)

Lenoch Jakub

10 generací

MH

0,30

20,9

2

13

5

dtto

GM

 

12,1

1

12,1

5 (M-)

dtto

FT

 

11,5

1

11,5

5 (M+)

Daniel Jakub

8 generací (4C3R)

MH

0,40

28,8

2

21,6

2 (S+)

dtto

GM

 

20,5

1

20,5

2 (S+)

Souček František

7 generací (5C1R)

GM

 

28,4

7

6,2

8 (S+)

Vodstrčil Jakub

5 generací (4C)

MH

0,80

55,5

1

55,5

17 (M+)

dtto

FT

 

11,9

1

11,9

17 (M+)

Pleskač Václav

5 generací (4C)

MH

0,90

64,5

3

41,7

14 (S-)

Souček Václav

5 generací (3C1R)

MH

0,90

64,2

3

31,9

8 (S+)

dtto

FT

 

61,0

3

31,5

8 (S+)

Souček Jan

5 generací (3C1R)

MH

1,70

119,1

5

40,3

2 (S)

dtto

GM

 

139,2

7

38,9

2 (S+)


V tabulce jsou moje nálezy z posledních let. Všechny tři atDNA testy jsem nechal dělat u Family Tree DNA (FT). Pak jsem výsledky nahrál do databáze MyHeritage (MH) a na GEDmatch (GM). Když se objeví na některém z chromozomů nejdelší segment nad 10 cM a dojde k triangulaci s matkou (M) nebo s bratrem otce (S), zkusím kontaktovat druhou stranu. Jestliže potenciální bratranec či sestřenice zareaguje (není to pravidlem), zkusím zjistit, zda nemáme stejná příjmení a stejnou oblast, kde předci žili. Pokud nemáme dohledány v matrikách a v dalších písemných zdrojích předky, ve kterých bychom se protli, zkusím zapátrat a dostat se ke společnému manželskému páru vzdálenému často 5 i více generací. Ze shody v centimorganech (cM) lze odhadnout vztah dvou jedinců. Odhad vychází ze statistických metod a nabízí pravděpodobnost jednotlivých vztahů.
Triangulace obvykle ukáže u matky nebo strýce větší (M+ / S+) shodu než u mě. Výjimečně je shoda stejná nebo dokonce menší (M- / S-). Čím více generací nás odděluje, tím se zmenšuje velikost shody, a zmenšuje se i pravděpodobnost jakékoli shody. V případě potomka Jakuba Lenocha z matčiny strany je vzdálenost deset generací. Máme velké štěstí, že vůbec nějakou shodu máme. Moje matka ale na MH už s potomkem Jakuba nemá shodu žádnou. To však neznamená, že nejsme příbuzní, byť vzdálení.