Vybraný příspěvek

Drobný výklad pravidel

V průběhu uplynulých let krystalizovalo desatero klanu Šemíků, které bych rád okomentoval. Pravidla "od Adama" začala vznikat me...

pondělí 20. února 2023

Malý krůček a velký skok

Přátelé, je to malý krůček pro lidstvo, ale velký skok pro klan Šemíků. Bude to delší text, možná ho rozdělím na dvě části. Na začátek krátké shrnutí.
Postupné zpřesňování výsledků Petra
Během ledna došlo k dokončení testu Petra Šemíka a byla vytvořena nová haploskupina R-FT174249. Bez nadsázky můžeme tuto větvičku na Y-DNA stromě udržovaného na stránkách FamilyTreeDNA (ftDNA) nazvat haploskupinou Šemíků.
A nyní si zkusme představit, že neznáme našeho společného předka Adama Šemíka. Odhlédněme, že jsme v posledním desetiletí vypátrali mnohé z historie našeho klanu počínaje polovinou 17. století po současnost. Před půldruhým rokem jsme dosáhli v projektu Genetika a příjmení hrubé ověření, kteří muži s příjmením Šemík mohou či nemohou mít společného předka v řádu několika málo století. Když jsem si v roce 2019 nechal udělat u společnosti Family Tree DNA test, byl jsem v haploskupině R-Y874 jedním z mála Evropanů na západ a severozápad od Černého moře.
11.1.2023 jsem nahrál výsledky na YFull
Až do roku 2021 to takto zůstalo beze změny. Nejbližší společný předek se vyskytoval téměř před 4 tisíci lety kdesi v širším okolí Kaspického moře. Tehdy si na YFull nahrál někdo s vlaječkou Iránu kit YF82979 a tím nás oba posunul ke společnému předkovi zhruba o 1000 let vpřed. Byl jsem s ním na YFull zařazen do podskupiny R-FT172727. Výsledky vzdáleného bratrance na YFull dnes vidět nejsou, protože si zařazení do haplostromu nazaplatil. Na ftDNA není ani tento vzdálený bratranec, ani tato podskupina.
17.1. na YFull vznikla podskupina R-Y184931
(na ftDNA bude pojmenována jako R-FT174249)
Od roku 2021 až do poloviny ledna tohoto roku jsme se dál nepohnuli. A pak došlo ke skoku. Hrubé Petrovy výsledky jsem nahrál na YFull. Mezitím na ftDNA šlo podle prvních výsledků odhadovat dobu života nejbližšího společného předka Romana a Petra. Na základě čtyřech rozdílů na 111 STR markerech vidíme na starším pravděpodobnostním modelu, že předpokládaný odhad 10 generací ke společnému předkovi je bezmála 99%.
Starší model výpočtu TMRCA
(zdroj ftDNA)
V posledních dnech se na ftDNA objevil nový model odhadu. Místo počtu generací zobrazuje interval roků, kdy mohl žít nejbližší společný předek v mužské linii. Na Y-111 markerech máme s Petrem následující rozdíly:

STR            Roman     Petr
DYF395S1 17-17        17     (pozice 40, 41)
DYS556      14             13     (pozice 77)
DYS712      21             23     (pozice 94)

Na Y-67 je jeden rozdíl a na 37, 25 a 12 STR markerech máme úplnou shodu. Jak je vidět z následující tabulky, je odhad optimisticky laděný k mladšímu termínu TMRCA. Ve skutečnosti máme Adama Šemíka genealogickými metodami určeného o desítky let dříve před rokem 1700.
FTDNATiP™ Report

Více se dozvíme v příštím pokračování, které se zaměří na naše terminální SNP R-FT174249 alias R-Y184931.
Na závěr dnešního přemítání jsem zkusil zadat dotaz na fenomén dnešních dnů, tedy model strojového učení za pomoci metod neuronových sítí, zjednodušeně nazýváno umělou inteligencí. Co odpověděl ChatGPT od OpenAI na otázku: jak se zjišťuje TMRCA u Y-DNA?

TMRCA (Time to the Most Recent Common Ancestor) je čas, který uplynul od nejnovějšího společného předka mezi dvěma nebo více jedinci k současnosti. V případě Y-DNA se TMRCA vypočítává pomocí genetického testování Y chromozomu, který se dědí pouze od otce k synovi.
Existuje několik metod, které umožňují vypočítat TMRCA u Y-DNA. Jednou z nejčastěji používaných metod je použití molekulárních hodin, které určují tempo mutací a vývoj chromozomu Y v průběhu času. Pro výpočet TMRCA lze použít různé statistické modely a programy, které zahrnují různé faktory, jako je průměrná míra mutací a délka generace.
Existuje také několik typů markerů, které mohou být testovány při výpočtu TMRCA, jako jsou STR (short tandem repeats) markery a SNP (single nucleotide polymorphism) markery. STR markery se vyznačují vysokou mírou mutací a používají se pro vypočítání relativně nedávných TMRCA (například před několika stovkami let), zatímco SNP markery se vyznačují nižší mírou mutací a používají se pro vypočítání TMRCA vzdálenějších v minulosti (například před tisíci lety).
Je důležité si uvědomit, že výpočet TMRCA není přesný a může být ovlivněn mnoha faktory, jako je počet testovaných markerů, míra mutací, věk mutací a další faktory. Výsledky TMRCA se proto často uvádějí jako intervaly s určitou pravděpodobností namísto konkrétních čísel.

pátek 3. února 2023

Statistika a pravděpodobnost

Metody klasické genealogie vychází z toho, co je psáno. Čím hlouběji v času jdeme, tím je psáno méně a méně. Ne vždy lze ale spoléhat na předpoklad – co je psáno, to je dáno. Proto přichází genetická genealogie, která může některé dohledané příbuzenské vztahy potvrdit nebo také vyvrátit.
Vezměme si jeden typ rodopisného bádání a tím je vývod, ve kterém hledáme rodiče rodičů. S každou generací se počet předků zdvojnásobuje, pokud nedochází k situaci, které říkáme ztráta předků. Popravdě řečeno, já osobně jsem se k pátrání svého vývodu dostal až po letech, kdy jsem zkoumal rodokmen Šemíků. Impulsem byla až tzv. rekreační genetika. Díky testu autozomální části genomu (atDNA) jsem se v několika případech propojil se vzdálenými bratranci a sestřenicemi.
Užitečnou pomůckou byl i test mé matky a strýce z otcovy strany. Oblasti, odkud pocházejí otcovy (Havlíčkobrodsko) a matčiny (okolí Litomyšle) linie, jsou geograficky odděleny. To mi pomáhá při základní selekci případných genetických shod. Zabývám se především těmi shodami, u kterých dochází k triangulaci se strýcem nebo matkou.

 

db

shoda (%)

shoda (cM)

počet segmentů

nejdelší segment (cM)…

…na společném   chromozomu (Matka/Strýc)

Lenoch Václav

10 9 generací

MH

0,30

20,9

2

13

5

dtto

GM

 

12,1

1

12,1

5 (M-)

dtto

FT

 

11,5

1

11,5

5 (M+)

Daniel Jakub

8 generací (4C3R)

MH

0,40

28,8

2

21,6

2 (S+)

dtto

GM

 

20,5

1

20,5

2 (S+)

Souček František

7 generací (5C1R)

GM

 

28,4

7

6,2

8 (S+)

Vodstrčil Jakub

5 generací (4C)

MH

0,80

55,5

1

55,5

17 (M+)

dtto

FT

 

11,9

1

11,9

17 (M+)

Pleskač Josef

5 generací (4C)

MH

0,90

64,5

3

41,7

14 (S-)

Souček Jan

5 generací (3C1R)

MH

0,90

64,2

3

31,9

8 (S+)

dtto

FT

 

61,0

3

31,5

8 (S+)

Souček Jan

5 generací (3C1R)

MH

1,70

119,1

5

40,3

2 (S)

dtto

GM

 

139,2

7

38,9

2 (S+)


V tabulce jsou moje nálezy z posledních let. Všechny tři atDNA testy jsem nechal dělat u Family Tree DNA (FT). Pak jsem výsledky nahrál do databáze MyHeritage (MH) a na GEDmatch (GM). Když se objeví na některém z chromozomů nejdelší segment nad 10 cM a dojde k triangulaci s matkou (M) nebo s bratrem otce (S), zkusím kontaktovat druhou stranu. Jestliže potenciální bratranec či sestřenice zareaguje (není to pravidlem), zkusím zjistit, zda nemáme stejná příjmení a stejnou oblast, kde předci žili. Pokud nemáme dohledány v matrikách a v dalších písemných zdrojích předky, ve kterých bychom se protli, zkusím zapátrat a dostat se ke společnému manželskému páru vzdálenému často 5 i více generací. Ze shody v centimorganech (cM) lze odhadnout vztah dvou jedinců. Odhad vychází ze statistických metod a nabízí pravděpodobnost jednotlivých vztahů.
Triangulace obvykle ukáže u matky nebo strýce větší (M+ / S+) shodu než u mě. Výjimečně je shoda stejná nebo dokonce menší (M- / S-). Čím více generací nás odděluje, tím se zmenšuje velikost shody, a zmenšuje se i pravděpodobnost jakékoli shody. V případě potomka Jakuba Lenocha z matčiny strany je vzdálenost deset generací. Máme velké štěstí, že vůbec nějakou shodu máme. Moje matka ale na MH už s potomkem Jakuba nemá shodu žádnou. To však neznamená, že nejsme příbuzní, byť vzdálení.