亚洲精品午夜精品,日本二手网站,国产AⅤ爽AV久久久久成人社区,日本一二三区不收费av

使用 WeGene 需要啟用 Cookies, 請啟用后刷新頁面獲得更好的體驗
MrTiung MrTiung 祖源分析

wegene數據轉23andme數據的嘗試

本來想試一下dna.land的,結果發型墻內上不了dna.land.........
試了下gedmatch,雖然,去掉了wegene所有的定制位點,但是結果還是和原來一樣,有1+%的非洲
捕獲.PNG
2017-08-11 ? IP屬地中國
按熱門排序    按默認排序

16 個回復

dna.land經測試成功,看來偽裝是成功了一部分,可以騙過gedmatch和dna.land,但是無法騙過myheritage
費力科思 - WeGene勤雜工
給一個我的思路
?
把WeGene的原始數據轉換成23andme的數據,要解決的問題:
1. 23andme的數據是有5個版本的,從V1到V5。V5是剛剛出來,很多第三方也不支持,V4用了很多年,用得比較多。現在建議以V4為轉化目標。
2. 修改rawdata的頭部注釋信息。很多第三方應用都會驗證原始數據txt文件頭部的注釋信息,這個肯定要改成跟23andme一樣的。
3. 修改數據中的SNP列表。WeGene跟23andme的rawdata是有區別的,把兩者重疊的部分全部保留。
4. 剩下的是23andme數據中有,而WeGene數據中沒有的位點。這部分有幾種處理方法,根據我自己的看法,從易到難羅列一下:
4.1 全部標為未檢出:這顯然是最簡單的,但是會損失很多信息,有些第三方應用也會提示數據的nocall rate太高。
4.2 全部用中國人的高頻基因型填充:根據千人基因組項目的SNP frequency信息,把中國人群的高頻基因型填充進去。這個方法也可以細化一點,比如根據CHB和CHS對南方和北方的數據做不同的處理。
4.3 先用WeGene原始數據中所有的位點,用千人的Chinese做參考數據集,對23andme多測的那些位點的結果做imputation,把impute中info值比較高的位點的impute結果填充進去,impute效果不好的點用未檢出填充。
?
從合理性來說,4.3是最好的
做了兩份數據,已經上傳到myheritage,一份是所有缺少的位點一律未檢出,另一份以一個臺灣網友的位點代替
更新myheritage
可以看到,套件號是m開頭,而不是w開頭了
如果,有需要轉23andme格式的人,可以聯系我,我正好需要測試一下,這個應用是否成功
您好,可否把程序拿到蘭海論壇共享下載呢?
費力科思 - WeGene勤雜工
去掉定制位點是什么意思?
費力科思 - WeGene勤雜工
你用的數據是剛從網站下載的嗎?
費力科思 - WeGene勤雜工
做個應用吧:)
這個不錯
kaji -
你好,樓主能幫我轉一下嗎?
我自己的也出來了

要回復問題請先登錄注冊

  • <track id="ffr4e"></track>

      <dfn id="ffr4e"></dfn>

      主站蜘蛛池模板: 三穗县| 什邡市| 奉新县| 海晏县| 吴川市| 当阳市| 汉源县| 马关县| 福鼎市| 禹城市| 宜昌市| 特克斯县| 剑川县| 阿合奇县| 报价| 江达县| 称多县| 弥渡县| 潮州市| 崇阳县| 鲜城| 平南县| 英德市| 同心县| 鸡泽县| 巫溪县| 外汇| 公安县| 灵山县| 蓬溪县| 邢台县| 林甸县| 大姚县| 沐川县| 连江县| 左云县| 包头市| 紫云| 民权县| 德安县| 股票|