
基于e11祖源結(jié)果的神經(jīng)網(wǎng)絡(luò)分類器
好久不見~先解釋一下,最近之所以在社區(qū)露面的少是因?yàn)樵诰恚╞ushi)建模國賽,所以如果有的時(shí)候回信息不及時(shí)還請(qǐng)見諒~
Anyway, 因?yàn)闇?zhǔn)備的過程中,卷大量的算法,其中就包括了神經(jīng)網(wǎng)絡(luò),于是我就突發(fā)奇想:那是不是用神經(jīng)網(wǎng)絡(luò)對(duì)不同族群的e11結(jié)果訓(xùn)練模型,再分類,是不是可以實(shí)現(xiàn)大批量未知民族樣本的族群預(yù)測。
于是本著有什么想法都要試試的好奇心,我打開了MATLAB軟件,一開始以hapmap數(shù)據(jù)集為例,用貝葉斯優(yōu)化試著跑了一遍,找到了一個(gè)比較好的超參數(shù),最后發(fā)現(xiàn)準(zhǔn)確度不錯(cuò),92%,所以我又接著用HGDP亞洲部分?jǐn)?shù)據(jù)集進(jìn)行訓(xùn)練,發(fā)現(xiàn)結(jié)果也不錯(cuò),也是90%左右。接著分析混淆矩陣,發(fā)現(xiàn)一些類別容易混淆,接著又合并了一些類別。
最終,確定類別為9類,其混淆矩陣如下:?
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下圖:?
接著為了方便各位使用 我還特意寫了python腳本,準(zhǔn)確度最高是99.29%(因?yàn)镸ATLAB氪金費(fèi)用。。。不菲。。。,而且MATLAB本身體積也很大)如下圖:
現(xiàn)在也開源在我的GitHub上了~歡迎大家下載和pull request~
https://github.com/yhlhhhhh/Ancestor-predictor-for-Asian
未來展望的話就是能對(duì)跨族混血人群友好一些吧,能加入混血機(jī)制~其次就是用GAN(生成對(duì)抗網(wǎng)絡(luò))實(shí)現(xiàn)更多人群的分類。
Anyway, 因?yàn)闇?zhǔn)備的過程中,卷大量的算法,其中就包括了神經(jīng)網(wǎng)絡(luò),于是我就突發(fā)奇想:那是不是用神經(jīng)網(wǎng)絡(luò)對(duì)不同族群的e11結(jié)果訓(xùn)練模型,再分類,是不是可以實(shí)現(xiàn)大批量未知民族樣本的族群預(yù)測。
于是本著有什么想法都要試試的好奇心,我打開了MATLAB軟件,一開始以hapmap數(shù)據(jù)集為例,用貝葉斯優(yōu)化試著跑了一遍,找到了一個(gè)比較好的超參數(shù),最后發(fā)現(xiàn)準(zhǔn)確度不錯(cuò),92%,所以我又接著用HGDP亞洲部分?jǐn)?shù)據(jù)集進(jìn)行訓(xùn)練,發(fā)現(xiàn)結(jié)果也不錯(cuò),也是90%左右。接著分析混淆矩陣,發(fā)現(xiàn)一些類別容易混淆,接著又合并了一些類別。
最終,確定類別為9類,其混淆矩陣如下:?
神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如下圖:?
接著為了方便各位使用 我還特意寫了python腳本,準(zhǔn)確度最高是99.29%(因?yàn)镸ATLAB氪金費(fèi)用。。。不菲。。。,而且MATLAB本身體積也很大)如下圖:
現(xiàn)在也開源在我的GitHub上了~歡迎大家下載和pull request~
https://github.com/yhlhhhhh/Ancestor-predictor-for-Asian
未來展望的話就是能對(duì)跨族混血人群友好一些吧,能加入混血機(jī)制~其次就是用GAN(生成對(duì)抗網(wǎng)絡(luò))實(shí)現(xiàn)更多人群的分類。
5 個(gè)回復(fù)
贊同來自:
?
贊同來自: WeChat_1DFF36 、chen279
贊同來自:
贊同來自:
贊同來自: Vacual
要回復(fù)問題請(qǐng)先登錄或注冊