周白玉,張兵,陳海明,王興林,劉祖明,李方明,劉金偉,楊紹華
黔西南漢族人群表皮生長因子前體蛋白編碼序列第14和16外顯子中單核苷酸多態(tài)性研究
周白玉,張兵,陳海明,王興林,劉祖明,李方明,劉金偉,楊紹華
背景與目的單核苷酸多態(tài)性(SNPs)在蛋白編碼序列中多以富集成簇的方式分布,并提示其可能有民族區(qū)域和人種之間的差異性,然而SNPs在黔西南漢族人群表皮生長因子前體蛋白(preproEGF)編碼序列第14和16外顯子中的分布狀況迄今尚未見報道,本研究擬對35例黔西南漢族受試者進行研究,旨在分析SNPs在preproEGF編碼序列第14和16外顯子中的分布特征。方法設計合成4條引物,分別對35例漢族受試者preproEGF編碼序列第14和16外顯子區(qū)段進行PCR擴增和產(chǎn)物的DNA測序;檢索單核苷酸多態(tài)性資料庫(dbSNP)獲取資料并與測序結果進行對比分析。結果35例黔西南漢族受試者中13例(37.1%)在preproEGF編碼序列的2 525 bp位點出現(xiàn)SNPs,基因型為AG和GG,頻率分別為69.2%和30.8%,其等位基因頻率分別為A 34.6%和G 65.4%;27例(77.1%)在2 576 bp位點有SNPs,基因型為AA和AG,頻率分別為66.7%和33.3%,等位基因頻率分別為A 83.3%和G 16.7%。相比之下,北京漢族受試者較黔西南漢族受試者在preproEGF編碼序列第14外顯子內多了1個單核苷酸多態(tài)位點,即2 619 bp位點;歐美等其他民族不僅在preproEGF編碼序列第14外顯子內分布有rs199935855等7個SNPs,而且在其第16外顯子內也分布有rs149396988等6個SNPs;黔西南漢族和北京漢族受試者在preproEGF編碼序列的第16外顯子內均未見有SNPs分布。結論在黔西南漢族、北京漢族和歐美等民族的preproEGF編碼序列第14和16外顯子中,SNPs分別具有各民族、各種族的特征性分布,據(jù)此可區(qū)分不同地域的種族和人群,甚至進行個體識別。也可將這些呈特征性分布的SNPs視為遺傳標記進而深入研究SNPs與疾病發(fā)生的關系。
漢族;貴州;多態(tài)性,單核苷酸;表皮生長因子前體蛋白;多位點測序分型
周白玉,張兵,陳海明,等.黔西南漢族人群表皮生長因子前體蛋白編碼序列第14和16外顯子中單核苷酸多態(tài)性研究[J].中國全科醫(yī)學,2015,18(29):3587-3591.[www.chinagp.net]
Zhou BY,Zhang B,Chen HM,et al.Single nucleotide polymorphisms in exon 14 and 16 in the coding sequence of prepro-epidermal growth factor in Han people of Qianxi'nan Prefecture[J].Chinese General Practice,2015,18(29): 3587-3591.
單核苷酸多態(tài)性(single nucleotide polymorphisms,SNPs)廣泛分布于全球各色人種的染色體及其基因序列中[1]。表皮生長因子前體蛋白(prepro-epidermal growth factor,preproEGF)基因具有SNPs分布的代表性或典型性[2]。
preproEGF基因位于染色體4q25,序列全長約110 kb,含有24個外顯子;其表達轉錄的mRNA序列長約5 kb,編碼一條含1 207個氨基酸的蛋白多肽鏈,即preproEGF,其中的表皮生長因子(53個氨基酸)對人體表皮細胞的生長、分化和代謝發(fā)揮十分重要的作用;此外,該蛋白還含有數(shù)段重復的低密度脂蛋白受體和類表皮生長因子結構域并且兼具潛在的Ca2+結合位點,這表明preproEGF蛋白除了具有表皮生長因子的功能外,還兼具低密度脂蛋白受體組成細胞膜結構和參與出凝血機制的生物學功能,對機體細胞的生長代謝和生理功能發(fā)揮多方面的重要作用[3]。另一方面,有研究顯示preproEGF基因的遺傳變體或多態(tài),特別是其SNPs可能與冠心病、智力發(fā)育障礙和腫瘤發(fā)生等臨床疾病具有相關性。研究表明preproEGF基因序列第61 bp位點的SNPs(A/G)與歐美人群發(fā)生黑色素瘤密切相關[4]。由此可見,探索鑒定SNPs在preproEGF基因和編碼序列中的分布情況不僅對于人類分子遺傳學,而且對醫(yī)學研究皆具重大意義。
在對SNPs探究早期,有研究認為從概率上講SNPs以平均1/1 000個單核苷酸的概率分布于DNA序列中,但之后有研究顯示SNPs也會以富集成簇的方式間隔分布[5]。隨著研究的不斷深入和擴展,迄今已發(fā)現(xiàn)了數(shù)以千萬計的SNPs分布在人類基因組序列中。與此同時,美國生物技術信息中心(National Center for Biotechnology Information,NCBI)的單核苷酸多態(tài)性資料庫(single nucleotide polymorphism database,dbSNP)匯總并向全球公開了這些SNPs[1]。目前已有研究憑借NCBI平臺對dbSNP的SNPs進行檢索,表明相關SNPs多以密集叢簇的方式間隔分布于編碼preproEGF的mRNA/cDNA序列中,其中尤以SNPs較多地集中分布在以外顯子11~12和16~19區(qū)段為間隔的第13~15外顯子區(qū)段頗具典型特征[1,6]。dbSNP相關SNPs在我國除北京地區(qū)以外的漢民族群體preproEGF編碼序列中的分布情況尚不清楚[1]。為彌補此項不足,本研究擬對貴州省黔西南州漢族人群preproEGF編碼或mRNA/cDNA序列中具有SNPs分布特征的上述典型區(qū)段進行實驗研究和資料分析,以探明SNPs的分布特征及其與不同國家、地區(qū)、民族和種群之間是否存在差異性,為進一步的群體遺傳學和分子醫(yī)學的診療應用提供基礎的和有價值的參考。
1.1 研究對象2009-05-22至2010-04-29選取35例彼此互無血緣關系且其父母雙親均是漢族的健康個體,來源于貴州省黔西南州人民醫(yī)院體檢中心。年齡18~59歲,平均年齡(35.3±14.7)歲;男19例,女16例。
1.2 方法
1.2.1 主要試劑與儀器DNA提取試劑盒(美國QiaGen公司),PCR擴增試劑盒(日本TaKaRa公司),50×TAE;電泳緩沖液(上海生物工程公司)。核酸測定儀(德國Eppendorf公司),PCR-2400擴增儀(美國PE公司),Mastercycler梯度PCR擴增儀(德國Eppendorf公司),平板電泳儀(美國Bio-Rad公司),凝膠成像儀(美國SYNGENE公司)。PCR擴增及DNA測序引物的合成(上海賽百盛公司)。
1.2.2 DNA樣本的制備和引物設計按照DNA提取試劑盒操作程序從受試者外周血樣本提取DNA。
對比參照NCBIBlast程序選出的引物序列,分別在preproEGF基因的第14和16外顯子所屬區(qū)段內設計了4條用于PCR和DNA測序的引物(見表1)。
1.2.3 目標區(qū)段的PCR擴增配制PCR反應液:10× PCR Buffer 5.0μl,dNTPMixture(各2.5 mmol/L)4.0 μl,受試者DNA模板8.0μl,正、反向引物各0.5μl,滅菌純水31.5μl,充分混勻后再加入濃度為5.0 U/μl的TaKaRa Taq酶0.5μl至反應總體積為50.0μl,輕輕混勻后置于PCR儀進行DNA擴增。其有效擴增條件為:先94℃3 min預變性,后于94℃30 s變性,63.8℃35 s引物復性和72℃1 min 30 s延伸,進行29個循環(huán),然后72℃7 min后降溫至4℃保持恒溫。
表1 4條測序引物序列表Table 1 Sequence of4 primers
1.2.4 PCR產(chǎn)物的DNA測序及其序列分析PCR擴增的目標DNA片段送上海英駿生物技術有限公司和寶生物(大連)工程有限公司進行DNA序列測定。應用ABI3130、ABI3700和ABI3730等DNA測序儀對PCR產(chǎn)物進行測序。同時根據(jù)研究的需要,對PCR擴增的DNA片段進行必要的雙向和重復測序。測序結果以NCBI的GenBank數(shù)據(jù)庫進行對比分析。
1.3 統(tǒng)計學方法計算漢族SNPs的等位基因和基因型頻率。通過檢索dbSNP,對比黔西南、北京漢族群體和其他種族之間的異同,列表并進行統(tǒng)計學分析。以P<0.05為差異有統(tǒng)計學意義。
2.1 PCR擴增產(chǎn)物采用10 g/L瓊脂糖凝膠電泳分別檢測受試者DNA的PCR產(chǎn)物,于紫外光燈下可見兩條分別長約0.64 kb和0.59 kb的DNA擴增帶(見圖1),其中1~7泳道為第14外顯子區(qū)段,8~11泳道為第16外顯子區(qū)的PCR擴增產(chǎn)物。
圖1 黔西南漢族受試者DNA的PCR擴增產(chǎn)物Figure 1 PCR amplification products of DNA in Han subjects of Qianxinan Prefecture
2.2 DNA序列測定和dbSNP資料對比分析
2.2.1 對PCR擴增產(chǎn)物進行DNA序列測定測序圖譜顯示受試者編碼preproEGF的第14外顯子序列內有兩個位點出現(xiàn)了單核苷酸替換改變,即2 525 bp(G/A)和2 576 bp(A/G),且在這兩個位點還呈現(xiàn)有SNPs雜合套峰的現(xiàn)象(見圖2)。
圖2 黔西南漢族受試者DNA測序圖譜和dbSNP對照圖譜Figure 2 Sequencing chromatogram of DNA in Han subjects of Qianxinan prefecture and the dbSNP tonrol
對測序結果進行計數(shù)統(tǒng)計,有13例受試者在2 525 bp位點有SNPs,占37.1%,其基因型有AG和GG兩種;有27例受試者在2 576 bp有SNPs,占77.1%,其基因型也有兩種,即AA和AG(見表2)。
表2 黔西南漢族受試者preproEGF編碼序列第14外顯子兩個位點的SNPs〔n(%)〕Table2 SNPs of two sites in exon 14 in the coding sequence of preproEGF in Han subjects of Qianxinan
2.2.2 與北京漢族受試者SNPs分布情況相比結果顯示35例黔西南漢族受試者在2 525 bp和2 576 bp兩個位點的SNPs基因頻率與43例北京漢族受試者比較,差異無統(tǒng)計學意義(P>0.05,見表3、4)。
表3 不同地區(qū)漢族受試者preproEGF編碼序列第14外顯子2 525 bp位點基因型和等位基因頻率比較〔n(%)〕Table 3 Comparison of genotype and alleles frequency of 2 525 bp site in exon 14 in the coding sequence of preproEGF among Han subjects of different regions
表4 不同地區(qū)漢族受試者preproEGF編碼序列第14外顯子2 576 bp位點基因型和等位基因頻率比較〔n(%)〕Table 4 Comparison of genotype and alleles frequency of 2 576 bp site in exon 14 in the coding sequence of preproEGF among Han subjects of different regions
2.2.3 計算黔西南漢族受試者的基因頻率并與dbSNP的資料比較本研究在第14外顯子序列內未檢測到2 619 bp位點有SNP發(fā)生;與其他地區(qū)種族(例如美歐人群)的SNPs分布情況相比,本研究在第16外顯子序列內未檢測到任何單核苷酸改變即SNPs發(fā)生(見表5)。
表5 在不同地區(qū)民族和種族preproEGF編碼序列中SNPsTable 5 Comparison of SNPs in the coding sequence of preproEGF among people of different nationality regions and races
3.1 鑒于SNPs與黑色素瘤等疾病相關,因而探究其在preproEGF基因序列中的分布狀況已引起廣泛關注[2,7]?,F(xiàn)已有研究表明,SNPs在preproEGF基因組序列中多以平均1/1 000個單核苷酸概率或密度分布,在內含子中的分布亦是如此;而在編碼preproEGF的24個外顯子中則多以富集叢簇間隔分布為特征,這在第14和16外顯子最為典型[1-2,6]。然而,SNPs在本地區(qū)漢民族preproEGF編碼序列中的分布是否也具同樣的特征尚不清楚。為此,本研究采用PCR、DNA測序并數(shù)量分析等技術從定性與定量兩個方面探究了SNPs在35例黔西南漢族受試者preproEGF編碼序列第14和16外顯子中的分布狀況。在定性方面,首先可觀察到有兩個SNPs (rs2302135和rs2237051,2 525 bp和2 576 bp位點)彼此間僅相隔51 bp而分布于第14外顯子中,提示這是一個SNPs富集分布的熱點外顯子;與之相反,在序列長度為122 bp的第16外顯子中未見到有任何SNPs,提示該外顯子可能系保守序列,可視為SNPs分布的間隔外顯子。這一結果與之前有關SNPs在人preproEGF編碼序列第14外顯子內富集成簇而在第16外顯子內卻是零分布的報道[6]基本上可相互印證。其次,在數(shù)量方面,有13例SNPs分布在2 525 bp位點,27例SNPs分布在2 576 bp位點。同時,這2個SNPs位點各自獨具其特征性的基因型和等位基因頻率,具體在2 525 bp位點其基因型是AG和GG,頻率分別為69.2%和30.8%,等位基因頻率分別為A(34.6%)和G(65.4%);而在2 576 bp位點其基因型則為AA和AG,頻率分別為66.7%和33.3%,等位基因頻率分別為A(83.3%)和G(16.7%)。黔西南漢族特有的這些SNPs基因型和等位基因頻率將有助于區(qū)域群體的區(qū)分和鑒定,對群體遺傳學的研究顯然具有參考價值和意義[8]。
3.2 參考dbSNP中SNPs的資料,本研究對比分析了北京和黔西南的漢族受試者,結果顯示preproEGF編碼序列第14外顯子中的2個SNPs即rs2302135和rs2237051在兩個群體中均可見到;在北京漢族受試者preproEGF編碼序列第14外顯子中還可見到1個位于2 619 bp的SNPs即rs6413481[1,6,9]。因此,在北京漢族受試者preproEGF編碼序列第14外顯子中有3個SNPs位點分布,而黔西南漢族受試者中僅只有2個SNPs位點。這既是北京漢族的SNPs分布特征之一,同時也是區(qū)別于黔西南漢族的一個明確的SNPs標志,提示雖然同為居住在國內的漢族,卻可能因地處南北區(qū)域的不同而出現(xiàn)其SNPs分布的差異性。另一方面,比較分析北京和黔西南漢族受試者2 525 bp和2 576 bp位點的基因頻率雖未見其差別有統(tǒng)計學意義,但并不意味著二者的SNPs基因頻率也是如此,尚待進一步的研究予以解答。
3.3 作為SNPs富集成簇分布間隔區(qū)段的第16外顯子,在本研究中并未見到任何SNPs分布于其中,這一結果與有關研究報道相一致[6]。然而,通過檢索dbSNP并觀察其SNPs在全球各民族/種族中的分布,本研究結果與之相比,分布在preproEGF編碼序列中的SNPs明顯增多,不僅第14外顯子有SNPs分布,而且本來是零分布的第16外顯子也有SNPs分布其中;計數(shù)在這兩個外顯子內的SNPs共有13個,其中7個分布于包括漢族在內的全球多個民族/種族的preproEGF編碼序列第14外顯子,而余下的6個則分布在除漢族以外的其他民族/族的preproEGF編碼序列第16外顯子中[1];進一步觀察發(fā)現(xiàn),除了在漢族preproEGF編碼序列第14外顯子中的3個SNPs為全球多民族/種族共有分布外,其余10個SNPs,即rs375886742、rs370234235、rs199935855、rs148000061、rs140133196、rs375314388、rs369597497、rs190681731、rs149396988和rs372992676皆為其他民族/種族所擁有,因此這些SNPs可望作為標志性或標簽SNPs用來區(qū)分是漢族抑或是其他種族,SNPs在 preproEGF編碼序列第14和16外顯子中的分布特征表現(xiàn)出了不同民族之間或種族之間具有差異性。
總而言之,本研究表明SNPs在黔西南漢族、北京漢族和歐美等其他民族的preproEGF編碼序列第14和16外顯子的分布存在著不同程度的差異性。
[1]Acland A,Aqarwala R,Barrett T,et al.Database resources of the National Center for Biotechnology Information[J].Nucleic Acids Res,2013,41(Database issue):D8-20.
[2]Wang M,Li FM,Liu ZM,et al.Characterization of single nucleotide polymorphisms in human epidermal growth factor precursor gene[J].Journal of Zunyi Medical University,2012,35(2): 104-110.(in Chinese)
王敏,李方明,劉祖明,等.SNPs在人preproEGF基因內的分布特征初探[J].遵義醫(yī)學院學報,2012,35(2):104-110.
[3]Bell GI,F(xiàn)ong NM,Stempien MM,et al.Human epidermal growth factor precursor:cDNA sequence,expression in vitro and gene organization[J].Nucleic Acids Res,1986,14(21):8427-8446.
[4]Shahbazi M,Pravica V,Nasreen N,et al.Association between functional polymorphism in EGF gene and malignantmelanoma[J].Lancet,2002,359(934):397-401.
[5]Koboldt DC,Miller RD,Kwok PY.Distribution of human SNPs and its effect on high-throughput genotyping[J].Hum Mutat,2006,27(3):249-254.
[6]Chen HM,Li FM,Zhang B,et al.Bioinformatics distribution of single nucleotide polymorphisms in mRNA∕cDNA of human epidermal growth factor precursor[J].China Medical Guides,2014,11(1):14-17.(in Chinese)
陳海明,李方明,張兵,等.人preproEGF的mRNA/cDNA序列中SNPs及生物信息學分布探究[J].中國醫(yī)藥導報,2014,11 (1):14-17.
[7]Lozano-Santos C,Martinez-Velasquez J,F(xiàn)ernandez-Cuevas B,et al.Vascular endothelial growth factor A(VEGFA)gene polymorphisms have an impact on survival in a subgroup of indolent patients with chronic lymphocytic leukemia[J].PLoS One,2014,9(6):e101063.
[8]Deng L,Hoh BP,Lu D,etal.The population genomic landscape of human genetic structure,admixture history and local adaptation in Peninsular Malaysia[J].Hum Genet,2014,133(9):1169-1185.
[9]Marth GT,Korf I,Yandell MD,et al.A general approach to single-nucleotide polymorphism discovery[J].Nat Genet,1999,23 (4):452-456.
Single Nucleotide Polymorphisms in Exon 14 and 16 in the Coding Sequence of Prepro-epidermalGrow th Factor in Han People of Qianxi'nan Prefecture
ZHOU Bai-yu,ZHANG Bi
ng,CHEN Hai-ming,et al.Department of Clinical Laboratory,Qianxi'nan State Hospital,the7th Affiliated Hospital of ZunyiMedical College,Xingyi562400,China
Background and Objective The distribution of single nucleotide polymorphisms(SNPs)in protein coding sequence ismainly in clustered integration and may varieswith differentnationality regions and races.However,there are few reports about the distribution of SNPs in exon 14 and 16 in the coding sequence of prepro-epidermal growth factor (preproEGF)in Han People of Qianxinan Prefecture.In this study,we conducted researches on 35 Han people of Qianxinan Prefecture to investigate the distribution features of SNPs in exon 14 and 16 in the coding sequence of preproEGF.MethodsFour primerswere designed and synthesized,and PCR amplification and DNA sequencing of the productswere conducted on the sections of exon 14 and 16 in the coding sequence of preproEGF in 35 Han subjects;comparison was made between the sequencing results and data retrieved from dbSNP.Results Among the 35 Han subjects of Qinxinan Prefecture,13(37.1%) subjects had SNPs shown at 2 525 bp site in the coding sequence of preproEGF,and the genotypes were AG and GG,withfrequencies of 69.2%and 30.8%respectively and allele frequencies of A 34.6%and G 65.4%respectively;27(77.1%) subjects had SNPs shown at 2 576 bp site,and the genotypes were AG and AG,with frequencies being 66.7%and 33.3% respectively and allele frequencies being A 83.3%and G 16.7%respectively.In comparison,Han subjects of Beijing had an extra site of SNPs in exon 14,which was 2 619 bp site;subjects of Europe,the U.S.and some other nationalities had 7 extra sites of SNPs in exon 14,such as rs199935855,and they also had 6 extra sites of SNPs in exon 16;Han subjects of Qianxinan prefecture and Beijing had no SNPs in exon 16.Conclusion Among Han people of Qianxinan prefecture and Beijing and people of Europe,the U.S.and some other nationalities,the distribution of SNPs in exon 14 and 16 in the coding sequence of preproEGF varieswith differentethnic groups and races,which could be served as a reference for distinguishing different races or populations from different regions and even individual identification.The SNPswith featured distribution could be taken as genetic markers for further research of the relation between SNPs and diseases.
Han nationality;Guizhou;Polymorphism,single nucleotide;preproEGF;Multilocus sequence typing
R 394.5
A
10.3969/j.issn.1007-9572.2015.29.020
2015-03-20;
2015-08-20)
(本文編輯:趙躍翠)
貴州省黔西南州醫(yī)院科研基金[(2009)84]
562400貴州省興義市,黔西南州人民醫(yī)院遵義醫(yī)學院第七附院檢驗科(周白玉,張兵,陳海明,王興林,劉祖明,李方明);遵義醫(yī)學院附屬醫(yī)院貴州省細胞工程重點實驗室(劉金偉);海口保稅區(qū)遠兮細胞分子技術應用研發(fā)有限公司(楊紹華)
周白玉,562400貴州省興義市,黔西南州人民醫(yī)院遵義醫(yī)學院第七附院檢驗科;E-mail:2578629971@qq.com