長鎖散在反復配列(ちょうささんざいはんぷくはいれつ、: long interspersed nuclear element, LINE)とは、非LTRレトロトランスポゾンの一群である。多くの真核生物のゲノムに広く見られ[1][2]ヒトゲノムでは全体のおよそ21.1%を占める[3][4][5]。それぞれの長さはおおよそ7000塩基対程度である。mRNAへ転写されたのち、逆転写酵素活性を持つタンパク質へと翻訳される。この逆転写酵素によりLINE RNAからコピーされたDNAのゲノム上における新しいサイトへの組み込みが可能となる。

長鎖散在反復配列
ヒトLINE-1レトロトランスポゾンの標的エンドヌクレアーゼ結晶構造
識別子
略号 LINE
テンプレートを表示
ネズミ科におけるLINE1およびSINEの遺伝構造。下:L1 RNA-タンパク質複合体の提案された構造。ORF1タンパク質が3量体を形成し、RNA結合活性および核酸シャペロン活性を示している。

ヒトゲノムにおいて多量にみられるのはLINE1英語版だけである。ヒトゲノム上には、切り詰められたもので100000個の、完全な長さを持つもので4000個のLINE1要素が存在する[6]。多くのLINE配列は、ランダム変異の蓄積によりもはや転写および翻訳が起こらないほど劣化している。LINE DNA配列の比較により、ゲノムへのトランスポゾンの挿入時期を推定できる。

発見の歴史

編集

J. Adams et al. 1980によりおよそ6.4 kb長のLINE由来配列が初めて記載された[7]

分類

編集

鍵となる逆転写酵素 (RT) の構造的特徴と系統に基づき、L1、RTE、R2、I、Jockeyの5つの主要なグループに分類され、さらにすくなくとも28個の下位分類がある[8]

植物ゲノムでは、これまでのところ、L1およびRTEに分類されるLINEのみが報告されている[9][10][11]。L1型はいくつかのグループに下位分類されるが、RTE型LINEは保存性が高く、多くの場合単一のファミリーを構成する[12][13]

菌類では、Tad、L1、CRE、Deceiver、Inkcapといった要素が同定されており[14]、Tad類似要素は真菌のゲノムにのみ見られる[15]

すべてのLINEは少なくとも1つのタンパク質、ORF2をコードする。ORF2 はRTドメインとエンドヌクレアーゼ (EN) ドメインをあわせもち、EN領域はN末端APE英語版およびC末端RLEのどちらかもしくはまれに両方の活性をもつ。リボヌクレアーゼHドメインが存在することもある。進化的に古いR2およびRTEスーパーファミリーを除いて、LINEは通常ORF1と呼ばれる別のタンパク質をコードする。ORF1はGag-knuckle型ジンクフィンガーL1-like RRM英語版[訳語疑問点] (InterPro英語版IPR035300)、エステラーゼのいずれかもしくはすべてを持つ。植物、真菌、昆虫においてはLTRレトロトランポゾン英語版 と比べてLINEの頻度は低いが、脊椎動物においては頻度が高く、特に哺乳動物においてはゲノムの約20%を占める[8]

LINE1英語版(L1 要素)は、現生のヒトゲノムにおいてもいまだ活動的な要素の1つであり、オオコウモリを除くすべての哺乳類に見られる[16][17]

その他

編集

L2およびL3要素は、ヒトゲノムに痕跡のみを残しており[5]、これらが活動的だったのはおよそ2〜3億年前と推定される。L1要素とは異なり、L2要素には隣接する標的部位重複がみられない[18]。L2およびL3要素は共にCR1クレード Jockeyに分類される[19]

頻度

編集

ヒト

編集

最初のドラフト版ヒトゲノムでは、ヒトゲノムに占めるLINEの割合は21%、コピー数は85万だった。この内訳はL1、L2、L3要素がそれぞれ51万6千、31万5千、3万7千であった。L1要素に依存して増殖する非自律的レトロトランスポゾンであるSINEは、ヒトゲノムの13%を占め、およそ150万のコピー数を持つ[5]。SINEの起源はRTEに分類されるLINEに由来することが推定されている[20]。最近の推定では、典型的な人間のゲノムには潜在的に可動性のあるL1要素が平均100個含まれるとされるが、分散が大きく多数の活動的L1要素を持ち、L1誘引変異導入の可能性が高い個体も存在する[21]

L1のコピー数の増加は統合失調症患者の脳にも見られ、LINEがいくつかの神経疾患に役割を果たす可能性を示唆している[22]

 
標的プライム逆転写(TPRT)のメカニズム:組み込みサイトで直接:L1 RNP はAAAATTヘキサヌクレオチドを認識し、ORF2のエンドヌクレアーゼ活性によりDNAの第一鎖が切断される。L1ポリAテールがTTTTオーバーハングに結合し、ホストDNAをプライマーとして逆転写が開始される。おそらくORF2は第二鎖の切断を仲介し、再びホストDNAをプライマーとして新たに合成されたcDNAのDNAテンプレートへの結合を仲介すると考えられる。

伝播

編集

LINE は、標的プライム逆転写 (TPRT) と呼ばれる機構により伝播する。この機構は、カイコにおける R2 RNA要素英語版について初めて記載された。

ORF2(および存在する場合はORF1)タンパク質は、それらをコードするmRNAと主にcis会合し、おそらく2つのORF2と未知の個数のORF1トライマーからなるリボ核タンパク質 (RNP) 複合体を形成する[23]。複合体はに戻され、そこでORF2のエンドヌクレアーゼドメインにより(哺乳類ではTTAAAAヘキサヌクレオチドモチーフにおいて)DNAが開裂する[24]。そして3′OHグループが逆転写酵素に対して開放され、LINE RNA転写物の逆転写開始が可能となる。逆転写後、標的鎖が切断され、新しく作成されたcDNAが組み込まれる[25]

新たな挿入により短い標的部位重複[訳語疑問点]が形成される。また、新たな挿入配列の大部分は5′が大幅に(ヒトにおける平均挿入サイズは 900bp)切り詰められ、しばしば逆転している(Szak et al., 2002)。5′UTRを欠くため、新しい挿入配列のほとんどは機能しない。

LINEの活性の調節

編集

宿主細胞は、たとえばエピジェネティックなサイレンシングを介して、L1レトロトランスポジション活動を調節することが示されている。たとえば、L1配列に由来する低分子干渉RNARNA干渉機構により、L1レトロトランスポジションが抑制される可能性が指摘されている[26]

植物ゲノムでは、LINEに対するエピジェネティック修飾[訳語疑問点]により、近接遺伝子の発現変化や表現型の変化さえもが引き起こされる。アブラヤシの劇的な収量現象につながる"mantled"ソマクローナル変異英語版体は、アブラヤシゲノムにおけるKarma型LINEに対するメチル化により引き起こされる[27]

ヒトAPOBEC3C英語版 (A3C) を介するLINE-1の抑制が報告されている。これは、A3CとORF1pとの相互作用により逆転写酵素活性が影響されることによる[28]

疾患との関連

編集

L1 由来疾患の歴史的な例として、挿入型遺伝子変異英語版 により引き起こされる血友病Aが挙げられる[29]。いくつかの種類の癌や神経障害など100近くの疾患がレトロエレメント挿入により引き起こされることが知られている[30]。上皮細胞癌においてL1移動と発癌との間の相関が報告されている[31]。LINEの低メチル化は染色体の不安定性および遺伝子発現の変化に関連し[32]、さまざまな組織のさまざまながん細胞に見られる[33]。癌遺伝子であるMET遺伝子内にある特定のL1の低メチル化は、膀胱癌の腫瘍形成に関連しする[34]交代勤務睡眠障害英語版 [35]は癌リスクの増加に関連するが、これは夜間に光にさらされることにより、L1起因ゲノム不安定性を抑制することが知られている、メラトニンが減少することによる[36]

出典

編集
  1. ^ “SINEs and LINEs: highly repeated short and long interspersed sequences in mammalian genomes”. Cell 28 (3): 433–4. (March 1982). doi:10.1016/0092-8674(82)90194-5. PMID 6280868. 
  2. ^ Jurka, J. (1998). “Repeats in genomic DNA: Mining and meaning”. Current Opinion in Structural Biology 8 (3): 333–337. doi:10.1016/S0959-440X(98)80067-5. PMID 9666329. 
  3. ^ “Genome sequence, comparative analysis and haplotype structure of the domestic dog”. Nature 438 (7069): 803–19. (December 2005). Bibcode2005Natur.438..803L. doi:10.1038/nature04338. PMID 16341006. 
  4. ^ Unique functions of repetitive transcriptomes. International Review of Cell and Molecular Biology. 285. (2010-01-01). pp. 115–88. doi:10.1016/B978-0-12-381047-2.00003-7. ISBN 9780123810472. PMID 21035099 
  5. ^ a b c “Initial sequencing and analysis of the human genome”. Nature 409 (6822): 860–921. (February 2001). Bibcode2001Natur.409..860L. doi:10.1038/35057062. PMID 11237011. https://deepblue.lib.umich.edu/bitstream/2027.42/62798/1/409860a0.pdf. 
  6. ^ “Reading between the LINEs: human genomic variation induced by LINE-1 retrotransposition”. Genome Research 10 (10): 1496–508. (October 2000). doi:10.1101/gr.149400. PMC 310943. PMID 11042149. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC310943/. 
  7. ^ “A family of long reiterated DNA sequences, one copy of which is next to the human beta globin gene”. Nucleic Acids Research 8 (24): 6113–28. (December 1980). doi:10.1093/nar/8.24.6113. PMC 328076. PMID 6258162. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC328076/. 
  8. ^ a b “Simple and fast classification of non-LTR retrotransposons based on phylogeny of their RT domain protein sequences”. Gene 448 (2): 207–13. (December 2009). doi:10.1016/j.gene.2009.07.019. PMC 2829327. PMID 19651192. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2829327/. 
  9. ^ “Evolutionary dynamics and evolutionary history in the RTE clade of non-LTR retrotransposons”. Molecular Biology and Evolution 18 (10): 1849–63. (October 2001). doi:10.1093/oxfordjournals.molbev.a003727. PMID 11557792. 
  10. ^ “BNR - a LINE family from Beta vulgaris - contains a RRM domain in open reading frame 1 and defines a L1 sub-clade present in diverse plant genomes”. The Plant Journal 59 (6): 872–82. (September 2009). doi:10.1111/j.1365-313x.2009.03923.x. PMID 19473321. 
  11. ^ “Two-step regulation and continuous retrotransposition of the rice LINE-type retrotransposon Karma”. The Plant Cell 15 (8): 1934–44. (August 2003). doi:10.1105/tpc.011809. PMC 167180. PMID 12897263. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC167180/. 
  12. ^ “Profiling of extensively diversified plant LINEs reveals distinct plant-specific subclades”. The Plant Journal 79 (3): 385–97. (August 2014). doi:10.1111/tpj.12565. PMID 24862340. 
  13. ^ “Acquisition of an Archaea-like ribonuclease H domain by plant L1 retrotransposons supports modular evolution”. Proceedings of the National Academy of Sciences of the United States of America 110 (50): 20140–5. (December 2013). Bibcode2013PNAS..11020140S. doi:10.1073/pnas.1310958110. PMC 3864347. PMID 24277848. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3864347/. 
  14. ^ “Non-LTR retrotransposons in fungi”. Functional & Integrative Genomics 9 (1): 27–42. (February 2009). doi:10.1007/s10142-008-0093-8. PMID 18677522. 
  15. ^ “The age and evolution of non-LTR retrotransposable elements”. Molecular Biology and Evolution 16 (6): 793–805. (June 1999). doi:10.1093/oxfordjournals.molbev.a026164. PMID 10368957. 
  16. ^ “Genome analysis of the platypus reveals unique signatures of evolution”. Nature 453 (7192): 175–83. (May 2008). Bibcode2008Natur.453..175W. doi:10.1038/nature06936. PMC 2803040. PMID 18464734. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2803040/. 
  17. ^ “The genome sizes of megabats (Chiroptera: Pteropodidae) are remarkably constrained”. Biology Letters 5 (3): 347–51. (June 2009). doi:10.1098/rsbl.2009.0016. PMC 2679926. PMID 19324635. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2679926/. 
  18. ^ Kapitonov, Vladimir V.; Pavlicek, Adam; Jurka, Jerzy (2006-01-01). Anthology of Human Repetitive DNA. Wiley-VCH Verlag GmbH & Co. KGaA. doi:10.1002/3527600906.mcb.200300166. ISBN 9783527600908 
  19. ^ “Evolutionary dynamics in a novel L2 clade of non-LTR retrotransposons in Deuterostomia”. Molecular Biology and Evolution 18 (12): 2213–24. (December 2001). doi:10.1093/oxfordjournals.molbev.a003768. PMID 11719571. 
  20. ^ Malik, HS; Eickbush, TH (September 1998). “The RTE class of non-LTR retrotransposons is widely distributed in animals and is the origin of many SINEs.”. Molecular Biology and Evolution 15 (9): 1123–34. doi:10.1093/oxfordjournals.molbev.a026020. PMID 9729877. 
  21. ^ “Sequencing, identification and mapping of primed L1 elements (SIMPLE) reveals significant variation in full length L1 elements between individuals”. BMC Genomics 16 (220): 220. (March 2015). doi:10.1186/s12864-015-1374-y. PMC 4381410. PMID 25887476. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4381410/. 
  22. ^ “Increased l1 retrotransposition in the neuronal genome in schizophrenia”. Neuron 81 (2): 306–13. (January 2014). doi:10.1016/j.neuron.2013.10.053. PMID 24389010. 
  23. ^ “L1 integration in a transgenic mouse model”. Genome Research 16 (2): 240–50. (February 2006). doi:10.1101/gr.4571606. PMC 1361720. PMID 16365384. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1361720/. 
  24. ^ “Sequence patterns indicate an enzymatic involvement in integration of mammalian retroposons”. Proceedings of the National Academy of Sciences of the United States of America 94 (5): 1872–7. (March 1997). Bibcode1997PNAS...94.1872J. doi:10.1073/pnas.94.5.1872. PMC 20010. PMID 9050872. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC20010/. 
  25. ^ “Reverse transcription of R2Bm RNA is primed by a nick at the chromosomal target site: a mechanism for non-LTR retrotransposition”. Cell 72 (4): 595–605. (February 1993). doi:10.1016/0092-8674(93)90078-5. PMID 7679954. 
  26. ^ “L1 retrotransposition is suppressed by endogenously encoded small interfering RNAs in human cultured cells”. Nature Structural & Molecular Biology 13 (9): 763–71. (September 2006). doi:10.1038/nsmb1141. PMID 16936727. 
  27. ^ “Loss of Karma transposon methylation underlies the mantled somaclonal variant of oil palm”. Nature 525 (7570): 533–7. (September 2015). Bibcode2015Natur.525..533O. doi:10.1038/nature15365. PMC 4857894. PMID 26352475. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4857894/. 
  28. ^ “Human LINE-1 restriction by APOBEC3C is deaminase independent and mediated by an ORF1p interaction that affects LINE reverse transcriptase activity”. Nucleic Acids Research 42 (1): 396–416. (January 2014). doi:10.1093/nar/gkt898. PMC 3874205. PMID 24101588. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3874205/. 
  29. ^ “Haemophilia A resulting from de novo insertion of L1 sequences represents a novel mechanism for mutation in man”. Nature 332 (6160): 164–6. (March 1988). Bibcode1988Natur.332..164K. doi:10.1038/332164a0. PMID 2831458. 
  30. ^ “Mobile elements in the human genome: implications for disease”. Genome Medicine 4 (2): 12. (February 2012). doi:10.1186/gm311. PMC 3392758. PMID 22364178. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3392758/. 
  31. ^ “L1 retrotransposons, cancer stem cells and oncogenesis”. The FEBS Journal 281 (1): 63–73. (January 2014). doi:10.1111/febs.12601. PMC 4160015. PMID 24286172. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4160015/. 
  32. ^ “Long interspersed nuclear element-1 hypomethylation in cancer: biology and clinical applications”. Clinical Epigenetics 2 (2): 315–30. (August 2011). doi:10.1007/s13148-011-0032-8. PMC 3365388. PMID 22704344. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3365388/. 
  33. ^ “LINE-1 hypomethylation in cancer is highly variable and inversely correlated with microsatellite instability”. PLOS ONE 2 (5): e399. (May 2007). Bibcode2007PLoSO...2..399E. doi:10.1371/journal.pone.0000399. PMC 1851990. PMID 17476321. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1851990/. 
  34. ^ “Hypomethylation of a LINE-1 promoter activates an alternate transcript of the MET oncogene in bladders with cancer”. PLOS Genetics 6 (4): e1000917. (April 2010). doi:10.1371/journal.pgen.1000917. PMC 2858672. PMID 20421991. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2858672/. 
  35. ^ “A LINE-1-encoded reverse transcriptase-dependent regulatory mechanism is active in embryogenesis and tumorigenesis”. Annals of the New York Academy of Sciences 1341 (1): 164–71. (April 2015). Bibcode2015NYASA1341..164S. doi:10.1111/nyas.12637. PMID 25586649. 
  36. ^ “Regulation of L1 expression and retrotransposition by melatonin and its receptor: implications for cancer risk associated with light exposure at night”. Nucleic Acids Research 42 (12): 7694–707. (July 2014). doi:10.1093/nar/gku503. PMC 4081101. PMID 24914052. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4081101/.