忍者ブログ

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

RAD-like sequencing

RAD-seqは,もはや説明もいらないでしょう.
制限酵素サイトで切断してその切断面から次世代シーケンサのショートリードで配列を読む.
複数個体に用いれば,非モデル生物でゲノムはわからなくても,制限酵素サイト周辺の配列からその中の多型サイトを得ることができる.
詳しくは,龍谷大の永野さんのグループの説明がわかりやすいでしょう.
https://sites.google.com/site/radseqincer/

このRAD-seqには派生的な手法が存在し,pyRADで解析可能な以下の手法がある.
RAD, ddRAD, PE-ddRAD, GBS, PE-GBS, EzRAD, PE-EzRAD, 2B-RAD, nextRAD
まだまだ増やすようだ.
pyRADの使い方はこの辺が参考になりそうです.
http://mitsuhiko.nobody.jp/bioinfo/pyrad.htm

RAD
通常のRAD-seq.制限酵素の断面にアダプタ等をつける.この時,アダプタは切断面の両側につく.

ddRAD: double digest RADseq (Brant K. Peterson et. al. 2012 PLOS ONE)
2種類の制限酵素で切断する.両端を異なる制限酵素で切断された領域のみを用いて,片方の断面にアタプタをつける.
つまり,通常のRADseqに比べると座位数は減るがcoverageは増える.

PE-ddRAD: Paired-End ddRAD
ddRADをペアエンドで読む.

GBS: genotyping-by-sequencing (Robert J. Elshire et. al. 2011 PLOS ONE)
制限酵素で切断後にショートリードをマッピングしてSNPを決める.
サイズセレクションのステップを含まないため実験が楽.とか.

PE-GBS: Paired-End GBS
GBSをペアエンドで読む.

PE-EzRAD (Robert J. Toonen et. al. 2013 PeerJ)
Illumina TruSeq ライブラリ調整キッドを使って,どんな制限酵素でも可能.
実験が簡単.

2B-RAD

nextRAD

やる気がでたら追記します.


PR

gVCF

VCFとは、Variant Call Fileという、多型情報を扱うフォーマット。
vCardというソフトもvcf形式を使っているので注意。

gVCFとは、genome VCFのこと。vcfに情報が追加されている。
gVCFは、多型サイトだけでなく、全サイトの情報を持つ。
それによって、コホートを結合して解析することができる。

参考
https://www.broadinstitute.org/gatk/guide/article?id=4017

塩基配列の種類

塩基配列は何種類あるか,ご存じですか?




4つと答えた方,よくご存じです.
ACGTですよね.

5つと答えた方,こちら側の人ですね.
核酸の種類は指定していないので,DNAとRNAあわせるとACGTU.


でも実は,次世代シーケンサーで読むともっと多くの表記があるんです.
A Adenine アデニン
C Cytosine シトシン
G Guanine グアニン
T Tymine チミン
U Uracil ウラシル

の他に

R AG puRine
Y TC pYrimidine
M AC aMino
K TG Keto
S GC Strong
W AT Weak
B GCT Aの次
H ACT Gの次
V ACG TUの次
D AGT Cの次
N ATGC aNy

以上,16種類です.
んな無茶な.
プリン・ピリミジンからもう無茶な.

まぁ核酸としては5種類というのが正しい気はします.
僕の場合,一番見る塩基配列はおそらくNです.

ショウジョウバエ遺伝子の書き方

Genetic nomenclature for Drosophila melanogasterより
http://flybase.org/static_pages/docs/nomenclature/nomenclature3.html

遺伝子,アリル,変異体,トランスポゾンの名前とシンボルはイタリックで書く.

遺伝子名をフルネームで書くときはローマン(非イタリック)で書く.

タンパク質名とシンボルはローマンで書く.1文字目は大文字で.

遺伝子名のないタンパク質には決まったルールはない.
RNAの名前にも決まったルールはない.

種によってルールが違うらしいのが,進化学からするとナンセンスすぎる.
誰か統一したらいいのに.

cytogenetic map

Flybaseを見ていたところ,Cytogenetic mapという項目が気になった.
でも何なのか見当がつかなかった.

ここの後ろの方でようやく見つけた.
http://www.biol.se.tmu.ac.jp/fly/method-basic.html#genetic-map

Cytogenetic map

細胞遺伝学的地図とか細胞学的地図とか言うらしい.
唾液腺染色体のバンドに基づいてつけた通し番号.

染色体をほぼ等間隔に区切って左から1~102にナンバリング.
1-20 X染色体
21-40 2L染色体
41-60 2R染色体
61-80 3L染色体
81-100 3R染色体
101-102 4染色体
に対応する.

その中をわかりやすいバンドに従ってAからFの小区画に区切る.
小区画内のバンドに左から順に数字を降る.この数は区切り方でかなりばらつくらしい.
バンドをまたがる場合は-ハイフンでつなぐ.

たとえば,sxl(sex lethal)は
6F3-6F5
にマッピングされている.
これは,6なので,X染色体の左から6/20 = 3/10くらい,Fなので区画の右端,その中の3番目から始まる.
-6F5なので,3番目から5番目にわたって遺伝子が配置されている.
ということかな.

実際,sxlは X:6,968,583から始まる(FB2014_03の場合).
X染色体は22Mbpくらいだったはずなので,
7,000,000/22,000,000=0.318181...
大体31%くらいの位置なので,3/10くらいという目算と大体あう.
ちなみに,この遺伝子は23,000bpくらいある長い遺伝子なので,バンドをまたぐのも何となく有り得そう.

実は,別の染色体の遺伝子で試してみたらあんまりうまく一致しなかったので,必ずしもこの目算が合うわけではないのかもしれない.


そもそも,今の時代に唾液腺染色体のバンドを元にした地図が必要な機会もないだろうけど.
単なる歴史の勉強でした.
他の生物でも同じようなマッピングがあるのかな.

カレンダー

11 2024/12 01
S M T W T F S
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

フリーエリア

最新コメント

プロフィール

HN:
No Name Ninja
性別:
非公開

バーコード

ブログ内検索

P R