<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Splice-Algorithm on TouchingFish.top</title><link>https://touchingfish.top/ja/tags/splice-algorithm/</link><description>Recent content in Splice-Algorithm on TouchingFish.top</description><generator>Hugo</generator><language>ja</language><lastBuildDate>Sun, 21 Feb 2021 00:00:00 +0000</lastBuildDate><atom:link href="https://touchingfish.top/ja/tags/splice-algorithm/index.xml" rel="self" type="application/rss+xml"/><item><title>選択的スプライシング解析詳解 / Alternative Splicing</title><link>https://touchingfish.top/ja/2021/alternative-splice-algorithm/</link><pubDate>Sun, 21 Feb 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/ja/2021/alternative-splice-algorithm/</guid><description>&lt;h2 id="背景"&gt;背景&lt;/h2&gt;
&lt;p&gt;真核生物において、一つの遺伝子は選択的スプライシング（Alternative Splicing, AS）によって複数の
mRNA アイソフォーム（isoform）を産生しうる。すなわち、pre-mRNA のスプライシング過程で
異なるエクソンの組み合わせをとることで、異なる成熟 mRNA が生成されるのである。この仕組みは、
遺伝子数を増やすことなくプロテオーム（proteome）の多様性を飛躍的に拡大する。&lt;/p&gt;
&lt;p&gt;N 個のエクソンを持つ遺伝子は、理論上最大 2^(N-1) 種のスプライスバリアントを産生しうる。
実際には多くの遺伝子が 2〜10 種のアイソフォームを産生するが、ショウジョウバエの Dscam のように
数万種のスプライスバリアント（splice variant）を産生する例外的な遺伝子も存在する。&lt;/p&gt;
&lt;h3 id="計算解析が必要な理由"&gt;計算解析が必要な理由&lt;/h3&gt;
&lt;p&gt;ハイスループットトランスクリプトームシーケンシング（RNA-seq、全長 cDNA シーケンシング）は、
参照ゲノムにマッピングされた数千本の転写産物を生み出す。これらを人手で一つひとつ検査することは
現実的ではない。計算パイプラインに求められるのは以下の処理である。&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;同一遺伝子座に属する転写産物のクラスタリング&lt;/li&gt;
&lt;li&gt;真のスプライスバリアントとアライメントアーティファクト（alignment artifact）の識別&lt;/li&gt;
&lt;li&gt;各スプライスバリアントの分類&lt;/li&gt;
&lt;li&gt;全ゲノム規模での AS イベントの定量と集計&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="as-code-の概念"&gt;AS Code の概念&lt;/h3&gt;
&lt;p&gt;AS Code 体系（Sammeth et al., 2008）は、任意の選択的スプライシングイベントをコンパクトかつ
曖昧さなく記述する記法を提供する。その中核となる考え方は次のとおりである。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;重複する任意の転写産物ペアについて、両者間で異なるスプライス部位が AS イベントを定義する。
これらの差異部位を位置順に番号付けし、ドナー（^）またはアクセプター（-）として標識すれば、
当該イベントの構造を一意に記述するコードが得られる。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;このコード化により、AS イベントを生物学的に意味のあるカテゴリへ体系的に分類できるようになる。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="入力データと前処理"&gt;入力データと前処理&lt;/h2&gt;
&lt;h3 id="必要な入力ファイル"&gt;必要な入力ファイル&lt;/h3&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;ファイル&lt;/th&gt;
 &lt;th&gt;形式&lt;/th&gt;
 &lt;th&gt;内容&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;ゲノム&lt;/td&gt;
 &lt;td&gt;FASTA&lt;/td&gt;
 &lt;td&gt;参照ゲノム配列&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;遺伝子アノテーション&lt;/td&gt;
 &lt;td&gt;GTF&lt;/td&gt;
 &lt;td&gt;遺伝子モデルおよびエクソン座標&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;cDNA アライメント&lt;/td&gt;
 &lt;td&gt;GFF3 (cDNA_match)&lt;/td&gt;
 &lt;td&gt;全長 cDNA アライメント結果&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;遺伝子アノテーションは参照転写産物の構造を提供し、cDNA アライメントは実験的に観測された
転写産物構造を提供する。後者には、アノテーションに未収録の新規スプライスバリアントが
含まれている可能性がある。&lt;/p&gt;</description></item></channel></rss>