<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Splice-Algorithm on TouchingFish.top</title><link>https://touchingfish.top/tags/splice-algorithm/</link><description>Recent content in Splice-Algorithm on TouchingFish.top</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Sun, 21 Feb 2021 00:00:00 +0000</lastBuildDate><atom:link href="https://touchingfish.top/tags/splice-algorithm/index.xml" rel="self" type="application/rss+xml"/><item><title>可变剪接分析详解 / Alternative Splicing</title><link>https://touchingfish.top/2021/alternative-splice-algorithm-cn/</link><pubDate>Sun, 21 Feb 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/alternative-splice-algorithm-cn/</guid><description>&lt;h2 id="背景"&gt;背景&lt;/h2&gt;
&lt;p&gt;在真核生物中，一个基因可以通过可变剪接（Alternative Splicing, AS）产生多种
mRNA 亚型（isoform）——即在 pre-mRNA 剪接过程中，通过不同的外显子组合方式，生成不同的
成熟 mRNA。这一机制在不增加基因数目的前提下，极大扩展了蛋白质组（proteome）的多样性。&lt;/p&gt;
&lt;p&gt;一个含有 N 个外显子的基因，理论上最多可产生 2^(N-1) 种剪接变体。实际中，
大多数基因产生 2-10 种亚型，但个别基因（如果蝇 Dscam）可产生数万种剪接变体（splice variant）。&lt;/p&gt;
&lt;h3 id="为什么需要计算分析"&gt;为什么需要计算分析&lt;/h3&gt;
&lt;p&gt;高通量转录组测序（RNA-seq、全长 cDNA 测序）会产生数千条转录本比对到参考基因组
上的结果。人工逐个检查每个基因的剪接变异是不现实的。计算流程需要：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;将属于同一基因位点的转录本聚类&lt;/li&gt;
&lt;li&gt;区分真正的剪接变体与比对假象（alignment artifact）&lt;/li&gt;
&lt;li&gt;对每种剪接变异进行分类&lt;/li&gt;
&lt;li&gt;对全基因组的 AS 事件进行定量和汇总&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="as-code-的概念"&gt;AS Code 的概念&lt;/h3&gt;
&lt;p&gt;AS Code 体系（Sammeth et al., 2008）提供了一种紧凑、无歧义的记号来描述任意
可变剪接事件。其核心思想是：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;对于任意一对重叠的转录本，它们之间不同的剪接位点定义了 AS 事件。将这些差异
位点按位置编号，并标记为供体（^）或受体（-），即可得到唯一描述该事件结构的
编码。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这一编码使得 AS 事件可以被系统地分类为具有生物学意义的类别。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="输入数据与预处理"&gt;输入数据与预处理&lt;/h2&gt;
&lt;h3 id="所需输入文件"&gt;所需输入文件&lt;/h3&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;文件&lt;/th&gt;
 &lt;th&gt;格式&lt;/th&gt;
 &lt;th&gt;内容&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;基因组&lt;/td&gt;
 &lt;td&gt;FASTA&lt;/td&gt;
 &lt;td&gt;参考基因组序列&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;基因注释&lt;/td&gt;
 &lt;td&gt;GTF&lt;/td&gt;
 &lt;td&gt;基因模型及外显子坐标&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;cDNA 比对&lt;/td&gt;
 &lt;td&gt;GFF3 (cDNA_match)&lt;/td&gt;
 &lt;td&gt;全长 cDNA 比对结果&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;基因注释提供参考转录本结构；cDNA 比对提供实验观测到的转录本结构，可能揭示注释中
未收录的新剪接变体。&lt;/p&gt;</description></item></channel></rss>