<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Alternative-Splicing on TouchingFish.top</title><link>https://touchingfish.top/tags/alternative-splicing/</link><description>Recent content in Alternative-Splicing on TouchingFish.top</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 21 May 2021 00:00:00 +0000</lastBuildDate><atom:link href="https://touchingfish.top/tags/alternative-splicing/index.xml" rel="self" type="application/rss+xml"/><item><title>有变则通，有通则久</title><link>https://touchingfish.top/2021/alternative-rna-processing/</link><pubDate>Fri, 21 May 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/alternative-rna-processing/</guid><description>&lt;p&gt;一上班就收到了《云南蝴蝶大爆发》的直播推送，前段时间在热搜上看到时就颇有兴趣——上学时跟随学院里的两位老师一起到山里观测过蝴蝶，其中一位是生物鉴定达人，另一位则是昆虫学家，他们都是我尊敬的启蒙老师。&lt;/p&gt;
&lt;p&gt;蝴蝶这件事，越想越觉得有意思。毛虫与蝶，同一套基因组，却活出截然不同的两世——并非基因被替换，而是在变态发育中，同一套遗传信息被重新&amp;quot;解读&amp;quot;。犹如换了套剪切方案，羽化出全新的形态与功能。这让我想起古人说的那句&lt;/p&gt;
&lt;p&gt;有变则通，有通则久。&lt;/p&gt;
&lt;p&gt;放在分子生物学的语境下，竟意外贴切。&lt;/p&gt;
&lt;p&gt;人类基因组只有两万多个基因，却构建出如此复杂多样的生命系统，奥秘很大程度上就在转录后的选择性加工里。DNA转录出的初级mRNA，需将内含子剪切移除，外显子相互连接，才能形成成熟的mRNA。但剪切并非只有一种结果——同一个初级转录本，可以保留或跳过某个内含子、包含或排除某个外显子、甚至改变外显子的连接顺序。一套排列组合下来，一个基因能产生数十甚至数百种mRNA变体，翻译出功能各异的蛋白质。&lt;/p&gt;
&lt;p&gt;这便是可变剪切（Alternative Splicing）。&lt;/p&gt;
&lt;p&gt;同一基因在不同组织、不同发育阶段，通过不同的剪切方式产出不同的蛋白质。以神经系统为例，同一基因经不同剪切，可产生对不同神经递质敏感的离子通道蛋白，决定神经元信号传导的特异性。&lt;/p&gt;
&lt;p&gt;另一种同样精妙的机制是可变多聚腺苷酸化（Alternative Polyadenylation）。&lt;/p&gt;
&lt;p&gt;mRNA的3&amp;rsquo;端通常添加poly(A)尾巴，保护其不被降解并协助翻译。但mRNA上可能存在多个潜在的多聚腺苷酸化位点——选择靠近转录起始点的位点时，3&amp;rsquo;端更短，调控序列更少，mRNA更易被降解；选择远端位点时，一些调控元件被保留，影响mRNA的细胞内定位和翻译效率。细胞正是通过选择不同位点，来精细调控mRNA的寿命和翻译时机。&lt;/p&gt;
&lt;p&gt;基因数目有限，却通过这些&amp;quot;变化&amp;quot;极大地拓展了表达的多样性——有限的遗传信息，生生不息。&lt;/p&gt;
&lt;p&gt;云南是下一届《生物多样性公约》缔结大会要召开的地方。云南瑞丽由于地理位置特殊，遭遇了疫情反扑，使原本5月的大会推迟到10月。不然刚好能赶上蝴蝶大爆发的景象，实在可惜。&lt;/p&gt;
&lt;p&gt;如果没有记错，明天是国际生物多样性日。&lt;/p&gt;
&lt;p&gt;生物多样性为什么如此重要？这取决于人们对生态系统自然修复能力的态度是否乐观，出于我们的伦理，以及对复杂的敬畏。在物质极大丰富的时代，智人占有的自然资源和掌握的科学技术，换来寿命的延长和物种的安定，至于这些在多大程度上威胁到其他生物的生存，我想并不容易界定。&lt;/p&gt;
&lt;p&gt;一种稀有生物的灭绝对目前这代人的影响大都不是肉眼可见的，不过我们还是尽可能从可持续的角度出发。持对立价值观的人则少有为资源忧虑，但也仍然会面对疾病的挑战。病毒是简单的生命形式，在全球化背景下带来了空前规模的疫情。癌变则像一套23册的书卷（每本约1000页），仅仅出现了40-60个排字错误，却成为了生命最困难的终极战役。&lt;/p&gt;
&lt;p&gt;幸好，有一部分高明的人（但愿他们并不是自诩&amp;quot;智人为地球的主宰&amp;quot;）考虑到各个物种在系统中隐约发挥着一定的生态作用，提倡人们采取行动，关注生物多样性保护。&lt;/p&gt;
&lt;p&gt;我深受感染。&lt;/p&gt;
&lt;p&gt;从基因的可变剪切到物种的多样并存，&amp;ldquo;变&amp;quot;是生命应对有限资源的根本策略——一个基因通过不同的剪切方式产出多种蛋白质，一个生态系统通过不同的物种组合维持韧性。逻辑同源，尺度不同。&lt;/p&gt;
&lt;p&gt;祝愿后疫情时代的世界，健康和平，焕发新生，羽化成蝶。&lt;/p&gt;</description></item><item><title>可变剪接分析详解 / Alternative Splicing</title><link>https://touchingfish.top/2021/alternative-splice-algorithm-cn/</link><pubDate>Sun, 21 Feb 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/alternative-splice-algorithm-cn/</guid><description>&lt;h2 id="背景"&gt;背景&lt;/h2&gt;
&lt;p&gt;在真核生物中，一个基因可以通过可变剪接（Alternative Splicing, AS）产生多种
mRNA 亚型（isoform）——即在 pre-mRNA 剪接过程中，通过不同的外显子组合方式，生成不同的
成熟 mRNA。这一机制在不增加基因数目的前提下，极大扩展了蛋白质组（proteome）的多样性。&lt;/p&gt;
&lt;p&gt;一个含有 N 个外显子的基因，理论上最多可产生 2^(N-1) 种剪接变体。实际中，
大多数基因产生 2-10 种亚型，但个别基因（如果蝇 Dscam）可产生数万种剪接变体（splice variant）。&lt;/p&gt;
&lt;h3 id="为什么需要计算分析"&gt;为什么需要计算分析&lt;/h3&gt;
&lt;p&gt;高通量转录组测序（RNA-seq、全长 cDNA 测序）会产生数千条转录本比对到参考基因组
上的结果。人工逐个检查每个基因的剪接变异是不现实的。计算流程需要：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;将属于同一基因位点的转录本聚类&lt;/li&gt;
&lt;li&gt;区分真正的剪接变体与比对假象（alignment artifact）&lt;/li&gt;
&lt;li&gt;对每种剪接变异进行分类&lt;/li&gt;
&lt;li&gt;对全基因组的 AS 事件进行定量和汇总&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="as-code-的概念"&gt;AS Code 的概念&lt;/h3&gt;
&lt;p&gt;AS Code 体系（Sammeth et al., 2008）提供了一种紧凑、无歧义的记号来描述任意
可变剪接事件。其核心思想是：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;对于任意一对重叠的转录本，它们之间不同的剪接位点定义了 AS 事件。将这些差异
位点按位置编号，并标记为供体（^）或受体（-），即可得到唯一描述该事件结构的
编码。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这一编码使得 AS 事件可以被系统地分类为具有生物学意义的类别。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="输入数据与预处理"&gt;输入数据与预处理&lt;/h2&gt;
&lt;h3 id="所需输入文件"&gt;所需输入文件&lt;/h3&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;文件&lt;/th&gt;
 &lt;th&gt;格式&lt;/th&gt;
 &lt;th&gt;内容&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;基因组&lt;/td&gt;
 &lt;td&gt;FASTA&lt;/td&gt;
 &lt;td&gt;参考基因组序列&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;基因注释&lt;/td&gt;
 &lt;td&gt;GTF&lt;/td&gt;
 &lt;td&gt;基因模型及外显子坐标&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;cDNA 比对&lt;/td&gt;
 &lt;td&gt;GFF3 (cDNA_match)&lt;/td&gt;
 &lt;td&gt;全长 cDNA 比对结果&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;基因注释提供参考转录本结构；cDNA 比对提供实验观测到的转录本结构，可能揭示注释中
未收录的新剪接变体。&lt;/p&gt;</description></item></channel></rss>