<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>2021s on TouchingFish.top</title><link>https://touchingfish.top/2021/</link><description>Recent content in 2021s on TouchingFish.top</description><generator>Hugo</generator><language>zh-cn</language><lastBuildDate>Fri, 10 Dec 2021 00:00:00 +0000</lastBuildDate><atom:link href="https://touchingfish.top/2021/index.xml" rel="self" type="application/rss+xml"/><item><title>甲基化的记忆（DNA Methylation）</title><link>https://touchingfish.top/2021/programmable-dna-methylation-breast-cancer/</link><pubDate>Fri, 10 Dec 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/programmable-dna-methylation-breast-cancer/</guid><description>&lt;p&gt;癌症基因组图谱计划画出了癌症的基因组地图，但知道了地图不等于找到了路。基因会突变，这事大伙都知道——一个个碱基发生替换、缺失、插入，细胞就慢慢走向失控。但很多人不知道的是，基因本身没变，表达的方式也能出问题。这就是表观遗传学干的事。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Cytosine methylation in mammalian DNA is regarded as a key epigenetic modification controlling essential processes such as imprinting, silencing of retrotransposons and cell differentiation.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;甲基化是表观遗传最经典的一种修饰。DNA还是那串DNA，但上面多了一些甲基基团，原本能打开的基因就被关上了。反过来也一样。正常细胞通过甲基化来保持身份——肝细胞记得自己是肝细胞，神经元记得自己是神经元，靠的就是这套表观遗传的记忆系统。&lt;/p&gt;
&lt;p&gt;问题是，这套系统在癌症里被打乱了。癌细胞不仅有基因突变，还有异常的甲基化模式——本该沉默的基因被打开，本该活跃的基因被关上。乳腺癌尤其典型，不同亚型的乳腺癌有不同的甲基化指纹。&lt;/p&gt;
&lt;p&gt;SOX2就是一个典型的例子。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;SOX2 is normally expressed in embryonic stem cells and neural progenitor cells, where it maintains self-renewal. DNA methylation in the SOX2 promoter and enhancer regions functions as an epigenetic switch, which forces cells to activate multiple differentiation pathways.&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这个基因在胚胎干细胞里是主角，负责维持干细胞的自我更新。正常成人的组织里它基本不表达，细胞分化了，不需要它了。但研究者发现，在约43%的基底样乳腺癌里，SOX2异常激活了。肿瘤组织中的SOX2启动子甲基化水平比正常组织低，拷贝数却增加了——双重推动下，这个转录因子开始在癌细胞里疯狂表达，直接激活CYCLIN D1，驱动细胞加速增殖。&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;The downregulation of SOX2 by RNA interference decreased the tumorigenic phenotype in the lung, breast and ovarian cancers.&lt;/p&gt;</description></item><item><title>潜在结果框架（因果推论的基石）</title><link>https://touchingfish.top/2021/potential-outcome/</link><pubDate>Wed, 17 Nov 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/potential-outcome/</guid><description>&lt;p&gt;在 Neyman-Rubin 因果模型（或称“潜在结果框架”，Potential Outcome）中，所谓因果推论，实际上是估计“因果效应”（causal effect）。&lt;/p&gt;
&lt;h2 id="何谓因果效应"&gt;何谓因果效应&lt;/h2&gt;
&lt;p&gt;Rubin 给出一个直观的例子：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;Intuitively, &amp;hellip;&lt;/p&gt;
&lt;p&gt;&amp;ldquo;If an hour ago I had taken two aspirins instead of just a glass of water, my headache would now be gone,&amp;rdquo; or &amp;ldquo;Because an hour ago I took two aspirins instead of just a glass of water, my headache is now gone.&amp;rdquo;&lt;/p&gt;
&lt;p&gt;“如果一个小时前我服用了两个阿司匹林而不是一杯水，我的头痛现在就会消失”，或者“因为一个小时前我服用了两个阿司匹林而不是一杯水，我的头痛现在消失了”&lt;/p&gt;
&lt;p&gt;&amp;hellip;&lt;/p&gt;
&lt;p&gt;Now define the causal effect of the $E$ versus $C$ treatment on $Y$ for a particular trial (i.e., a particular unit and associated
times $t_1$, $t_2$) as follows:&lt;/p&gt;</description></item><item><title>北国秋日（October Sketches）</title><link>https://touchingfish.top/2021/october-sketches/</link><pubDate>Sun, 31 Oct 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/october-sketches/</guid><description>&lt;p&gt;永远可以相信课题组里的前辈。&lt;/p&gt;
&lt;p&gt;这话在组里流传甚广。每次不知道吃什么、玩什么、干什么的时候，只要有人出手，总不会失望。带我逛沈阳师范大学，看古生物博物馆里满地跑的小孩子；在校门口那块比人还大的石头前拍照；在需要走很久才能到的烧烤店里，课题组又一次高估自己的战斗力，没在餐桌上把饭干完。&lt;/p&gt;
&lt;p&gt;那是十月的一个午后，组会开得异常顺利。大家都正开心地聊天，突然发现有人在阴阳怪气——“出去玩没有告诉我们”——原来是前几天组队去故宫的时候没有约前辈一起。&lt;/p&gt;
&lt;p&gt;气氛一时有点尴尬。兄弟之情危在旦夕。三乘二小时的直男自我感动行为。捡树叶，准备礼物，手残得不行，也可能是技巧还没掌握，没起到什么贡献。拍起照片来看着还行。也许研究生三年不会再像今天一样，认真为别人准备礼物了。&lt;/p&gt;
&lt;p&gt;&lt;img src="Ginkgo1.jpg" alt=""&gt;&lt;/p&gt;
&lt;p&gt;下午人都来328了，前辈主动示好，给足了面子。气氛略有缓和，还跟我们借球拍一起到球场打球。显然我已经掌握了一些击球小技巧，越来越熟练，有那么几下还以为自己已经会打了。&lt;/p&gt;
&lt;p&gt;有些歉意不需要言语。&lt;/p&gt;
&lt;p&gt;前辈带我吃过很多东西。有一天下午拿来一盒&amp;quot;饼&amp;quot;，吃了整整一个下午，晚饭胃口依然不错。后来才知道那是一位师兄用可乐蒸鸡蛋——又是课题组的迷惑行为大赏。师兄总能在吃的方面整出点新花样，今天是可乐蒸鸡蛋，明天不知道又是什么。&lt;/p&gt;
&lt;p&gt;说起吃的，彩电塔的小吃街第一次去就遇到了臭豆腐。那臭豆腐臭得惊人，还好买了烤酸奶缓冲缓冲。中街的汉堡王也算来得及时，本来想给大家带点吃吃喝喝的东西，但不知道什么原因打消了念头。&lt;/p&gt;
&lt;p&gt;我的发型也值得记录一笔。&lt;/p&gt;
&lt;p&gt;托尼老师喜欢唠嗑，东北人更热情。但我很难说清是他的审美不行还是技术不好，或是经验不足。眼看我的发型逐渐奇怪，他使出每位托尼老师的常用套路——&amp;ldquo;等下给你吹一吹，做个造型&amp;rdquo;。&lt;/p&gt;
&lt;p&gt;我可太明白了。言下之意就是现在的发型不捯饬捯饬，看上去显然是不值这个价了。&lt;/p&gt;
&lt;p&gt;幸好我对形象的要求并不算很高。洗完吹干后勉强能够接受。&lt;/p&gt;
&lt;p&gt;英语课就没这么幸运了。&lt;/p&gt;
&lt;p&gt;被老师点名翻译句子，翻译出来的内容完全读不通，当场尬住。也没什么不好意思的，本来就是这个例句断章取义的错。但按这进度，自我介绍轮到我的可能性还是挺大的，emo。&lt;/p&gt;
&lt;p&gt;比起英语课，更让我emo的是奖学金申报。&lt;/p&gt;
&lt;p&gt;老师嫌弃的语气基本上已经断了念想。交完材料那天，想着除了论文没有其他拿得出手的东西了，还得找人写推荐，想想有些尴尬。后来竟然让我发电子版材料了，又觉得还有点希望。其他人也不是省油的灯，自己除了一篇论文，没有任何能秀的东西。如果能答辩秀一下综合素质可能还有戏。&lt;/p&gt;
&lt;p&gt;晚上在328开小会，除了组里的人，还来了几个朋友。一开就聊了好久，迟迟没有规划明天外出的行程。书记一个线上会议，又给大家的出入校审批提高了难度，一时很是扫兴。&lt;/p&gt;
&lt;p&gt;说起来，328真是个神奇的地方。&lt;/p&gt;
&lt;p&gt;328是研究生办公室。围坐开小会，奶茶局，成功把其他人聊走。这个氛围真是太有趣了。晚上有人提议一起上政治课，集体坐在第一排，明目张胆地摸鱼、睡觉、吃瓜。&lt;/p&gt;
&lt;p&gt;有一次我正在烧水，突然有人来敲门。根本没想到会有人来，根本没机会一个人待着学会儿习。设了路由器密码，发现竟然无从下手。十月份大部分时间，328都是这样热热闹闹的。&lt;/p&gt;
&lt;p&gt;也有安静的时候。&lt;/p&gt;
&lt;p&gt;早上做生统作业，奖励自己跑个步。刚开始跑的时候真是冷得很难控制呼吸，这个天气运动有点勉强了。运动完后扛冻能力短时间内是max，洗完澡吃完饭又开始感受到刺骨的寒冷。跑步的时候想明白了一些事情——在解释知识这方面，国内做得有点一般。也许再读一两遍就能把实验串起来。&lt;/p&gt;
&lt;p&gt;但有些道理，不是跑步能想通的。&lt;/p&gt;
&lt;p&gt;那天晚上看了Y叔的直播。他是国内从事生信软件开发的人员中，我很早便知道且颇有个性、值得欣赏的一位老师。在直播中，看出他做人做事的特点和原则。开发一个受众广泛的应用已经不是一件容易的事情，能够坚持维护这么长时间更是一项困难的工作。脚踏实地、持之以恒地做事（学术）这方面，给我很大的震撼。也许他并没有发太多高分的大文章，但他的引用量已经超过绝大多数靠灌水评职称的学阀教授。对国内生信的学习和进步也有很大的贡献。&lt;/p&gt;
&lt;p&gt;开题和中期答辩那阵子，第一次见到大家所谓的“和老师讨论”。场面确实有点激烈。但看下来，倒没有见到其他人被&amp;quot;为难&amp;quot;。看师兄师姐开题，好像有点水，但也没那么水。&lt;/p&gt;
&lt;p&gt;十月份眼看就要结束了。&lt;/p&gt;
&lt;p&gt;最近学习进度实在一般，综艺节目也很多没补上。个人的节奏有点被打乱，该重新调整过来。&lt;/p&gt;
&lt;p&gt;铁锅炖确实越吃越香，体验还算不错，但实际上并没有很合个人口味。比起第一次聚餐尬玩桌游，氛围已经好多了，大家关系亲近不少。&lt;/p&gt;
&lt;p&gt;这个月流量限速后，刷手机体验极差。一度想要先眯一觉，但又说要买套过冬装备，坚持挺到了十二点。&lt;/p&gt;
&lt;p&gt;有人请吃饭。除了天气，都很美好。&lt;/p&gt;
&lt;p&gt;&lt;img src="Ginkgo2.jpg" alt=""&gt;&lt;/p&gt;
&lt;p&gt;做了很多事情，又好像什么也没做。&lt;/p&gt;
&lt;p&gt;第一次跟大家出去玩耍还是很开心的。&lt;/p&gt;</description></item><item><title>陷阱不只是交换学科（CSS Summer School）</title><link>https://touchingfish.top/2021/css-summer-school-memory/</link><pubDate>Sun, 15 Aug 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/css-summer-school-memory/</guid><description>&lt;p&gt;2021年7月，研0。&lt;/p&gt;
&lt;p&gt;研究生录取之后接到的第一个任务，是去上一个暑期学校。&lt;/p&gt;
&lt;p&gt;七月的最后一周，华中农大和帝国理工合办了一个计算社会科学方法论的暑期学校。课程安排在线上，每天从早到晚排满了课，结课还要交一个 NetLogo 模型。&lt;/p&gt;
&lt;p&gt;在这之前，我刚被电动车撞了。&lt;/p&gt;
&lt;p&gt;不是我自己被撞，是我妈。一大早出门买早餐，让一个跑单的骑手撞了。手肘肿得厉害，脚趾被前轮碾过，死皮掀开一大块。报警，ct，派出所，交警大队。一家人跑了一整天。&lt;/p&gt;
&lt;p&gt;第二天网课就开始了。&lt;/p&gt;
&lt;p&gt;我以为这就是全部了。后来发现，这只是开始。&lt;/p&gt;
&lt;p&gt;开课第一天早上 Georgiy 老师的课，我盯着屏幕里那个俄罗斯男人看了半天。客观来说，确实挺帅，专业背景也跟我比较 fit。我寻思着要是能保持联系以后说不定有用。&lt;/p&gt;
&lt;p&gt;上课讲了什么现在差不多忘光了。只记得下课前他演示了几个 NetLogo 模型，其中一个关于 covid 的印象深刻——后来我们小组的作业就是从这个模型改出来的。&lt;/p&gt;
&lt;p&gt;课间我骑着自行车出门把骑行卡的次数用完。回来接着划水。晚上的综艺追到三四点。&lt;/p&gt;
&lt;p&gt;现在回想起来，那大概是我最接近&amp;quot;帝国理工&amp;quot;三个字的一次。虽然线上，虽然只有一周，虽然本质上就是个 NetLogo 入门培训。但怎么说呢，title 好听啊。&lt;/p&gt;
&lt;p&gt;第二天下午的 Jerry 孙老师是全场最有人情味的一个。&lt;/p&gt;
&lt;p&gt;前半程用英文讲，听得云里雾里。后半程不知道谁提了一句能不能用中文，孙老师居然答应了。Koen 在旁边听了一会儿，大概是觉得没意思，中途下线回血。&lt;/p&gt;
&lt;p&gt;用中文讲果然效果好很多。那些&amp;quot;学习&amp;quot;、&amp;ldquo;贝叶斯网络&amp;rdquo;、&amp;ldquo;遗传算法&amp;quot;的概念，从孙老师嘴里说出来变得接地气了不少。他说微观到宏观的角度，说抽象和复杂的关系，我突然意识到这可能就是建模的思维方式。&lt;/p&gt;
&lt;p&gt;之前自学 NetLogo 的时候，只知道怎么把代码敲正确。从没想过为什么要建这个模型，为什么抽象，为什么复杂。&lt;/p&gt;
&lt;p&gt;抽象还是复杂？&lt;/p&gt;
&lt;p&gt;这是个哲学问题。&lt;/p&gt;
&lt;p&gt;小组作业是结课前才布置的。&lt;/p&gt;
&lt;p&gt;在此之前，我已经大概猜到了——每次小组作业的剧本都是这样的：定题那天大家头脑风暴热热闹闹，真正干活的就那么一两个人。选题的时候每个人都参与，讨论的时候每个人都发言，等到了写代码的阶段，环顾四周，发现只有自己。&lt;/p&gt;
&lt;p&gt;果然。&lt;/p&gt;
&lt;p&gt;为什么这些小年轻约 meeting 会约在早上，感觉被安排得明明白白。第一次讨论定题，我在同学掩护下闭麦装高手。大家都想做疫苗相关的话题，追热点嘛，都懂。在老师的建议下，我们决定在 SIR 模型基础上加疫苗干预，模拟社会网络中的传播阻断效果。&lt;/p&gt;
&lt;p&gt;选题确定得很快，但研究问题实际上并不明确。这也给后续工作埋下了隐患——我们是在已知模型能实现什么的前提下来设计实验，而不是先明确问题再选择方法。&lt;/p&gt;
&lt;p&gt;第二次讨论的时候，我已经甩了一个半成品模型上去。其实就一个晚上肝出来的，很多参数还没调，ODD 协议也没写。队员们看着屏幕另一端的模型面面相觑——这就开始了？&lt;/p&gt;
&lt;p&gt;我也没想到能这么早进入状态。但没办法，科研这件事嘛，都是自己催自己。无所事事，因为队友看起来不急。&lt;/p&gt;
&lt;p&gt;整个暑期学校有八堂课，我现在能回忆起来的没几门。&lt;/p&gt;
&lt;p&gt;Lecture 3 讲 ODD protocol。概念不难理解，不就是 Overview, Design concepts, Details 吗？但真到自己写的时候傻眼了。描述一个模型比理解一个模型难得多。这感觉就像看别人游泳觉得自己也行，等下了水才发现连换气都不会。&lt;/p&gt;
&lt;p&gt;Lecture 5 讲 GIS。Koen 老师说仿真在时空中演化，空间数据怎么处理，shapefile 怎么用。我想起之前学最大熵模型时也接触过这些概念，当时没学明白，这次还是没学明白。哪些模型需要 GIS，哪些不需要？地理信息在模型中起什么作用？这些问题是好问题，但我没有答案。&lt;/p&gt;
&lt;p&gt;Lecture 7 最有意思。白军飞老师是临时被拉来代课的，讲的是应用经济学研究的规范问题。他说很多所谓的研究只是在&amp;quot;讨论问题&amp;rdquo;，而不是&amp;quot;研究约束对行为的影响&amp;quot;。他还提到一个观点：交叉学科盛行今日，各自发挥优势比换学科更重要——&amp;ldquo;交换学科&amp;quot;的陷阱，迷失在其他学科之中，既丧失自身优势，也没有扎实基础与科班竞争。&lt;/p&gt;
&lt;p&gt;彼时我刚考上研究生，选的是生物统计。本科学生物，信息与计算科学也沾一点，机器学习也自学过一点。现在看来，哪哪都懂一点，哪哪都不精。&lt;/p&gt;
&lt;p&gt;这不就是&amp;quot;交换学科&amp;quot;的陷阱吗？&lt;/p&gt;
&lt;p&gt;但转念一想，如果不是因为什么都会一点，这个暑期学校的作业我也做不来。复杂适应系统、多智能体建模、NetLogo——这些词我之前连听都没听说过。&lt;/p&gt;</description></item><item><title>鳗研（PERVADE）</title><link>https://touchingfish.top/2021/the-ways-of-eel/</link><pubDate>Thu, 24 Jun 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/the-ways-of-eel/</guid><description>&lt;p&gt;说是科普文章有点勉强，毕竟这里既没有严谨的实验设计，也没有系统的文献综述。说它是读后感吧，我又实在没那么多愁善感，翻书时没怎么走心，看完也就忘了。&lt;/p&gt;
&lt;p&gt;本科跟着老师做日本鳗鱼，虽然最后因为学院不再提供实验室，项目不了了之，但两年多的摸鱼经历，足够让我对这种生物产生一种说不清道不明的情感。&lt;/p&gt;
&lt;p&gt;&lt;img src="freezed.jpg" alt="冰冻的成鳗（2018年摄于福建泉州）"&gt;&lt;/p&gt;
&lt;p&gt;&lt;em&gt;冰冻的成鳗（2018年摄于福建泉州）&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;解剖、打针、手术、组织切片、细胞观察——这些湿实验工作，现在回想起来依然历历在目。&lt;/p&gt;
&lt;p&gt;养鱼这件事，考验的其实不是动手能力，而是对动物生理学的理解。你得知道什么时候该升温，什么时候该换水，什么时候该喂食，鳗鱼不舒服了会有什么样的表现。&lt;/p&gt;
&lt;p&gt;听起来像养宠物，但养宠物可不需要你给鱼打针。&lt;/p&gt;
&lt;p&gt;有意思的是，鳗鱼总是给人一种“神秘”的印象。这种印象不是来自教科书，而是来自你真的跟它们相处之后，你会发现这种动物有太多地方说不清楚。&lt;/p&gt;
&lt;h3 id="神秘是鳗鱼的底色"&gt;神秘，是鳗鱼的底色&lt;/h3&gt;
&lt;p&gt;鳗鱼的一生需要经历多次变态。从海里孵化的叶状幼体，到透明如玻璃的玻璃鳗，再到河流里的黄鳗，最后变成银光闪闪的银鳗游回大海产卵——这种一生经历多次完全变形的能力，在脊椎动物里相当罕见。&lt;/p&gt;
&lt;p&gt;&lt;img src="life_history.jpg" alt="发育的幼鳗（2022年摄于辽宁大连）"&gt;&lt;/p&gt;
&lt;p&gt;&lt;em&gt;发育的幼鳗（2022年摄于辽宁大连）&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;但真正让人着迷的，不是变态本身，而是变态背后的那些未解之谜。&lt;/p&gt;
&lt;p&gt;比如说，鳗鱼是怎么找到回家的路的？&lt;/p&gt;
&lt;p&gt;科学家提出了不少假说：地球磁场、嗅觉导航、听觉信号……听起来头头是道，但说白了，我们还是不知道。它们为什么能在茫茫大海里准确地回到出生的那条河？没有人确切知道。&lt;/p&gt;
&lt;p&gt;&lt;img src="Otolith.jpg" alt="日本鳗鲡的耳石（2017年摄于福建泉州）"&gt;&lt;/p&gt;
&lt;p&gt;&lt;em&gt;日本鳗鲡的耳石（2017年摄于福建泉州）&lt;/em&gt;&lt;/p&gt;
&lt;p&gt;书里有个说法我印象很深：有人把鳗鱼抓到几公里外放生，一两周后，它们居然能准确地回到最初被捕获的地方。&lt;/p&gt;
&lt;p&gt;程老师说，鳗鱼身上有雷达。&lt;/p&gt;
&lt;p&gt;或许吧。&lt;/p&gt;
&lt;p&gt;再比如说，产卵地到底在哪里？&lt;/p&gt;
&lt;p&gt;欧洲鳗鱼和美洲鳗鱼的产卵地基本确定了——大西洋的马尾藻海。但日本鳗鱼的产卵地，科学家们吵了很多年。一说在马里亚纳群岛附近，一说还有别的可能。马里亚纳群岛。&lt;/p&gt;
&lt;h3 id="书中自有颜如玉书中也有鳗鱼"&gt;书中自有颜如玉，书中也有鳗鱼&lt;/h3&gt;
&lt;p&gt;《鳗鱼的旅行》这本书有意思的地方在于，它不是一本正经地给你讲生物学。 作者帕特里克·斯文松是瑞典人，写得很有意思，把鳗鱼的历史、生物学、哲学，甚至自己的童年回忆混在一起读。&lt;/p&gt;
&lt;p&gt;书里提到一个细节：亚里士多德曾经相信鳗鱼是从淤泥里自然生成的。他建议人们在干旱期去观察干涸的池塘，等第一场雨降临时，池塘里就突然满是鳗鱼了——“雨水赋予了它们存在”。&lt;/p&gt;
&lt;p&gt;现在我们知道这是错的。但在那个没有显微镜、没有实验方法的年代，这种猜测似乎也合情合理。更有意思的是，几千年后，我们有了先进得多的技术，鳗鱼依然有办法让我们困惑。&lt;/p&gt;
&lt;p&gt;书里还提到，鳗鱼问题存在的时间“跟自然科学的历史一样长”。一种我们每天都能在市场和餐桌上见到的鱼繁殖方式至今仍保持隐秘，这听起来有点讽刺，但也恰恰说明了自然的复杂性远超我们的理解。&lt;/p&gt;
&lt;p&gt;我在想，本科那两年，我们实验室里养的鳗鱼，最后都怎么样了？&lt;/p&gt;
&lt;p&gt;大概率是为科学事业往生了，总不会是放生了。&lt;/p&gt;
&lt;p&gt;不是以我希望的方式结束。&lt;/p&gt;
&lt;p&gt;后来转了方向，本科毕业后就没再碰过鳗鱼。&lt;/p&gt;
&lt;p&gt;一两年后偶然翻到这本书，确实想起了一些往事，但也就是想想而已。&lt;/p&gt;
&lt;p&gt;书中引用了一位哲学家托马斯·纳格尔1974年写的那篇著名文章——《身为蝙蝠是一种什么体验》。这个问题同样可以问鳗鱼：身为一条鳗鱼是什么体验？&lt;/p&gt;
&lt;p&gt;我们用尽了各种方法去研究它们，基因、激素、追踪器、卫星定位……但我们真的理解它们吗？&lt;/p&gt;
&lt;p&gt;我不知道。&lt;/p&gt;
&lt;p&gt;但有时候我反而觉得，正是这种“不知道”，让鳗鱼变得有趣。&lt;/p&gt;
&lt;p&gt;如果你对这种神秘的生物感兴趣，或者只是想找本书打发一下午，《鳗鱼的旅行》值得一读。它不会告诉你鳗鱼是什么——因为没人知道。它只会告诉你，鳗鱼有多神秘，以及人类为了破解这个谜，花了多少力气。&lt;/p&gt;
&lt;h3 id="附录读书笔记摘录"&gt;附录：读书笔记（摘录）&lt;/h3&gt;
&lt;blockquote&gt;
&lt;p&gt;马尾藻海是一片没有陆地边界的海洋，它只是由四股强大的海流围起来的……500多万平方公里的马尾藻海就像在由海流封闭起来的圆圈里打转的一个温暖又缓慢的漩涡。进入这片海域的东西，要想出去就没有那么简单了。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;如果因为外力被冲到其他地方，只要情况一允许，它们就会立刻返回自己所选择的住处。那些在实验中被捕获的鳗鱼被装上无线电发射器后，在距捕获地几公里远的地方被放生，可一两周之内它们就会准确地回到它们最初被捕获的地方。没有人确切地知道它们是如何找回家的。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;亚里士多德建议：在干旱期去观察一个干涸的池塘。所有的水都被蒸发掉了，所有的淤泥和土都被晒干了，硬化了的池塘底部已经完全不存在生命了……但是当第一场雨降临时，当雨水缓缓地重新灌满池塘时，奇妙的事情发生了。一瞬间，池塘里又满是鳗鱼了。突然间，它们就在那里了。雨水赋予了它们存在。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;在鳗鱼这个问题上，那些本来博学的人，在某种程度上却总是受到信仰的摆布。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;有一种鱼，在全世界很多地方都比其他鱼更常见，我们每天都能在市场和餐桌上见到它们，尽管现代科学界花了那么多力气做了那么多实验，它们仍然能够使自己的繁殖、出生、死亡方式保持隐秘。鳗鱼问题存在的时间，跟自然科学的历史一样长。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;遇到一条鳗鱼差不多就像遇到一个去过地球上最美丽、最遥远地方的人；我立刻就能看到一幅生动的景象，那是鳗鱼去过的神秘地方，是我——作为人类——永远无法造访的地方。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;blockquote&gt;
&lt;p&gt;我们似乎被困在了一种“乌托邦僵局”中。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;——选自 [瑞典] 帕特里克·斯文松《鳗鱼的旅行》&lt;/p&gt;</description></item><item><title>有变则通，有通则久</title><link>https://touchingfish.top/2021/alternative-rna-processing/</link><pubDate>Fri, 21 May 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/alternative-rna-processing/</guid><description>&lt;p&gt;一上班就收到了《云南蝴蝶大爆发》的直播推送，前段时间在热搜上看到时就颇有兴趣——上学时跟随学院里的两位老师一起到山里观测过蝴蝶，其中一位是生物鉴定达人，另一位则是昆虫学家，他们都是我尊敬的启蒙老师。&lt;/p&gt;
&lt;p&gt;蝴蝶这件事，越想越觉得有意思。毛虫与蝶，同一套基因组，却活出截然不同的两世——并非基因被替换，而是在变态发育中，同一套遗传信息被重新&amp;quot;解读&amp;quot;。犹如换了套剪切方案，羽化出全新的形态与功能。这让我想起古人说的那句&lt;/p&gt;
&lt;p&gt;有变则通，有通则久。&lt;/p&gt;
&lt;p&gt;放在分子生物学的语境下，竟意外贴切。&lt;/p&gt;
&lt;p&gt;人类基因组只有两万多个基因，却构建出如此复杂多样的生命系统，奥秘很大程度上就在转录后的选择性加工里。DNA转录出的初级mRNA，需将内含子剪切移除，外显子相互连接，才能形成成熟的mRNA。但剪切并非只有一种结果——同一个初级转录本，可以保留或跳过某个内含子、包含或排除某个外显子、甚至改变外显子的连接顺序。一套排列组合下来，一个基因能产生数十甚至数百种mRNA变体，翻译出功能各异的蛋白质。&lt;/p&gt;
&lt;p&gt;这便是可变剪切（Alternative Splicing）。&lt;/p&gt;
&lt;p&gt;同一基因在不同组织、不同发育阶段，通过不同的剪切方式产出不同的蛋白质。以神经系统为例，同一基因经不同剪切，可产生对不同神经递质敏感的离子通道蛋白，决定神经元信号传导的特异性。&lt;/p&gt;
&lt;p&gt;另一种同样精妙的机制是可变多聚腺苷酸化（Alternative Polyadenylation）。&lt;/p&gt;
&lt;p&gt;mRNA的3&amp;rsquo;端通常添加poly(A)尾巴，保护其不被降解并协助翻译。但mRNA上可能存在多个潜在的多聚腺苷酸化位点——选择靠近转录起始点的位点时，3&amp;rsquo;端更短，调控序列更少，mRNA更易被降解；选择远端位点时，一些调控元件被保留，影响mRNA的细胞内定位和翻译效率。细胞正是通过选择不同位点，来精细调控mRNA的寿命和翻译时机。&lt;/p&gt;
&lt;p&gt;基因数目有限，却通过这些&amp;quot;变化&amp;quot;极大地拓展了表达的多样性——有限的遗传信息，生生不息。&lt;/p&gt;
&lt;p&gt;云南是下一届《生物多样性公约》缔结大会要召开的地方。云南瑞丽由于地理位置特殊，遭遇了疫情反扑，使原本5月的大会推迟到10月。不然刚好能赶上蝴蝶大爆发的景象，实在可惜。&lt;/p&gt;
&lt;p&gt;如果没有记错，明天是国际生物多样性日。&lt;/p&gt;
&lt;p&gt;生物多样性为什么如此重要？这取决于人们对生态系统自然修复能力的态度是否乐观，出于我们的伦理，以及对复杂的敬畏。在物质极大丰富的时代，智人占有的自然资源和掌握的科学技术，换来寿命的延长和物种的安定，至于这些在多大程度上威胁到其他生物的生存，我想并不容易界定。&lt;/p&gt;
&lt;p&gt;一种稀有生物的灭绝对目前这代人的影响大都不是肉眼可见的，不过我们还是尽可能从可持续的角度出发。持对立价值观的人则少有为资源忧虑，但也仍然会面对疾病的挑战。病毒是简单的生命形式，在全球化背景下带来了空前规模的疫情。癌变则像一套23册的书卷（每本约1000页），仅仅出现了40-60个排字错误，却成为了生命最困难的终极战役。&lt;/p&gt;
&lt;p&gt;幸好，有一部分高明的人（但愿他们并不是自诩&amp;quot;智人为地球的主宰&amp;quot;）考虑到各个物种在系统中隐约发挥着一定的生态作用，提倡人们采取行动，关注生物多样性保护。&lt;/p&gt;
&lt;p&gt;我深受感染。&lt;/p&gt;
&lt;p&gt;从基因的可变剪切到物种的多样并存，&amp;ldquo;变&amp;quot;是生命应对有限资源的根本策略——一个基因通过不同的剪切方式产出多种蛋白质，一个生态系统通过不同的物种组合维持韧性。逻辑同源，尺度不同。&lt;/p&gt;
&lt;p&gt;祝愿后疫情时代的世界，健康和平，焕发新生，羽化成蝶。&lt;/p&gt;</description></item><item><title>可变剪接分析详解 / Alternative Splicing</title><link>https://touchingfish.top/2021/alternative-splice-algorithm-cn/</link><pubDate>Sun, 21 Feb 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/alternative-splice-algorithm-cn/</guid><description>&lt;h2 id="背景"&gt;背景&lt;/h2&gt;
&lt;p&gt;在真核生物中，一个基因可以通过可变剪接（Alternative Splicing, AS）产生多种
mRNA 亚型（isoform）——即在 pre-mRNA 剪接过程中，通过不同的外显子组合方式，生成不同的
成熟 mRNA。这一机制在不增加基因数目的前提下，极大扩展了蛋白质组（proteome）的多样性。&lt;/p&gt;
&lt;p&gt;一个含有 N 个外显子的基因，理论上最多可产生 2^(N-1) 种剪接变体。实际中，
大多数基因产生 2-10 种亚型，但个别基因（如果蝇 Dscam）可产生数万种剪接变体（splice variant）。&lt;/p&gt;
&lt;h3 id="为什么需要计算分析"&gt;为什么需要计算分析&lt;/h3&gt;
&lt;p&gt;高通量转录组测序（RNA-seq、全长 cDNA 测序）会产生数千条转录本比对到参考基因组
上的结果。人工逐个检查每个基因的剪接变异是不现实的。计算流程需要：&lt;/p&gt;
&lt;ul&gt;
&lt;li&gt;将属于同一基因位点的转录本聚类&lt;/li&gt;
&lt;li&gt;区分真正的剪接变体与比对假象（alignment artifact）&lt;/li&gt;
&lt;li&gt;对每种剪接变异进行分类&lt;/li&gt;
&lt;li&gt;对全基因组的 AS 事件进行定量和汇总&lt;/li&gt;
&lt;/ul&gt;
&lt;h3 id="as-code-的概念"&gt;AS Code 的概念&lt;/h3&gt;
&lt;p&gt;AS Code 体系（Sammeth et al., 2008）提供了一种紧凑、无歧义的记号来描述任意
可变剪接事件。其核心思想是：&lt;/p&gt;
&lt;blockquote&gt;
&lt;p&gt;对于任意一对重叠的转录本，它们之间不同的剪接位点定义了 AS 事件。将这些差异
位点按位置编号，并标记为供体（^）或受体（-），即可得到唯一描述该事件结构的
编码。&lt;/p&gt;
&lt;/blockquote&gt;
&lt;p&gt;这一编码使得 AS 事件可以被系统地分类为具有生物学意义的类别。&lt;/p&gt;
&lt;hr&gt;
&lt;h2 id="输入数据与预处理"&gt;输入数据与预处理&lt;/h2&gt;
&lt;h3 id="所需输入文件"&gt;所需输入文件&lt;/h3&gt;
&lt;table&gt;
 &lt;thead&gt;
 &lt;tr&gt;
 &lt;th&gt;文件&lt;/th&gt;
 &lt;th&gt;格式&lt;/th&gt;
 &lt;th&gt;内容&lt;/th&gt;
 &lt;/tr&gt;
 &lt;/thead&gt;
 &lt;tbody&gt;
 &lt;tr&gt;
 &lt;td&gt;基因组&lt;/td&gt;
 &lt;td&gt;FASTA&lt;/td&gt;
 &lt;td&gt;参考基因组序列&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;基因注释&lt;/td&gt;
 &lt;td&gt;GTF&lt;/td&gt;
 &lt;td&gt;基因模型及外显子坐标&lt;/td&gt;
 &lt;/tr&gt;
 &lt;tr&gt;
 &lt;td&gt;cDNA 比对&lt;/td&gt;
 &lt;td&gt;GFF3 (cDNA_match)&lt;/td&gt;
 &lt;td&gt;全长 cDNA 比对结果&lt;/td&gt;
 &lt;/tr&gt;
 &lt;/tbody&gt;
&lt;/table&gt;
&lt;p&gt;基因注释提供参考转录本结构；cDNA 比对提供实验观测到的转录本结构，可能揭示注释中
未收录的新剪接变体。&lt;/p&gt;</description></item><item><title>负二项分布和它的朋友（RNA表达量）</title><link>https://touchingfish.top/2021/gamma-poisson/</link><pubDate>Mon, 01 Feb 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/gamma-poisson/</guid><description>&lt;h2 id="一个看似奇怪的事实"&gt;一个看似奇怪的事实&lt;/h2&gt;
&lt;p&gt;做RNAseq分析的时候，我们通常会说：表达量计数（read counts）服从负二项分布（Negative Binomial distribution，NB）。这个结论出现在几乎所有主流差异表达分析工具的文档里——DESeq2、edgeR、limma-voom——好像这是一个不言自明的前提。&lt;/p&gt;
&lt;p&gt;但为什么？&lt;/p&gt;
&lt;p&gt;我查过很多资料，大多数解释要么太浅（&amp;ldquo;因为数据过度离散，过dispersed&amp;rdquo;），要么直接跳到公式层面（&amp;ldquo;NB的概率质量函数是……&amp;quot;），要么扯到什么&amp;quot;等待时间&amp;quot;上去（&amp;ldquo;NB描述的是等待r次成功所需的试验次数&amp;rdquo;）——最后一种解释尤其让人困惑，因为RNAseq计数和&amp;quot;等待时间&amp;quot;八竿子打不着。&lt;/p&gt;
&lt;p&gt;所以我想把这件事彻底说清楚。用一个最简单的例子，一步步推出为什么NB是自然的选择，而那个经典的等待时间定义，其实和我们的推导毫无关系。&lt;/p&gt;
&lt;h2 id="从一个直观的例子说起"&gt;从一个直观的例子说起&lt;/h2&gt;
&lt;p&gt;假设我们要研究某个基因在细胞A和细胞B中的表达量。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;细胞内部发生了什么？&lt;/strong&gt; 一个基因要被转录，首先要有RNA聚合酶结合到启动子上，然后开始合成。聚合酶会随机地到达和离开启动子区域，所以转录本身是一个随机过程——在任何给定的时间窗口内，合成出的mRNA分子数是随机的。&lt;/p&gt;
&lt;p&gt;如果我们把观察时间固定（比如观察一秒），转录产生的mRNA数量大致服从Poisson分布。理由是：mRNA的产生可以看作一系列独立的&amp;quot;成功&amp;quot;事件（一次转录起始），在一个固定时间窗口内，Poisson是描述这类计数过程的自然模型。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;但问题来了——Poisson有一个很强的假设：均值等于方差。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;对于单细胞来说，均值和方差的关系确实大致如此。但当我们比较&lt;strong&gt;一群细胞&lt;/strong&gt;（比如组织样本中的上万个细胞）时，情况完全不同。即使是同一个基因，不同细胞的表达量也可能差异巨大——有些细胞可能完全不表达，有些高表达。&lt;strong&gt;这种细胞间的异质性（biological variability）会导致整个群体的方差远大于均值。&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;这就是所谓的&amp;quot;过度离散&amp;rdquo;（overdispersion）。Poisson处理不了这个问题。&lt;/p&gt;
&lt;h2 id="gamma-poisson层级模型"&gt;Gamma-Poisson层级模型&lt;/h2&gt;
&lt;p&gt;解决之道来自一个层级思想。&lt;/p&gt;
&lt;p&gt;我们先承认：不同细胞的真实表达率（$\lambda$）本身是不同的。这种差异可以用一个分布来描述。选什么分布？在统计中，Gamma分布是一个自然的选择——因为它数学上处理起来方便，而且足够灵活，可以描述各种形状的随机变量。&lt;/p&gt;
&lt;p&gt;于是我们构建一个两层模型：&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第一层（细胞间变异）：&lt;/strong&gt; $\lambda \sim \text{Gamma}(\alpha, \beta)$&lt;/p&gt;
&lt;p&gt;这里 $\lambda$ 代表每个细胞的真实表达率（单位时间内的mRNA平均产量）。$\alpha$ 和 $\beta$ 是Gamma分布的参数。均值 $\mu = \alpha/\beta$，方差 $= \alpha/\beta^2$。&lt;/p&gt;
&lt;p&gt;&lt;strong&gt;第二层（细胞内随机性）：&lt;/strong&gt; 给定 $\lambda$，计数 $X$ 服从Poisson分布：$X | \lambda \sim \text{Poisson}(\lambda)$&lt;/p&gt;
&lt;p&gt;这一层描述的是：即使两个细胞有完全相同的 $\lambda$，由于转录过程本身的随机性，实际观察到的计数也会有波动。&lt;/p&gt;
&lt;p&gt;现在，&lt;strong&gt;把 $\lambda$ 积掉&lt;/strong&gt;（marginalize out），求 $X$ 的边缘分布：&lt;/p&gt;
$$P(X = k) = \int_0^\infty P(X=k|\lambda) \cdot P(\lambda) \, d\lambda$$&lt;p&gt;这个积分的结果是：&lt;/p&gt;
$$P(X = k) = \frac{\Gamma(k+\alpha)}{k! \cdot \Gamma(\alpha)} \left(\frac{\beta}{1+\beta}\right)^\alpha \left(\frac{1}{1+\beta}\right)^k$$&lt;p&gt;而这——恰好就是&lt;strong&gt;负二项分布&lt;/strong&gt;的参数化形式。&lt;/p&gt;</description></item><item><title>2021年1月精神粮票</title><link>https://touchingfish.top/2021/january-books-movies-music/</link><pubDate>Sun, 31 Jan 2021 00:00:00 +0000</pubDate><guid>https://touchingfish.top/2021/january-books-movies-music/</guid><description>&lt;h2 id="书籍"&gt;书籍&lt;/h2&gt;
&lt;p&gt;（2021-01-01）这个月继续阅读《基因传》，一本关于生物学家轶事的书，很适合做科普素材。&lt;/p&gt;
&lt;p&gt;（2021-01-09）重读数学书籍，《普林斯顿微积分读本》一次一气呵成的复习体验，让我好像找到了合适的学习方式。&lt;/p&gt;
&lt;p&gt;（2021-01-10）读了《数学》这本书，看了很久，每次阅读几段文字便有强烈的感想，然后花点时间体会和吸收。&lt;/p&gt;
&lt;p&gt;（2021-01-13）读了一小时《菜根谭》，有点像经书里的《箴言》和《传道书》，一些措辞和比喻值得玩味儿和积累。《牛津：数学》的电子书翻完，只因为排版已经完全影响阅读，还是看纸书更好。&lt;/p&gt;
&lt;p&gt;（2021-01-19）今天把《双螺旋》加入微信读书的书架，什么时候体会到了笔尖，文案和视频都能够出来。&lt;/p&gt;
&lt;p&gt;（2021-01-31）微信读书数据显示，看了34万字的书，实际上在电脑上看《普林斯顿微积分读本》更多，不过一本完整的书都没读完。&lt;/p&gt;
&lt;h2 id="电影与剧集"&gt;电影与剧集&lt;/h2&gt;
&lt;p&gt;（2021-01-01）看完了《神奇女侠》，对漫威和DC的这些电影似乎已经没有从前的兴致了（除了最经典的《蜘蛛侠》吧）。&lt;/p&gt;
&lt;p&gt;（2021-01-02）早上终于还是开始二刷《绝代双骄》了，好想分享自己看剧的吐槽日记。小鱼儿和铁心兰的感情线是我很喜欢的一部分，初恋不过如此吧。&lt;/p&gt;
&lt;p&gt;（2021-01-04）睡前看了两集《甜蜜家园》，第二集开始便没有那种惊悚的压迫感了，甚至有点中二，果然只是一部漫改剧。&lt;/p&gt;
&lt;p&gt;（2021-01-07）一口气看完《甜蜜家园》，像看漫画一样，有点洗海带内味了。因为剧作原创的剧情，没办法通过漫画剧透，有点可惜，至于有没有第二季，我觉得还是个问题。&lt;/p&gt;
&lt;p&gt;（2021-01-18）看了大半天《Run on》，确实好看，不然估计之前看了十二分钟就弃了。&lt;/p&gt;
&lt;p&gt;（2021-01-19）下午看了《Soul》，创意和立意都很好，但是强行上价值，剧情逻辑混乱，让我有点不适。还好有网友同感并指出，原谅了自己一直get不到的情况。庆幸自己没看环游记。&lt;/p&gt;
&lt;p&gt;（2021-01-22）好几天没看《Run on》，还是很无脑赞。《浪姐2》开播了，既想看又不想看，倒是热搜截胡很残忍。没想到湖北卫视在播《非正6》，前两天刚刚关注了一些friends的IG，今天又在屏幕上看到他们。&lt;/p&gt;
&lt;h2 id="综艺节目"&gt;综艺节目&lt;/h2&gt;
&lt;p&gt;（2021-01-01）今晚没有《姐姐的爱乐之程》，因为没有提前关注消息，空等被鸽。&lt;/p&gt;
&lt;p&gt;（2021-01-02）晚上有大本营和爱乐之程，看电视维持我的好心情。姐姐们的节目真是生活赏给我的一颗糖，似乎从选择泉州作为第一站就已经决定了节目能够渐入佳境。&lt;/p&gt;
&lt;p&gt;（2021-01-09）周六看《快乐大本营》已经成为惯例了。虽然很多人说这个节目早已不复当年，但我个人还是很喜欢快乐家族的每一位，就像以前很乐意看《Running Man》一样。&lt;/p&gt;
&lt;p&gt;（2021-01-15）每年过年前都会看一下《把乐带回家》的微电影，原来今年的在十二月底就出来了，还没来得及看。&lt;/p&gt;
&lt;p&gt;（2021-01-16）没有《快本》的周六不是周六，电视罢工也要倒回去看完最后十分钟，太爱周六这些综艺了。&lt;/p&gt;
&lt;p&gt;（2021-01-22）姐姐的节目步入尾声，看一集少一集了。本以为今晚《爱乐之程》收官，没想到还有一期日常，赚了。艾克斯西斯塔昙花一现，却&amp;quot;惊艳&amp;quot;了本命年的我。&lt;/p&gt;
&lt;h2 id="音乐"&gt;音乐&lt;/h2&gt;
&lt;p&gt;（2021-01-02）立了一个无关紧要的flag：把今年网易云音乐每日推荐的第一首歌收集成一个歌单，今天是第二天。&lt;/p&gt;
&lt;p&gt;（2021-01-08）耳机丢了一个，没有心情了。奇怪的是明明该掉在家中，地板上却怎么也找不到，浪费了生命中宝贵的一小时，原本应该用来录歌的时间。&lt;/p&gt;
&lt;p&gt;（2021-01-13）差点忘记收藏日推的仪式，这样下去很有可能会有一天miss，于是设置了备忘提醒。&lt;/p&gt;
&lt;p&gt;（2021-01-17）终于还是买了新的蓝牙耳机，过几天就能用上了吧。&lt;/p&gt;
&lt;p&gt;（2021-01-20）新耳机到了。&lt;/p&gt;
&lt;p&gt;（2021-01-26）突然想起有个马思惠妹妹深得我心，于是找了两首新歌听。&lt;/p&gt;
&lt;p&gt;（2021-01-29）出门懒得跑步，唱歌录音效果极差，好想要一副新耳机。&lt;/p&gt;
&lt;p&gt;（2021-01-30）听到一首很棒的歌。&lt;/p&gt;
&lt;p&gt;（2021-01-31）一月结束，每天收藏第一首歌的成就达成。&lt;/p&gt;</description></item></channel></rss>