概率图模型学习笔记I - 引子

我是个有CS背景的医学生,并不是工科的人。我突发奇想要开始学概率图模型是因为Coursera上有这样一节课,然后我之前知道自然语言处理之中使用的HMM模型就是一种无向图模型。我对自然语言处理很感兴趣,于是对概率图模型(Probabilistic Graphic Model)产生了好奇心。

我下定决心要好好学习概率图模型是因为在PubMed上看iPS细胞(今年诺贝尔医学奖)相关的文章时,偶然在Cell上发现了这么一篇神奇的文献:

Single-Cell Expression Analyses during Cellular Reprogramming Reveal an Early Stochastic and a Late Hierarchic Phase

http://dx.doi.org/10.1016/j.cell.2012.08.023

  这篇文献说的内容大概是一个细胞之内的转录调节的发生,前半段是一个随机过程,只要某些因子在随机过程中胜出,那么就会进入后方的确定性过程。接着这篇文献给出了iPS细胞相关因子的调控网络。看到那个网络的时候,贝叶斯网络这个词立刻在我脑海里浮现出来。之前的课上老师提到过各种-omics(组学),但是这些组学的概念从来没有用这样数学的方式呈现出来。

  于是我第一次理解到组学的重要性。同时也意识到,贝叶斯网络是一个强大的工具,如果我们能找到一种方式,从已经进行的各种生物实验数据中学习得到一个贝叶斯网络,然后用这个网络进行预测,例如寻找合适的药物靶点(之前听说过有的药物是针对某个细胞因子设计的,但是效果不佳,是因为细胞转录网络在某个细胞因子被药物阻断之后又激活了别的通路来补充,如果能成功建立这么一个贝叶斯网络,对阻断后细胞调节的效果进行预测,那么确实有应用的价值)。

  由于我相信学习密度对学习质量的影响很大,我专门抽出一周时间,把大部分空闲时间集中用来看概率图模型,并且一边看一边写比较零碎的学习笔记。这个系列是把学习笔记整理出来的文章。

希望不要坑掉

2012-12-02 09:23353