许多现实世界的系统可以表示为网络,包括生物网络。 网络存在于不同规模的生物系统中, 从生命进化树,生态网络到表达网络和监管网络。 你能说出任何可以表示为网络的其他生物现象吗? 蛋白质或代谢相互作用, 也可以表示为图形或网络。 在生物网络中,节点和边可以代表不同的东西。 节点可以是蛋白质,肽或非蛋白质生物分子。 边可以是任何生物关系, 例如相互作用,规则或变换。 例如,可以在基因,蛋白质和药物之间 构建二分图或三方网络图。 你还记得二分图的定义吗? 已经研究了蛋白质 -蛋白质相互作用网络, 转录调节网络和代谢网络,并且据报道它们的结构特性是相似的。 观察到的属性与复杂网络传统的随机图模型不一致。 它们的度分布遵循幂律的度分布, 基本上富者越富。它们具有较小的平均最短路径长度。 它们非常有弹性,有很强的抵抗力, 随机攻击会失效,但对有针对性攻击很脆弱。 它们具有分层模块性和一些中心节点, 并且正如前面提到的,已经在生物网络中观察到 如果没有它,就不能进行更多的中心节点。 此处显示的图是蛋白质 - 蛋白质相互作用网络或PPI, 并且已使用三种不同的公共数据库构建。 该蛋白质相互作用网络具有超过1,500种蛋白质 和337,000种相互作用。 PPI通常被建模为无向图,其中节点代表蛋白质, 边代表相互作用。 与其它蛋白质相互作用的蛋白质的频率遵循幂律。 PPI网络展现出小世界现象。 可以在少量次数的跳跃中到达任何节点, 通常是四次或五次。 虽然这些网络非常稀疏,但如果不把它们分成小块就很难进行研究。 生物网络是模块化的。 因此,人们可以尝试 找到生物网络的高度聚类子图,以获得它的高水平概观。 这也使我们能够根据其社区预测未知的基因 或蛋白质功能。 在文献中已经提出了多种算法和方法,从简单的k-均值聚类到基于马尔可夫链的模型, 以在复杂网络中找到这些模块和社区。 社区检测的主要挑战之一是社区数量。 大多数这些方法都有一组在运行它们之前需要说明的参数。 更改这些参数的确切值, 会影响检测到的社区或模块的数量。 例如这里显示的是MCL方法找到的PPI网络模块。 已知这里的许多基因属于特定的生物途径。 作为生物网络的另一个例子,我们有一个药物之间相互作用网络。 基于每种药物对一组基因的作用的相似性重建该网络。 这种类型的网络在药物再利用中非常有用。 直接使用统计学或机器学习方法从实验数据 构建生物网络在过去十年中受到了极大的关注。 有多种方法可用于从实验数据推断生物网络。 采用的方法包括:贝叶斯网络,自回归模型,基于相关, 基于互信息的模型,聚类技术或微分方程模型。 这些方法中的大多数使用扰动来验证重建的网络。 这可以通过从系统中去除节点,基因,蛋白质或代谢物 或通过防止特定的相互作用来进行。 生物网络非常复杂和多样化, 因此我们不能仅依靠基于统计的方法来分析它们。 在本课程的其余部分, 您将学习一种研究和探索这种复杂网络的新方法。