Mitchell: 我现在和Simon DeDeo在一起,他是SFI的研究员 Simon是理论物理学出身,但他研究各种各样的问题 现在他要给我们讲一点他的研究 呢么Simon 你来研究所多久了 DeDeo: 我猜...我2008年来的,2010年开始隶属这里 一直到现在 Mitchell: 好,那么Simon, 你能讲讲你在做什么吗 DeDeo: 当然,就像Melanie所说,我最开始是做物理的 我实际上是个宇宙学家,当时我在研究 你知道的,比如时间空间的起源..甚至不包括星星,只有宇宙空间 当我2001年读博士 很多最重要的结果还没有在理论中出现 还处在理论和数据的中间 所以当时我的项目中,最厉害的人都在分析数据 这就引出了这个想法: 我们可以通过观察来探索 我现在做很多完全不同领域的工作 我主要研究生物和社会系统 这次会提及一点社会系统 在这些方面,我做的最多的就是 某种意义上,我们宇宙学和哲学很相似 我们有很多数据,而我们在寻找最关键的理论特征 可以说,最令我激动地,就是维基百科的工作 让我讲讲历史因为这很有趣 很多人,他们成为生物学家因为他们出生在 西佛吉尼亚州,那里动植物丰富 我是伦敦出生的,那个大城市没什么动物 (当然,除了人) 当时我只明白一件事,就是我身处一个大城市 城市有条不紊地运作,那么为什么会运作呢? 为什么糖果屋正好有糖果呢 为什么街道呈现那样的结构模式呢 我当时这样问我自己,为什么这样?谁创造了一切? 有一个系统我们可以仔细研究,有类似的性质 就是维基百科 维基百科(你估计听说过) 是一个开放的百科全书,人人都可以编辑 十分值得信任 在特定的主题栏目它和大英百科全书可以媲美 大概是每篇文章四个错误相对而言大英百科有五个 在维基百科中我关注的是人们的合作和冲突 确切的说我们通过咨询帮人们决定是否要撤销别人的工作 如果你熟悉维基百科,你会发现你能编辑页面 粗略地讲有两种编辑 一种是,你看出了一个问题,你可以修复它 你可以创建一个缺少的页面 你觉得一个段落不够完善可以补全它 我刚刚在阅读麦克斯韦妖,那里有一段很诡异,刚刚被去掉 Mitchell: 嘿,那是我写的 DeDeo: 天呐! 那是一段关于涡流的,看起来很诡异 另一种编辑是"恢复" 那就是把现在的状态恢复回原来的 恢复虽然不能说是敌意的举动 因为确实有时候你需要恢复页面 当有什么人出来恶意破坏页面的时候 如果你是个好人你就会来恢复页面 广泛的说,一连串的恢复页面是一种反对行为的表现,一种冲突 如果我写了什么关于乔治·布什的东西,你不喜欢 你就去掉它,通过恢复到以前的页面内容 我也不喜欢你,所以我恢复到我更改的页面 所以维基百科上发生的事情可以归纳为 对一个页面是或否的选择 是或否编辑页面,我们称为合作编辑的C和称为恢复编辑的R 粗略的来讲就是这样 我们考虑人们在维基百科中编辑行为的复杂性 不考虑具体是更改了编辑了什么东西 因为有时候C是恶意的而R是善意的 总的来说,我们是观察那些句子 那些在任何页面中被编辑的句子 实际上,被编辑最多的维基页面是乔治·沃克·布什的 目前有45000独立的编辑 所有的记录都被维基记录了下来(虽然并不是维基一开始就有) (可能以前也发生了很多事情) 但我们有记录,关于总统的管理和管理的后果 其中最关键的是人们如何达成一致又如何产生分歧 对页面中的任何一处内容 我们关心的问题是,那种底层的机制 怎样的系统,将会产生那种编辑战 你可能会这样想,人们带着偏见随机的来这个页面 假设说,75的人带着坏心情来,他们会恢复页面 我们称之为IID操作 但真正有意义的是,现在发生的事情和以前发生的事情无关 这是一种能观察到的结构 这可能很常见,这不是如何使用维基的教程 另一种常见现象 是现在发生的事情很大层面取决于之前发生的事情 我们做了很多不同的模型 在这篇我们刚刚发表的文献 这个系统中其中一点是极大的储存容量 之所以不用无限这个词是因为它很诡异 这个系统能够存储之前任意久的信息 我们想表达的是 我们观察了百科中重复合作的事件 如果一个系统有有限的记忆 用术语说就是有限状态机 我来画一个对数图吧 Mitchell: 画吧 DeDeo: 好,如果我这样画对数坐标图 这里是概率...(不我想作的是线性---对数图) 如果我对一串合作事件的概率做对数图 这个轴上是串的长度 很大概率你会看到一个C被R包围了 两个C的概率---也就是两个人在做好事 或者至少是看起来的好事,粗略地说 那么,如果这是有限状态的 这将会是一条直线,也就是说对数下降 一个好事后再一个好事的概率 如果你连续获得了一百个C,获得一个新的C的概率会指数下降 实际上,你不会看到一条直线 你会看到最后趋于平衡 如果你考虑这个系统本质上是一台巨型电脑 里面假设人们随机相互作用(这就是我的机器) (我的机器就是一束相互作用的循环,也许是乔布斯的灵魂在操控) 你可以问这个系统正在做什么运算呢,怎么样去描述他呢 这种信息的收集,这种记忆的持续 现在发什么本质上取决于之前发生了什么 并不是均匀的影响,最近的过去会影响地更多些 也就是,过去的事情并没有被遗忘 这种结构并不是单个个体所产生的 这是众多人们合起来创造的合作现象 所以这就是某种社会建立制度的过程 Mitchell: 那么Simeon, 我问几个问题 DeDeo: 好 Mitchell: 第一个问题,这个研究的最终目标是什么 大体来说你会怎么回答 DeDeo: 啊好问题,首先是,我们不了解大型系统网络如何工作 我们大致了解个体怎么行动,我们有这些个体在这种系统中如何行为的模型 但我们不知道他们在群体中活动的确切机制 我们有很多简化的模型 但是我们想知道,本质上发生了什么 Mitchell: 所以,在维基百科人们是匿名的 匿名对合作和非合作有很大影响 这和每个人都知道是谁以及他们在做什么是完全不同的 DeDeo: 很正确 实际上当你关注计算过程这两者是有很大差别的 这个系统究竟底层是什么程序在运行 你马上会发现它分成了两个不同模块 一个是被保护的页面 只有注册的不能改名的用户才能更改,一个是无保护的 所以显然是两种不同的动力系统 在没有被保护的页面中,结构实际上十分复杂 在被保护的页面中又是另一种情况 但是强迫人们用固定的身份信息并没有排除某种行为 二是拉大了行为的状态空间,我觉得很惊讶 我觉得应该会有两种不同模块 一种纯粹的任何人都可以编辑 一种是只有被信任的人才能编辑 实际上,任何人都可以编辑比加上限制更加简单一些 加上限值实际上增加了这个过程的复杂性 这就带来了复杂,我认为 这就是说简单性就是你假定的这个系统有多少内在状态 有多少结构,多大的记忆容量 不知道这是否回答了你的问题 Mitchell: 我觉得回答得很好,谢谢,Simon Dedeo: 谢谢,和你交谈很愉快