Skip directly to search Skip directly to A to Z list Skip directly to page options Skip directly to site content

使用DNA微阵列来研究宿主与微生物间的相互作用。

克雷格 A. 库蒙明格斯*和大卫 A. 瑞尔曼*
美国加利福尼亚州斯坦福区斯坦福大学;美国加利福尼亚州怕罗阿尔托区 梵.怕罗阿尔托保健系统

Chinese Translations - 中文译本 > Volume 6 - 第6卷

Article in English

吕晓英 译

病原微生物和宿主的完整基因组序列为研究宿主-病原体间的相互作用提供了尖端的新战略。DNA微排列是利用主要序列的数据来同时测量每一基因的转录水平和检测序列多态现象。为每一个给定的微生物基因组设计和构造一个DNA微 排列是简单的。通过监视微生物的基因表达,人们能预知该非特异基因的功能、探索各种环境条件下该基因的生理适应性、识别毒性关联基因和测试药效。同样,通 过使用宿主基因微排列,人们能探索宿主在基因表达水平的反应,并提供随后感染事件的一种分子水平的描述。宿主的状况也可为每一病原体的识别提供基因表达所 独有的信号。这样就为传染性疾病的诊断、预后和临床管理提供了一种新的工具。

病原微生物和宿主间复杂的相互作用是传染性疾病的根源。通过了解这一相互作用的分子详细资料,我们能识别微生物毒力相关基因和宿主防卫方略以及它们反应出的特点的提示和他们的调控机理。该信息将指导设计新一代的医疗工具。

基因组排序将为阐明宿主-病原体间相互作用的复杂性提供必需的数据。至2000810日址,已获得87%人类基因组序列草图(http://www.ncbi.nlm.nih.gov/genome/seq/),并对包括超过一打以上人类病原体的至少39个原核基因组基因组序列进行了测序(http://www.tigr.org/tdb/mdb/mdbcomplete.html)。发现基因的速度突飞猛进,但因我们对基因功能的了解远远置后,所以,基因用于在分子水平上解释生命现象的潜能尚未得已实现。例如,即使对已研究了很多的大肠杆菌来说,对其功能的研究也不超过其基因的三分之一(1)。如果使用此主要序列的信息,就需要高通量方法对其功能进行清楚的评估。

通用的基因表达的构形是用来评定其功能的诱人的方法。因为一种基因通常只有在其功能所要求的时间和地点才进行转录,所以确定控制一个基因表达的位置和条件可以推论其功能。一些独立的、高通量的、用于差异基因表达的方法(包括SAGE和差异显示)可以为被测序的基因组提供功能注解(2)DNA微排列杂交分析具有简单、全面、数据一致和高通量等突出优点。

转录控制在宿主-病原体相互作用中扮演一种关键角色(3,4); 因此,基因组范围的转录构形似乎特别适合于此过程的研究。因这些方法可特许用于传染性疾病的研究,故本文将集中讨论研究转录反应以微排列为基础的方法。虽然期望以微排列为基础的基因型的应用在该领域作出重要贡献,但这里崭不提及。

-密度DNA微阵列:基本工具

-密度DNA微阵列方法在1995年首次提出后(5),已经在包括细胞生理学(6- 11)、癌生物学(12- 17)和药理学的许多领域造成了显著的影响。宿主-病原体相互作用的首次基因表达构形结果已经开始显现出来。探究这些结果之前,我们来简略地回顾一下这些方法。

技术

(Color graphic to come)

1.通过使用DNA微阵列来测量相关的基因表达。用毛细管印刷术可将DNA片段在一幻灯玻片上排列(右上方)。从两个要进行比较的标本制备RNA,通过反转录制备cDNA,将Cy3(绿色)Cy5(红色)合并(左上方)。对两种标记的cDNA混合物进行混合并杂交形成微排列,并对幻灯片扫描。在所形成的假色图像处理中,绿色的Cy3和红色的Cy5信号被黄色覆盖的斑点显示出相等的染色强度。使用图像处理分析软件,决定排列的每一成分染色信号的强度并计算出Cy5浓度与Cy3强度之比的对数值。在Cy5标记样本中,(Cy5/Cy3)的对数正值显示该标记物过剩,而在Cy3标记样本中,(Cy5/Cy3)的对数副值则显示Cy5标记物过剩。其值接近零则显示两个样本富余程度相等。完成了数个这样的实验之后,可以用聚类分析来处理数据。在此显示系统中,红框表示log( Cy5/Cy3)值为正数,绿框表示log( Cy5/Cy3)值为负数,强度代表该值的大小。黑框表示log( Cy5/Cy3)值接近零。通过基因(纵轴)和试验(横轴)的分层聚类已经识别出一群共济基因(在这里显示显示少许)并将实验分为切然不同的类别。 (斯坦福大学J. Boldrick插图)

(Penny graphic to come)

2. DNA微排列-淋巴芯片。 (中心)淋巴片译本8.0,是用32点色彩打印头打印在一种有涂盖层的玻璃显微镜幻灯片上,容纳17,856 cDNA克隆(在上方照明)(14)(左边)以美国便士(硬币)作比例尺。 (右边)扫描的图像显示Cy3Cy5标记的cDNA对此微阵列的微分杂交。 (斯坦福大学的阿里扎德、M. 埃森、P.布朗和国立癌症学会的L. 斯托德特的插图)

所有微阵列试验一致的关键原理是:在溶液中标记的核酸分子同高灵敏度和高特异性地杂交到固定在固体基质上的足够的互补序列上,这样就有利于对许多不同序列在一种复杂的混合物中进行平行定量测定(20,21)。虽然已建立了几种用于建立微排列的方法(22,23), 但是有两种很盛行。其一,是通过物理性地粘附诸如库存克隆DNA片段或多聚酶链反应(PCR)产物到一种固体基质上来构造DNA微阵列(5)(图1)。通过使用一种遥控编排和毛细管印刷术,我们能在一个显微片上印刷至少23,000种成分(P布朗,佩尔斯·科姆,图2)。另一种方法,是通过使用照象平板印刷术在原位合成单链寡核苷酸来构建阵列(24,25 )。前一方法的优点包括费用相对低和良好的适用性(这是它在学术机构设备中被广泛应用的原因);另外,印迹一个DNA组分并不需要主要序列的信息。后法的优点包括更高的密度(在一个1.28×1.28-厘米的阵列上有大于280,000个特征)和免去了收集和储存克隆DNAPCR产物的麻烦。在微阵列技术中持续的商业兴趣在于增加数组元素密度,更好的检测灵敏度和比较便宜、快速的方法。可以获得对微阵列构造方法和杂交草案的技术描述(26- 28;和http://cmgm.stanford.edu/pbrown/mguide/index.html)

来自真核细胞的信使RNA通常通过将mRNA用一种寡-dT树脂亲和纯化而特定标记,随后通过随机或寡-dT寡核苷酸引物反转录酶(RT)将染料标记的核苷嵌入cDNA分子中(图1)。在原核生物中,因转录中缺乏聚腺苷酸使得标记 mRNA更困难。方法之一是通过共价结合或通过RT和随机寡核苷酸引物将染料标记的核苷嵌入互补DNA从而标记总RNA (30)。尽管在杂交反应中标记的染色体和tRNA分子拷贝数很高,在合适的条件之下仍可实现将特殊的mRNA杂交到阵列上。另一种方法是用对于开放读码框架(ORFs)特异的反转链寡核苷酸混合物,或者那些用于构造微阵列(M.Laub Shapiro,每comm.)或足够杂交到每个ORF 3端的最小限度为8的 复杂混合物进行预反转录反应。这种方法通过从编码区选择性地合成cDNA而导致更高的信号和声音比。

对于印迹的DNA微阵列,通过用不同的荧光染料(例如,Cy3Cy5)标记两个样品,并同时与他们杂交,确定在该阵列上每个聚光点的荧光比,从而来测量相对转录丰度(图1)。在寡核苷酸阵列中,来自相同基因的多个探针,每个探针用一个相应的不匹配探针作为内对照和对标准基因已知数量的标记转录,使得单个标记标本杂交之后转录丰度的定量测量成为可能(25)。对于此两种技术,使用荧光标记增加了灵敏度和测量的动态范围。

基因表达矩阵实验还可以通过将单个标记的mRNA标本杂交到阳性电荷滤膜上的DNA元素巨阵列上进行(10,11,32- 34)。因为此格式不需要任何特殊的阵列或扫描设备,特殊阵可以相对便宜地生产和分析。人、鼠和微生物的巨阵列可商业购买(SigmaGenosysWoodlandsTX;研究遗传学,汉特斯维尔, AL; 保罗 阿尔托,CA 克隆技术实验室;基因组系统,圣路易斯,MO)。该格式的主要不利之处在于降低了灵敏度(32),有限的组分和需要更高浓度的标记cDNA

微阵列数据分析

微矩阵可能成为一种微生物学实验室的标准工具。然而,因为基因组范 围资料的具大和广泛,分析一个实验都使人望而生畏。认真的实验设计能通过减少影响基因表达的变量数目而简化数据的分析和解释。例如,通过使用等位基因突变 可以减少菌株差异,通过研究克隆细胞系来减小组织复杂性,并且,通过转基因表达的实验调控可以降低复杂的调控途径(6)

因为微阵列实验产生如此大量的数据,所以假阳性结果是可能的。分析多个独立实验可以消除假结果(32)。通过独立的方法验证基因差异表达也同样重要。当用包括定量RT- PCR的许多方法检测时(6,35),已经确认Northern印迹法(33,34,36)、蛋白表达(33, 34)和大部分基因差异表达。例如,通过较早的报告或Northern印迹法,已证实72mRNAs中有72个受巨细胞病毒(CMV)感染而具有调控反应(37)。对微阵列研究人员来说,未来的挑战将包括开发数据库和算法来处理和分析巨大的基因组规模的资料。

图像处理分析软件

在杂交之后第一步是捕获阵列图像,并从其中提取每个组分的数据资料(图1)。有几种软件的应用程序,包括那些大多数市售的扫描仪装有的应用程序,可以执行此项任务。然而,并非所有程序都使用相同的算法来计算信号强度,并且每一程序输出一些不同的信号的质量测量,对用不同应用软件获取的数据进行复杂的比较(38)。如果比较基因表达资料,这些测量必须被标准化。此外,对于基因表达测量必须开发标准、有力的统计方法来对显著性进行评价。

数据库

虽然许多实验室现在能够收集微阵列资料,但很少能得到在实际上能满足他们资料要求的数据库。用可观的资源投资,已开发出一些特征清楚的、相关的基因表达数据库,但是并不用于公众的数据积累(例如,http://genome-www4.stanford.edu/MicroArray/MDEV/index.htmlhttp://www.nhgri.nih.gov/DIR/LCG/15K/HTML/dbase.html).近来发布,免费AMAD软件包(http://www.microarrays.org/software.html)给一般的实验室提供了基本的微阵列数据存储库和检索能力。

对于该团体一个主要的目标是为微阵列资料的共用确立一种统一资源(39- 41)。微阵列数据缺乏一种标准的格式再次妨碍了创建这样一种资源(38,39)(40; http://www.ebi.ac.uk/arrayexpress/).欧洲生物信息学会识别到此障碍,已经建议定义一种基于XML的标准,即一种合并数据并以单个文件的格式在全球网上进行发布的计算机语言(40http://www.ebi.ac.uk/arrayexpress/).

运算法则

对来自微阵列的数据进行计算并推论出生物学上有意义的信息需要复杂的数据研究http://www.ebi.ac.uk/arrayexpress/)。大多数的基因表达分析使用某些无人监管的聚类运算法则 (16,42- 44)处理数据以发现协同调控基因(图1)。此方法之所以正确的一个主要理由是共有的表达常常与其功能一致(38,43)。资料设置容纳许多的实验数据,聚类还可以根据基因表达档案资料进行分组,此方法已经被证实在来源于肿瘤的细胞系分类(19,45)和肿瘤亚类类中是成功的(12- 17)

当已知一种协同调控基因类型时,被训练过识别该类已知数据的受监督的聚类运算法则能将非特异基因归列到该类。例如,一种通常所说的支持媒体机的机器-学习方法已经被用于根据协同调控按照功能对酵母基因进行分类(46)。通过使用一种分层方法可以对协同调控基因簇实现有力的判断:用自治的聚类识别协同调控基因,随后用监控运算进行测试和使之精细化 (47)

虽然聚类算法在基因表达资料设置分析中将继续是中流砥柱,但已采用很多其他数据-采集技术(38,48)。初步报告显示许多算法和可视化方法正在开发之中,但是它们析取洞察生物的能力还未被确立(49- 51)

病原微生物和常规原核生物的研究将要求开发某些专门的分析工具。首先,简洁的和模块化的原核基因组结构--尤其是操纵子和致病性的显示部分,通过在基因组结构上进行基因表达信息绘图可以获得重要的见解。而且,因为在许多不同的病原体中测量基因表达,常常在相同的环境条件之下,基因表达数据的跨种比较工具将能探测保守转录反应。

检查一种微生物:DNA微阵列应用程序

微阵列技术通过对微生物基因组的解读,可加速非特异的或未充分探明特性微生物的研究,使得微生物生理学的研究和识别疑似毒性因子成为可能。

设计一种微生物的基因组微阵列

为一种完全测序的微生物设计一个全基因组DNA微阵列在概念上是简单的。一些敏感的决定程序的微生物基因,可以快速并正确地预报大部分ORFs( 52- 57)。代表每一种ORFsDNA片段可以通过使用ORF -特异寡核苷酸进行PCR扩增获得,该设计可以用诸如引物3的引物设计软件自动完成(58)。采用同族关系-搜索运算法则选择不与该基因组其他区域交叉-杂交的基因区域。在一种简单的纯化步骤之后,可以通过一种遥控的阵列对PCR片段进行排列(5)(L.这种基本方法已被用于构造一种4,290- ORF大肠杆菌微阵列(10,11)和一种3,834- ORF肺结核分枝杆菌微阵列(30)以及幽门螺旋菌全基因组阵列(S. Falkow,每comm.)Caulobacter crescentus( L. Shapiro, pers. comm.). (E. 沙皮若,佩尔斯 库姆.)( E.coli Genome Array, Affymetrix, Santa Clara, CA).依据照相平板印刷法在原位合成寡核苷酸来构造微阵列又是一种可行的方法并已被成功地用于生产一种大肠杆菌完整ORF芯片(大肠杆菌基因组阵列,AffymetrixSanta ClaraCA)

微阵列的应用并不局限于已完全测序的生物。通过阵列DNA文库可以获得一种强大的筛选工具,这一点已在真核病原体、疟原虫中得以证实( 59)。一种3,648个随机基因组克隆DNA微阵列被用于识别在滋养体和配子体阶段表达显著不同的50多个基因。此方法主要的局限性在于任何感兴趣的组分其身份必须在实验之后才能决定。

微生物基因组功能的注释

对许多病原体来说,具有功能信息的基因数目可利用者通常不多。而且,遗传工具的相对不足使得获得这样的信息很困难。然而,因为70%以上的细菌蛋白质在其他生物中有orthologs( 60,61),人们可以从模型生物得到某一病原体基因组功能的广泛认识。单独的类似研究将可预知许多基因的功能。

我们期待基因组范围表达模式的研究对功能注释有进一步的贡献。此信念遵循共有的表达与功能一致性的基本原理(38).布朗和包特 司特因( 21)建议,一种基因与某一特征明确的原语言包含在一个协同调控基因聚类中可以预知那个聚类中剩余基因的功能,从而得到病原体基因组的功能注释。此断言已在一个通用的克鲁维酵母基因表达研究中被证明。在证明参与细胞功能基因的协同调控研究中,2467个基因表达构型的聚类分析,表现出8个细胞的78个试验的交叉系列(43)。因此,可以从适当实验条件获得的病原体基因表达数据获得对于大部分基因功能的实验性假说,即使是那些缺乏与特征性功能基因序列相类似的基因也如此。

探索微生物的生理状态

当其功能需要时,基因才有选择性地表达的假设内容,可从基因生理反应直接推论基因功能。例如,酵母在diauxic二分裂转换的时候其基因有选择性地进行转录被认为有助于新陈代谢转变为呼吸(9).因此,基因表达研究将有助于通过识别每个基因表达的特殊环境和生理条件而解释其功能。此外,由于注释增加,此推论的方向可以逆转,即,如果许多基因的功能信息已知,基因组的表达资料可以揭示该生物的生理状态。

在大肠杆菌中已经使用全基因组DNA阵列的两个研究来探索基因对环境刺激的表达反应。首先,研究表明用异丙基--D- 硫乳吡喃糖( IPTG)处理只是诱导lac操纵子,并且在一种更小的程度上,只是蜜二糖操纵子 (11)。在第二个研究中,比较基础培养基与营养培养基上菌株生长的差异显示:344个基因在两种条件下表达显著不同:在营养培养基中细胞转化器的选择性表达和在基础培养基中氨基酸的生物合成途径与先前的资料完全一致(10)。最后,在热休克的时候对基因表达的测验显示,119个基因表达水平改变,除35个之外,先前已被认为是热休克基因(11)。这些研究证明细菌的生理状态可以从基因表达资料中推论出来。

在首次全球病原菌基因表达监测报告中,用寡核苷酸微阵列测量100个肺炎链球菌基因在自然生长阶段和在静止阶段的相对转录水平(29)。该结果证明顺式操纵子诱导并识别了11个在静止期与指数期调控不同的基因。当然,基因表达监测并非局限于研究病原菌。在感染时,使用一个代表226个中每一75个寡核苷酸排列来预测CMV 开放阅读框架以测量CMV基因组转录(62)。研究人员通过阻断翻译或DNA复制将CMV基因细分成四个动态亚类,其与早先的报告一致,并且为了表达以前无效的资料,匹配了许多开放阅读框架进入这些分组。

识别疑是毒性因子

因为毒性相关基因的表达是被严格调控的(4),在微环境下测量对病原体特异的并与该疾病过程有密切关系的病原体基因表达是很重要的。因为在一只被感染的动物中病原体的数目相对较小,在宿主环境研究病原体的基因表达可能在技术上具有挑战性(29)。直到开发出更灵敏的检测方法之前,模仿宿主环境来检查通用基因表达将更加实用,诸如在细胞培养模型中,升高温度、缺铁、改变pH(4,63)。事实上,在结核分支杆菌感染单核细胞的[的培养中,可使用一种微阵列监测其基因表达(64)。即使在从被感染的宿主中检测细菌基因表达成为可行之后,体外资料也将有助于将体内基因表达反应拆析成组成要素反应,从而对毒性因子调控途径有更详尽的了解。

两个假设是通过一种通用的基因表达方法来识别疑是毒性因子的。首先,因为毒性相关基因常常是协同调控的(4),新的毒性因子可能与人们已知的毒性因子受到共同的调控。通过在很多条件下收集基因表达资料,我们能够精确监视协同调控,从而揭示调控微妙变化并确认真的fide调控子。其次,因为毒性相关基因是受严格调控的(4),所以在感染的时候或在模仿感染的条件之下特定表达的基因是疑是毒性因子。此假设已经用体内表达技术(IVET)和差异荧光感应(DFI)法在很多研究中被证实,其中在感染的时候常常需要引导基因表达毒性(4,65)。当从体内微生物来的RNA标本能有效地被分离和标记时,微阵列将在识别假定毒性因子方面具有胜过IVET DFI技术的实质上的优越性,包括快速识别差异表达基因和检测转录诱导和抑制反应的实际情况。这一点是通过任何表达筛选方法识别疑是基因的要求,即必须通过突变和随后的毒性分析来证实发病机理中的某一角色。

通过识别在宿主中表达的因子,微阵列方法也可识别潜在的疫苗靶位。而且,通过预报宿主白血球内选择性表达基因是否将编码混杂的人类白血球抗原II,人们能为细胞内病原体疫苗开发识别疑是抗原决定基(66)

基因表达研究也可以揭示导致密切相关致病株之间不同毒性的关键性调控的差异。例如,李斯特菌单细胞基因血清型的毒性变化已经被证明与PrfA-调控毒性基因的转录有相互关系(67,68)。然而,因为微阵列不能测量缺少参考株的基因表达,所以,将不能用这种方法检测基因型差异,如毒性因子的水平转移。

药效学

微阵列的另一应用是研究药物对微生物细胞的生理学影响,这一点已经通过共用基因表达模式显示出来(69)。这种方法已经被用于在酵母和人类细胞中识别药物特异的基因表达信号 (18,19,70)。基因表达与药物活性的相互关系可以为药物作用提供分子的详细情况,并且未处理细胞的转录资料与药物反应间的相互关系可以揭示敏感性和抵抗力的机制(19)

这种方法近来已被用于表现暴露于已知霉菌酸生物合成途径抑制剂、异瘀肼和乙硫异烟胺的结核分支杆菌基因表达反应特性(30)。两种化合物均引起一种相似的基因表达反应,即以五个编码脂肪酸生物合成酶的相邻基因的显著转录诱导为特色。因为一种已被证实的异菸肼靶KasA在这些基因之中,作者们认为,相邻的协同调控点可能是新的抗结核药物的靶位。最后,这些结果表明一种新的化合物的作用可以从基因对该化合物的表达反应中作出推论。

用微阵列检测与已知抗药性表型相关的微生物多型性又将影响诊断和随后的药物治疗。例如,一种寡核苷酸阵列被用于检测已知对利福平有抗性的结核分之杆菌rpoB基因突变等位基因(71)

微生物基因分型

通过测量每一点DNA拷贝数,即一种叫作以阵列为基础的相当的基因组杂交技术,采用DNA而不是RNA的微阵列应用之一是确定基因组在突变异种株和隔离环境中的缺失(72)。这种技术用于在许多BCG疫苗株中识别一些大的缺失和重建它们的种系发生关系(73)

寡核苷酸阵列也已被用于相关病原体多型性精细测量基因分型。用一种来自16S染色体RNA基因的包含一组82个多型性的寡核苷酸的基因芯片来精确鉴定分枝杆菌种,从而证明这种方法用于分子诊断的潜在能力(71)。由于可以获得另外的微生物基因组ORF微阵列,对于多个株的基因组结构分子测量将变得更加精确可行。有两点需要告戒的是:缺乏与参考序列相关的特色基因组插入的能力,以及根据微阵列杂交表示序列变化的程度尚不知道。

检查宿主:DNA微阵列的应用

为宿主生物体设计微阵列

目前描述的人类DNA微阵列主要由表达序列标记(ESTs)构成。从许多不同组织选择ESTs并限制任何专一单个基因簇(http://www.ncbi.nlm.nih.gov/UniGene/Hs.stats.shtml)显现,已经导致预知的80,000- 100,000个人类基因编码区中超过50%基因显现出来(28)。许多人类DNA和寡核苷酸微阵列可以买到(例如,IncytePalo AltoCAAffymetrixNEN Life Science Products, Boston, MA)

为研究宿主体内反应,常常须要感染的动物模型。如果该动物是一种灵长类动物,因为在种属之间主要序列非常相似,人类DNA微阵列可以被用于监测宿主基因表达。因序列相似性太低而不允许将人类DNA微阵列与非灵掌类脊椎动物进行可靠的交叉杂交反应,但是由小鼠和大鼠基因序列构成的微阵列已有描述(74)并可利用(例如,Incyte, Affymetrix)

了解病因

微阵列有希望加速我们对宿主-病 原体交互作用中宿主方面的了解。可以同时检测大部分基因组,并且聚类资料可以识别暗示关键调控途径中激活或抑制基因组。微阵列也允许暂时进行序列转录诱导 和抑制,即一次邂逅之后决定事件顺序的必要条件。最后,通过基因组范围的描绘,宿主细胞生理状态的确定,尤其是凋亡和坏死,将有助于区别主要和次要效应。

在任何系统研究转录的一个重要告诫是不能检测后转录调控事件。因为许多重要的宿主细胞应答,诸如细胞骨架重排,在转录之后发生这一点就在宿主反应中显得尤其重要(75)。因此,用基因表达资料不易于表现该分子程序的某些关键特征。最后,它可用以同时监测细胞内所有蛋白质的水平、活力和交互作用(76)

虽然检测被感染组织的基因表达是可行的,但细胞的异质性可能使得分析宿主反应变得很复杂。用最可能是某病原体感染细胞的培养并检测其感染反应可能减少被检查系统的复杂性。该细胞培养系统中所获得的结果,将在解释全部组织中的特异细胞类型基因表达资料时具有重要作用。

对发病机理的通用基因表达方法的首次应用,是用于寡核苷酸阵列监测被人CMV感染的人类纤维原细胞的基因表达(37)。在细胞感染之后824小时与未感染的细胞相比,6,600个人类基因中有258个转录丰度改变了四倍以上。这些改变中的某些情况,如细胞因子的诱导、应急诱导蛋白和许多干扰素诱导基因,与细胞免疫反应的诱导一致。

以一个相似的实验设计来检查HIV- 1感染培养的CD4-阳性T细胞的共同效应。一项研究得出结论,即HIV- 1感染导致监测的1,506个人类基因中有20个有差异表达,并且这些变化大多数只是在培养3天之后发生(36)。相比之下,另一个项设计相似的独立研究的初步结果显示,实质上的HIV-诱导的变化在接种之后很早就开始了(77)。近来的研究确定了核因子-kB( NF- kB)p68激酶和RNase L被激活。

近来用DNA表达阵列检查宿主细胞对病原菌感染的反应。沙门氏菌感染的巨噬细胞和上皮细胞的转录资料证实了许多前炎症细胞因子和化学因子、信号分子和转录催化剂,并且识别了一些先前未知的受感染调控的基因(33,34)。巨噬细胞的研究证明暴露于提纯的沙门氏菌脂多糖导致一种与暴露于整个细胞非常相似的反应,并证明感染之前用 r-干扰素可改变巨噬细胞的激活反应(34)。在上皮细胞中,对于许多调控基因来说,IkB(一种NF- kB抑制剂)的过表达阻碍了基因表达的诱导,掩饰了NF- kB在前炎症反应中的重要性(33)

同样地,已用寡核苷酸阵列和依据滤膜的阵列确定了人类前骨髓细胞对单细胞基因感染的转录反应 (32)。这些资料与沙门氏菌感染的资料比较表明,前炎症反应是非常保守的:在两个事例中,包括白细胞介素-1、细胞间粘附分子-1和巨噬细胞激动蛋白1- b等许多关键组分是被诱导的。虽然在两个实验中观察到一些差异,包括沙门氏菌诱导 凋亡促进基因与单细胞基因诱导抗凋亡基因,但因这些报告中所用细胞系、方法和分析基因间的不一致性使得很难对其进行直接比较。然而我们推测病原体毒性的差 异可以在分子水平上解释宿主反应中的一些差异。

初步的报告证明,用微阵列表现宿主反应特征性的潜在能力,但也显示对宿主基因表达资料的解释将具有挑战性。例如,前列腺素E2生物合成途径中mRNAs编码组件的调控表明CMV诱导该前炎症第二信使的合成(37)。该项研究的作者对此观察作出了三种可能的解释:即可能通过一种意在借助促进杀伤被感染细胞而限制感染传播的细胞反应诱导此途径;滤过性毒菌调控子可以诱导前列腺素E2产生从而引诱单核细胞,而单核细胞随后被感染,导致滤过性毒菌在宿主内部传播;由于观察到在用细胞因子处理的细胞中有一种相似的调控模式,其次,这些基因可以通过诱导白细胞介素-1b而被诱导。微阵列可以识别有趣的细胞事件,但是由于不能区别这些机制的表达模式,显然需要进一步的研究。

上述实验严格说来是探测性的,并力求对感染后发生的转录事件分类。 然而,表达资料也导致一种由更多假设驱使作出的实验设计。例如,对同一病原体相关株与宿主间反应的比较可以解释病因差异。事实上,用两株独特的埃博拉病 毒,一株为人感染株和一株人非感染株来感染人单核细胞时基因表达的比较揭示出转录反应的不同(78)。同样地,通过检查缺乏单个毒性基因的等位基因突变病原株或毒性因子相关生物活性反应,人们可能将特异毒性属性归于反应组件,它反过来可能使人们对那些毒性因子产生机械性的认识。最后,对结构相关的毒性因子家族比较其转录反应,例如,细菌的气孔-形成的毒素,可以解释表达相似毒性因子的病原体如何引起不同的病理反应。

诊断基因表达的概况

大多数依据微阵列的人类基因表达研究一直寻找在各种病理状态下表达不同的基因。例如,聚类基因表达资料可以将肿瘤分成不同的分子亚类(12- 17)。在播散性大B- 细胞淋巴瘤中,两种不同分子类型展现出本质上不同的生存率,表明将来的临床干预,至少对于癌症,可以诊断性基因表达资料为指导(14)。微阵列也用于测量培养细胞对不同外部刺激的反应,包括药物和环境毒素(79)

如何将此范例应用于传染性疾病的诊断呢?在与Pat布朗(斯坦福)Lou Staudt(国立癌症学会)合作中,我们假设一种特异病原体表达的毒性因子的独特集合将在宿主中引起一种独特的转录反应(80)。推而广之,此事件的不断产生导致炎症和获得性免疫,包括调控子的分泌和后来的细胞-细胞交互作用,可以在参与该反应的白血球中留下一种独特的转录信号痕迹。尽管保存了全部毒性性能,但病原微生物在分子水平上对任意给定的性能,可展现出特殊和独有的特性(81)。因此,通过测量外周血单核白细胞中基因聚集表达的模式,例如,我们可以通过特异病原体或病原体分类找到传染病诊断标识。

用宿主基因表达标识作为传染病诊断标记的潜在优点是深远的。首先, 此技术可允许早期检测所接触的病原体,甚至那些不能培养或非特异性的病原体。其次,宿主中信号的变化可用于推断暴露的时间。第三,因为宿主反应可以在没有 病原体的情况下持续存在,这种方法可用于仅短期定植于宿主的病原体感染的检测,以及隐藏在不便于取材的解剖位置或根本不定植于宿主的病原体的检测(例如,在某些案例中的肉毒梭菌和产气荚膜杆菌)。最后,单个容易收集的标本,可用宽阵列试剂诊断暴露情况。

在这种建议的方法成为一种可接受的诊断工具之前,人们必须确定是否 暴露于一种导致外周血单核白细胞中的有活力的、稳定的和特异基因表达的病原体,以及是否在不同遗传背景的病人中这种信号是否普遍存在。在我们的实验室正对 此方法的可行性进行实验评定。至今,对许多不同病原体的共同基因表达资料的确认,尤其是炎症发生中对早期事件的更详细了解在免疫反应中是重要的,但是这些 实验(对每个病原体介定独特的信号)的目标尚未实现。

结论:两方面的讨论

而今回顾少数已发表的研究资料表明,在基因组范围内病原体资料已开始泛滥是肯定的。单是在斯坦福大学,对百日咳杆菌、沙门氏菌、幽门螺杆菌、空肠弯曲菌、霍乱弧菌、结核分支杆菌、大肠杆菌、非病源性微生物、链霉菌和crescentus的依据微阵列的研究正在进行中(S. 伐尔柯, G. 司古尔尼克, S. 可汗,L. 沙匹若, 佩尔斯. 库姆.)

在传染性疾病中功能性基因组和微阵列技术的长期目标包括在分子水平 上描述宿主病原体交互作用并识别用于诊断和干预的关键靶分子和途径。实现这些目标必须还要有其它的技术、广泛收集数据、功能完备的计算工具和洞悉因果的努 力。我们能够通过非常好的设备来聆听病原体和宿主这两方面之间的会话。

致谢

我们忠心感谢P.布朗、S. 伐尔柯、L. 沙匹若、S. 可汗、G.司古尔尼克以及布朗、伐尔柯和日尔曼实验室的成员对此文的有益讨论。J. 波尔得里克 和A. 阿里乍得友好地为此文提供插图。

此工作得到高级防务研究项目机构(#_N65236- 99- 15428) 和退伍军人REAP项目的资助。

库蒙明斯博士在加利福尼亚州斯坦福区斯坦福大学微生物学和免疫学系作博士后。他的兴趣包括Bordetella分子的病因和基因表达生物信息。

瑞尔曼博士是斯坦福大学微生物学、免疫学和医学副教授。他的兴趣是开发和使用分子方法发现病原体、人类微生态学、基因组范围宿主、微生物对感染的反应和Bordetella病因。

参考文献

  1. Blattner FR, Plunkett G, 3rd, Bloch CA, Perna NT, Burland V, Riley M, et al. The complete genome sequence of Escherichia coli K-12. Science 1997;277:1453-74.
  2. Carulli JP, Artinger M, Swain PM, Root CD, Chee L, Tulig C, et al. High throughput analysis of differential gene expression. J Cell Biochem Suppl 1998;30-31:286-96.
  3. Svanborg C, Godaly G, Hedlund M. Cytokine responses during mucosal infections: role in disease pathogenesis and host defence. Current Opinion in Microbiology 1999;2:99-105.
  4. Cotter PA, Miller JF. In vivo and ex vivo regulation of bacterial virulence gene expression. Current Opinion in Microbiology 1998;1:17-26.
  5. Schena M, Shalon D, Davis RW, Brown PO. Quantitative monitoring of gene expression patterns with a complementary DNA microarray. Science 1995;270:467-70.
  6. Spellman PT, Sherlock G, Zhang MQ, Iyer VR, Anders K, Eisen MB, et al. Comprehensive identification of cell cycle-regulated genes of the yeast Saccharomyces cerevisiae by microarray hybridization. Mol Biol Cell 1998;9:3273-97.
  7. Cho RJ, Campbell MJ, Winzeler EA, Steinmetz L, Conway A, Wodicka L, et al. A genome-wide transcriptional analysis of the mitotic cell cycle. Mol Cell 1998;2:65-73.
  8. Chu S, DeRisi J, Eisen M, Mulholland J, Botstein D, Brown PO, et al. The transcriptional program of sporulation in budding yeast. Science 1998;282:699-705.
  9. DeRisi JL, Iyer VR, Brown PO. Exploring the metabolic and genetic control of gene expression on a genomic scale. Science 1997;278:680-6.
  10. Tao H, Bausch C, Richmond C, Blattner FR, Conway T. Functional genomics: expression analysis of Escherichia coli growing on minimal and rich media. J Bacteriol 1999;181:6425-40.
  11. Richmond CS, Glasner JD, Mau R, Jin H, Blattner FR. Genome-wide expression profiling in Escherichia coli K-12. Nucleic Acids Res 1999;27:3821-35.
  12. Khan J, Simon R, Bittner M, Chen Y, Leighton SB, Pohida T, et al. Gene expression profiling of alveolar rhabdomyosarcoma with cDNA microarrays. Cancer Res 1998; 58:5009-13.
  13. Perou CM, Jeffrey SS, van de Rijn M, Rees CA, Eisen MB, Ross DT, et al. Distinctive gene expression patterns in human mammary epithelial cells and breast cancers. Proc Natl Acad Sci U S A 1999;96:9212-7.
  14. Alizadeh AA, Eisen MB, Davis RE, Ma C, Lossos IS, Rosenwald A, et al. Distinct types of diffuse large B-cell lymphoma identified by gene expression profiling. Nature 2000; 403:503-11.
  15. Golub TR, Slonim DK, Tamayo P, Huard C, Gaasenbeek M, Mesirov JP, et al. Molecular classification of cancer: class discovery and class prediction by gene expression monitoring. Science 1999;286:531-7.
  16. Alon U, Barkai N, Notterman DA, Gish K, Ybarra S, Mack D, et al. Broad patterns of gene expression revealed by clustering analysis of tumor and normal colon tissues probed by oligonucleotide arrays. Proc Natl Acad Sci U S A 1999;96:6745-50.
  17. Wang K, Gan L, Jeffery E, Gayle M, Gown AM, Skelly M, et al. Monitoring gene expression profile changes in ovarian carcinomas using cDNA microarray. Gene 1999; 229:101-8.
  18. Marton MJ, DeRisi JL, Bennett HA, Iyer VR, Meyer MR, Roberts CJ, et al. Drug target validation and identification of secondary drug target effects using DNA microarrays. Nat Med 1998;4:1293-301.
  19. Scherf U, Ross DT, Waltham M, Smith LH, Lee JK, Tanabe L, et al. A gene expression database for the molecular pharmacology of cancer. Nat Genet 2000;24:236-244.
  20. Southern E, Mir K, Shchepinov M. Molecular interactions on microarrays. Nat Genet 1999;21:5-9.
  21. Brown PO, Botstein D. Exploring the new world of the genome with DNA microarrays. Nat Genet 1999;21:33-7.
  22. Ramsay G. DNA chips: state-of-the art. Nat Biotechnol 1998;16:40-4.
  23. Watson A, Mazumder A, Stewart M, Balasubramanian S. Technology for microarray analysis of gene expression. Curr Opin Biotechnol 1998;9:609-14.
  24. Fodor SP, Rava RP, Huang XC, Pease AC, Holmes CP, Adams CL. Multiplexed biochemical assays with biological chips. Nature 1993;364:555-6.
  25. Lockhart DJ, Dong H, Byrne MC, Follettie MT, Gallo MV, Chee MS, et al. Expression monitoring by hybridization to high-density oligonucleotide arrays. Nat Biotechnol 1996; 14:1675-80.
  26. Cheung VG, Morley M, Aguilar F, Massimi A, Kucherlapati R, Childs G. Making and reading microarrays. Nat Genet 1999;21:15-9.
  27. Duggan DJ, Bittner M, Chen Y, Meltzer P, Trent JM. Expression profiling using cDNA microarrays. Nat Genet 1999;21:10-4.
  28. Lipshutz RJ, Fodor SP, Gingeras TR, Lockhart DJ. High density synthetic oligonucleotide arrays. Nat Genet 1999;21:20-4.
  29. de Saizieu A, Certa U, Warrington J, Gray C, Keck W, Mous J. Bacterial transcript imaging by hybridization of total RNA to oligonucleotide arrays. Nat Biotechnol 1998; 16:45-8.
  30. Wilson M, DeRisi J, Kristensen HH, Imboden P, Rane S, Brown PO, et al. Exploring drug-induced alterations in gene expression in Mycobacterium tuberculosis by microarray hybridization. Proc Natl Acad Sci U S A 1999;96:12833-8.
  31. Talaat AM, Hunter P, Johnston SA. Genome-directed primers for selective labeling of bacterial transcripts for DNA microarray analysis. Nat Biotechnol 2000;18:679-682.
  32. Cohen P, Bouaboula M, Bellis M, Baron V, Jbilo O, Poinot-Chazel C, et al. Monitoring cellular responses to Listeria monocytogenes with oligonucleotide arrays. J Biol Chem 2000; 275:11181-90.
  33. Eckmann L, Smith JR, Housley MP, Dwinell MB, Kagnoff MF. Analysis by high density cDNA arrays of altered gene expression in human intestinal epithelial cells in response to infection with the invasive enteric bacteria salmonella . J Biol Chem 2000;275:14084-94.
  34. Rosenberger CM, Scott MG, Gold MR, Hancock RE, Finlay BB. Salmonella Typhimurium infection and lipopolysaccharide stimulation induce similar changes in macrophage gene expression. J Immunol 2000;164:5894-904.
  35. Iyer VR, Eisen MB, Ross DT, Schuler G, Moore T, Lee JCF, et al. The transcriptional program in the response of human fibroblasts to serum. Science 1999;283:83-7.
  36. Geiss GK, Bumgarner RE, An MC, Agy MB, van 't Wout AB, Hammersmark E, et al. Large-scale monitoring of host cell gene expression during HIV-1 infection using cDNA microarrays. Virology 2000;266:8-16.
  37. Zhu H, Cong JP, Mamtora G, Gingeras T, Shenk T. Cellular gene expression altered by human cytomegalovirus: global monitoring with oligonucleotide arrays. Proc Natl Acad Sci U S A 1998;95:14470-5.
  38. Bassett DE, Jr., Eisen MB, Boguski MS. Gene expression informatics--it's all in your mine. Nat Genet 1999;21:51-5.
  39. Khan J, Bittner ML, Chen Y, Meltzer PS, Trent JM. DNA microarray technology: the anticipated impact on the study of human disease. Biochim Biophys Acta 1999; 1423:M17-28.
  40. Brazma A, Robinson A, Cameron G, Ashburner M. One-stop shop for microarray data. Nature 2000;403:699-700.
  41. Array data go public. Nat Genet 1999;22:211-12.
  42. Tamayo P, Slonim D, Mesirov J, Zhu Q, Kitareewan S, Dmitrovsky E, et al. Interpreting patterns of gene expression with self-organizing maps: methods and application to hematopoietic differentiation. Proc Natl Acad Sci U S A 1999;96:2907-12.
  43. Eisen MB, Spellman PT, Brown PO, Botstein D. Cluster analysis and display of genome-wide expression patterns. Proc Natl Acad Sci U S A 1998;95:14863-8.
  44. Ben-Dor A, Shamir R, Yakhini Z. Clustering gene expression patterns. J Comput Biol 1999;6:281-97.
  45. Ross DT, Scherf U, Eisen MB, Perou CM, Rees C, Spellman P, et al. Systematic variation in gene expression patterns in human cancer cell lines. Nat Genet 2000;24:227-35.
  46. Brown MP, Grundy WN, Lin D, Cristianini N, Sugnet CW, Furey TS, et al. Knowledge-based analysis of microarray gene expression data by using support vector machines. Proc Natl Acad Sci U S A 2000;97:262-7.
  47. Gaasterland T, Bekiranov S. Making the most of microarray data. Nat Genet 2000; 24:204-6.
  48. Berry MJA, Linoff G. Data mining techniques for marketing, sales and customer support. New York: John Wiley and Sons;1997.
  49. Weaver DC, Workman CT, Stormo GD. Modeling regulatory networks with weight matrices. In: Altman RB, Lauderdale K, Dunker AK, Hunter L, Klein TE, editors. Biocomputing '99: Proceedings of the Pacific Symposium. River Edge (NJ): World Scientific Press;1999:112-23.
  50. Chen T, He HL, Church GM. Modeling gene expression with differential equations. In: Altman RB, Lauderdale K, Dunker AK, Hunter L, Klein TE, editors. Biocomputing '99: Proceedings of the Pacific Symposium. River Edge (NJ): World Scientific Press; 1999:29-40.
  51. Davidson GS, Hendrickson B, Johnson DK, Meyers CE, Wylie BN. Knowledge mining with VxInsight: discovery through interaction. Journal of Intelligent Information Systems, Integrating Artificial Intelligence and Database Technologies 1998;11:259-85.
  52. Delcher AL, Harmon D, Kasif S, White O, Salzberg SL. Improved microbial gene identification with GLIMMER. Nucleic Acids Res 1999;27:4636-41.
  53. Ramakrishna R, Srinivasan R. Gene identification in bacterial and organellar genomes using GeneScan. Comput Chem 1999;23:165-74.
  54. Hayes WS, Borodovsky M. How to interpret an anonymous bacterial genome: machine learning approach to gene identification. Genome Res 1998;8:1154-71.
  55. Audic S, Claverie JM. Self-identification of protein-coding regions in microbial genomes. Proc Natl Acad Sci U S A 1998; 95:10026-31.
  56. Lukashin AV, Borodovsky M. GeneMark.hmm: new solutions for gene finding. Nucleic Acids Res 1998;26:1107-15.
  57. Borodovsky M, McIninch J. Recognition of genes in DNA sequence with ambiguities. Biosystems 1993;30:161-71.
  58. Rozen S, Skaletsky HJ. Primer3; 1996, 1997, 1998. Cambridge (MA): Whitehead Institute. Code available at http://www-genome.wi.mit.edu/genome_software/other/primer3.html.
  59. Hayward RE, Derisi JL, Alfadhli S, Kaslow DC, Brown PO, Rathod PK. Shotgun DNA microarrays and stage-specific gene expression in Plasmodium falciparum malaria. Mol Microbiol 2000;35:6-14.
  60. Koonin EV, Mushegian AR, Galperin MY, Walker DR. Comparison of archaeal and bacterial genomes: computer analysis of protein sequences predicts novel functions and suggests a chimeric origin for the archaea. Mol Microbiol 1997;25:619-37.
  61. Tatusov RL, Galperin MY, Natale DA, Koonin EV. The COG database: a tool for genome-scale analysis of protein functions and evolution. Nucleic Acids Res 2000; 28:33-6.
  62. Chambers J, Angulo A, Amaratunga D, Guo H, Jiang Y, Wan JS, et al. DNA microarrays of the complex human cytomegalovirus genome: profiling kinetic class with drug sensitivity of viral gene expression. J Virol 1999;73:5757-66.
  63. Mekalanos JJ. Environmental signals controlling expression of virulence determinants in bacteria. J Bacteriol 1992;174:1-7.
  64. Mangan JA, Monahan IM, Wilson MA, Schnappinger D, Schoolnik GK, Butcher PD. The expression profile of Mycobacterium tuberculosis infecting the human monocytic cell line THP-1 using whole genome microarray analysis. Nat Genet 1999;23:61.
  65. Chiang SL, Mekalanos JJ, Holden DW. In vivo genetic analysis of bacterial virulence. Annu Rev Microbiol 1999;53:129-54.
  66. Sturniolo T, Bono E, Ding J, Raddrizzani L, Tuereci O, Sahin U, et al. Generation of tissue-specific and promiscuous HLA ligand databases using DNA microarrays and virtual HLA class II matrices. Nat Biotechnol 1999;17:555-61.
  67. Sokolovic Z, Schuller S, Bohne J, Baur A, Rdest U, Dickneite C, et al. Differences in virulence and in expression of PrfA and PrfA-regulated virulence genes of Listeria monocytogenes strains belonging to serogroup 4. Infect Immun 1996; 64:4008-19.
  68. Bohne J, Kestler H, Uebele C, Sokolovic Z, Goebel W. Differential regulation of the virulence genes of Listeria monocytogenes by the transcriptional activator PrfA. Mol Microbiol 1996;20:1189-98.
  69. Debouck C, Goodfellow PN. DNA microarrays in drug discovery and development. Nat Genet 1999;21:48-50.
  70. Gray NS, Wodicka L, Thunnissen AM, Norman TC, Kwon S, Espinoza FH, et al. Exploiting chemical libraries, structure, and genomics in the search for kinase inhibitors. Science 1998;281:533-8.
  71. Troesch A, Nguyen H, Miyada CG, Desvarenne S, Gingeras TR, Kaplan PM, et al. Mycobacterium species identification and rifampin resistance testing with high-density DNA probe arrays. J Clin Microbiol 1999;37:49-55.
  72. Pollack JR, Perou CM, Alizadeh AA, Eisen MB, Pergamenschikov A, Williams CF, et al. Genome-wide analysis of DNA copy-number changes using cDNA microarrays. Nat Genet 1999;23:41-6.
  73. Behr MA, Wilson MA, Gill WP, Salamon H, Schoolnik GK, Rane S, et al. Comparative genomics of BCG vaccines by whole-genome DNA microarray. Science 1999;284:1520-3.
  74. Khan J, Bittner ML, Saal LH, Teichmann U, Azorsa DO, Gooden GC, et al. cDNA microarrays detect activation of a myogenic transcription program by the PAX3-FKHR fusion oncogene. Proc Natl Acad Sci U S A 1999;96:13264-9.
  75. Finlay BB, Falkow S. Common themes in microbial pathogenicity revisited. Microbiol Mol Biol Rev 1997;61:136-69.
  76. Uetz P, Giot L, Cagney G, Mansfield TA, Judson RS, Knight JR, et al. A comprehensive analysis of protein-protein interactions in Saccharomyces cerevisiae. Nature 2000; 403:623-7.
  77. Corbeil J, Sheeter D, Rought S, Du P, Ferguson M, Masys DR, et al. Magnitude and specificity of temporal gene expression during HIV-1 infection of a CD4+ T cell. Nat Genet 1999;23:39-40.
  78. Xiang C, Young H, Alterson H, Reynolds D, Bittner M, Chen Y, et al. Comparison of cellular gene expression in Ebola-Zaire and Ebola-Reston virus-infected primary human monocytes. Nat Genet 1999;23:82.
  79. Nuwaysir EF, Bittner M, Trent J, Barrett JC, Afshari CA. Microarrays and toxicology: the advent of toxicogenomics. Mol Carcinog 1999;24:153-9.
  80. Roebuck KA, Carpenter LR, Lakshminarayanan V, Page SM, Moy JN, Thomas LL. Stimulus-specific regulation of chemokine expression involves differential activation of the redox-responsive transcription factors AP-1 and NF-kappaB. J Leukoc Biol 1999; 65:291-8.
  81. Lo D, Feng L, Li L, Carson MJ, Crowley M, Pauza M, et al. Integrating innate and adaptive immunity in the whole animal. Immunol Rev 1999;169:225-39.

Comments to the EID Editors

Please contact the EID Editors via our Contact Form.

TOP