Promotor-Analyse
(Untersuchung der Bindestellen von Ahr1 anhand von ChIP-Seq Daten aus Candida albicans)

(Stand: April 2021)

Hintergrund


Candida albicans ist ein hu­man-pa­tho­ge­ner Pilz, der bei Menschen mit schwachem Immunsystem schwere In­fek­tio­nen hervorrufen kann. Er kann in verschiedenen For­men wachsen: als Hefe, Pseudohyphen und Hyphen [1]. Diese morphologische Fle­xi­bi­li­tät und insbesondere die Hy­phen­form sind für die Virulenz des Pilzes entscheidend [2, 3]. In den vergangenen Jahren wur­den mehrere Vi­ru­lenz­fak­to­ren von C. al­bi­cans identifiziert. Sie stehen oft in engem Zu­sam­men­hang mit dem Hy­phen­wachs­tum des Pilzes. Dazu zählt auch der Transkriptionsfaktor Ahr1, von dem vermutet wird, dass er mehrere Vi­ru­lenz-re­le­van­te Ge­ne über eine Bindung in deren Pro­mo­tor­re­gion reguliert.

"Chromatin Immunopräzipitation Sequenzierung" (ChIP-Seq)


Zwei C. albicans Stämme mit einem hyperaktiven Ahr1 wurden mittels ChIP-Seq analysiert [4]. Mit diesem Verfahren können Protein-DNA-Interaktionen bestimmt werden. Das Protein wird mit der DNA gemischt, die DNA fragmentiert und alle nicht gebundenen DNA-Stücke entfernt. An­schlie­ßend löst man das Protein wieder von der DNA und analysiert diese mittels Hochdurchsatz-Sequenzierung. Resultat dieser Analyse waren 325 Se­quenz­ab­schnit­te, die potentielle Bin­de­stel­len von Ahr1 im C. al­bi­cans Genom repräsentieren. Durch Nutzung deren chromosomaler Position wurden 532 Gene auf beiden DNA-Strängen identifiziert, in deren Pro­mo­tor­be­reich die Sequenzen lagen, die also potentiell durch Ahr1 reguliert werden.

Promotor-Analyse


Eine Region von 500 Basenpaaren um das Ma­xi­mum jedes Peaks eines Se­quenz­ab­schnitts (also den Punkt in der Sequenz, der in der Sequenzierung am häufigsten vertreten war und somit als die wahrscheinlichste Bindestelle angesehen werden kann) wurde als Eingabe für das Online-Tool Meme-ChIP (v. 5.1.0) [5] genutzt. So konnte ein hoch signifikantes Motiv gefunden werden, was mit einem bereits bekannten Bindemotiv von Ahr1 übereinstimmt. Zur weiteren Bestätigung dieses Motivs wurde die Software MochiView (v. 1.46) [6] genutzt. Der integrierte Motiv-Finder detektierte bei einer Suche nach möglichen Bindemotiven in den Peak-Regionen ebenfalls das bereits bekannte Ahr1-Motiv, welches in Abbildung 1 zu sehen ist.

bindingmotive
Abb. 1: Bindemotiv von Ahr1.

In MochiView können Peaks, Gene und Motive auch visualisiert werden. Es ist hierbei deutlich ersichtlich (Abbildung 2a und 2b), dass Ahr1 im Promotorbereich von wichtigen Virulenz-assoziierten Genen in C. albicans wie ECE1 und ALS3 bindet. Häufig ist mehr als eine potentielle Bin­de­stel­le pro Promotorregion vorhanden.

ECE1-Promotorbereiche ALS3-Promotorbereiche
Abb. 2: Visualisierung der Ahr1-Bindestellen in den Promotorbereichen von a) ECE1 und b) ALS3. Der gesamte durch ChIP-Seq gefundene Sequenzbereich ist ersichtlich, sowie die zur Ermittlung des Bindemotivs verwendete 500 Basenpaare lange Peak-Region. Grüne Pfeile zeigen Positionen des gefundenen Sequenzmotivs.

Insgesamt konnte das Bindemotiv in den Promotoren von 37 Vi­ru­lenz-re­le­van­ten Ge­nen nachgewiesen werden. Die unten stehende Tabelle zeigt für jedes dieser Gene jeweils das Motiv mit dem höchsten, von MochiView ermittelten Score. Falls es zwei Bindestellen mit gleichem Score gibt, sind beide aufgeführt.

Tab. 1: Ahr1 Bindemotiv in den Promotoren von 37 Virulenz-assoziierten Genen, dessen Entfernung zum Transkriptionsstart, die Lage auf dem Gen-Strang sowie der von MochiView ermittelte Score.
Gen-Name Motiv-Entfernung zum Gen in bp Motiv-Strang Motiv-Score Motiv-Sequenz
AHR15586-5.4GGCAACAATTACCGG
ALS11390-4.6GGAAACTTCAAACGA
ALS3340+4.5TGCAAGTTAAACCGA
ALS41649-3.4CACAAGTGTAAGCGA
BCR12178-2.8AGAAAGGAAAAGCGA
BRG15765+5.1TGCAAGAATTACCGA
CDR11337+4.7ATCAACTATTGCCGA
CZF14304-2.4TGCAGTGGTAACCGA
DCK1506+4.5GGAAAGTATAGTCGA
DEF11719-4.0GTCAACTTCTGACGA
DEF1495-4.0GGAAATTAGAAACGA
EAP11204+4.5GGGAAGTTCAAGCGA
ECE12721+4.8GGGAAGAATTACCGA
EFG12311+5.0TGCAACTACAACCGA
FLO82066-3.5GGCAAGAAGTAGAGA
HGC111647-4.3GGAAAGTGGTAGCGA
HGT23442+4.9TGCAACTATTCGCGA
HWP11225-3.9GGCAAGTTTATCCGC
HYR11938+4.8AGCAATATTAGGCGA
IHD1861+5.1TGCAACAATTACCGA
LMO1179+4.4AGAAATTTTTAGCGA
MDR1537-5.4GGTAACTATTGGCGA
NDT801567-5.1GGCAAGTTTAATCGA
RBT198-4.4GGTAAGATTTACCGG
RIM101664-5.1AGCAAGTAGAGCCGA
SAP4807-3.8AGCAATTTTAAGAGA
SAP51144+4.3GGCAATTTTAAGAGA
SAP6833-3.5GGTAATTTTAAGAGA
SFL16551-5.1GGAAACTATTACCGG
SFL22733+4.0AACAAGTAGAGCCGA
SOD5888+4.9GGCATCTTTTCCCGA
SOD51512+4.9GGAAAGTTGAAGCGA
STP2915+2.9TGCAAGACTTGCAGA
TEC15005-4.8GGCAAGTATAAGCTA
UME615928+4.2AACAACTTTAAACGA
WOR15648-5.0AGCAAGTATAGCCGT
WOR21834+5.0GGCATCAATTACCGA

Das weist darauf hin, dass Ahr1 an der Regulation einer Vielzahl von Virulenz-assoziierten Prozessen wie Hyphenbildung, Zellinvasion, Eisenaufnahme und Wirts­zell­be­schä­di­gung beteiligt ist und durch die Bindestelle im eigenen Promotor möglicherweise sogar einen Feed­back-Me­cha­nis­mus aufweist.

Homologiesuche und Syntänie


Homologe von AHR1 (also Gene, die denselben Vorläufer haben), aber auch von ECE1 und ALS3 können in den Genomen von C. dubliniensis und C. tropicalis gefunden werden. Beide Arten sind eng mit C. albicans verwandt und ebenfalls pathogen. Die AHR1-Homologen beispielsweise haben in T-Coffee (v. 11.0) [7] einen sehr guten Alignment-Score von 992 (C. albicans AHR1 vs. C. dubliniensis Cd36_85930) bzw. 914 (C. albicans AHR1 vs. C. tropicalis CTRG_02263). ECE1 und seine Homologen kommen auf Scores von 994 (C. albicans ECE1 vs. C. dubliniensis Cd36_43260) bzw. 852 (C. albicans ECE1 vs. C. tropicalis CTRG_00476).

Auch die räumliche Lage der Gene im Genom (Syntänie) passt gut zueinander, wie man im Candida Gene Order Browser [8] sehen kann (in der Abbildung unten beispielhaft für AHR1), während sie zu S. cerevisiae, als nicht pathogenem Modellorganismus für Pilze, deutlich verschieden ist.

CGOBrowser.jpg
Abb. 3: Syntänie von AHR1 in C. albicans, C. dubliniensis, C. tropicalis und S. cerevisiae.

Möglicherweise gibt es also in diesen Spezies ähnliche Regulationsmechanismen wie in C. albicans.

Referenzen


  1. [1] P. E. Sudbery: Growth of Candida albicans hyphae. In: Nat. Rev. Microbiol., 9:737–748, 2011. doi: 10.1038/nrmicro2636
  2. [2] K. Zakikhany, J. R. Naglik, A. Schmidt-Westhausen, G. Holland, M. Schaller, B. Hube: In vivo transcript profiling of Candida albicans identifies a gene essential for interepithelial dissemination. In: Cell Microbiol., 9:2938–2954, 2007. doi: 10.1111/j.1462-5822.2007.01009.x
  3. [3] A. L. Mavor, S. Thewes, B. Hube: Systemic fungal infections caused by Candida species: epidemiology, infection process and virulence attributes. In: Curr. Drug Targets, 6:863–874, 2005. doi: 10.2174/138945005774912735
  4. [4] S. Ruben, E. Garbe, S. Mogavero, D. Albrecht-Eckardt, D. Hellwig, A. Häder, T. Krüger, K. Gerth, I. D. Jacobsen, O. Elshafee, S. Brunke, K. Hünniger, O. Kniemeyer, A. A. Brakhage, J. Morschhäuser, B. Hube, S. Vylkova, O. Kurzai, R. Martin: Ahr1 and Tup1 contribute to the transcriptional control of virulence-associated genes in Candida albicans. In: mBio, 11:2, 2020.
    doi: 10.1128/mBio.00206-20
  5. [5] P. Machanick, T. L. Bailey: MEME-ChIP: motif analysis of large DNAdatasets. In: Bioinformatics, 27:1696–1697, 2011. doi: 10.1093/bioinformatics/btr189
  6. [6] O. R. Homann, A. D. Johnson: MochiView: versatile software for genome browsing and DNA motif analysis. In: BMC Biol., 8:49, 2010. doi: 10.1186/1741-7007-8-49
  7. [7] C. Notredame, D. G. Higgins, J. Heringa: T-Coffee: A novel method for fast and accurate multiple sequence alignment. In: J. Mol. Biol., 302(1):205–217, 2000. doi: 10.1006/jmbi.2000.4042
  8. [8] S. L. Maguire, S. S. ÓhÉigeartaigh, K. P. Byrne, M. S. Schröder, P. O'Gaora, K. H. Wolfe, G. Butler: Comparative genome analysis and gene finding in Candida species using CGOB. In: Mol. Biol. Evol., 30(6):1281–1291, 2013. doi: 10.1093/molbev/mst042