Ein Multi

Blog

HeimHeim / Blog / Ein Multi

Jun 23, 2023

Ein Multi

Nature Plants (2023) Diesen Artikel zitieren 6589 Zugriffe auf 96 Altmetric Metrics-Details Nicotiana benthamiana ist eine unschätzbar wertvolle Modellpflanzen- und Biotechnologieplattform mit einem allotetraploiden Genom von ~3 Gb. Zu

Naturpflanzen (2023)Diesen Artikel zitieren

6589 Zugriffe

96 Altmetrisch

Details zu den Metriken

Nicotiana benthamiana ist eine unschätzbar wertvolle Modellpflanzen- und Biotechnologieplattform mit einem allotetraploiden Genom von ca. 3 GB. Um seine Nützlichkeit und Vielseitigkeit weiter zu verbessern, haben wir hochwertige Genomassemblierungen auf Chromosomenebene, gekoppelt mit Transkriptom-, Epigenom-, microRNA- und transponierbaren Elementdatensätzen, für den allgegenwärtig verwendeten LAB-Stamm und eine verwandte wilde Akzession, QLD, erstellt. Darüber hinaus wurden Einzelnukleotid-Polymorphismuskarten für zwei weitere Laborstämme und vier Wildakzessionen erstellt. Trotz des Verlusts von fünf Chromosomen aus dem angestammten Tetraploid, der Ausdehnung intergener Regionen, weit verbreiteter segmentaler Allopolyploidie, fortgeschrittener Diploidisierung und Hinweisen auf kürzliche Ausbrüche der Mobilität des Copia-Pseudovirus (Copia), die in anderen Nicotiana-Genomen nicht beobachtet wurden, weisen die beiden Subgenome von N. benthamiana große Ausmaße auf Syntenieregionen in den Nachtschattengewächsen. LAB und QLD weisen viele genetische, metabolische und phänotypische Unterschiede auf, einschließlich unterschiedlicher RNA-Interferenzreaktionen, sind jedoch hochgradig interfruchtbar und für die Genombearbeitung sowie sowohl vorübergehende als auch stabile Transformation geeignet. Die LAB/QLD-Kombination hat das Potenzial, genauso nützlich zu sein wie die Partnerschaft zwischen Columbia-0 und Landsberg errecta, die von den frühen Pioniertagen der Arabidopsis-Genomik bis heute genutzt wird.

Die Gattung Nicotiana, die etwa 75 Arten umfasst, kommt vorwiegend in Amerika und Australien vor1. Wie die meisten Nachtschattengewächse hat es eine Grundchromosomenzahl von 12 und einen haploiden DNA-Gehalt im Bereich von 1,37 bis 6,27 Gb (Lit. 2). Die Sektion Suaveolentes (gut riechend) umfasst N. benthamiana und ist die größte allotetraploide Gruppe der Gattung (~35 Arten) mit Chromosomenzahlen zwischen 15 und 24, was auf ein Allotetraplodisierungsereignis mit anschließendem Chromosomenverlust hindeutet3,4,5 (Abb. 1a ). Fast alle Arten in diesem Abschnitt sind in Australasien beheimatet, wo sie offenbar während des Übergangs zum Pliozän vor etwa 5–6 Millionen Jahren (Ma) besiedelt wurden. Die diploiden Vorfahren von N. benthamiana gehörten höchstwahrscheinlich zu den Sektionen Sylvestres und Noctiflorae, deren nächste sequenzierte Verwandte N. sylvestris (~2,6 Gb) und N. glauca (~3,2 Gb) sind6,7,8,9,10, 11 bzw.

a, Vorgeschlagene Phylogenie und Herkunft der Suaveolentes-Sektion im Vergleich zu anderen Nicotianas. Für jede Suaveolentes-Art sind die Chromosomenzahlen angegeben. Mit einem Sternchen markierte Arten sind noch vorhandene Verwandte der mutmaßlichen Eltern von N. benthamiana und N. tabacum. b, Verbreitung von N. benthamiana in Australien (karierte Regionen). Die physischen Standorte isolierter N.-benthamiana-Akzessionen, über die in dieser Studie berichtet wurde, sind durch Stecknadeln dargestellt, und traditionelle indigene Handelsrouten sind durch rote Linien dargestellt. c, Profile der durchschnittlichen Emission ausgewählter flüchtiger Blütenverbindungen aus LAB und QLD über einen Zeitraum von 24 Stunden. Dunkelblau, Benzylalkohol. Für andere Verbindungen siehe Erweiterte Daten Abb. 1. Die Daten werden als Mittelwert ± Standardabweichung (n = 4 pro Probenpunkt) dargestellt. d, Anthocyanproduktion 5 Tage nach der vorübergehenden Expression von AN-ähnlichem MYB in LAB und QLD; Die rechten Felder zeigen Protoplasten, die aus LAB- und QLD-infiltrierten Flecken isoliert wurden (n = 5). Maßstabsbalken, 50 μm. e, Vergleich der Anreicherung von Nikotin und Nornikotin in Blüten und Blättern von LAB und QLD. Die biochemische Umwandlung von Nikotin in Nornikotin, vermittelt durch die CYP82E-Demethylase (Extended Data Abb. 9), ist rechts dargestellt. Die Daten werden als Mittelwert ± Standardabweichung (n = 4) dargestellt. f, Vergleich der Anreicherung von HGL-DTGs in Blüten und Blättern von LAB und QLD. Der schematische biochemische Weg ist rechts dargestellt. Die Daten werden als Mittelwert ± Standardabweichung (n = 4) dargestellt.

N. benthamiana ist eine sehr wichtige Pflanzenplattform für die biopharmazeutische Protein- und Impfstoffproduktion7,12 und war maßgeblich an grundlegenden Entdeckungen in den Bereichen RNA-Interferenz (RNAi), Wechselwirkungen zwischen Pflanzen und Pathogenen, Stoffwechselwegtechnik, funktioneller Genomik, synthetischer Biologie und Genbearbeitung beteiligt13. Alle diese Arbeiten stützten sich auf Pflanzen, die aus einer Akzession stammen, die wir LAB nennen und die offenbar aus einer einzigen Sammlung in der Nähe der Granites-Goldmine in Zentralaustralien stammt7,14,15 (Abb. 1b). Kürzlich wurden mehrere weitere Akzessionen beschrieben7,14,15,16.

In diesem Artikel berichten wir über Gesamtgenom-, Epigenom- und Metabolominformationen für den LAB-Stamm und die Wild-QLD-Akzession, gekoppelt mit Single Nucleotide Polymorphism (SNP)-Karten für weitere Labor- und Wild-Akzessionen. Wir untersuchen ihre Beziehungen innerhalb der Nachtschattengewächse und versuchen, sowohl die evolutionären Kräfte, die im Spiel sind, als auch die Grundlage für die Eignung von LAB als Forschungsinstrument zu verstehen.

Die QLD-Wildakzession weist viele morphologische, entwicklungsbezogene und metabolische Unterschiede zu LAB7,14,15,16 auf, wie z. B. das Auskreuzen von Blüten, die Produktion von Blumenduft in der Nacht und die robuste Fähigkeit, Anthocyane zu produzieren (Abb. 1c, d, Erweiterte Daten, Abb. 1). , Ergänzende Abbildung 1 und Ergänzende Tabelle 1). Vor allem ist QLD viel weniger anfällig für Viren als LAB, was mit einer unterschiedlichen RNAi-Kompetenz in Verbindung gebracht wird7,14. Die Konzentrationen einer Reihe von Metaboliten wie Phenolsäuren, Flavonoiden, Aminosäurederivaten und Metaboliten, die an Abwehrreaktionen17,18,19,20 beteiligt sind, wie Nornikotin und Hydroxygeranyl-Linalool-Diterpenglycoside (HGL-DTG), weisen deutliche Unterschiede zwischen LAB auf und QLD (Abb. 1e, f, erweiterte Daten Abb. 2 und 3 und Ergänzungstabelle 2). LAB zeigte eine höhere Anzahl unterexprimierter/nicht funktionierender Biosynthesewege als QLD, mit Ausnahme von Phenolsäuren und HGL-DTGs. Aufgrund dieser und möglicherweise vieler weiterer unterschiedlicher Merkmale, ihrer genetischen Distanz (Abb. 1a) und insbesondere ihrer Unterschiede in der Fähigkeit zur Virusabwehr wurden sowohl LAB als auch QLD für Genomsequenzassemblierungen auf Chromosomenebene ausgewählt.

Lange und kurze Sequenzablesungen der LAB- und QLD-Akzessionen wurden zu 19 Chromosomen für jedes Genom zusammengesetzt (Methoden und ergänzende Abbildung 2). Die Größe der Chromosomen lag zwischen 128 und 182 Mb, mit einer Gesamtgenomgröße von ~2,8 Gb (LAB) und ~2,9 Gb (QLD), von denen 99 % bzw. 96 % an Chromosomen verankert waren (Ergänzungstabelle 3). Dies entspricht etwa 94 % der erwarteten Genomgröße, die anhand zytologischer Färbungen geschätzt wurde2. Die Baugruppen wurden mit Anmerkungen (Methoden und ergänzende Abbildung 2) zu 45.797 bzw. 49.636 Genmodellen in LAB und QLD (ergänzende Tabelle 3) versehen. Ungefähr 87 % der Genmodelle in LAB und 75 % in QLD werden vollständig durch RNA-Sequenzierung (RNA-seq) unterstützt (Ergänzungstabellen 4 und 5) und 98 % der LAB-exprimierten Sequenz-Tag-Sequenzen21,22,23 werden auf das LAB abgebildet Genomkodierende Sequenzen. Laut mehreren Qualitätsbewertungen, einschließlich des Long Terminal Repeat (LTR) Assembly Index24, lagen die LAB- und QLD-Assemblys deutlich über den Standardanforderungen des Earth Biogenome Project25,26 (Ergänzungstabelle 6). Sie weisen eine höhere Kontiguität auf als alle veröffentlichten Nicotiana-Genomassemblierungen (Tabelle 1); Dies wird durch die Kontaktmatrizen (Extended Data Abb. 4(A)) und die Analyse des gut untersuchten S-Locus (Extended Data Abb. 4(B)) weiter veranschaulicht.

Die Genkartierung (Ergänzungstabelle 7a) ergab, dass 72 %, 92 % und 89 % der N. benthamiana-Gene ortholog zu denen in Tomate, N. attenuata bzw. Tabak sind. Ähnliche Zahlen wurden durch Proteinclusteranalyse erhalten (Ergänzungsabbildung 3 und Ergänzungstabelle 7b). Es gab etwa 1.000 bzw. etwa 3.000 Gene, die für LAB bzw. QLD spezifisch waren. Basierend auf BUSCO-Scores und dem Vergleich der vorhergesagten Proteinlängen mit ihren besten Arabidopsis-Hits sind die LAB- und QLD-Anmerkungen besser als die meisten Nicotiana- und Solanaceae-Anmerkungen (Ergänzungstabelle 7c und ergänzende Abbildung 4). Insgesamt wurden 369 bzw. 383 potenzielle microRNA-Familien und die Expression von 59 bzw. 57 davon in LAB bzw. QLD nachgewiesen (Ergänzungstabelle 8a – e und erweiterte Daten Abb. 5).

Die zuvor beschriebenen NT-, SA-, WA- und NWA-Wildakzessionen14 (Abb. 1b) sowie die häufig verwendete transgene Linie (16c), die grün fluoreszierendes Protein (GFP) exprimiert, hergestellt im Labor von D. Baulcombe23,27 (EU-LAB) und (USA-LAB) wurden neu sequenziert und auf die LAB- und QLD-Baugruppen abgebildet. Die SNP-Häufigkeiten28 (Ergänzungstabelle 9) waren unter den drei LAB-Akzessionen sehr niedrig (<25 SNPs pro MB), was zeigt, dass unsere LAB-Anordnung eine enorme Ressource für weltweite N. benthamiana-Laborisolate darstellt. Die SNPs zwischen den vier Wildakzessionen spiegelten die zuvor berechneten evolutionären Beziehungen wider (Ergänzungstabelle 9) und ähnelten im Bereich denen von 20 Capsicum annuum-Akzessionen . SA und LAB, die ursprünglich an geografisch weit voneinander entfernten Standorten gesammelt wurden, weisen eine große genetische Ähnlichkeit auf (~51 SNPs pro MB). Eine mögliche Erklärung ist, dass Pitjuri (eine Kautabakmischung, die oft getrocknetes N. benthamiana-Luftgewebe enthält), das entlang alter traditioneller Handelsrouten der Aborigines ausgetauscht wurde (Abb. 1b), in den letzten 60.000 Jahren Samen zwischen diesen Orten transportiert hat. Die annotierten Genome von LAB und QLD, die Spuren enthalten, die Genmodelle, SNPs mit anderen N. benthamiana-Isolaten, Genexpression in fünf Geweben, Position und Expression von Prä-miRNAs und die epigenetischen Landschaften beschreiben, sind in einem interaktiven WebApollo-Browser30 verfügbar (https:// ://www.nbenth.com).

Die Genome der meisten diploiden Nachtschattengewächse bestehen aus 12 Chromosomenpaaren (2x = 2n = 24), die etwa 35.000 Gene kodieren31. N. tabacum, ein Allotetraploid, der vor etwa 0,2–0,4 Ma8,9 gebildet wurde, hat 24 Chromosomenpaare (2n = 4x = 48), die ~70.000 Gene kodieren32,33. In den geschätzten 5–6 Millionen Jahren seit dem Hybridisierungsereignis basal zur australischen Nicotiana-Klade hat N. benthamiana fünf Chromosomenpaare verloren, um ein Genom von 2n = 4x = 38 zu ergeben (Abb. 1a)4,5.

Ein Kartierungsansatz, ähnlich dem zur Identifizierung der subgenomischen Zugehörigkeiten der N. tabacum-Chromosomen32,33,34, wurde auf N. benthamiana und N. tabacum unter Verwendung von Sequenzen aus den Genomen von N. sylvestris, N. glauca und N. tabacum angewendet. tomentosiformis. Dies rekapitulierte die vorherigen Tabakergebnisse, differenzierte jedoch, wie zuvor vorhergesagt8,9, die N.-benthamiana-Chromosomen nicht in ein N.-glauca- und ein N.-sylvestris-verwandtes Subgenom (Abb. 2a). Deshalb haben wir einen anderen Ansatz gewählt. Syntenische Sequenzen und Blöcke orthologer Gene wurden sowohl innerhalb der hochsyntenischen LAB- und QLD-Genome als auch mit den Genomanordnungen von N. tabacum32 und N. attenuata34 verglichen (Abb. 2b). Ein Dendrogramm, das aus Matrizen der Ähnlichkeitsgrade der entsprechenden Gensequenzen des Nicotiana-Satzes abgeleitet wurde, identifizierte eindeutig acht homöologe Chromosomenpaare und drei verwaiste Chromosomen (Abb. 2c und Ergänzungstabelle 10).

a: Das linke Circos-Diagramm zeigt die Positionen der syntenischen Blöcke (1 Mbp) von N. tomentosiformis (blau) und N. sylvestris (rot) im N. tabacum-Genom und hebt die Subgenome und ihren jeweiligen Beitrag zum Subgenom hervor Struktur dieser Art. Das Circos-Diagramm auf der rechten Seite lokalisiert in ähnlicher Weise die syntenischen Blöcke von N. tomentosiformis (blau), N. sylvestris (rot) und N. glauca (lila) im LAB-Genom von N. benthamiana, was die Schwierigkeit bei der Zuordnung der Abstammung für Subgenome in diesem Fall hervorhebt Art, die durch eine umfassende Neuanordnung von Blöcken zwischen einzelnen Chromosomen gekennzeichnet ist. Die Linien in der Mitte verbinden syntenische Regionen und verdeutlichen die Fragmentierung des N. benthamiana-Genoms. b, Punktdiagramm, das die Beziehung zwischen den LAB- und QLD-Chromosomen (mittlere durchgehende Linie im Bild ganz links) und die fragmentierte syntenische Beziehung zwischen den Subgenomen zeigt. Der Vergleich des N. tabacum-Genoms, das aus zwei Subgenomen mit klaren Beziehungen zu N. sylvestris und N. tomentosiformis besteht, ergab eine fragmentierte Beziehung zu den Chromosomen von N. benthamiana. c, Dendrogramm mit Hervorhebung der Chromosomenpaare und der drei verwaisten Chromosomen (mit Anmerkungen 9, 10 und 19). d, Retention und Verlagerung homöologer Gene in N. benthamiana LAB- und QLD-Genomen. Die Prozentwerte außerhalb und innerhalb der Klammern beziehen sich auf LAB bzw. QLD und zeigen, dass etwa die Hälfte der ursprünglichen homöologen Paare ein Mitglied verloren hat.

Um das Genom in zwei funktionelle Subgenome zu unterteilen, wählten wir einen Ansatz zur Aufteilung disjunkter Teilmengen, der dadurch ermöglicht wurde, dass sich etwa 50 % der Gene, für die homöologe Genpaare identifiziert wurden, auf anderen Chromosomen als ihrem vorhergesagten homöologen Gegenstück befanden. Jede Kombination von LAB-Chromosomen wurde zwei disjunkten Untergruppen zugeordnet und auf die Anzahl der homöologen Genpaare gemessen, die 1:1 zwischen den beiden Untergruppen verteilt waren. Die beste Kombination, ohne die Gene auf den drei verwaisten Chromosomen, ergab eine Verteilung von 8.543 Genpaaren in gegenüberliegenden Subgenomen und 1.999 Genpaaren im selben Subgenom (Ergänzungstabelle 11a – h und Abb. 2d). Der visuelle Vergleich der Subgenome von N. benthamiana mit den Genomen von sechs anderen Nachtschattengewächsen mithilfe von SynVisio35 ergab eine bemerkenswerte Langstreckensyntenie in der gesamten Familie, die sich sogar noch deutlicher zeigte, als der Prozentsatz der Gene auf jedem Chromosom der Art zu denen auf jedem Tomatenchromosom ortholog war , insbesondere in den Chromosomen 1, 2, 3 und 4, aber immer noch erkennbar in N. tabacum bis Chromosom 7 (Abb. 3a, b). Im Gegensatz dazu nimmt diese Konservierung bei N. benthamiana nach Chromosom 4 schnell ab (Abb. 3b, e), wahrscheinlich aufgrund des hohen Ausmaßes an chromosomalen Umlagerungen, die für diese allopolyploide Art spezifisch sind.

a, Wasserfalldiagramm, das die syntenischen Beziehungen zwischen LAB, QLD und anderen verwandten Arten zeigt, wie von SynVisio generiert. b, Anteil orthologer Gencluster in verschiedenen Solanaceae-Chromosomen, wobei eine hohe Erhaltung der Chromosomen 1–4 und eine abnehmende Erhaltung der verbleibenden Chromosomen hervorgehoben wird; Die Chromosomennummerierung folgt weitgehend dem Tomaten-Kartoffel-System. Nb, N. benthamiana. c, Ein Gibson-Venn-Diagramm, das die Anzahl der Genfamiliencluster zeigt, die von LAB, N. sylvestris und N. glauca gemeinsam genutzt werden. d, Überlagerung orthologer Gene von N. glauca (blaue Balken innerhalb der Chromosomen) und N. sylvestris (rot) auf LAB-Chromosomen. Grau/blaue Linien, die Chromosomen verbinden, verbinden syntenische Blöcke zwischen den übereinstimmenden Subgenom-Chromosomen. e, Circos-Diagramm der physikalischen Verteilung der syntenischen Blöcke der Tomatenchromosomen 9–12, überlagert mit dem LAB-Genom (Spur a), das eine ausgedehnte Fragmentierung über die verbleibenden LAB-Chromosomen zeigt. Im Gegensatz dazu zeigt eine Überlagerung der syntenischen Blöcke der Tomatenchromosomen 1–4 auf dem LAB-Genom deutlich die Erhaltung sowohl der Sequenz als auch der Position (Spur b). Spur c zeigt die Gendichte über die LAB-Chromosomen hinweg.

Die Syntenieblöcke zwischen den beiden Subgenomen von N. benthamiana sind zahlreicher, größer und zusammenhängender als beim von N. sylvestris abgeleiteten Subgenom von N. tabacum (ergänzende Abbildung 5). Um dies weiter zu untersuchen, wurde eine Clusteranalyse unter Verwendung der aus unserer LAB-Anordnung vorhergesagten Proteome und der verfügbaren Gerüstanordnungen von N. sylvestris und N. glauca durchgeführt (Abb. 3c). Die LAB-Gene, bei denen eine Clusterbildung mit N. sylvestris-Genen, aber nicht mit N. glauca-Genen und umgekehrt festgestellt wurde, wurden auf dem LAB-Genom kartiert (Abb. 3d). Dies ergab, dass selbst in den genreichen, großen, Solanaceae-weiten syntenischen Blöcken eine umfassende Rekombination zwischen den beiden angestammten Subgenomen stattgefunden hat, und legt nahe, dass das aktuelle N. benthamiana-Genom das Ergebnis einer umfangreichen homöologen „Duplikation/Deletion“-Rekombination ist36. oder einer wiederholten Hybridisierung zwischen den abgeleiteten Populationen der ursprünglichen allotetraploiden Nicotiana an der Basis der Suaveolentes. Diese Prozesse haben Chromosomen erzeugt, die aus Genen beider Vorfahreneltern bestehen, was die größere Syntenie zwischen den homöologen Chromosomen von N. benthamiana im Vergleich zu ihren N. sylvestris-Gegenstücken erklärt. Dies ist wahrscheinlich auch die Ursache für die geringe Subgenomdominanz (Ergänzungsabbildung 6 und Ergänzungstabelle 12). Die Subgenome A und B kodieren 23.408 bzw. 22.388 Gene, und die Gesamttranskripthäufigkeit der Homöologen unterscheidet sich nur um 1 %, was darauf hindeutet, dass sich das Genom in ausgewogener, aber fließender Harmonie befindet.

Eine beeinträchtigte RNAi-Reaktion in N. benthamiana-LAB könnte die Ursache für die hervorragende Leistung der Pflanze als Biofabrik und Forschungsinstrument sein7. Um dies zu untersuchen, wurden die Fähigkeit zur Transgenese, Genombearbeitung, vorübergehenden Transgenexpression sowie das Vorhandensein, die Integrität und die Expressionsniveaus von RNAi-assoziierten Genen in LAB und QLD analysiert (ergänzende Abbildung 7). In beiden Akzessionen verfügen die wichtigsten viralen Abwehr-RNAi-Gene37, DCL2, RDR6, DRB4 und AGO2 über ein exprimiertes Homöolog, beide funktionellen DCL4-Homöologen und vier exprimierte Kopien von AGO1. Die Anzahl, Integrität und Expression dieser Gene unterscheidet sich nicht wesentlich zwischen den Akzessionen, ebenso wenig wie die der RNAi-Gene, die am Chromatin-Remodelling oder der endogenen Produktion kleiner RNAs beteiligt sind (ergänzende Abbildung 7). NbRDR1 ist die Ausnahme. In LAB gibt es eine 72 Nukleotide lange Insertion, die Stoppcodons in der Mitte des Gens erzeugt38. Merkwürdigerweise ist die Boten-RNA die volle Länge und akkumuliert sich wie die ihres ununterbrochenen QLD-Gegenstücks. Nichtsdestotrotz wirkt das verkürzte NbRDR1-Protein in LAB nicht als dominantes Negativ, da die Einführung früher Stoppcodons in das Gen die Virusanfälligkeit nicht verringerte (ergänzende Abbildung 8). Um zu testen, ob der Unterschied in der RDR1-Funktion QLD zu einem überlegenen oder minderwertigen Forschungsinstrument und einer Bioplattform gegenüber LAB machen könnte, wurden die Akzessionen auf Einfachheit und Effizienz der Transformation sowie Genbearbeitung und Grad der vorübergehenden Genexpression durch Spritzen- und Vakuuminfiltration bewertet (erweiterte Daten). Abb. 6 und 7, Ergänzungstabelle 13 und Abb. 4). In fast allen diesen Punkten schnitten sie ähnlich ab. Allerdings lieferte LAB durch die Vakuum-Agro-Infiltration eine viel höhere Menge an vorübergehend exprimiertem Antikörper (Abb. 4b, c), lässt sich physikalisch einfacher per Patch infiltrieren und hat eine schnellere Generationszeit14.

a, Vorübergehende Expression von GFP in LAB und QLD. Es wurden quantitative Schwellenwerte (Ct) für den Polymerasekettenreaktionszyklus gemessen und ΔCt als Ct-Differenz zwischen dem interessierenden Gen (GFP) und dem Referenzgen (GAPDH) für jede Probe berechnet. Die GFP-Expressionsniveaus werden unter jedem Blatt als ΔCt dargestellt. Alle Reaktionen wurden für jede komplementäre DNA-Probe dreifach durchgeführt. Alle Experimente wurden in acht unabhängigen biologischen Replikaten durchgeführt. Der durchschnittliche ΔCt von LAB und QLD betrug 4,8 bzw. 4,7. Die statistische Analyse des zweiseitigen Student-T-Tests (P = 0,7972) und des Z-Tests (P = 0,9949) zeigt, dass es keinen signifikanten Unterschied zwischen den GFP-Expressionsniveaus in den beiden Ökotypen gab. Maßstabsleiste, 1 cm. b, Antikörperkonzentration in den gesamten löslichen Proteinextrakten der Ökotypen LAB (weiß) und QLD (grau), gemessen durch Protein-A-Bioschichtinterferometrie in μg mg−1 des Gewebefrischgewichts (FW). Die P-Werte wurden durch den Mann-Whitney-U-Test zum Vergleich zwischen Ökotypen bestimmt. Bei „n“ handelt es sich bei den Proben um biologisch unabhängige, vorübergehende Infiltrationen, die 7 Tage nach der Infiltration entnommen werden. Interpretation der Box- und Whisker-Plots: Jede Box erstreckt sich über den Interquartilbereich, wobei die Enden der Box das obere und das untere Quartil sind. Der Median wird durch eine vertikale Linie innerhalb der Box dargestellt. Whisker außerhalb der Box erstrecken sich auf die höchsten und niedrigsten Beobachtungen. GalT, Galactosyltransferase; IgG, Immunglobulin G. c, SDS-Polyacrylamid-Gelelektrophorese zeigt Protein A-gereinigtes Trastuzumab unter reduzierenden Bedingungen. Ähnliche Ergebnisse wurden in drei unabhängigen Replikaten beobachtet (n = 3).

Quelldaten

Polyploidisierung geht häufig mit Ausbrüchen der Aktivität transponierbarer Elemente (TE) einher39,40,41,42 und TEs, insbesondere die Typ-1-LTR-Klasse wie das Gypsy-Metavirus (Gypsy), kommen in Nicotiana sehr häufig vor34. Obwohl die Zigeunerproliferation im N.-benthamiana-Genom offensichtlich ist, ähnelt ihr Inhalt (~1,5 Gb) in der Größe eher denen der diploiden Nicotiana-Arten als der allotetraploiden N. tabacum oder der kombinierten Summe der vorhandenen diploiden elterlichen Verwandten der Vorfahren. N. glauca und N. sylvestris (Abb. 5a). Eine ähnliche Ausweitung des Zigeunergehalts ist im kürzlich gemeldeten Pfeffergenom offensichtlich und eine der Hauptursachen für dessen Vergrößerung43. Bezogen auf die Genomgröße bestehen jedoch alle diese Nicotianas, einschließlich N. benthamiana, zu etwa 50 % aus Gypsy- oder Gypsy-ähnlichen Sequenzen, was darauf hindeutet, dass der verringerte Gypsy-Gehalt in N. benthamiana eher auf den Verlust ganzer Chromosomen als auf TE- zurückzuführen ist. vermittelte Genombereinigung44,45.

a: Relative Komplemente des Transposon- und Nicht-Transposon-Gehalts in Arabidopsis thaliana, Vitis vinifera und wichtigen Solanaceous und Nicotianas werden als berechneter Genomgehalt in Gb dargestellt. Das gestrichelte Kästchen für N. glauca gibt die aus der k-mer-Analyse berechnete Genomgröße (4,5 Gb) an, während die Zusammensetzung des Genoms auf der aktuellen Zusammensetzung von 3,2–3,5 Gb basiert. Viele Gypsy-ähnliche Sequenzen sind in der Kategorie „andere TE“ in N. benthamiana vorhanden. b, Geschätzte Daten der LTR-Retrotransposon-Insertion, berechnet durch Sequenzvergleich zwischen den LTRs einzelner Elementinsertionen, in N. benthamiana LAB und QLD, verglichen mit N. attenuata und N. tabacum. Sowohl in LAB als auch in QLD ist ein deutlicher und anhaltender großer Anstieg der Aktivität des Copia-Elements erkennbar, der sowohl in N. attenuata als auch in N. tabacum fehlt. Der gemeldete Anstieg der Zigeuneraktivität in Nicotianas scheint vor der 6-Millionen-Grenze unserer Analyse zu liegen. c, Ein Circos-Diagramm, das die Chromatinlandschaft im Vergleich zum Gengehalt in LAB darstellt. Die Spuren a und b stellen jeweils die Position der permissiven Histonmarkierungen H3K27ac und H3K4me3 innerhalb jedes LAB-Chr dar. Spur c zeigt die Gendichte im gesamten LAB-Genom, während die Spuren d und e den Ort oder die repressiven Histonmarkierungen H3K9me2 bzw. H3K27me3 darstellen. d, Circos-Diagramm, das die vergleichenden Positionen von Transgen-Insertionen, LTR-Retrotransposon-Insertionen und Methylierungsmarkierungen über LAB-Chromosomen hinweg darstellt. Verfolgen Sie a, Transgen-Insertionsstellen; Rote „Häkchen“ stellen Einfügungen dar, die aus einer stabilen Transformation stammen, blaue „Häkchen“ stellen Einfügungen dar, die aus einer vorübergehenden Agrarinfiltration stammen. Spur b, Einfügungen intakter Copia-TEs (enthaltend passende LTRs und vollständige interne Sequenzen). Spur c, Einfügen aller kommentierten Copia-TEs, einschließlich fragmentierter Elemente. Spur d, Verteilung der CHH-Methylierungsmarkierungen. Verfolgen Sie die Gendichte im gesamten LAB-Genom. Spur f, Einfügungen aller annotierten Gypsy-TEs, einschließlich fragmentierter Elemente. Spur g, Verteilung der CG-Methylierungsmarkierungen. Spur h, Verteilung der CHG-Methylierungsmarkierungen. Der innerste Kreis stellt die nummerierten Chromosomen dar. e, Verteilung der Gendichten auf den Chromosomen von Kartoffeln (innerer Kreis) und Tomaten (äußerer Kreis). f, Verteilung der Gendichten auf den Chromosomen der Genomen LAB (innerer Kreis) und QLD (äußerer Kreis).

Im Gegensatz zu allen anderen sequenzierten Genomen von Nachtschattengewächsen, einschließlich des eng verwandten diploiden N. attenuata und des polyploiden N. tabacum, weist das Genom von N. benthamiana Hinweise auf eine dramatische, jüngste Proliferation von Copia-Elementen auf (Abb. 5a, b). Eine detailliertere Untersuchung von vier verschiedenen Loci in den Subgenomen von LAB und QLD und deren Vergleich mit ihren Gegenstücken in Tomaten und anderen Nicotianas (Erweiterte Daten, Abb. 8–10) ergab ein gemeinsames Thema der Erweiterung intergener Regionen in Nicotianas im Vergleich zu Tomaten , wie bei Pfeffer, ist größtenteils auf Gypsy-Elemente zurückzuführen, die jetzt stark fragmentiert sind. Ein zweites Thema ist die Tandemduplikation bei Nicotiana, gefolgt von einer umfassenden Pseudogenisierung speziell bei N. benthamiana. Eine Fülle rezenter, intakter Copia-Elemente ist auch in N. benthamiana erkennbar. Die Einfügungsdatierung (Abb. 5b) zeigt, dass anhaltende Perioden der Copia-Mobilität um etwa 2 Ma begannen und vor etwa 750.000 Jahren (ka) ihren Höhepunkt erreichten und immer noch auftreten. Dies stimmt mit der Divergenz von LAB und QLD überein, die auf ca. 800 ka datiert ist (Lit. 14), und kürzlich eingefügte Copia-Elemente sind in unmittelbarer Nähe zu Schlüsselgenen in allen vier von uns untersuchten Loci erkennbar (Erweiterte Daten, Abb. 8–10). Dies legt nahe, dass die jüngste Mobilität eine wichtige Rolle bei der fortschreitenden Diploidisierung und Diversität des Genoms gespielt hat. Es ist möglich, dass die Copia-Explosion allen australasiatischen Nicotianas gemeinsam ist, und in Verbindung mit ihrer Allopolyploidie hat dies möglicherweise die Anpassung vorangetrieben, die den weit verbreiteten Erfolg der Suaveolentes in einigen der rauesten klimatischen und ökologischen Regionen Australiens ermöglicht hat.

Die epigenetische Landschaft des LAB-Genoms wurde auf Histon-H3-Methylierung und -Acetylierung sowie Cytosin-Methylierung untersucht (Abb. 5c, d und ergänzende Abb. 9)46. Die Chromosomen 1, 2, 3, 4, 5 und in geringerem Maße auch 11 und 12 weisen einen ausgeprägten Gradienten der Gendichte über jedes Chromosom auf, was dabei hilft, die Korrelation einer hohen Gendichte mit einem hohen Maß an aktiven Histonmarkierungen aufzudecken ( H3K4me3, H3K27ac). Es ist auch eine umgekehrte Korrelation einer hohen Gendichte mit repressiven Histon- und DNA-Markierungen (H3K9me2 und CG- und CHG-Methylierung) erkennbar. Diese epigenetisch unterdrückten Regionen enthalten ein hohes Maß an fragmentierten Gypsy-Elementen, wohingegen die aktiven Regionen mit einem erhöhten Maß an intakten Copia-Elementen korrelieren. Die Assoziationen sind auch in den anderen Chromosomen auf einer lokaleren Ebene sichtbar. Der bemerkenswert hohe Grad der jüngsten Insertionen von Copia-Elementen in Regionen mit hoher Gendichte und aktiven Histonmarkierungen korreliert auch mit hohen Graden an CHH-Methylierung, die wahrscheinlich durch die aktive Transkription dieser TEs gesteuert werden.

Um zu untersuchen, ob die epigenetische Landschaft einen Einfluss auf die Transgeninsertion im N. benthamiana-Genom hat, wurden stabile transgene Linien und Blattflecken, die mit transgenkodierenden Konstrukten agroinfiltriert waren, auf ihre Insertionsorte analysiert. Von 40 unabhängigen transgenen Linien konnten 23 Stellen kartiert werden, und die Sequenzierung des gesamten Genoms der infiltrierten Flecken identifizierte 144 Integrationsstellen (Abb. 5d). Bei Anpassung an die Chromosomengröße gab es keine signifikante Tendenz zur Integration in ein bestimmtes Chromosom (P = 0,19). Die Integration in den Genkörper und die Promotorelemente erfolgte jedoch häufiger als zufällig (ergänzende Abbildung 10), und diejenigen, die in intergene Regionen eingefügt wurden, befanden sich deutlich näher an den Gengrenzen (ergänzende Abbildung 11). Die Transgeninsertion in den Genkörper erfolgte in vorübergehend agroinfiltriertem Gewebe viel häufiger als in stabilen transgenen Linien, vermutlich weil die durch die Insertion vermittelte Dysfunktionalität einiger Gene die Regeneration ganzer Pflanzen verhindert, in begrenzten Bereichen somatischen Gewebes jedoch nicht tödlich ist. Die durchschnittliche intergene Größe für N. benthamiana beträgt ~ 60 kb (ergänzende Abbildung 12), und die meisten Transgene wurden innerhalb der 10 kb-Region neben einem Gen eingefügt. Eine ähnliche Tendenz ist für aktive Kopien von Copia und Gypsy erkennbar (Abb. 5d und ergänzende Abb. 11). In Verbindung mit den Daten zum Histon- und Cytosin-Methylierungsstatus stützt dies die Annahme, dass Transgene und TEs eher in der Lage sind, sich in das offene Chromatin von Genen und angrenzenden Regionen zu integrieren als in den kondensierten Kern intergener Zonen.

Der Verlust von fünf Chromosomen aus dem angestammten Allotetraploiden mit Beibehaltung von ~50 % der Gene im Genom als Singletons (LAB sgA: 10.075 sgB: 11.906; QLD sgA: 11.416 sgB: 12.905) und nicht als homöologe Paare (Abb. 2d und Ergänzung). Tabelle 11,a–h) zeigt einen Verlust von ~20.000 Genen/Genom über 5 Millionen Jahre. Dies steht im Einklang mit der Schätzung, dass das allotetraploide Genom der Vorfahren etwa 70.000 Gene hatte31,32 und erklärt in Verbindung mit den genetischen Dysfunktionen von LAB die einfachen 3:1-Mendelschen Vererbungsverhältnisse vieler Merkmale in LAB × QLD-Kreuzungen, wie z. B. Virusanfälligkeit14, Nornikotinproduktion usw Anthocyan-Kompetenz. In jedem dieser Fälle weist LAB im Vergleich zu QLD dysfunktionale Gene und Signalwege auf. Der Anthocyan-regulierende Transkriptionsfaktor (TF)-Locus zeigt eine Tandem-Genduplikation mit fortschreitender Gendysfunktion (Erweiterte Daten, Abb. 8 (B)). Eine noch auffälligere Diploidisierung zeigt sich im ERF IX TF-Locus, der die Nikotinsynthese reguliert (Extended Data, Abb. 8(A)), im RPM1-ähnlichen bakteriellen Abwehrgenlocus (Extended Data, Abb. 9(A)) und im Terpenbiosynthese-Gen CYP736A Ort (Erweiterte Daten Abb. 9(B)). In all diesen Dokumenten gibt es Hinweise auf kürzlich eingefügte Copia-Elemente, die auf ihre Rolle in dem Prozess schließen lassen. Diploide Solanum-Genome und viele Nicht-Solanaceen-Arten weisen eine hohe Gendichteverzerrung in Richtung der Chromosomentermini auf (Abb. 5e, f). Interessanterweise weisen die Chromosomen von N. benthamiana, insbesondere 5–10 und 15–19, eine gleichmäßigere Dichte auf. Diese ungewöhnliche Anordnung wurde wahrscheinlich durch ihre Bildung durch reichliche interchromosomale Rekombination und durch die Verdünnung der Gendichte durch die bevorzugte Insertion von TEs in das aktive Chromatin genreicher Regionen verursacht.

Die exponentielle Einführung von Nicotiana benthamiana als Modellpflanze in den letzten zwei Jahrzehnten hat zu riesigen Datenmengen geführt, die ihre Reaktionen auf ein breites Spektrum biotischer und abiotischer Herausforderungen beschreiben, und dies scheint unvermindert anzuhalten. Seine Nutzung als Bioplattform zur Herstellung von Therapeutika verläuft ähnlich. Diese Doppelfunktion als Modellart und Non-Food-Bioproduktionsplattform sowie die unübertroffene Fähigkeit zur schnellen transienten Transgenanalyse haben N. benthamiana zum bevorzugten Chassis für die Erprobung und Umsetzung der fortschrittlichsten technischen Ansätze in der synthetischen Pflanzenbiologie gemacht47,48 ,49. Wir haben eine hochwertige Genomassemblierung des LAB-Stamms von N. benthamiana mit vollständig annotierten Genmodellen, miRNA-Familien, TEs, epigenetischen Landschaften und chromosomaler subgenomischer Mitgliedschaft erstellt und diese in einem interaktiven webbasierten Genombrowser öffentlich zugänglich gemacht. Dies ermöglicht die Einordnung jahrzehntelanger zuvor gewonnener Daten in einen breiteren Kontext, stellt eine wichtige Hilfe für zukünftige Forschung und Biotechnologie dar und erleichtert die Einbindung der wissenschaftlichen Gemeinschaft zur Erweiterung und Verfeinerung der Ressource. Die hochwertige Genomassemblierung von QLD mit ihren zusätzlichen Signalwegen und etwa 3.000 Genen sowie die Details zur genomischen Diversität von weiteren vier Wild- und zwei Laborisolaten stellen Ressourcen bereit, um Stoffwechsel-, Entwicklungs- und Evolutionsstudien erheblich zu verbessern. Dies ist nicht nur für N. benthamiana, sondern auch für die gesamten Nachtschattengewächse relevant, da es das Genom einer Nicotiana-Art auf den gleichen chromosomalen Vollständigkeitsgrad (>95 %) bringt wie Tomaten, Auberginen, Kartoffeln und Paprika.

Im Vergleich zu QLD ist LAB aufgrund eines dysfunktionalen RNA-Polymerase-Gens (RDR1) in vielen Signalwegen, einschließlich der Virusabwehr, defekt, aber beide Akzessionen weisen ähnliche Expressionsniveaus und Homöologen-Retention für die anderen RNAi-Signalweg-Gene auf. Obwohl QLD über ein größeres genetisches Spektrum für metabolische und biotechnologische Technik als LAB und ähnlich hohe Transformations- und Genbearbeitungseffizienzen verfügt, ist LAB aufgrund seiner langsameren Wachstumsrate und geringeren Ausbeute an vorübergehend exprimierten Antikörpern nach der Vakuum-Agrarinfiltration die bevorzugte Wahl als Biofabrik und Forschungsinstrument . Allerdings sind QLD und LAB in hohem Maße interfruchtbar (ergänzende Abbildung 13), was sie zu einer leistungsstarken Partnerschaft für ein breites Spektrum molekulargenetischer und vergleichender Genomikansätze macht, wie z. B. rekombinante Inzucht- und epigenetische rekombinante Inzuchtpopulationen, die an etablierte Modellpflanzensysteme wie Arabidopsis erinnern , Mais und Reis.

N. benthamiana zeigt eine jüngste Explosion der Copia-Mobilität und eine schnell voranschreitende Diploidisierung. Diese beiden Phänomene können eine Ursache-Wirkungs-Beziehung haben oder auch nicht, sind aber unter den sequenzierten Nicotianas offenbar einzigartig für diese Art, was sie zu einer hervorragenden Modellart für die Untersuchung des Verlaufs der Diploidisierung und des dynamischen Gleichgewichts zweier Subgenome macht, die diesen Prozess durchlaufen.

Nicotiana benthamiana LAB-, NT-, SA-, WA-, QLD- und NWA-Akzessionen wurden bereits beschrieben14. Das EU-LAB-Isolat, eine weit verbreitete GFP-exprimierende transgene Linie (16c), die im Labor von D. Baulcombe, im Sainsbury Institute, UK23,27 und im USA-LAB hergestellt wurde, wurde beschrieben50. Die Pflanzen wurden in einer maßgeschneiderten Bodenmischung (UQ23, ergänzt mit Osmocote-Langzeitdünger) unter kontrollierten Umgebungsbedingungen bei einer konstanten Temperatur von 25 °C mit einer Photoperiode von 16 Stunden Licht und 8 Stunden Dunkelheit gezüchtet.

Gesamt-RNA wurde aus vier Geweben (Blatt, Blüte, Stängel, Wurzel) und Sämlingen (10 Tage) von LAB (6 Wochen) und QLD (7 Wochen) im gleichen Entwicklungsstadium unter Verwendung von TRIzol-Reagenz gemäß den Anweisungen des Herstellers isoliert. Mit dem NEBNext ultra RNA Library Prep Kit für Illumina wurden für jedes Gewebe drei Bibliotheken erstellt, die Größe ausgewählt (durchschnittlich 300 Nukleotide) und auf einem Illumina HiSeq 2000/2500-System sequenziert, um 150 bp Paired-End-Reads zu erzeugen.

Blüten, Blätter, Stängel und Wurzeln wurden wie für die RNA-Sequenz beschrieben beprobt, und zwei biologische Replikate (einzelne Pflanzen) derselben Proben von LAB und QLD wurden für die Stoffwechselanalyse verwendet. Die Gewebe wurden gefriergetrocknet und in flüssigem Stickstoff homogen gemahlen.

Die semipolare Fraktion wurde aus lyophilisiertem Grundgewebe (3 mg für Blüten- und Wurzelgewebe und 5 mg für Blatt- und Stängelgewebe) mit 75 % Methanol/0,1 % v/v Ameisensäure extrahiert und mit 0,25 µg ml-1 Formononetin versetzt (Sigma-Aldrich) als interner Standard. Metaboliten wurden bei Raumtemperatur durch kontinuierliches Rühren für 30 Minuten in MM 400 bei 20 Hz extrahiert. Die Proben wurden 20 Minuten lang bei 20.000 g zentrifugiert und 0,6 ml des Überstands wurden zur Flüssigkeitschromatographie-Massenspektrometrie-Analyse (0,2 µm Porengröße) in Filterfläschchen aus Polytetrafluorethylen überführt. Für jedes biologische Replikat wurden zwei unabhängige Extraktionen und Analysen durchgeführt. Die Bedingungen der Flüssigkeitschromatographie wurden bereits beschrieben51. Fünf Mikroliter des gefilterten Extrakts wurden unter Verwendung eines Q-exaktiven Massenspektrometers (Thermo Fisher Scientific) in das Flüssigchromatographie-beheizte Elektrospray-Ionisations-Massenspektrometriesystem injiziert. Die Ionisierung wurde unter Verwendung der beheizten Elektrospray-Ionisierungsquelle durchgeführt, wobei Stickstoff als Hüll- und Hilfsgas verwendet wurde und auf 35 bzw. 10 Einheiten eingestellt war. Die Kapillartemperatur betrug 250 °C, die Sprühspannung wurde auf 3,5 kV eingestellt, die Temperatur der Sondenheizung betrug 330 °C und der RF-Pegel der S-Linse wurde auf 50 eingestellt. Die Erfassung wurde mit Fourier-Transformations-Massenspektrometrie mit einer Masse durchgeführt Bereich von 110–1.600 m/z sowohl im positiven als auch im negativen Ionenmodus, mit den folgenden Parametern: Auflösung 70.000, Mikroscan 1, AGC-Target 1 × 106 und maximale Injektionszeit 100 Millisekunden. Die Dd-MS2-Parameter waren wie folgt: Auflösung 17.500, Intensitätsschwelle 4,0 × 104, AGC-Ziel 2 × 104, maximale Injektionszeit 50 Millisekunden, TopN 5, gestufte normalisierte Kollisionsenergie 15, 25, 40. Alle während der Das gesamte Verfahren war von LC/MS-Qualität (Chromasolv, Merck Millipore).

Die Stoffwechselvielfalt wurde durch Vergleich der MS-Spektren (Positiv-Ionen-Modus) mit der SIEVE-Software (Thermo Fisher Scientific)51 bewertet. Die LC-MS-Spektren wurden durch den Vergleich von Geweben aus jedem Ökotyp verarbeitet. Es wurden nur Metaboliten ausgewählt, die sich bis zu einem Wert von mehr als dem Zweifachen anreicherten und einen P < 0,05 (t-Test) zwischen den beiden Ökotypen aufwiesen. Metaboliten wurden basierend auf genauen Massen im vollständigen MS zusammen mit MS2-Spektren und/oder authentischen Standards unter Verwendung von KEGG (https://www.genome.jp/kegg/compound/), Metfrag (https://ipb-halle. github.io/MetFrag/projects/metfragweb/) und PubChem-Massendatenbanken (ST3) (https://pubchem.ncbi.nlm.nih.gov/). Die relativen Akkumulationsniveaus der untersuchten Metaboliten wurden gemessen und relativ zu destilliertem Wasser und dem internen Standard normalisiert, um die Extraktions- und Injektionsvariabilität zu korrigieren, wie beschrieben51.

Kleine Studien zur Trastuzumab-Expression wurden an 5–6 Wochen alten N. Benthamiana-Pflanzen durchgeführt. Der Agrobacterium tumefaciens-Stamm GV3101, der Plasmide mit Expressionskassetten für die leichte Kette, die schwere Kette von Trastuzumab, P19 und Galactosyltransferase (https://www.plantformcorp.com/) enthält, wurde 30 Minuten lang bei 12.000 g zentrifugiert und dann in Infiltrationspuffer in einem optischen Gerät resuspendiert Dichte bei 600 nm von 0,2. Die Infiltrationslösung wurde in 2-l-Bechergläser gegossen, wobei jedes Becherglas bis zum Rand gefüllt war. Die oberirdischen Teile der N. benthamiana-Pflanzen wurden in die Infiltrationslösung getaucht und in eine 15-Gallonen-Vakuumkammer (Best Value Vacs, Katalog-Nr. BVV15G) gegeben. Über eine Vakuumleitung wurde ein Vakuum angelegt, bis der Druck in der Kammer –25 inHg erreichte, dann 3 Minuten lang gehalten und dann langsam entspannt. N. benthamiana-Pflanzen wurden dann aus der Lösung entfernt und in die Wachstumskammer zurückgebracht. Blattgewebe wurde 7 Tage nach der Infiltration geerntet und bis zur Verarbeitung bei –80 °C gelagert.

Gefrorenes infiltriertes Pflanzengewebe wurde in flüssigem Stickstoff mit Mörser und Pistill homogenisiert und dann mit 3 Volumina 4 °C PBS-Puffer, pH 7,4, kombiniert. Das Homogenat wurde dann 30 Minuten lang bei 4 °C und 16.000 g zentrifugiert. Das gesamte lösliche Protein wurde dann durch einen 0,45-μm-Filter in ein sauberes Röhrchen geleitet. Der Antikörper wurde dann gemäß den Anweisungen des Herstellers, die mit dem Protein G HP SpinTrap-Kit (GE Healthcare, Katalog-Nr. 28903134) geliefert wurden, unter Verwendung des Standard-Reinigungsprotokolls gereinigt.

Genomische DNA mit hohem Molekulargewicht aus Blättern oder Blattkernen der Ökotypen N. benthamiana LAB und QLD wurde wie beschrieben extrahiert und für die Sequenzierung des gesamten Genoms verwendet (Illumina, PacBio und Oxford Nanopore; ergänzende Abbildung 3). Die Illumina- und PacBio-Sequenzierung wurde von der Central Analytical Research Facility der Queensland University of Technology (QUT-CARF) und die Nanoporensequenzierung von der Australian Genome Research Facility, Melbourne, durchgeführt. Die Qualität der Baugruppen wurde mit der Merqury-Software (v.1.3)53 bestimmt. Die LTR-Assembly-Index-Scores wurden unter Verwendung der aus der EDTA-TE-Annotation-Pipeline54 erhaltenen Annotation und unter Verwendung des LTR-Assembly-Index-Unterpakets des LTR-retriever55-Pakets gemäß Ou et al.24 (https://github.com/oushujun/EDTA) ermittelt /wiki/Calculate-LAI-from-EDTA-GFF3-files).

Die Assembly-Pipeline ist in der ergänzenden Abbildung 3 zusammengefasst. LAB- und QLD-Contigs wurden mit CANU (v.1.81)56 und SparseAssembler k-mer 77 (v.20160205)/DBG2OLC (v.20160205)/Racon (v.1.3) zusammengestellt. 2)57,58,59 bzw. Die optische Bionano-Kartierung60 ergab 44 bzw. 37 Supergerüste für LAB und QLD mit Kontiguitätsstatistik-N50-Werten von 122 und 130 Mbit/s. Juicer (v.1.6)61 und 3D-DNA (Zweig 201008)62 wurden verwendet, um Hi-C-Daten und Vormontagedateien zu generieren. HiC-Bibliotheken wurden wie von Dong et al.63 beschrieben erstellt, mit der Illumina-Plattform sequenziert und die ausgerichteten Fragmente von Juicer wurden mit Juicebox (v.2.12)64 und Citrus (https://github.com/anjiyuan/Citrus) weiter verfeinert ), um Anordnungen auf Chromosomenebene zu erzeugen. LR_Gapcloser65 (v.1.1) wurde verwendet, um Lücken mit langen Lesevorgängen zu schließen und unsere Genomassemblierungen zu vervollständigen. Anschließend wurden beide Baugruppen mit Illumina-Lesevorgängen unter Verwendung von Pilon66 (v.1.23) poliert. Schließlich wurde Mercury53 (v.1.3) verwendet, um die Montagequalität basierend auf dem Earth Biogenome Project25 zu kategorisieren. Zuerst wurde k-mer für die DNA-Illumina-Sequenz generiert, indem das Tool mit „meryl k = 21 Count Output xxx.meryl xxx.fastq.gz“ ausgeführt wurde und dann mit „merqury.sh xxx.meryl“ der k-mer-Vollständigkeits- und Qualitätswert generiert wurde '. Die bioinformatischen Analysen wurden in der High-Performance Computing (HPC)-Einrichtung (QUT) und auf Flashlite auf QRIScloud, Australien, durchgeführt.

HISAT2 (v.2.1.0)67 generierte Binary Alignment Map (BAM)-Dateien unter Verwendung gepoolter RNA-seq-Daten (Blatt, Wurzel, Stamm und Samen) und Scallop (v.0.10.5)68 wurde verwendet, um Transkripte aus den gepoolten Daten zu identifizieren RNA-seq-Daten. Transdecoder (https://github.com/TransDecoder/TransDecoder/) identifizierte die Codierungs- und UTR-Regionen. AUGUSTUS (v.3.2.3)69 wurde verwendet, um alle möglichen Transkripte basierend auf der Genomsequenz vorherzusagen. Die Kombination der beiden Genanmerkungen70 ergab 267.000 bzw. 255.000 Gene für LAB und QLD. Um vorhergesagte Gene mit geringer Konfidenz herauszufiltern, wurden die kodierenden Sequenzen aller vorhergesagten Gene mittels BLAST durchsucht71 anhand der NR-Gendatenbank (nicht redundant) des National Center For Biotechnology Information (NCBI) und Solanaceae-Pflanzen (Tomate, Kartoffel, N. attenuata, N. tabacum), wobei der Parameter „Identität“ schrittweise reduziert wurde, bis der BUSCO (v.4.0.5)72-Score nicht mehr anstieg. Dies waren Identitätswerte von 86 % (LAB) und 83 % (QLD). Um die Genannotation zu vereinfachen, wurde nur eine Isoform (mit dem längsten CDS) beibehalten, bei der es scheinbar überlappende Gene gab. Die Ergänzung dieser hochzuverlässigen Gene durch die in der Analyse verlorenen, aber von Scallop identifizierten Gene ergab 45.796 bzw. 49.636 Gene für LAB und QLD. Die Genkartierung wurde von BLAST durchgeführt und suchte nach Tomato (https://solgenomics.net/ftp/tomato_genome/assembly/build_4.00/, v4.0), N. attenuata (https://www.ncbi.nlm.nih.gov). /assembly/GCF_001879085.1/, einschließlich Gerüsten) und N. tabacum (https://solgenomics.net/ftp/genomes/Nicotiana_tabacum/edwards_et_al_2017/) Genomen mit den Sequenzen der genkodierenden Regionen aus dem LAB-Genom. Es wurden Standard-BLAST-Einstellungen verwendet.

Orthofinder v.2.5.4 (Ref. 73) (unter Verwendung der Standardeinstellungen) identifizierte orthologe Beziehungen zwischen LAB, QLD und identifizierte N. tabacum, N. sylvestris, N. tomentosiformis, N. glauca, A. thaliana, V. vinifera und Solanum Lycopersicum und S. tuberosum. Das UpSet-Diagramm in der ergänzenden Abbildung 9 wird mit dem UpSetR-Paket74 generiert. Einzelheiten zu den verwendeten Genomen finden Sie in der Ergänzungstabelle 7c.

Die EDTA-Pipeline (v.2.0.0)54 (https://github.com/oushujun/EDTA); (letzter Zugriff am 22. September 2022) wurde verwendet, um den Wiederholungselementraum für LAB, QLD, N. attenuata und N. tabacum mit dem folgenden initiierenden Befehl zu kommentieren:

>EDTA.pl-genome -species other -step all -u -sensitive 0 -anno 1 -threads 48.

Bei der Annotation des N. tabacum-Genoms wurde nur die Chromosomenanordnung verwendet, die im Sol Genomics Network verfügbar ist (https://solgenomics.net/organism/Nicotiana_tabacum/genome; Datei Nitab-v4.5_genome_Chr_Edwards2017.fasta.gz). Das Flag -u generiert eine Datei (*EDTA_raw/LTR/*.pass.list), die Schätzungen der LTR-Einfügungszeiten von LTR-retriever55, einem Bestandteil der EDTA-Pipeline, enthält. Die Schätzung der Einfügungszeit basiert auf der Anzahl der Polymorphismen, die zwischen den LTR-Sequenzen intakter transponierbarer langer terminaler Wiederholungselemente berechnet wurden. Aufgrund des Fehlens einer genauen Schätzung der neutralen Mutationsrate in N. benthamiana wurde die Standardrate auf die für Reis berechnete festgelegt: 1,3 × 10−8 Substitutionen pro Basenpaar und Jahr54.

Die reifen miRNA-Sequenzen von 79 Pflanzenarten (Ergänzungstabelle 8e) wurden von miRbase (Version 21; https://www.mirbase.org/) abgerufen und zur Identifizierung von microRNAs (miRs) in N. benthamiana mithilfe von Bowtie (v.2.0) verwendet )75. Um das Fehlen von IsomiRs zu vermeiden, wurden mögliche reife miRNA-Sequenzen mit einer Fehlpaarung auch mit miRPlant (v.6)76 identifiziert. Die Expressionsniveaus jedes miR und seines Vorläufertranskripts wurden aus gepoolten Daten von Bibliotheken kleiner RNA- und RNA-seq-Reads (aus dieser und früheren Studien77,78) berechnet.

Alle genomischen Paired-End-Reads von Illumina von jedem Ökotyp wurden mit Bowtie2 (v.2.3.5)79 an die LAB- und QLD-Assemblys angepasst. Doppelte Lesevorgänge wurden aus jeder BAM-Datei mit Picard Toolkit (https://broadinstitute.github.io/picard/) (v.2.19), MarkDuplicates (picard -Xmx25g MarkDuplicates ASSUME_SORT_ORDER=coordinate REMOVE_DUPLICATES=true) und SAMtools (v. 1.10)80 wurde verwendet, um eindeutige (samtools view -Sb -q 40) und korrekte Pair-End-Lesevorgänge (samtools view -@ 1 -hb -f 0 × 2 -F 2316) beizubehalten. Jede Lese-ID in der BAM-Datei wurde geändert, indem die ID des Ökotyps mithilfe von generic_subset_BAM.py aus der SGSautoSNP28-Pipeline (v.2.001) hinzugefügt wurde. Als nächstes wurden BAM-Dateien für jede Sorte mit SAMtools zusammengeführt, um BAM-Dateien für LAB und QLD zu erstellen. Schließlich wurde das Skript SGSautoSNP.py mit Standardparametern verwendet.

Vernetzung, Chromatinisolierung, Kernlyse, Chromatinscherung und Immunpräzipitation wurden wie von Ranawaka et al.52 beschrieben durchgeführt. Antikörper gegen zwei aktive Histonmarkierungen, Anti-Histon-H3-tri-methyl-K4 (Abcam, Katalog-Nr. ab8580) und Anti-Histon-H3-acetyl-K27 (Abcam, Katalog-Nr. ab4729), und zwei repressive Histonmarkierungen Anti-Histon-H3-tri-methyl-K27 (Abcam, Katalog-Nr. ab6002) und Anti-Histon-H3-di-methyl-K9 (Diagenode, Katalog-Nr. C15410060) wurden im Immunpräzipitationsschritt zur Generierung des Genoms verwendet -weite Histonmodifikationslandschaften von LAB und QLD. Bibliotheken (zwei Replikate pro Histonmodifikation und Kontrolleingabe) wurden mit dem NEBNext Ultra II DNA Library Prep Kit für Illumina (Katalognr. E7645S) gemäß den Spezifikationen des Herstellers vorbereitet. Chromatin-Immunpräzipitationssequenzierungsbibliotheken von H3K9me2 wurden bei QUT-CARF unter Verwendung von Illumina NextSeq 500 mit der Ausgabe von 75 bp Paired-End-Reads (TG NextSeq 500/550 High Output Kit v2, 75 Cycle, TG-160-2005) sequenziert. Bibliotheken von H3K4me3, H3K27me3 und H3K27ac wurden bei Novogene International Private Limited (Singapur) auf dem Illumina HiSeq 2000/2500-System sequenziert, um 150 bp Paired-End-Reads zu erzeugen, und mit der Galaxy-Plattform analysiert (https://usegalaxy.org.au). 81. Paired-End-Reads wurden mit Bowtie2 (v.2.4.2) und Standardeinstellungen an LAB- und QLD-Genomassemblierungen abgeglichen75. Alignments mit einer Kartierungsqualität von < 40 wurden vor nachgelagerten Analysen verworfen, um die Spezifität und Genauigkeit des Homöologen sicherzustellen. Die deepTools bamCompare82 wurden zur Quantifizierung und Visualisierung von Histonmarkierungen über Gene hinweg verwendet.

Bisulfit-Sequenzierungsproben für das gesamte Genom wurden mit genomischer DNA hergestellt, die aus denselben Geweben extrahiert wurde, die für die Chromatin-Immunpräzipitationssequenzierung verwendet wurden. Genomische Blatt-DNA aus drei Replikaten wurde mit einem DNeasy Plant Mini Kit (QIAGEN, 69104) extrahiert. Die Bisulfit-Umwandlung der DNA wurde mit dem EZ DNA Methylation-Gold-Kit (ZYMO, D5005) durchgeführt und die mit Bisulfit behandelten DNA-Bibliotheken wurden mit dem Illumina TruSeq DNA-Probenvorbereitungskit gemäß den Anweisungen des Herstellers erstellt. Die Bibliotheksvorbereitung und die anschließende Next-Generation-Sequenzierung wurden von Novogene HK Company Limited (Tochtergesellschaft in Hongkong) durchgeführt. Die Paired-End-Read-Sequenzierung (150 bp) der mit Bisulfit behandelten DNA-Bibliotheken wurde unter Verwendung eines Illumina HiSeqX-Systems durchgeführt.

Die hochwertigen Lesevorgänge aus Bisulfit-Sequenzierungsproben des gesamten Genoms wurden unter Verwendung der Standardeinstellungen des Bismark-Programms (v.0.19.0)83 an LAB- und QLD-Genomassemblierungen ausgerichtet. PCR-Duplikate wurden mit dem im Bismark-Programm (v.0.19.0) implementierten deduplicate_bismark entfernt. Die Lesevorgänge wurden als Kontrolle auf das Genom des nicht methylierten Chloroplasten abgebildet, um die Natriumbisulfit-Umwandlungsrate von nicht methylierten Cytosinen zu berechnen, die für alle Replikate (drei Replikate aus jedem LAB und QLD) > 99,9 % betrug. Der Cytosin-Methylierungsgrad wurde mit dem bismark_methylation_extractor in Bismark (v.0.19.0) berechnet. Das Methylierungsverhältnis von Cytosin wurde als Anzahl der methylierten Cytosine dividiert durch die Anzahl der Lesevorgänge, die diese Position abdecken, berechnet.

Das MCScanX-Toolkit84 wurde verwendet, um syntenische Blöcke innerhalb der Spezies mithilfe von Proteinsequenzen und chromosomalen Positionen von Genen zu identifizieren (e-Wert 1 × 10−10, max-target-seqs 6, Maskierung 1, max-hsps 1). SynVisio85, ein interaktives Multiskalen-Synteny-Visualisierungstool für McScanX, wurde verwendet, um die Kollinearität auf Genebene zu visualisieren. Gene in syntenischen Blöcken wurden als Homöologen identifiziert, und die Gene, die ihre homöologen Partner nicht finden konnten, wurden als Singletons identifiziert. Die durchschnittliche Transkripte pro Million (TPM)-Expression von Genen in jedem Gewebetyp wurde berechnet (durchschnittliche Expression pro Gewebe). Anschließend wurde anhand der durchschnittlichen Expression jedes Gens pro Gewebe die globale Expression über alle Gewebe hinweg berechnet. Für die Downstream-Analyse wurde ein globaler Ausdruck >0,5 TPM verwendet. Die Werte dieser kombinierten Analyse wurden verwendet, um die relative Ausprägung von Homöologen zu bestimmen. Die homöologen Paare wurden als ausgedrückt definiert, wenn die Summe der Homöologen des a- und b-Subgenoms > 0,5 TPM betrug. Diese Filterung umfasste Duplikatpaare, in denen nur ein einziger Homöologe exprimiert wurde. Um die relative Expression von Homöologen zu standardisieren, wurde der absolute TPM für jedes Gen innerhalb des Duplikatpaars wie folgt normalisiert. A und B stellen die Gene dar, die den A- und B-Homöologen paarweise entsprechen.

Relativer Ausdruck von A = TPM(A)/(TPM(A) + TPM(B))

Relativer Ausdruck von B = TPM(B)/(TPM(A) + TPM(B))

Der Kruskal-Wallis-Test wurde durchgeführt, um die homöologische Expressionsverzerrung zwischen Subgenomen statistisch zu bestimmen. Die Überrepräsentationsanalyse wurde mit dem exakten Fisher-Test durchgeführt. Alle Gene in N. benthamiana wurden mit der Blast2Go-Suite86 BLASTed, kartiert und annotiert und als Hintergrund für die Überrepräsentationsanalyse verwendet. Es wurden stark unterdrückte Gene in beiden Subgenomen untersucht. Gene mit einem P-Wert <0,05 galten als deutlich überrepräsentiert.

ERF189-, NBS-LRR-RPM1-like-, Anthocyanin-R2R3-Myb- und CYP82-Gene in N. benthamiana wurden basierend auf Sequenzhomologie unter Verwendung von N. attenuata-Proteinsequenzen identifiziert (http://nadh.ice.mpg.de/NaDH/others/data). als Abfragesequenzen für die tBLASTn-Funktion auf Apollo (https://www.nbenth.com). N. attenuata CYP82 (NiAv7g20333) wurde durch Sequenzähnlichkeit mit Tabak CYP82E4 identifiziert, einem nachgewiesenen Nikotin-Demethylase-Gen87. Phylogenetische Bäume wurden unter Verwendung der identifizierten Nukleotidsequenzen und ihrer verfügbaren Gegenstücke in anderen Nicotiana-Arten (N. attenuata, N. tabacum, N. sylvestris, N. tomentosiformis) erstellt und mithilfe von Muscle (v.3.8)88 ausgerichtet. Das beste Nukleotidsubstitutionsmodell wurde basierend auf jModeltest2 (v.2.1)89 geschätzt und für jede Genfamilie mit MrBayes (v.3.2.6)90 ein Baum erstellt.

Mit einem 35s-GFP-OCS-Konstrukt (pBEN0317) transformiertes Agrobacterium tumefaciens (GV3101) wurde in 4 Wochen alte N. benthamiana-Blätter infiltriert. Nach 5 Tagen wurden agroinfiltrierte Blätter gesammelt. Die gesamte genomische DNA wurde mit dem ISOLATE II Plant DNA Kit Bioline (BIO-52070) extrahiert und vor der Bibliotheksvorbereitung mit TruSeq DNA Library Prep Kits (FC-121-2001) gepoolt. Die Sequenzierung wurde mit der Illumina HiSeq 2000-Plattform durchgeführt. Paired-End-Lesevorgänge wurden mit Burrows-Wheeler Aligner (BWA-MEM) (v.0.7)91 auf den binären Vektor pBEN0317 abgebildet. Um die Transfer-DNA-Integrationsereignisse zu bestimmen, wurden alle Split-Reads, die die linken und rechten Ränder der T-DNA-Region teilweise überlappten, extrahiert und mit BLASTn gegen das N. benthamiana-Genom durchsucht. Lesevorgänge mit einer Identität von mehr als 85 % und einem e-Wert von weniger als 1 × 10–5 wurden als Transgen-Integrationsstellen mit hoher Zuverlässigkeit ausgewählt. Zur Identifizierung der fehlerhaften Lesevorgänge wurde ein anderer Ansatz verwendet. Reads wurden zunächst dem N. benthamiana-Genom zugeordnet und kartierte Reads, deren Partner nicht kartiert ist, wurden mit Samtools view80 extrahiert. Die gefilterte BAM-Datei wurde mit bedtools Convert BAM to FastQ92 in fastq konvertiert. Die Lesevorgänge wurden dann per BLAST auf den pBEN0317-Vektor übertragen. Die Reads, die auf Vektoren mit einem e-Wert von weniger als 1 × 10−5 und einem Alignment von mehr als 100 bp abgebildet wurden, wurden dann auf das N. benthamiana-Genom BLASTed. Lesevorgänge mit hoher Identität (>95 %) und >50 % Abdeckung wurden als integrierte T-DNA im Pflanzengenom identifiziert. Für die stabile Transformationsanalyse wurden Blattgewebe von 5 Wochen alten stabilen transgenen unabhängigen N. benthamiana-Linien gesammelt, die unter Verwendung von pFN117 (Cas9) und pUQC-GFP-(218) generiert wurden. Genomische DNA wurde nach der Cetyltrimethylammoniumbromid-Methode extrahiert. Es wurden verschachtelte, insertierungsspezifische Primer für die rechten Ränder (RB1, RB2 und RB3, RB2 und RB3; Tabelle 2) von pFN117 und pUQC-GFP-(218)-A entworfen. Beliebige degenerierte Primer und das Hochdurchsatz-Programm der thermischen asymmetrischen interlaced-Polymerase-Kettenreaktion (ht-TAIL-PCR) wurden von Singer und Burke93 beschrieben. Gereinigte PCR-Produkte wurden direkt mit dem RB3-Primer nach Sanger sequenziert und die Insertionsstellen wurden durch eine BLASTn-Suche im N. benthamiana-Genom identifiziert. Die Anzahl der stabilen und transienten T-DNA-Insertionsstellen, die Genkörper, Promotor, Terminator und TEs schneiden, wurde mit dem Bedtools Intersect Tool (v.2.30.0)92 bestimmt und die Länge bis zum nächstgelegenen Gen von der Insertionsstelle wurde mit berechnet RnaChipIntegrator (v.1.1.0) (https://github.com/fls-bioinformatics-core/RnaChipIntegrator). Der Z-Score-Test für zwei Populationsanteile wurde verwendet, um den signifikanten Unterschied zwischen 10-kb-, 10-20-kb-, 20-30-kb- und 30-40-kb-Intervallen aller stabilen, vorübergehenden Transgeninsertionsstellen und zufällig ausgewählten Stellen im Norden zu bestimmen . Benthamiana-Genom.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Portfolio Reporting Summary.

Auf die Genom- und Transkriptomassemblierungen von Nicotiana benthamiana sowie deren Anmerkungen kann unter https://www.nbenth.com zugegriffen werden. Die für die Genomassemblierung verwendeten Rohdaten wurden im NCBI Sequence Read Archive (SRA) unter BioProject PRJNA881799 hinterlegt. Konkret sind die PacBio-Daten für LAB und QLD unter den Zugangsdaten SRR21820240 bzw. SRR21820239 zu finden. Die HiC-Daten für LAB und QLD sind unter den Zugangsdaten SRR21820238 bzw. SRR21820237 verfügbar. Verwendete Datenbanken: KEGG (https://www.genome.jp/kegg/compound/), Metfrag (https://ipb-halle.github.io/MetFrag/projects/metfragweb/), PubChem-Massendatenbanken (ST3) ( https://pubchem.ncbi.nlm.nih.gov/), miRbase (Release 21; https://www.mirbase.org/) und Nicotiana attenuata Data Hub (http://nadh.ice.mpg.de/ NaDH/andere/Daten) Quelldaten werden mit diesem Dokument bereitgestellt.

Der zum Erhalten von Genomsequenzen auf Chromosomenebene verwendete Code kann aus dem folgenden GitHub-Repository bezogen werden: https://github.com/anjiyuan/Citrus. Der Circos-Plotter kann über https://bioweb01.qut.edu.au/circos-bigwig/ aufgerufen werden. Darüber hinaus kann auf den Synteny- und Punktplotter über https://bioweb01.qut.edu.au/syntenyViewer/ zugegriffen werden.

Knapp, S., Bohs, L., Nee, M. & Spooner, DM Solanaceae – ein Modell zur Verknüpfung von Genomik und Biodiversität.Comp. Funktion. Genomics 5, 285–291 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Narayan, RKJ Kern-DNA-Veränderungen, Genomdifferenzierung und Evolution bei Nicotiana (Solanaceae). Anlagensystem Entwicklung 157, 161–180 (1987).

Artikel CAS Google Scholar

Clarkson, JJ, Kelly, LJ, Leitch, AR, Knapp, S. & Chase, MW Evolution der nuklearen Glutaminsynthetase in Nicotiana: Phylogenetik und die Ursprünge allotetraploider und homoploider (diploider) Hybride. Mol. Phylogenet. Entwicklung 55, 99–112 (2010).

Artikel CAS PubMed Google Scholar

Marks, CE, Ladiges, PY & Newbigin, E. Karyotypische Variation im Nicotiana-Abschnitt Suaveolentes. Genet. Ressource. Ernteentwicklung. 58, 797–803 (2011).

Artikel Google Scholar

Bally, J. et al. Nicotiana paulineana, eine neue australische Art in der Nicotiana-Sektion Suaveolentes. Aust. Syst. Bot. 34, 477–484 (2021).

Artikel Google Scholar

Byrne, M. et al. Geburt eines Bioms: Einblicke in den Aufbau und die Erhaltung der Biota der australischen Trockenzone. Mol. Ökologisch. 17, 4398–4417 (2008).

Artikel CAS PubMed Google Scholar

Bally, J. et al. Der Aufstieg und Aufstieg von Nicotiana benthamiana: eine Pflanze aus allen Gründen. Annu. Rev. Phytopathol. 56, 405–426 (2018).

Artikel CAS PubMed Google Scholar

Schiavinato, M., Marcet-Houben, M., Dohm, JC, Gabaldón, T. & Himmelbauer, H. Elterlicher Ursprung des allotetraploiden Tabaks Nicotiana benthamiana. Pflanze J. 102, 541–554 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Schiavinato, M., Bodrug-Schepers, A., Dohm, JC & Himmelbauer, H. Subgenomentwicklung in allotetraploiden Pflanzen. Pflanze J. 106, 672–688 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Khafizova, G., Dobrynin, P., Polev, D. & Matveeva, T. Gesamtgenomsequenzierung von Nicotiana glauca. Vorabdruck bei bioRxiv https://doi.org/10.1101/211482 (2017).

Usade, B. et al. Das Genom und Metabolom des Tabakbaums Nicotiana glauca: ein potenzieller erneuerbarer Rohstoff für die Bioökonomie. Vorabdruck bei bioRxiv https://doi.org/10.1101/351429 (2018).

LeBlanc, Z., Waterhouse, P. & Bally, J. Pflanzenbasierte Impfstoffe: der Weg in die Zukunft? Viren 13, 5 (2020).

Artikel PubMed PubMed Central Google Scholar

Waterhouse, PM & Helliwell, CA Erforschung von Pflanzengenomen durch RNA-induzierte Gen-Stummschaltung. Nat. Rev. Genet. 4, 29–38 (2003).

Artikel CAS PubMed Google Scholar

Bally, J. et al. Die extremophile Nicotiana benthamiana hat die Virusabwehr gegen frühe Vitalität eingetauscht. Nat. Pflanzen 1, 15165 (2015).

Artikel CAS PubMed Google Scholar

Drapal, M., Enfissi, EMA & Fraser, PD Stoffwechselveränderungen in Blättern von N. tabacum und N. benthamiana während der Pflanzenentwicklung. J. Pflanzenphysiologie. 265, 153486 (2021).

Artikel CAS PubMed Google Scholar

Drapal, M., Enfissi, EMA & Fraser, PD Stoffwechseleffekte der Agrarinfiltration auf N.-benthamiana-Akzessionen. Transgene Res. 30, 303–315 (2021).

Artikel CAS PubMed PubMed Central Google Scholar

Steppuhn, A., Gase, K., Krock, B., Halitschke, R. & Baldwin, IT Die Abwehrfunktion von Nikotin in der Natur. PLoS Biol. 2, E217 (2004).

Artikel PubMed PubMed Central Google Scholar

de Boer, G. & Hanson, FE Fütterungsreaktionen auf Nachtschattengewächse durch Larven des Tabakschwärmers Manduca sexta. Entomol. Exp. Appl. 45, 123–131 (1987).

Artikel Google Scholar

Snook, ME et al. Hydroxygeranyllinalool-Glykoside aus Tabak zeigen eine antibiose Aktivität beim Tabakknospenwurm [Heliothis virescens (F.)]. J. Agrar. Lebensmittelchem. 45, 2299–2308 (1997).

Artikel CAS Google Scholar

Jassbi, AR, Zamanizadehnajari, S., Kessler, D. & Baldwin, IT Ein neues azyklisches Diterpenglycosid aus Nicotiana attenuata mit einer milden abschreckenden Wirkung auf die Fütterung von Manduca sexta-Larven. Z. Naturforsch. B 61, 1138–1142 (2006).

Artikel CAS Google Scholar

EST-Details – SGN-E1214852. Sol Genomics Network https://solgenomics.net/search/est.pl?request_id=SGN-E1214852&request_from=0&request_type=automatic&search=Search (abgerufen am 27. Juli 2023).

Nakasugi, K., Crowhurst, R., Bally, J. & Waterhouse, P. Kombination von Transkriptomassemblierungen mehrerer De-novo-Assembler in der allo-tetraploiden Pflanze Nicotiana benthamiana. PLoS ONE 9, e91776 (2014).

Artikel PubMed PubMed Central Google Scholar

Ruiz, MT, Voinnet, O. & Baulcombe, DC Initiierung und Aufrechterhaltung der virusinduzierten Gen-Stummschaltung. Plant Cell 10, 937–946 (1998).

Artikel CAS PubMed PubMed Central Google Scholar

Ou, S., Chen, J. & Jiang, N. Bewertung der Qualität der Genomassemblierung mithilfe des LTR Assembly Index (LAI). Nukleinsäuren Res. 46, e126 (2018).

PubMed PubMed Central Google Scholar

Howe, K. et al. Deutliche Verbesserung der Qualität von Genomassemblierungen durch Kuration. GigaScience 10, giaa153 (2021).

Artikel PubMed PubMed Central Google Scholar

Lawniczak, MKN et al. Standardempfehlungen für das Earth BioGenome Project. Proz. Natl Acad. Wissenschaft. USA 119, e2115639118 (2022).

Artikel PubMed PubMed Central Google Scholar

Philips, JG et al. Die weit verbreitete Linie Nicotiana benthamiana 16c weist ein ungewöhnliches T-DNA-Integrationsmuster einschließlich einer Transposonsequenz auf. PLoS ONE 12, e0171311 (2017).

Artikel PubMed PubMed Central Google Scholar

Lorenc, MT et al. Entdeckung von Einzelnukleotidpolymorphismen in komplexen Genomen mithilfe von SGSautoSNP. Biology 1, 370–382 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Qin, C. et al. Die Sequenzierung des gesamten Genoms von Kultur- und Wildpaprika bietet Einblicke in die Domestizierung und Spezialisierung von Capsicum. Proz. Natl Acad. Wissenschaft. USA 111, 5135–5140 (2014).

Artikel CAS PubMed PubMed Central Google Scholar

Dunn, NA et al. Apollo: Demokratisierung der Genomannotation. PLoS Comput. Biol. 15, e1006790 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Barchi, L. et al. Eine chromosomenverankerte Auberginen-Genomsequenz enthüllt wichtige Ereignisse in der Evolution der Nachtschattengewächse. Wissenschaft. Rep. 9, 11769 (2019).

Artikel PubMed PubMed Central Google Scholar

Edwards, KD et al. Ein Referenzgenom für Nicotiana tabacum ermöglicht das kartenbasierte Klonen homöologer Loci, die an der Effizienz der Stickstoffverwertung beteiligt sind. BMC Genomics 18, 448 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Brockmöller, T. et al. Nicotiana attenuata Data Hub (NaDH): eine integrative Plattform zur Erforschung genomischer, transkriptomischer und metabolomischer Daten in Wildtabak. BMC Genomics 18, 79 (2017).

Artikel PubMed PubMed Central Google Scholar

Xu, S. et al. Wildtabakgenome offenbaren die Entwicklung der Nikotinbiosynthese. Proz. Natl Acad. Wissenschaft. USA 114, 6133–6138 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Bandi, V. & Gutwin, C. Interative Erforschung der Genomkonservierung. In Proceedings of Graphic Interface 2020 (Canadian Human-Computer Communications Society, 2020).

Gaeta, RT & Chris Pires, J. Homoeologe Rekombination in Allopolyploiden: die polyploide Ratsche. Neues Phytol. 186, 18–28 (2010).

Artikel CAS PubMed Google Scholar

Qin, C. et al. Rollen der Dicer-ähnlichen Proteine ​​2 und 4 bei der intra- und interzellulären antiviralen Stummschaltung. Pflanzenphysiologie. 174, 1067–1081 (2017).

Artikel PubMed PubMed Central Google Scholar

Yang, S.-J., Carter, SA, Cole, AB, Cheng, N.-H. & Nelson, RS Eine natürliche Variante einer RNA-abhängigen RNA-Polymerase des Wirts wird mit einer erhöhten Anfälligkeit für Viren durch Nicotiana benthamiana in Verbindung gebracht. Proz. Natl Acad. Wissenschaft. USA 101, 6297–6302 (2004).

Artikel CAS PubMed PubMed Central Google Scholar

Grandbastien, M.-A. et al. Stressaktivierung und genomischer Einfluss von Tnt1-Retrotransposons in Solanaceae. Zytogenet. Genomres. 110, 229–241 (2005).

Artikel CAS PubMed Google Scholar

Kim, S. et al. Die Genomsequenz der scharfen Paprika liefert Einblicke in die Entwicklung der Schärfe bei Capsicum-Arten. Nat. Genet. 46, 270–278 (2014).

Artikel CAS PubMed Google Scholar

Kuang, H. et al. Identifizierung von Miniatur-Inverted-Repeat-Transponable-Elementen (MITEs) und Biogenese ihrer siRNAs in den Nachtschattengewächsen: neue funktionelle Implikationen für MITEs. Genomres. 19, 42–56 (2009).

Artikel CAS PubMed PubMed Central Google Scholar

Naito, K. et al. Unerwartete Folgen einer plötzlichen und massiven Transposon-Amplifikation auf die Reis-Genexpression. Natur 461, 1130–1134 (2009).

Artikel CAS PubMed Google Scholar

Liao, Y. et al. Die 3D-Architektur des Pfeffergenoms und seine Beziehung zu Funktion und Evolution. Nat. Komm. 13, 3479 (2022).

Artikel CAS PubMed PubMed Central Google Scholar

Lee, S.-I. & Kim, N.-S. Transponierbare Elemente und Variationen der Genomgröße in Pflanzen. Genomik informieren. 12, 87–97 (2014).

Artikel PubMed PubMed Central Google Scholar

Devos, KM, Brown, JKM & Bennetzen, JL Die Reduzierung der Genomgröße durch illegitime Rekombination wirkt der Genomexpansion bei Arabidopsis entgegen. Genomres. 12, 1075–1079 (2002).

Artikel CAS PubMed PubMed Central Google Scholar

An, J. et al. J-Circos: ein interaktiver Circos-Plotter. Bioinformatik 31, 1463–1465 (2015).

Artikel CAS PubMed Google Scholar

Mitiouchkina, T. et al. Pflanzen mit genetisch kodierter Autolumineszenz. Nat. Biotechnologie. 38, 944–946 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Brophy, JAN et al. Synthetische genetische Schaltkreise als Mittel zur Neuprogrammierung von Pflanzenwurzeln. Wissenschaft 377, 747–751 (2022).

Artikel CAS PubMed Google Scholar

Bernabé-Orts, JM et al. Ein Speicherschalter für die synthetische Pflanzenbiologie basierend auf dem Phagen-ϕC31-Integrationssystem. Nukleinsäuren Res. 48, 3379–3394 (2020).

Artikel PubMed PubMed Central Google Scholar

Bombarely, A. et al. Ein Entwurf einer Genomsequenz von Nicotiana benthamiana zur Verbesserung der molekularen Pflanzen-Mikroben-Biologieforschung. Mol. Anlage. Mikroben-Interaktion. 25, 1523–1530 (2012).

Artikel CAS PubMed Google Scholar

Sulli, M. et al. Eine rekombinante Inzuchtpopulation von Auberginen ermöglicht die Entdeckung metabolischer QTLs, die die Ernährungsqualität von Früchten steuern. Vorderseite. Pflanzenwissenschaft. 12, 638195 (2021).

Artikel PubMed PubMed Central Google Scholar

Ranawaka, B., Tanurdzic, M., Waterhouse, P. & Naim, F. Eine optimierte Chromatin-Immunpräzipitationsmethode (ChIP) für stärkehaltige Blätter von Nicotiana benthamiana, um Histonmodifikationen einer allotetraploiden Pflanze zu untersuchen. Mol. Biol. Rep. 47, 9499–9509 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Rhie, A., Walenz, BP, Koren, S. & Phillippy, AM Merqury: Referenzfreie Qualitäts-, Vollständigkeits- und Phasenbewertung für Genomassemblierungen. Genombiol. 21, 245 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Ou, S. et al. Benchmarking transponierbarer Elementannotationsmethoden zur Erstellung einer optimierten, umfassenden Pipeline. Genombiol. 20, 275 (2019).

Artikel CAS PubMed PubMed Central Google Scholar

Ou, S. & Jiang, N. LTR_retriever: ein hochpräzises und empfindliches Programm zur Identifizierung langer terminaler Wiederholungs-Retrotransposons. Pflanzenphysiologie. 176, 1410–1422 (2018).

Artikel CAS PubMed Google Scholar

Koren, S. et al. Canu: Skalierbare und genaue Long-Read-Assemblierung durch adaptive k-mer-Gewichtung und Wiederholungstrennung.Genome Res. 27, 722–736 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Ye, C., Ma, ZS, Cannon, CH, Pop, M. & Yu, DW SparseAssembler: De-novo-Assemblierung mit dem Sparse-de-Bruijn-Graphen. Vorabdruck unter https://doi.org/10.48550/arXiv.1106.2603 (2011).

Ye, C., Hill, CM, Wu, S., Ruan, J. & Ma, Z. DBG2OLC: Effiziente Assemblierung großer Genome unter Verwendung langer fehlerhafter Lesevorgänge der Sequenzierungstechnologien der dritten Generation. Wissenschaft. Rep. 6, 3 (2016).

Google Scholar

Vaser, R., Sović, I., Nagarajan, N. & Šikić, M. Schnelle und genaue De-novo-Genomassemblierung aus langen unkorrigierten Lesevorgängen. Genomres. 27, 737–746 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Liu, J. et al. Lückenlose Assemblierung von Maischromosomen mithilfe von Long-Read-Technologien. Genombiol. 21, 121 (2020).

Artikel CAS PubMed PubMed Central Google Scholar

Durand, NC et al. Juicer bietet ein Ein-Klick-System zur Analyse von Hi-C-Experimenten mit Schleifenauflösung. Zellsystem 3, 95–98 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Dudchenko, O. et al. Die De-novo-Assemblierung des Genoms mithilfe von Hi-C führt zu Gerüsten mit Chromosomenlänge. Wissenschaft 356, 92–95 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Dong, P. et al. 3D-Chromatinarchitektur großer Pflanzengenome, bestimmt durch lokale A/B-Kompartimente. Mol. Werk 10, 1497–1509 (2017).

Artikel CAS PubMed Google Scholar

Durand, NC et al. Juicebox bietet ein Visualisierungssystem für Hi-C-Kontaktkarten mit unbegrenztem Zoom. Zellsystem 3, 99–101 (2016).

Artikel CAS PubMed PubMed Central Google Scholar

Xu, G.-CE et al. LR_Gapcloser: ein auf Kachelpfaden basierender Lückenschließer, der lange Lesevorgänge verwendet, um die Genomassemblierung abzuschließen. GigaScience 8, giy157 (2019).

Artikel PubMed Google Scholar

Walker, BJ et al. Pilon: ein integriertes Tool zur umfassenden Erkennung mikrobieller Varianten und zur Verbesserung der Genomassemblierung. PLoS ONE 9, e112963 (2014).

Artikel PubMed PubMed Central Google Scholar

Kim, D., Langmead, B. & Salzberg, SL HISAT: ein schnell gespleißter Aligner mit geringem Speicherbedarf. Nat. Methoden 12, 357–360 (2015).

Artikel CAS PubMed PubMed Central Google Scholar

Shao, M. & Kingsford, C. Präzise Zusammenstellung von Transkripten durch phasenerhaltende Graphenzerlegung. Nat. Biotechnologie. 35, 1167–1169 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Stanke, M. & Morgenstern, B. AUGUSTUS: ein Webserver zur Genvorhersage in Eukaryoten, der benutzerdefinierte Einschränkungen ermöglicht.Nucleic Acids Res. 33, W309–W312 (2005).

Artikel Google Scholar

Dainat, J. AGAT: ein weiteres Gff-Analyse-Toolkit zur Verarbeitung von Anmerkungen in jedem GTF/GFF-Format. Version 0.4.10-5281 (2020); https://zenodo.org/record/3877441

Altschul, SF, Gish, W., Miller, W., Myers, EW & Lipman, DJ Grundlegendes Suchwerkzeug für die lokale Ausrichtung. J. Mol. Biol. 215, 403–410 (1990).

Artikel CAS PubMed Google Scholar

Manni, M., Berkeley, MR, Seppey, M. & Zdobnov, EM BUSCO: Bewertung der Qualität genomischer Daten und darüber hinaus. Curr. Protokoll. 1, e323 (2021).

Artikel PubMed Google Scholar

Emms, DM & Kelly, S. OrthoFinder: Phylogenetische Orthologie-Inferenz für die vergleichende Genomik. Genombiol. 20, 238 (2019).

Artikel PubMed PubMed Central Google Scholar

Conway, JR, Lex, A. & Gehlenborg, N. UpSetR: ein R-Paket zur Visualisierung sich überschneidender Mengen und ihrer Eigenschaften. Bioinformatik 33, 2938–2940 (2017).

Artikel CAS PubMed PubMed Central Google Scholar

Langmead, B. & Salzberg, SL Schnelle Lücken-Lese-Ausrichtung mit Bowtie 2. Nat. Methoden 9, 357–359 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

An, J., Lai, J., Sajjanhar, A., Lehman, ML & Nelson, CC miRPlant: ein integriertes Tool zur Identifizierung pflanzlicher miRNA aus RNA-Sequenzierungsdaten. BMC Bioinformatics 15, 275 (2014).

Artikel PubMed PubMed Central Google Scholar

Huen, A., Bally, J. & Smith, P. Identifizierung und Charakterisierung von microRNAs und ihren Zielgenen in phosphatarmer Nicotiana benthamiana durch kleine RNA-Tiefensequenzierung und 5′-RACE-Analyse. BMC Genomics 19, 940 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Baksa, I. et al. Identifizierung von Nicotiana-benthamiana-microRNAs und ihren Zielen mittels Hochdurchsatzsequenzierung und Degradomanalyse. BMC Genomics 16, 1025 (2015).

Artikel PubMed PubMed Central Google Scholar

Langmead, B., Wilks, C., Antonescu, V. & Charles, R. Skalierung von Lese-Alignern auf Hunderte von Threads auf Allzweckprozessoren. Bioinformatik 35, 421–432 (2019).

Artikel CAS PubMed Google Scholar

Li, H. et al. Das Sequence Alignment/Map-Format und SAMtools. Bioinformatik 25, 2078–2079 (2009).

Artikel PubMed PubMed Central Google Scholar

Afgan, E. et al. Die Galaxy-Plattform für zugängliche, reproduzierbare und kollaborative biomedizinische Analysen: Update 2018. Nukleinsäuren Res. 46, W537–W544 (2018).

Artikel CAS PubMed PubMed Central Google Scholar

Ramírez, F. et al. deepTools2: ein Webserver der nächsten Generation für die Deep-Sequencing-Datenanalyse. Nukleinsäuren Res. 44, W160–W165 (2016).

Artikel PubMed PubMed Central Google Scholar

Krueger, F. & Andrews, SR Bismark: ein flexibler Aligner und Methylierungs-Caller für Bisulfit-Seq-Anwendungen. Bioinformatik 27, 1571–1572 (2011).

Artikel CAS PubMed PubMed Central Google Scholar

Wang, Y. et al. MCScanX: ein Toolkit zur Erkennung und evolutionären Analyse der Syntenie und Kollinearität von Genen. Nukleinsäuren Res. 40, e49 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Bandi, V. et al. Visualisierungstools für die Genomkonservierung. Methoden Mol. Biol. 2443, 285–308 (2022).

Artikel PubMed Google Scholar

Götz, S. et al. Funktionale Annotation und Data Mining mit hohem Durchsatz mit der Blast2GO-Suite. Nukleinsäuren Res. 36, 3420–3435 (2008).

Artikel PubMed PubMed Central Google Scholar

Siminszky, B., Gavilano, L., Bowen, SW & Dewey, RE Die Umwandlung von Nikotin in Nornikotin in Nicotiana tabacum wird durch CYP82E4, eine Cytochrom-P450-Monooxygenase, vermittelt. Proz. Natl Acad. Wissenschaft. USA 102, 14919–14924 (2005).

Artikel CAS PubMed PubMed Central Google Scholar

Edgar, SM & Theriot, EC Phylogenie von Aulacoseira (Bacillariophyta) basierend auf Molekülen und Morphologie. J. Phycol. 40, 772–788 (2004).

Artikel CAS Google Scholar

Darriba, D., Taboada, GL, Doallo, R. & Posada, D. jModelTest 2: mehr Modelle, neue Heuristiken und paralleles Rechnen. Nat. Methods 9, 772 (2012).

Artikel CAS PubMed PubMed Central Google Scholar

Ronquist, F. et al. MrBayes 3.2: effiziente bayesianische phylogenetische Inferenz und Modellauswahl über einen großen Modellraum. Syst. Biol. 61, 539–542 (2012).

Artikel PubMed PubMed Central Google Scholar

Li, H. & Durbin, R. Schnelle und genaue Langzeitausrichtung mit Burrows-Wheeler-Transformation. Bioinformatik 26, 589–595 (2010).

Artikel PubMed PubMed Central Google Scholar

Quinlan, AR & Hall, IM BEDTools: eine flexible Suite von Dienstprogrammen zum Vergleich genomischer Merkmale. Bioinformatik 26, 841–842 (2010).

Artikel CAS PubMed PubMed Central Google Scholar

Singer, T. & Burke, E. Hochdurchsatz-TAIL-PCR als Werkzeug zur Identifizierung flankierender DNA-Insertionen. Methoden Mol. Biol. 236, 241–272 (2003).

CAS PubMed Google Scholar

Referenzen herunterladen

Wir danken dem Team für Hochleistungsrechnen der Queensland University of Technology für ihre Unterstützung bei der Genomassemblierung und dem Hosting der Genombrowser. Die Arbeit wurde durch das Australian Research Council Federation Fellowship, Laureate Fellowship, Discovery und Centre of Excellence Awards (Zuschussnummern FF0776510 für PMW, FL160100155 für PMW, DP170103960 für PMW und CE200100015 für PMW) und das Horizon 2020-Programm der Europäischen Kommission, Projekt „Developing Multipurpose“, unterstützt „Nicotiana Crops for Molecular Farming using New Plant Breeding Techniques (NEWCOTIANA)“, Fördervereinbarung Nr. 760331 an DO, AB, GG und PMW und Grant-Nr. 101094738 an GG

Hyungtaek Jung

Aktuelle Adresse: Centre for Animal Science, Queensland Alliance for Agriculture and Food Innovation (QAAFI), The University of Queensland, Brisbane, Queensland, Australien

Fatima Naim

Aktuelle Adresse: Centre for Crop and Disease Management, School of Molecular and Life Sciences, Curtin University, Bentley, Western Australia, Australien

Diese Autoren haben gleichermaßen beigetragen: Buddhini Ranawaka, Jiyuan An.

Zentrum für Landwirtschaft und Bioökonomie, Queensland University of Technology (QUT), Brisbane, Queensland, Australien

Buddhini Ranawaka, Jiyuan An, Michael T. Lawrence, Hyungtaek Jung, Sally Roden, Satomi Hayashi, Leila Asadyar, Zacharie LeBlanc, Zuba Ahmed, Fatima Naim, Samanta Bolzan de Fields, Tal Cooper, Philip F. de Philippes, Julia Bally und Peter M. Waterhouse

ARC-Kompetenzzentrum für Pflanzenerfolg in Natur und Landwirtschaft, Brisbane, Queensland, Australien

Buddhini Ranawaka, Jiyuan An, Sally Roden, Satomi Hayashi, Leila Asadyar, Zuba Ahmed, Julia Bally, Christopher Winefield und Peter M. Waterhouse

Italienische Nationalagentur für neue Technologien, Energie und nachhaltige Wirtschaftsentwicklung (ENEA), Forschungszentrum Casaccia, Rom, Italien

Maria Sulli, Giuseppe Aprea und Giovanni Giuliano

Genomics Technologies, Corteva Agriscience, Johnston, IA, USA

Victor Llaca

Staatliches Schlüssellabor für Agrarbiotechnologie, School of Life Sciences, Chinesische Universität Hongkong, Hongkong, China

Pengfei Dong & Silin Zhong

Institut für Molekular- und Zellbiologie der Pflanzen (IBMCP), Höherer Rat für wissenschaftliche Forschung (CSIC), Polytechnische Universität Valencia, Valencia, Spanien

Victor Garcia-Carpintero, Diego Orzaez und Aureliano Bombarely

Fakultät für Biologie und Umweltwissenschaften, Queensland University of Technology (QUT), Brisbane, Queensland, Australien

Kevin J. Dudley

QUT Central Analytical Research Facility, Queensland University of Technology (QUT), Brisbane, Queensland, Australien

Kevin J. Dudley

Universität Mailand, Mailand, Italien

Aureliano Bombarely

Abteilung für Wein, Lebensmittel und Molekulare Biowissenschaften, Lincoln University, Lincoln, Neuseeland

Christopher Winefield

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

BR, JA, MTL, HJ, KJD, JB, DO, GG, AB, CW und PMW haben das Projekt konzipiert und gestaltet. Die Assemblierung und Annotation des Genoms wurde von JA, MTL, HJ, BR, VL, GA und VG-C durchgeführt. HiC-Daten gesammelt von PD, SZ, SBDC und JB. Genbearbeitung durch SR, FN und SH. GFP, Anthocyane, flüchtige Stoffe und Antikörperexpression durchgeführt von LA, ZA, SR, BR, FFdF und ZL. Stoffwechselanalyse durch MS, BR und GG. Chromosomenzuordnung zu Subgenomen und Syntenieanalyse durch JA, TC, MTL und PMWPMW, BR, JA und GG haben die ersten Entwürfe des Manuskripts geschrieben und alle Autoren haben das Manuskript überprüft und bearbeitet und die endgültige Version genehmigt.

Korrespondenz mit Jiyuan An, Christopher Winefield oder Peter M. Waterhouse.

Die Autoren geben an, dass keine Interessenkonflikte bestehen.

Nature Plants dankt Ed Rybicki, Yongbiao Xue und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

Profile der durchschnittlichen Emission ausgewählter mutmaßlich insektenanlockender flüchtiger Verbindungen und Nikotin (eine Abwehrverbindung) im grünen Blatt- und Blütenraum von LAB und QLD über einen Zeitraum von 24 Stunden. (A) LAB-Blumenkopfraum (B) QLD-Blumenkopfraum (C) LAB-Grünblatt-Kopfraum (D) QLD-Grünblatt-Kopfraum. Diese Ergebnisse deuten darauf hin, dass QLD-Blüten, aber nicht LAB-Blüten oder LAB- und QLD-Blätter, über Nacht (18:00–8:00 Uhr) Benzylalkohol abgeben. Fehlerbalken stellen den Standardfehler des Mittelwerts dar (n = 4 pro Stichprobenpunkt).

Unterschiedlich akkumulierte Metaboliten in semipolaren Extrakten von N. benthamiana LAB vs. QLD-Geweben, analysiert durch Flüssigkeitschromatographie/hochauflösende Massenspektrometrie (LC/HESI/MS). Der Orange/Blau-Grad zeigt die relativen Werte in LAB vs. QLD an, grau schattierte Bereiche zeigen keine erkennbaren Werte.

Kladogramm der Beziehungen der Nikotin-Demethylase-Gene in S. lycopersicum, N. sylvestris, N. tabacum, N. tomentosiformis, N. attenuata und N. benthamiana (LAB und QLD). Die hervorgehobene Gruppe enthält das N. benthamiana CYP82E2-Gen. Gene ohne Sterne stellen Proteine ​​mit nicht charakterisierter Nikotin-N-Demethylase-Aktivität dar. (B) Lage der bZIP-Transkriptionsfaktor-Bindungsmotive (rote und violette Dreiecke) im LAB- und QLD-2-kb-Promotor. Das untere Feld zeigt die Transversion im dritten TF-Bindungsmotiv (violette Dreiecke), die wahrscheinlich die TF-Bindung und die Expression von CYP82E2 in LAB hemmt. (C) Genexpression (TPM) von CYP82E2 in Blatt- und Blütengeweben von LAB und QLD. Fehlerbalken stellen den Standardfehler des Mittelwerts dar (n=3 biologisch unabhängige Blüten- und Blattproben von LAB und QLD).

(a) Diagramm der Kontaktmatrizen von LAB- und QLD-Baugruppen. Juicebox-Diagramm aus der HiC-Analyse, das die Auflösung in 19 zusammenhängende Elemente (Chromosomen) sowohl für LAB- als auch für QLD-Anordnungen zeigt. (b) Syntenie von Selbstinkompatibilität (S)-ähnlichen Loci in Tomaten, N. attenuata, N. tabacum, Petunien, LAB und QLD, Cladogramm von Protein-Gensequenzähnlichkeiten und gewebespezifischer mRNA-Expression des LAB-S-Locus. Genanordnung und Beziehungen in Cartoon-Form der Gene im hochrekombinogenen S-Locus (bestehend aus einer S-RNAse und damit verbundenen mehreren Kopien von F-Box-Proteinen (SLF)) in den fortschrittlichsten Genomanordnungen von Tomaten, N. attenuata, N.tabacum, Petunia, LAB und QLD. Die Farben der Gene stellen ihre Beziehungen zwischen den Arten dar, wie im Kladogramm angegeben. Die Analyse zeigt die Kontiguität des S-Locus in Tomaten, LAB und QLD und die fragmentierte Natur des Locus in N. attenuata und Petunia axillaris aufgrund ihrer Anwesenheit auf kleinen Gerüsten und der unvollständigen Anordnung von Ch22 in N. tabacum. Gewebeexpressionsdaten für LAB zeigen, dass das dazwischenliegende Gen 16g24630 in allen fünf untersuchten Geweben exprimiert wird, die S-RNAse- und SLF-Gene jedoch nur im Blütengewebe exprimiert werden, wie es für einen mit Blumeninkompatibilität assoziierten Locus erwartet wird. Abstände zwischen Genen werden in MB angegeben.

Die Anzahl der identifizierten miRNA-Familien in LAB und QLD, die mit drei Solanaceae-Pflanzen (A. attenuata, S. lycopersicum und S. tuberosum) und der gut untersuchten Pflanze Arabidopsis (A. thaliana) gemeinsam sind, wird in einem Venn-Diagramm dargestellt. Die Abbildung zeigt, dass die wichtigsten miRNAs in der am häufigsten verwandten Pflanze, N. attenuata, sowohl in LAB als auch in QLD identifiziert wurden. Es wurden viele potenzielle miRNAs entdeckt, die bisher nicht identifiziert wurden. Teilabbildung (a) zeigt die überlappende Anzahl identifizierter miRNAs in LAB, die mit den anderen vier Arten geteilt werden. Unterabbildung (b) zeigt die identifizierten miRNAs in QLD.

Vergleich der Transformationseffizienzen von LAB-, QLD- und Northern Territory (NT)-Beitritten. (a) Regeneration, Selektion, Sprossentwicklung und Wurzelentwicklung der Ökotypen LAB, NT und QLD nach der Transformation mit einer 35S:Cas9-Kassette und einem selektierbaren Kanamycin-Marker (Maßstabsbalken entspricht 1 cm). Die Daten oben im Bild zeigen den Fortschritt der Transformation an. (b) Vergleich der Zeit, die für die Regeneration, das Wachstum (1–2 cm lange Triebe) und die Wurzelbildung von LAB, QLD und NT benötigt wird. Zur Bestimmung der Signifikanzunterschiede wurde ein zweiseitiger ANOVA-Test durchgeführt. (Die Daten werden als Mittelwerte +/− Standardfehler (n = 3 biologisch unabhängige Proben) dargestellt. (C) Vergleich der Regenerationshäufigkeit und Transformationseffizienz von LAB, QLD und NT. Zur Bestimmung wurde ein zweiseitiger ANOVA-Test ohne Transformation durchgeführt Signifikanzunterschiede zwischen prozentualen Daten, die aus Zähldaten abgeleitet wurden. Zur Berechnung der Transformationseffizienz wurden unabhängige positive Transformanten von LAB n=72, QLD n=74 und NT n=21 (eine einzelne Schwesterpflanze, die von einem einzelnen Kallus stammt) verwendet.

(a) Das grundlegende Editierungskonstrukt (mit Kanamycin-Selektion), das zur Transformation von LAB- oder QLD-Geweben verwendet wird. Die beiden Guide-(g)RNA-Sequenzen wurden zwischen den tRNA-Verarbeitungseinheiten platziert (in Panel A als Spacer-Sequenzen 1 und 2 angegeben). Innerhalb desselben Zielgens wurden zwei Stellen ausgewählt, die normalerweise etwa 200 Nukleotide voneinander entfernt waren, und führten entweder zu einem Ausfall der dazwischenliegenden DNA-Sequenz im Genom oder zu einer ungenauen Reparatur einer oder beider Stellen. (b) Phänotypen von QLD-Knockouts (ko) von RDR1, infiziert mit Tabakmosaikvirus (TMV), RDR6 und Phytoen-Desaturase (PDS) und LAB-Knockout von RDR2. Die Stummschaltung von PDS in QLD zielte auf zwei Homöologen gleichzeitig ab, um eine biallelische Stummschaltung beider Gene in der T0-Generation zu erreichen. Verwendete gRNA-Sequenzen: RNA-abhängige RNA-Polymerase (NbRDR1): TAAATAGTACAGTTTCTCCA; GACACTCAAAGTTTCTCTGG. NbRDR2: CCACTCCCAACGTAGATAAG; GTGTTCCGAAATGTGCTGCA. NbRDR6: CTTACTTAGAAGTCATCAGG; CTGCAACAGTATTACCAAAG. Phytoen-Desaturase (NbPDS) TCACAAACCGATATTGCTGG; GAGCTTCAGGAAAATCAAAG. (c) Vergleich der Bearbeitungseffizienz von LAB und QLD. Die Bearbeitungseffizienz in LAB und QLD wurde mithilfe der an RNAi beteiligten NbRDR-Gene bestimmt.

(A1) Syntenieanalyse des ERF-Locus IX in Tomate, N. obtusifolia, LAB und QLD zeigt linienspezifische Tandemduplikationen von ERF189s, fortgeschrittene Diploidisierung durch Verlust der Genfunktion und eine Inversion zwischen LAB und QLD auf chr 14, flankiert von neu eingefügte Copia-Elemente. Funktionelle Gene werden grün dargestellt; Nichtfunktionelle/Pseudogene sind blau. Gypsy, Copia und LTRs werden als gelbe, olivgrüne bzw. rote Pfeile angezeigt. Die Schattierung zeigt die orthologischen Beziehungen der ERF189-Gene zwischen verschiedenen syntenischen Blöcken an. Der invertierte Bereich des LAB-Chromosoms 14 und die Gypsy- und Copia-Landschaft im blauen Kasten sind im zweiten Bild (A2) vergrößert. Das dritte Feld (A3) vergrößert den durch ein rotes Kästchen in (A2) gekennzeichneten Bereich weiter. Das vierte Panel (A4) zeigt die epigenetische Landschaft (H3K4me3, H3K9me2 und Cytosin-Methylierung) und die Expression ausgewählter ERF189-Gene in LAB. Für H3K4me3 sind die mit H3K9me2 angereicherten Regionen in Blau und das Fehlen einer Histonmodifikation in Rot dargestellt. Methylierte Cytosine werden als blaue Balken dargestellt. (A5) Gewebespezifische Genexpression der Ancestral-Gene (die beiden Gene ganz links und ganz rechts in N. obtusifolia grün dargestellt) und „Expansion“-Gene (die drei grünen Gene in der Mitte von N. obtusifolia). (B1) Die Syntenieanalyse des AN-ähnlichen Locus in Tomate, LAB und QLD zeigt eine Tandem-Duplikation von SlAN2-ähnlichen MYB-Genen in LAB und QLD mit Verlust der Genfunktion von 1 Kopie in QLD (Bur1) und beiden Kopien (Bur 1 & 2) im LABOR. Der Verlust von Bur2 in LAB ist mit einem neu eingefügten Copia-Element verbunden. Funktionelle Gene sind hellgrün dargestellt, nichtfunktionale/Pseudogene sind dunkelgrün. Gypsy, Copia und LTRs werden als gelbe, olivgrüne bzw. rote Pfeile angezeigt. Die Schattierung zeigt die orthologischen Beziehungen an. Die Gypsy- und Copia-Landschaft im blauen Feld ist im zweiten Panel (B2) vergrößert dargestellt. Das dritte Panel (B3) zeigt die Aminosäureveränderung in LAB Bur2, die seine bHLH-Bindungsstelle verändert. (B4) zeigt, dass die Funktion von Bur1 in LAB, QLD und NT fehlerhaft ist und dass Bur2 in QLD und NT vollständig aktiv ist und durch gleichzeitige Überexpression von bHLH in LAB teilweise wiederhergestellt werden kann. Bur3 ist nur in NT funktionsfähig. (B5) Konzentrationen verschiedener Anthocyane in LAB- und QLD-Blättern nach vorübergehender Expression von AcMYB110 (einem AN-ähnlichen MYB aus Kiwis) oder QLD Bur2. Zum Vergleich wurden die Anthocyanspiegel in NT gemessen, das mit einem AcMYB110-Konstrukt stabil transformiert war.

(a) Syntenie von RPM1-ähnlichen Loci in Tomaten, N. attenuata, N. tabacum, LAB und QLD. (b) Syntenie eines Terpen-Biosynthesewegs Cytochrom P450-Locus in N. attenuata, LAB und QLD. Genanordnung in Cartoon-Form, die RPM1-ähnliche Bakterienresistenzgene und CYP736A-ähnliche Gene darstellt (funktionell – hellgrün), möglicherweise funktionsfähig (dunkelgrün), defekt/Pseudogene (blau). In (A) sind die Abstände zwischen den Genen angegeben (schwarzer Text) < 15 kbp; (roter Text) >15 kbp und die umgebenden syntenischen Gene werden in Orange, Lila, Gelb und Braun angezeigt. Orthologie-/Homologiebeziehungen werden durch farbige Schattierung angezeigt. In (B) sind die Abstände zwischen den Genen angegeben (schwarzer Text) < 50 kbp; (roter Text) >50 kbp. TE-Annotationsspuren für LAB und QLD wurden unter Verwendung von Annotationsdaten aus der EDTA TE-Annotationspipeline (siehe Online-Methoden) und der Geneious Prime-Software (Geneious Prime 2023.0.1; https://www.geneious.com) erstellt. Es werden nur LTR-transponierbare Elemente angezeigt. Gelbe Blöcke stehen für GYPSY-Elemente und grüne Blöcke für COPIA-Elemente. Die Größe jedes Blocks ist proportional zur Anzahl der für dieses Element annotierten Basenpaare. Rote Dreiecke stellen LTR-Wiederholungsbereiche dar, die entweder ein GYPSY- oder COPIA-Element flankieren. Diese Elemente dürften nahezu vollständig sein und können als mögliche autonome Elemente betrachtet werden. Die rechteckigen roten Blöcke flankieren unbekannte LTR-TE-Elemente. Unbekannte TEs sind Elemente, die als LTR-Element erkannt werden, aber aufgrund von Unregelmäßigkeiten in den internen Sequenzen dieses Elements nicht als COPIA- oder GYPSY-Element klassifiziert werden können. Dabei handelt es sich wahrscheinlich um nicht-autonome Elemente. Bei den Elementen, die nicht von LTR-Sequenzen flankiert werden, handelt es sich um stark fragmentierte, nichtfunktionale Elemente. Die blauen rechteckigen Kästchen markieren die Position der Gene, die in den Spuren über und unter den TE-Annotationsspuren annotiert sind.

Ergänzende Abbildungen. 1–13.

Ergänzende Tabelle 1 Morphologische, entwicklungsbedingte und metabolische Unterschiede zwischen LAB und QLD. Ergänzende Tabelle 2 Identifizierung unterschiedlich exprimierter semipolarer Metaboliten in LAB vs. QLD. Ergänzungstabelle 3 Größe und Anzahl der Gene in jedem Chromosom in den LAB- und QLD-Anordnungen. Ergänzungstabelle 4 Alle exprimierten Gene in LAB. Ergänzungstabelle 5 Alle exprimierten Gene in QLD. Ergänzende Tabelle 6 Qualitätsstatistiken der LAB- und QLD-Baugruppen. Ergänzende Tabelle 7A Kartierung von Genen in bestimmten Solanacae-Arten mit LAB, um den Prozentsatz der Gene in LAB mit Orthologen in diesen Arten zu ermitteln. Ergänzende Tabelle 7B Proteinclusteranalyse. Ergänzende Tabelle 7C: Merkmale und Quellen der für Vergleichsanalysen verwendeten Genome. Ergänzende Tabelle 8A Exprimierte miRNAs in LAB. Ergänzende Tabelle 8B Exprimierte miRNAs in QLD. Ergänzende Tabelle 8C Vollständige Liste potenzieller miRNAs in LAB. Ergänzende Tabelle 8D Vollständige Liste potenzieller miRNAs in LAB. Ergänzende Tabelle 8E Pflanzenarten, die in miRPlant-Analysen verwendet werden. Ergänzende Tabelle 9 SNPs zwischen verschiedenen sequenzierten N.-benthamiana-Akzessionen. Ergänzende Tabelle 10 Anzahl homöologe Gene unter den Chromosomen von LAB, N. attenuata und den N. sylvestris- und N. tomentosiformis-Subgenomen von N. tabacum. Ergänzende Tabelle 11A Verteilung der homöologen LAB-Gene über die Chromosomen der Subgenome. Ergänzende Tabelle 11B Verteilung der homöologen QLD-Gene über die Chromosomen der Subgenome. Ergänzende Tabelle 11C Homöologen, die in Partner-Subgenomen in LAB vorhanden sind. Ergänzende Tabelle 11D Homöologen sind im Partner-Subgenom, aber nicht auf den Partner-Chromosomen im LAB vorhanden. Ergänzende Tabelle 11E Homöologen, die in LAB auf demselben Subgenom vorhanden sind. Ergänzende Tabelle 11F Homöologen, die im Partner-Subgenom in QLD vorhanden sind. Ergänzende Tabelle 11G Homöologen sind im Subgenom des Partners, aber nicht auf den Chromosomen des Partners in QLD vorhanden. Ergänzungstabelle 11H Homöologen, die in QLD auf demselben Subgenom vorhanden sind. Ergänzende Tabelle 12: Erkennung homöologischer Expressionsmuster zur Bewertung der Subgenom-Dominanz.

Unbearbeitete SDS–Seite.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht gesetzlich zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Ranawaka, B., An, J., Lorenc, MT et al. Eine multiomische Nicotiana-Benthamiana-Ressource für Grundlagenforschung und Biotechnologie. Nat. Pflanzen (2023). https://doi.org/10.1038/s41477-023-01489-8

Zitat herunterladen

Eingegangen: 01. Februar 2023

Angenommen: 11. Juli 2023

Veröffentlicht: 10. August 2023

DOI: https://doi.org/10.1038/s41477-023-01489-8

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt