Blick ins Buch

Bioinformatik (eBook)

Grundlagen, Algorithmen, Anwendungen

Rainer Merkl (Autor)

eBook Download: EPUB

2022 | 4. Auflage
752 Seiten
Wiley-VCH (Verlag)
978-3-527-83389-4 (ISBN)

Lese- und Medienproben

Ebook-Leseprobe (EPUB)

Bioinformatik

Der Marktführer bei den Bioinformatiklehrbüchern in neuer Auflage und mit dem neuen Thema Molekulardynamik

Bioinformatik ist eine Kerndisziplin in den modernen Biowssenschaften, von der Biotechnologie über die Biochemie und Molekularbiologie bis zur Molekulargenetik und Molekularmedizin. Sie ist eine essenzielle Grundlage für alle 'omics'-Technologien, für die Strukturbiologie, die Systembiologie sowie die synthetische Biologie.

Bioinformatik. Grundlagen, Algorithmen, Anwendungen bietet eine umfassende Einführung in die wichtigsten Methoden der Bioinformatik. Der Autor erklärt dabei sowohl die mathematischen und biologischen Grundlagen als auch die wichtigsten Software-Tools und deren Anwendungsbereiche. Schwerpunkte sind Methoden zum Sequenzvergleich, Verfahren zur Charakterisierung von Proteinfamilien, Algorithmen zur Vorhersage von Protein- und RNA-Strukturen, Methoden des maschinellen Lernens und das Proteindesign.

Für die 4. Auflage wurde der Text durchgehend aktualisiert und um ein Kapitel zur Molekulardynamik erweitert. Neu aufgenommene Exkurse zu Meilensteinen der Bioinformatik und aktuellen Anwendungsgebieten lockern den Text auf. Auf der ebenfalls komplett überarbeiteten Begleit-Webseite werden interaktive Lernmodule bereitgestellt, einschließlich mehr als 120 Übungsaufgaben, zum Teil mit Lösungen.

Eine perfekte Einführung für alle Studenten der Lebenswissenschaften oder Informatik, die einen Einblick in die gängigen Methoden der Bioinformatik benötigen, sowie ein wertvoller Begleiter für alle, die bereits bioinformatische Werkzeuge nutzen und die zugrundeliegenden Konzepte verstehen möchten.

Rainer Merkl war von 2012 bis zu seiner Pensionierung im Jahr 2020 Professor für Bioinformatik am Lehrstuhl Biochemie II der Universität Regensburg. Er hat biomedizinische Technik und Informatik studiert und war am Max-Planck-Institut für Biochemie in Martinsried und der Universität Göttingen tätig, wo er 1996 im Fach Genetik promoviert wurde. Im Jahre 2005 habilitierte er sich an der Universität Regensburg in Bioinformatik. Neben seiner Lehrtätigkeit für Biologen und Biochemiker bildete er an der Fernuniversität Hagen mehr als zehn Jahre lang Informatiker im Fach Bioinformatik aus.

Fachbuch-Bestseller: Biologie (Nr. 1/2024) — Platz 5
Fachbuch-Bestseller: Biologie (Nr. 10/2023) — Platz 8
Fachbuch-Bestseller: Biologie (Nr. 6/2023) — Platz 9
Fachbuch-Jahres-Bestseller: Biologie 2022 — Platz 7
Fachbuch-Bestseller: Biologie (Nr. 9/2022) — Platz 2

Rainer Merkl war von 2004 bis zu seiner Emeritierung im Jahr 2020 Professor für Bioinformatik am Lehrstuhl Biochemie II der Universität Regensburg. Nach seiner Promotion in Göttingen im Fach Genetik habilitierte er sich in Regensburg für das Fach Bioinformatik. Rainer Merkl war am Max Planck Institut für Biochemie, Martinsried und der Universität Göttingen tätig. Neben seiner Lehrtätigkeit in Regensburg für Biologen und Biochemiker bildete er an der Fernuniversität Hagen viele Jahre lang Informatiker im Fach Bioinformatik aus.

GRUNDLAGEN - BIOLOGIE UND DATENBANKEN
Biologische Grundlagen
Sequenzen und ihre Funktion
Datenbanken
LERNEN, OPTIMIEREN UND ENTSCHEIDEN
Grundbegriffe der Stochastik
Bayessche Entscheidungstheorie und Klassifikatoren
Klassische Cluster- und Klassifikationsverfahren
Neuronale Netze
Genetische Algorithmen
ALGORITHMEN UND MODELLE DER BIOINFORMATIK
Paarweiser Sequenzvergleich
Sequenz-Motive
Scoring-Schemata
FASTA und die BLAST-Suite
Multiple Sequenzalignments und Anwendungen
Grundlagen phylogenetischer Analysen
Markov-Ketten und Hidden-Markov-Modelle
Profil-HMMs
Support-Vektor Maschinen
Molekulardynamik (NEU)
Vorhersage der Sekundärstruktur
Vergleich von Protein-3D-Strukturen
Vorhersage der Protein-3D-Struktur
Analyse integraler Membranproteine
Entschlüsselung von Genomen
Auswertung von Genexpressionsdaten
Analyse von Protein-Protein-Interaktionen
Big Data: Herausforderungen und Möglichkeiten

1
Biologische Grundlagen

In den folgenden Kapiteln beschäftigen wir uns meist mit Algorithmen, die Eigenschaften von Makromolekülen bewerten oder vergleichen. Für das Verständnis der Algorithmen und der zugrunde liegenden informatischen Methoden und Modellieransätze benötigen wir relativ wenige biologische Grundkenntnisse, die in diesem Kapitel eingeführt werden. Zu den wichtigsten molekularbiologischen Substanzklassen gehören DNA, RNA und Proteine. Dies sind Makromoleküle, die jeweils aus einer Abfolge kleinerer Bausteine bestehen. Die DNA ist beispielsweise aus Nukleotiden aufgebaut und deren lineare Anordnung kann in Form einer Zeichenkette (Sequenz) angegeben werden. Das Konzept der Sequenzen betrachten wir im nächsten Kapitel genauer, im Folgenden konzentrieren wir uns zunächst auf biochemische und biophysikalische Eigenschaften der genannten Molekülklassen.

Die DNA ist der wichtigste Datenträger in der Molekularbiologie; das Genom einer Spezies, das die komplette genetische Information enthält, ist in DNA-Molekülen codiert. In den letzten Jahrzehnten wurden Hochdurchsatzmethoden entwickelt, die es erlauben, DNA-Sequenzen mit geringem Aufwand und in kurzer Zeit zu ermitteln. Aus diesen Gründen werden bevorzugt Genomsequenzen bestimmt, da deren Kenntnis häufig ausreicht, die Komposition der anderen Makromoleküle (RNA und Proteine) abzuleiten. Die biologische Bedeutung der RNA hat durch neuere Erkenntnisse enorm zugenommen. Es ist klar geworden, dass RNA-Moleküle nicht nur an der Umsetzung der genetischen Information in Proteine beteiligt sind. Sie übernehmen in erheblichem Ausmaß auch Regulationsaufgaben, was lange unbekannt war. Proteine sind die wichtigsten Baustoffe aller biologischen Zellen. Sie geben den Zellen oft ihre Struktur und sind beispielsweise in Form von Enzymen essenzielle Komponenten der meisten Stoffwechselvorgänge.

Die In-vivo-Funktion von DNA, RNA und Proteinen kann nur anhand der dreidimensionalen Molekülstruktur verstanden werden. Im Vergleich zu den eher uniformen Raumstrukturen der DNA- und RNA-Moleküle bilden Proteine eine enorme Vielfalt unterschiedlichster Strukturen aus. Deswegen nimmt im Folgenden die Darstellung von Proteinarchitekturen einen breiteren Raum ein. Nach der Beschreibung typischer Protein-3-D-Strukturen beschäftigen wir uns mit Proteineigenschaften, die in bioinformatischen Algorithmen von Bedeutung sind.

Die in der Natur vorkommende Vielfalt von Lebewesen ist entstanden, weil sich vererbte organische Strukturen aufgrund von Evolutionsvorgängen in den biologischen Arten unterschiedlich entwickelt haben. Wir müssen uns daher auch mit dem Wesen von biologischen Evolutionsprozessen beschäftigen, da diese einen wesentlichen Teil der informatischen Modellbildung ausmachen. Das Kapitel schließt mit einer Definition wichtiger Fachbegriffe.

Abb. 1.1 Raumstruktur der DNA. In diesem DNA-Fragment ist die Doppelhelix gut zu erkennen. Die basischen Anteile der Nukleotide sind nach innen gerichtet und durch Wasserstoffbrücken verknüpft. Die Wasserstoffbrücken sind in dieser Abbildung nicht markiert. Außen verlaufen die Zucker-Phosphat-Anteile der polymerisierten Nukleotide; sie sind orange dargestellt. Die Raumstruktur dieses DNA-Fragments wurde mit experimentellen Methoden bestimmt, sodass die exakte Position aller DNA-Elemente bekannt ist und visualisiert werden kann.

1.1 DNA

Im bioinformatischen Kontext beschreiben Sequenzen in der Regel eine bestimmte Abfolge von Einzelbausteinen, die aus einer kleinen und definierten Menge stammen. So sind DNA-Sequenzen einfache Modelle für Makromoleküle der Desoxyribonucleinsäure (abgekürzt DNS oder DNA), die in der Natur als fädige Struktur vorliegt. Die Grundbausteine sind vier Nukleotide, diese bestehen jeweils aus

einem Zucker (in der DNA: Desoxyribose),
einer der zwei Purin-(Adenin, Guanin) oder zwei Pyrimidinbasen (Cytosin, Thymin),
einem Phosphatrest.

Abb. 1.2 Basenpaarungen in der DNA. In der als Doppelhelix bekannten DNA-Struktur liegen sich jeweils paarweise die Basen Adenin und Thymin oder Guanin und Cytosin gegenüber. Zwischen A:T-Paaren können zwei und zwischen G:C-Paaren drei Wasserstoffbrücken ausgebildet werden. Je höher der Anteil von G:C-Paaren ist, desto mehr Energie muss für das Trennen der beiden Stränge einer DNA-Doppelhelix aufgewendet werden.

Ein DNA-Strang ist aus einer Abfolge von Nukleotiden aufgebaut und in der Zelle kommt die DNA üblicherweise in doppelsträngiger Form vor, die eine Doppelhelix bildet. In der Helix stehen sich Nukleotide paarweise gegenüber, wobei nur zwei Paarungen zugelassen sind (siehe Abb. 1.1 und 1.2). In den Zellkernen höherer Arten ist die DNA um Nukleosomen gewickelt, die sich zu komplexeren Strukturen zusammenlagern. Dieser Befund ist für die bioinformatischen Kernalgorithmen ohne Belang.

Wasserstoffbrücken

Die Funktion und Struktur von Makromolekülen wird maßgeblich durch Wasserstoffbrücken determiniert. Eine Wasserstoffbrücke ist eine anziehende elektromagnetische Wechselwirkung zwischen einem kovalent in einem Molekül gebundenen Wasserstoff und einem elektronegativen Atom wie Stickstoff oder Sauerstoff. Diese Bindung kann im Gegensatz zu einer kovalenten Atombindung mit geringem Energieaufwand gelöst werden.

Reverses Komplement

Aufgrund des chemischen Aufbaus der Nukleotide hat jeder DNA-Strang beliebiger Länge eine eindeutige Orientierung mit jeweils einem freien 3′-OH- und einem 5′-OH-Ende. Sequenzen werden nach Übereinkunft stets so geschrieben, dass das 5′-OH-Ende links und das 3′-OH-Ende rechts steht. In vivo ist die DNA-Doppelhelix meist zu einem Ring geschlossen, z. B. in Chromosomen oder Plasmiden. Darin sind die beiden komplementären DNA-Stränge gegenläufig angeordnet. Die durch den Aufbau vorgegebene Orientierung bedingt die Richtung, in der Gene abgelesen werden. Da Gene auf beiden Strängen codiert sein können, in Datensammlungen jedoch nur die Sequenz eines Stranges abgelegt wird, muss zum Bestimmen der Sequenz des Gegenstranges das reverse Komplement gebildet werden.

1.2 Genetischer Code und Genomkomposition

Die Sequenzinformation eines jeden Proteins ist in Form eines Gens in der DNA-Sequenz codiert. Jeweils drei direkt aufeinanderfolgende Nukleotide, die nicht überlappend abgelesen werden, codieren für eine Aminosäure. Eine solche Nukleotidgruppe wird Triplett oder Codon genannt. Die Abbildung der 64 Tripletts auf die 20 Aminosäuren heißt genetischer Code, dieser ist in Tab. 1.1 dargestellt. Der Code ist quasi universell, abweichende Codonzuordnungen finden sich aber z. B. bei Mitochondrien, Mycoplasma und einigen Protozoen [1]. Stoppcodonen terminieren die für Proteine codierenden Gensequenzen.

Tab. 1.1 Der genetische Code. Die Zahlen geben die Nukleotidposition im Codon an. In einigen speziellen Fällen, wie in mitochondrialen Genomen, kann es Abweichungen von diesem kanonischen Code geben. Die Namen der Aminosäuren sind im Dreibuchstabencode angegeben (siehe Tab. 2.2 in Kap....

Erscheint lt. Verlag	15.8.2022
Sprache	deutsch
Themenwelt	Naturwissenschaften ► Biologie
Schlagworte	Bioinformatik • Bioinformatik u. Computersimulationen in der Biowissenschaften • Biologie • Biomedizintechnik • Biostatistik • Biowissenschaften • Medizininformatik u. biomedizinische Informationstechnologie • Statistik • Statistische Genetik
ISBN-10	3-527-83389-7 / 3527833897
ISBN-13	978-3-527-83389-4 / 9783527833894

Haben Sie eine Frage zum Produkt?

EPUB (Adobe DRM)
Größe: 21,1 MB

Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belletristik und Sachbüchern. Der Fließtext wird dynamisch an die Display- und Schriftgröße angepasst. Auch für mobile Lesegeräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine Adobe-ID und die Software Adobe Digital Editions (kostenlos). Von der Benutzung der OverDrive Media Console raten wir Ihnen ab. Erfahrungsgemäß treten hier gehäuft Probleme mit dem Adobe DRM auf.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine Adobe-ID sowie eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.