Blick ins Buch

Bioinformatik (eBook)

Grundlagen, Algorithmen, Anwendungen

Rainer Merkl (Autor)

eBook Download: PDF

2022 | 4. Auflage
751 Seiten
Wiley-VCH (Verlag)
978-3-527-83390-0 (ISBN)

Lese- und Medienproben

Ebook-Leseprobe (PDF)

Bioinformatik

Der Marktführer bei den Bioinformatiklehrbüchern in neuer Auflage und mit dem neuen Thema Molekulardynamik

Bioinformatik ist eine Kerndisziplin in den modernen Biowssenschaften, von der Biotechnologie über die Biochemie und Molekularbiologie bis zur Molekulargenetik und Molekularmedizin. Sie ist eine essenzielle Grundlage für alle 'omics'-Technologien, für die Strukturbiologie, die Systembiologie sowie die synthetische Biologie.

Bioinformatik. Grundlagen, Algorithmen, Anwendungen bietet eine umfassende Einführung in die wichtigsten Methoden der Bioinformatik. Der Autor erklärt dabei sowohl die mathematischen und biologischen Grundlagen als auch die wichtigsten Software-Tools und deren Anwendungsbereiche. Schwerpunkte sind Methoden zum Sequenzvergleich, Verfahren zur Charakterisierung von Proteinfamilien, Algorithmen zur Vorhersage von Protein- und RNA-Strukturen, Methoden des maschinellen Lernens und das Proteindesign.

Für die 4. Auflage wurde der Text durchgehend aktualisiert und um ein Kapitel zur Molekulardynamik erweitert. Neu aufgenommene Exkurse zu Meilensteinen der Bioinformatik und aktuellen Anwendungsgebieten lockern den Text auf. Auf der ebenfalls komplett überarbeiteten Begleit-Webseite werden interaktive Lernmodule bereitgestellt, einschließlich mehr als 120 Übungsaufgaben, zum Teil mit Lösungen.

Eine perfekte Einführung für alle Studenten der Lebenswissenschaften oder Informatik, die einen Einblick in die gängigen Methoden der Bioinformatik benötigen, sowie ein wertvoller Begleiter für alle, die bereits bioinformatische Werkzeuge nutzen und die zugrundeliegenden Konzepte verstehen möchten.

Rainer Merkl war von 2004 bis zu seiner Emeritierung im Jahr 2020 Professor fÃ¼r Bioinformatik am Lehrstuhl Biochemie II der UniversitÃ¤t Regensburg. Nach seiner Promotion in GÃ¶ttingen im Fach Genetik habilitierte er sich in Regensburg fÃ¼r das Fach Bioinformatik. Rainer Merkl war am Max Planck Institut fÃ¼r Biochemie, Martinsried und der UniversitÃ¤t GÃ¶ttingen tÃ¤tig. Neben seiner LehrtÃ¤tigkeit in Regensburg fÃ¼r Biologen und Biochemiker bildete er an der FernuniversitÃ¤t Hagen viele Jahre lang Informatiker im Fach Bioinformatik aus.

Fachbuch-Bestseller: Biologie (Nr. 1/2024) — Platz 5
Fachbuch-Bestseller: Biologie (Nr. 10/2023) — Platz 8
Fachbuch-Bestseller: Biologie (Nr. 6/2023) — Platz 9
Fachbuch-Jahres-Bestseller: Biologie 2022 — Platz 7
Fachbuch-Bestseller: Biologie (Nr. 9/2022) — Platz 2

Rainer Merkl war von 2004 bis zu seiner Emeritierung im Jahr 2020 Professor für Bioinformatik am Lehrstuhl Biochemie II der Universität Regensburg. Nach seiner Promotion in Göttingen im Fach Genetik habilitierte er sich in Regensburg für das Fach Bioinformatik. Rainer Merkl war am Max Planck Institut für Biochemie, Martinsried und der Universität Göttingen tätig. Neben seiner Lehrtätigkeit in Regensburg für Biologen und Biochemiker bildete er an der Fernuniversität Hagen viele Jahre lang Informatiker im Fach Bioinformatik aus.

Cover 1
Titelseite 5
Impressum 6
Vorwort 7
Inhaltsverzeichnis 11
Teil I Grundlagen – Biologie und Datenbanken 23
1 Biologische Grundlagen 27
1.1 DNA 28
1.2 Genetischer Code und Genomkomposition 30
1.3 Transkription 34
1.4 RNA 35
1.5 Proteine 36
1.6 Peptidbindung 38
1.7 Konformation von Aminosäureseitenketten 38
1.8 Ramachandran-Plot 39
1.9 Hierarchische Beschreibung von Proteinstrukturen 40
1.10 Sekundärstrukturelemente 41
1.11 ?-Helix 42
1.12 ?-Faltblätter 42
1.13 Supersekundärstrukturelemente 43
1.14 Proteindomänen 44
1.15 Proteinfamilien 45
1.16 Enzyme 48
1.17 Proteinkomplexe 49
1.18 Evolutionäre Prozesse 50
1.19 Fachbegriffe 52
Literatur 55
2 Sequenzen und ihre Funktion 59
2.1 Definitionen und Operatoren 60
2.2 DNA-Sequenzen 61
2.3 Proteinsequenzen 61
2.4 Vergleich der Sequenzkomposition 63
2.5 Ontologien 67
2.6 Analyse der Anreicherung von GO-Termen 70
2.7 Semantische Ähnlichkeit von GO-Termen 70
2.7.1 Bewertung mit informationstheoretischen Ansätzen 70
2.7.2 Vergleich mit einer graphentheoretischen Methode 72
Literatur 76
3 Datenbanken 79
3.1 Nukleotidsequenzdatenbanken 80
3.2 RNA-Sequenz-Datenbanken 81
3.3 Proteinsequenzdatenbanken 82
3.4 3-D-Struktur-Datenbanken 82
3.5 SMART: Analyse der Domänenarchitektur 84
3.6 STRING: Proteine und ihre Interaktionen 84
3.7 SCOP: Strukturelle Klassifikation von Proteinen 85
3.8 Pfam: Kompilation von Proteinfamilien 88
3.9 COG und eggNOG: Gruppen orthologer Gene 90
3.10 KEGG: Gene, Genome und Krankheiten 90
3.11 NCBI-Datenbanken: Literatur und biologisches Wissen 91
3.12 Weitere Datenbanken 92
Literatur 96
Teil II Lernen, Optimieren und Entscheiden 99
4 Grundbegriffe der Stochastik 103
4.1 Grundbegriffe der beschreibenden Statistik 104
4.2 Zufallsvariable, Wahrscheinlichkeitsmaß 106
4.3 Urnenexperimente und diskrete Verteilungen 108
4.4 Die kolmogoroffschen Axiome 111
4.5 Bedingte Wahrscheinlichkeit, Unabhängigkeit, Satz von Bayes 111
4.6 Markov-Ketten 113
4.7 Erwartungswert, Varianz 113
4.8 Wichtige Wahrscheinlichkeitsverteilungen 114
4.8.1 Diskrete Verteilungen 114
4.8.2 Totalstetige Verteilungen 115
4.9 Schätzer 118
4.10 Grundlagen statistischer Tests 120
4.11 Eine optimale Entscheidungstheorie: die Neyman-Pearson-Methode 122
Literatur 123
5 Bayessche Entscheidungstheorie und Klassifikatoren 125
5.1 Bayessche Entscheidungstheorie 125
5.1.1 Ein Beispiel: Klassifikation der Proteinoberfläche 126
5.1.2 Übergang zu bedingten Wahrscheinlichkeiten 127
5.1.3 Erweitern auf m Eigenschaften 129
5.2 Marginalisieren 131
5.3 Boosting 132
5.4 ROC-Kurven 134
5.4.1 Bewerten von Fehlklassifikationen 134
5.4.2 Aufnehmen einer ROC-Kurve 134
5.5 Testmethoden für kleine Trainingsmengen 137
Literatur 139
6 Klassische Cluster- und Klassifikationsverfahren 141
6.1 Metriken und Clusteranalyse 142
6.2 Das mittlere Fehlerquadrat als Gütemaß 142
6.3 Ein einfaches iteratives Clusterverfahren 143
6.4 k-Means-Clusterverfahren 145
6.5 Hierarchische Clusterverfahren 148
6.6 Affinity propagation 149
6.7 Bewertung der Clusterverfahren 151
6.8 Überlappende Cluster 152
6.9 Nächster-Nachbar-Klassifikation 152
6.10 k-nächste-Nachbarn-Klassifikation 154
Literatur 155
7 Neuronale Netze 157
7.1 Architektur von neuronalen Netzen 158
7.2 Das Perzeptron 158
7.3 Modellieren boolscher Funktionen 160
7.4 Lösbarkeit von Klassifikationsaufgaben 161
7.5 Universelle Approximation 163
7.6 Lernen in neuronalen Netzen 165
7.7 Der Backpropagation-Algorithmus 166
7.8 Codieren der Eingabe 169
7.9 Selbstorganisierende Karten 170
7.10 Tiefe Architekturen 172
7.11 Ein einfaches Neuron, die rectified linear unit 173
7.12 Das Neocognitron als alternatives Modellierparadigma 174
7.13 Faltung mithilfe von CNNs 175
7.14 Längerfristiges Speichern von Eingabedaten 179
7.15 Attention-basierte Netze 183
Literatur 190
8 Genetische Algorithmen 193
8.1 Objekte und Funktionen 195
8.2 Ablauf des Verfahrens 196
8.3 Codieren der Problemstellung 198
8.4 Der Begriff des Schemas 198
8.5 Dynamik der Anzahl von Schemata 199
8.6 Limitationen genetischer Algorithmen 201
8.7 Genetisches Programmieren 202
Literatur 205
Teil III Algorithmen und Modelle der Bioinformatik 207
9 Paarweiser Sequenzvergleich 211
9.1 Dotplots 213
9.1.1 Definition 213
9.1.2 Beispiel 214
9.1.3 Implementierung 215
9.1.4 Abschätzen der Laufzeit 216
9.1.5 Anwendungen 217
9.1.6 Einschränkungen und Ausblick 218
9.2 Entwickeln eines optimalen Alignment-Verfahrens 220
9.2.1 Paarweise und multiple Sequenzalignments 222
9.2.2 Dynamisches Programmieren 222
9.2.3 Distanzen und Metriken 224
9.2.4 Die Minkowski-Metrik 225
9.2.5 Die Hamming-Distanz 225
9.3 Levenshtein-Distanz 226
9.3.1 Berechnungsverfahren 228
9.3.2 Ableiten des Alignments 232
9.4 Bestimmen der Ähnlichkeit von Sequenzen 232
9.4.1 Globales Alignment 232
9.4.2 Lokales Sequenzalignment 233
9.5 Optimales Bewerten von Lücken 234
9.5.1 Eigenschaften affiner Kostenfunktionen 235
9.5.2 Integration in Algorithmen 235
9.6 Einordnung der Algorithmen 237
Literatur 238
10 Sequenzmotive 241
10.1 Signaturen 242
10.2 Die PROSITE-Datenbank 243
10.3 Die BLOCKS-Datenbank 243
10.4 Sequenzprofile 244
10.5 Scores für Promotorsequenzen 246
10.6 Möglichkeiten und Grenzen profilbasierter Klassifikation 246
10.7 Sequenzlogos 247
10.8 Konsensussequenzen 248
10.9 Sequenzen niedriger Komplexität 249
10.10 Der SEG-Algorithmus 250
Literatur 253
11 Scoring-Schemata 255
11.1 Theorie von Scoring-Matrizen 256
11.2 Algorithmenbedingte Anforderungen 259
11.3 Identitätsmatrizen 259
11.4 PAM-Einheit 260
11.5 PAM-Matrizen 260
11.6 Ein moderner PAM-Ersatz: die JTT-Matrix 262
11.7 BLOSUM-Matrizen 263
11.8 Matrixentropie 265
11.9 Scoring-Schemata und Anwendungen 266
11.10 Flexible Erweiterung: Scoring-Funktionen 267
Literatur 269
12 FASTA und die BLAST-Suite 271
12.1 FASTA 272
12.1.1 Programmablauf 272
12.1.2 Statistische Bewertung der Treffer 274
12.2 BLAST 277
12.2.1 Konzepte und Umsetzung 278
12.2.2 Statistik von Alignments 281
12.2.3 Ausgabe der Treffer 286
12.3 Vergleich der Empfindlichkeit von FASTA und BLAST 286
12.4 Ansätze zur Performanzsteigerung 287
12.5 Profilbasierter Sequenzvergleich 288
12.6 PSI-BLAST 289
12.7 Sensitivität verschiedener Sequenzvergleichsmethoden 291
12.8 Vergleich von Profilen und Konsensussequenzen 292
12.9 DELTA-BLAST 293
12.10 Alternative Ansätze 297
Literatur 298
13 Multiple Sequenzalignments und Anwendungen 301
13.1 Berechnen von Scores für multiple Sequenzalignments 303
13.2 Iteratives Berechnen eines Alignments 304
13.3 ClustalW: Ein klassischer Algorithmus 305
13.3.1 Grundlegende Konzepte 305
13.3.2 Algorithmus 305
13.3.3 Ein Beispiel: MSA für Trypsininhibitoren 306
13.4 T-Coffee 308
13.5 M-Coffee und 3D-Coffee 311
13.6 Alternative Ansätze 313
13.7 Alignieren großer Datensätze mit Clustal Omega 314
13.8 Alignieren großer Proteinsequenzdatensätze mit DECIPHER 315
13.9 Charakterisierung von Residuen mithilfe von Alignments 318
13.9.1 Entwickeln der Scoring-Funktion 319
13.9.2 FRpred: Vorhersage funktionell wichtiger Residuen 319
13.9.3 SDPpred: Vergleich homologer Proteine mit unterschiedlicher Spezifität 320
13.10 Alignment von DNA- und RNA-Sequenzen 322
Literatur 323
14 Grundlagen phylogenetischer Analysen 325
14.1 Einteilung phylogenetischer Ansätze 329
14.2 Distanzbasierte Verfahren 329
14.2.1 Ultrametrische Matrizen 330
14.2.2 Additive Matrizen 331
14.3 Linkage-Algorithmen 333
14.4 Der Neighbour-Joining-Algorithmus 335
14.5 Parsimony-Methoden 336
14.6 Maximum-Likelihood-Ansätze 339
14.6.1 Übergangswahrscheinlichkeiten für DNA-Sequenzen 340
14.6.2 Empirische Modelle der Proteinevolution 341
14.6.3 Berechnen der Likelihood eines Baumes 343
14.6.4 Quartett-Puzzle: Heuristik zum Finden einer Topologie 345
14.7 Grundannahmen phylogenetischer Algorithmen 347
14.8 Statistische Bewertung phylogenetischer Bäume 348
14.8.1 Validierung durch Outgroups 349
14.8.2 Bootstrap-Verfahren und A-posteriori-Wahrscheinlichkeiten 349
14.8.3 Alternativen und Ergebnisse 351
Literatur 354
15 Markov-Ketten und Hidden-Markov-Modelle 357
15.1 Ein epigenetisches Signal: CpG-Inseln 357
15.2 Finite Markov-Ketten 358
15.3 Kombination zweier Ketten zu einem Klassifikator 359
15.4 Genvorhersage mithilfe inhomogener Ketten 362
15.5 Hidden-Markov-Modelle 365
15.6 Der Viterbi-Pfad 368
15.7 Ein HMM zur Erkennung von CpG-Inseln 370
15.8 Der Vorwärts- und der Rückwärtsalgorithmus 371
15.9 Schätzen von Parametern 373
15.10 Der Baum-Welch-Algorithmus 374
15.11 Entwurf von HMMs 376
15.12 Verwendung und Grenzen von HMMs 378
15.13 Wichtige Eigenschaften von Markov-Ketten 379
15.14 Markov-Ketten-Monte-Carlo-Verfahren 381
15.14.1 Monte-Carlo-Integration 381
15.14.2 Metropolis-Hastings-Algorithmus 382
15.14.3 Simulated annealing 383
15.14.4 Gibbs-Sampler 384
15.15 Weitere Anwendungen von Markov-Ketten 384
Literatur 388
16 Profil-HMMs 391
16.1 HMM-Struktur zur Beschreibung von Proteinfamilien 392
16.2 Suche nach homologen Sequenzen 395
16.3 Modellbau für Profil-HMMs 398
16.4 Approximieren von Wahrscheinlichkeitsdichten 402
16.5 HHsearch: Vergleich zweier Profil-HMMs 408
16.5.1 Grundlagen des Alignments von zwei Hidden-Markov-Ketten 409
16.5.2 Paarweises Alignment von HMMs 412
16.5.3 Performanz von HHsearch 413
16.5.4 Strukturvorhersage mit HHsearch 415
Literatur 417
17 Support-Vektor-Maschinen 419
17.1 Beschreibung des Klassifikationsproblems 420
17.2 Lineare Klassifikatoren 421
17.3 Klassifizieren mit großer Margin 425
17.4 Kernel-Funktionen und Merkmalsräume 427
17.5 Implizite Abbildung in den Merkmalsraum 429
17.6 Eigenschaften von Kernel-Funktionen 430
17.7 Häufig verwendete Kernel-Funktionen 431
17.8 Aus Merkmalen abgeleitete Kernel-Funktionen 432
17.9 Support-Vektor-Maschinen in der Anwendung 438
17.10 Multiklassen-SVM 441
17.11 Theoretischer Hintergrund 442
Literatur 446
18 Vorhersage der Sekundärstruktur 449
18.1 Vorhersage der Proteinsekundärstruktur 449
18.1.1 Ein früher Ansatz: Chou-Fasman-Verfahren 450
18.1.2 PHD: profilbasierte Vorhersage 451
18.2 Vorhersage der RNA-Sekundärstruktur 458
18.2.1 RNA-Sequenzen und -Strukturen 460
18.2.2 Freie Energie und Strukturen 461
18.2.3 Sekundärstrukturvorhersage durch Energieminimierung 462
18.2.4 Strukturen mit Schleifen 464
18.2.5 MEA-Verfahren zur Vorhersage von Strukturen mit Pseudoknoten 466
18.2.6 Strukturvorhersage mithilfe von multiplen Sequenzalignments 469
Literatur 471
19 Vergleich von Protein-3-D-Strukturen 473
19.1 Grundlagen des Strukturvergleichs 475
19.2 Simulated annealing 477
19.3 DALI: fragmentbasierte Superposition 480
19.3.1 Scores für Substrukturen 481
19.3.2 Alignieren von Substrukturen 481
19.4 Fr-TM-align: Alignieren von Fragmenten 483
19.5 SPalignNS: optimales Kombinieren von Residuenpaaren 484
19.6 FAST: Vergleich der lokalen Geometrie 485
19.7 DeepAlign: Verwenden eines Strukturalphabets 488
19.8 Multiple Superpositionen 493
Literatur 496
20 Vorhersage der Protein-3-D-Struktur, Proteindesign und Moleküldynamik 499
20.1 Threading-Verfahren 504
20.2 3D-1D-Profile: profilbasiertes Threading 506
20.2.1 Bestimmen der lokalen Umgebung 506
20.2.2 Erzeugen eines 3-D-1-D-Profils 508
20.3 Wissensbasierte Kraftfelder 511
20.3.1 Theoretische Grundlagen 512
20.3.2 Ableiten der Potenziale 515
20.4 Rotamerbibliotheken 516
20.5 MODELLER 521
20.6 Bewerten der Modellqualität 526
20.7 Alternative Modellieransätze 526
20.8 ROSETTA/ROBETTA 527
20.8.1 De-novo-Strukturvorhersage mit ROSETTA 528
20.8.2 Verfeinerung der Fragmentinsertion 530
20.8.3 Modellieren strukturell variabler Regionen 530
20.8.4 Proteindesign mithilfe von ROSETTA 532
20.9 Moleküldynamiksimulationen 539
20.9.1 Physikalische Grundlagen von MD-Simulationen 540
20.9.2 Berechnungsverfahren 541
20.9.3 Berechnen der Interaktionen mithilfe von Kraftfeldern 543
20.9.4 Spezielle Hardware beschleunigt die Simulationen 544
Literatur 545
21 Analyse integraler Membranproteine 549
21.1 Architektur integraler Membranproteine 550
21.2 Spezifische Probleme beim Sequenzvergleich 552
21.3 Vorhersage der Topologie von ?-helikalen IMPs 552
21.3.1 HMMTOP 553
21.3.2 MEMSAT-SVM 554
21.3.3 Ein Metaansatz: TOPCONS2 556
21.4 Vorhersage der Struktur von ?-Fässern 557
21.4.1 TMBpro 557
21.4.2 PRED-TMBB2 559
21.4.3 BOCTOPUS2 561
21.4.4 Alternative Ansätze und Homologiemodellierung 563
Literatur 563
22 Entschlüsselung von Genomen 567
22.1 Shotgun-Sequenzierung 571
22.2 Erwartete Anzahl von Contigs beim Shotgun-Ansatz 572
22.3 Basecalling und Sequenzqualität 573
22.4 Der klassische Assemblieransatz 575
22.4.1 Phase eins: Bestimmen überlappender Präfix-Suffix-Regionen 576
22.4.2 Phase zwei: Erzeugen von Contigs 578
22.4.3 Phase drei: Generieren der Konsensussequenz 578
22.5 Assemblieren kurzer Fragmente 580
22.6 Assemblieren langer und fehlerbehafteter Reads 583
22.7 Annotation kompletter Genome 587
22.8 Metagenomik 592
22.8.1 Spezielle Anforderungen an die Bioinformatik 593
22.8.2 Minimalanforderungen für die Metagenomannotation 595
Literatur 596
23 Auswertung von Transkriptomdaten 601
23.1 DNA-Chip-Technologie 601
23.1.1 Datenbanken für Transkriptomdaten 603
23.1.2 Grenzen der Technologie 604
23.2 Analyse von DNA-Chip-Signalen 605
23.2.1 Quantifizierung von Expressionswerten 605
23.2.2 Normalisieren und Datenreduktion 606
23.3 Identifizieren differenziell exprimierter Gene 608
23.4 RNA-Sequenzierung 609
23.5 Analyse der RNA-Sequenzen 610
23.6 Einzelzell-RNA-Sequenzierung 613
23.7 Metriken zum Vergleich von Expressionsdaten 613
23.8 Analyse kompletter Expressionsdatensätze 615
23.8.1 Anwenden von Clusterverfahren 615
23.8.2 Validierung und Alternativen 615
23.9 Hauptkomponentenanalyse 616
23.10 Biclusterverfahren 619
23.10.1 ISA: ein performantes Biclusterverfahren 619
23.10.2 Der Signaturalgorithmus 620
23.10.3 Iterative Optimierung 623
23.10.4 QUBIC2: Ein graphenbasiertes Biclusterverfahren 624
23.11 Grenzen und Alternativen bei der Expressionsanalyse 626
23.12 Genexpressions-Profiling 627
23.13 Visualisieren mithilfe von Wärmekarten 628
23.13.1 Der klassische Ansatz 629
23.14 Datenaufbereitung für systembiologische Fragestellungen 629
23.14.1 Bündelung von Datenbankinformation 630
23.14.2 Statistische Analyse der Termverteilung 631
23.14.3 Verwendbarkeit der Verfahren 632
Literatur 634
24 Analyse von Protein-Protein-Interaktionen 637
24.1 Biologische Bedeutung des Interaktoms 637
24.2 Methoden zum Bestimmen des Interaktoms 638
24.3 Vergleich von Codonhäufigkeiten 640
24.4 Analyse des Genominhaltes 641
24.4.1 Genfusion 641
24.4.2 Phyletische Profile 642
24.4.3 Analyse von Genfolgen 644
24.4.4 Performanz sequenzbasierter Methoden 645
24.5 Suche nach korrelierten Mutationen 646
24.5.1 Erzeugen sortierter MSA-Paare 646
24.5.2 Identifizieren korrelierter Mutationen 647
24.6 Vergleich phylogenetischer Bäume 649
24.6.1 Die Mirror-Tree-Methode 649
24.6.2 Korrektur des Hintergrundsignals 651
24.6.3 Ein alternativer Ansatz, der auf einem Nullmodell basiert 652
24.7 Vorhersage des Interaktoms der Hefe 653
24.8 Strukturbasierte Protein-Protein-Interaktionsvorhersagen 656
24.8.1 Vorhersagen basierend auf Strukturinformation 657
24.8.2 PrePPI: Integration zusätzlicher Merkmale 659
24.9 Netzwerkbasierte Protein-Protein-Interaktionsvorhersagen 662
Literatur 664
25 Big Data und Deep Learning: neue Herausforderungen und Möglichkeiten 667
25.1 Klassifikation mit Random Forests 669
25.1.1 Entscheidungsbäume 669
25.1.2 Berechnen der Topologie 671
25.1.3 RF-Algorithmus 674
25.1.4 Theoretische Klassifikationsleistung eines RFs 675
25.1.5 Problemlösungen für konkrete Anwendungen 676
25.1.6 Auswahl informativer Eigenschaften 677
25.1.7 Bioinformatische Anwendungen 679
25.2 Sequenzbasierte Vorhersage der Protein-3-D-Struktur 680
25.2.1 Experimentelle Proteinstrukturaufklärung 681
25.2.2 Berechnen von Co-Variationssignalen 682
25.2.3 PSICOV: Vorhersage räumlich benachbarter Residuenpaare 685
25.2.4 Vorhersage der 3-D-Struktur mithilfe von Kontaktinformation 687
25.2.5 Alternative Nutzung von Kopplungssignalen 687
25.3 Berechnen einer Feinstruktur großer Proteinfamilien 688
25.3.1 MCL: Clustern mithilfe stochastischer Matrizen 689
25.3.2 Cytoscape: Visualisierung von Netzwerkclustern 691
25.4 Positionierung von Nukleosomen 692
25.4.1 Chromatin und Nukleosomen 693
25.4.2 NucleoFinder: ein statistischer Ansatz zur Vorhersage von Nukleosomenpositionen 694
25.5 Auswertung großer Datensätze mit tiefen Lernverfahren 698
25.5.1 DL-basierte Vorhersage der Proteinstruktur 699
25.5.2 AlphaFold2 und RoseTTAFold 702
25.5.3 Erkennen von Translationsinitiationsstellen 705
25.5.4 DeepCpG bestimmt den Methylierungsstatus in einzelnen Zellen 706
25.6 Analyse des menschlichen Genoms mithilfe von ENCODE-Daten 708
25.6.1 Datentypen 709
25.6.2 Genome Browser 711
Literatur 714
26 Zum Schluss 721
26.1 Informatik in schwierigem Umfeld 721
26.2 Ungelöste Probleme und Herausforderungen 723
Literatur 726
Stichwortverzeichnis 727
EULA 751

Erscheint lt. Verlag	2.8.2022
Sprache	deutsch
Themenwelt	Naturwissenschaften ► Biologie
Schlagworte	Bioinformatik • Bioinformatik u. Computersimulationen in der Biowissenschaften • Biologie • Biomedizintechnik • Biostatistik • Biowissenschaften • Medizininformatik u. biomedizinische Informationstechnologie • Statistik • Statistische Genetik
ISBN-10	3-527-83390-0 / 3527833900
ISBN-13	978-3-527-83390-0 / 9783527833900

Haben Sie eine Frage zum Produkt?

PDF (Adobe DRM)
Größe: 22,7 MB

Kopierschutz: Adobe-DRM
Adobe-DRM ist ein Kopierschutz, der das eBook vor Mißbrauch schützen soll. Dabei wird das eBook bereits beim Download auf Ihre persönliche Adobe-ID autorisiert. Lesen können Sie das eBook dann nur auf den Geräten, welche ebenfalls auf Ihre Adobe-ID registriert sind.
Details zum Adobe-DRM

Dateiformat: PDF (Portable Document Format)
Mit einem festen Seitenlayout eignet sich die PDF besonders für Fachbücher mit Spalten, Tabellen und Abbildungen. Eine PDF kann auf fast allen Geräten angezeigt werden, ist aber für kleine Displays (Smartphone, eReader) nur eingeschränkt geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen eine Adobe-ID und die Software Adobe Digital Editions (kostenlos). Von der Benutzung der OverDrive Media Console raten wir Ihnen ab. Erfahrungsgemäß treten hier gehäuft Probleme mit dem Adobe DRM auf.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen eine Adobe-ID sowie eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Zusätzliches Feature: Online Lesen
Dieses eBook können Sie zusätzlich zum Download auch online im Webbrowser lesen.

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.