Einstieg in Data Science mit R -  Benjamin Matuzak

Einstieg in Data Science mit R (eBook)

Datenanalyse und Statistik ohne Vorkenntnisse
eBook Download: EPUB
2020 | 1. Auflage
263 Seiten
Rheinwerk Computing (Verlag)
978-3-8362-7894-2 (ISBN)
Systemvoraussetzungen
29,90 inkl. MwSt
  • Download sofort lieferbar
  • Zahlungsarten anzeigen

Datenanalyse ist überall angekommen - seien auch Sie dabei! Quereinsteiger wie Historiker oder Germanisten, die mit quantitativen Methoden beginnen möchten, sind bei diesem Buch richtig, ob für die Forschung oder im Unternehmen.
Sie bekommen alles an die Hand, was Sie zum Loslegen brauchen. Lassen Sie Excel-Tabellen hinter sich und lernen Sie, wie Sie statistische Analysen mit R programmieren. Auch die mathematischen Grundlagen lernen Sie kennen, von den Mittelwerten bis zur linearen Regression. Nach der Lektüre sind Sie in der Lage, ein eigenes Projekt mit ausgewählten statistischen Methoden durchzuführen und Ihre Ergebnisse zu visualisieren.

Aus dem Inhalt:

  • Installation
  • Programmieren für Quereinsteiger
  • Daten verschiedener Formate laden
  • Daten bereinigen
  • Mit fehlenden Werten umgehen
  • Wachstumsberechnungen
  • Mittelwerte
  • Lineare Regression
  • R Studio
  • Einstieg in die Programmiersprache R

3.6    Hilfe!


Am Anfang ist es schwierig, mit den vielen Möglichkeiten, die R bietet, umzugehen. Seien Sie sich deshalb schon zu Beginn zweier Punkte bewusst:

  1. Es gibt keine vorgegebene Herangehensweise, wie Sie Ihre Fragestellungen lösen. In R gibt es in der Regel immer mehrere Möglichkeiten, ein Ziel zu erreichen. Wenn die eine nicht funktioniert, dann probieren Sie doch einfach mal die andere.

  2. Es gibt Hilfe. 99 % Ihrer Probleme hatten bereits andere vor Ihnen. Und die entsprechenden Lösungen sind im Netz auffindbar.

3.6.1    R-eigene Hilfe


R hat zu allen Paketen und Funktionen, die im Programm verwendet werden können, R‐eigene Dokumentationen. Die finden Sie immer im Fenster rechts unten unter dem Reiter Help.

Abbildung 3.21    Hilfe-Fenster

Wenn ich bspw. nach der Funktion help suche, erscheint die Dokumentation dieser Funktion.

Abbildung 3.22    R-eigene Hilfe

Die Dokumentationen für andere Funktionen und auch für in Paketen mitgelieferte Datensätze, die Sie hier suchen, sind immer im gleichen Stil aufgebaut.

Die erste Zeile zeigt an, was in der Hilfe gesucht wurde:

help {utils}

Die nächste Zeile, in großer Schrift und fett hervorgehoben, beschreibt die Hauptfunktion, die die von Ihnen gesuchte Funktion ausübt. In diesem Fall steht dort Documentation, da die Hilfe-Funktion »help« der Dokumentation dient. Gleich darunter erfahren Sie im Abschnitt Description (Beschreibung), was das genau bedeutet, und unter Usage (Gebrauch) finden Sie die Syntax der Funktion.

Die Funktion help() wird also mit help aufgerufen. Zwei runde Klammern schließen die Argumente, die die Funktionen erhalten kann, in ihr ein:

help(topic, package = NULL, lib.loc = NULL,
verbose = getOption("verbose"),
try.all.packages = getOption("help.try.all.packages"),
help_type = getOption("help_type"))

Unter Arguments werden nun die Argumente, die die Funktion von Ihnen zugewiesen bekommen kann oder nicht, genauer beschrieben. Das erste Argument der help-Funktion ist topic, also das Thema, mit dem geholfen werden soll.

Wem die englische Beschreibung nicht hilft, der kann es mit dem Google Translator versuchen. Für den ersten Parameter, topic, habe ich folgende Übersetzung erhalten:

In der Regel ein Name oder eine Zeichenfolge, die das Thema angibt, für das nach Hilfe gesucht wird. Eine Zeichenkette (eingeschlossen in expliziten einfachen oder doppelten Anführungszeichen) wird immer als Benennung eines Themas verwendet.

Wenn der Wert von topic ein Zeichenvektor der Länge 1 ist, wird als Topic der Wert des einzigen Elements angenommen. Andernfalls muss das Thema ein Name oder ein reserviertes Wort (sofern syntaktisch gültig) oder eine Zeichenfolge sein.

Unter "Details" erfahren Sie, was passiert, wenn dies weggelassen wird.

Das ist nicht fehlerfrei, reicht aber aus, um zu verstehen, dass an der Stelle, wo das Argument topic steht, der Name des von Ihnen gesuchten Begriffes stehen muss. Das erfahren Sie sogar gleich im ersten Satz.

Zu package sagt die Übersetzung, dass Sie hier das Paket benennen können: können, nicht müssen. Das package = NULL gibt an, dass in der Voreinstellung kein spezielles Paket nach topic durchsucht wird, sondern RBase. Sollten Sie nach einer Funktion in einem bestimmten Paket suchen, geben Sie das Paket an.

Die nächsten Eintragungen in der Auflistung zu help sind ebenfalls Argumente, die Sie der Funktion hinzufügen können oder nicht.

Unter Details erscheint nun die technische Beschreibung des Umgangs mit der Funktion, z. B. bezüglich bestimmter Besonderheiten verschiedener Betriebssysteme. Das ist aber für den Informatiker interessanter als für den R-Einsteiger.

Die dann folgenden Unterpunkte (hier Offline help, Note, References und See also) sind weitere manchmal sehr nützliche, manchmal weniger nützliche zusätzliche Infos.

Für den Einsteiger unverzichtbar ist jedenfalls die immer letzte Überschrift: Examples. Hier werden funktionierende Beispiele der Anwendung der Funktion gezeigt, die Sie in der Regel durch einfaches Kopieren und Einfügen in Ihr Skript nachbilden können. Im Fall von »help« finden Sie dort z. B.:

help()
help(help) # the same
help(lapply)

Listing 3.4    Beispiel für die Verwendung von »help« in der Onlinehilfe

Probieren Sie es aus. Schreiben Sie help in Ihre Konsole, und drücken Sie auf (¢). Sofort öffnet sich die Dokumentation im Hilfe-Fenster.

3.6.2    Hilfe aus der riesigen R-Community


Vor allem am Anfang aber kann die sehr technische Beschreibung der R-eigenen Dokumentationen der Funktionen, Pakete und Datensätze für R-Anfänger kompliziert erscheinen. Abhilfe schafft die riesige frei zugängliche (open access-)R-Nutzergemeinschaft (Community).

Stack Overflow

Stack Overflow ist eine Frage-und-Antwort-Plattform zum Thema Programmierung. Sie ist zwar auf Englisch, aber mit Ihrem RStudio, das Sie auf Englisch installiert haben, kommen ja auch die Fehlermeldungen auf Englisch. Nach denen können Sie dann hier suchen und z. B. Ausschau nach Code oder Codeschnipseln halten, die Ihnen weiterhelfen. Über zehn Millionen Nutzer sind hier bereits registriert. Sie erreichen Stack Overflow auf der Webseite www.stackoverflow.com.

Abbildung 3.23    Stack-Overflow-Webseite

Um Fragen zu stellen und Antworten zu bekommen, müssen Sie sich registrieren.

Abbildung 3.24    Registrierung bei Stack Overflow

Sind Sie einmal registriert, können Sie mit dem Fragenstellen beginnen.

Abbildung 3.25    Fragen stellen 1

Abbildung 3.26    Fragen stellen 2

Achten Sie dabei unbedingt darauf, dass Sie die Formalien der Seite bei Ihren Fragestellungen einhalten. Das ist sehr wichtig, denn Fragen zu stellen ist auf Stack Overflow kein Recht, sondern ein Privileg, und die Beantwortung der Fragen ist ein Gefallen, der Ihnen von der Nutzergemeinschaft getan wird. Nutzen Sie zum Verständnis der Vorgaben im Zweifel wieder den Google Translator, und sehen Sie sich bereits gestellte Fragen an.

Meistens aber werden Sie vor allem beim Einstieg in R Probleme haben, die andere schon hatten und die auf Stack Overflow so oder so ähnlich bereits gelöst wurden. Suchen Sie zur Probe das Thema »Package«. Da Ihr Thema ein R-Thema ist, fügen Sie das auch in die Suchoption mit ein. Wenn Sie also R package suchen, schlägt Ihnen Stack Overflow bereits einige beantwortete Fragen und gelöste Probleme vor.

Abbildung 3.27    Fragenpräsenz überprüfen

YouTube

Mittlerweile ein Klassiker sind entweder kleinere Vorträge zu bestimmten Themen auf YouTube oder ganze Vorlesungen zu allen Themen. Die Webseite von YouTube ist www.youtube.com. Suchen Sie hier nach einem Video, das Ihr Problem behandelt, auch auf Deutsch! Meist finden Sie jemanden, der Ihr Problem dort gelöst hat oder z. B. einen Grundlagenkurs in R gibt (z. B. http://r-wrk.de/youtubewessel). Geplant ist auch von mir ein Vortrag zu diesem Buch und der hiesigen Einführung. Suchen Sie doch auf youtube.com einfach mal nach mir – »Benjamin Matuzak« oder genauer nach der »Einführung in die Data Science mit R für Quereinsteiger und Anfänger auf Deutsch« (z. B.: http://r-wrk.de/einfuehrung.

Weitere Hilfe

Neben Stack Overflow gibt es weitere nützliche Seiten, so z. B. CRAN und GitHub.

CRAN

Das Comprehensive R Archive Network (CRAN) ist unter der Webseite http://r-wrk.de/cran zu erreichen. CRAN ist ein Netzwerk von FTP-(Dateiübertragungsprotokoll-)Servern und Webservern auf der ganzen Welt, auf denen identische, aktuelle Versionen von Code und Dokumentation für R gespeichert und verfügbar sind. CRAN haben Sie während der Installation des Programms bereits kennengelernt.

Zudem gibt es hier eine Reihe von »Bedienungsanleitungen« für R (Manuals). Die sind aber...

Erscheint lt. Verlag 28.11.2020
Sprache deutsch
Themenwelt Mathematik / Informatik Informatik Datenbanken
Mathematik / Informatik Informatik Programmiersprachen / -werkzeuge
ISBN-10 3-8362-7894-4 / 3836278944
ISBN-13 978-3-8362-7894-2 / 9783836278942
Haben Sie eine Frage zum Produkt?
EPUBEPUB (Wasserzeichen)
Größe: 9,0 MB

DRM: Digitales Wasserzeichen
Dieses eBook enthält ein digitales Wasser­zeichen und ist damit für Sie persona­lisiert. Bei einer missbräuch­lichen Weiter­gabe des eBooks an Dritte ist eine Rück­ver­folgung an die Quelle möglich.

Dateiformat: EPUB (Electronic Publication)
EPUB ist ein offener Standard für eBooks und eignet sich besonders zur Darstellung von Belle­tristik und Sach­büchern. Der Fließ­text wird dynamisch an die Display- und Schrift­größe ange­passt. Auch für mobile Lese­geräte ist EPUB daher gut geeignet.

Systemvoraussetzungen:
PC/Mac: Mit einem PC oder Mac können Sie dieses eBook lesen. Sie benötigen dafür die kostenlose Software Adobe Digital Editions.
eReader: Dieses eBook kann mit (fast) allen eBook-Readern gelesen werden. Mit dem amazon-Kindle ist es aber nicht kompatibel.
Smartphone/Tablet: Egal ob Apple oder Android, dieses eBook können Sie lesen. Sie benötigen dafür eine kostenlose App.
Geräteliste und zusätzliche Hinweise

Buying eBooks from abroad
For tax law reasons we can sell eBooks just within Germany and Switzerland. Regrettably we cannot fulfill eBook-orders from other countries.

Mehr entdecken
aus dem Bereich
Das umfassende Handbuch

von Wolfram Langer

eBook Download (2023)
Rheinwerk Computing (Verlag)
49,90
Das umfassende Handbuch

von Jürgen Sieben

eBook Download (2023)
Rheinwerk Computing (Verlag)
89,90
der Grundkurs für Ausbildung und Praxis

von Ralf Adams

eBook Download (2023)
Carl Hanser Fachbuchverlag
29,99