Was ist R-Programmierung?
R ist eine der beliebtesten Skriptsprachen für statistische Programmierung heute. Die Nachfrage nach R-Programmierern steigt seit den frühen 2010er Jahren ständig an und R genießt immer noch den Status als bevorzugte Programmiersprache unter Datenwissenschaftlern.
R wurde auch an Deep Learning angepasst und hat vielen Statistikern den Einstieg in Deep Learning in ihren jeweiligen Bereichen erleichtert, was R zu einem unverzichtbaren Teil des aktuellen aufkeimenden KI-Szenarios macht.
Empfohlene Lektüre: Python Data Science Libraries
Geschichte der R-Programmiersprache
R hat einen Vorläufer namens S (S steht für Statistik), entwickelt von AT&T für statistische Berechnungen. AT&T begann seine Arbeit an S im Jahr 1976, als Teil seiner internen statistischen Analyseumgebung, die zuvor als FORTRAN-Bibliotheken implementiert wurde.
Der Mann hinter S war John Chambers. Der einbuchstabige Name S wurde durch die allgegenwärtige C-Sprache für die Programmierung zu dieser Zeit inspiriert.
R wurde von Ross Ihaka und Ross Gentleman in einem Projekt entwickelt, das 1992 an der Universität von Auckland, Neuseeland, konzipiert wurde. Die erste Version wurde 1995 veröffentlicht und die erste stabile Betaversion kam im Jahr 2000 heraus.
R unterschied sich zunächst von S, da es lexikalisches Scoping auf die bestehenden S-Funktionalitäten aufsetzte. Der einbuchstabige Name R wurde wiederum von S inspiriert, indem der erste Buchstabe der Vornamen beider Autoren genommen wurde.
R wurde unter der GNU Public License entwickelt und ist frei verteilbar.
Die S-Programmiersprache wurde später von der TIBCO Corporation, die sie von AT&T kaufte, zu S-plus weiterentwickelt, indem einige fortgeschrittene analytische Fähigkeiten und OOP-Fähigkeiten hinzugefügt wurden.
Funktionen der R-Programmierung
- Plattformunabhängig – Läuft auf verschiedenen Computerplattformen wie Windows, Linux und Mac OS.
- Portabel – Einfach auf Mobiltelefonen, Tablets und Spielkonsolen zu betreiben.
- Häufige Veröffentlichungen – Führen zu zeitnahen Fehlerbehebungen und weniger Frustration.
- Überlegene Grafiken – Kompatibilität mit ästhetischen Grafikbibliotheken wie ggplot2 und plotly gewährleistet Grafikvisualisierungen in Publikationsqualität.
- Vielseitigkeit – Hunderte von Paketen für spezifische Zwecke werden täglich von der Entwicklergemeinschaft entwickelt und verbessert.
Vorteile der R-Programmierung
R bleibt weiterhin die dominierend genutzte statistische Programmiersprache im Vergleich zu S und S-plus, und das zu Recht, aufgrund vieler seiner Tugenden.
- R wurde mit der Absicht entwickelt, eine Open-Source-Implementierung von S zu sein, daher wird R immer eine Open-Source-Software bleiben.
- R hat Tausende von professionellen Wissenschaftlern und Statistikern, die es ständig nutzen und verbessern.
- R ist kompatibel mit Windows, Mac und Linux. Es läuft fast überall und verbraucht nicht viel Platz.
- Zusätzlich zu den statistischen Verarbeitungsfunktionen kann R auch als allgemeine Programmiersprache mit funktionalen Programmier- und objektorientierten Programmierfähigkeiten verwendet werden.
- R hat weit überlegene Visualisierungsfunktionen im Vergleich zu mehreren kommerziellen Produkten, aufgrund der Beteiligung von ggplot2 und plotly.
- Die von R bereitgestellten Grafiken sind schöner und werden von Experten auf der ganzen Welt bevorzugt.
- R ist keine von Natur aus grafische Benutzeroberfläche. Es nimmt nur Befehle als Eingaben an, was es einfach macht, Befehle als Skripte zu speichern und über Domänen hinweg zu übertragen.
- R-Sitzungen werden effizient verwaltet. Ihre Befehlshistorie und Daten werden zwischen den Sitzungen gespeichert, sodass Sie dort weitermachen können, wo Sie aufgehört haben, mit wenig Aufwand.
- R hat eine reiche und ansprechende Online-Entwicklergemeinschaft.
Einschränkungen der R-Programmierung
- Steile Lernkurve: R ist keine einfache Sprache, um zu beginnen. Anfänger finden es schwer, aufgrund der Befehlszeilenschnittstelle ins kalte Wasser zu springen. IDEs wie RStudio können diese Einschränkung bis zu einem gewissen Grad überwinden. Zusätzlich kann die große Auswahl an Paketen für Anfänger verwirrend sein.
- Hungrig nach physischem Speicher: Im Gegensatz zu seinem starken Konkurrenten Python speichert R alle seine Daten im physischen Speicher. Dies macht es schwer, riesige Datensätze zu handhaben. Glücklicherweise hat sich die Hadoop-Integration für R in diesen Tagen stark verbessert, was das Problem weitgehend lindert.
- Langsamere Ausführung: R benötigt eine Menge Optimierung, bevor Ihr Code so schnell laufen kann, wie es auf MATLAB oder Python der Fall ist. Ein starkes Verständnis der internen Arbeitsweise von Objekten ist notwendig, wenn man ein Programm entwirft, um eine langsame Ausführung zu vermeiden.
Verfügbarkeit von R
R ist verfügbar als Command-Line-Interface-Umgebung beim CRAN-Projekt (steht für Comprehensive R Archive Network). Als Anfänger werden Sie jedoch schneller lernen mit Hilfe einer IDE, von denen es einige für R gibt.
- RStudio: Die beliebteste IDE für den Einstieg in R. Es sind sowohl Desktop- als auch Enterprise-Versionen verfügbar.
- StatET : Eine Eclipse-basierte IDE für die R-Programmierung und die Erstellung von Paketen.
- ESS-R-Projekt: Unterstützt neben R mehrere Statistikpakete, wie S-Plus, SAS, Stata und OpenBUGS/JAGS.