Język R – wprowadzenie

Język R – wprowadzenie

Język R jest kompletnym, darmowym środowiskiem programistycznym, skoncentrowanym na obliczeniach statystycznych i numerycznych oraz graficznej prezentacji ich wyników. Jest powszechnie stosowany w wielu dziedzinach nauki, przemysłu i biznesu. Wykorzystuje się go do zwykłych obliczeń matematycznych, analizy i przetwarzania danych, uczenia maszynowego etc.

Dostępne środowiska i licencja

Dostarczany jest na licencji GNU GPL v2, co oznacza, że z powodzeniem może być wykorzystywany zarówno we własnych projektach, jaki i w komercyjnych przedsięwzięciach. Dostępny na różne platformy systemów operacyjnych (Linux, Mac, Windows). Kod źródłowy języka napisany jest głównie w C, Fortranie i R. Jego korzeni i inspiracji, które przyczyniły się do powstania języka, możemy doszukiwać się w języku S.

Wersja komercyjna

Jako ciekawostkę możemy odnotować, że istnieje odmiana środowiska R dystrybuowana przez podmiot komercyjny (Microsoft) pod nazwą Microsoft R Open.  Początkowo był to produkt firmy Revolution Analytics, a samo środowisko nazywało się wówczas – Revolution R Open. Głównym atutem tego projektu była zoptymalizowana i wydajna platforma do przetwarzania dużych zbiorów danych. Z biegiem czasu, informatyczny gigant przejął firmę wraz z jej produktem, w rezultacie powstało oprogramowanie Microsoft R Open.

Jednak w ramach tej strony internetowej będę skupiał się na darmowym, powszechnie dostępnym oprogramowaniu.

Cechy języka R

Poniżej przedstawione zostały główne cechy języka R, które go charakteryzują, wyróżniają, definiują na tle innych:

  1. Jest językiem interpretowanym, tzn. jego kolejne instrukcje są wykonywane w czasie rzeczywistym. Kolejne polecenia można wprowadzać w konsoli oczekując interaktywności środowiska, tj. konkretnej odpowiedzi na wydaną komendę.
  2. Może działać w trybie wsadowym, czyli możliwym jest uruchomienie pliku .R, który będzie zawierał przygotowany zbiór instrukcji – kod programu.
  3. Posiada centralne, darmowe, ogólnodostępne repozytorium dodatkowych bibliotek, które można pobrać w dowolnej chwili, by rozszerzyć funkcjonalność środowiska.
  4. Zorientowany jest na pracę ze zbiorami danych. Posiada typy danych niewystępujące w innych językach, które bezpośrednio pomagają w obsłudze (szczególnie dużych) zbiorów danych, np. data.frame, data.table, martix. Posiada szeroki wachlarz bibliotek wbudowanych i zewnętrznych do przetwarzania danych, np. biblioteka ff, która pomaga w obsłudze ogromnych obiektów (przechowywanie na dysku twardym zamiast w pamięci RAM).
  5. Posiada możliwość integracji z różnymi źródłami danych przy wykorzystaniu połączenia ODBC  (ang. Open DataBase Connectivity – otwarte łącze baz danych). Dzięki temu istnieje możliwość podłączenia się do różnych baz danych, np. Oracle, MySQL, SQLite, repozytoriów plikowych etc.
  6. Jest językiem ogólnego zastosowania, tj. można tworzyć oprogramowanie opisujące dowolne zagadnienie, dowolne zjawisko. Ograniczeniem (w ogromnym uproszczeniu) jest programista, który implementuje kod i jego kreatywność.
  7. Język R posiada możliwość generowania w pełni skalowalnych grafik, wizualizujących otrzymane wyniki. W połączeniu ze środowiskiem RStudio pozwala na interakcję użytkownika z oprogramowaniem udostępniając mu interfejs graficzny (ang. Graphical User Interface – GUI) – R Shiny.
  8. Jest bardzo dobrze udokumentowany. Dokumenty zebrane w oficjalnym i ogólnodostępnym repozytorium zawierają kompletną wiedzę potrzebną do wykorzystania danej biblioteki. Dodatkowo, dzięki temu, że cieszy się coraz większym zainteresowaniem i popularnością – posiada szerokie grono społeczności.
  9. Stosuje się logikę trójwartościową: PRAWDA, FAŁSZ, WARTOŚĆ NIEZNANA.
  10. Pisząc kod, należy mieć na uwadze, że rozmiar liter ma znaczenie, środowisko jest na to wrażliwe (ang. case sensitive).
Opublikowany w R

Dodaj komentarz