R este cel mai popular limbaj de programare open source folosit pentru analiza datelor. Luna trecută, Stack Overflow anunța că secțiunea lor dedicată acestui limbaj a avut în ultimii 5 ani una dintre cele mai ridicate rate de creștere, comparativ cu secțiunile dedicate celorlalte limbaje. Aceeași sursă l-a numit și limbajul cu cei mai puțini oameni cărora nu le place să lucreze cu el 😊 Desigur, trebuie ținut cont că are o bază mai mică de utilizatori, ceea ce este absolut normal, fiind un limbaj nișat.

Mai important, este un limbaj robust cu o comunitate solidă. A apărut în urmă cu 24 de ani pentru a fi folosit de statisticieni, iar în prezent avem aproximativ 12.000 de pachete create de comunitate, și asta doar pe site-ul „oficial”. Un pachet este o colecție de funcții care extinde capabilitățile limbajului. Pentru a observa creșterea, trebuie menționat că în iunie s-a atins cifra rotundă de 10.000 de pachete, în fiecare săptămână lansându-se câteva titluri interesante. De exemplu, în urmă cu o lună a apărut officer, un pachet care exportă din R grafice editabile pentru documentele Microsoft Office.

De ce am vrea datele noastre din Google Analytics în R? În primul rând, avem o flexibilitate mai mare pentru prelucrarea acestora. Cum spuneam mai spus, în R avem pachete pentru orice fază din analiza datelor, de la curățare și transformare, la modelare statistică, raportare și vizualizare de date și chiar generare de predicții și machine learning. Continue reading →

Tags: , ,