Python
Install
Questions:
Différence iPython vs. python?
Différence extension .py, .ipy, .ipynb?
IS: Installation d’Anaconda avec python 3.6 (met à dispo jupyter, spider, jupyterlab, Rstudio à installer)
Arnaud: install 3.5 direct sans librairies - IDE code
Bertrand: install python 2.XX sur fixe et 3.XX sur portable :-DD IDE idle
Sébastien: install python 2.XX
Hazael: 3.6 spider (par anaconda suivant linux ou windows)
Girault: install python 2.XX - jupyter
Dayma: anaconda 3.6 - utilisation plus en notebook
Alice: install 2.7 pour executer du code
cf. l’onglet “Learning” d’anaconda… pleins de videos
Dans quel environnement peut-on écrire les notebooks hormis jupyter?
packages
Numpy: opérations vectorisées pour la manipulation de matrices
Scipy: bibliothèque scientifique complète, construite sur numpy.
Pandas: data management de data frame (https://pandas.pydata.org)
Matplotlib: graphiques
Bokeh: graphiques interactifs
plotly: graphiques interactifs
random: la librairie préférée de bertrand. parait que c’est pour faire de l’aléatoire
nltk: trt du langage naturel (sequence de mot: qui est le sujet, verbe… fouille de données de texte)
pygeocoder: récupérer à partir d’une adresse les coordonnées GPS
pygmaps: interroger google maps
folium: interroger open street map
importation de fichiers: csv, ? xml
request: langage http
R
Install
- Commmencer par installer un IDE, par exemple, Rstudio: possibilité d’écrire des scripts (.R) des rapports rmarkdown (.Rmd => pdf ou html) des notebooks (.Rmd également => html)
https://rstudio.com/products/rstudio/download/
- Installer R à partir du CRAN (pour windows) ou synaptic (pour linux mais attention de vérifier que ce soit la dernière version sinon installer “à la main”)
Sur Windows, faire attention d’installer R dans un chemin où il n’y a ni espaces, ni accents. (pas de “C:/Program Files”, cela pose problème dans certains cas).
Packages
dplyr, tidyr, data.table, purrr: data-managment (cf. site packages Rstudio)
ggplot2: graphiques (www.cookbook-r.com/Graphs/) (cf. site packages Rstudio)
plotly, htmlwidgets: graphiques interactifs
lubridate, hms: manipulation des dates (cf. site packages Rstudio)
importation de fichiers: readr, readxl (cf. site packages Rstudio)
geospatial: sp, rgeos, maptools, raster, fields, sf
requetes: rjsonlite, httr,
Récupérer les pages de triche des packages Rstudio directement sur leur site (https://rstudio.com/resources/cheatsheets/) ou dans Rstudio (Help -> Cheatsheets)
connexion avec git/github/gitlab
Vous pouvez utiliser le versionning git sous R soit en console, soit si vous utilisez Rstudio, directement dans l’IDE, après avoir configurer un compte github ou gitlab. Lire les fiches disponibles dans le répertoire contenant ce fichier:
- RstudioGitGithubGitlab_20181107.pdf
- gitDaily.pdf
https://support.rstudio.com/hc/en-us/articles/200532077-Version-Control-with-Git-and-SVN
notebook
Quelles extensions pour executer du R ou du python? avec quels logiciels? obligation d’etre dans l’environnement jupyter??