Flux d'import avec pmeasyr et %>%
Rédiger ses imports autour d’un noyau de paramètres avec noyau_pmeasyr
.
Ce post correspond au contenu de la nouvelle vignette du package.
La syntaxe initiée dans le post précédent permet de ne préciser qu’une fois les paramètres (finess, annee, mois, path). Le package intègre désormais cette syntaxe1, c’est ce qui est présenté ici.
1 - Définir un noyau de paramètres
On précise avec progress = F
le fait que l’on ne veut pas de barre de progression lors de la lecture des fichiers.
En partant de ces paramètres à gauche et en écrivant les appels de fonctions à droite, avec %>%
et les fonctions de pmeasyr, on rend le script plus lisible, et on profite du côté “humain” de la programmation %>%
.
2 - Dézipper
Par défaut la fonction adezip()
dézippe la totalité des fichiers de l’archive PMSI, on pourra également effacer tous les fichiers avec adelete()
.
3 - Importer
Syntaxe explicite
On importe toutes les tables du MCO, la syntaxe est plus concise et va de gauche à droite :
Importer plusieurs années avec une boucle
On dézippe et on importe les rsa de 2011 à 2015. Les rsa seront dans l’environnement R avec comme nom :
rsa_2011 rsa_2012 rsa_2013 rsa_2014 rsa_2015
On peut aussi envisager un import mois par mois si besoin, ou boucler sur une liste de finess (entités géographiques).
Appel de fonctions
Pour l’exemple, on utilise ci-dessous sapply()
à la liste des fonctions MCO out, en appelant toutes les fonctions, on crée ainsi un objet contenant toutes les tables du MCO out.
irsa iano_mco iium idiap imed_mco idmi_mco ipo ileg_mco itra
rsa ano_mco ium diap med_mco dmi_mco po leg_mco tra
4 - Sauvegarde (~ library Rds)
On sauvegarde cet objet R, contenant toutes les tables du out MCO dans un fichier .rds nommé 750100042.2015.12.out.rds
.
Le répertoire suivant est créé :
'~/Documents/data/mco/tables/'
Le fichier rds se nomme :
750100042.2015.12.out.rds
5 - Effacer
On a importé toutes les données, on peut effacer les fichiers dézippés qui prennent de la place inutilement sur le disque.
6 - Relire les tables sauvegardées en rds
Avec le noyau de paramètres p
défini tout en haut de cette page, on a les éléments nécessaires pour reconstruire le nom du fichier : 750100042.2015.12.out.rds
:
Les données sont de nouveau dans l’environnement R.
-
La syntaxe standard
f(finess, annee, mois, path)
est toujours valide ↩