pypmsi est un package python pour lire les fichiers du PMSI ; dans la suite de pmeasyr.
Ce code, qui en est à ses débuts, a été initié au sein du département d’information médicale du CHU de Brest en conjonction avec son
centre de données cliniques (CDC, entrepôt de données de santé) et dans la continuité des travaux réalisés
avec le DIM de l’AP-HP.
Le découpage d’un fichier .rsa de 130 000 RSA prend selon les types d’imports :
<= 1 seconde, découpage partie fixe (< 300 ms avec puce silicon)
<= 4 secondes, découpage partie fixe + parties variables actes, diags, ums (< 1 seconde avec puce silicon)
Le découpage d’un fichier .rss de 140 000 lignes prend selon les types d’imports :
<= 1 seconde, découpage partie fixe (~ 150 ms avec puce silicon)
<= 3 secondes, découpage partie fixe + parties variables actes, diags (< 600 ms seconde avec puce silicon)
Le découpage d’un fichier .rsfa avec pypmsi sur puce silicon met :
773 ms pour 1 million de lignes rafael
1,4 secondes pour 2 millions
3 secondes pour 5 millions
7 secondes pour 10 millions
14 secondes pour 20 millions
35 secondes pour 30 millions
1min 35sec secondes pour 50 millions
Installation
ou télécharger la dernière version directement sur github avec votre navigateur et l’installer ainsi :
indiquer le chemin du fichier et l’année, et le lire
(du coup le nom du fichier peut-être formaté différement : export_rock_n_roll.rss).
On peut modifier en ligne les paramètres, exemple :
Exemple sur les rsa
Quelques statistiques avec polars
Types d’imports
La typologie des imports pour les RUM et les RSA reprend celle du package pmeasyr.
On peut obtenir avec les imports “stream” des colonnes de ce type, ici au niveau des RSA :
(ici sur les RSA, typi = 3)
On peut alors filtrer sur les actes, les diags etc directement au niveau des RSA, sans jointure entre les tables :
RSA : 6 types d’imports (typi)
# 1 : partie fixe uniquement
# 2 : partie fixe + zones streams actes, das
# 3 : partie fixe + zones streams actes, das, dpum, drum, typaut
# 4 (défaut) : partie fixe + partie variable + zones streams actes, das
# 5 : partie fixe + zones streams actes, das, dpum, drum, typaut
# 6 : partie fixe + partie variable + zones streams actes, das, dpum, drum, typaut
RUM : 4 types d’imports (typi)
# 1 : partie fixe uniquement
# 2 : partie fixe + zones streams actes, das, dad
# 3 (défaut) : partie fixe + partie variable
# 4 : partie fixe + partie variable + zones streams actes, das, dad