Architecture
5 modules intégrés — Pipeline end-to-end
Import multi-format
Importez vos données depuis n'importe quel format utilisé par les INS africains : Excel, Stata, SPSS, SAS, CSV, KoboToolbox, ODK, CSPro.
import_excel()
import_kobo()
import_stata()
import_spss()
import_odk()
import_cspro()
import_csv()
valider_dictionnaire()
# Import depuis Excel donnees <- import_excel( "enquete_menage.xlsx", feuille = "Ménages", conserver_labels = TRUE ) # Import depuis KoboToolbox kobo <- import_kobo( url = "https://kf.kobotoolbox.org/...", token = Sys.getenv("KOBO_TOKEN") )
Nettoyage et préparation
9 fonctions dédiées au nettoyage, à la vérification de la qualité et à la préparation des bases d'enquête pour l'analyse.
check_na()
check_types()
valider_qualite_donnees()
nettoyer_libelles()
imputer_valeurs()
harmoniser_regions()
standardiser_ages()
appliquer_ponderations()
# Audit qualité complet rapport <- valider_qualite_donnees( donnees, vars_cles = "id_menage" ) # Pondération complexe plan <- appliquer_ponderations( donnees, poids = "hhweight", grappe = "grappe", strate = "strate" )
Indicateurs et modèles
Calcul des indicateurs ODD, indices de pauvreté, inégalités, statistiques descriptives et modèles de régression pondérés.
stat_descr()
tab_croisee()
analyse_regression()
decomposer_inegalite()
calcul_idh()
calcul_ipm()
# Indice de Développement Humain idh <- calcul_idh( donnees, var_sante = "esperance_vie", var_educ = "scolarisation", var_revenu = "rni_log" ) # Indice de Pauvreté Multidimensionnelle ipm <- calcul_ipm(donnees, indicateurs = list(sante = c("nutrition", "mortalite"), educ = c("scolarite"), niveau_vie = c("eau", "electricite")), seuil = 1/3 )
Graphiques institutionnels
Visualisations conformes à la charte graphique des INS africains, pyramides des âges, cartes thématiques et rapports automatisés.
pyramide_ages()
graphique_barres()
carte_thematique()
theme_ins()
palette_ins()
generer_rapport()
# Pyramide des âges institutionnelle pyramide_ages(donnees, var_age = "age_annee", var_sexe = "sexe", poids = "hhweight", titre = "RGPH 2023" ) # Rapport Word/PDF automatisé generer_rapport( titre = "Rapport pauvreté 2023", sortie_format = "word" )
Publication et archivage
Anonymisation avant diffusion, métadonnées DDI, export SDMX pour les portails régionaux (AFRISTAT, PARIS21, Banque mondiale).
anonymiser_donnees()
generer_metadonnees_ddi()
exporter_sdmx()
compresser_package_diffusion()
# Anonymisation avant publication anon <- anonymiser_donnees(donnees, vars_supprimer = c("nom", "telephone"), vars_masquer = c("age"), k = 5 ) # Export SDMX pour AFRISTAT/Banque mondiale exporter_sdmx(donnees_agregees, dsd = "AFRISTAT_POVERTY", pays = "NE" )
Référentiel complet
Les 40 fonctions de statAfrikR v0.1.0
| # | Fonction | Module | Description | Documentation |
|---|---|---|---|---|
| 01 | import_excel() | Collecte | Import fichiers Excel avec gestion des en-têtes et labels | Docs → |
| 02 | import_csv() | Collecte | Import CSV — encodage et séparateur auto-détectés | Docs → |
| 03 | import_stata() | Collecte | Import .dta Stata 8 à 18 avec labels préservés | Docs → |
| 04 | import_spss() | Collecte | Import .sav SPSS avec labels et codes manquants | Docs → |
| 05 | import_sas() | Collecte | Import fichiers SAS (.sas7bdat) | Docs → |
| 06 | import_kobo() | Collecte | Import via API KoboToolbox (token requis) | Docs → |
| 07 | import_odk() | Collecte | Import depuis ODK Central | Docs → |
| 08 | import_cspro() | Collecte | Import CSPro (.csdb + .dcf) — format recensements | Docs → |
| 09 | valider_dictionnaire() | Collecte | Contrôle conformité données / dictionnaire de variables | Docs → |
| 10 | check_na() | Traitement | Audit valeurs manquantes par variable avec seuils d'alerte | Docs → |
| 11 | check_types() | Traitement | Vérification des types de variables | Docs → |
| 12 | valider_qualite_donnees() | Traitement | Score global de qualité (0-100) avec rapport détaillé | Docs → |
| 13 | nettoyer_libelles() | Traitement | Harmonisation des libellés textuels et encodage | Docs → |
| 14 | recoder_variable() | Traitement | Recodage des modalités selon une table de correspondance | Docs → |
| 15 | supprimer_doublons() | Traitement | Détection et suppression des doublons identifiants | Docs → |
| 16 | fusion_datasets() | Traitement | Fusion de plusieurs modules d'enquête sur clé commune | Docs → |
| 17 | imputer_valeurs() | Traitement | Imputation des valeurs manquantes (hot-deck, moyenne, médiane) | Docs → |
| 18 | harmoniser_regions() | Traitement | Normalisation nomenclature géographique africaine | Docs → |
| 19 | standardiser_ages() | Traitement | Correction biais de déclaration d'âge (méthode Myers) | Docs → |
| 20 | appliquer_ponderations() | Traitement | Plan de sondage complexe stratifié par grappes (package survey) | Docs → |
| 21 | stat_descr() | Analyse | Statistiques descriptives pondérées avec intervalles de confiance | Docs → |
| 22 | tab_croisee() | Analyse | Tableaux croisés pondérés avec test chi² et IC 95% | Docs → |
| 23 | analyse_regression() | Analyse | Régression linéaire/logistique pondérée sur plan de sondage | Docs → |
| 24 | decomposer_inegalite() | Analyse | Gini, Theil et décomposition des inégalités par groupe | Docs → |
| 25 | calcul_idh() | Analyse | Indice de Développement Humain — méthode PNUD officielle | Docs → |
| 26 | calcul_ipm() | Analyse | IPM méthode Alkire-Foster avec décomposition dimensionnelle | Docs → |
| 27 | tracer_flux_traitement() | Analyse | Journal complet du pipeline de traitement (audit trail) | Docs → |
| 28 | pyramide_ages() | Visualisation | Pyramide démographique institutionnelle (ggplot2) | Docs → |
| 29 | graphique_barres() | Visualisation | Graphique barres aux couleurs institutionnelles INS | Docs → |
| 30 | graphique_tendance() | Visualisation | Séries temporelles institutionnelles (IPC, prix) | Docs → |
| 31 | carte_thematique() | Visualisation | Carte choroplèthe par région ou pays (sf) | Docs → |
| 32 | analyse_spatiale() | Visualisation | Autocorrélation spatiale (indice de Moran) | Docs → |
| 33 | theme_ins() | Visualisation | Thème ggplot2 pour charte graphique INS officielle | Docs → |
| 34 | palette_ins() | Visualisation | Palettes de couleurs institutionnelles adaptées | Docs → |
| 35 | exporter_graphique() | Visualisation | Export PNG/PDF haute résolution pour publication | Docs → |
| 36 | generer_rapport() | Visualisation | Rapport Word/PDF automatisé — zéro retouche manuelle | Docs → |
| 37 | anonymiser_donnees() | Diffusion | Anonymisation k-anonymat avant diffusion publique | Docs → |
| 38 | generer_metadonnees_ddi() | Diffusion | Métadonnées DDI XML standard pour archivage | Docs → |
| 39 | exporter_sdmx() | Diffusion | Export SDMX pour portails régionaux et Banque mondiale | Docs → |
| 40 | compresser_package_diffusion() | Diffusion | Package complet données + métadonnées + documentation | Docs → |
Démarrage rapide
Installation et premier usage
# Depuis le CRAN (recommandé) install.packages("statAfrikR") # Depuis GitHub (version dev) # install.packages("remotes") remotes::install_github("damoko2004/statAfrikR") # Charger le package library(statAfrikR) # Vérifier l'installation packageVersion('statAfrikR') # → '0.1.0' # Premier usage — pipeline complet donnees <- import_excel("mon_enquete.xlsx") check_na(donnees, seuil = 0.1) plan <- appliquer_ponderations(donnees, "poids", "grappe", "strate") stats <- stat_descr(plan, vars = c("depense_menage", "taille_menage"))