(TIC & NTIC)’s connexion

Z/Os & Rstudio

Usines à données & Moulinettes

Aujourd’hui l’on voit, parler de Big data. L’image que l’on en a est souvent réduite à la dimension visible de ce phénomène de génération massive d’informations numériques. Logiciels de BI, de type ETL ou CRM, puis d’analytics, sont alors à l’honneur et attirent toute la lumière des spotlights.

Pour autant, il ne faut pas se fier à ce qui est surfacique, ce que l’on observe seulement ici, est pour ce qui concerne le Big Data, le point émergé de l’iceberg informatique. Cependant, il faut rester calme, boire frais, avec où sans glaçons, mais surtout, garder en tête la poussée d’Archimède !

L’intérêt de ce présent article est de montrer un lien, un trait d’union direct entre les technologies objets de type Python et R, utilisées pour la DataViz ou le reporting et les technologies hébergeant un volume considérable d’information. Une synergie entre “nouvelles technologies” et les “technologies canoniques” de l’informatique permet de construire une organisation épurée ou chaque composant à un rôle et une fonction bien précise et attribuée. En d’autres mots, pas de duplicité technico-fonctionnelle.

L’automatisation d’un tel système complexe entre  ces différentes technologies, au service du client, ou bien de la recherche, est un réel nouveau défi pour notre profession, nous autres, logiciens de l’information.

Certains l’ont fait, et ne nous ont pas attendu. Voici quelques exemples d’hybridations intéressantes qui sont retranscrites ici. Accessoirement, ce papier s’inspire  de l’outillage généré sur les technologies dominantes du secteur de l’information automatique.

Ici ou encore , d’autres innovations se construisent dans des versions stabilisées et industrialisées.

Créer des silos hermétiques entre les technologies informatiques  est une très grave erreur,  qui faute de pertinence et d’assise technique, masque en fait leur profonde complémentarité.

Alors, prêt à Tidy un fichier de centaines de millions d’enregistrements ?

Bibliographie

https://rdrr.io/github/rustyoldrake/WatsonR/

https://www.ibm.com/support/knowledgecenter/

https://cran.r-project.org/web/packages/ibmdbR/ibmdbR.pdf

https://www.tidyverse.org/