atlas des actus
    
Stat 4 déciosion
20  février     16h27
Marre du VBA ? Passez à python
Emmanuel Jakobowicz    Vous avez forcément entendu parler du box plot que l’on appelle aussi boîte à moustache pour sa forme originale. Ce graphique tout simple permet de résumer une variable de manière simple et visuel, d’identifier les valeurs extrêmes et de comprendre la répartition des observations. La suite L...
    09h37
Gouvernance des données : principes, approches et rôles clés
stat4decision    La gouvernance des données assure la fiabilité, la sécurité et la qualité de l’information. Elle s’appuie sur des rôles dédiés CDO, Data Steward et des cadres COBIT, DAMA DMBOK, DCAM . Chacun accède aux bonnes données au bon moment. L’entreprise développe ainsi une culture data favorisant l...
14  février     00h11
Utiliser Git et la CI CD pour les projets Data : guide complet
Emmanuel Jakobowicz    Git est un système de gestion de versions distribué essentiel pour vos projets data. Il vous permet de suivre chaque modification de scripts, notebooks et fichiers de configuration, tout en facilitant la collaboration via des branches et des pull requests. Couplé à des outils de CI CD Intégration...
25  janvier     09h39
Construire un nuage de points (scatter plot) avec Python
stat4decision    Les nuages de points, ou scatter plots, permettent d’analyser les relations entre deux variables numériques. Cet article explique comment générer des données, utiliser Matplotlib pour tracer ces graphes, et personnaliser les visualisations avec Seaborn. Il aborde également des techniques pour repr...
23  janvier     10h45
Lexique de la data science
stat4decision    Ce lexique de la data science fournit des définitions essentielles sur divers termes tels que les algorithmes, l’apprentissage automatique, le big data, et les modèles d’intelligence artificielle. Il s’adresse à ceux qui cherchent à comprendre ces concepts techniques et leur impact sur l’analyse...
21  janvier     14h32
Essayez de coder en Python
stat4decision    JupyterLite est une version légère de Jupyter, permettant d’exécuter du code Python directement dans le navigateur, sans aucune installation nécessaire. Elle utilise Pyodide et WebAssembly pour exécuter Python localement. Bien que pratique pour partager des notebooks et réaliser des démos, ses...
22  décembre     15h51
KNIME : une plateforme data science 100 % open source et évolutive
stat4decision    KNIME est une plateforme open source leader en data science, lancée en et gratuite depuis . Elle permet de préparer, analyser, et automatiser des workflows de données via une interface intuitive basée sur des n uds. Ses capacités s’étendent à l’IA, le big data, et le NLP, tout en bén...
30  novembre     14h44
L’évolution du Data Scientist à l’ère de l’IA
Emmanuel Jakobowicz    Le métier de Data Scientist, décrit comme sexy par la Harvard Business Review, reste crucial malgré les avancées en IA et l’automatisation. Ce rôle pluridisciplinaire allie mathématiques, informatique et connaissances métier, évoluant vers des compétences stratégiques, éthiques et créatives....
03  septembre     15h19
Introduction à Polars : Une Alternative Rapide à Pandas
stat4decision    Polars est une bibliothèque de manipulation de données rapide, conçue pour surpasser Pandas en performances. Grâce à son architecture en Rust et à l’utilisation du format Apache Arrow, Polars optimise le traitement des données volumineuses. Elle propose des fonctionnalités comme le multi...
11  avril     16h04
Faites de ChatGPT un assistant data, et pas un décideur
Jean-Paul Maalouf    ChatGPT s’avère être un assistant data remarquable en analyse poussée des données. Il est capable de nettoyage de données, d’analyses descriptives, voire de modélisation et de Machine Learning. Dans cet article, nous décrivons une expérience dans laquelle nous avons mis à l’épreuve la pertinence...