1. Introduction🔗
- Version:
Science des données - Python du 14/11/23, 14:46
- Auteur:
Yannick Copin
<ipnl.in2p3.fr>
1.1. Pourquoi un module d'analyse scientifique ?🔗
Pour générer ses données, p.ex. simulations numériques, contrôle d'expériences.
Pour traiter ses données, i.e. supprimer les artefacts observationnels.
Pour analyser ses données, i.e. extraire les quantités physiques pertinentes, p.ex. en ajustant un modèle.
Pour visualiser ses données, et appréhender leur richesse multi-dimensionnelle.
Pour présenter ses données, p.ex. générer des figures prêtes à publier.
Ce module s'addresse donc avant tout aux futurs expérimentateurs, phénoménologistes ou théoriciens voulant se frotter à la réalité des observations.
1.2. Pourquoi Python ?🔗
Les principales caractéristiques du langage Python:
syntaxe simple et lisible: langage pédagogique et facile à apprendre et à utiliser;
langage interprété: utilisation interactive ou script exécuté ligne à ligne, pas de processus de compilation;
haut niveau: typage dynamique, gestion active de la mémoire, pour une plus grande facilité d'emploi;
multi-paradigme: langage impératif et/ou orienté objet, selon les besoins et les capacités de chacun;
logiciel libre et ouvert, largement répandu (multi-plateforme) et utilisé (forte communauté);
riche bibliothèque standard: Batteries included;
riche bibliothèque externe: de nombreuses bibliothèques de qualité, dans divers domaines (y compris scientifiques), sont déjà disponibles.
L'objectif est bien d'apprendre un seul langage de haut niveau, permettant tout aussi bien des analyses rapides dans la vie de tous les jours – quelques lignes de code en intéractif – que des programmes les plus complexes (projets de plus de 100 000 lignes).
1.3. Comment lire ce cours?🔗
Ce cours a évolué au fil du temps, et inclut des parties destinées à différents publics.
Pour un (re)mise à niveau Python et une introduction à l'analyse scientifique, focalisez-vous sur:
Installation et interpréteurs,
Initiation à Python,
Bibliothèque standard,
Bibliothèques numériques de base,
Développer en Python;
Pour des concepts plus avancés, complétez avec:
Python avancé,
Bibliothèques scientifiques avancées;
Les outils de gestion de projet sont présentés dans:
Packaging,
Système de gestion de versions: git,
Documentation,
Tests.
Les éléments liés à la Science des données sont:
Outils statistiques,
Algorithmes d'analyse des données.
Des exercices de programmation Python de différents niveaux sont proposés dans la section Exercices, et des mini-projets plus conséquents dans Projets.
Liens:
Getting Started
Python Advocacy