Sarah travaille comme consultante freelance. Elle aide des entreprises à intégrer les réseaux de neurones dans leurs processus. Je l'ai rencontrée un mardi matin dans son bureau à Lyon.
Racontez-nous votre semaine type.
Lundi, j'étais chez un fabricant de meubles. Ils voulaient automatiser le contrôle qualité des planches de bois. On a installé une caméra au-dessus de la chaîne de production et entraîné un réseau à détecter les défauts comme les nœuds, les fissures ou les taches. Le réseau analyse 40 images par seconde. Avant, ils avaient deux personnes qui faisaient ça manuellement et laissaient passer environ 15% des défauts.
Quel type de réseau avez-vous utilisé?
Un réseau convolutif classique, architecture ResNet-50. On l'a entraîné sur 8000 photos de planches défectueuses et 12000 photos de bonnes planches. L'entraînement a pris une journée sur leur serveur. Maintenant le taux de détection est à 94%. Pas parfait, mais largement meilleur que l'inspection humaine sur une journée de huit heures.
Et les autres jours?
Mercredi, consultation avec une clinique dentaire. Ils veulent un système pour analyser les radiographies et repérer les caries précoces. Là c'est plus délicat parce qu'on touche à la santé. Le réseau aide le dentiste mais ne remplace pas son diagnostic. On utilise un U-Net, spécialisé dans la segmentation d'images médicales. Il surligne les zones suspectes que le dentiste examine ensuite.
Jeudi et vendredi, projet complètement différent avec une boîte de e-commerce. Ils veulent prédire quels clients vont abandonner leur panier. On utilise un réseau de neurones récurrent qui analyse le comportement de navigation. Combien de temps sur chaque page, quels produits consultés, heure de connexion. Le réseau prédit avec 73% de précision si quelqu'un va acheter ou partir.
Comment gérez-vous des domaines aussi différents?
Les principes restent les mêmes. Vous avez des données en entrée, un réseau qui apprend des patterns, et une sortie. Ce qui change c'est la préparation des données et le choix de l'architecture. Pour les images, les réseaux convolutifs marchent bien. Pour les séquences temporelles comme le comportement client, les réseaux récurrents sont plus adaptés.
Quelles difficultés rencontrez-vous?
La qualité des données. Toujours. Le client du meuble avait pris des photos dans des conditions d'éclairage variables. Il a fallu normaliser tout ça. La clinique avait des radiographies de trois appareils différents. Nettoyer et harmoniser les données prend 60% du temps total du projet. L'entraînement du modèle, c'est presque la partie facile.