.. _l-td2a-mlplus: ========================================= Galleries de problèmes résolus ou presque ========================================= Cette rubrique étend la liste des références avec des articles exposant des méthodes de machine learning appliquées à des problèmes précis. Il est difficile de garder une liste à jour tant les avancées sont rapides et dans de nombreux de domaines. Le site `daily-paper-computer-vision `_ recense régulièrement des articles sur des applications du deep learning, le site est en chinois mais les articles sont en anglais. .. contents:: :local: 3D ++ Pas d'articles précis, juste une liste de problèmes résolus. * `3D-Machine-Learning `_ Apprentissage par renforcement ++++++++++++++++++++++++++++++ * `Towards Reinforcement Learning in the Real World `_ * `Open AI Spinning up `_ Awesome, Playground... ++++++++++++++++++++++ * `Awesome-Pytorch-list `_ * `pytorch-playground `_ : modèle préentraînés * `pytorch-yolo2 `_ Pretrained-models +++++++++++++++++ * `pretrained-models.pytorch `_ * `PyTorch for Semantic Segmentation `_ * `fcn - Fully Convolutional Networks `_ * `pytorch-fcn/torchfcn/models `_ Adversarial Examples ++++++++++++++++++++ * `The Limitations of Deep Learning in Adversarial Settings `_ .. _l-prob-solved-archi: Architecture de Deep Learning +++++++++++++++++++++++++++++ * `Neural Network Zooo Prequel: Cells and Layers `_ : revue d'architectures de réseaux de neurones * `Deformable Convolutional Networks `_ Compétitions et datasets ++++++++++++++++++++++++ * `ImageNet `_ * `SQuAD The Stanford Question Answering Dataset `_ Compter les objets dans une image +++++++++++++++++++++++++++++++++ * `Fully Convolutional Crowd Counting On Highly Congested Scenes `_ * `Research on Methods for Counting the Number of People in a Video Stream Using OpenCV `_ .. _l-ml2a-resolu-detexpr: Détection d'expressions +++++++++++++++++++++++ * `Prediction and Localization of Student Engagement in the Wild `_ .. _l-ml2a-resolu-detobj: Détection d'objets ++++++++++++++++++ * `Pascal VOC Dataset `_ * `YOLO9000: Better, Faster, Stronger `_ : détection en temps d'objets sur des images ou dans une vidéo, le code est sur github `darknet `_, wrapper Python : `darknetpy `_, `demo `_ * `Automatic Salient Object Detection for Panoramic Images Using Region Growing and Fixation Prediction Model `_ .. _l-ml2a-resolu-detobj3d: Détection d'objets en 3D ++++++++++++++++++++++++ * `PointNet++: Deep Hierarchical Feature Learning on Point Sets in a Metric Space `_, `Frustum PointNets for 3D Object Detection from RGB-D Data `_, (`pointnet `_, `pointnet2 `_) * `3DContextNet: K-d Tree Guided Hierarchical Learning of Point Clouds Using Local and Global Contextual Cues `_ .. _l-ml2a-resolu-detpartobj: Détection de parties d'objets +++++++++++++++++++++++++++++ * `Structured Set Matching Networks for One-Shot Part Labeling `_ Détection de positions (humaines) +++++++++++++++++++++++++++++++++ * `A 2019 guide to Human Pose Estimation with Deep Learning `_ Fraudes +++++++ * `Detecting Fraudulent Personalities in Networks of Online Auctioneers `_ Deep Learning Artistique ++++++++++++++++++++++++ * `Pramit Choudhary - Learn to be a painter using Neural Style Painting `_ (vidéo) * `Visual Attribute Transfer through Deep Image Analogy `_ * `Coherent Online Video Style Transfer `_ * `StyleBank: An Explicit Representation for Neural Image Style Transfer `_ * `msracver/Deep-Image-Analogy `_ Génération d'images à partir de texte +++++++++++++++++++++++++++++++++++++ * `AttnGAN `_, `AttnGAN: Fine-Grained Text to Image Generation with Attentional Generative Adversarial Networks `_ Histoire ++++++++ * `Revisiting Unreasonable Effectiveness of Data in Deep Learning Era `_ Images en vrac ++++++++++++++ Les réseaux de neurones profonds fonctionnent très bien sur les images car ce sont des entrées homogènes. Le traitement des images cachent plusieurs types de problématiques : * **classification** : reconnaître un object dans l'image sans savoir extactement où il est * **segmentation** : reconnaître des objects dans une images, sous la forme de boîtes englobantes ou au pixel près * **transformation** : déflouter, extraire le squelette, mettre en couleur, fusionner image et style Ce ne sont pas les seules mais ces problématiques commencent à être assez bien résolus. Il faut noter qu'on n'utilisent pas mêmes modèles s'il s'agit d'images prises par un appareil photos ou d'images médicales. * `Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation `_ : un robot apprend à imiter les mouvements d'une personne (`vidéo `_) * `Device Placement Optimization with Reinforcement Learning `_ * `Automatic Colorization `_ * `Image Completion `_ * `Perceptual Losses for Real-Time Style Transfer and Super-Resolution `_, article : `neural-style `_, code : `neural-style `_. * `Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network `_ : entraîner un réseau de neurones pour améliorer la netteté des images * `YOLO9000: Better, Faster, Stronger `_ : détection en temps d'objets sur des images ou dans une vidéo, le code est sur github `darknet `_, wrapper Python : `darknetpy `_, `demo `_ * `openalpr `_ : reconnaissance de plaques d'immatriculation, pas vraiment du deep learning * `Fully Convolutional Networks for Semantic Segmentation `_ * `Deep Supervision with Shape Concepts for Occlusion-Aware 3D Object Parsing `_ * `Best-Buddies Similarity for Robust Template Matching `_ Imitations ++++++++++ * `XIRL: Cross-embodiment Inverse Reinforcement Learning `_ (`code `_) Jeux ++++ * `Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm `_, voir quelques parties `The future is here - AlphaZero learns chess `_. Avec ce type d'algorithme adapté à la finance, le trader humain a du soucis à se faire. .. _l-prob-solved-speech: Parole ++++++ * `Achieving Human Parity in Conversational Speech Recognition `_ (2016) * `Achieving Human Parity on Automatic Chinese to English News Translation `_ (2018) * `Honk: CNNs for Keyword Spotting `_ Parole + Audio ++++++++++++++ * `Looking to Listen at the Cocktail Party: A Speaker-Independent Audio-Visual Model for Speech Separation `_ Portraits +++++++++ * `Face Segmentation `_ : il est plus facile de déterminer une boîte englobante autour d'un visage, le modèle référencé extrait un visage au pixel près, `Simple Classification Segmentation `_, `Upsampling segmentation `_ * `FaderNetworks `_ : vieillir un visage, rajeunir, ajouter des lunettes, ce réseaux de neurones a été appris pour transformer un portrait (données : `Large-scale CelebFaces Attributes (CelebA) Dataset `_) .. _l-ml2a-reconstruction-image: Reconstruction d'images +++++++++++++++++++++++ * `Deep Image Prior `_ .. _l-ml2a-resolu-sketch: Reconstruction de sketchs +++++++++++++++++++++++++ .. index:: sketch On entend par *sketch* des dessins filiformes représentant un objet, une silhouette. Cela ressemble beaucoup aux dessins présents sur les panneaux signalétiques dans la plupart des transports en commun tout autour du monde. * `SketchMate: Deep Hashing for Million-Scale Human Sketch Retrieval `_ .. _l-ml2aresolu-socnet: Réseaux Sociaux +++++++++++++++ * `Social Clicks: What and Who Gets Read on Twitter? `_ * `Real-time Detection of Content Polluters in Partially Observable Twitter Networks `_ Retail ++++++ * `Data Mining Problems in Retail `_ .. _l-prob-solved-segmentation: Segmentation d'images +++++++++++++++++++++ * `Fully Convolutional Networks for Semantic Segmentation `_ * `SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation `_ * `Pyramid Scene Parsing Network `_ * `U-Net: Convolutional Networks for Biomedical Image Segmentation `_ * `RefineNet: Multi-Path Refinement Networks for High-Resolution Semantic Segmentation `_ * `pytorch-semseg `_ * `Pixel-wise segmentation on the VOC2012 dataset using pytorch `_ * `Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation `_ * `Xception: Deep Learning with Depthwise Separable Convolutions `_ * `DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs `_ * `Rethinking Atrous Convolution for Semantic Image Segmentation `_ * `Pose2Seg: Detection Free Human Instance Segmentation `_ Suivis d'objets +++++++++++++++ * `End-to-end Active Object Tracking and Its Real-world Deployment via Reinforcement Learning `_ Texte / Traduction ++++++++++++++++++ * `Neural Machine Translation (seq2seq) Tutorial `_ * `Representing Sentences as Low-Rank Subspaces `_ * `SQuAD: 100,000+ Questions for Machine Comprehension of Text `_, cette compétition fera sans doute émerger la nouvelle version des moteurs de recherche. * `whatthelang `_ : module Python pour reconnaître la langue d'un texte, s'appuie sur :epkg:`FastText` Voiture autonome ++++++++++++++++ * `Computer Vision for Autonomous Vehicles: Problems, Datasets and State-of-the-Art `_ Notebooks +++++++++ *CNTK* * `Complex Neural Network Data Modelling with CNTK `_ *Keras* * `Using a pre-trained convnet `_