Les progrès de la vision par ordinateur et des techniques d’apprentissage automatique ont conduit à un développement significatif de l’estimation de pose humaine 2D et 3D à partir de caméras RVB, de LiDAR et de radars. Cependant, l’estimation de la pose humaine à partir des images est affectée par l’occlusion et l’éclairage, qui sont courants dans de nombreux scénarios d’intérêt. Les technologies radar et LiDAR, en revanche, nécessitent un matériel spécialisé coûteux et gourmand en énergie. De plus, placer ces capteurs dans des zones non publiques soulève d’importantes préoccupations en matière de confidentialité. Pour remédier à ces limitations, des recherches récentes ont exploré l’utilisation d’antennes WiFi (capteurs 1D) pour la segmentation corporelle et la détection de points clés du corps. Cet article développe davantage l’utilisation du signal WiFi en combinaison avec des architectures d’apprentissage en profondeur, couramment utilisées en vision par ordinateur, pour estimer la correspondance de pose humaine dense. Nous avons développé un réseau neuronal profond qui cartographie la phase et l’amplitude des signaux WiFi aux coordonnées UV dans 24 régions humaines. Les résultats de l’étude révèlent que notre modèle peut estimer la pose dense de plusieurs sujets, avec des performances comparables aux approches basées sur l’image, en utilisant les signaux WiFi comme seule entrée. Cela ouvre la voie à des algorithmes peu coûteux, largement accessibles et préservant la confidentialité pour la détection humaine.

https://arxiv.org/abs/2301.00250

Share this content: