Dans cet article nous présentons une nouvelle approche pour la détection des émotions humaines à partir de flux d'images de profondeur. Notre analyse consiste à découper la vidéo en sous-séquences chacune représentée par un sous-espace linéaire, élément d'une variété Grassmannienne. Il en résulte une trajectoire (courbe) sur la variété qui représente la vidéo à analyser. Les outils géométriques définis sur ce type de variété permettent de calculer une signature de l'évolution dans le temps de la dynamique (mouvements) de la personne filmée par la caméra. Cette signature est présentée au fur-et-à-mesure à une détecteur précoce d'événements, appelé SOSVM, pour une analyse séquentielle . Les résultats obtenus sur la base publique Cam3D montrent l'intérêt de l'approche proposée pour l'analyse d'émotions spontanées filmées avec une caméra de bas-coût (type Kinect). Nos résultats montrent aussi que l'analyse des mouvements du corps est plus pertinente que l'analyse du visage seul dans le contexte des vidéos de profondeur.