Nous proposons un système de vision, basé sur un réseau de caméras non-synchronisées permettant d'estimer le mouvement d'un véhicule et la structure de l'environnement 3D à l'échelle absolue. L'algorithme proposé nécessite au moins trois images prises par au moins deux caméras. Les poses relatives des caméras sont estimées par les méthodes classiques d'estimation du mouvement. Les déplacements absolus sont calculés en supposant que les trajectoires entre deux vues consécutives d'une même caméra sont rectilignes et que les caméras sont calibrées hors ligne. Une étape d'optimisation par ajustement de faisceaux est réalisée pour affiner l'estimation des facteurs d'échelle et les positions des points 3D. Notre méthode est évaluée à partir de données réelles issues de la base de données KITTI.