WO1994017485A1 - Procede d'estimation de disparite entre les images monoscopiques constituant une image stereoscopique - Google Patents

Procede d'estimation de disparite entre les images monoscopiques constituant une image stereoscopique Download PDF

Info

Publication number
WO1994017485A1
WO1994017485A1 PCT/FR1994/000057 FR9400057W WO9417485A1 WO 1994017485 A1 WO1994017485 A1 WO 1994017485A1 FR 9400057 W FR9400057 W FR 9400057W WO 9417485 A1 WO9417485 A1 WO 9417485A1
Authority
WO
WIPO (PCT)
Prior art keywords
disparity
images
vector
image
level
Prior art date
Application number
PCT/FR1994/000057
Other languages
English (en)
Inventor
Bertrand Chupeau
Original Assignee
Thomson-Csf
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson-Csf filed Critical Thomson-Csf
Priority to US08/481,394 priority Critical patent/US5727078A/en
Priority to DE69413384T priority patent/DE69413384T2/de
Priority to EP94904687A priority patent/EP0680638B1/fr
Publication of WO1994017485A1 publication Critical patent/WO1994017485A1/fr

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/53Multi-resolution motion estimation; Hierarchical motion estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/55Depth or shape recovery from multiple images
    • G06T7/593Depth or shape recovery from multiple images from stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/261Image signal generators with monoscopic-to-stereoscopic image conversion
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10004Still image; Photographic image
    • G06T2207/10012Stereo images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • G06T2207/10021Stereoscopic video; Stereoscopic image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/12Acquisition of 3D measurements of objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N13/20Image signal generators
    • H04N13/204Image signal generators using stereoscopic image cameras
    • H04N13/239Image signal generators using stereoscopic image cameras using two 2D image sensors having a relative position equal to or related to the interocular distance
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0081Depth or disparity estimation from stereoscopic image signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N13/00Stereoscopic video systems; Multi-view video systems; Details thereof
    • H04N2013/0074Stereoscopic image analysis
    • H04N2013/0085Motion estimation from stereoscopic image signals

Definitions

  • the present invention relates to a method for estimating disparity between the monoscopic images constituting a stereoscopic image. It applies in particular to the processing of stereoscopic images animated and digitized in sequences, this processing making it possible to obtain a description of the relief by measurements of the distances to the cameras for taking pictures. It applies for example to the signal processing of stereoscopic televisions or to the special effects of processing of a stereoscopic image.
  • stereoscopic images for example the detachment of an object from all types of backgrounds, other than blue in particular, requires knowledge of the relief of this object.
  • a stereoscopic image results from the combination of two monoscopic views taken by two cameras placed at different locations, the distance between the cameras being for example equal to the distance between two eyes and their direction simulating the human gaze for example.
  • Each stereoscopic image therefore consists of a pair of monoscopic images. It is known that knowing the point-to-point disparity between the images of the same pair makes it possible to deduce the distance of the filmed objects relative to the cameras and thus to deduce therefrom relief information from these objects.
  • a physical description of the differences between the two images of a stereoscopic pair is obtained by the point-to-point mapping providing vector information.
  • the disparity field consists of this vector information which is in fact linked to the change of perspective between the two images and to the distance of the cameras from the objects in the scene to be filmed.
  • a method of point-to-point mapping of two images, a left image and a right image, constituting a stereoscopic image is described in an article: PROCEEDINGS OF THE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, Miami Beach, June 22-26, 1986 , pages 219-226, IEEE, Silver Spring, US; LR WILLIAMS et al. : "A coarse-to-fine control strategy for stereo and motion on a mesh-connected commuter".
  • a hierarchical decomposition of the images is carried out there by levels of resolution, then an estimate of the disparities between these images is carried out starting from the coarsest level of resolution towards increasingly fine resolutions.
  • This method using a single pyramid of images of increasing resolutions, does not always provide a sufficiently precise estimate, in particular for fine objects or for outlines, or even when the zones of disparities are substantially uniform.
  • the point-to-point disparities between the two images of the same pair can be described by vectors, called disparity vectors, the aim of the invention is to obtain a sequence of disparity vector fields corresponding to a sequence of stereoscopic images and satisfactorily estimating the differences between the two views of a stereoscopic image, in particular with good precision.
  • the subject of the invention is a method for estimating disparity between the monoscopic images constituting a stereoscopic image, characterized in that it consists:
  • each monoscopic image by levels of resolution, by constituting at least three pyramids of images of increasing resolutions, a pyramid of low frequency images and two pyramids of high frequency images following the horizontal and vertical directions of the images;
  • FIG. 1 presents a pair of natural, monoscopic lg (t), ld (t) images, a left image lg (t) and a right image ld (t) taken at an instant t, obtained for example using of two cameras filming the same scene from two different angles.
  • the problem of estimating disparity consists in the point-to-point mapping of the two images or right and left views.
  • the disparity vector D assigned to the point Zd of the image on the right has as components (Xd-Xg, Yd-Yg). It is known that the disparity information makes it possible to calculate the distance of the points of the scene filmed with the camera, as soon as the optical and geometric parameters of the acquisition of the images are known. These parameters include focal lengths, optical centers and the distance between the two cameras.
  • Figure 2 shows side by side the two monoscopic images lg (t), ld (t) of the previous figure.
  • a vector disparity at an instant t is defined at each point Zd of the straight image ld (t), the point Zd being identified by a couple of coordinates (x, y) in this image ld (t).
  • the vector disparity at this point Zd is for example denoted D (Zd).
  • the point of the left image lg (t) corresponding to the point Zd of the straight image ld (t) being denoted Zg, it is connected to the first point Zd by the following relation:
  • a point Z'g of the right image ld (t) represents the point Zg of the left image lg (t) in the latter. It is also connected to the point Zd of the right image ld (t) by the relation (1).
  • the stereoscopic disparity estimation method between the left image lg (t) and the right image ld (t) uses a motion estimation technique between two consecutive images of a monoscopic sequence described in French Patent No. 2,663,178: "Method for hierarchical estimation of movement in a sequence of images", the right image ld (t) being assimilated to a consecutive image of the left image lg (t) and the disparity vector D being assimilated to the movement vector.
  • the same hierarchical decomposition of each monoscopic image Id (t), lg (t) is carried out by levels of resolution.
  • At least three pyramids of images of increasing resolution are constructed: a pyramid of low-frequency images and two pyramids of high-frequency images along the horizontal and vertical directions of the images ld (t), lg (t).
  • a disparity is estimated at the coarsest level of resolution, then this estimate is refined in each level of resolution as the resolution increases.
  • the disparity analysis is carried out using a hierarchical sub-band decomposition of the monoscopic images analyzed ld (t), lg (t), retaining at each level of resolution of the decomposition the low frequency band and the high frequency bands representing respectively the vertical and horizontal contours of the image.
  • FIG. 3 presents a sequence of stereoscopic images consisting of left monoscopic images Ig and right monoscopic images Id evolving as a function of time t.
  • FIG. 4 presents two series of successive left and right images of a sequence of evolution of a stereoscopic image
  • the left monoscopic image lg (t) taken at an instant t is preceded by a left monoscopic image lg (t -1) taken at an instant t-1
  • the right monoscopic image ld (t) taken at an instant t is preceded by a right monoscopic image ld (t-1) taken at an instant t-1
  • the temporal prediction of the disparity vector £> (t) at a point in the right image ld (t) is calculated from the disparity vector £> (t-1) corresponding to this point in the previous right image ld (t -1), using the motion vectors calculated between the instant t and the previous instant t-1 on the right images ld (t-1), ld (t) and left images lg (t-1), lg (t)
  • These vectors are respectively denoted Vd (t) and Vg (t), and called right motion vector and left motion vector
  • the temporal prediction of the disparity vector Z) (t) at a current point Zdc of the right image ld (t) at an instant t can for example be obtained in the following way the corresponding point Zdp in the right image ld (t-1) at the previous instant t-1 is known by the right motion vector V d ⁇ i) at the instant t, therefore these two points Zdc, Zdp are connected by the following relation
  • the point Zgp of the left image lg (t-1) at the previous instant t-1 corresponding to the point Zdp of the right image ld (t-1) taken at this same instant t-1 which corresponds to the current point Zdc of the right image ld (t) taken at the instant t is known by the disparity vector Z) (t-1) of the previous instant t-1 according to the following relation
  • a joint estimate of disparity and movement can be carried out, the movement is estimated for example independently on each of the two sequences of right images Id and left Ig.
  • the motion vector calculated on a sequence, right or left is temporally predicted only by the motion vectors calculated previously on the same sequence.
  • the motion estimation technique can be that described by French Patent No. 2,663,178.
  • the disparity is predicted temporally by the disparity calculated at the preceding instants, compensated by. the movements calculated, independently, on the right images Id and left images Ig.
  • FIGS. 5 to 7 accompany the description of improvements to the estimation method described in French patent No. 2,663,178 applicable to the estimation of movement or to the estimation of disparity of the present invention.
  • the description of the aforementioned improvements is illustrated by its application to the disparity estimation.
  • the source images 51, 52, 53, 54 of luminances are broken down into a multiresolution pyramid.
  • an image of level i, of resolution 1/2 ' is made up of L / 2' lines and C / 2 'columns. It is obtained by i low-pass filtering and i subsampling by 2 successive lines and columns.
  • This pyramid of low frequency images is deduced from a hierarchical decomposition into sub-bands as described by French patent No. 2,663,178.
  • Image analysis takes place hierarchically on the pyramid. It then consists in first carrying out an overall estimate at a coarse resolution level of the image, then in refining this estimation as the resolution of the processed images increases.
  • the disparity vectors estimated at the directly coarser resolution level 1/2 l + 1 have their modules multiplied by two to take account of the sub-sampling factor and are used for the prediction.
  • the aforementioned patent describes how this prediction can be improved by not proposing a single prediction from a coarser level immediately preceding, but four, for the calculation of a disparity vector at the current level. This amounts to bringing the contribution of a vector of the coarse level for the prediction of four to sixteen points of the next finer level.
  • the aforementioned predictions 61 can each be improved by an additional temporal prediction.
  • a disparity vector estimated at a given point at a previous instant t-1 between right images ld (t-1) and left lg (t-1) at the same level of resolution is for example projected temporally in the direction of the vector movement associated with the given point towards the images ld (t), lg (t) taken at time t.
  • a temporal prediction method which can be applied is described in French Patent No. 2,675,002: "Method for classifying the pixels of an image belonging to a sequence of moving images and method for temporal interpolation of images using said method classification".
  • the calculation of the disparity vector is carried out at any point of the image, level after level in the multiresolution pyramid, from the coarsest to the finest constituted by the original image not subsampled.
  • Four prediction vectors can be proposed when calculating each vector disparity a vector resulting from the vector calculates at the preceding instant, projected in the direction of the movement, and three calculated at the directly coarser level II follows that only a weak correction is necessary around such a prediction to obtain the good disparity vector
  • a disparity vector to be estimated D is the sum of a prediction vector P and a correction ⁇ , that is
  • the starting level of the disparity estimate in the pyramid is calculated according to the maximum disparity to be reached, fixed at a priori
  • This calculation is for example done separately for the horizontal disparity and the vertical disparity, a simple horizontal search being carried out as long as the maximum amplitude in vertical does not justify a two-dimensional search
  • the vector of disparity chosen is that which minimizes a certain function of cost as described for example in French patent No. 2,663,178
  • a cost function can be, for example, the sum of the squares of the luminance differences between the right and left images, the sum being taken for example on a window of 3 ⁇ 3 pixels centered at the point of calculation of the disparity vectors
  • the confidence is for example calculated separately by the horizontal component and the vertical component of the vector If Px is the horizontal component of the prediction vector, values Px ⁇ n are proposed for the corrected vector, n being worth for example 2 if the search is one-dimensional or 1 if the search is two-dimensional, four vectors being then proposed.
  • the vector which minimizes the cost function being chosen it has for horizontal component Pxc where Pxc belongs to the interval [Px - n, Px + n] In order to frame the minimum value of the cost function, the calculation of the confidence is made on the interval [Px-n-1, Px + n + 1], even if the choice of the minimum is made in the interval [Px-n, Px + n]
  • a confidence thus defined varies from 0 to + ⁇ and it may be advantageous to restrict all of its variations to the interval [0, 1].
  • a normalized confidence cf (Pxc) for the horizontal component Pxc of the prediction vector this normalized confidence being defined by the following relation:
  • FIG. 7 shows, by way of example, two possible cost function curves F.
  • the abscissa axis represents the values of the horizontal component Px of the prediction vector and the ordinate axis represents the cost function F.
  • a curve 71 has a large radius of curvature for the component Pxc signifying that the chosen prediction vector has strong confidence.
  • a curve 72 has a small radius of curvature for this component, signifying that the vector chosen has low confidence.
  • a confidence measure between 0 and 1, is therefore associated with the horizontal component and the vertical component of each estimated disparity vector.
  • a corrected vector is associated with each of the proposed vectors, four in number for example, and with each corrected vector there is associated a confidence and a cost value.
  • the corrected vector chosen is for example that which minimizes the cost function, which therefore has the value of minimum cost. If this minimum is not sufficiently marked, the choice is for example guided by confidence
  • An oriented smoothing, or filtering, of the disparity vectors is for example carried out in the multiresolution pyramid, at all the levels of resolution, between the estimation and the prediction of the finer level. This smoothing makes it possible in particular to propagate the values with high confidence towards the regions of the image with low confidence.
  • a smoothing technique is notably described in the article by P. Anandan: "A computational framework and an algorithm for the measurement of Visual motion", International Journal of Computer Vision, 2, 283-310, 1989
  • Smoothing is for example carried out independently on the horizontal component and the vertical component of a disparity vector.

Abstract

L'invention concerne un procédé d'estimation de disparité entre les images constituant une image stéréoscopique. Le procédé consiste: dans une première étape, à réaliser une même décomposition hiérarchique de chaque image (Id(t), Ig(t)) monoscopique, par niveaux de résolution, en constituant au moins trois pyramides d'images de résolutions croissantes, une pyramide d'images basses fréquences et deux pyramides d'images hautes fréquences suivant les directions horizontales et verticales des images; dans une deuxième étape, à estimer une disparité (D) au niveau de résolution le plus grossier et à affiner l'estimation dans chaque niveau au fur et à mesure que la résolution augmente. Application: traitement d'effets spéciaux d'images stéréoscopiques.

Description

PROCEDE D'ESTIMATION DE DISPARITE ENTRE
LES IMAGES MONOSCOPIQUES CONSTITUANT UNE IMAGE STEREOSCOPIQUE
La présente invention concerne un procédé d'estimation de disparité entre les images monoscopiques constituant une image stéréoscopique. Elle s'applique notamment au traitement d'images stéréoscopiques animées et numérisées en séquences, ce traitement permettant d'obtenir une description du relief par mesures des distances aux caméras de prises de vues. Elle s'applique par exemple au traitement du signal de télévisions stéréoscopiques ou aux effets spéciaux de traitement d'une image stéréoscopique.
Le traitement d'images stéréoscopiques, par exemple le détachement d'un objet de tous types de fonds, autres que bleus notamment, nécessite une connaissance du relief de cet objet.
Une image stéréoscopique résulte de la combinaison de deux vues monoscopiques prises par deux caméras placées à des endroits différents, la distance entre les caméras étant par exemple égale à la distance entre deux yeux et leur direction simulant le regard humain par exemple. Chaque image stéréoscopique est donc constituée d'une paire d'images monoscopiques. Il est connu que la connaissance de la disparité point à point entre les images d'une même paire permet de déduire la distance des objets filmés par rapport aux caméras et ainsi d'en déduire une information de relief de ces objets. Une description physique des différences entre les deux images d'une paire stéréoscopique est obtenue par la mise en correspondance point à point fournissant des informations vectorielles. Le champ de disparité est constitué de ces informations vectorielles qui sont en fait liées au changement de perspective entre les deux images et à la distance des caméras par rapport aux objets de la scène à filmer.
Une méthode de mise en correspondance point à point de deux images, une image gauche et une image droite, constituant une image stéréoscopique est décrite dans un article : PROCEEDINGS OF THE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION, Miami Beach, 22-26 juin 1986, pages 219-226, IEEE, Silver Spring, US ; L.R. WILLIAMS et al. : "A coarse-to-fine control strategy for stereo and motion on a mesh-connected commuter".
Une décomposition hiérarchique des images y est réalisée par niveaux de résolution, puis une estimation des disparités entre ces images est réalisée en partant du niveau de résolution le plus grossier vers des résolutions de plus en plus fines. Cette méthode, utilisant une seule pyramide d'images de résolutions croissantes, n'apporte pas toujours une estimation suffisamment précise, notamment pour des objets fins ou pour des contours, ou encore quand les zones de disparités sont sensiblement uniformes. Les disparités points à points entre les deux images d'une même paire pouvent être décrites par des vecteurs, appelés vecteurs disparité, le but de l'invention est l'obtention d'une séquence de champs de vecteurs disparité correspondant à une séquence d'images stéréoscopiques et estimant de façon satisfaisante les différences entre les deux vues d'une image stéréoscopique, notamment avec une bonne précision.
A cet effet, l'invention a pour objet un procédé d'estimation de disparité entre les images monoscopiques constituant une image stéréoscopique, caractérisé en ce qu'il consiste :
- dans une première étape, à réaliser une même décomposition hiérarchique de chaque image monoscopique, par niveaux de résolution, en constituant au moins trois pyramides d'images de résolutions croissantes, une pyramide d'images basses fréquences et deux pyramides d'images hautes fréquences suivant les directions horizontales et verticales des images ;
- dans une deuxième étape, à estimer une disparité au niveau de résolution le plus grossier et à affiner l'estimation dans chaque niveau au fur et à mesure que la résolution augmente, la disparité étant représentée en chaque point de l'image par un vecteur dont l'origine est située au point d'une des images monoscopiques et sur l'extrémité au point correspondant de l'autre image monoscopique. L'invention a pour principaux avantages qu'elle améliore la précision d'estimation, notamment au niveau des contours ou des objets fins, qu'elle peut être utilisée pour de nombreuses applications de traitement d'images stéréoscopiques, qu'elle permet d'associer à l'estimation de disparité une estimation de mouvements d'objets d'une image stéréoscopique et qu'elle est simple à mettre en oeuvre. D'autres caractéristiques et avantages de l'invention apparaîtront à l'aide de la description qui suit, faite en regard des dessins annexés qui représentent :
- la figure 1 , une paire d'images constituant une image stéréoscopique, obtenues par deux caméras filmant la même scène sur deux angles différents ;
- la figure 2, les images précédentes mises côte à côte ;
- la figure 3, une séquence d'images stéréoscopiques ;
- la figure 4, deux séries d'images gauches et droites successives d'une séquence d'évolution d'une image stéréoscopique ;
- la figure 5, une décomposition hiérarchique d'image en pyramide ;
- la figure 6, des illustrations de prédictions possibles ;
- la figure 7, des illustrations de fonctions de coût possibles.
Une paire stéréoscopique d'images peut être modélisée par deux projections en perspective dans des plans images différents de la même scène tridimensionnelle. La figure 1 présente une paire d'images lg(t), ld(t) naturelles, monoscopiques, une image gauche lg(t) et une image droite ld(t) prises à un instant t, obtenues par exemple à l'aide de deux caméras filmant la même scène sous deux angles différents. Le problème de l'estimation de disparité, consiste en la mise en correspondance point à point des deux images ou vues droite et gauche. Si un point P de l'espace, de coordonnées spatiales (X, Y, Z) se projette respectivement sur l'image gauche lg(t) et sur l'image droite ld(t) en un point Zg de coordonnées (Xg, Yg) et en un point Zd de coordonnées (Xd, Yd), le vecteur disparité D assigné au point Zd de l'image de droite a pour composantes (Xd-Xg, Yd-Yg). Il est connu que l'information de disparité permet de calculer la distance des points de la scène filmée à la caméra, dès lors que les paramètres optiques et géométriques de l'acquisition des images sont connus. Ces paramètres sont notamment les distances focales, les centres optiques et la distance entre les deux caméras.
La figure 2 présente côté à côte les deux images monoscopiques lg(t), ld(t) de la figure précédente. Un vecteur disparité à un instant t, est défini en chaque point Zd de l'image droite ld(t), le point Zd étant repéré par un couple de coordonnées (x, y) dans cette image ld(t). Le vecteur disparité en ce point Zd est par exemple noté D (Zd). Le point de l'image gauche lg(t) correspondant au point Zd de l'image droite ld(t) étant noté Zg, il est relié au premier point Zd par la relation suivante :
Zg = Zd - D{Zd) (1)
Un point Z'g de l'image droite ld(t) représente le point Zg de l'image gauche lg(t) dans cette dernière. Il est aussi relié au point Zd de l'image droite ld(t) par la relation (1 ).
Selon l'invention, le procédé d'estimation de disparité stéréoscopique entre l'image gauche lg(t) et l'image droite ld(t) utilise une technique d'estimation de mouvement entre deux images consécutives d'une séquence monoscopique décrite dans le brevet français n° 2 663 178 : "Procédé d'estimation hiérarchique du mouvement dans une séquence d'images", l'image droite ld(t) étant assimilée à une image consécutive de l'image gauche lg(t) et le vecteur disparité D étant assimilé au vecteur mouvement. Ainsi, dans une première étape, une même décomposition hiérarchique de chaque image monoscopique Id(t), lg(t) est réalisée par niveaux de résolution. Pour cela, au moins trois pyramides d'images de résolution croissante sont construites : une pyramide d'images basses fréquences et deux pyramides d'images hautes fréquences suivant les directions horizontales et verticales des images ld(t), lg(t). Dans une deuxième étape, une disparité est estimée au niveau de résolution le plus grossier, puis cette estimation est affinée dans chaque niveau de résolution au fur et à mesure que la résolution augmente.
L'analyse de la disparité est effectuée à l'aide d'une décomposition hiérarchique en sous-bandes des images monoscopiques analysées ld(t), lg(t), en conservant à chaque niveau de résolution de la décomposition la bande basse fréquence et les bandes hautes fréquences représentant respectivement les contours verticaux et horizontaux de l'image.
La figure 3 présente une séquence d'images stéréoscopiques constituée d'images monoscopiques gauches Ig et d'images monoscopiques droites Id évoluant en fonction du temps t.
L'image stéréoscopique évoluant au cours du temps, comme l'illustre la figure 3, il peut être nécessaire d'effectuer des prédictions temporelles des disparités entre les images gauches Ig et droites Id de l'image stéréoscopique. La figure 4 présente deux séries d'images gauches et droites successives d'une séquence d'évolution d'une image stéréoscopique L'image monoscopique gauche lg(t) prise a un instant t est précédée d'une image monoscopique gauche lg(t-1 ) prise à un instant t-1 De même, l'image monoscopique droite ld(t) prise à un instant t est précédée d'une image monoscopique droite ld(t-1 ) prise à un instant t-1
La prédiction temporelle du vecteur disparité £>(t) en un point de l'image droite ld(t) est calculée à partir du vecteur disparité £>(t-1 ) correspondant à ce point dans l'image droite précédente ld(t-1 ), à l'aide des vecteurs de mouvement calculés entre l'instant t et l'instant précédent t-1 sur les images droites ld(t-1 ), ld(t) et gauches lg(t-1 ), lg(t) Ces vecteurs sont respectivement notés Vd(t) et Vg(t), et appelés vecteur mouvement droit et vecteur mouvement gauche
Les vecteurs disparité et mouvement précités sont reliés par la relation suivante
~D{ι) + V g{ή = ~D{t - \) + V {ή (2)
— >
Pratiquement, la prédiction temporelle du vecteur disparité Z)(t) en un point courant Zdc de l'image droite ld(t) à un instant t peut par exemple être obtenu de la façon suivante le point correpondant Zdp dans l'image droite ld(t-1 ) à l'instant précédent t-1 est connu par le vecteur mouvement droit V d{i) à l'instant t, donc ces deux points Zdc, Zdp sont reliés par la relation suivante
Zdp = Zdc - V d(l) (3)
Le point Zgp de l'image gauche lg(t-1 ) à l'instant précédent t-1 correspondant au point Zdp de l'image droite ld(t-1 ) prise à ce même instant t-1 qui correspond au point courant Zdc de l'image droite ld(t) prise à l'instant t est connu par le vecteur disparité Z)(t-1 ) de l'instant précédent t-1 d'après la relation suivante
Zgp = Zdp - ~D{t - \) (4) Le point Zgc correspondant à ce point Zgp dans l'image gauche lg(t) à l'instant t peut être obtenu à l'aide du vecteur mouvement gauche Vg(t-1 ), pris à l'instant précédent d'après la relation suivante
Zgc = Zgp + Vg{t - \)) (5) Une prédiction temporelle du vecteur disparité £>(/) au point courant Zdc de l'image droite ld(t) à l'instant t est donnée par le vecteur formé du couple de points (Zgc, Zdc) où Zgc, correspondant au point courant Zdc de l'image droite ld(t) dans l'image gauche lg(t) au même instant t est calculé à l'aide des trois dernières relations (3), (4), (5) précédemment établies. Dans ce dernier cas, une estimation de mouvement et de disparité est ainsi proposée, dans laquel la disparité est prédite temporellement par elle-même, en corrigeant cette prédiction par le mouvement éventuel des objets dans la scène stéréoscopique. Une estimation conjointe de disparité et de mouvement peut être réalisée, le mouvement est estimé par exemple de façon indépendante sur chacune des deux séquences d'images droites Id et gauches Ig. Dans ce cas, le vecteur mouvement calculé sur une séquence, droite ou gauche, n'est prédit temporellement que par les vecteurs mouvements calculés précédemment sur la même séquence. La technique d'estimation de mouvement peut être celle décrite par le brevet français N° 2 663 178. La disparité est, elle, prédite temporellement par la disparité calculée aux instants précédents, compensée par . les mouvements calculés, indépendamment, sur les images droites Id et gauches Ig. Les relations (3), (4), (5) montrent que le vecteur prédition D{ή à un instant t nécessite la connaissance du vecteur prédiction E>(t - l) à l'instant précédent ainsi que du vecteur mouvement droit Vd(t) à l'instant t et du vecteur mouvement gauche Vg(t-1 ) à l'instant t-1.
Les figures 5 à 7 accompagnent la description d'améliorations du procédé d'estimation décrit dans le brevet français N° 2 663 178 applicables à l'estimation de mouvement ou à l'estimation de disparité de la présente invention. La description des améliorations précitées est illustrée par son application à l'estimation de disparité.
Comme l'illustre la figure 5, les images sources 51 , 52, 53, 54 de luminances sont décomposées en une pyramide multiresolution. L'image source, possédant un nombre L de lignes et un nombre C de colonnes, est par définition l'image 51 de niveau 0, de résolution 1/2° = 1/1 dans une telle pyramide. Dans cette pyramide une image de niveau i, de résolution 1/2 ', est constituée de L/2 ' lignes et C/2 ' colonnes. Elle est obtenue par i filtrages passe-bas et i sous-échantillonnages par 2 successifs en lignes et en colonnes. Cette pyramide d'images basses fréquences est déduite d'une décomposition hiérarchique en sous-bandes telle que décrite par le brevet français N° 2 663 178.
L'analyse d'image a lieu de façon hiérarchique sur la pyramide. Elle consiste alors à effectuer d'abord une estimation globale à un niveau de résolution grossier de l'image, puis à affiner cette estimation au fur et à mesure que la résolution des images traitées augmente. A chaque niveau de résolution 1/2 ' dans la pyramide, les vecteurs disparité estimés au niveau de résolution directement plus grossier 1/2 l+1 , ont leurs modules multipliés par deux pour tenir compte du facteur de sous-échantillonnage et sont utilisés pour la prédiction. Le brevet précité décrit comment cette prédiction peut être améliorée en proposant non pas une seule prédiction issue d'un niveau plus grossier immédiatement précédent, mais quatre, pour le calcul d'un vecteur disparité au niveau courant. Cela revient à porter la contribution d'un vecteur du niveau grossier pour la prédiction de quatre à seize points du niveau plus fin suivant. Cependant, il est possible par exemple de réduire le nombre de prédictions issues du niveau grossier à trois pour le calcul d'un vecteur du niveau fin. Cela revient à porter la contribution d'un vecteur du niveau grossier pour la prédiction de douze points seulement du niveau fin comme l'illustre la figure 6. Sur cette figure, une prédiction est illustrée par une flèche 61 reliant un niveau grossier 62 à un niveau plus fin 63.
Les prédictions 61 précitées peuvent être chacune améliorées par une prédiction temporelle supplémentaire. Ainsi, un vecteur disparité estimé en un point donné à un instant précédent t-1 entre des images droites ld(t-1 ) et gauche lg(t-1 ) au même niveau de résolution est par exemple projeté temporellement dans la direction du vecteur mouvement associé au point donné vers les images ld(t), lg(t) prises à l'instant t. Une méthode de prédiction temporelle qui peut être appliquée est décrite dans le brevet français N° 2 675 002 : "Procédé de classification des pixels d'une image appartenant à une séquence d'images animées et procédé d'interpolation temporelle d'images utilisant ladite classification".
Ainsi, le calcul du vecteur disparité est effectué en tout point de l'image, niveau après niveau dans la pyramide multiresolution, du plus grossier au plus fin constitué par l'image originale non sous-échantillonnée. Quatre vecteurs de prédiction peuvent être proposés lors du calcul de chaque vecteur disparité un vecteur issu du vecteur calcule à l'instant précèdent, projeté dans la direction du mouvement, et trois calculés au niveau directement plus grossier II s'ensuit que seule une correction faible est nécessaire autour d'une telle prédiction pour obtenir le bon vecteur disparité Un vecteur disparité à estimer D est la somme d'un vecteur de prédiction P et d'une correction δ , soit
D = P+ δ (6) Suivant l'amplitude maximale, en horizontal et en vertical, du vecteur disparité à estimer, la recherche autour de la prédication de ce dernier, représentée par un vecteur, peut par exemple être effectuée uniquement en horizontal ou dans les deux directions, horizontale et verticale Le brevet français n° 2 663 178 décrit une recherche dans les deux directions Une telle correction de résolution de ± 1 pixel, initialisée à 0 à un niveau N-1 de la pyramide par exemple, conduit à une valeur maximale égale à
Figure imgf000010_0001
Ainsi, le nombre de niveaux nécessaire Nmax+1 pour estimer une disparité d'amplitude maximale égale à la valeur maximale |Dmaχ| précitée est donnée par la partie entière du logarithme de base 2 de cette valeur maximale |Dmax|, soit Nmax = partie entière de log2 (|Dmax|) (8)
Afin notamment d'économiser le nombre de niveaux de résolution, il est possible de séparer le calcul du vecteur disparité en horizontal et en vertical Soient |Dx max| et |Dy max| les valeurs maximales de la disparité respectivement en horizontal et en vertical Une recherche de ± 1 pixel initialisée à 0 n'est nécessaire qu'à partir du niveau de rang Nx max en horizontal et de rang Ny max en vertical, ces niveaux Nx max, Ny max étant calculés a partir des deux relations (7) et (8) précédentes |Dx max| étant par exemple supposée supérieure à |Dy max|, une recherche uniquement horizontale est menée dans la pyramide entre les niveaux Nx max et Ny max + 1 , suivie par une recherche bidimensionnelle, en horizontal et en vertical, entre le niveau Ny max et 0
Ainsi, le niveau de départ de l'estimation de disparité dans la pyramide est calculé en fonction de la disparité maximale à atteindre, fixé a priori Ce calcul est par exemple fait séparément pour la disparité horizontale et la disparité verticale, une simple recherche horizontale étant menée tant que l'amplitude maximale en verticale ne justifie pas une recherche bidimensionelle Le vecteur de disparité choisi est celui qui minimise une certaine fonction de coût telle que décrite par exemple dans le brevet français N° 2 663 178 Une fonction de coût peut être par exemple la somme des carrés des différences de luminance entre les images droite et gauche, la somme étant prise par exemple sur une fenêtre de 3X3 pixels centrée au point de calcul des vecteurs disparité
Il est possible de déduire une mesure de confiance du vecteur de disparité choisi. Dans une zone homogène de l'image notamment, les valeurs de la fonction de coût étant sensiblement égales quel que soit le vecteur testé, la confiance dans le vecteur choisi sera faible En revanche dans une région de l'image à fort gradient, le vecteur correct correspond à un minimum très net de la fonction de coût et est donc très fiable
La confiance est par exemple calculée séparément par la composante horizontale et la composante verticale du vecteur Si Px est la composante horizontale du vecteur de prédiction, des valeurs Px ± n sont proposées pour le vecteur corrigé, n valant par exemple 2 si la recherche est monodimensionnelle ou 1 si la recherche est bidimensionnelle, quatre vecteurs étant alors proposés. Le vecteur qui minimise la fonction de coût étant choisi, il a pour composante horizontale Pxc où Pxc appartient à l'intervalle [Px - n, Px + n] De façon à encadrer la valeur minimale de la fonction de coût, le calcul de la confiance est fait sur l'intervalle [Px-n-1 , Px+n+1 ], même si le choix du minimum est fait dans l'intervalle [Px-n, Px+n]
F représentant la fonction de coût, trois valeurs de cette fonction sont disponibles F(Pxc), F(xc-1 ) et F (Pxc+1 ) La confiance conf (Pxc) dans la composante horizontale Pxc du vecteur choisi est par exemple donnée par les deux relations suivantes
, , F( PXC - \) + F{ PXC + \) - 2F{PXC) Co rb{ Pxc) = — (9) λ cour b( Pxc) , ,
ConήFxc) ~ jA ) (,0)- K étant une constante positive.
Une confiance ainsi définie varie de 0 à + ∞ et il peut être avantageux de restreindre l'ensemble de ses variations à l'intervalle [0, 1 ], Pour cela, il est possible de définir une confiance normalisée cf (Pxc) pour la composante horizontale Pxc du vecteur de prédiction, cette confiance normalisée étant définie par la relation suivante :
, N conf (Pxc) cf {Pxc) = J (1 1)
\ + conf {Pxc) en combinant les relations (10) et (11 ), il vient :
Figure imgf000012_0001
La confiance normalisée ainsi définie, tend asymptotiquement vers 1 quand la courbure de la courbe de la fonction de coût F augmente. La constante K permet de contrôler la variation de la confiance. La figure 7 présente à titre d'exemple, deux courbes de fonction de coût F possible. L'axe des abscisses représente les valeurs de la composante horizontale Px du vecteur de prédiction et l'axe des ordonnées représente la fonction de coût F. Une courbe 71 possède un fort rayon de courbure pour la composante Pxc signifiant que le vecteur de prédiction choisi possède une forte confiance. Une courbe 72 possède un faible rayon de courbure pour cette composante, signifiant que le vecteur choisi possède une faible confiance.
Des relations analogues aux relations précédentes (9), (10), (11 ), (12) peuvent être obtenues pour la composante verticale Py du vecteur de prédiction choisi, son traitement étant identique.
Une mesure de confiance, comprise entre 0 et 1 , est donc associée à la composante horizontale et à la composante verticale de chaque vecteur disparité estimé. A chacun des vecteurs proposés, au nombre de quatre par exemple, est associé un vecteur corrigé, et à chaque vecteur corrigé sont associées une confiance et une valeur de coût. Le vecteur corrigé choisi est par exemple celui qui minimise la fonction de coût, qui a donc la valeur de coût minimum. Si ce minimum n'est pas suffisamment marqué, le choix est par exemple guidé par la confiance
Un lissage orienté, ou filtrage, des vecteurs disparités est par exemple réalisé dans la pyramide multiresolution, à tous les niveaux de résolution, entre l'estimation et la prédiction du niveau plus fin. Ce lissage permet notamment de propager les valeurs à forte confiance vers les régions de l'image à faible confiance. Une technique de lissage est notamment décrite dans l'article de P. Anandan : "A computational framework and an algorithm for the measurement of Visual motion", International Journal of Computer Vision, 2, 283-310, 1989
Le lissage est par exemple mené de façon indépendante sur la composante horizontale et la composante verticale d'un vecteur disparité.

Claims

R E V E N D I C A T I O N S
1 . Procédé d'estimation de disparité entre les images monoscopiques (Id, Ig) constituant une image stéréoscopique, caractérisé en ce qu'il consiste :
- dans une première étape, à réaliser une même décomposition hiérarchique de chaque image (Id, Ig) monoscopique, par niveaux de résolution, en constituant au moins trois pyramides d'images de résolutions croissantes, une pyramide d'images basses fréquences et deux pyramides d'images hautes fréquences suivant les directions horizontales et verticales des images ;
- dans une deuxième étape, à estimer une disparité au niveau de résolution le plus grossier et à affiner l'estimation dans chaque niveau au fur et à mesure que la résolution augmente, la disparité étant représentée en chaque point de l'image par un vecteur (D) dont l'origine est située au point (Zg) d'une des images monoscopiques et sur l'extrémité au point (Zd) correspondant de l'autre image monoscopique.
2. Procédé selon la revendication 1 , caractérisé en ce qu'il consiste à effectuer l'analyse de la disparité à l'aide d'une décomposition hiérarchique en sous-bandes des images monoscopiques en conservant à chaque niveau de la décomposition la bande basse fréquence et les bandes hautes fréquences représentant respectivement les contours verticaux et horizontaux des images.
3. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que trois vecteurs de prédiction (61 ) issus du vecteur disparité calculé au niveau le plus grossier sont proposés en initialisation du vecteur disparité au niveau suivant.
4. Procédé selon la revendication 3, caractérisé en ce qu'à tous les niveaux de résolution, le vecteur de disparité (D ) estimé à un instant précédent (t-1 ) est projeté temporellement dans la direction du mouvement de façon à fournir un quatrième vecteur de prédiction pour le calcul du vecteur de disparité.
5. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce que le niveau de départ de l'estimation dans la pyramide est calculé en fonction d'une disparité maximale à atteindre, fixée a priori, le calcul étant fait séparément pour la disparité horizontale et la disparité verticale de l'image.
6. Procédé selon la revendication 5, caractérisé en ce qu'une simple recherche horizontale est menée tant que l'amplitude verticale de la disparité n'a pas atteint la disparité maximale fixée a priori.
7. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'une fonction de coût (F) est utilisée pour choisir entre les vecteurs de disparité estimés, la fonction de coût étant la somme des carrés des différences de luminance sur les points d'une fenêtre centrée au point de calcul des vecteurs disparités.
8. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'une fonction de confiance, calculée pour chaque composante des vecteurs de disparité estimés, est utilisée pour choisir entre ces derniers.
9. Procédé selon l'une quelconque des revendications précédentes, caractérisé en ce qu'à chaque niveau de résolution, après l'estimation et avant la prédiction de chaque vecteur de disparité, celui-ci est filtré par une fonction de confiance.
PCT/FR1994/000057 1993-01-19 1994-01-18 Procede d'estimation de disparite entre les images monoscopiques constituant une image stereoscopique WO1994017485A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US08/481,394 US5727078A (en) 1993-01-19 1994-01-18 Process for estimating disparity between the monoscopic images making up a sterescopic image
DE69413384T DE69413384T2 (de) 1993-01-19 1994-01-18 Verfahren zum bestimmen der ungleichheit zwischen monoskopischen bildern, die ein stereoskopisches bild darstellen
EP94904687A EP0680638B1 (fr) 1993-01-19 1994-01-18 Procede d'estimation de disparite entre les images monoscopiques constituant une image stereoscopique

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR93/00477 1993-01-19
FR9300477A FR2700654B1 (fr) 1993-01-19 1993-01-19 Procédé d'estimation de disparité entre les images monoscopiques constituant une image stéréoscopiques.

Publications (1)

Publication Number Publication Date
WO1994017485A1 true WO1994017485A1 (fr) 1994-08-04

Family

ID=9443165

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR1994/000057 WO1994017485A1 (fr) 1993-01-19 1994-01-18 Procede d'estimation de disparite entre les images monoscopiques constituant une image stereoscopique

Country Status (7)

Country Link
US (1) US5727078A (fr)
EP (1) EP0680638B1 (fr)
DE (1) DE69413384T2 (fr)
ES (1) ES2123758T3 (fr)
FR (1) FR2700654B1 (fr)
SG (1) SG48283A1 (fr)
WO (1) WO1994017485A1 (fr)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL1010920C2 (nl) * 1997-12-30 2000-12-04 Samsung Electronics Co Ltd Inrichting en werkwijze om een tweedimensionale beeldsequentie om te zetten in een driedimensionaal beeld waarbij gebruik wordt gemaakt van omzetting van beweging-dispariteit in horizontale dispariteit en een nabewerkingsmethode tijdens het genereren van een driedimensionaal beeld.

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6009188A (en) * 1996-02-16 1999-12-28 Microsoft Corporation Method and system for digital plenoptic imaging
US6693666B1 (en) * 1996-12-11 2004-02-17 Interval Research Corporation Moving imager camera for track and range capture
US6215898B1 (en) 1997-04-15 2001-04-10 Interval Research Corporation Data processing system and method
JPH10320561A (ja) * 1997-05-21 1998-12-04 Oki Data:Kk 画像処理方法及びその装置
US6031564A (en) 1997-07-07 2000-02-29 Reveo, Inc. Method and apparatus for monoscopic to stereoscopic image conversion
DE69809920T2 (de) 1997-07-28 2003-10-09 Idt Internat Digital Technolog Verfahren und vorrichtung zur mehrfachauflösung objektorientierter bewegungsschätzung
FR2767404B1 (fr) * 1997-08-12 1999-10-22 Matra Systemes Et Information Procede de production de donnees cartographiques par stereovision
JP3931392B2 (ja) * 1997-08-25 2007-06-13 ソニー株式会社 立体画像用ビデオ信号生成装置、立体画像用ビデオ信号送出装置および立体画像用ビデオ信号受信装置
US6141440A (en) * 1998-06-04 2000-10-31 Canon Kabushiki Kaisha Disparity measurement with variably sized interrogation regions
JP3798161B2 (ja) * 1998-10-29 2006-07-19 株式会社ニデック 眼底計測装置及び眼底計測プログラムを記録した記録媒体
US6771793B1 (en) * 1999-02-17 2004-08-03 Fuji Photo Film Co., Ltd. Image processing method and apparatus
DE19928341C2 (de) * 1999-06-21 2002-06-20 Inb Vision Ag Verfahren zur dreidimensionalen optischen Vermessung von Objektoberflächen
US6865289B1 (en) * 2000-02-07 2005-03-08 Canon Kabushiki Kaisha Detection and removal of image occlusion errors
US7050646B2 (en) * 1999-12-10 2006-05-23 British Telecommunications Public Limited Company Image processing system and method for image segmentation using intensity contrast and depth contrast values
US6741757B1 (en) * 2000-03-07 2004-05-25 Microsoft Corporation Feature correspondence between images using an image pyramid
US6678323B2 (en) * 2001-01-24 2004-01-13 Her Majesty The Queen In Right Of Canada, As Represented By The Minister Of Industry Through Communications Research Centre Bandwidth reduction for stereoscopic imagery and video signals
GB0125774D0 (en) * 2001-10-26 2001-12-19 Cableform Ltd Method and apparatus for image matching
US7809183B2 (en) * 2003-10-08 2010-10-05 Microsoft Corporation Gaze manipulation
KR100601958B1 (ko) 2004-07-15 2006-07-14 삼성전자주식회사 3차원 객체 인식을 위한 양안차 추정 방법
WO2006080739A1 (fr) * 2004-10-12 2006-08-03 Electronics And Telecommunications Research Institute Procede et dispositif de codage et de decodage de videos multi-vues par assemblage d'images
JP4177826B2 (ja) * 2005-03-23 2008-11-05 株式会社東芝 画像処理装置および画像処理方法
JP4887374B2 (ja) * 2005-11-30 2012-02-29 テレコム・イタリア・エッセ・ピー・アー ステレオビジョンにおいて散乱視差場を求める方法
US8160353B2 (en) * 2005-12-21 2012-04-17 Telecom Italia S.P.A. Method for determining dense disparity fields in stereo vision
US8325196B2 (en) * 2006-05-09 2012-12-04 Koninklijke Philips Electronics N.V. Up-scaling
EP1870857A1 (fr) * 2006-06-19 2007-12-26 Koninklijke Philips Electronics N.V. Estimation de mouvement global
US8830309B2 (en) * 2008-01-04 2014-09-09 3M Innovative Properties Company Hierarchical processing using image deformation
US9137518B2 (en) 2008-01-29 2015-09-15 Thomson Licensing Method and system for converting 2D image data to stereoscopic image data
US8120644B2 (en) * 2009-02-17 2012-02-21 Autoliv Asp, Inc. Method and system for the dynamic calibration of stereovision cameras
JP2011059658A (ja) * 2009-08-11 2011-03-24 Sony Corp 表示装置、表示方法およびコンピュータプログラム
DE102011109301B4 (de) * 2011-08-03 2013-05-08 3Ality Digital Systems, Llc Verfahren zum Korrigieren der Zoom-Einstellung und/oder des vertikalen Versatzes von Teilbildern eines Stereofilms sowie Steuerung oder Regelung eines Kamerarigs mit zwei Kameras
KR101841750B1 (ko) * 2011-10-11 2018-03-26 한국전자통신연구원 매칭 정보에 의한 입체 영상 보정 장치 및 그 방법
US9183461B2 (en) 2012-05-11 2015-11-10 Intel Corporation Systems and methods for row causal scan-order optimization stereo matching
US8867826B2 (en) * 2012-11-26 2014-10-21 Mitusbishi Electric Research Laboratories, Inc. Disparity estimation for misaligned stereo image pairs
EP2916290A1 (fr) * 2014-03-07 2015-09-09 Thomson Licensing Procédé et appareil d'estimation de disparité
US10380753B1 (en) 2018-05-30 2019-08-13 Aimotive Kft. Method and apparatus for generating a displacement map of an input dataset pair
CN112991254A (zh) * 2019-12-13 2021-06-18 上海肇观电子科技有限公司 视差估计系统、方法、电子设备及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0460997A1 (fr) * 1990-06-06 1991-12-11 Thomson-Csf Procédé d'estimation hiérarchique du mouvement dans une séquence d'images

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0460997A1 (fr) * 1990-06-06 1991-12-11 Thomson-Csf Procédé d'estimation hiérarchique du mouvement dans une séquence d'images

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHIENCHUNG CHANG ET AL.: "Multiresolution Stereo by Simulated annealing", PROCEEDINGS OF THE INTERNATIONAL JOINT CONFERENCE ON NEURAL NETWORKS ,SAN DIEGO (US) , JUNE 17-21 ,1990 ;IEEE NEW YORK(US), pages 885 - 890, XP000144434 *
FRANK GLAZER ET AL.: "Scene matching by hierarchical Correlation", PROCEEDINGS OF THE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION , WASHINGTON , JUIN 83 ; IEEE ,NEW YORK (US), pages 432 - 441 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NL1010920C2 (nl) * 1997-12-30 2000-12-04 Samsung Electronics Co Ltd Inrichting en werkwijze om een tweedimensionale beeldsequentie om te zetten in een driedimensionaal beeld waarbij gebruik wordt gemaakt van omzetting van beweging-dispariteit in horizontale dispariteit en een nabewerkingsmethode tijdens het genereren van een driedimensionaal beeld.

Also Published As

Publication number Publication date
DE69413384T2 (de) 1999-02-04
EP0680638A1 (fr) 1995-11-08
FR2700654A1 (fr) 1994-07-22
EP0680638B1 (fr) 1998-09-16
ES2123758T3 (es) 1999-01-16
SG48283A1 (en) 1998-04-17
US5727078A (en) 1998-03-10
DE69413384D1 (de) 1998-10-22
FR2700654B1 (fr) 1995-02-17

Similar Documents

Publication Publication Date Title
EP0680638B1 (fr) Procede d'estimation de disparite entre les images monoscopiques constituant une image stereoscopique
US11562498B2 (en) Systems and methods for hybrid depth regularization
US11044458B2 (en) Methods, systems, and computer-readable storage media for generating three-dimensional (3D) images of a scene
US10462447B1 (en) Electronic system including image processing unit for reconstructing 3D surfaces and iterative triangulation method
US8508580B2 (en) Methods, systems, and computer-readable storage media for creating three-dimensional (3D) images of a scene
US5383013A (en) Stereoscopic computer vision system
AU3554199A (en) Face recognition from video images
JPH1062140A (ja) 形状の再構成方法および形状の再構成装置
JP2996067B2 (ja) 三次元計測装置
Bonatto et al. Multiview from micro-lens image of multi-focused plenoptic camera
Orozco et al. HDR multiview image sequence generation: Toward 3D HDR video
Fishbain et al. Spatial, temporal, and interchannel image data fusion for long-distance terrestrial observation systems
CN109379577B (zh) 一种虚拟视点的视频生成方法、装置及设备
Wang et al. Depth map restoration and upsampling for kinect v2 based on ir-depth consistency and joint adaptive kernel regression
Castorena et al. Motion guided lidar-camera autocalibration and accelerated depth super resolution
JP3103028B2 (ja) 被写体の傾き検出方法
Tripathy et al. Clustering based approach for underwater sunlight flicker removal
KR101823657B1 (ko) 이종 카메라를 위한 스테레오 영상 교정 방법
CN114037804A (zh) 一种结合物体级特征约束的室内场景重构方法
Zeng et al. Combining Laplacian transform and image gradient for focal stack image fusion
YasirSalih et al. Distance and Size Measurements of Objects in the Scene from a Single 2D Image
Jovanov et al. Multiresolution example-based depth image restoration
JP2002170100A (ja) 画像間対応探索装置及び画像間対応探索方法
Bräunl et al. Stereo Image Processing
Ding et al. Direct virtual viewpoint synthesis from multiple viewpoints

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FR GB GR IE IT LU MC NL PT SE

DFPE Request for preliminary examination filed prior to expiration of 19th month from priority date (pct application filed before 20040101)
121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 1994904687

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 08481394

Country of ref document: US

WWP Wipo information: published in national office

Ref document number: 1994904687

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 1994904687

Country of ref document: EP