WO2006009257A1 - 画像処理装置および画像処理方法 - Google Patents

画像処理装置および画像処理方法 Download PDF

Info

Publication number
WO2006009257A1
WO2006009257A1 PCT/JP2005/013505 JP2005013505W WO2006009257A1 WO 2006009257 A1 WO2006009257 A1 WO 2006009257A1 JP 2005013505 W JP2005013505 W JP 2005013505W WO 2006009257 A1 WO2006009257 A1 WO 2006009257A1
Authority
WO
WIPO (PCT)
Prior art keywords
image
spatial composition
image processing
processing apparatus
camera
Prior art date
Application number
PCT/JP2005/013505
Other languages
English (en)
French (fr)
Inventor
Masaki Yamauchi
Original Assignee
Matsushita Electric Industrial Co., Ltd.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co., Ltd. filed Critical Matsushita Electric Industrial Co., Ltd.
Priority to US11/629,618 priority Critical patent/US20080018668A1/en
Priority to JP2006519641A priority patent/JP4642757B2/ja
Publication of WO2006009257A1 publication Critical patent/WO2006009257A1/ja

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T17/00Three dimensional [3D] modelling, e.g. data description of 3D objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/50Depth or shape recovery
    • G06T7/536Depth or shape recovery from perspective effects, e.g. by using vanishing points

Definitions

  • the present invention relates to a technique for generating a stereoscopic image from a still image, and in particular, an object such as a person, an object, an animal, or a building is extracted from the still image, and the depth of the entire still image including the object is extracted.
  • the present invention relates to a technique for generating three-dimensional information, which is information indicating. Background art
  • Patent Document 1 As a conventional method of obtaining stereoscopic information from a still image, there is a method of generating stereoscopic information in an arbitrary viewpoint direction from still images taken by a plurality of cameras. A method of generating an image at a different viewpoint or line-of-sight direction from that at the time of imaging by extracting stereoscopic information about the image at the time of imaging is shown (for example, see Patent Document 1). This includes left and right image input units for inputting images and a distance calculation unit for calculating object distance information, and includes an image processing circuit for generating an image viewed from an arbitrary viewpoint and line-of-sight direction. Yes. There are Patent Document 2 and Patent Document 3 as conventional technologies having the same meaning, and a highly versatile and image recording / reproducing apparatus for recording a plurality of images and parallax is presented.
  • Patent Document 4 discloses a method of recognizing an accurate three-dimensional shape of an object at high speed by imaging an object with at least three different positional forces.
  • Patent Document 5 many other documents such as Patent Document 5 are presented.
  • Patent Document 6 is a television camera with a fish-eye lens for acquiring a shape of an object without rotating it with a single camera. After taking a series of shots, the background of the shot image is removed to find the vehicle silhouette. The movement trajectory of the ground contact point of the vehicle tire in each image is obtained, and from this, the relative position between the camera viewpoint and the vehicle in each image is obtained. With this relative positional relationship, each silhouette is placed in the projection space, and each silhouette is projected onto the projection space to obtain the shape of the vehicle.
  • an epipolar technique is widely known.
  • this Patent Document 6 instead of obtaining images of a plurality of viewpoints of an object with a plurality of cameras, a moving object is targeted. 3D information acquisition by obtaining multiple images in time series It is carried out.
  • FIG. 1 is a flowchart showing the flow of processing from the generation of stereoscopic information from the still image to the generation of a stereoscopic image in the above-described prior art (of the steps in FIG. 1)
  • the step that the inside is represented by the mesh is the step by the user's manual work).
  • spatial composition information information representing the spatial composition
  • S900 information representing the spatial composition
  • the number of vanishing points is determined (S901)
  • the position of the vanishing point is adjusted (S902)
  • the inclination of the spatial composition is input (S903), and adjusted according to the position and size of the spatial composition. (S904).
  • the user inputs a mask image obtained by masking the object (S910), and three-dimensional information is also generated for the mask arrangement and the spatial composition information power (S920).
  • the user selects the area where the object is masked (S921) and one side (or one side) of the object is selected (S922), the force that makes contact with the spatial composition (S923: No), if it is non-contact (S923: No), it is input that it is non-contact (S924). If it is in contact (S923: Yes), it will contact! /
  • the coordinates of the hitting part are input (S925).
  • the above processing is performed on all surfaces of the object (S922 to S926).
  • Patent Document 1 Japanese Patent Laid-Open No. 09-009143
  • Patent Document 2 Japanese Patent Laid-Open No. 07-049944
  • Patent Document 3 Japanese Patent Application Laid-Open No. 07-095621
  • Patent Document 4 Japanese Patent Laid-Open No. 09-091436
  • Patent Document 5 Japanese Patent Application Laid-Open No. 09-305796
  • Patent Document 6 Japanese Patent Application Laid-Open No. 08-043056
  • each object in the still image is manually extracted, the background image is manually created, and the drafting spatial information such as the vanishing point is manually created.
  • This is a situation where each object is manually mapped to virtual 3D information after being set separately, and there is a problem that 3D information cannot be created easily.
  • the present invention solves the above-described conventional problems, and an object of the present invention is to provide an image processing apparatus and the like that can reduce a user's workload when generating stereoscopic information from a still image.
  • an image processing apparatus is an image processing apparatus that generates stereoscopic information from a still image, and an image acquisition unit that acquires a still image,
  • An object extracting means for extracting an object from the still image;
  • a spatial composition specifying means for specifying a spatial composition representing a virtual space including a vanishing point using features of the acquired still image;
  • the arrangement of the object tart in the virtual space is determined by associating the extracted object with the determined spatial composition, and the determined arrangement force of the object is generated as a three-dimensional information relating to the object.
  • Information generating means is an image processing apparatus that generates stereoscopic information from a still image, and an image acquisition unit that acquires a still image.
  • the image processing apparatus further assumes that a camera is assumed in the virtual space, and a viewpoint control unit that moves the position of the camera and an arbitrary position force are captured by the camera.
  • An image generating means for generating an image and an image display means for displaying the generated image are provided.
  • the viewpoint control means controls the camera to move in a range where the generated stereoscopic information exists.
  • the viewpoint control means is further characterized in that the camera controls the object so that it does not exist! [0031] With this configuration, it is possible to avoid collision and passage of an image taken by a camera moving in a virtual space with an object, and to improve the image quality.
  • the viewpoint control means is further characterized in that the camera controls to shoot a region where the object indicated by the generated stereoscopic information is present.
  • the viewpoint control means further controls the camera to move in the direction of the vanishing point.
  • the viewpoint control means further controls the camera so as to advance in the direction of the object indicated by the generated stereoscopic information.
  • the object extracting means specifies two or more non-parallel line objects from the extracted objects, and the spatial composition specifying means further includes the two or more specified lines.
  • the position of one or more vanishing points is estimated by extending the object, and the spatial composition is identified from the identified two or more linear objects and the position of the estimated vanishing point. It is characterized by.
  • the spatial composition specifying means further estimates the vanishing point even outside the still image.
  • the image processing apparatus further includes user interface means for receiving an instruction of user power, and the spatial composition specifying means is further specified according to the received instruction of user power. It is characterized by correcting the spatial composition.
  • the image processing apparatus further includes a spatial composition template storage unit that stores a spatial composition template that serves as a template for the spatial composition, and the spatial composition specifying unit is configured to store the spatial composition template in the acquired still image. It is also possible to select one spatial composition template from the spatial composition template storage means using the feature and specify the spatial composition using the selected spatial composition template.
  • the three-dimensional information generating means further calculates a grounding point where the object touches a ground plane in the spatial composition, and the three-dimensional information when the object exists at the position of the grounding point Is generated.
  • the spatial arrangement of objects can be specified more accurately, and the quality of the entire image can be improved.
  • the quality of the entire image can be improved. For example, in the case of a photograph that shows a full body image of a human, it is possible to map the human to a more accurate spatial position by calculating the contact point between the human foot and the ground plane.
  • the three-dimensional information generation start stage is characterized in that a surface that is outside the object and is in contact with the spatial composition is changed according to the type of the object.
  • the ground plane can be changed depending on the type of object, a more realistic spatial arrangement can be obtained, and the quality of the entire image can be improved.
  • the three-dimensional information generation start stage further includes at least one of the object or the ground plane when the object is unable to calculate a grounding point in contact with the ground plane of the spatial composition.
  • a virtual ground point in contact with the ground plane is calculated by interpolation, extrapolation, or interpolation, and the three-dimensional information when the outside of the object exists at the position of the virtual ground point is generated.
  • the three-dimensional information generating means further generates the three-dimensional information by giving a predetermined thickness to the object and arranging the object in a space.
  • the three-dimensional information generating means may generate the three-dimensional information by adding image processing for blurring or sharpening the periphery of the object.
  • the three-dimensional information generation means may further hide at least one of background data and data of another object that are missing due to being hidden by the shadow of the object. It is characterized by comprising.
  • the three-dimensional information generating means is characterized in that the data representing the back surface and the side surface of the object is also composed of the data force of the front surface of the object.
  • the three-dimensional information generation means is characterized in that the process related to the object is dynamically changed based on the type of the object.
  • the present invention can be realized as an image processing method using characteristic constituent means in the image processing apparatus as steps, or as a program for causing a personal computer or the like to execute these steps. And that program can be widely distributed via recording media such as DVDs and transmission media such as the Internet. Nor.
  • the image processing apparatus of the present invention it is possible to reconstruct a 3D information from a photograph (still image) into an image having a depth by a very simple operation with a force that cannot be achieved conventionally. Can do. In addition, by moving and shooting inside a 3D space with a virtual camera, you can enjoy the still images as a moving image without any complicated work. Can provide a way of enjoying.
  • FIG. 1 is a flowchart showing the contents of processing for generating stereoscopic information from a still image in the prior art.
  • FIG. 2 is a block diagram showing a functional configuration of the image processing apparatus according to the present embodiment.
  • FIG. 3 (a) is an example of an original image input to an image acquisition unit according to the present embodiment.
  • FIG. 3 (b) is an example of an image obtained by binarizing the original image of FIG. 2 (a). It is a figure which shows an original image and a binarization example.
  • FIG. 4 (a) is an example of edge extraction according to the present embodiment.
  • Fig. 4 (b) shows an example of extracting a spatial composition according to this embodiment.
  • FIG. 4 (c) is a diagram showing an example of a spatial composition confirmation screen according to the present embodiment.
  • FIGS. 5 (a) and 5 (b) are diagrams showing an example of a spatial composition extraction template in the first embodiment.
  • FIGS. 6 (a) and 6 (b) are diagrams showing an example of an enlarged spatial composition extraction template according to the first embodiment.
  • FIG. 7 (a) is a diagram showing an example of object extraction in the first embodiment.
  • FIG. 7B is an example of an image obtained by combining the extracted object and the determined spatial composition in the first embodiment.
  • FIG. 8 is a diagram showing an example of setting a virtual viewpoint in the first embodiment.
  • FIGS. 9 (a) and 9 (b) are diagrams showing a generation example of a viewpoint change image in the first embodiment.
  • FIG. 10 is an example of a spatial composition extraction template in the first embodiment (in the case of one vanishing point).
  • FIG. 11 is an example of a spatial composition extraction template in the first embodiment (in the case of two vanishing points).
  • FIGS. 12 (a) and 12 (b) are examples of a spatial composition extraction template in Embodiment 1 (in the case of including an edge line).
  • FIG. 13 is an example of a spatial composition extraction template in Embodiment 1 (in the case of a vertical type including a ridge line).
  • FIGS. 14 (a) and 14 (b) are diagrams showing an example of generation of synthetic three-dimensional information in the first embodiment.
  • FIG. 15 is a diagram showing an example of changing the viewpoint position in the first embodiment.
  • FIG. 16 (a) shows an example of changing the viewpoint position in the first embodiment.
  • FIG. 16 (b) is a diagram showing an example of an image common part in the first embodiment.
  • FIG. 16 (c) is a diagram showing an example of an image common part in the first embodiment.
  • FIG. 17 is a diagram showing a transition example of image display in the first embodiment.
  • FIGS. 18 (a) and 18 (b) are diagrams showing an example of camera movement in the first embodiment.
  • FIG. 19 is a diagram showing an example of camera movement in the first embodiment.
  • FIG. 20 is a flowchart showing a process flow in the spatial composition specifying unit in the first embodiment.
  • FIG. 21 is a flowchart showing the flow of processing in the viewpoint control unit in the first embodiment.
  • FIG. 22 is a flowchart showing a process flow in the three-dimensional information generation unit in the first embodiment. Explanation of symbols
  • FIG. 2 is a block diagram showing a functional configuration of the image processing apparatus according to the present embodiment.
  • the image processing apparatus 100 generates stereoscopic information (also referred to as three-dimensional information) from a still image (also referred to as “original image”), generates a new image using the generated stereoscopic information, and generates a stereoscopic image.
  • stereoscopic information also referred to as three-dimensional information
  • original image also referred to as “original image”
  • the image acquisition unit 101 includes a storage device such as a RAM or a memory card, acquires image data of each frame in a still image or a moving image via a digital camera, a scanner, and the like. Perform binary extraction and edge extraction.
  • a storage device such as a RAM or a memory card
  • the above-described still images or images for each frame in the moving image are collectively referred to as “still images”.
  • the spatial composition template storage unit 110 includes a storage device such as a RAM, and stores a spatial composition template used in the spatial composition specification unit 112.
  • the “spatial composition template” refers to a framework composed of multiple line forces to represent the depth in a still image, and represents the position of the start and end points of each line segment, and the position of the intersection of the line segments.
  • the information includes information such as the reference length for still images.
  • the spatial composition user IF unit 111 includes a mouse, a keyboard, a liquid crystal panel, and the like, receives an instruction from the user force, and notifies the spatial composition identification unit 112 of it.
  • the spatial composition specifying unit 112 determines a spatial composition (hereinafter also simply referred to as “composition”) for the still image based on the acquired edge information of the still image, object information described later, and the like. In addition, the spatial composition specifying unit 112 selects a spatial composition template from the spatial composition template storage unit 110 as necessary (and modifies the selected spatial composition template as necessary), and converts the spatial composition. Identify. Furthermore, the spatial composition specifying unit 112 may determine or correct the spatial composition with reference to the object extracted by the object extracting unit 122.
  • the object template storage unit 120 includes a storage device such as a RAM or a hard disk, and stores object templates, parameters, and the like for extracting the object of the acquired original image.
  • the object user IF unit 121 includes a mouse, a keyboard, and the like, and selects a method (template match, -Ural net, color information, etc.) used for extracting an object from a still image, or the above method. Select an object from among the object candidates presented by, select the object itself, or modify the selected object. It accepts user-powered operations when adding positives, templates, and methods for extracting objects.
  • a method template match, -Ural net, color information, etc.
  • the object extraction unit 122 also extracts an object with a still image force, and specifies information about the object (hereinafter referred to as "object information") such as the position, number, shape, and type of the object. In this case, it is assumed that candidates (for example, people, animals, buildings, plants, etc.) are determined in advance for the objects to be extracted. Furthermore, the object extraction unit 122 refers to the object template stored in the object template storage unit 120 as necessary, and also extracts the object based on the correlation value between each template and the object of the still image. Further, an object may be extracted or the object may be corrected with reference to the spatial composition determined by the spatial composition specifying unit 112.
  • the three-dimensional information generation unit 130 includes the spatial composition determined by the spatial composition specifying unit 112, the object information extracted by the object extraction unit 122, instructions received by the user force via the three-dimensional information user IF unit 131, and the like. Based on the above, the three-dimensional information related to the acquired still image is generated. Further, the three-dimensional information generation unit 130 is a microcomputer including a ROM, a RAM, and the like, and controls the entire image processing apparatus 100.
  • the three-dimensional information user IF unit 131 includes a mouse, a keyboard, and the like, and changes the three-dimensional information according to an instruction from the user.
  • the information correction user IF unit 140 includes a mouse, a keyboard, and the like, receives an instruction from the user, and notifies the information correction unit 141 of the instruction.
  • the information correction unit 141 corrects the erroneously extracted object, or corrects the spatial composition and the stereoscopic information that are erroneously specified based on the user instruction received via the information correction user IF unit 140.
  • other correction methods include, for example, extraction of objects up to that point, identification of spatial composition, or correction based on a rule base defined based on the generation result of three-dimensional information.
  • the three-dimensional information storage unit 150 includes a storage device such as a hard disk, and stores three-dimensional information being created and three-dimensional information generated in the past.
  • the three-dimensional information comparison unit 151 compares the whole or a part of the three-dimensional information generated in the past with the whole or a part of the three-dimensional information currently being processed (or processed), When a matching point is confirmed, information for enhancing the three-dimensional information is provided to the three-dimensional information generation unit 130.
  • the style / effect template storage unit 160 has a storage device such as a hard disk, and includes programs, data, Memorize the style or template.
  • the effect control unit 161 adds an arbitrary effect effect such as a transition effect or a color tone conversion to the new image generated by the image generation unit 170.
  • an effect group in a predetermined style may be used to give a sense of unity as a whole.
  • the effect control unit 161 adds a new template or the like to the style Z jet template storage unit 160 or edits the referenced template or the like.
  • the effect user IF unit 162 includes a mouse, a keyboard, and the like, and notifies the user control unit 161 of an instruction from the user.
  • the image generation unit 170 generates an image that three-dimensionally represents the still image based on the three-dimensional information generated by the three-dimensional information generation unit 130. Specifically, a new image derived from a still image is generated using the generated stereoscopic information.
  • the 3D image may be schematic, and the camera position and camera orientation that are good may be displayed in the 3D image. Furthermore, the image generation unit 170 generates a new image using separately specified viewpoint information, display effects, and the like.
  • the image display unit 171 is a display device such as a liquid crystal panel or a PDP, for example, and presents the image or video generated by the image generation unit 170 to the user.
  • the viewpoint change template storage unit 180 stores a viewpoint change template that indicates a predetermined three-dimensional movement of camera work.
  • the viewpoint control unit 181 determines the viewpoint position as camera work. At this time, the viewpoint control unit 181 may refer to the viewpoint change template stored in the viewpoint change template storage unit 180. Furthermore, the viewpoint control unit 181 creates, changes, and deletes a viewpoint change template based on a user instruction received via the viewpoint control user IF unit 182.
  • the viewpoint control user IF unit 182 includes a mouse, a keyboard, and the like, and notifies the viewpoint control unit 181 of an instruction related to control of the viewpoint position that has received user power.
  • the camera work setting image generation unit 190 generates an image when the current camera position force is also viewed as a reference when the user decides the camera work.
  • the image processing apparatus 100 can be configured by selecting functional elements according to necessity, not all of which are required (i.e., the department represented as “to” in FIG. 2).
  • FIG. 3 (a) is an example of an original image according to the present embodiment.
  • Fig. 3 (b) is an example of a binary image obtained by binarizing the original image.
  • the spatial composition In order to determine the spatial composition, it is important to roughly extract the spatial composition.
  • the main spatial composition hereinafter referred to as “schematic spatial composition”.
  • “binarization” is performed in order to extract a schematic spatial composition, and then fitting by template matching is performed.
  • the binary key and the template match are merely examples of the method for extracting the approximate spatial composition, and the approximate spatial composition may be extracted using any other method.
  • a detailed spatial composition may be extracted directly without extracting a schematic spatial composition.
  • the general spatial composition and the detailed spatial composition are collectively referred to as “spatial composition”.
  • the image acquisition unit 101 binarizes the original image 201 to obtain a binary image 202, and further, the binary image 202 To obtain an edge extracted image.
  • Fig. 4 (a) is an example of edge extraction according to the present embodiment
  • Fig. 4 (b) is an example of extracting a spatial composition
  • Fig. 4 (c) is for confirming the spatial composition. Is a display example.
  • the image acquisition unit 101 After binarization, the image acquisition unit 101 performs edge extraction on the binary key image 202, generates an edge extraction image 301, and outputs it to the spatial composition specifying unit 112 and the object extraction unit 122 To do.
  • the spatial composition specifying unit 112 generates a spatial composition using the edge extracted image 301. More specifically, the spatial composition specifying unit 112 extracts two or more non-parallel straight lines from the edge extraction image 301 and generates a “framework” obtained by combining these straight lines. This “framework” is the spatial composition.
  • a spatial composition extraction example 302 in Fig. 4 (b) is an example of the spatial composition generated as described above. Further, the spatial composition specifying unit 112 corrects the spatial composition in the spatial composition confirmation image 303 so as to match the content of the original image according to the user instruction received via the spatial composition user IF unit 111.
  • the spatial composition confirmation image 303 is an image for confirming the suitability of the spatial composition, and is an image obtained by combining the original image 201 and the spatial composition extraction example 302. Note that the user's instruction received via the spatial composition user IF section 111 also follows when the user makes corrections, applies other spatial composition extraction, or adjusts the spatial composition extraction example 302.
  • edge extraction is performed by “binarizing” an original image.
  • the present invention is not limited to this method, and an existing image processing method is used. Needless to say, edge extraction may be performed by a combination thereof.
  • Existing image processing methods include, but are not limited to, using color information, using luminance information, using orthogonal transformation and wavelet transformation, and using various 1D Z multidimensional filters.
  • the spatial composition is not limited to the case where the edge extraction image force is also generated as described above, but “space composition extraction”, which is a template of the spatial composition prepared in advance for extracting the spatial composition. You can decide using the “template”.
  • FIGS. 5A and 5B are examples of spatial composition extraction templates.
  • the spatial composition specifying unit 112 selects a spatial composition extraction template as shown in FIGS. 5 (a) and 5 (b) from the spatial composition template storage unit 110 as necessary, and combines it with the original image 201 for matching. It is also possible to determine the final spatial composition.
  • the spatial composition may be estimated from the arrangement information (information indicating where and what is present). Furthermore, a spatial composition can be determined by arbitrarily combining existing image processing methods such as segmentation (region division), orthogonal transformation, wavelet transformation, color information, and luminance information. As an example, the spatial composition may be determined based on the direction in which the boundary surface of each divided region is directed. In addition, meta information attached to a still image (arbitrary tag information such as EXIF) may be used. For example, it can be used for spatial composition extraction using arbitrary tag information such as “determining whether a vanishing point, which will be described later, is present in the image from the focal length and subject depth”.
  • arbitrary tag information such as EXIF
  • the spatial composition user IF unit 111 can be used as an interface for performing all input / output desired by the user, such as inputting, modifying or changing a template, inputting, modifying, or changing spatial composition information itself.
  • FIGS. 5 (a) and 5 (b) show vanishing points VP410 in each spatial composition extraction template.
  • the spatial composition extraction template is not limited to these as described later, but is a template that corresponds to an arbitrary image having depth information (or perceived as having! /).
  • a similar arbitrary template can be generated from one template.
  • a wall in the back direction
  • the spatial composition extraction template like the front back wall 420. It goes without saying that the distance in the back direction of the front back wall 420 can be moved in the same manner as the vanishing point.
  • Examples of spatial composition extraction templates include the case where there is one vanishing point, such as the spatial composition extraction template example 401 and the spatial composition extraction template example 402, and the spatial composition extraction template shown in Fig. 11. As shown in Example 1010, when there are two vanishing points (vanishing point 1001, vanishing point 100 2), or the wall composition intersects from two directions as shown in spatial composition extraction template 1110 in Figure 12! In such a case (this is also a 2 vanishing point), if it is a vertical type like the spatial composition extraction template 1210 in FIG. 13, the camera movement example 1700 in FIG. 18 (a) is shown.
  • vanishing point is linear, such as the horizon (horizontal line), or if the vanishing point is outside the image range, such as the camera movement example 1750 in Fig. 18 (b), Spatial composition generally used in fields such as CAD and design can be used arbitrarily.
  • the enlarged space composition extraction template 520 in Fig. 6 or the enlarged space is used.
  • the spatial composition extraction template can be enlarged and used. In this case, vanishing points are set even for images in which the vanishing point is outside the image, such as image range example 501, image range example 502, and image range example 503 in FIGS. 6 (a) and 6 (b). It becomes possible to do.
  • any parameter related to the spatial composition such as the position of the vanishing point can be freely changed.
  • the spatial composition extraction template 910 in FIG. 10 can respond more flexibly to various spatial compositions by changing the position of the vanishing point 910, the wall height 903 of the front back wall 902, the wall width 904, etc. be able to .
  • the spatial composition extraction template 1010 in FIG. 11 shows an example in which the positions of two vanishing points (the vanishing point 1001 and the vanishing point 1002) are arbitrarily moved.
  • the parameters of the spatial composition to be changed can be changed for any target in the spatial composition, such as the side wall surface, ceiling surface, and front back wall surface, which are not limited to the vanishing point and the front back wall. it can.
  • any state related to the surface such as the inclination of the surface and the position in the spatial arrangement, can be used as a subparameter.
  • the change method is not limited to top, bottom, left and right, and deformation such as rotation, morphing, and affine transformation may be performed.
  • FIG. 13 shows examples of vanishing points (vanishing points 1202, vanishing points 1201), ridge lines (ridge lines 1203), and ridge line widths (ridge line width 1204) in the case of a vertical spatial composition.
  • These spatial composition-related parameters may be set by user-operated operations (for example, designation, selection, correction, registration, etc., though not limited to this) via the spatial composition user IF unit 111. Good.
  • FIG. 20 is a flowchart showing the flow of processing until the spatial composition is specified in the spatial composition specifying unit 112.
  • the spatial composition specifying unit 112 acquires the edge extraction image 301 from the image acquisition unit 101
  • the spatial composition element for example, a non-parallel linear object
  • Extract (S100) is acquired from the edge extraction image 301.
  • the spatial composition specifying unit 112 calculates vanishing point position candidates (S102).
  • the spatial composition specifying unit 112 sets a horizon (S106). Further, if the position of the vanishing point candidate is not in the original image 201 (S108: No), the vanishing point is extrapolated (S110).
  • the spatial composition specifying unit 112 creates a spatial composition template including elements constituting the spatial composition centered on the vanishing point (S112), and the created spatial composition template and the template of the spatial composition component Matching (also simply “TM”) is performed (S 114).
  • an object extraction method a method used in an existing image processing method or image recognition method can be arbitrarily used. For example, for person extraction, template It can be extracted based on matches, -Ural nets, color information, etc. Segments and areas divided by segmentation and area division can be regarded as objects. If it is a still image in a moving image or a continuous still image, the frame image force object before and after can be extracted.
  • the extraction method and the extraction target are not limited to these and are arbitrary.
  • the template and parameters for object extraction described above are stored in the object template storage unit 120, and can be read out and used according to the situation. It is also possible to input new templates and parameters to the object template storage unit 120.
  • the object user IF unit 121 selects a method for extracting an object (such as a template match, a -Ural net, or color information), selects a candidate object presented as a candidate, It provides an interface to do all the work users want, such as selecting itself, modifying results, adding templates, and adding object extraction methods.
  • an object such as a template match, a -Ural net, or color information
  • FIG. 7A is a diagram showing the extracted object
  • FIG. 7B is an example of an image obtained by combining the extracted object and the determined spatial composition.
  • the object extraction example 610 the main person image is extracted from the original image 201 as objects 601, 602, 603, 604, 605, and 606 as objects.
  • Depth information synthesis example 611 is a combination of each object and spatial composition.
  • the three-dimensional information generation unit 130 can generate the three-dimensional information by arranging the extracted objects in the spatial composition as described above. Note that the three-dimensional information can be input or corrected in accordance with a user instruction received via the three-dimensional information generation user IF unit 131.
  • the image generation unit 170 newly sets a virtual viewpoint and generates an image different from the original image.
  • FIG. 22 is a flowchart showing the flow of processing in the three-dimensional information generation unit 130 described above. It is a chart.
  • the three-dimensional information generation unit 130 generates data relating to the plane in the spatial composition information force (hereinafter referred to as “composition plane data”) (S300).
  • composition plane data data relating to the plane in the spatial composition information force
  • the three-dimensional information generation unit 130 calculates a contact point between the extracted object (also referred to as “Obj”) and the composition plane (S302), and there is no contact point between the object and the ground plane (S304: No). If there is no further contact with the wall or top surface (S306: No), the position in the space is set assuming that the object is in the foreground (S308). In other cases, contact coordinates are calculated (S310), and the position of the object space is calculated (S312).
  • the three-dimensional information generation unit 130 incorporates correction contents related to the object in the information correction unit 141 (S318 to 324), and completes the generation of the three-dimensional information (S326).
  • the virtual viewpoint position 701 is considered as the viewpoint position in the space, and the virtual viewpoint direction 7002 is set as the viewpoint direction.
  • the virtual viewpoint position 701 and virtual viewpoint direction 702 for the depth information synthesis example 810 (same as depth information synthesis example 611) in Fig. 9, the virtual viewpoint When a viewpoint direction such as the viewpoint at the position 701 and the virtual viewpoint direction 702 are set (that is, when viewed from the horizontal direction with a slight advance), an image like the viewpoint change image generation example 811 can be generated.
  • FIG. 15 shows an example of an image assuming a viewpoint position and direction for an image having certain stereoscopic information.
  • An image example 1412 is an image example at the time of the image position example 1402.
  • An image example 1411 is an image example at the time of the image position example 1401.
  • the viewpoint position and the viewpoint object are schematically represented by the viewpoint position 1403 and the viewpoint object 1404.
  • FIG. 15 is used as an example in which an image is generated by setting a virtual viewpoint from an image having certain stereoscopic information.
  • the still image used to acquire the stereoscopic information is the image example 1412
  • the image when the viewpoint position 1403 and the viewpoint target 1404 are set for the stereoscopic information extracted from the image example 1412 is an image example. It can be said that it is 1412.
  • FIG. 16 shows an image example 1511 and an image example 1512 as image examples corresponding to the image position example 1501 and the image position example 1502, respectively. At this time, some of the image examples may overlap. For example, the image common part 1521 and the image common part 1521 correspond to this.
  • the viewpoint, focus, zoom, pan, etc. are applied to the inside and outside of the stereoscopic information, or a transition or effect is applied. Of course, an image can be generated.
  • image common part 1521 and image common part 1521 which is not simply generated as a moving image or a still image taken in a three-dimensional space with a virtual camera, it is cut out as a still image.
  • video or still images can be connected to each other with camera work / effects (or in a mixed video / still image situation) while corresponding common parts.
  • Figure 17 shows how images that have common parts (ie, the parts shown in bold frames) can be morphed using transitions, image transformations (affine transformations, etc.), effects, camera angle changes, camera parameter changes, etc.
  • An example is shown in which a transition is made. Identification of common parts is easily possible with the ability of information on the body, and conversely, it is possible to set camera work to have common parts.
  • FIG. 21 is a flowchart showing the flow of processing in the viewpoint control unit 181 described above.
  • the viewpoint control unit 181 sets the start point and end point of camera work (S200).
  • the start point and end point of the camera work are set approximately at the front of the virtual space, and the end point is set at a point closer to the vanishing point from the start point.
  • a predetermined database or the like may be used for setting the start point and end point.
  • the viewpoint control unit 181 determines the destination and direction of movement of the camera (S202), and determines the movement method (S204). For example, it moves from the near side to the vanishing point while passing through the vicinity of each object. Further, it may move in a spiral shape by simply moving in a straight line, or the speed may be changed during the movement. [0138] Furthermore, the viewpoint control unit 181 actually moves the camera for a predetermined distance (S206 to 224). During this time, if a camera effect such as camera pan is executed (S208: Yes), a predetermined effect subroutine is executed (S212 to S218).
  • the viewpoint control unit 181 sets the next movement destination (S228) and repeats the above processing. (S202 ⁇ S228).
  • the viewpoint control unit 181 ends the camera work when the camera moves to the end point.
  • the above-mentioned repetitive force can be used by preparing a predetermined viewpoint change template in a database, like the viewpoint change template storage unit 180, for the camera work related to these image generations. Further, a new viewpoint change template may be added to the viewpoint change template storage unit 180, or the viewpoint change template may be edited and used. Also, the viewpoint position can be determined by the user's instruction via the viewpoint control user IF section 182, or the viewpoint change template can be created / edited / added / deleted.
  • a predetermined effect Z style template can be prepared in a database and used as in the effect Z style template storage unit 160.
  • the effect Z style template storage unit 160 may be added to add an effect Z style template or edit an effect Z style template.
  • the viewpoint position may be determined by the user's instruction via the effect user IF unit 162, or the effect Z style template may be created, edited, added, and deleted.
  • any camera work depending on the object such as close to the object, close up to the object, or wrap around the object, is taken into consideration. It can also be set. Needless to say, the ability to create images that depend on the object is the same for effects other than camera work.
  • spatial composition can be taken into account when setting camera work.
  • the effect is the same.
  • the processing that takes into account the common parts described above is the process of spatial composition and objects. This is an example of camera work or effect using both, whether the generated image is a moving image or a still image, any existing camera using spatial composition and objects, camera angle, camera parameters , Image conversion, transitions, etc. can be used.
  • FIGS. 18 (a) and 18 (b) are diagrams showing an example of camera work.
  • the camera movement example 1700 showing the camerawork trajectory in Fig. 18 (a) shows the case where the virtual camera starts imaging from the starting viewpoint position 1701 and the camera moves along the camera movement line 1708. Yes. From the viewpoint position 1702, the viewpoint position 1703, the viewpoint position 1704, the viewpoint position 1705, and the viewpoint position 1706 are sequentially passed, and the camera work is ended at the end viewpoint position 1707. At the starting viewpoint position 1701, the starting viewpoint area 1710 is photographed, and at the ending viewpoint position 1707, the ending viewpoint area 1711 is photographed. During this movement, the camera movement ground projection line 1709 is obtained by projecting the camera movement onto a plane corresponding to the ground.
  • the camera moves from the start viewpoint position 1751 to the end viewpoint position 1752, and images the start viewpoint area 1760 and the end viewpoint area 1761, respectively. ing.
  • the movement of the camera during this time is shown schematically by the camera movement line 1753.
  • the locus of the camera movement line 1753 projected on the ground and the wall surface is indicated by a camera movement ground projection line 1754 and a camera movement wall projection line 1755, respectively.
  • an image can be generated at any timing that moves on the camera movement line 1708 and the camera movement line 1753 (it goes without saying that it can be a moving image, a still image, or a mixture of both). .
  • the camera work setting image generation unit 190 generates an image when the current camera position force is also viewed and presents it to the user so that the user can determine the camera work.
  • An example of this is shown in a camera image generation example 1810 in FIG. In FIG. 19, the image when the shooting range 1805 is shot from the current camera position 1803 is displayed as the current camera image 1 804.
  • FIGS. 14 (a) and 14 (b) are diagrams showing an example in the case of combining a plurality of three-dimensional information.
  • the current image data object A1311 and the current image data object B1312 are shown in the current image data 1301, and the past image data object A1313 and the past image data object are included in the past image data 1302.
  • the case where B1314 is shown is shown. In this case, two image data can be combined in the same three-dimensional space.
  • a synthesis example in this case is a synthesis three-dimensional information example 1320 shown in FIG.
  • composition may be performed from common elements between a plurality of original images. Also, completely different original image data may be synthesized, and the spatial composition may be changed as necessary.
  • “fate” refers to the overall effects on images (still images and moving images).
  • effects include general non-linear image processing methods, and those that can be given (can be given) when shooting is possible by changing camera work, camera angle, and camera parameters.
  • processing can be performed with general digital image processing software.
  • placing music and onomatopoeia according to the image scene also falls within the category of effects.
  • effects are written together with other terms that express the effects included in the definition of the effect, such as camera angles, the written effects are emphasized and the category of the effects is narrowed. Specify that it is not.
  • the thickness information about the extracted object may be missing.
  • it is also possible to set an appropriate value as the thickness based on the depth information an arbitrary method such as calculating the relative depth of the depth information and setting the thickness appropriately from the size.
  • a template or the like is prepared in advance, the object is recognized, and the recognition result may be used for setting the thickness. For example, if it is recognized as an apple, the thickness may be set to a size corresponding to an apple, and if it is recognized as a car, the thickness may be set to a size corresponding to a car.
  • the vanishing point may be set in the object. Even objects that are not actually at infinity can be treated as being at infinity.
  • mapping the extracted object to the three-dimensional information it may be rearranged at an appropriate position in the depth information. It is not always necessary to map to a position that is faithful to the original image data. It is easy to apply effects!
  • information corresponding to the back side of the object may be appropriately given. It is possible that information on the back side of the object cannot be obtained from the original image, but the information on the back side may be set based on the information on the front side (for example, image information corresponding to the front side of the object). (In terms of 3D information, information corresponding to textures, polygons, etc.) is also copied to the back of the object). Of course, information on the back side may be set with reference to other objects and other spatial information.
  • any smoothing process may be performed to make the object and background appear smoother.
  • the camera parameters may be changed based on the positions of objects arranged three-dimensionally as spatial information.
  • focus information (out-of-focus information) may be generated based on the camera position Z depth from the object position or spatial composition when generating an image, and a perspective image may be generated.
  • focus information may be generated based on the camera position Z depth from the object position or spatial composition when generating an image, and a perspective image may be generated.
  • only the object may be squeezed, or the object and its surroundings may be squeezed.
  • the power of the functional configuration separated as the viewpoint control user IF unit 182 may be configured to have one IF unit having the functions of each IF unit described above.
  • the present invention provides a static computer such as a microcomputer, a digital camera, or a camera-equipped mobile phone.
  • the present invention can be used for an image processing apparatus that generates a stereoscopic image from a still image.

Abstract

 静止画像から立体情報を生成する際における、ユーザの作業負荷の軽減を可能とする。  立体情報生成部130と、空間構図特定部112と、オブジェクト抽出部122と、立体情報ユーザIF部131と、空間構図ユーザIF部111と、オブジェクトユーザIF部121とを備え、取得した原画像から空間構図とオブジェクトをそれぞれ抽出し、その仮想空間内にオブジェクトを配置させることにより、オブジェクトに関する立体情報を生成すると共に、その仮想空間内を移動するカメラから撮影された画像を生成するため、原画像とは異なった視点における立体的な映像を生成することが可能となる。                                                                         

Description

明 細 書
画像処理装置および画像処理方法
技術分野
[0001] 本発明は、静止画像から立体画像を生成する技術に関し、特に静止画像の中から 人や物、動物、建造物などのオブジェクトを抽出し、当該オブジェクトを含む静止画 像全体についての奥行きを示す情報である立体情報を生成する技術に関する。 背景技術
[0002] 従来の静止画像カゝら立体情報を得る方法として、複数のカメラで撮った静止画像か ら任意視点方向の立体情報を生成する手法がある。撮像時に画像に関する立体情 報を抽出することにより、撮像時と異なる視点や視線方向における画像を生成する方 法が示されている(例えば、特許文献 1参照)。これは、画像を入力する左右の画像 入力部と、被写体の距離情報を演算する距離演算部などを有しており、任意の視点 及び視線方向から見た画像を生成する画像処理回路を備えている。同趣旨の従来 技術としては特許文献 2や特許文献 3があり、複数の画像および視差をそれぞれ記 録する汎用性の高!、画像記録再生装置が提示されて 、る。
[0003] また、特許文献 4には、少なくとも異なる 3つの位置力も物体を撮像して、物体の正 確な 3次元形状を高速で認識する手法が示されており、他にも複数カメラ系は、他に も特許文献 5など多数提示されて ヽる。
[0004] また、特許文献 6は、 1台のカメラで物体を回転させることなくその形状を取得するこ とを目的として、魚眼レンズを付けたテレビカメラで、移動物体 (車両)を一定の区間 の間撮影し、その各撮影画像力も背景画像を除去して車両のシルエットを求めて ヽ る。各画像の車両タイヤの接地点の移動軌跡を求め、これより、カメラの視点と各画 像における車両との相対位置を求める。この相対位置関係で投影空間に対し各シル エツトを配し、その各シルエットを投影空間に投影して、車両の形状を取得している。 複数画像から立体情報の取得を行う手法としては、ェピポーラによる手法が広く知ら れているが、この特許文献 6では、複数のカメラで対象物の複数視点の画像を得る代 わりに、移動物体を対象として時系列的に複数の画像を得ることで立体情報の取得 を行っている。
[0005] また、単一の静止画像から 3次元構造を抽出し表示する手法としては、 HOLON社 製パッケージソフトとして「Motion Impact」が挙げられる。これは、一枚の静止画像か ら仮想的に立体情報を作り出すものであり、以下のステップで立体情報を構築する。
[0006] 1)オリジナル画像 (画像 A)を用意する。
[0007] 2)別途画像処理ソフト(レタッチソフトなど)を使用し、オリジナル画像か ら「立体 化させるオブジェクトを消した画像 (画像 B)」と「立体化させる オブジェクトのみをマ スク化した画像 (画像 C)」を作る。
[0008] 3)画像 A〜Cをそれぞれ「Motion Impact」に登録する。
[0009] 4)オリジナル画像中の消失点を設定し、写真に立体的な空間を設定する。
[0010] 5)立体化させた 、オブジェクトを選択する。
[0011] 6)カメラアングルやカメラモーションを設定する。
[0012] 図 1は、上記従来技術における静止画像から立体情報を生成し、さらに立体的な映 像を生成するまでの処理の流れを示すフローチャートである(なお、図 1における各ス テツプのうち、内部をメッシュで表したステップがユーザの手作業によるステップであ る)。
[0013] 静止画像が入力されると、ユーザの手作業によって空間構図を表す情報 (以下「空 間構図情報」という。)が入力される (S900)。具体的には、消失点の個数が決定され (S901)、消失点の位置が調整され (S902)、空間構図の傾きが入力され (S903)、 空間構図の位置やサイズにっ 、て調整される(S904)。
[0014] 次に、ユーザによって、オブジェクトをマスク化したマスク画像が入力され(S910)、 マスクの配置と空間構図情報力も立体情報が生成される(S920)。具体的には、ュ 一ザによって、オブジェクトがマスクされた領域の選択(S921)およびオブジェクトの 1 辺 (又は 1面)が選択されると (S922)、それが空間構図と接触している力否かが判断 され (S923)、非接触の場合は(S923 :No)、非接触である旨が入力され (S924)、 接触して ヽる場合は(S923: Yes)、接触して!/ヽる部分の座標が入力される (S925)。 以上の処理をオブジェクトのすべての面にっ 、て実施する(S922〜S926)。
[0015] さらに、上記の処理をすベてのオブジェクトについて実施後(S921〜S927)、空間 構図で規定される空間に全てのオブジェクトをマッピングし、立体的な映像を生成す るための立体情報を生成する(S928)。
[0016] このあと、ユーザにより、カメラワークに関する情報が入力される(S930)。具体的に は、ユーザによって、カメラを移動する経路が選択されると(S931)、そのプレビュー 後(S932)、最終的なカメラワークが決定される (S933)。
[0017] 以上の処理が終わると、上記ソフトの一機能であるモーフイングエンジンによって奥 行き感が付加され (S940)、ユーザに提示する映像が完成する。
特許文献 1 :特開平 09— 009143号公報
特許文献 2 :特開平 07— 049944号公報
特許文献 3 :特開平 07— 095621号公報
特許文献 4:特開平 09— 091436号公報
特許文献 5:特開平 09 - 305796号公報
特許文献 6:特開平 08 - 043056号公報
発明の開示
発明が解決しょうとする課題
[0018] 以上のように、従来、複数の静止画像若しくは複数のカメラで得られた静止画増か ら立体情報を得る手法は数多く示されて!/ヽる。
[0019] 一方、静止画像の内容について 3次元構造を自動的に解析し表示する手法はまだ 確立されておらず、上記のように殆どが手作業に頼って 、る。
[0020] 図 1に示すように、従来技術においては、ほとんど全てを手作業で行う必要がある。
言い換えると、唯一、立体情報を生成した後のカメラワークについて、カメラ位置を都 度手入力するためのツールのみが提供されている状態である。
[0021] 上記のように、静止画像の中の各オブジェクトを手作業で抜き出し、また背景となる 画像も手作業で別途作成し、更に、消失点などの製図的な空間情報も手作業で個 別に設定した上で、各オブジェクトを手作業で仮想的な立体情報にマッピングしてい る状況であり、容易には立体情報を作成できないという課題がある。また、消失点が 画像外に有る場合には全く対応が出来な ヽと ヽつた課題もある。
[0022] さらに、 3次元構造の解析結果後の表示についても、カメラワークの設定が煩雑で あったり、奥行き情報を用いたエフェクトが考慮されて ヽな ヽと 、つた課題を有して ヽ る。これは、特にエンターテイメント向けの利用において大きな問題となる。
[0023] 本発明は、上記従来の課題を解決するものであり、静止画像から立体情報を生成 する際のユーザの作業負荷を軽減し得る画像処理装置等を提供することを目的とす る。
課題を解決するための手段
[0024] 上記の従来課題を解決するために、本発明に係る画像処理装置は、静止画像から 立体情報を生成する画像処理装置であって、静止画像を取得する画像取得手段と、 取得された前記静止画像の中からオブジェクトを抽出するオブジェクト抽出手段と、 取得された前記静止画像における特徴を利用して、消失点を含む仮想的な空間を 表す空間構図を特定する空間構図特定手段と、特定された前記空間構図に、抽出 された前記オブジェクトを関連づけることによって前記仮想的な空間におけるォブジ 工タトの配置を決定し、決定された当該オブジェクトの配置力 前記オブジェクトに関 する立体情報を生成する立体情報生成手段とを備える。
[0025] 本構成によって、一枚の静止画像から立体情報を自動的に生成するため、立体情 報を生成する際のユーザの手間を軽減することができる。
[0026] また、前記画像処理装置は、さらに、前記仮想的な空間内にカメラを想定し、当該 カメラの位置を移動させる視点制御手段と、前記カメラによって、任意の位置力 撮 影した場合の画像を生成する画像生成手段と、生成された前記画像を表示する画像 表示手段とを備えることを特徴とする。
[0027] 本構成によって、生成された立体情報を用いて、静止画像から派生させた新しい画 像を生成することが可能となる。
[0028] また、前記視点制御手段は、前記カメラが、生成された前記立体情報が存在する 範囲を移動するように制御することを特徴とする。
[0029] 本構成によって、仮想空間内を移動するカメラカゝら撮影された画像が、データの無 い部分を映し出すことが無くなり、画像の品質を向上させることができる。
[0030] また、前記視点制御手段は、さらに、前記カメラが、前記オブジェクトが存在しな!、 空間を移動するように制御することを特徴とする。 [0031] 本構成によって、仮想空間内を移動するカメラカゝら撮影された画像が、オブジェクト への衝突や通過を回避することができ、画像の品質を向上させることができる。
[0032] また、前記視点制御手段は、さらに、前記カメラが、生成された前記立体情報が示 す前記オブジェクトが存在する領域を撮影するように制御することを特徴とする。
[0033] 本構成によって、仮想空間内を移動するカメラがパンやズーム、回転等を行った際 に、オブジェクトの裏面にデータが無力つた、などという品質低下を防ぐことができる。
[0034] また、前記視点制御手段は、さらに、前記カメラが、前記消失点の方向へ移動する ように制御することを特徴とする。
[0035] 本構成によって、仮想空間内を移動するカメラカゝら撮影された画像が、画像に入り 込んでいくような視覚的効果を得ることができ、画像の品質を向上させることができる
[0036] また、前記視点制御手段は、さらに、前記カメラが、生成された前記立体情報が示 す前記オブジェクトの方向へ進むように制御することを特徴とする。
[0037] 本構成によって、仮想空間内を移動するカメラカゝら撮影された画像が、オブジェクト に近づいていくような視覚的効果を得ることができ、画像の品質を向上させることがで きる。
[0038] また、前記オブジェクト抽出手段は、抽出された前記オブジェクトの中から 2以上の 非並行の線状のオブジェクトを特定し、前記空間構図特定手段は、さらに、特定され た前記 2以上の線状のオブジェクトを延長することによって、 1以上の消失点の位置 を推定し、特定された前記 2以上の線状のオブジェクトと前記推定された消失点の位 置とから前記空間構図を特定することを特徴とする。
[0039] 本構成によって、静止画像力も立体情報を自動的に抽出し、空間構図情報を的確 に反映することができ、生成する画像全体の品質を向上させることができる。
[0040] また、前記空間構図特定手段は、さらに、前記静止画像の外部においても前記消 失点を推定することを特徴とする。
[0041] 本構成によって、画像内に消失点が無いような画像(ほとんどのスナップ写真など、 一般写真の大多数を占める画像)についても、空間構図情報を的確に取得すること ができ、生成する画像全体の品質を向上させることができる。 [0042] また、前記画像処理装置は、さらに、ユーザ力 の指示を受け付けるユーザインタ フ ース手段を備え、前記空間構図特定手段は、さらに、受け付けられたユーザ力 の指示に従って、特定された前記空間構図を修正することを特徴とする。
[0043] 本構成によって、容易に空間構図情報についてのユーザ意図を反映することがで き、全体の品質の向上を図ることができる。
[0044] また、前記画像処理装置は、さらに、空間構図のひな形となる空間構図テンプレー トを記憶する空間構図テンプレート記憶手段を備え、前記空間構図特定手段は、取 得された前記静止画像における特徴を利用して前記空間構図テンプレート記憶手 段から一の空間構図テンプレートを選択し、選択された当該空間構図テンプレートを 用いて前記空間構図を特定するように構成することもできる。
[0045] また、前記立体情報生成手段は、さらに、前記オブジェクトが前記空間構図におけ る地平面に接する接地点を算出し、前記オブジェクトが前記接地点の位置に存在す る場合の前記立体情報を生成することを特徴とする。
[0046] 本構成によって、オブジェクトの空間配置をより的確に指定することができ、画像全 体の品質を向上させることができる。例えば、ヒトの全身像が写っている写真の場合 は、ヒトの足元と地平面との接点を算出することで、ヒトをより正しい空間位置にマツピ ングすることが可能となる。
[0047] また、前記立体情報生成出段は、さらに、前記オブジェクトの種類によって、前記ォ ブジエ外が前記空間構図と接する面を変更することを特徴とする。
[0048] 本構成によって、オブジェクトの種類によって接地面の変更が可能となり、より現実 感の高い空間配置を得ることができ、画像全体の品質を向上させることができる。例 えば、ヒトであれば地平面と足もとの接点を用い、看板であれば、側面との接点を用 い、電灯であれば天井面との接点を用いるなど、適応的な対応が可能となる。
[0049] また、前記立体情報生成出段は、さらに、前記オブジェクトが前記空間構図の地平 面と接する接地点が算出できな力つた場合に、前記オブジェクト若しくは前記地平面 の少なくとも一つを、内挿若しくは外挿若しくは補間することで、地平面と接する仮想 接地点を算出し、前記オブジェ外が前記仮想接地点の位置に存在する場合の前記 立体情報を生成することを特徴とする。 [0050] 本構成によって、例えばバストアップで写っている人物など地平面との接点が無い 場合でも、オブジェクトの空間配置をより的確に指定することができ、画像全体の品 質を向上させることができる。
[0051] また、前記立体情報生成手段は、さらに、前記オブジェクトに所定の厚みを付与し て空間に配置し、前記立体情報を生成することを特徴とする。
[0052] 本構成によって、より自然なオブジェクトを空間に配置することができ、画像全体の 品質を向上させることができる。
[0053] また、前記立体情報生成手段は、さらに、前記オブジェクトの周囲をぼかす又は尖 鋭にする画像処理を付加して、前記立体情報を生成することを特徴とする。
[0054] 本構成によって、より自然なオブジェクトを空間に配置することができ、画像全体の 品質を向上させることができる。
[0055] また、前記立体情報生成手段は、さらに、前記オブジェクトの影に隠れていることに より欠如している背景のデータ又は他のオブジェクトのデータの少なくとも一方を、隠 れて 、な 、データを用いて構成することを特徴とする。
[0056] 本構成によって、より自然なオブジェクトを空間に配置することができ、画像全体の 品質を向上させることができる。
[0057] また、前記立体情報生成手段は、さらに、前記オブジェクトの背面や側面を表すデ ータを、前記オブジェクトの前面のデータ力も構成することを特徴とする。
[0058] 本構成によって、より自然なオブジェクトを空間に配置することができ、画像全体の 品質を向上させることができる。
[0059] また、前記立体情報生成手段は、前記オブジェクトの種類に基づ 、て、前記ォブジ ェクトに関する処理を動的に変化させることを特徴とする。
[0060] 本構成によって、より自然なオブジェクトを空間に配置することができ、画像全体の 品質を向上させることができる。
[0061] なお、本発明は、上記画像処理装置における特徴的な構成手段をステップとする 画像処理方法として実現したり、それらステップをパーソナルコンピュータ等に実行さ せるプログラムとして実現することもできる。そして、そのプログラムを DVD等の記録 媒体やインターネット等の伝送媒体を介して広く流通させることができるのは云うまで もない。
発明の効果
[0062] 本発明に係る画像処理装置によれば、従来では成しえな力つた非常に簡便な操作 で、写真 (静止画像)から 3次元情報を生成に奥行きを持った画像に再構築すること ができる。また、 3次元空間内を仮想的なカメラで移動撮影することにより、煩雑な作 業をすることなしに、従来では成しえな力つた、静止画の中を動画として楽しむことが でき、新しい写真の楽しみ方を提供することができる。
図面の簡単な説明
[0063] [図 1]図 1は、従来技術における静止画像から立体情報を生成する処理内容を示す フローチャートである。
[図 2]図 2は、本実施の形態に係る画像処理装置の機能構成を示すブロック図である
[図 3]図 3 (a)は、本実施の形態に係る画像取得部に入力される原画像の一例である 。 図 3 (b)は、上記図 2 (a)の原画像を 2値ィ匕した画像例である。原画像と 2値化例を 示す図である。
[図 4]図 4 (a)は、本実施の形態に係るエッジ抽出例である。 図 4 (b)は、本実施の形 態に係る空間構図の抽出例である。 図 4 (c)は、本実施の形態に係る空間構図確 認画面の一例を示す図である。
[図 5]図 5 (a)、(b)は、実施の形態 1における、空間構図抽出用テンプレートの一例 を示す図である。
[図 6]図 6 (a)、(b)は、実施の形態 1における拡大型空間構図抽出用テンプレートの 一例を示す図である。
[図 7]図 7 (a)は、実施の形態 1におけるオブジェクトの抽出例を示す図である。 図 7 (b)は、実施の形態 1における抽出したオブジェクトと決定された空間構図とを合成し た画像の一例である。
[図 8]図 8は、実施の形態 1における仮想視点の設定例を示す図である。
[図 9]図 9 (a)、(b)は、実施の形態 1における視点変更画像の生成例を示す図である [図 10]図 10は、実施の形態 1における空間構図抽出用テンプレートの一例(消失点 1つの場合)である。
[図 11]図 11は、実施の形態 1における空間構図抽出用テンプレートの一例(消失点 2つの場合)である。
[図 12]図 12 (a)、(b)は、実施の形態 1における空間構図抽出用テンプレートの一例 (稜線を含む場合)である。
[図 13]図 13は、実施の形態 1における空間構図抽出用テンプレートの一例(稜線を 含む縦型の場合)である。
圆 14]図 14 (a)、(b)は、実施の形態 1における合成立体情報の生成例を示す図で ある。
[図 15]図 15は、実施の形態 1における視点位置の変更例を示す図である。
[図 16]図 16 (a)は、実施の形態 1における視点位置変更例である。 図 16 (b)は、実 施の形態 1における画像共通部分例を示す図である。 図 16 (c)は、実施の形態 1に おける画像共通部分例を示す図である。
[図 17]図 17は、実施の形態 1における画像表示の遷移例を示す図である。
[図 18]図 18 (a)、(b)は、実施の形態 1におけるカメラ移動例を示す図である。
[図 19]図 19は、実施の形態 1におけるカメラ移動例を示す図である。
[図 20]図 20は、実施の形態 1における空間構図特定部における処理の流れを示す フローチャートである。
[図 21]図 21は、実施の形態 1における視点制御部における処理の流れを示すフロー チャートである。
[図 22]図 22は、実施の形態 1における立体情報生成部における処理の流れを示す フローチャートである。 符号の説明
100 画像処理装置
101 画像取得部
110 空間構図テンプレート記憶部
111 空間構図ユーザ IF部 112 空間構図特定部
120 オブジェクトテンプレート記憶部
121 オブジェクトユーザ IF部
122 オブジェクト抽出部
130 立体情報生成部
131 立体情報ユーザ IF部
140 情報補正ユーザ IF部
141 情報補正部
150 立体情報記憶部
151 立体情報比較部
160 スタイル Zエフェクトテンプレート
161 エフェクト制御部
162 エフェクトユーザ IF部
170 画像生成部
171 画像表示部
180 視点変更テンプレート記憶部
181 視点制御部
182 視点制御ユーザ IF部
190 カメラワーク設定用画像生成部
201 原画像
202 2値化画像
301 エッジ抽出画像
302 空間構図抽出例
303 空間構図確認画像
401 空間構図抽出テンプレート例
402 空間構図抽出テンプレート例
410 消失点
420 正面奥壁 501 画像範囲例
502 画像範囲例
503 画像範囲例
510 消失点
511 消失点
520 拡大型空間構図抽出テンプレー -ト例
521 拡大型空間構図抽出テンプレー -ト例
610 オブジェクト抽出例
611 奥行き情報合成例
701 仮想視点位置
702 仮想視点方向
810 奥行き情報合成例
811 視点変更画像生成例
901 消失点
902 正面奥壁
903 壁高
904 壁幅
910 空間構図抽出用テンプレート
1001 消失点
1002 消失点
1010 空間構図抽出用テンプレート
1100 空間構図抽出用テンプレート
1101 消失点
1102 消失点
1103 稷線
1104 稷線尚
1110 空間構図抽出用テンプレート
1210 空間構図抽出用テンプレート 1301 現在の画像データ
1302 過去の画像データ
1311 現在画像データオブジェクト A
1312 現在画像データオブジェクト B
1313 過去画像データォブジコ :クト A
1314 過去画像データォブジュ :ク卜 B
1320 合成立体情報例
1401 画像位置例
1402 画像位置例
1403 視点位置
1404 視点対象
1411 画像例
1412 画像例
1501 画像位置例
1502 画像位置例
1511 画像例
1512 画像例
1521 画像共通部分例
1522 画像共通部分例
1600 画像表示遷移例
1700 カメラ移動例
1701 開始視点位置
1702 視点位置
1703 視点位置
1704 視点位置
1705 視点位置
1706 視点位置
1707 終了視点位置 1708 カメラ移動線
1709 カメラ移動地上投影線
1710 開始視点領域
1711 終了視点領域
1750 カメラ移動例
1751 開始視点位置
1752 終了視点位置
1753 カメラ移動線
1754 カメラ移動地上投影線
1755 カメラ移動壁面投影線
1760 開始視点領域
1761 終了視点領域
1800 カメラ移動例
1801 開始視点位置
1802 終了視点位置
発明を実施するための最良の形態
[0065] 以下、本発明に係る実施の形態について、図面を参照しながら詳細に説明する。
なお、以下の実施の形態において、本発明について図面を用いて説明するが、本発 明はこれらに限定されることを意図しない。
[0066] (実施の形態 1)
図 2は、本実施の形態に係る画像処理装置の機能構成を示すブロック図である。画 像処理装置 100は、静止画像(「原画像」ともいう。)から立体情報(3次元情報ともい う。)を生成し、生成された立体情報を用いて新たな画像を生成して立体的な映像を ユーザに提示し得る装置であり、画像取得部 101、空間構図テンプレート記憶部 11 0、空間構図ユーザ IF部 111、空間構図特定部 112、オブジェクトテンプレート記憶 部 120、オブジェクトユーザ IF部 121、オブジェクト抽出部 122、立体情報生成部 13 0、立体情報ユーザ IF部 131、情報補正ユーザ IF部 140、情報補正部 141、立体情 報記憶部 150、立体情報比較部 151、スタイル Zエフェクトテンプレート記憶部 160 、エフェクト制御部 161、エフェクトユーザ IF部 162、画像生成部 170、画像表示部 1 71、視点変更テンプレート記憶部 180、視点制御部 181、視点制御ユーザ IF部 182 、カメラワーク設定用画像生成部 190を備える。
[0067] 画像取得部 101は、 RAMやメモリカード等の記憶装置を備え、デジタルカメラゃス キヤナ等を介して静止画像又は動画におけるフレーム毎の画像の画像データを取得 し、当該画像に対して 2値ィ匕およびエッジ抽出を行う。なお、以下では、上記の取得 した静止画像又は動画におけるフレーム毎の画像を「静止画像」で総称する。
[0068] 空間構図テンプレート記憶部 110は、 RAM等の記憶装置を備え、空間構図特定 部 112において使用する空間構図テンプレートを記憶する。ここで、「空間構図テン プレート」とは、静止画像における奥行きを表すための複数の線分力 構成される骨 組みをいい、各線分の始点および終点の位置、線分の交点の位置を表す情報にカロ え、静止画像における基準長さ等の情報も有している。
[0069] 空間構図ユーザ IF部 111は、マウス、キーボードおよび液晶パネル等を備え、ユー ザ力 の指示を受け付けて空間構図特定部 112に通知する。
[0070] 空間構図特定部 112は、取得された静止画像のエッジ情報や後述のオブジェクト 情報などに基づいて、この静止画像についての空間構図(以下、単に「構図」ともいう 。)を決定する。また、空間構図特定部 112では、必要に応じて、空間構図テンプレ ート記憶部 110から空間構図テンプレートを選択して (さらに、必要に応じて選択した 空間構図テンプレートを修正し、)空間構図を特定する。さらに、空間構図特定部 11 2は、オブジェクト抽出部 122において抽出されたオブジェクトを参考にして、空間構 図を決定又は修正してもよ 、。
[0071] オブジェクトテンプレート記憶部 120は、 RAM又はハードディスク等の記憶装置を 備え、上記取得した原画像の中力もオブジェクトを抽出するためのオブジェクトテンプ レートやパラメータなどを記憶する。
[0072] オブジェクトユーザ IF部 121は、マウスやキーボード等を備え、静止画像からォブ ジェタトを抽出するために用いる手法 (テンプレートマッチや-ユーラルネット、色情報 など)を選択したり、上記の手法によってオブジェクト候補として提示された中からォ ブジェクトを選択したり、オブジェクト自体を選択したり、選択されたオブジェクトの修 正やテンプレートの追加、オブジェクトを抽出する手法の追加などに際して、ユーザ 力 の操作を受け付ける。
[0073] オブジェクト抽出部 122は、静止画像力もオブジェクトを抽出し、そのオブジェクトの 位置、数、形状および種類等のオブジェクトに関する情報 (以下「オブジェクト情報」と いう。)を特定する。この場合、抽出するオブジェクトについては、予めその候補 (例え ば、人、動物、建物、植物等)が決められているものとする。さらに、オブジェクト抽出 部 122は、必要に応じて、オブジェクトテンプレート記憶部 120のオブジェクトテンプ レートを参照し、各テンプレートと静止画像のオブジェクトとの相関値に基づくォブジ タトの抽出も行う。また、上記空間構図特定部 112において決定された空間構図を 参考にして、オブジェクトを抽出したり、そのオブジェクトを修正してもよい。
[0074] 立体情報生成部 130は、空間構図特定部 112で決定された空間構図やオブジェク ト抽出部 122で抽出されたオブジェクト情報、立体情報ユーザ IF部 131を介してユー ザ力 受け付けた指示等に基づ 、て、取得した静止画像に関する立体情報を生成 する。さらに、立体情報生成部 130は、 ROMや RAM等を備えるマイクロコンピュー タであり、画像処理装置 100全体の制御を行う。
[0075] 立体情報ユーザ IF部 131は、マウスやキーボード等を備え、ユーザからの指示によ つて立体情報を変更する。
[0076] 情報補正ユーザ IF部 140は、マウス、キーボード等を備え、ユーザからの指示を受 け付けて、情報補正部 141に通知する。
[0077] 情報補正部 141は、情報補正ユーザ IF部 140を介して受け付けたユーザの指示 に基づいて、誤って抽出されたオブジェクトの補正、又は誤って特定された空間構図 や立体情報を補正する。この場合、その他の補正手法として、例えばそれまでのォブ ジェタトの抽出、空間構図の特定又は立体情報の生成結果に基づいて規定されたル ールベースに基づく補正等がある。
[0078] 立体情報記憶部 150は、ハードディスク等の記憶装置を備え、作成中の立体情報 や過去に生成された立体情報を記憶する。
[0079] 立体情報比較部 151は、過去に生成された立体情報の全体若しくは一部と、現在 処理中の (若しくは処理済の)立体情報の全体若しくは一部とを比較し、類似点や合 致点が確認された場合に、立体情報生成部 130に対して立体情報をより充実させる ための情報を提供する。
[0080] スタイル/エフェクトテンプレート記憶部 160は、ハードディスク等の記憶装置を備 え、画像生成部 170において生成する画像に付加する、トランジシヨン効果や、色調 変換など任意のエフェクト効果に関するプログラム、データ、スタイル又はテンプレー ト等を記憶する。
[0081] エフェクト制御部 161は、画像生成部 170において生成する新たな画像にトランジ シヨン効果や色調変換など、任意のエフェクト効果をカ卩える。このエフェクト効果は、 全体として統一感を出すために所定のスタイルに沿ったエフェクト群を用いることとし てもよい。さらに、エフェクト制御部 161は、新しいテンプレート等をスタイル Zェフエ タトテンプレート記憶部 160に追加し、又は参照したテンプレート等の編集を行う。
[0082] エフェクトユーザ IF部 162は、マウスやキーボード等を備え、ユーザからの指示をェ フエタト制御部 161に通知する。
[0083] 画像生成部 170は、立体情報生成部 130で生成された立体情報に基づいて上記 静止画像を立体的に表現する画像を生成する。具体的には、上記生成された立体 情報を用いて、静止画像から派生させた新たな画像を生成する。また、 3次元画像は 模式的であっても良ぐカメラ位置やカメラ向きを 3次元画像内に表示してもよい。さら に、画像生成部 170は、別途指定される視点情報や表示エフェクト等を用いて新た な画像を生成する。
[0084] 画像表示部 171は、例えば液晶パネルや PDP等の表示装置であり、画像生成部 1 70において生成された画像や映像をユーザに提示する。
[0085] 視点変更テンプレート記憶部 180は、予め決められたカメラワークの 3次元的な動 きを示す視点変更テンプレートを記憶する。
[0086] 視点制御部 181は、カメラワークとしての視点位置の決定を行う。この際、視点制御 部 181は、視点変更テンプレート記憶部 180に記憶されている視点変更テンプレート を参照してもよい。さらに、視点制御部 181は、視点制御ユーザ IF部 182を介して受 け付けたユーザの指示に基づいて、視点変更テンプレートの作成、変更および削除 等を行う。 [0087] 視点制御ユーザ IF部 182は、マウスやキーボード等を備え、ユーザ力も受け付けた 視点位置の制御に関する指示を視点制御部 181に通知する。
[0088] カメラワーク設定用画像生成部 190は、ユーザがカメラワークを決める際の参照とな るような現在のカメラ位置力も見た時の画像を生成する。
[0089] なお、本実施の形態に係る画像処理装置 100の構成要素として、上記の機能要素
(即ち、図 2において「〜部」として表した部署)の全てが必須というわけではなぐ必 要に応じて機能要素を選択して画像処理装置 100を構成できることは言うまでもない
[0090] 以下、上記のように構成される画像処理装置 100における各部の機能について詳 細に説明する。以下では、オリジナルの静止画像 (以下「原画像」という。)から立体 情報を生成し、さらに、立体的な映像を生成する実施の形態について説明する。
[0091] まず、空間構図特定部 112及びその周辺の部署の機能について説明する。
[0092] 図 3 (a)は、本実施の形態に係る原画像の一例である。また、図 3 (b)は、上記原画 像を 2値ィ匕した 2値ィ匕画像の一例である。
[0093] 空間構図を決定するためには、大まかなに空間構図を抽出することが重要であり、 まず、原画像力も主たる空間構図 (以下「概略空間構図」という。)を特定する。ここで は、概略空間構図を抽出するために、「2値化」を行い、その後、テンプレートマッチ による当て嵌めを行う実施例を示す。勿論、 2値ィ匕及びテンプレートマッチは概略空 間構図を抽出する手法の一例に過ぎず、これら以外の任意の手法を用いて概略空 間構図を抽出してもよい。さらに、概略空間構図を抽出することなぐ直接、詳細な空 間構図を抽出してもよい。なお、以下では、概略空間構図および詳細な空間構図を 総称して「空間構図」という。
[0094] 最初に、画像取得部 101は、図 3 (b)に示すように、原画像 201を 2値ィ匕して 2値ィ匕 画像 202を得て、さらに、 2値ィ匕画像 202からエッジ抽出画像を得る。
[0095] 図 4 (a)は、本実施の形態に係るエッジ抽出例であり、図 4 (b)は、空間構図の抽出 例であり、図 4 (c)は、空間構図を確認するための表示例である。
[0096] 画像取得部 101は、 2値化後、 2値ィ匕画像 202に対してエッジ抽出を行い、エッジ 抽出画像 301を生成し、空間構図特定部 112およびオブジェクト抽出部 122に出力 する。
[0097] 空間構図特定部 112は、エッジ抽出画像 301を用いて空間構図を生成する。より 具体的に説明すると、空間構図特定部 112は、エッジ抽出画像 301から非並行の 2 以上の直線を抽出し、これらの直線を組み合わせた「骨組み」を生成する。この「骨組 み」が空間構図である。
[0098] 図 4 (b)における空間構図抽出例 302は、上記のように生成された空間構図の一例 である。さらに、空間構図特定部 112は、空間構図ユーザ IF部 111を介して受け付 けたユーザの指示により、空間構図確認画像 303における空間構図が原画像の内 容に合致するように補正する。ここで、空間構図確認画像 303は、上記空間構図の 適否を確認するための画像であり、原画像 201と空間構図抽出例 302とを合成した 画像である。なお、ユーザによって、修正等を行う場合や他の空間構図抽出を適用 する場合又は空間構図抽出例 302を調整する場合などについても空間構図ユーザ I F部 111を介して受け付けたユーザの指示に従う。
[0099] なお、上記の実施の形態では、原画像を「2値化」することによってエッジ抽出を行 つたが、この方法に限定されるものでは無ぐ既存の画像処理方法を用いて、若しく はそれらの組み合わせによってエッジ抽出を行ってもよいことは言うまでも無い。既存 の画像処理方法としては、色情報を用いるものや輝度情報を用いるもの、直交変換 やウェーブレット変換を用いるもの、各種 1次元 Z多次元フィルタを用いるものなどが 有るがこれらに限定されない。
[0100] なお、空間構図は、上記のようにエッジ抽出画像力も生成する場合に限らず、空間 構図を抽出するために、予め用意しておいた空間構図のひな形である「空間構図抽 出用テンプレート」を用いて決定してもよ 、。
[0101] 図 5 (a)、 (b)は、空間構図抽出用テンプレートの一例である。空間構図特定部 112 では、必要に応じて空間構図テンプレート記憶部 110から、図 5 (a)、 (b)に示すよう な空間構図抽出用テンプレートを選択し、原画像 201と合成してマッチングを行い、 最終的な空間構図を決定することも可能とする。
[0102] 以下、空間構図抽出用テンプレートを用いて空間構図を決定する実施例について 説明を行うが、空間構図抽出用テンプレートを用いずにエッジ情報やオブジェクトの 配置情報 (どこに何があるかを示す情報)から空間構図を推定してもよい。更に、セグ メンテーシヨン (領域分割)や直交変換'ウェーブレット変換、色情報、輝度情報など、 既存の画像処理手法を任意に組み合わせて空間構図を決定することもできる。一例 を挙げると、領域分割された各領域の境界面が向 、て 、る方向に基づ 、て空間構図 を決定してもよい。また、静止画像に付帯するメタ情報 (EXIFなど任意のタグ情報) を利用してもよい。例えば、「焦点距離と被写体深度から、後述の消失点が画像内に あるかどうかの判断を行う」など、任意のタグ情報を用いて空間構図抽出に用いること が出来る。
[0103] また、テンプレートの入力、修正又は変更や空間構図情報そのものの入力、修正又 は変更などユーザの欲する全ての入出力を行うインタフェースとして、空間構図ユー ザ IF部 111を用いることも出来る。
[0104] 図 5 (a)、 (b)では、各空間構図抽出用テンプレートにおける消失点 VP410を示さ れている。この例では、消失点が 1点の場合を示している力 消失点が複数あっても よい。空間構図抽出用テンプレートは、後述するようにこれらに限られるものではなく 、奥行き情報を持つ (若しくは持って!/、るように知覚できる)任意の画像に対応するよ うなテンプレートである。
[0105] さらに、空間構図抽出用テンプレート 401から空間構図抽出用テンプレート 402の ように、消失点の位置を移動することで、一つのテンプレートから類似する任意のテ ンプレートを生成することも出来る。また、消失点までに壁が存在する場合も有る。こ の場合は、正面奥壁 420のように空間構図抽出用テンプレート内に(奥方向の)壁を 設定することも出来る。正面奥壁 420の奥方向の距離も消失点と同様に移動すること が出来ることは言うまでもない。
[0106] 空間構図抽出用テンプレートの例としては、空間構図抽出テンプレート例 401や空 間構図抽出テンプレート例 402のような消失点が一つである場合のほ力、図 11の空 間構図抽出テンプレート例 1010のように、 2つの消失点(消失点 1001、消失点 100 2)を持つ場合や、図 12の空間構図抽出用テンプレート 1110のように、壁が 2方向か ら交わって!/、るような場合 (これも 2消失点と 、える)、図 13の空間構図抽出用テンプ レート 1210のように、縦型になっている場合、図 18 (a)のカメラ移動例 1700に示す ような地平線 (水平線)のように、消失点が線状になっている場合、図 18 (b)のカメラ 移動例 1750のように、画像範囲外に消失点があるような場合など、製図や CAD、設 計などの分野で一般的に用いられている空間構図を任意に用いることが出来る。
[0107] なお、図 18 (b)のカメラ移動例 1750のように、画像範囲外に消失点があるような場 合については、図 6の拡大型空間構図抽出用テンプレート 520や拡大型の空間構図 抽出用テンプレート 521のように、空間構図抽出用テンプレートを拡大して用いること が出来る。この場合、図 6 (a)、 (b)における画像範囲例 501、画像範囲例 502およ び画像範囲例 503のように、消失点が画像の外部にあるような画像についても消失 点を設定することが可能になる。
[0108] なお、空間構図抽出用テンプレートに関しては、消失点の位置など空間構図に関 する任意のパラメータを自由に変更することもできる。例えば、図 10の空間構図抽出 用テンプレート 910では、消失点 910の位置や正面奥壁 902の壁高 903、壁幅 904 などを変更することにより、様々な空間構図に対してより柔軟に対応することができる 。同様に、図 11の空間構図抽出用テンプレート 1010では、二つの消失点(消失点 1 001と消失点 1002)の位置を任意に動かす例を示している。当然、変更する空間構 図のパラメータは、消失点や正面奥壁に限られるものではなぐ側壁面、天井面、正 面奥壁面など空間構図内の任意の対象について、そのパラメータを変更することが できる。更に、これらの面の傾きや空間配置上における位置など、面に関する任意の 状態をサブパラメータとして利用することが出来る。また、変更方法も上下左右に限ら れるものでなぐ回転やモーフイング、ァフィン変換などによる変形などを行ってもよい
[0109] これらの変換や変更は、画像処理装置 100に用いるハードウェアのスペックやユー ザインタフエース上の要求などに応じて、任意に組み合わせることができる。例えば、 比較的ロースペックの CPUで実装する場合には、予め用意する空間構図抽出用テ ンプレートの数を削減し、変換や変更も極力少ないものとして、その中から最も近い 空間構図抽出用テンプレートをテンプレートマッチにより選択することが考えられる。 また、記憶装置が比較的潤沢にある画像処理装置 100の場合には、予め多くのテン プレートを用意しておき、記憶装置上に保存し、変換や変更に要する時間を抑えると ともに、短時間で精度の良いマッチング成果を上げられるように、用いる空間構図抽 出用テンプレートを階層的に分類して構成しておくこともできる(ちょうど高速検索を 行うデータベース上のデータ配置と同様にテンプレートを配置することができる)。
[0110] なお、図 12の空間構図抽出テンプレート例 1100や空間構図抽出テンプレート例 1 110では、消失点、正面奥壁のほか、稜線 (稜線 1103、稜線 1113)の位置、稜線の 高さ(稜線高 1104、稜線高 1114)を変更する例を示している。同様に、図 13では、 縦型の空間構図の場合の消失点(消失点 1202、消失点 1201)、稜線 (稜線 1203) 、稜線幅 (稜線幅 1204)の例を示している。
[0111] これらの空間構図に関するパラメータは、空間構図ユーザ IF部 111を介してユーザ 力もの操作 (例えば、指定、選択、修正、登録などが挙げられるが、この限りではない )によって設定してもよい。
[0112] 図 20は、空間構図特定部 112における、空間構図を特定するまでの処理の流れを 示すフローチャートである。
[0113] 最初に、空間構図特定部 112は、画像取得部 101からエッジ抽出画像 301を取得 すると、このエッジ抽出画像 301から空間構図の要素(例えば、非並行の直線状のォ ブジェクトなど)を抽出する(S100)。
[0114] 次に、空間構図特定部 112は、消失点位置の候補を算出する (S102)。
この場合、空間構図特定部 112は、算出された消失点の候補が点でない場合は (S 104: Yes)、地平線を設定する(S 106)。さらに、その消失点候補の位置が原画像 2 01内にな 、場合は(S 108: No)、消失点を外挿する(S 110)。
[0115] その後、空間構図特定部 112は、消失点を中心とした空間構図を構成する要素を 含む空間構図テンプレートを作成し (S 112)、作成した空間構図テンプレートと空間 構図構成要素とのテンプレートマッチング(単に「TM」とも 、う。)を行う(S 114)。
[0116] 以上の処理 (S104〜S116)を全ての消失点候補について実施し、最終的に最も 適切な空間構図を特定する(S118)。
[0117] 次に、オブジェクト抽出部 122及びその周辺の部署の機能について説明する。
[0118] オブジェクトの抽出手法としては、既存の画像処理方法や画像認識方法で用いら れている手法を任意に用いることが出来る。例えば、人物抽出であればテンプレート マッチや-ユーラルネット、色情報などを基に抽出することが出来る。また、セグメンテ ーシヨンや領域分割により、分割されたセグメントや領域をオブジェクトとみなすことも 出来る。動画若しくは連続する静止画中の一静止画であれば、前後のフレーム画像 力 オブジェクトを抜き出すことも出来る。もちろん抽出手法や抽出ターゲットはこれら に限定されるものではなく任意である。
[0119] 上記のオブジェクト抽出用のテンプレートやパラメータなどはオブジェクトテンプレ ート記憶部 120に記憶し、状況に応じて読み出して使うこともできる。また、新たなテ ンプレートやパラメータなどをオブジェクトテンプレート記憶部 120に入力することも出 来る。
[0120] また、オブジェクトユーザ IF部 121は、オブジェクトを抽出する手法 (テンプレートマ ツチや-ユーラルネット、色情報など)を選択したり、候補として提示されたオブジェク トの候補を選択したり、オブジェクト自体を選択したり、結果の修正やテンプレートの 追加、オブジェクト抽出手法の追加など、ユーザの欲する全ての作業を行うためのィ ンタフェースを提供する。
[0121] 次に、立体情報生成部 130及びその周辺の部署の機能について説明する。
[0122] 図 7 (a)は、抽出したオブジェクトを示す図であり、図 7 (b)は、抽出したオブジェクト と決定された空間構図とを合成した画像の一例である。オブジェクト抽出例 610では 、原画像 201から主な人物像をオブジェクト 601、オブジェクト 602、オブジェクト 603 、オブジェクト 604、オブジェクト 605、オブジェクト 606をオブジェクトとして抽出して V、る。この各オブジェクトと空間構図とを合成したものが奥行き情報合成例 611である
[0123] 立体情報生成部 130は、上記のように抽出したオブジェクトを空間構図の中に配置 することにより、立体情報を生成できる。なお、立体情報については、立体情報生成 ユーザ IF部 131を介して受け付けたユーザの指示に従って、入力したり、修正したり することも出来る。
[0124] 画像生成部 170は、上記のように生成された立体情報を有する空間において、新 たに仮想的な視点を設定して原画像とは異なる画像を生成する。
[0125] 図 22は、上記で説明した、立体情報生成部 130における処理の流れを示すフロー チャートである。
[0126] 最初に、立体情報生成部 130は、空間構図情報力 空間構図における平面に関 するデータ (以下「構図平面データ」という。)を生成する(S300)。次に、立体情報生 成部 130は、抽出されたオブジェクト(「Obj」ともいう。)と構図平面との接点を算出し ( S302)、オブジェクトと地平面との接点がなく(S304 : No)、さらに壁面又は天面との 接点もない場合は(S306: No)、オブジェクトは最前面にあるものとして空間におけ る位置を設定する(S308)。これ以外の場合は、接点座標を算出し (S310)、ォブジ ェタトの空間における位置を算出する(S312)。
[0127] 以上の処理を全てのオブジェクトに実施した場合は(S314 : Yes)、オブジェクト以 外の画像情報を空間構図平面にマッピングする(S316)。
[0128] さらに、立体情報生成部 130は、情報補正部 141においてオブジェクトに関する修 正内容を盛り込み(S318〜324)、立体情報の生成を完了する(S326)。
[0129] ここで、図 8を参照しながら、仮想視点位置の設定方法について説明する。まず、 空間中の視点位置として仮想視点位置 701を考え、視点方向として仮想視点方向 7 02を設定する。この仮想視点位置 701と仮想視点方向 702を図 9の奥行き情報合成 例 810 (奥行き情報合成例 611と同一)について考えると、正面力もの視点力も見た 奥行き情報合成例 810に対して、仮想視点位置 701の視点と仮想視点方向 702の ような視点方向を設定した場合 (即ち、少し進んで横方向から見た場合)、視点変更 画像生成例 811のような画像を生成することができる。
[0130] 同様に、図 15では、ある立体情報を有する画像に対して、視点位置と方向を想定 した画像例を示す。画像例 1412は、画像位置例 1402の時の画像例である。また、 画像例 1411は、画像位置例 1401の時の画像例である。画像位置例 1401につい ては、視点位置と視点対象を視点位置 1403と視点対象 1404で模式的に表現して いる。
[0131] ここでは、図 15を、ある立体情報を有する画像から仮想視点を設定して画像を生成 した例として用いた。なお、立体情報 (空間情報)の取得に用いた静止画像を画像例 1412とし、この画像例 1412から抽出した立体情報に対して、視点位置 1403、視点 対象 1404を設定した場合の画像が画像例 1412であるということもいえる。 [0132] 同様に、図 16では、画像位置例 1501と画像位置例 1502に対応した画像例として それぞれ画像例 1511と画像例 1512を示している。このとき、それぞれの画像例の 一部が重複している場合がある。例えば、画像共通部分 1521と画像共通部分 1521 がそれにあたる。
[0133] なお、前述のように、新たな画像を生成する際のカメラワーク 'エフェクトとして、立体 情報の内外を視点や焦点、ズーム、パン等をしながら、若しくはトランジシヨンやエフ ェクトをかけながら画像を生成できることはもちろんである。
[0134] 更に、単に立体空間内を仮想的なカメラで撮影したような動画若しくは静止画を生 成するだけではなぐ上記の画像共通部分 1521と画像共通部分 1521のように、静 止画として切出した時に共通する部分を対応させながら、動画若しくは静止画を (若 しくは動画静止画混在状況下で)カメラワーク ·エフェクトで繋 、で 、く処理を行うこと もできる。ここでは、従来のカメラワークでは考えられな力つた、モーフイングやァフィ ン変換などを用いて、共通する対応点や対応領域を繋いでいくことも可能となる。図 17は、共通部分 (即ち、太枠で示した部分)を持つ画像同士をモーフイングゃトラン ジシヨン、画像変換 (ァフィン変換など)、エフェクト、カメラアングル変更、カメラパラメ ータ変更、などを用いて遷移させて表示する例を示している。共通部分の特定は立 体情報力 容易に可能であり、逆にいえば共通部分を持つようにカメラワークを設定 することも可會である。
[0135] 図 21は、上記で説明した、視点制御部 181における処理の流れを示すフローチヤ ートである。
[0136] 最初に、視点制御部 181は、カメラワークの開始点および終了点を設定する(S20 0)。この場合、カメラワークの開始点および終了点は、概ね仮想空間の手前付近に 開始点を設定し、開始点からより消失点に近い地点に終了点を設定する。この開始 点および終了点の設定には、所定のデータベース等を利用してもよい。
[0137] 次に、視点制御部 181は、カメラの移動先や移動方向を決定し (S202)、移動方法 を決定する(S204)。例えば、手前から消失点の方向に、各オブジェクトの近傍を通 りながら移動する。さらに、単に直線状に移動するのみでなぐらせん状に移動したり 、移動途中に速度を変更したりしてもよい。 [0138] さらに、視点制御部 181は、実際に所定の距離についてカメラを移動する(S206 〜224)。この間、もし、カメラパンなどのカメラエフェクトを実行する場合は(S208 :Y es)、所定のエフェクトサブルーチンを実行する(S212〜S218)。
[0139] また、視点制御部 181は、カメラがオブジェクトや空間構図自体と接触しそうな場合 は(S220 :接触する)、改めて次の移動先を設定して(S228)、上記の処理を繰り返 す(S202〜S228)。
[0140] なお、視点制御部 181は、カメラが終了点まで移動したら、カメラワークを終了する
[0141] 前述の繰り返しになる力 これらの画像生成に関するカメラワークは、視点変更テン プレート記憶部 180のように、予め決められた視点変更テンプレートをデータベース に用意して利用することも出来る。また、視点変更テンプレート記憶部 180に新しい 視点変更テンプレートを追加し、若しくは視点変更テンプレートを編集して利用しても よい。また、視点制御ユーザ IF部 182を介して、ユーザの指示によって視点位置を 決定したり、視点変更テンプレートを作成 ·編集 ·追カ卩 ·削除してもょ 、。
[0142] また、これらの画像生成に関するエフェクトは、エフェクト Zスタイルテンプレート記 憶部 160のように、予め決められたエフェクト Zスタイルテンプレートをデータベース に用意して利用することも出来る。また、エフェクト Zスタイルテンプレート記憶部 160 に新し 、エフェクト Zスタイルテンプレートを追カ卩し、若しくはエフェクト Zスタイルテン プレートを編集して利用してもよい。また、エフェクトユーザ IF部 162を介して、ユー ザの指示によって視点位置を決定したり、エフェクト Zスタイルテンプレートを作成' 編集 '追加'削除してもよい。
[0143] なお、カメラワークを設定する際に、オブジェクトの位置を考慮し、オブジェクトに沿 つて若しくはオブジェクトにクローズアップするように、若しくはオブジェクトに回り込む ように、などオブジェクトに依存した任意のカメラワークを設定することもできる。ォブ ジェタトに依存した画像作成ができることは、カメラワークだけではなぐエフェクトにつ Vヽても同様であることは言うまでも無 、。
[0144] 同様に、カメラワークを設定する際に、空間構図を考慮することもできる。エフェクト も同様である。先に述べた共通部分を考慮した処理は、空間構図とオブジェクトとの 両方を利用したカメラワーク若しくはエフェクトの一例であり、生成される画像が動画 であっても静止画であっても、空間構図とオブジェクトを用いた既存任意のカメラヮー クゃエフェクト、カメラアングル、カメラパラメータ、画像変換、トランジシヨンなどを利用 できる。
[0145] 図 18(a)、 (b)は、カメラワークの一例を示す図である。図 18 (a)のカメラワークの軌 跡を示したカメラ移動例 1700では、開始視点位置 1701から仮想的なカメラの撮像 が開始され、カメラ移動線 1708に沿ってカメラが移動した場合を表している。視点位 置 1702から視点位置 1703、視点位置 1704、視点位置 1705、視点位置 1706を 順に通過して終了視点位置 1707においてカメラワークが終了している。開始視点位 置 1701では、開始視点領域 1710が撮影されており、終了視点位置 1707では終了 視点領域 1711が撮影されている。この移動の間、カメラの移動を地上に相当する平 面に投影したものがカメラ移動地上投影線 1709である。
[0146] 同様に、図 18 (b)に示すカメラ移動例 1750の場合は、開始視点位置 1751から終 了視点位置 1752までカメラが移動し、それぞれ開始視点領域 1760、終了視点領域 1761を撮像している。この間のカメラの移動はカメラ移動線 1753で模式的に示して いる。また、カメラ移動線 1753の地上及び壁面に投影した軌跡は、それぞれカメラ 移動地上投影線 1754およびカメラ移動壁面投影線 1755で示している。
[0147] もちろん、上記カメラ移動線 1708及びカメラ移動線 1753上を移動する任意のタイ ミングで画像を生成することができる(動画でも静止画でも両者の混在でも良 ヽことは 言うまでも無い)。
[0148] また、カメラワーク設定用画像生成部 190は、ユーザがカメラワークを決める際の参 考になるように、現在のカメラ位置力も見た時の画像を生成してユーザに提示するこ とができる力 その例を図 18のカメラ画像生成例 1810に示している。図 19において 、現在カメラ位置 1803から撮影範囲 1805を撮影した場合の画像を現在カメラ画像 1 804【こ表示して!/ヽる。
[0149] 視点制御ユーザ IF部 182を介して、ユーザには、カメラ移動例 1800のようカメラを 移動することによって模式的な立体情報や、その中のオブジェクトなどを提示すること ちでさる。 [0150] さらに、画像処理装置 100は、生成された複数の立体情報を合成することもできる。 図 14 (a)、(b)は、複数の立体情報を合成する場合の一例を示す図である。図 14 (a )には、現在の画像データ 1301内に現在画像データオブジェクト A1311と現在画像 データオブジェクト B1312が写っており、過去の画像データ 1302内に過去画像デ ータオブジェクト A1313と過去画像データオブジェクト B1314が写っている場合を示 している。この場合、同一立体空間内に二つの画像データを合成することもできる。こ の場合の合成例が図 14 (b)に示す合成立体情報例 1320である。この合成の際、複 数の原画像間の共通要素から合成してもよい。また、全く異なる原画像データを合成 してもよく、空間構図を必要に応じて変更してもよい。
[0151] なお、本実施の形態における「エフヱタト」とは、画像 (静止画像および動画像)に対 する効果全般を指すものとする。効果の例として、一般的なノンリニアな画像処理方 法や、カメラワークやカメラアングル、カメラパラメータの変化によって可能な撮影時に 付与する (付与できる)ものなどを挙げることができる。また、一般的なデジタル画像処 理ソフト等で可能な処理も含まれる。更に、画像シーンに合わせて音楽や擬音を配 置することも効果の範疇に入る。また、カメラアングルなど、エフェクトの定義内に含ま れる効果を表す他の用語と「エフェクト」を併記して 、る場合は、併記した効果を強調 しているものであり、エフェクトの範疇を狭めるものではないことを明記する。
[0152] なお、静止画像からのオブジェクト抽出であるため、抽出されたオブジェクトについ ての厚み情報が欠ける場合がありえる。この際、奥行き情報に基づいて適当な値を 厚みとして設定することも可能である(奥行き情報力 相対的なオブジェクトのサイズ を算出し、サイズから厚みを適当に設定する、など任意の手法を取ってよい。 ) o
[0153] なお、予めテンプレートなどを用意しておき、オブジェクトが何であるかを認識して、 その認識結果を厚みの設定に用いてもよい。例えばリンゴであると認識された場合に は、リンゴ相応の大きさに厚みを設定し、車であると認識された場合には、車相応の 大きさに厚みを設定してもよ 、。
[0154] なお、消失点をオブジェクトに設定してもよい。実際には無限遠に無いオブジェクト であっても無限遠に有るものとして処理することもできる。
[0155] なお、オブジェクトの抽出にあたり、オブジェクトをマスクするマスク画像を生成して ちょい。
[0156] なお、抽出されたオブジェクトの立体情報へのマッピングに際して、奥行き情報内 の適当な位置に再配置してもよ 、。必ずしも原画像データに忠実な位置にマツピン グする必要は無ぐエフェクトを施しやす!/ヽ位置やデータ処理がしゃす!/ヽ位置など任 意の位置に再配置してもよ!/、。
[0157] なお、オブジェクトを抽出した際、若しくは立体情報にマッピングした際、若しくは立 体譲歩宇宙のオブジェクトについて処理を行う際、オブジェクトの裏側に相当する情 報を適当に付与してもよ 、。原画像からはオブジェクトの裏側の情報は得られな 、こ とがありえるが、その際に、表側の情報を基に裏側の情報を設定してもよい (たとえば 、オブジェクトの表側に相当する画像情報(立体情報で言えばテクスチャやポリゴン などに相当する情報)をオブジェクトの裏側にもコピーするなど)。もちろん、他のォブ ジェタトや、他の空間情報などを参考に裏側の情報を設定してもよい。さらに、影をつ ける、黒く表示する、裏側から見るとオブジェクトが存在しないように見える、など裏側 に与える情報そのものについては任意のものを与えることができる。なお、オブジェク トと背景をなめらかに見せるため、任意のスムージング処理を行ってもよい (境界をぼ かすなど)。
[0158] なお、 3次元的に空間情報として配置されたオブジェクトの位置に基づきカメラパラ メータを変更してもよい。例えば、画像生成時にオブジェクトの位置や空間構図から カメラ位置 Z深度によりピント情報 (ピンボケ情報)を生成し、遠近感のある画像を生 成してもよい。この場合、オブジェクトのみぼ力しても良ぐまたオブジェクト及びその 周囲をもぼ力してもよい。
[0159] なお、上記実施の形態 1に係る画像データ管理装置 100では、空間構図ユーザ IF 部 111、オブジェクトユーザ IF部 121、立体情報ユーザ IF部 131、情報補正ユーザ I F部 140、エフヱタトユーザ IF部 162および視点制御ユーザ IF部 182として分離させ た機能構成とした力 上記の各 IF部の機能を備える一の IF部を有するように構成し てもよい。
産業上の利用可能性
[0160] 本発明は、マイクロコンピュータ、デジタルカメラ又はカメラ付携帯電話機などの静 止画から立体画像を生成する画像処理装置などに利用が可能である。

Claims

請求の範囲
[1] 静止画像から立体情報を生成する画像処理装置であって、
静止画像を取得する画像取得手段と、
取得された前記静止画像の中からオブジェクトを抽出するオブジェクト抽出手段と、 取得された前記静止画像における特徴を利用して、消失点を含む仮想的な空間を 表す空間構図を特定する空間構図特定手段と、
特定された前記空間構図に、抽出された前記オブジェクトを関連づけることによつ て前記仮想的な空間におけるオブジェクトの配置を決定し、決定された当該オブジェ タトの配置から前記オブジェクトに関する立体情報を生成する立体情報生成手段と を備えることを特徴とする画像処理装置。
[2] 前記画像処理装置は、さらに、
前記仮想的な空間内にカメラを想定し、当該カメラの位置を移動させる視点制御手 段と、
前記カメラによって、任意の位置力 撮影した場合の画像を生成する画像生成手 段と、
生成された前記画像を表示する画像表示手段と
を備えることを特徴とする請求項 1記載の画像処理装置。
[3] 前記視点制御手段は、
前記カメラが、生成された前記立体情報が存在する範囲を移動するように制御する ことを特徴とする請求項 2記載の画像処理装置。
[4] 前記視点制御手段は、さらに、
前記カメラが、前記オブジェクトが存在しない空間を移動するように制御する ことを特徴とする請求項 2記載の画像処理装置。
[5] 前記視点制御手段は、さらに、
前記カメラが、生成された前記立体情報が示す前記オブジェクトが存在する領域を 撮影するように制御する
ことを特徴とする請求項 2記載の画像処理装置。
[6] 前記視点制御手段は、さらに、 前記カメラが、前記消失点の方向へ移動するように制御する
ことを特徴とする請求項 2記載の画像処理装置。
[7] 前記視点制御手段は、さらに、
前記カメラが、生成された前記立体情報が示す前記オブジェクトの方向へ進むよう に制御する
ことを特徴とする請求項 2記載の画像処理装置。
[8] 前記オブジェクト抽出手段は、
抽出された前記オブジェクトの中から 2以上の非並行の線状のオブジェクトを特定し 前記空間構図特定手段は、さらに、
特定された前記 2以上の線状のオブジェクトを延長することによって、 1以上の消失 点の位置を推定し、
特定された前記 2以上の線状のオブジェクトと前記推定された消失点の位置とから 前記空間構図を特定する
ことを特徴とする請求項 1記載の画像処理装置。
[9] 前記空間構図特定手段は、さらに、
前記静止画像の外部においても前記消失点を推定する
ことを特徴とする請求項 8記載の画像処理装置。
[10] 前記画像処理装置は、さらに、
ユーザ力もの指示を受け付けるユーザインタフェース手段を備え、
前記空間構図特定手段は、さらに、
受け付けられたユーザ力 の指示に従って、特定された前記空間構図を修正する ことを特徴とする請求項 1記載の画像処理装置。
[11] 前記画像処理装置は、さらに、
空間構図のひな形となる空間構図テンプレートを記憶する空間構図テンプレート記 憶手段を備え、
前記空間構図特定手段は、
取得された前記静止画像における特徴を利用して前記空間構図テンプレート記憶 手段力 一の空間構図テンプレートを選択し、選択された当該空間構図テンプレート を用いて前記空間構図を特定する
ことを特徴とする請求項 1記載の画像処理装置。
[12] 前記立体情報生成手段は、さらに、
前記オブジェクトが前記空間構図における地平面に接する接地点を算出し、前記 オブジェクトが前記接地点の位置に存在する場合の前記立体情報を生成する ことを特徴とする請求項 1記載の画像処理装置。
[13] 前記立体情報生成出段は、さらに、
前記オブジェクトの種類によって、前記オブジェクトが前記空間構図と接する面を変 更する
ことを特徴とする請求項 12記載の画像処理装置。
[14] 前記立体情報生成出段は、さらに、
前記オブジェクトが前記空間構図の地平面と接する接地点が算出できな力つた場 合に、前記オブジェクト若しくは前記地平面の少なくとも一つを、内挿若しくは外揷若 しくは補間することで、地平面と接する仮想接地点を算出し、前記オブジェクトが前記 仮想接地点の位置に存在する場合の前記立体情報を生成する
ことを特徴とする請求項 12記載の画像処理装置。
[15] 前記立体情報生成手段は、さらに、
前記オブジェクトに所定の厚みを付与して空間に配置し、前記立体情報を生成す る
ことを特徴とする請求項 1記載の画像処理装置。
[16] 前記立体情報生成手段は、さらに、
前記オブジェクトの周囲をぼかす又は尖鋭にする画像処理を付加して、前記立体 情報を生成する
ことを特徴とする請求項 1記載の画像処理装置。
[17] 前記立体情報生成手段は、さらに、
前記オブジェクトの影に隠れていることにより欠如している背景のデータ又は他の オブジェクトのデータの少なくとも一方を、隠れて ヽな 、データを用いて構成する ことを特徴とする請求項 1記載の画像処理装置。
[18] 前記立体情報生成手段は、さらに、
前記オブジェクトの背面や側面を表すデータを、前記オブジェクトの前面のデータ から構成する
ことを特徴とする請求項 17記載の画像処理装置。
[19] 前記立体情報生成手段は、
前記オブジェクトの種類に基づいて、前記オブジェクトに関する処理を動的に変化 させる
ことを特徴とする請求項 18記載の画像処理装置。
[20] 静止画像から立体情報を生成する画像処理方法であって、
静止画像を取得する画像取得ステップと、
取得された前記静止画像の中からオブジェクトを抽出するオブジェクト抽出ステップ と、
取得された前記静止画像における特徴を利用して、消失点を含む仮想的な空間を 表す空間構図を特定する空間構図特定ステップと、
特定された前記空間構図に、抽出された前記オブジェクトを関連づけることによつ て前記仮想的な空間におけるオブジェクトの配置を決定し、決定された当該オブジェ タトの配置力 前記オブジェクトに関する立体情報を生成する立体情報生成ステップ と
を含むことを特徴とする画像処理方法。
[21] 静止画像から立体情報を生成する画像処理装置に使用される、コンピュータに実 行させるためのプログラムであって、
静止画像を取得する画像取得ステップと、
取得された前記静止画像の中からオブジェクトを抽出するオブジェクト抽出ステップ と、
取得された前記静止画像における特徴を利用して、消失点を含む仮想的な空間を 表す空間構図を特定する空間構図特定ステップと、
特定された前記空間構図に、抽出された前記オブジェクトを関連づけることによつ て前記仮想的な空間におけるオブジェクトの配置を決定し、決定された当該オブジェ タトの配置力 前記オブジェクトに関する立体情報を生成する立体情報生成ステップ と
を含むプログラム。
PCT/JP2005/013505 2004-07-23 2005-07-22 画像処理装置および画像処理方法 WO2006009257A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
US11/629,618 US20080018668A1 (en) 2004-07-23 2005-07-22 Image Processing Device and Image Processing Method
JP2006519641A JP4642757B2 (ja) 2004-07-23 2005-07-22 画像処理装置および画像処理方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004-215233 2004-07-23
JP2004215233 2004-07-23

Publications (1)

Publication Number Publication Date
WO2006009257A1 true WO2006009257A1 (ja) 2006-01-26

Family

ID=35785364

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2005/013505 WO2006009257A1 (ja) 2004-07-23 2005-07-22 画像処理装置および画像処理方法

Country Status (4)

Country Link
US (1) US20080018668A1 (ja)
JP (1) JP4642757B2 (ja)
CN (1) CN101019151A (ja)
WO (1) WO2006009257A1 (ja)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009015583A (ja) * 2007-07-04 2009-01-22 Nagasaki Univ 画像処理装置及び画像処理方法
JP2013506198A (ja) * 2009-09-25 2013-02-21 イーストマン コダック カンパニー デジタル画像の美的品質の推定方法
JP2013037510A (ja) * 2011-08-08 2013-02-21 Juki Corp 画像処理装置
CN103063314A (zh) * 2012-01-12 2013-04-24 杭州美盛红外光电技术有限公司 热像装置和热像拍摄方法
CN103105234A (zh) * 2012-01-12 2013-05-15 杭州美盛红外光电技术有限公司 热像装置和热像规范拍摄方法
JP2015039490A (ja) * 2013-08-21 2015-03-02 株式会社三共 遊技機
WO2018051688A1 (ja) * 2016-09-15 2018-03-22 キヤノン株式会社 仮想視点画像の生成に関する情報処理装置、方法及びプログラム
US9948913B2 (en) 2014-12-24 2018-04-17 Samsung Electronics Co., Ltd. Image processing method and apparatus for processing an image pair
CN108171649A (zh) * 2017-12-08 2018-06-15 广东工业大学 一种保持焦点信息的图像风格化方法
JP2019096996A (ja) * 2017-11-21 2019-06-20 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
JP2022069007A (ja) * 2020-10-23 2022-05-11 株式会社アフェクション 情報処理システム、情報処理方法および情報処理プログラム

Families Citing this family (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8559705B2 (en) 2006-12-01 2013-10-15 Lytro, Inc. Interactive refocusing of electronic images
US10298834B2 (en) 2006-12-01 2019-05-21 Google Llc Video refocusing
US20100265385A1 (en) * 2009-04-18 2010-10-21 Knight Timothy J Light Field Camera Image, File and Configuration Data, and Methods of Using, Storing and Communicating Same
US8117137B2 (en) 2007-04-19 2012-02-14 Microsoft Corporation Field-programmable gate array based accelerator system
US20080310707A1 (en) * 2007-06-15 2008-12-18 Microsoft Corporation Virtual reality enhancement using real world data
US8264505B2 (en) * 2007-12-28 2012-09-11 Microsoft Corporation Augmented reality and filtering
TW200948043A (en) * 2008-01-24 2009-11-16 Koninkl Philips Electronics Nv Method and image-processing device for hole filling
KR20090092153A (ko) * 2008-02-26 2009-08-31 삼성전자주식회사 이미지 처리 장치 및 방법
US8301638B2 (en) 2008-09-25 2012-10-30 Microsoft Corporation Automated feature selection based on rankboost for ranking
US8131659B2 (en) 2008-09-25 2012-03-06 Microsoft Corporation Field-programmable gate array based accelerator system
US8279325B2 (en) 2008-11-25 2012-10-02 Lytro, Inc. System and method for acquiring, editing, generating and outputting video data
WO2010077625A1 (en) 2008-12-08 2010-07-08 Refocus Imaging, Inc. Light field data acquisition devices, and methods of using and manufacturing same
US8624962B2 (en) * 2009-02-02 2014-01-07 Ydreams—Informatica, S.A. Ydreams Systems and methods for simulating three-dimensional virtual interactions from two-dimensional camera images
JP5257157B2 (ja) * 2009-03-11 2013-08-07 ソニー株式会社 撮像装置、撮像装置の制御方法およびプログラム
US8908058B2 (en) * 2009-04-18 2014-12-09 Lytro, Inc. Storage and transmission of pictures including multiple frames
US8310523B2 (en) * 2009-08-27 2012-11-13 Sony Corporation Plug-in to enable CAD software not having greater than 180 degree capability to present image from camera of more than 180 degrees
EP2513868A4 (en) 2009-12-16 2014-01-22 Hewlett Packard Development Co ESTIMATING A 3D STRUCTURE FROM A 2D IMAGE
JP5424926B2 (ja) * 2010-02-15 2014-02-26 パナソニック株式会社 映像処理装置、映像処理方法
US8749620B1 (en) 2010-02-20 2014-06-10 Lytro, Inc. 3D light field cameras, images and files, and methods of using, operating, processing and viewing same
US8666978B2 (en) * 2010-09-16 2014-03-04 Alcatel Lucent Method and apparatus for managing content tagging and tagged content
US8533192B2 (en) 2010-09-16 2013-09-10 Alcatel Lucent Content capture device and methods for automatically tagging content
US8655881B2 (en) 2010-09-16 2014-02-18 Alcatel Lucent Method and apparatus for automatically tagging content
US8768102B1 (en) 2011-02-09 2014-07-01 Lytro, Inc. Downsampling light field images
US9184199B2 (en) 2011-08-01 2015-11-10 Lytro, Inc. Optical assembly including plenoptic microlens array
JP5724057B2 (ja) * 2011-08-30 2015-05-27 パナソニックIpマネジメント株式会社 撮像装置
JP5269972B2 (ja) * 2011-11-29 2013-08-21 株式会社東芝 電子機器及び三次元モデル生成支援方法
US8811769B1 (en) 2012-02-28 2014-08-19 Lytro, Inc. Extended depth of field and variable center of perspective in light-field processing
US8948545B2 (en) 2012-02-28 2015-02-03 Lytro, Inc. Compensating for sensor saturation and microlens modulation during light-field image processing
US8995785B2 (en) 2012-02-28 2015-03-31 Lytro, Inc. Light-field processing and analysis, camera control, and user interfaces and interaction on light-field capture devices
US8831377B2 (en) 2012-02-28 2014-09-09 Lytro, Inc. Compensating for variation in microlens position during light-field image processing
US9330466B2 (en) * 2012-03-19 2016-05-03 Adobe Systems Incorporated Methods and apparatus for 3D camera positioning using a 2D vanishing point grid
US9754357B2 (en) * 2012-03-23 2017-09-05 Panasonic Intellectual Property Corporation Of America Image processing device, stereoscoopic device, integrated circuit, and program for determining depth of object in real space generating histogram from image obtained by filming real space and performing smoothing of histogram
CN102752616A (zh) * 2012-06-20 2012-10-24 四川长虹电器股份有限公司 双目立体视频转换多目立体视频的方法
US9607424B2 (en) 2012-06-26 2017-03-28 Lytro, Inc. Depth-assigned content for depth-enhanced pictures
US9858649B2 (en) 2015-09-30 2018-01-02 Lytro, Inc. Depth-based image blurring
US10129524B2 (en) 2012-06-26 2018-11-13 Google Llc Depth-assigned content for depth-enhanced virtual reality images
US8997021B2 (en) 2012-11-06 2015-03-31 Lytro, Inc. Parallax and/or three-dimensional effects for thumbnail image displays
US9001226B1 (en) 2012-12-04 2015-04-07 Lytro, Inc. Capturing and relighting images using multiple devices
US8983176B2 (en) * 2013-01-02 2015-03-17 International Business Machines Corporation Image selection and masking using imported depth information
US10334151B2 (en) 2013-04-22 2019-06-25 Google Llc Phase detection autofocus using subaperture images
JP6027705B2 (ja) * 2014-03-20 2016-11-16 富士フイルム株式会社 画像処理装置,方法,およびそのプログラム
US9414087B2 (en) 2014-04-24 2016-08-09 Lytro, Inc. Compression of light field images
US9712820B2 (en) 2014-04-24 2017-07-18 Lytro, Inc. Predictive light field compression
US9336432B2 (en) * 2014-06-05 2016-05-10 Adobe Systems Incorporated Adaptation of a vector drawing based on a modified perspective
US8988317B1 (en) 2014-06-12 2015-03-24 Lytro, Inc. Depth determination for light field images
EP3185747A1 (en) 2014-08-31 2017-07-05 Berestka, John Systems and methods for analyzing the eye
US9635332B2 (en) 2014-09-08 2017-04-25 Lytro, Inc. Saturated pixel recovery in light-field images
US11328446B2 (en) 2015-04-15 2022-05-10 Google Llc Combining light-field data with active depth data for depth map generation
US10419737B2 (en) 2015-04-15 2019-09-17 Google Llc Data structures and delivery methods for expediting virtual reality playback
US10444931B2 (en) 2017-05-09 2019-10-15 Google Llc Vantage generation and interactive playback
US10546424B2 (en) 2015-04-15 2020-01-28 Google Llc Layered content delivery for virtual and augmented reality experiences
US10567464B2 (en) 2015-04-15 2020-02-18 Google Llc Video compression with adaptive view-dependent lighting removal
US10275898B1 (en) 2015-04-15 2019-04-30 Google Llc Wedge-based light-field video capture
US10341632B2 (en) 2015-04-15 2019-07-02 Google Llc. Spatial random access enabled video system with a three-dimensional viewing volume
US10440407B2 (en) 2017-05-09 2019-10-08 Google Llc Adaptive control for immersive experience delivery
US10412373B2 (en) 2015-04-15 2019-09-10 Google Llc Image capture for virtual reality displays
US10565734B2 (en) 2015-04-15 2020-02-18 Google Llc Video capture, processing, calibration, computational fiber artifact removal, and light-field pipeline
US10540818B2 (en) 2015-04-15 2020-01-21 Google Llc Stereo image generation and interactive playback
US10469873B2 (en) 2015-04-15 2019-11-05 Google Llc Encoding and decoding virtual reality video
US9979909B2 (en) 2015-07-24 2018-05-22 Lytro, Inc. Automatic lens flare detection and correction for light-field images
JP6256509B2 (ja) * 2016-03-30 2018-01-10 マツダ株式会社 電子ミラー制御装置
US10275892B2 (en) 2016-06-09 2019-04-30 Google Llc Multi-view scene segmentation and propagation
US10679361B2 (en) 2016-12-05 2020-06-09 Google Llc Multi-view rotoscope contour propagation
US10594945B2 (en) 2017-04-03 2020-03-17 Google Llc Generating dolly zoom effect using light field image data
US10474227B2 (en) 2017-05-09 2019-11-12 Google Llc Generation of virtual reality with 6 degrees of freedom from limited viewer data
US10354399B2 (en) 2017-05-25 2019-07-16 Google Llc Multi-view back-projection to a light-field
US10545215B2 (en) 2017-09-13 2020-01-28 Google Llc 4D camera tracking and optical stabilization
US10965862B2 (en) 2018-01-18 2021-03-30 Google Llc Multi-camera navigation interface
CN110110718B (zh) * 2019-03-20 2022-11-22 安徽名德智能科技有限公司 一种人工智能图像处理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10271535A (ja) * 1997-03-19 1998-10-09 Hitachi Ltd 画像変換方法及び画像変換装置
JP2000030084A (ja) * 1998-07-13 2000-01-28 Dainippon Printing Co Ltd 画像合成装置
JP2000123196A (ja) * 1998-09-25 2000-04-28 Lucent Technol Inc 三次元仮想現実のための表示技法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5625408A (en) * 1993-06-24 1997-04-29 Canon Kabushiki Kaisha Three-dimensional image recording/reconstructing method and apparatus therefor
EP0637815B1 (en) * 1993-08-04 2006-04-05 Canon Kabushiki Kaisha Image processing method and image processing apparatus
US5687249A (en) * 1993-09-06 1997-11-11 Nippon Telephone And Telegraph Method and apparatus for extracting features of moving objects
US6839081B1 (en) * 1994-09-09 2005-01-04 Canon Kabushiki Kaisha Virtual image sensing and generating method and apparatus
US6640004B2 (en) * 1995-07-28 2003-10-28 Canon Kabushiki Kaisha Image sensing and image processing apparatuses
US6057847A (en) * 1996-12-20 2000-05-02 Jenkins; Barry System and method of image generation and encoding using primitive reprojection
US6229548B1 (en) * 1998-06-30 2001-05-08 Lucent Technologies, Inc. Distorting a two-dimensional image to represent a realistic three-dimensional virtual reality
US6417850B1 (en) * 1999-01-27 2002-07-09 Compaq Information Technologies Group, L.P. Depth painting for 3-D rendering applications
CN1160210C (zh) * 1999-09-20 2004-08-04 松下电器产业株式会社 驾驶提醒装置
JP2001111804A (ja) * 1999-10-04 2001-04-20 Nippon Columbia Co Ltd 画像変換装置及び画像変換方法
KR100443552B1 (ko) * 2002-11-18 2004-08-09 한국전자통신연구원 가상 현실 구현 시스템 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10271535A (ja) * 1997-03-19 1998-10-09 Hitachi Ltd 画像変換方法及び画像変換装置
JP2000030084A (ja) * 1998-07-13 2000-01-28 Dainippon Printing Co Ltd 画像合成装置
JP2000123196A (ja) * 1998-09-25 2000-04-28 Lucent Technol Inc 三次元仮想現実のための表示技法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
GUILLOU E. AND MENEVEAUX D. ET AL: "Using vanishing points for camera calibration and coarse 3D reconstruction from a single image.", THE VISUAL COMPUTER., vol. 16, no. 7, 2000, pages 396 - 410, XP002991719 *

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009015583A (ja) * 2007-07-04 2009-01-22 Nagasaki Univ 画像処理装置及び画像処理方法
JP2013506198A (ja) * 2009-09-25 2013-02-21 イーストマン コダック カンパニー デジタル画像の美的品質の推定方法
JP2013037510A (ja) * 2011-08-08 2013-02-21 Juki Corp 画像処理装置
CN103063314A (zh) * 2012-01-12 2013-04-24 杭州美盛红外光电技术有限公司 热像装置和热像拍摄方法
CN103105234A (zh) * 2012-01-12 2013-05-15 杭州美盛红外光电技术有限公司 热像装置和热像规范拍摄方法
JP2015039490A (ja) * 2013-08-21 2015-03-02 株式会社三共 遊技機
US9948913B2 (en) 2014-12-24 2018-04-17 Samsung Electronics Co., Ltd. Image processing method and apparatus for processing an image pair
WO2018051688A1 (ja) * 2016-09-15 2018-03-22 キヤノン株式会社 仮想視点画像の生成に関する情報処理装置、方法及びプログラム
JP2018046448A (ja) * 2016-09-15 2018-03-22 キヤノン株式会社 画像処理装置および画像処理方法
JP2019096996A (ja) * 2017-11-21 2019-06-20 キヤノン株式会社 情報処理装置、情報処理方法、及びプログラム
CN108171649A (zh) * 2017-12-08 2018-06-15 广东工业大学 一种保持焦点信息的图像风格化方法
CN108171649B (zh) * 2017-12-08 2021-08-17 广东工业大学 一种保持焦点信息的图像风格化方法
JP2022069007A (ja) * 2020-10-23 2022-05-11 株式会社アフェクション 情報処理システム、情報処理方法および情報処理プログラム

Also Published As

Publication number Publication date
CN101019151A (zh) 2007-08-15
JPWO2006009257A1 (ja) 2008-05-01
US20080018668A1 (en) 2008-01-24
JP4642757B2 (ja) 2011-03-02

Similar Documents

Publication Publication Date Title
JP4642757B2 (ja) 画像処理装置および画像処理方法
CN110738595B (zh) 图片处理方法、装置和设备及计算机存储介质
US9489765B2 (en) Silhouette-based object and texture alignment, systems and methods
JP6220486B1 (ja) 3次元モデル生成システム、3次元モデル生成方法、及びプログラム
US7903111B2 (en) Depth image-based modeling method and apparatus
US8947422B2 (en) Gradient modeling toolkit for sculpting stereoscopic depth models for converting 2-D images into stereoscopic 3-D images
JP6196416B1 (ja) 3次元モデル生成システム、3次元モデル生成方法、及びプログラム
EP3668093B1 (en) Method, system and apparatus for capture of image data for free viewpoint video
US9374535B2 (en) Moving-image processing device, moving-image processing method, and information recording medium
JP2019053732A (ja) シーン内に存在する不要なオブジェクトの除去に基づくシーンの画像の動的生成
WO1998009253A1 (fr) Procede permettant de fournir des informations sur une texture, procede d'extraction d'objet, procede de production de modeles tridimensionnels et appareillage associe a ceux-ci
JP2014178957A (ja) 学習データ生成装置、学習データ作成システム、方法およびプログラム
CN104735435B (zh) 影像处理方法及电子装置
US8436852B2 (en) Image editing consistent with scene geometry
CN111008927B (zh) 一种人脸替换方法、存储介质及终端设备
JP2011048586A (ja) 画像処理装置および画像処理方法、並びにプログラム
JP2010237804A (ja) 画像検索システム及び画像検索方法
JP2010287174A (ja) 家具シミュレーション方法、装置、プログラム、記録媒体
CN111724470B (zh) 一种处理方法及电子设备
JP6272071B2 (ja) 画像処理装置、画像処理方法及びプログラム
Park Interactive 3D reconstruction from multiple images: A primitive-based approach
KR101566459B1 (ko) 이미지 기반의 비주얼 헐에서의 오목 표면 모델링
Zhong et al. Slippage-free background replacement for hand-held video
JP2020173726A (ja) 仮想視点変換装置及びプログラム
CN115359169A (zh) 图像处理方法、装置和存储介质

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): AE AG AL AM AT AU AZ BA BB BG BR BW BY BZ CA CH CN CO CR CU CZ DE DK DM DZ EC EE EG ES FI GB GD GE GH GM HR HU ID IL IN IS JP KE KG KM KP KR KZ LC LK LR LS LT LU LV MA MD MG MK MN MW MX MZ NA NG NI NO NZ OM PG PH PL PT RO RU SC SD SE SG SK SL SM SY TJ TM TN TR TT TZ UA UG US UZ VC VN YU ZA ZM ZW

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): BW GH GM KE LS MW MZ NA SD SL SZ TZ UG ZM ZW AM AZ BY KG KZ MD RU TJ TM AT BE BG CH CY CZ DE DK EE ES FI FR GB GR HU IE IS IT LT LU LV MC NL PL PT RO SE SI SK TR BF BJ CF CG CI CM GA GN GQ GW ML MR NE SN TD TG

WWE Wipo information: entry into national phase

Ref document number: 2006519641

Country of ref document: JP

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWE Wipo information: entry into national phase

Ref document number: 11629618

Country of ref document: US

WWE Wipo information: entry into national phase

Ref document number: 200580024753.5

Country of ref document: CN

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase
WWP Wipo information: published in national office

Ref document number: 11629618

Country of ref document: US