+

WO1998015117A1 - Method for temporally and spatially integrating and managing a plurality of videos, device used for the same, and recording medium storing program of the method - Google Patents

Method for temporally and spatially integrating and managing a plurality of videos, device used for the same, and recording medium storing program of the method Download PDF

Info

Publication number
WO1998015117A1
WO1998015117A1 PCT/JP1997/003526 JP9703526W WO9815117A1 WO 1998015117 A1 WO1998015117 A1 WO 1998015117A1 JP 9703526 W JP9703526 W JP 9703526W WO 9815117 A1 WO9815117 A1 WO 9815117A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
image
space
subject
spatio
Prior art date
Application number
PCT/JP1997/003526
Other languages
English (en)
French (fr)
Inventor
Akihito Akutsu
Yoshinobu Tonomura
Hiroshi Hamada
Original Assignee
Nippon Telegraph And Telephone Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph And Telephone Corporation filed Critical Nippon Telegraph And Telephone Corporation
Priority to DE69732089T priority Critical patent/DE69732089T2/de
Priority to EP97943138A priority patent/EP0866606B1/en
Publication of WO1998015117A1 publication Critical patent/WO1998015117A1/ja
Priority to NO19982517A priority patent/NO323034B1/no
Priority to US09/090,642 priority patent/US6411339B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • H04N5/77Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera
    • H04N5/772Interface circuits between an apparatus for recording and another apparatus between a recording apparatus and a television camera the recording apparatus and the television camera being placed in the same enclosure
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • H04N19/25Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding with scene description coding, e.g. binary format for scenes [BIFS] compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2625Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects for obtaining an image which is composed of images from a temporal image sequence, e.g. for a stroboscopic effect
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection

Definitions

  • the present invention relates to a technology for creating a new image by integrating a plurality of images, and particularly to a method for integrating and managing a plurality of images in a spatio-temporal manner, an apparatus and a device therefor. It relates to a recording medium on which the program is recorded. Background art
  • multiple images refers to, for example, a plurality of images from cameras installed at sports stadiums such as Olympics. Or even a video shot with a single camera could be a video of a different player's situation.
  • handling refers to viewing, comparing, searching, and editing a plurality of videos at the same time.
  • one example is to create a single video in which each player is overlapped in a common space from a plurality of videos of different players.
  • to manage spatiotemporally means to uniformly manage information extracted based on the spatiotemporal structure of video.
  • the subject and the background are separated, and each is managed, and at the same time, the information on the relationship between the space and time is managed.
  • the unified management of multiple images using the spatio-temporal structure is not included and is simply a combination of conventional technologies. It is impossible to manage multiple images in a unified manner in space and time.
  • the purpose of the present invention is to efficiently provide video information on a user's own style for a plurality of videos taken in the same space according to their interests and purposes.
  • In order to acquire it is possible to integrate multiple images in a spatio-temporal manner and to gen- erate and sense the images, and to manage, express, and operate multiple images in a unified manner in a spatio-temporal manner.
  • An object of the present invention is to provide a method for integrating and managing a plurality of videos in a spatio-temporal manner, a device, and a recording medium on which the program is recorded. Disclosure of the invention
  • the spatio-temporal integration and management device of multiple videos is a device that integrates and manages a plurality of videos in a spatio-temporal manner.
  • An image data column memory unit for reading the image data and storing it as a data column;
  • a shooting state detector that reads out the data from the memory section and detects shooting state information including camera on-off information and camera operation information.
  • a video division unit for dividing the video image of the data sequence into shots based on the camera on / off information, and using the camera operation information and a physical characteristic amount.
  • the object that separates the subject from the background for each frame of the video, the background separation section, and the subject information separated for each frame are associated with each other between the frames.
  • An object movement information extraction unit and a camera space for recombining a camera space where the video is shot from the camera operation information and a background separated for each frame.
  • a re-synthesizing unit, and the imaging from the plurality of divided shots An inter-shot relationship calculating section for calculating a spatial inter-shot relation between a plurality of imaging spaces re-combined by the spatial re-combining section;
  • a video structure information management / storage unit that manages / accumulates subject information, the associated subject information, the shooting state information, the background information, and the information on the relationship between the shots. , Is characterized by having.
  • a video structured information transmission / reception unit for transmitting or receiving all or a part of the above.
  • the management device may perform the image structure information management according to one or both of given conditions and user requests.
  • a re-synthesizing unit for re-synthesizing one or a plurality of photographing spaces and one or a plurality of subjects based on information managed and accumulated; and a video re-synthesized by the re-synthesizing unit.
  • a user input unit for inputting a request of the user for re-synthesis based on a video displayed on the display unit.
  • an output unit for outputting an image displayed on the display unit to an external device in a digital or analog format as necessary is provided.
  • the spatio-temporal integration and management method of multiple videos is a method of integrating and managing a plurality of videos, reading video data, and And storing the image data, and reading out the data sequence from the image data sequence memory unit, and including camera on / off information and camera operation information.
  • a subject and background separation process for separating the subject from the background for each frame of the video using the camera operation information and a physical feature amount; and a separation for each frame.
  • the subject information between the frames A process of extracting subject movement information, and recombining a shooting space where the video is shot from the camera operation information and a background separated for each frame.
  • Calculating the relationship between the shots which calculates the relationship between the shots,
  • a video structure that manages and accumulates information on the separated subject, information on the associated subject, the photography information, the background information, and the information on the relationship between the shots. It is characterized by having information management and storage process.
  • all of the extracted subject information, shooting state information, background information, shot-related information, and video data are all included.
  • the spatio-temporal integration of multiple images according to the present invention, and a computer-readable recording medium that records a management program can integrate multiple images in a spatio-temporal manner.
  • the saving process and the reading of the data sequence from the image data sequence memory section to detect the shooting status information including camera on / off information and camera operation information The detection process and before A video dividing process of dividing the video of the data sequence into shots based on the camera on / off information, and using the camera operation information and physical feature amounts; A subject that separates the subject from the background for each frame of the video, a background separation process, and a subject that associates the subject information separated for each frame between the frames A motion information extracting process; a photographing space combining process for recomposing a photographing space in which the video is photographed from the camera operation information and a background separated for each frame; Calculating, from the shots thus divided, spatial relations between the plurality of shooting spaces reconstructed in the shooting space recombining process, respectively.
  • the process of calculating the relationship between shots Manages and accumulates information on the separated subject, information on the associated subject, the shooting state information, the background information, and the information on the relationship between the shots. And a storage step.
  • the extracted subject information it further includes a video structured information transmission / reception process for transmitting or receiving all or a part of the shooting status information, background information, shot relationship information, and video data. It is characterized by
  • the above-mentioned image structure information management / accumulation process is performed on a computer-readable recording medium on which the above-mentioned time-space integration of a plurality of images and a management program are recorded. Later, one or both of the given conditions and the requirements of the user A re-synthesizing step of re-synthesizing one or a plurality of photographing spaces and one or a plurality of subjects based on the information stored and managed; And a display or output process for displaying or outputting the obtained video.
  • a video image is read, a stored image data string is read, and shooting state information including camera on / off information and camera operation information is read.
  • the video is detected, the video is divided into shots based on the camera on / off information, and the video is divided into frames for each frame using the camera operation information and physical feature values.
  • the subject and background are separated, the separated subject information is correlated between the frames, and the subject movement information is extracted, and the camera operation information and each frame are extracted.
  • the shooting space is recombined from the background, and the spatial shot relationship between the plurality of reconstructed shooting spaces is calculated from the plurality of shots.
  • the user can freely select, search, and retrieve such information at any place. It can be fetched and sent to any user at any location. Also, any user can send such information from any place.
  • one or more photographing spaces and one or more objects are recombined and displayed or displayed externally.
  • the digital format it is conventionally possible to acquire information simultaneously for multiple images that have been shot in the same space, in time and space.
  • users can obtain information on multiple videos simultaneously and intuitively and efficiently with their own styles according to their interests and purposes.
  • FIG. 1 is a diagram illustrating the configuration and processing flow of an embodiment of the present invention.
  • FIG. 2 is a diagram for explaining the configuration of the imaging state detection unit and the flow of processing in the above embodiment.
  • FIG. 3 is a flowchart of a process performed by the imaging state detection unit in the embodiment.
  • FIG. 4 is a diagram for explaining the camera operation information in the above embodiment.
  • FIG. 5 is a diagram illustrating an algorithm for extracting camera operation information in the above embodiment.
  • FIG. 6 is a diagram illustrating the configuration of the subject / background separation unit and the flow of processing in the above embodiment.
  • FIG. 7 is a diagram illustrating an example of the binarization processing in the above embodiment.
  • FIG. 8 shows the processing of labeling in the above embodiment. It is a flow chart.
  • FIG. 9 is a diagram showing the image scanning order in the above embodiment.
  • FIG. 10 is a diagram showing target pixels and scanned pixels in the above embodiment.
  • FIG. 11 is a diagram for explaining a method of recomposing an imaging space based on camera scanning in the above embodiment.
  • Figure 12 is a diagram illustrating the cylinder transformation.
  • FIG. 13 is a diagram for explaining a strobe expression by time and space sampling according to the above embodiment. Best mode for carrying out the invention
  • FIG. 1 shows an apparatus configuration diagram of an embodiment of the present invention.
  • each component and method will be described with reference to the configuration diagram.
  • the video signal input from the video signal input unit 101 in FIG. 1 is temporarily stored in the image data column memory unit 102.
  • the stored video signal is subjected to video processing in a shooting state detection unit 103 to extract camera on / off information and camera operation information.
  • FIG. 2 shows the configuration of the shooting state detector 103.
  • FIG. 3 shows the flow of processing by the components of the photographing state detection unit 103 from 201 to 204.
  • the configuration and processing flow of each component will be described in detail below using these drawings.
  • the number of frames of the video signal read out from the memory section of the image data of the image 102 in FIG. 102 is 301 shown in FIG. 3.
  • This is called a spatio-temporal image.
  • the horizontal and vertical linear components are calculated for each frame image in a linear component calculation unit 201.
  • the vertical straight line calculation is 302 in FIG. 3
  • the horizontal straight line calculation is 303 in FIG.
  • the 304 obtained by these calculations is called the vertical linear component spatio-temporal image, and the 304 is called the horizontal linear component spatio-temporal image.
  • the image data rearranging section of 2022 is arranged by the image data column rearrangement means so that the vertical and horizontal linear component space-time can be prepared for the next filter processing.
  • the inter-images 304 and 305 are rearranged.
  • the rearrangement processing here corresponds to the reference numeral 106 in FIG. 3, and is a processing for cutting the spatio-temporal image on a plane including the normal of the screen.
  • the direction perpendicular to the x and y coordinate axes of the frame image is defined as the normal direction of the screen.
  • the plane including the cut-off time axis is generally called a spatio-temporal cross-sectional image.
  • this spatio-temporal cross-sectional image a plane that includes the camera's traveling direction and the screen normal, which is used in the field of computer vision.
  • a cut plane (Epipolar Plane Image) at the time of cutting the spatio-temporal image.
  • the three-dimensional position of the subject is estimated from this spatio-temporal cross-sectional image.
  • the locus of the feature points of the object is a straight line on the epipolar plane image, and the inclination of this straight line is the magnitude of the movement of the feature points of the object.
  • the spatio-temporal cut image obtained by cutting the spatio-temporal image so as to include the x and y coordinate axes is particularly called an X-t spatio-temporal image. This is called a spatiotemporal image.
  • An arbitrary X-t spatio-temporal image is cut out from an arbitrary y value, and a plurality of these X-t spatio-temporal images are called an X-t spatio-temporal image sequence. The same applies to the y-t spatiotemporal image sequence.
  • This processing is performed by a line detecting means, and is intended to detect an edge or a line.
  • the filter processing unit 203 calculates the edge or line intensity.
  • the flow pattern along the time axis, which is seen in the cut cross section indicates that the direction of the flow generated by the movement in the video is large. It corresponds to.
  • the edge detection described above detects an edge or a straight line that indicates the direction of the flow, and emphasizes only the movement information from the image. Become .
  • the cut image sequence detected by the edge Vertical and horizontal spatio-temporal edge image sequences are called.
  • the vertical and horizontal spatiotemporal edge image sequence is added to the normal direction of the edge image by the integration means. .
  • this corresponds to 308, and the addition process is performed in the direction of the broken line 308a.
  • This addition processing is intended to further emphasize the movement emphasized in the previous filter processing. In other words, if the movement of the feature points of the object is due to a global movement, the addition processing is emphasized by the addition processing, and conspicuously deviates from the addition processing result. It is projected. On the other hand, if the movement of the feature points of the object is due to local movement, it is weakened by performing the addition processing, and is reflected in the addition processing result. It gets worse.
  • this addition processing is different from the difference processing in that it is strong against noise, and it is possible to extract motion information even from a video that contains a lot of noise. It means.
  • the resulting image obtained by this addition is called a spatio-temporal projection image.
  • X — t vertical spatio-temporal image sequence yields X — t spatio-temporal projection image 3 09
  • y — t horizontal spatio-temporal image yields y — t spatio-temporal projection image 3 1
  • the flow pattern along the time axis of the X-t spatio-temporal projection image represents the horizontal movement of the image
  • the y-t spatio-temporal image pattern is the upward-downward movement. Is expressed.
  • a two-dimensional image having a time axis and a space axis is first obtained by the camera on-off detection means.
  • Perpendicular to the time axis from the extracted features expressed as To extract the camera on / off information by detecting a straight line, the X-t spatio-temporal projection image is expressed as F (X, t), y 1t spatio-temporal projection. Denote the image by F (y, t). If the value C calculated from the evaluation equation expressed by the following equation is equal to or greater than the predetermined threshold value, it is determined that the camera has been turned on / off at the time t. .
  • Camera operations consist of seven basic operations and their combined operations.
  • Basic operations include Fix (camera fixed), Pan 401 (shaking the camera left and right), and Zoom 402 (changing the angle of view). And zoom in and out of the subject), tilt 403 (shaking the camera up and down), and track 404 (moving the camera left and right) ), Boom 405 (operation to move the camera up and down), and dolly 406 (operation to move the camera back and forth).
  • the fix is stationary
  • the pan and the tilt are changes in the direction of the optical axis fixed to the camera projection center
  • the zoom is the change in the angle of view
  • the track is , Boom, and dolly are operations that involve a change in the position of the camera projection center.
  • the track, boom, and dolly are operations that include the three-dimensional arrangement information of the subject in the motion of the video. Motion of video shot by truck, boom, and dolly Indicates a fast movement when the subject is relatively close to the camera, and indicates a slow movement when the subject is fast.
  • the X-t spatio-temporal projection image calculated by the above method is denoted by F (X, t).
  • X — t Spatio-temporal projection image is a function of space X and time t. Time t.
  • the spatial distribution of the X-t spatio-temporal projection image is expressed by F (X, t.)
  • F (X, t!) the spatial distribution of the X-t spatio-temporal projection image of the time t.
  • the global motion parameters calculated below are represented by ab and c, and a is a zoom parameter parameter and b is a parameter parameter.
  • the parameters, c mean the overnight parameters. In the following, we show a method for finding the camera operation parameters.
  • 501 denotes an X-t spatiotemporal projection image
  • 502 denotes a space distribution F (X, T) of time T
  • 503 denotes a time distribution.
  • the space distribution F (X, T-1) between T — 1 is shown.
  • the coordinate value of 504 is correlated as shown in the figure, and the corresponding coordinate 505 is calculated.
  • every minute range It is also possible to calculate and correlate the correlation functions.
  • the associated 504 and 505 indicate arbitrary coordinate values, and the relationship between these coordinates becomes the straight line shown in 506.
  • the squares represent the zoom-in and the slices represent the pan-blurs, respectively.
  • the camera operation parameter calculating means calculates the camera operation parameter using the space coordinate values associated with the above by the camera operation parameter calculating means. .
  • the projections are projected over the space with the following relational expression using the associated space coordinate values. Voting), extract the maximum value of the projection space 507, and calculate the parameters a and b.
  • This transformation is generally performed by a Hough transformation [PVC Hough, Methodand Means for R ecognizing Complex P atterns ", U.S. Patent No. 306954, 1956. If any of the associated coordinates are represented by x and x, the relationship between a and b is as follows.
  • the Hough transform is generally established as a method for estimating a straight line formed by a plurality of points from those points.
  • One point in the image space represents a single curve in the Hough space, and the coordinate value of the intersection point 507 of a plurality of projected curved lines should be extracted.
  • Computers that represent the slope and intercept of a straight line cast a straight line into the projection space and calculate the maximum number of votes.
  • the slope and intercept of the straight line to be extracted are calculated using the coordinate values shown.
  • Each set of associated coordinate values is voted in the projective space to calculate the parameters.
  • the image dividing section 104 the image is generated based on the camera on / off information calculated by the shooting state detecting section 103. Is divided into shots. In such a shot divided by the on / off of the camera, the images in the shot have information of the same continuous space. Conceivable .
  • Figure 6 shows the configuration of the subject / background separation unit 105.
  • the configuration of the components of the subject / background separation unit 105 from 601 to 604 and the flow of the processing by them will be described in detail below.
  • the image data camera is used. To cancel the operation. next to Changes and displacements caused by the camera operation during the night of the touching image are changed and displaced between the image data only.
  • the adjacent image data be F (x, y, t) and F (x, y, t + 1).
  • A is a matrix
  • F (x, y, t) A- 1 F (x, y, t + 1)
  • the processing performed here is a comparison processing of the images that have been canceled by the camera operation, and only the difference between the information such as brightness and color between the images is calculated. Is the absolute value of By this comparison processing, the background is subtracted, and the change in only the movement of the subject is extracted as the difference from the background.
  • the comparison image data comparing section 603 compares adjacent comparison image data.
  • the processing to be performed here is a comparison operation such as a product between images or a comparison between images and a smaller value is used as a value of a comparison image.
  • the binarization processing of the emphasized subject area is performed by the binarization processing means.
  • binarization processing is performed under the following conditions: I do . Let the comparison image be f (X, y) and the binarized image be F (X, y).
  • FIG. 7 shows an example of the binarization process.
  • 70 1 is a comparison data image
  • 70 2 is a binarized image. It is assumed that the threshold is set to 9.
  • FIG. 8 shows the labeling algorithm.
  • 1 is a variable representing the connected component number
  • T (i) is a label table, respectively.
  • a physical feature is calculated for the labeled area by a physical feature calculating means.
  • the physical characteristics calculated here are luminance, color distribution, texture, and so on.
  • the matching means compares and compares the given feature quantity with the calculated feature quantity of the label area to determine a subject area.
  • the background region is separated by subtracting the subject region extracted above from the frame image by the background extraction means.
  • the above is the configuration of the subject / background separation unit 105 and the flow of processing.
  • the image was calculated in the area extracted for each frame image by the matching means.
  • the physical features are compared between adjacent frames, and compared with the conditions given in advance for the comparison amount, and the matched regions are regions having similar physical features. In other words, the temporal relationship is performed assuming that the region is the same subject. The information associated with this is used as the motion information of the subject.
  • the photographing space recombining unit 107 the background separated by the subject / background separating unit 105 by the space superimposing means is used as the photographing state detecting unit 10.
  • the image frames are deformed and displaced to overlap as one continuous space, and the frames are combined. More than wide Recompose as a new shooting space.
  • Fig. 11 (a) which shows the appearance of recombining in Fig. 11, 1101 and 1102 are temporally continuous frame images. If the video was shot with the camera operation of, 1102 is only 103 (pan operation amount per frame) with respect to 1101 Flot and synthesize.
  • the zoom operation is performed by shifting by 1104 (the amount of tilt operation per frame) and then synthesizing.
  • the size of the image is enlarged, reduced, and combined according to the amount of zoom 1105.
  • the background image created by this compositing method is a panorama space, which is generally called, and has a unique distortion that the panorama space has. This distortion is equivalent to the distortion that occurs when the image is transformed into a cylinder.
  • the shot-to-shot relationship calculation unit 108 detects the shadow space for each shot reconstructed by the shooting space conversion means by the shooting space conversion means. After converting the shooting space so that the size and the position of the shooting space become equal, calculation of the shot relationship information is performed.
  • the information to be calculated is information on the space of the shot.
  • the layout relationship between each space recorded in the shots to be related is taken as the shot relationship information.
  • the relationship between the shots is calculated by comparing the panorama spaces synthesized by the shooting space synthesis unit 197. Eight created from images shot at the same focal length.
  • the space between the Noramas has the same cylindrical transformation distortion.
  • Figure 12 shows the state of the cylinder deformation.
  • the line 1 2 0 1 on the three-dimensional space is
  • the dot ⁇ in 1 2 is the projection center of the camera
  • the image plane 0 3 Above is the image plane.
  • the size of the cylinder is uniquely determined by the focal point at fe fe 'and the size of the distance f.
  • the panorama space created from the video shot at the same pel occupation distance has the same cylinder transformation distortion.
  • the relationship between panorama spaces created from images cast at the same focal length can be calculated by calculating the spatial translation of those images. It is possible to calculate by matching using the reciprocal function counting using the eight normal images of the above as a template.
  • the matching can be stably performed by newly defining the evaluation function from the correlation between the overlapping portions and the overlapping region.
  • the correlation between images with different focal lengths must be matched in consideration of cylindrical distortion. It is possible to calculate the relationship by changing the focal length f little by little with respect to one image as a reference. It is possible to calculate the relationship between the images captured without the operation of the force camera by matching the image by enlarging or reducing the size of the image. .
  • the calculated camera on / off information, camera operation information, subject information, subject movement information, re-combined background information, and inter-sit relation information are included in a plurality of images.
  • video has been managed in a storage device as a file or as a signal of the time change of RGB. Control at the signal level was effective for mechanical processing, transmission, storage, and display.
  • the handling of video is difficult because of the conventional processing, storage, and display of signals.
  • the use of advanced video such as retrieval, editing, and processing from video databases stored in the Internet has been increasing.
  • the structure information of the extracted video and the video data are compressed and stored. By compressing data, the storage space can be made more efficient, and data can be transmitted and received via a network.
  • Information that changes with time as a variable in the video structure information is compressed using lossless coding such as Huffman coding.
  • Information about the space that is related to the image is a irreversible code as a still image.
  • Compress A typical method of lossy encoding is JPEG encoding. From the video taken by turning the camera horizontally 360 ° in the image of 320 ⁇ 240, the image recombined using the present invention is about 5 images.
  • the resynthesizing unit 1101 responds to the request from the user input unit 112 and responds to the request from the user input unit 112 according to the condition given or given in advance. It is managed by the video structure information management and storage unit 109 in accordance with both the requirements of the user and the conditions given in advance. Re-synthesize the information. It is also possible to do semantic video filtering. It is possible to create an image of only the background or only the subject. It is also possible to create an image that expands information information from time and space video information to the space and expresses it as space-only information. As an example of this, there is an image in which a subject is expressed in a tropo-like manner in the space where the above-mentioned norarama is developed. In the prior art, in addition to being able to realize only a time-sampled tropo representation, spatial sampling is not possible. It is also possible to use a strobe expression.
  • Figure 13 shows the strobe representation of time and space sampling.
  • 1301 is the recombined panorama space
  • 1302 represents the subject.
  • 1303 is a spatially sampled stroboscopic representation
  • 1304 is a temporally sampled stroboscopic representation. is there .
  • 1304 expresses the speed of the object by the arrangement of the object, while 1303 expresses the change in the space of the object.
  • the subject (player A) shot in shot A is represented in a panorama space by a strobe
  • the subject shot in shot B is shot.
  • Player B can also be displayed as a video by moving it over the strobe representation as a video. Shot A and Shot B here They have a common space in space. The geno and ancestors of this video are intuitively and visually intuitive about good selections and differences in form with poor players. It makes it easy for the user to grasp.
  • various expressions can be made in response to a user request from the user input unit 112. From the video image displayed on the display unit of 111, the user can input a feedback of the expression to the user's request via the user input unit of 112. Is possible.
  • digital output and analog log output are possible, and digital output is provided by an external printer such as a printer or an external printer.
  • the output is to a personal computer or the like, and the analog output is the output of a video signal to a monitor or the like.
  • the output unit 113 may be provided if necessary.
  • the present invention has been specifically described based on one embodiment.
  • the present invention is not limited to the above embodiment, and the gist of the present invention is described. It goes without saying that various changes can be made without departing from the scope of the invention.
  • the video data is read, the stored image data is read out, the camera on-off information and the camera operation information are read out. Is detected, and the video is divided into shots based on the camera information, and the camera operation information and physical feature values are used.
  • the subject and background are separated, and the separated subject information is correlated between frames to extract the subject movement information, and the camera operation information and
  • the shooting space is recombined from the background of each frame, and a plurality of shots recombined from a plurality of shots are recreated.
  • the spatial relationship between shots between the shooting spaces was calculated, and the information obtained above was managed and stored, so the temporal and spatial relationship between multiple images was calculated. Enhancement, spatio-temporal and unified management, representation and operation will enable the integration of multiple spatio-temporal images.
  • one or more shooting spaces and one or more shooting spaces may be provided in accordance with predetermined conditions or user requests.
  • the subject is recomposed and displayed or output to the outside in analog or digital format, so that multiple images taken in the same space can be used. It is possible for users to acquire information on multiple videos simultaneously and intuitively and efficiently at the same time according to their interests and purposes.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Television Signal Processing For Recording (AREA)
  • Studio Circuits (AREA)
  • Closed-Circuit Television Systems (AREA)
  • Image Processing (AREA)

Description

明 細 複数映像 の 時空 間統合, 管理方法及びそ の 装置並び に そ の プ ロ グ ラ ム を ^内し た記録媒体 技術分野
本発明 は 、 複数 の映像 の統合 に よ り 新た な映像 を 作成 す る 技術 に 関す る も の で あ っ て 、 特 に複数映像 の 時空 間 統合 , 管理方法及びそ の 装置並びに そ の プ ロ グ ラ ム を 記 録 し た 記録媒体 に 関す る も の で あ る 。 背景技術
コ ン ピ ュ ー タ の 高性能化 、 ハ ー ド ディ ス ク の大容量化 ビデオカ メ ラ の 小型化, デジ タ ル化 と 、 こ れ ら の 低価格 化 に 伴 い 、 一般家庭へ のそれ ら の機器の 普及が進んで い る 。 こ の よ う な 高性能 コ ン ピ ュ ー タ 及び大容量ハ ー ド デ イ ス ク の 普及 、 さ ら に は情報 の圧縮技術 の確立 に よ り 、 映像 の デ ジ タ ル化が身近な も の と な っ て き て い る 。 映像 を デ ジ タ ル化す る こ と に よ り 、 汎用 ノヽ °— ソ ナル コ ン ビ ュ — 夕 で の 映像 の扱 い が可能 に な る と 共 に 、 高解像度 の パ 一ソ ナル コ ン ピ ュ ー タ 用 デ ィ ス プ レ イ へ の 出 力 も 可能 と な っ た 。 こ の こ と は 、 一般 に 映像 は、 T V モ ニ タ ( 6 4 0 X 4 8 0 画素) の み の 出 力 に 限 ら れて い たが、 T V モ 二 夕 の解像度以上 の解像度で の 出 力 も 可能 と し て い る 。 例 え ば、 パ ー ソ ナ ル コ ン ピ ュ ー タ 用 デ ィ ス プ レ イ 上へ は 複数 の 映像 を 同 時 に 表示す る こ と 等 が可能で あ る 。
映像機器 の こ の よ う な 発展 に 伴 い 、 映像 を ェ ン ノ、 ン ス す る 方法が幾つ か 報告 さ れて い る 。 M i c h a 1 I r a n i a m d S h m u e l P e l e g は、 文献 「 M o t i o n a n a l y s i s f o r i m a g e e n h a n c e m e n t : R e s o l u t i o n O c c l u s i o n a n d T r a n s p a r e n c y , J o u r n a l o f V i s u a l c o m m u n i c a t i o n a n d i m a g e r e p r e s e n t a t i o n , V o l . 4 , N o . 4 , D e c e m b r , p p , 3 2 4 - 3 3 5 , 1 9 9 3 」 で 、 映像 中 の 動 き 情報 を 用 い て 、 映像 を 高解像度 に す る 方法 、 被写 体な ど に よ る 背景 の い んぺ い 領域 を 補 間す る 方法等 を 提 案 し て レゝ る 。 ま た 、 ロ ー ラ エイ . テ ィ ド シ ォ は、 映像 か ら 高解像 の 静止画 を 作成す る 方法 を 報告 し て い る (特 開 平 5 — 3 0 4 6 7 5 号) 。 最近 で は、 O R A D 社が 、 映像 に新 し い 付加価値 を 付 け た 映像 の再生 を 実現 し た シ ス テ ム " D i g i t a l R e p l a y " を 発表 し て い る 。 シ ス テ ム の機能 と し て例 え ば、 被写体 の 強調表現, 追跡及 び拡大機能 , 並 び に 図 形及 びそ の 線分, 距離, 及 び速度等 の 情報 を 映像 と 共 に 表示す る 機能 を 有 し て い る ま た 、 映像 の新 し いュ一ザィ ン 夕 フ エ 一 ス に 関す る 報 告 も あ り 、 M . M i 1 1 他 は 、 文献 「 " A M a g n i f i e r T o o l f o r V i d e o D a t a P r o c e e d i n s o f C H I ' 9 2 , p . 9 3 — 9 8 ( 1 9 9 2 ) 」 で 、 映像 の フ レ ー ム を 時 間解像 度 レ ベル に 応 じ て 空 間 に配置 し 、 粗 い 時 間解像度 か ら 細 か い 時間解像度 へ と 時間 へ の新 し い 映像 の 見方 、 ァ ク セ ス ス タ イ ル を 可能 に し た 報告 を し て い る 。 ま た 、 E . E 1 1 i o t a n d A . W . D a v i s は 、 文献 「 M o t i o n I m a g e P r o c e s s i n g " , S t r i k i n g P o s s i b i l i t i e s A D V A N C E D I M A G I N G , A U G U S T ( 1 9 9 2 ) 」 て 、 映像画像 ( 2 次元) + 時間 ( 1 次元) の 3 次元物体 と し て表現 し 、 映像 の 時 間情報 の新 し い表現 方法 と 時間情報へ の 直観的 な ア ク セ ス の 実現 を 報告 し て い る 。
と こ ろ で 、 ビ デ オ カ メ ラ に よ る 入 力 が手軽 に な り 、 表 示の形態 も 自 由 に な る 環境 に お い て は、 複数 の 映像 を极 い た い と い う 要求 力 S生 じ る 。 こ こ で レ う 「複数 の 映像」 と は 、 例 え ば、 オ リ ン ピ ッ ク 等 の ス ポ ー ツ 競技場 へ複数 設置 さ れた カ メ ラ に よ る 複数 の 映像で あ る と か 、 一台 の カ メ ラ で撮影 し た 映像で も 、 異な る 選手 の 様子 を 各 々 撮 影 し た 映像 と か で あ る 。 ま た 、 こ こ で言 う 「扱 う 」 と は 複数 の 映像 を 同 時 に 鑑賞 し た り 、 比較 し た り 、 検索 , 編 集 し た り す る こ と で あ る 。
し か し な が ら 、 複数 の 映像 に 対 し て は上記従来 の 報告 等 で は 、 解決 し て い な い 課題 が存在す る 。 上記従来 の 報 告 で は 、 一つ の シ ョ ッ ト に 対 し て 、 ェ ン ノ、 ン ス す る こ と を 実現 し て い る が 、 複数 の 映像 に 対 し て複数 映像 間 の 関 係 を 用 い て 複数映像 を ェ ン ノヽ ン ス す る こ と は不可能 で あ る 。 加 え て 、 複数 映像 を 時空 間 的 に統合 し 、 統合 的 に 管 理 し う る も の で は な い 。 こ こ で言 う 「複数 の 映像 に 対 し て の ェ ン ノ、 ン ス メ ン ト 」 と は 、 も と の複数 の 映像 間 で 関 係付 け を 行 う こ と で あ り 、 映像 コ ン テ ン ツ 情報 ( 映像 内 に 実際 に 映 し 出 さ れて い る 対象 の 情報 、 すな わ ち 被写体 の 情報) を 自 動抽 出 し 、 視覚 的 に 表現す る こ と で あ る 。 ま た 、 複数 の 映像 を 関係付 け 、 映像 コ ン テ ン ツ 情報 が視 覚 的 に 表現 さ れた 一 つ 又 は複数 の 映像 を 作 り 出 す こ と で あ る 。 例 え ば、 異な る 選手 の様子 を 撮影 し た複数 の 映像 か ら 、 各選手 を 共通空 間 で オー バー ラ ッ プ さ せた 一つ の 映像 を 作 り 出 す こ と も 一つ の例 で あ る 。 ま た 、 「時空 間 的 に管理す る 」 と は、 映像 の 時空 間構造 に 基づい て抽 出 さ れた 情報 を 統一的 に 管理す る こ と で あ る 。 例 え ば、 被 写体 と 背 景 を 分離 し 、 そ れぞれ を 管理す る と 共 に 、 それ ら の 時 間 空 間 の 関 係 情報 も 管理す る こ と で あ る 。 上記従 来 の技術 の 目 的 に は 、 複数 の 映像 を 時空 間構造 を 用 い て 統一的 に 管理す る こ と は 、 含 ま れて お ら ず、 単純 に 従来 の技術 の 組み合わ せで だ けで は 、 複数映像 を 時空 間 的 に 統一的 に 管理す る こ と を 実現す る の は不可能で あ る 。
ま た 、 従来 、 実現 さ れて い る 映像 の ユ ー ザイ ン 夕 フ エ ー ス に 関 し て は 、 映像 を た だ単 に 表現 し 直 し た も の で あ り 、 映像 の 持つ 情報や 複数映像 間 の 関係 を 積極的 に 抽 出 し 、 映像 を ェ ン ノ、 ン ス し た も の で はな い 。 映像 の コ ン テ ン ト ゃ複数 の 映像 間 の 関係 に 関 し て 何 も 考慮 さ れて い な い た め に 、 映像や 映像 間 コ ン テ ン ト に対す る 直感 的な把 握や 、 映像情報 、 特 に 時 間 に 関 す る 情報 の 新た な ェ ンハ ン ス を 可能 に す る も の で は な い 。 ま た 、 複数映像 が時空 間 的 に 管理 さ れて い な い た め に 、 映像 の コ ン テ ン ツ に踏 み込 ん だイ ン タ ラ ク シ ョ ン は不 可能 で あ る 。
こ の よ う に 従来報告 さ れて い る 映像 の ェ ンノ、 ン ス メ ン ト 、 ユーザイ ン タ フ ェ ー ス 等 に 関 す る 報告 に は、 複数 の 映像 に対 し て 高 付加価値 を 与 え る ェ ン 八 ン ス メ ン ト で き る も の 、 ま た 時空 間 的 に 統 一 的 に 管理 、 表現 、 操作 を表 現 し う る も の はな い 。 すな わ ち 、 上記従来 の 技術 に は問 題 が あ る 。
本発 明 の 目 的 は、 同 じ 空 間 を 撮影 し た 複数 の 映像 に対 し て 、 ユーザが興味や 目 的 に 応 じ て 各 自 の ス タ イ ルで映 像 の情報 を 効率 よ く 取得す る た め に 、 複数映像 を 時空 間 的 に統合 し て 映像 を ェ ン ノ、 ン ス す る こ と がで き 、 複数映 像 を 時空 間 的 に統一的 に 管理 、 表現 、 操作す る こ と がで き る 複数映像 の時空 間統合 , 管理方法及びそ の装置並び に そ の プ ロ グ ラ ム を 記録 し た 記録媒体 を 提供す る こ と に あ る 。 発 明 の 開 示
上記 の 目 的 を 達成す る た め に 、 本発 明 に よ る 複数映像 の 時空 間統合 、 管理装 置 は 、 複数 の 映像 を 時空 間統合 、 管理す る 装置で あ っ て 、 映像 デー タ を 読み込 み 、 デ一 夕 列 と し て保存す る 画像 デー タ 列 メ モ リ 部 と 、 前記画像デ 一 夕 列 メ モ リ 部力ゝ ら デ一 夕 列 を 読 み 出 し 、 カ メ ラ オ ン ォ フ 情報 と カ メ ラ 操作情報 を 含む撮影 状態情報 を検 出 す る 撮影状態検 出 部 と 、 前記 カ メ ラ オ ン オ フ 情報 に基づ い て 前記デー タ 列 の 映像 を シ ョ ッ 卜 毎 に 分割す る 映像分割部 と 、 前記 カ メ ラ 操作情報 と 物理 的 な特微量 を 用 い て 前記 映像の フ レ ー ム毎 に 被写体 と 背景 を 分離す る 被写体 、 背 景分離部 と 、 前記 フ レ ー ム 毎 に 分離 さ れた 被写体情報 を フ レ ー ム 間 で対応付 け る 被 写体動 き 情報抽 出部 と 、 前記 カ メ ラ 操作情報 と 前記 フ レ ー ム 毎 に 分離 さ れた 背景か ら 前記映像が撮影 さ れた 撮影 空 間 を 再合成す る 撮影 空 間再 合成部 と 、 前記分割 さ れた 複数 の シ ョ ッ ト か ら 前記撮影 空 間再合成部で各 々 再合成 さ れた 複数 の撮影空間 の 間 の 空 間的 な シ ョ ッ ト 間 関係 を 算 出 す る シ ョ ッ ト 間 関係算 出 部 と 、 前記分離 さ れた 被写体 の情報 、 前記対応付 け ら れ た 被写体 の 情報 、 前記撮影 状態情報 、 前記背景 の 情報 、 前記 シ ョ ッ ト 間 関係 の 情報 を 管理 · 蓄積す る 映像構造情 報管理 · 蓄積部 と 、 を 具備す る こ と を特徴 と す る 。
ま た 、 上記 の複数 映像 の 時空 間統合 、 管理装置 に お い て 、 前記抽 出 さ れた 被写体情報 , 撮影状態情報 , 背景情 報 , シ ョ ッ ト 間 関 係情報及 び映像デ一 夕 の すべて 又 はそ の 一部 を 伝送 又 は受信す る 映像構造化情報伝送受信部 を 更 に 具備す る こ と を特徴 と す る 。
ま た 、 上記 の 複数映像 の 時空 間統合 、 管理装置 に お い て 、 予 め 与 え た 条件 と ユ ー ザか ら の 要求 の い ずれか 一方 又 は双方 に 従 っ て 前記映像構造情報管理 · 蓄積部 に 蓄 積 · 管理 さ れて い る 情報 を 基 に一つ 又 は複数 の 撮影 空 間 と 一つ 又 は複数 の 被写体 を 再合成す る 再合成部 と 、 前記 再合成部で再合成 さ れ た 映像 を 表示す る 表示部 と 、 前記 表示部で表示 さ れて い る 映像 に 基づ い て再合成 に 関す る 前記ユー ザ の 要求 を 入 力 す る ユー ザ入 力 部 と 、 を 具備す る と と も に 、 必要 に 応 じ て 前記表示部 に 表示 さ れた映像 を デ ジ タ ル又 は ア ナ ロ グ形式で外部装置 に 出 力 す る 出 力 部 を 具備す る 、 こ と を 特徴 と す る 。
同 じ く 、 本発 明 に よ る 複数映像 の 時空 間統合 、 管理方 法 は、 複数 の 映像 を 時空 間統合 、 管理す る 方法で あ っ て 映像デー タ を 読み込 み 、 デー タ 列 と し て保存す る 画像デ 一 夕 列保存過程 と 、 前記画像デー タ 列 メ モ リ 部か ら デ一 タ 列 を読み 出 し 、 カ メ ラ オ ン オ フ 情報 と カ メ ラ 操作情報 を含む撮影状態情報 を検 出す る 撮影状態検 出過程 と 、 前 記 カ メ ラ オ ン オ フ 情報 に 基づ い て 前記デ一 夕 列 の 映像 を シ ョ ッ ト 毎 に 分割す る 映像分割過程 と 、 前記カ メ ラ 操作 情報 と 物理的 な特徴 量 を 用 い て 前記映像 の フ レ ー ム 毎 に 被写体 と 背景 を 分離す る 被写体、 背景分離過程 と 、 前記 フ レ ー ム 毎 に 分離 さ れた 被写体情報 を フ レ ー ム 間で対応 付 け る 被写体動 き 情報 を 抽 出過程 と 、 前記 カ メ ラ 操作情 報 と 前記 フ レ ー ム 毎 に 分離 さ れた 背景か ら 前記映像が撮 影 さ れた 撮影空 間 を 再合 成す る 撮影空 間 再合成過程 と 、 前記分割 さ れた複数 の シ ョ ッ 卜 か ら 前記撮影空 間再合成 過程 で 各 々 再合成 さ れ た複数 の 撮影 空 間 の 間 の 空 間 的な シ ョ ッ ト 間 関 係 を 算 出 す る シ ョ ッ ト 間 関係算 出 過程 と 、 前記分離 さ れ た 被写体 の情報 、 前記対応付 け ら れた 被写 体 の 情報 、 前記撮影撮影情報 、 前記 背 景 の 情報 、 前記 シ ョ ッ ト 間 関係 の 情報 を 管理 · 蓄積す る 映像構造情報管 理 · 蓄積過程 と 、 を 具備す る こ と を 特徴 と す る 。
ま た 、 上記 の複数映像 の 時空 間統合 、 管理方法 に お い て 、 前記抽 出 さ れ た被写体情報 , 撮影状態情報 , 背景情 報, シ ョ ッ ト 間 関係情報及び映像デー タ の すべて 又 はそ の 一部 を 伝送又 は受信す る 映像構造化情報伝送受信過程 を 、 更 に 具備す る こ と を 特徴 と す る 。
ま た 、 上記 の 複数映像 の 時空 間統合 、 管理方 法 に お い て 、 前記 映像構造情報管理 , 蓄積過程 の 後 に 、 予 め 与え た 条件 と ユーザか ら の要求 の い ずれか 一方又 は双方 に従 つ て前記蓄積 · 管理 さ れて い る 情報 を 基 に一つ 又 は複数 の撮影空 間 と 一つ 又 は複数 の 被写体 を 再合成す る 再合成 過程 と 、 前記再合成過程 で再合成 さ れた 映像 を 表示又 は 出 力 す る 表示又 は 出 力 過程 と 、 を 具備す る こ と を特徴 と す る 。
同 じ く 、 本発 明 に よ る 複数映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読み取 り 可能な記録媒 体 は 、 複数 の 映像 を 時空 間統合 、 管理す る プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読み取 り 可能 な 記録媒体で あ っ て 映像デー タ を 読み込 み 、 デー タ 列 と し て保存す る 画像デ 一 夕 列保存過程 と 、 前記画像デー タ 列 メ モ リ 部か ら デー 夕 列 を 読 み 出 し 、 カ メ ラ オ ン オ フ 情報 と カ メ ラ 操作情報 を 含む撮影状態情報 を検 出 す る 撮影 状態検 出 過程 と 、 前 記 カ メ ラ オ ン オ フ 情報 に 基づ い て 前記 デー タ 列 の 映像 を シ ョ ッ ト 毎 に 分割す る 映像 分割過程 と 、 前記 カ メ ラ 操作 情報 と 物理 的 な特徴量 を 用 い て 前記映像 の フ レ ー ム 毎 に 被写体 と 背 景 を 分離す る 被写体 , 背景分離過程 と 、 前記 フ レ ー ム 毎 に 分離 さ れた 被写体情報 を フ レ ー ム 間 で対応 付 け る 被写体動 き 情報抽 出 過程 と 、 前記 カ メ ラ 操作情報 と 前記 フ レ ー ム 毎 に 分離 さ れ た 背景か ら 前記映像が撮影 さ れた 撮影空 間 を 再合成す る 撮影 空 間合成過程 と 、 前記 分割 さ れ た 複数 に シ ョ ッ 卜 か ら 前記撮影空 間再合 成過程 で各 々 再合成 さ れた 複数 の 撮影空 間 の 空 間 的 な シ ョ ッ ト 間 関 係 を 算 出 す る シ ョ ッ ト 間 関係算 出 過程 と 、 前記分離 さ れた 被写体 の 情報 、 前記対応付 け ら れた 被写体 の情報 前記撮影 状態情報 、 前記背 景 の情報 、 前記 シ ョ ッ ト 間 関 係 の 情報 を 管理 · 蓄積す る 映像構造情報管理 · 蓄積過程 と 、 を 具備す る こ と を特徴 と す る 。
ま た 、 上記 の 複数 映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読 み取 り 可能な 記録媒体 に お い て 、 前記抽 出 さ れた被写体情報, 撮影状態情報, 背 景情 報 , シ ョ ッ ト 間 関係情報及 び映像デ一 夕 の すべて 又 はそ の 一部 を 伝送又 は受信す る 映像構造化情報伝送受信過程 を 、 更 に 具備す る こ と を特徴 と す る 。
ま た 、 上記 の 複数映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読 み取 り 可能な 記録媒体 に お い て 、 前記映像構造情報管理 · 蓄積過程 の 後 に 、 予 め 与 え た 条 件 とュ一ザか ら の 要求 の い ずれか 一方又 は双方 に 従 つ て前記蓄積 · 管理 さ れて い る 情報 を 元 に 一つ 又 は複数 の 撮影空 間 と 一つ 又 は複数 の 被写体 を 再合成す る 再合成 過程 と 、 前記再合成過程 で再合成 さ れた 映像 を 表示又 は 出 力 す る 表示 又 は 出 力 過程 と 、 を 具備す る こ と を 特徴 と す る 。
本発 明 で は 、 映像デ一 夕 を 読み込 み 、 保存 さ れた 画像 デー タ 列 を 読 み 出 し 、 カ メ ラ オ ン オ フ 情報 と カ メ ラ 操作 情報 を含 む撮影状態情報 を 検 出 し 、 こ の カ メ ラ オ ン オ フ 情報 に 基づ い て 映像 を シ ョ ッ ト 毎 に 分割 し 、 カ メ ラ 操作 情報 と 物理 的な特徴量 を 用 い て フ レ ー ム 毎 に被写体 と 背 景 を 分離 し 、 分離 さ れた 被写体情報 を フ レ ー ム 間 で対応 付 け を 行 っ て 被写体動 き 情報 を 抽 出 し 、 カ メ ラ 操作情報 と フ レ ー ム 毎 の 背 景か ら 撮影空 間 を 再合成 し 、 複数 の シ ョ ッ 卜 か ら 各 々 再合成 さ れた 複数 の 撮影空 間 の 間 の 空 間 的な シ ョ ッ ト 間 関 係 を 算 出 し 、 以上で得 ら れた 情報 を管 理 · 蓄積す る こ と に よ り 、 複数 映像 の 時空 間的 な ェ ンハ ン ス メ ン ト 、 時空 間 的 、 統一的な 管理 , 表現 , 操作 を 可 能 と す る 複数映像 の 時空 間統合 を 実現す る 。
ま た 、 抽 出 さ れた 被写体情報等 のすべて 又 はそ の 一部 を伝送又 は受信す る こ と に よ り 、 ユーザー が 自 由 に 任意 の 場所でそれ ら の 情報 を 選択, 検索 , 取 り 出 し 、 ま た任 意 の 場所 の 任意 の ユ ーザ一 に 送 る こ と がで き る 。 ま た 、 任意 の ユーザ一 が任意 の 場所か ら 、 それ ら の 情報 を 送 り 込 む こ と がで き る 。
ま た 、 上 記管理 · 蓄積 さ れて い る 情報 を 基 に 、 予 め 与 え た 条件や ユ ーザか ら の 要求 に 従 っ て 、 一つ 又 は複数 の 撮影空 間 と 一つ 又 は複数 の 被写体 を 再合 成 し 、 表示又 は 外部へ ア ナ ロ グ、 デ ジ タ ル形式で 出 力 す る こ と に よ り 、 同 じ 空 間 を 撮影 し た 複数 の 映像 に 対 し 、 従来 は時 間 的 に 空 間 的 に 同 時 に 情報 を 取得す る こ と が困難 で あ っ た課題 に 対 し て 、 ユーザが興味, 目 的 に 応 じ て 各 自 の ス タ イ ル で複数映像 の 情報 を 同 時 に 直感的 に効率 よ く 取得で き る よ う に す る 。 図面 の簡単な 説明
図 1 は、 本発 明 の 一実施形態例 の 構成 と 処 理 の 流れ を 説 明す る 図 で あ る
図 2 は、 上記実施形態例 に お け る 撮影 状態検 出 部の構 成 と 処理 の 流れ を 説 明す る 図 で あ る 。
図 3 は 、 上記実施形態例 に お け る 撮影状態検 出 部の処 理 の 流れ 図 で あ る
図 4 は 、 上記実施形態例 に お け る カ メ ラ 操作情報 を 説 明す る 図 で あ る 。
図 5 は 、 上記実施 形態例 に お け る カ メ ラ 操作情報 の 抽 出 ア ル ゴ リ ズム を 説 明 す る 図 で あ る 。
図 6 は 、 上記実施形態例 に お け る 被写体, 背景分離部 の構成 と 処理 の 流れ を 説 明 す る 図 で あ る 。
図 7 は 、 上記実施形態例 に お け る 2 値化処 理 の 例 を 示 す 図で あ る 。
図 8 は 、 上記実施形態例 に お け る ラ ベ リ ン グ の 処理 の 流れ 図 で あ る 。
図 9 は 、 上記実施形態例 に お け る 画像走査順 を 示す 図 で あ る 。
図 1 0 は 、 上記実施形態例 に お け る 対象画素及 び走査 済み画素 を 示す 図 で あ る 。
図 1 1 は 、 上記実施形態例 に お け る カ メ ラ 走査 に 基づ く 撮影空 間 の 再合成方法 を 説 明 す る 図 で あ る 。
図 1 2 は、 円 柱変換 を 説 明す る 図 で あ る 。
図 1 3 は 、 上記実施形態例 に よ る 時間 , 空 間サ ン プ リ ン グ に よ る ス ト ロ ボ 表現 を 説明す る 図で あ る 。 発 明 を 実施す る た め の 最 良 の 形態
以下 、 本発 明 の 実施形態例 を 、 図 面 を 参照 し て 詳細 に 説明す る 。
図 1 に 、 本発 明 の 一実施形態例 の 装置構成 図 を 示す。 以下 、 構成 図 に 沿 っ て 各構成部及 び手法 を 説 明す る 。
図 1 の ビデオ信号入 力 部 1 0 1 か ら 入 力 さ れた ビ デオ 信号 は、 1 0 2 の 画像デー タ 列 メ モ リ 部 に 一時的 に 蓄積 さ れ る 。 次 に 、 蓄積 さ れた ビ デオ信号 を 1 0 3 の 撮影状 態検 出部 に お い て 映像処理 し 、 カ メ ラ の オ ン オ フ 情報 と カ メ ラ 操作情報 を 抽 出 す る 。
撮影状態検 出 部 1 0 3 の 構成 を 図 2 に 示す。 ま た 、 図 3 に 撮影 状態検 出 部 1 0 3 の 2 0 1 カゝ ら 2 0 4 ま で の構 成要素 に よ る 処理 の 流れ を 示す。 こ れ ら の 図 面 を 用 い て 以下 、 各構成素 毎 の 構成 と 処理 の 流れ を 詳細 に 説 明 す る 1 0 2 の 画像デ一 夕 列 メ モ リ 部か ら 読み 出 さ れた ビデ ォ信号 の 数 フ レ ー ム は 、 図 3 に 示す 3 0 1 で あ り 、 こ の 3 0 1 を 通常 、 時空 間画像 と 呼 ん で い る 。 こ の時空 間画 像 に 対 し 、 2 0 1 の 直線成 分算 出 部 に お い て 、 各 フ レ ー ム 画像毎 に 水平 、 垂直 直線 成分 を 各 々 算 出 す る 。 垂直方 向 直線算 出 は 、 図 3 で は 3 0 2 で あ り 、 水平方向 直線算 出 は 、 図 3 で は 3 0 3 で あ る 。 こ れ ら の 各算 出 で得 ら れ た 3 0 4 を 垂直方 向 直線成分時空 間 画像 、 3 0 5 を 水平 方 向 直線成分時空 間 画像 と 呼ぶ。
続 い て 、 2 0 2 の 画像デー タ 並 べ替 え 部 は、 画像デ一 夕 列再配置手段 に よ り 、 次 の フ ィ ル タ ー処理 に備 え て垂 直 , 水平方向 直線成分時空 間 画像 3 0 4 , 3 0 5 の並び 替 え を行 う 。 こ こ で の並び替 え 処理 は 、 図 3 で は 3 0 6 に 相 当 し 、 画面 の 法線 を 含 む平面 で時空 間画像 を 切 断す る 処理で あ る 。 フ レ ー ム 画像 の x , y 座標軸 と 垂直 を な す方 向 を 画面 の 法線方 向 と し て い る 。 切 断 さ れた 時 間軸 を含む平面 を 一般 に 時空 間 断面画像 と 呼 ん で い る 。 こ の 時空間 断面画像の 一例 と し て 、 コ ン ピ ュ ー タ ビ ジ ョ ン の 分野で用 い ら れて い る 、 カ メ ラ の 進行方 向 と 画面 の 法線 を含む平面で 、 時空 間 画像 を 切 断 し た 時 の 切断面 ( ェ ピ ポ ー ラ 平面画像 ( E p i p o l a r P l a n e I m a g e ) ) が あ る 。 こ の 時 空 間 断面 画像か ら 被写体 の三 次元位置 を 推定 し て い る 。 こ れ は 、 こ の ェ ピ ポ ー ラ 平面 画像上で 、 物体 の 特徴点 の 軌跡が直線 に な り 、 こ の 直線 の 傾 き が物体特徴点 の 動 き の 大 き さ に な る こ と に よ っ て レ ^ る 〔 R . C . B o l l e s , H . B a k e r , a n d D . H . M a r i m o n t , " E p i p o l a r — p i a n e i m a g e a n a l y s i s : A n a p p r o a c h t o d e t e r m i n g s t r u c t u r e f r o m m o t i o n " , I J C V , 1 , 1 p p 7 - 5 5 , j u n e 1 9 8 9 . 〕 。 時空 間画像 を x , y 座標軸 を含む よ う に 切 断 し た 時空 間 切 断画像 を特 に X — t 時空 間画像 と 呼び、 同様 に y , t 座標軸 を含む 時空 間 切 断画像 を y — t 時空 間画像 と 呼ぶ。 任意 の y の 値か ら 任意 の X — t 時空 間 画像が切 り 出 さ れ、 こ れ ら 複 数枚 の X — t 時空 間画像 を X — t 時空 間画像列 と 呼ぶ。 y - t 時空 間 画像列 も 同 様で あ る 。
続 い て 、 画像デー タ 並べ替 え 部 2 0 2 に お い て 切 断 さ れた垂直 , 水平方 向 直線成分時空 間画像 の 切 断面 を 、 2 0 3 の 映像情報 フ ィ ル 夕 一 処理部 に お い て フ ィ ル タ ー
(第一次微分 、 第二次微分等) 処理 を 施す。 こ の 処理 は 線分検 出 手段 に よ り 為 さ れ 、 エ ッ ジ ま た は線 を検 出す る こ と を 目 的 と し て レ る 。 図 3 で は 、 3 0 7 に相 当 す る 。 フ ィ ル タ ー処理部 2 0 3 に よ り エ ッ ジ ま た は線 の 強度が 算 出 さ れ る 。 切 断画像 に お い て 切 断面 に 見 ら れ る 時 間軸 に 沿 っ た 流れ模様 は 、 映像 中 の 動 き に よ っ て 生 じ て い る こ の 流れ の 方向 が動 き の 大 き さ に 対応 し て い る 。 上記 ま で述べ た エ ッ ジ検 出 は 、 流れ の 方 向 を 表す エ ッ ジ ま た は 直線 を検 出 し て お り 、 画像 か ら 動 き 情報 の み を 強調 し て い る こ と に な る 。 上記 の エ ッ ジ検 出 さ れた 切断画像列 を 垂 直 、 水平方 向時空 間 エ ッ ジ画像列 と 呼ぶ。
続 い て 、 2 0 4 の 特徴抽 出 部 に お い て 、 積分手段 に よ り 、 垂直 、 水平方 向 時空 間 エ ッ ジ画像列 を エ ツ ジ画像 の 法線方 向 に 加算処 理す る 。 図 3 で は 、 3 0 8 に 相 当 し 、 3 0 8 a の 破線方向 に 加算処理 を 行 う 。 こ の 加算処理 は 先 の フ ィ ル タ ー処理 に お い て 強調 さ れた 動 き を 、 よ り 強 調す る こ と を 目 的 に 行 う 。 即 ち 、 も し 物体 の特徴点 の動 き が、 グ ロ ー バルな 動 き に よ る 物 の 場合 、 加算処理 を す る こ と に よ り 強調 し あ い 、 顕著 に 加算処理結果 に 反 映 さ れ る 。 半 面 、 物体 の 特徴点 の 動 き が、 ロ ー カ ルな 動 き に よ る も の の 場合 、 加算処理 を す る こ と に よ り 弱小 し 、 加 算処理結果 に 反 映 さ れ に く く な る 。 ま た 、 こ の加算処理 は、 差分処理 と 違 い ノ イ ズ に 強 い 処理 で あ り 、 ノ イ ズ を 多 く 含む映像か ら で も 動 き 情報 の抽 出 が可能 と な る こ と を 意味 し て い る 。 こ の加算処理 に よ っ て得 ら れ る 結果 の 画像 を 時空 間投影画像 と 呼ぶ。 X — t 垂直方 向時空 間画 像列か ら は 、 X — t 時空 間投影画像 3 0 9 が得 ら れ、 y 一 t 水平方向時空 間画像か ら y — t 時空 間投影画像 3 1
0 が得 ら れ る 。 X — t 時空 間投影画像 の 時間軸 に 沿 つ た 流れ模様 の 意味す る と こ ろ は 、 映像 の 左右方向 の 動 き を 表現 し 、 y — t 時空 間画像 の模様 は上下方 向 の 動 き を 表 現 し て い る 。
続 い て 、 2 0 5 の 特徴統 計解析部 に お い て 、 ま ずカ メ ラ オ ン オ フ 検 出 手段 に よ り 、 時 間軸 と 空 間軸 と を 有す る 二次元画像 と し て表現 さ れた 抽 出特徴 か ら 時 間軸 に 垂直 な 直線 を検 出 し て 、 カ メ ラ の オ ン オ フ 情報 の 抽 出 を 行 う 具体的 に は 、 X — t 時空 間 投影画 像 を F ( X , t ) 、 y 一 t 時空 間投影画像 を F ( y , t ) で表す 。 次式で表 し た 評価式か ら 算 出 さ れ る 値 C が 、 予 め 与 え た 閾値以上で あ れ ば、 そ の 時間 t で カ メ ラ の オ ン オ フ が存在 し た と す る 。
C ( t ) - s u m ( F ( x , t ) ) d x
+ s u m ( F ( y , t ) ) d y
… ( 1 ) 次 に 、 カ メ ラ 操作情報 の 抽 出 を 行 う 。 抽 出 す る カ メ ラ 操作情報 を 図 4 に示す 。 カ メ ラ 操作 は 、 基本 7 操作 と そ れ ら の組み合 わせ操作で構成 さ れて い る 。 基本操作 に は フ ィ ッ ク ス ( カ メ ラ 固 定) , パ ン 4 0 1 ( カ メ ラ を 左右 に振 る 操作) 、 ズー ム 4 0 2 (画角 を 変ィヒ さ せ る こ と に よ り 被写体 を拡大 , 縮小す る 操作) 、 チル ト 4 0 3 ( 力 メ ラ を 上下 に 振 る 操作) 、 ト ラ ッ ク 4 0 4 ( カ メ ラ を 左 右 に 移動す る 操作) 、 ブー ム 4 0 5 ( カ メ ラ を 上下 に移 動す る 操作) 、 ド リ ー 4 0 6 ( カ メ ラ を 前後 に移動す る 操作) が あ る 。 すな わ ち 、 フ ィ ッ ク ス は静止 、 パ ン , テ ィ ル ト は 、 カ メ ラ 投影 中 心固 定 の 光軸方 向 の 変化 、 ズー ム は画角 の変化 、 ト ラ ッ ク , ブー ム , ド リ ー はカ メ ラ 投 影 中 心の位置変化 を 伴 う 操作で あ る 。 カ メ ラ 投影 中 心の 位置変化 に 伴 い 、 ト ラ ッ ク , ブー ム , ド リ 一 は被写体の 三次元配置情報 を 映像 の 動 き の 中 に 含む操作で あ る 。 ト ラ ッ ク , ブー ム , ド リ ー に よ っ て 撮影 さ れ た 映像 の 動 き は 、 被写体 がカ メ ラ に対 し て 相対的 に 近 い 場合 、 速 い 動 き を 示 し 、 逆 に 速 い 場合 、 遅 い 動 き を 示す。
上記 の 方 法で算 出 さ れた X — t 時空 間 投影画像 を F ( X , t ) で表す。 X — t 時空 間投影 画像 は、 空 間 X と 時 間 t の 関数 で あ る 。 時 間 t 。 の X — t 時空 間投影画像 の 空 間 分布 を F ( X , t 。 ) で表 し 、 同 様 に 時 間 t ェ の X — t 時空 間 投影画像 の 空 間 分布 F ( X , t ! ) で表す。 ま た 、 以下 で算 出 す る グ ロ 一 バル な 動 き パ ラ メ 一 夕 を a b , c で表 し 、 それぞれ a はカ メ ラ 操作 を 言 う ズー ム パ ラ メ 一 夕 、 b はパ ンパ ラ メ ー タ 、 c はテ ィ ル 卜 パ ラ メ 一 夕 を 意 味す る 。 以下 、 こ の カ メ ラ 操作パ ラ メ 一 夕 を 求 め る 手法 を 示す。
も し 作成 さ れた X — t 時空 間投影画像 に グ ロ ー バルな 動 き が存在 し て い た と すれ ば、 F ( X , t 。 ) と F ( X , t ! ) の 間 に 以下 の 関係 が あ る 。
F ( % , t ! ) = F ( a + b : t 0 )
同様 に y — t 時空 間 投影画像 に は 、
F ( y % , t ! ) = F ( a y + b ; t 0 )
の 関 係 が あ る 。 ま ず、 上記 の X と X y と y の対応 付 け を 対応付 け手段 に よ り 行 う 。 こ の様子 を 図 5 に 示す 図 5 中 の 5 0 1 は X — t 時空 間投影画像 を 表 し 、 5 0 2 は時 間 T の 空 間 分布 F ( X , T ) 、 5 0 3 は時 間 T — 1 の 空 間分布 F ( X , T - 1 ) を それぞれ表す。 5 0 4 の 座標値 を 図 に 示す よ う に 対応付 け を 行 い 、 対応座標 5 0 5 を 算 出 す る 。 こ の 算 出 方法 の 他 に 、 微少な 範 囲 ご と の相 関 関 数 を 算 出 し 対応付 け る こ と も 可能 で あ る 。 こ の 対応付 け ら れた 5 0 4 と 5 0 5 は 、 任意 の 座標値 を 示 し てお り 、 こ れ ら 座標 間 の 関係 は 5 0 6 に 示す直線 に な る こ の 直線 の 傾 き がズー ム ノ\° ラ メ 一 夕 a を 表 し て お り 、 切 片がパ ン パ ラ メ 一 夕 b を そ れぞれ表 し て い る 。
続 い て 、 カ メ ラ 操作パ ラ メ 一 夕 算 出 手段 に よ り 、 上記 で対応付 け ら れた 空 間座標値 を 用 い て カ メ ラ 操作パ ラ メ 一 夕 を 算 出 す る 。 具体的 に は 、 直線 5 0 6 の a と b を 算 出す る た め に 、 対応付 け ら れた 空 間 座標値 を 用 い て 以下 の 関係式 でパ ラ メ 一 夕 空 間 に 射影 (投票) し て射影空 間 の最大値 5 0 7 を 抽 出 し 、 パ ラ メ 一 夕 a , b を 算 出 す る こ と を 行 う 。 こ の 変換 は 、 一般 に H o u g h 変換 〔 P . V . C . H o u g h , M e t h o d a n d M e a n s f o r R e c o g n i z i n g C o m p l e x P a t t e r n s " , U . S . P a t e n t N o 3 0 6 9 5 4 , 1 9 6 2 ) と 呼 ばれて い る も の で あ る 。 対応付 け ら れた任意 の座標 を x と x で表す と 、 a と b の 関係 は下記式の よ う に な る 。
b = X % · c o s ( a ) + x · s i n ( a )
H o u g h 変換 は 、 一般 に 複数個 の 点か ら そ れ ら の点 が構成す る 直線 を 推定す る 方法 と し て確立 さ れて い る 。 画像空 間 の 一つ の 点 が (射影空 間 ) H o u g h 空 間 で は 一本 の 曲線 を 表 し 、 射影 さ れた 複数個 の 曲 線 の 交点 5 0 7 の 座標値 が抽 出 すべ き 直線 の 傾 き と 切 片 を 表 し て い る 計算機で は 、 直線 を 射影 空 間 に 投票 し 、 最大 の 投票数 を 示す座標値 を も っ て 抽 出 すべ き 直線 の 傾 き と 切片 を 算 出 し て い る 。 対応付 け ら れ た 複数組み の 座標値 の 各 々 を 射 影空間 に 投票 し て パ ラ メ 一 夕 を 算 出 し て い る 。
同様 に y — t 時空 間投影画像カゝ ら テ ィ ル ト ノ° ラ メ 一 夕 C が算 出 で き る 。 ま た 、 三 次元情報 を含む よ う な 操作が 行わ れた 場合 の 時空 間投影 ( 積分) 画像で あ っ て も 、 ミ ク ロ 的 (部分的) に は三次元操作 を 含 ま な い 操作が行わ れた 場合 の 画像 に 等 し い こ と 力ゝ ら 、 かか る 画像で あ っ て も 上記処理 を 部分的 ( ブ ロ ッ ク 的) に施す こ と に よ り 処 理が可能 で あ る 。 以上 が撮影状態検 出部 1 0 3 の構成 と 処理 の 流れで あ る 。
次 に 、 図 1 に 戻 り 、 1 0 4 の 映像分割部 に お い て 、 撮 影状態検 出部 1 0 3 で算 出 し た カ メ ラ の オ ン オ フ 情報 に 基づ い て 映像 を シ ョ ッ ト 毎 に 分割す る 。 こ の よ う に カ メ ラ の オ ン オ フ で分割 さ れた シ ョ ッ ト で は 、 シ ョ ッ ト 内 の 画像 は、 連続的な 同 じ 空 間 の 情報 を も っ て い る と 考 え ら れ る 。
次 に 、 1 0 5 の 被写体 , 背景分離部 に お い て 、 被写体 と 背景 の 分離 を 行 う 。 被写体, 背 景分離部 1 0 5 の構成 を 図 6 に 示す。 以下 、 被写体, 背景分離部 1 0 5 の 6 0 1 か ら 6 0 4 ま で の 構成要 素 の構成 と それ ら に よ る 処理 の 流れ を 詳細 に 説 明 す る 。
ま ず、 6 0 1 の カ メ ラ 操作相殺部 に お い て 、 映像 フ レ ー ム 変形手 段 に よ り 、 カ メ ラ 操作情報 に基づ い て 、 画像 デ一 タ カゝ ら カ メ ラ 操作 を キ ャ ン セ ルす る こ と を 行 う 。 隣 接す る 画像 デ一 夕 間 でカ メ ラ 操作 に よ り 生 じ た 変化 · 変 位分 だ け画像 デー タ 間 で変化 · 変位 さ せ る 。 隣接す る 画 像デ一 夕 を F ( x , y , t ) 、 F ( x , y , t + 1 ) と す る 。 カ メ ラ 操作 A は ( A はマ ト リ ク ス ) を 用 い る と 、 隣接す る 画像デー タ 間 で は、 次 の 関係 が あ る 。
F ( X , y , t + 1 ) = A F ( x , y , t ) カ メ ラ 操作 の キ ャ ン セ ル は、 次 の 式で表せ る 。
F ( x , y , t ) = A - 1 F ( x , y , t + 1 ) 続 い て 、 6 0 2 の 画像 デー タ 比較部で は、 差分処理手 段 に よ り 、 上記で カ メ ラ 操作がキ ャ ン セ ル さ れた 隣接す る 画像 間 で 比較処理 を 行 う 。 こ こ で行 う 処理 は、 カ メ ラ 操作 を キ ャ ン セ ル し た 画像 ど う し の 比較処理で あ り 、 算 出 さ れ る も の は画像 間 の輝度 、 色等 の情報 の 差分 の 絶対 値等で あ る 。 こ の 比 較処理 に よ り 、 背景 は差 し 引 か れ 、 被写体 の 動 き の み の 変化 分が背景 と の 差分 と し て 抽 出 さ れ る 。
続 い て 、 6 0 3 の 比較画像デー タ 比較部で は 、 隣接す る 比較画像デー タ 間 の 比較 を 行 う 。 こ こ で行 う 処理 は、 画像 間 で の 積や 、 画像 間 で 比較 し 小 さ い 方 の 値 を 比較画 像 の値 と す る 等 の 比較演算 で あ る 。 こ れ ら 一連 の 処理 に よ り 、 3 枚 の 連続す る 画像デ一 夕 に 基づ い てそ の 真 ん 中 の 画像 の 被写体 ( 移 動物体) の 領域が強調 さ れ る 。
続 い て 、 6 0 4 の 領域抽 出 部で は、 先ず 、 強調 さ れた 被写体領域 の 2 値化処理 を 2 値化処理手段 に よ り 行 う 。 予 め 与 え ら れた 閾値 S を 用 い て 、 次 の 条件で 2 値化処理 を行 う 。 比較デ一 夕 画像 を f ( X , y ) と し 、 2 値化画 像 を F ( X , y ) と す る 。
F ( X , y ) = 1 : i f f ( x , y ) ≥ S F ( x , y ) = 0 : i f f ( x , y ) < S 図 7 に 2 値化処理 の 例 を 示す。 7 0 1 が比較デー タ 画 像で あ り 、 7 0 2 が 2 値化画像で あ る 。 閾値 を 9 と し た 場合 を 想定 し て い る 。
続 い て 、 ラ ベル付 け手段 に よ り 、 2 値化画像 F ( , y ) の ラ ベ ル付 け を 行 う 。 ラ ベ ル 付 け の ア ル ゴ リ ズム を 図 8 に 示す。 2 値化画像 F ( X , y ) を F = ( F j , j } 、 ラ ベル画像 を L = { 1 j } で表す。 1 」 は各 連結成分 の ラ ベル を 表す正整数で あ る 。 ま た 、 1 は連結 成分番号 を 表す変数 、 T ( i ) は ラ ベル表 を それぞれ表 す。 8 0 1 の初期 設定 に お い て 1 = 1 と し 、 画素 ( 2 , 2 ) か ら ラ ベル走査 を 開始す る 。 現在 の 画素 を ( i , j ) と し 、 8 0 2 に お レ て 半 IJ 断す る 。 f i , j = 1 な ら ば 8 0 3 へ 、 f i , j = 0 な ら 1 に ; = 0 と し て 8 0 7 へ処理 を 進 め る 。 図 9 に 示 し た 走査方法で 、 現在 の 画素 X 。 = ( i , j ) と 、 そ の 近傍で操作済み の 画 素 を 図 1 0 に 示す よ う に表 し 、 x p の ラ ベ リレ (画像 L の値) を 1 p ( p = l , 2 , 3 , 4 ) と す る 。 8 0 3 で は、 { T ( 1 p ) , 1 p が 0 でな レ 、 = 1 , 2 , 3 , 4 } 中 に 異な る 正 の 値 が n 種類 あ る と し , それ ら を 小 さ い 値 力 ら 順 に L i , L 2 , … , L n と す る 。 n = 0 な ら ば 8 0 4 へ 、 n = 1 な ら ば 8 0 5 へ 、 n = 2 な ら ば 8 0 6 へ処理 を 進 め 、 各処理後 、 8 0 7 へ進 む 、 8 0 7 で は全画 素 に つ い て終 了 し た か ど う か を 判 断 し 、 全画 素終 了 で あ れ ば 8 0 8 , 8 0 9 の 処 理 を し て ラ ベ リ ン グ を 完 了 す る 。
次 い で 、 物理 的特徴算 出 手段 に よ り 、 ラ ベ リ ン グ さ れ た 領域 に対 し て 物 理 的 な特徴量 を 算 出 す る 。 こ こ で算 出 す る 物理的 な特徴 は 、 輝度 , 色分布 , テ ク ス チ ャ 等 で あ る 。 次 い で 、 照合手 段 に よ り 、 予 め 与 え た特徴量 と 算 出 し た ラ ベル領域 の 特徴量 と を 比較照合 し 、 被写体領域 を 決定す る 。 次 い で 、 背 景抽 出 手段 に よ り 、 上記で抽 出 し た被写体領域 を フ レ ー ム 画像か ら 差 し 引 く こ と で 、 背景 領域 を 分離す る 。
以上が被写体, 背 景分離部 1 0 5 の構成 と 処理 の 流れ で あ る 。
次 に 、 図 1 に 戻 り 、 1 0 6 の 被写体動 き 情報抽 出 部 に お い て 、 照合手段 に よ り 、 各 フ レ — ム 画像毎 に 抽 出 さ れ た 領域で算 出 し た 物理 的 な 特徴量 を 隣接す る フ レ一 ム 間 で 比較 し 、 比較量 に 対 し て 予 め 与 え た 条件 と 照合 し 、 照 合 し た領域 は類似す る 物理 的特徴 を 持つ 領域 、 すな わ ち 同 一被写体 に よ る 頜域で あ る と し て 時間 的な 関係付 け を 行 う 。 こ の 関係付 け の 情報 を 被写体 の 動 き 情報 と す る 。
一方 、 1 0 7 の 撮影空 間 再合成部 に お い て 、 空 間 重ね 合わ せ手段 に よ り 、 被写体 , 背景分離部 1 0 5 で 分離 さ れた 背景 を 、 撮影状態検 出 部 1 0 3 で算 出 し た 力 メ ラ 操 作情報 に 基づ い て 画像 フ レ ー ム を 変形 · 変位 さ せて 一つ の 連続す る 空 間 と し て重ね合 わ せ 、 フ レ — ム を超 え る 広 い 撮影空 間 と し て 再合成 し な お す。 図 1 1 に 再合 成の様 子 を 示す 図 1 1 ( a ) に お い て 、 1 1 0 1 と 1 1 0 2 は時間 的 連糸 す る フ レ ー ム 画像で あ り 、 パ ン の カ メ ラ 操作で撮影 さ れた 映像 で あ る 場合 、 1 1 0 2 は 1 1 0 1 に対 し て 1 0 3 ( フ レ ー ム あ た り のパ ン 操作量) 分 だ け シ フ 卜 し て合成す る 。 同 様 に テ ィ ル 卜 の 場合 1 1 0 4 ( フ レ ー ム あ た り の テ ィ ル ト 操作量) 分だ け シ フ 卜 し て 合成す る ズー ム 作 の 場合 、 図 1 1 ( b ) に 示すよ う に 、 ズ一 ム 量 1 1 0 5 に 応 じ て画像 のサ イ ズ を拡大 , 縮 小 し 合成す る 。 こ の 合成 の 方法で作 ら れた 背景画像 は、 一般 に言 う パ ノ ラ マ 空 間 で あ り 、 パ ノ ラ マ 空 間 が持つ 特 有 の 歪み を 持つ 。 こ の 歪 み は、 画像 を 円 柱変換 し た 場合 に 生 じ る 歪 み と 等価で あ る 。
次 に 、 1 0 8 の シ ョ ッ 卜 間 関係算 出部で 、 撮影 空 間変 換手段 に よ り 、 再合成 さ れた 各 シ ョ ッ 卜 毎 の 撮影 空 間 に 対 し て 、 影 空 間 の 間 でそ れ ら の 大 さ さ と 位置が等 し く な る よ う に 撮影 空 間 を 変換 し た後 、 シ ョ ッ 卜 間 関 係情報 の算 出 を 行 う 。 こ こ で 、 算 出 す る 情報 は 、 シ ョ ッ 卜 の 空 間 に 関す る 情報 で あ る 。 関係付 け を 行 う シ ョ ッ 卜 に 記録 さ れて い る それぞれ の 空 間 の 配置関係 を シ ョ ッ 卜 間 関係 情報 と す る 。 こ の シ ョ ッ 卜 間 の 関係 は、 撮影空 間合成部 1 9 7 で 合成 し た パ ノ ラ マ 空 間 を 比較す る こ と で算 出 す る 。 同 じ 焦 点距離で撮影 さ れた 映像 ら 作成 し た 八。 ノ ラ マ 空 間 間 で は 、 同 じ 円 柱変換 の 歪 み を 有す る 。 図 1 2 に 円 柱変 の 様子 を 示す。 三次元空 間 上 の線 1 2 0 1 は
π S π
円 柱変換 に よ り 円 柱 1 2 0 3 上 の 1 2 0 2 へ変換 さ れ る
1 2 中 の 点 〇 は 、 カ メ ラ の 投影 中 心で あ り 、 円 柱 1 2
0 3 上 は 、 画像面で あ る 。 円 柱 の 大 き さ は fe ΐέ'時 の 焦 点、距離 f の 大 き さ で 一意で 決 ま る 。 こ の こ と に よ り 同 じ 隹 占 距離で撮影 さ れた 映像か ら 作成 し た パ ノ ラ マ 空 間 で は 、 同 じ 円 柱変換 の 歪 み を 有 す る 。 同 じ 焦点距離で 影 さ れ た 映像か ら 作成 し た パ ノ ラ マ 空 間 間 の 関係 は、 それ ら の 画像 の 空 間 的 な 平行移 を 算 出 す る こ と で可 で あ る つ の 八 ノ ラ マ 画像 を テ ン プ レ 卜 と し て相 互関数計数 を 用 い て マ ッ チ ン グ に よ り 算 出 可能 で あ る 。
の算 出 の 際 、 重な り 部分 の相 関 関係 と 重 な り 領域か ら 評価関数 を新た に 定義す る こ と で安定 に マ ッ チ ン グが可 で あ る 。 焦点距離が異な る 画像間 の 関 係付 け に は 円 柱歪み を 考慮 し て マ ツ チ ン グ し な け ればな な い 。 一つ の 画像 を 基準 と し て 焦 点距離 f を 少 し づつ 変化 さ せて マ ツ チ ン グす る こ と で 関係 を 算 出 す る こ と 力 可能で あ る 。 力 メ ラ 操作が行われず に 撮影 さ れた 映像 間 で は、 画像 の 大 さ を 拡大 · 縮小 さ せて マ ッ チ ン グす る こ と で 関係 を算 出す る こ と が可能で あ る 。
算 出 さ れた カ メ ラ オ ン オ フ 情報 , カ メ ラ 操作情報, 被 体情報 , 被写体動 き 情報 , 再合成 し た 背 景情報 , 及び シ 3 ッ 卜 間 関係情報 は 、 複数 の 映像 に 関 し 、 映像構造情 報管理 部 1 0 9 に 時空 間 的 に 管理 · 蓄積 さ れ る 。 従来 に お い て は、 映像 は 、 フ ァ ィ ル と し て 又 は R G B の 時 間変化 の 信号 と し て 蓄積装置 の 中 で管理 さ れて き た 。 信号 レ ベ ルで の管理 は 、 機械的 な 処 理や伝送, 蓄積 , 表 示 に お い て 有効で あ っ た 。 映像 が 計算機で扱 え る マ ルチ メ デ ィ ア 時代 に お い て は 、 映像 に 対す る 扱 い は、 従来 の た だ単 に 信号 の処理 , 蓄積 , 表示す る こ と 等か ら 、 大量 に 蓄積 さ れ た 映像 デー タ ベ ー ス か ら の検索, 編集 , 加工 等 の 高度な 映像 の 扱 い に な っ て き て い る 。 こ の よ う な 映 像 の 高 度な扱 い を 可能 に す る た め に は、 映像 を 信号 レ べ ルか ら よ り 映像 の 中 身 に 突 っ 込 ん だ レ ベルで の 情報 で管 理 し な けれ ばな ら な い 。 上述 の 抽 出 し た 情報 は こ の レ べ ル の情報で あ り 、 こ の情報で 映像 を 表現 し 管理す る こ と で 、 R G B の 時間変化信号 の みで表現 さ れた 映像 と は全 く 異な る よ り 高度 な扱 い が可能 と な る 。 映像 の 中 身 を 反 映 し た こ の 表現 は、 単な る 信号 の 時 間変化 と は異な り 映 像 の 時間 , 空 間 に 関す る 意味的な表現で あ る と も 考 え ら れ る 。 こ の 映像 の 新た な表現 を 時空 間的 に 蓄積 , 管理す る こ と で 人 間 に と っ て直観 的で分 か り やす い 高度 な 映像 の扱 い が実現可能 と な る 。
抽 出 さ れた 映像 の 構造情報 , 映像デー タ に対 し て デー 夕 圧縮 し て蓄積す る 。 デー タ 圧縮す る こ と で蓄積 ス ぺー ス の効率化や 、 デー タ の ネ ッ ト ワ ー ク を 介 し た送受信 を 実現す る 。 映像構造情報 の 中 で時 間 を 変数 と し て 変化す る 情報 に 対 し て は 、 ハ フ マ ン 符号化等 の 可逆符号化 を 用 い て圧縮す る 。 空 間 に 関す る 情報 で あ っ て画像 に 関す る も の (例 え ば、 抽 出 さ れた 被写体 の 画像や再合成 さ れた 背 景画像等) は 、 静止画像 と し て 非 可逆符号化 を 用 い て 圧縮す る 。 非可逆符号化 の 代表的 な 手法 は 、 J P E G 符 号化で あ る 。 3 2 0 X 2 4 0 の 画像で カ メ ラ を 3 6 0 度 水平 に 回 し て撮影 さ れた 映像か ら 、 本発 明 を 用 い て 再合 成 さ れた 画像 は 、 約 5 メ ガノ ' イ ト の情報 を 有 し 、 J P E G 符号化 を 用 い る と 1 0 分 の 1 の 圧縮効率が見込 ま れて 約 5 0 0 キ ロ バイ 卜 の デー タ に 圧縮可能で あ る 。 現在の イ ン タ ー ネ ッ ト 等 を 用 い る 場合 、 約 5 メ ガ ノ ィ 卜 の 情報 で は 、 そ の デー タ 伝送 は時間 的な 制限 か ら 不可能で あ る が、 約 5 0 0 キ ロ ノ ' ィ 卜 の デー タ の伝送 は実用 的 に 可能 で あ る 。 ま た 、 時 間 的 に 変化す る 被写体 の 画像等 は 、 同 様 に 非可逆符号化で あ る H 2 6 1 や M P E G 等 の 符号化 を 用 い る こ と で約 1 0 分 の 1 カゝ ら 2 0 分 の 1 程度 ま で圧 縮可能で あ る 。 イ ン タ ー ネ ッ ト 等 の細 い線 (情報伝送 レ ー ト の低 い 線) で構造化 さ れた 映像 を 送 る 場合 、 静止画 像 と し て J P E G 圧縮 さ れた 背景画像 と 、 同 じ く 時 間情 報 を 空 間 に 展 開 し た 静止画像 (例 え ば、 背 景 に 被写体 を 展 開 し た ス 卜 ロ ボ 画像等) と し て J P E G 圧縮 さ れた 被 写体情報等 の 、 ユー ザー の 要求 に 答 え る だ け の 最低限 の 情報 を 送 る こ と で 、 ネ ッ ト ワ ー ク 使用 , 時 間 の 効率化 と イ ン タ ラ ク シ ョ ン レ ス ポ ン ス の 良 さ を 実現 可能 と し て い る 。
次 に 、 1 1 0 1 の 再合成部で は 、 1 1 2 の ユーザ入 力 部か ら の 要求 に 応 じ て 、 も し く は予 め 与 え た 条件 に 従 つ て 、 ま た はユー ザ の 要求 と 予 め 与 え た 条件 の 両方 に 従 つ て 、 映像構造情報管理 · 蓄積部 1 0 9 に 管理 さ れて い る 情報 の再合成 を行 う 。 意味的 な 映像 の フ ィ ル タ ー リ ン グ を 行 う こ と も 可能 で あ る 。 背 景 の み 、 被写体 の み の 映像 な ど も 作成可能で あ る 。 時 間 と 空 間 の 映像情報か ら 情報 情報 を 空 間 へ展 開 し 空 間 の み の情報 と し て 表現 し た画像 も 作成可能 で あ る 。 こ の 例 と し て 、 前述 の よ う な ノ\° ノ ラ マ 展 開 さ れた 空 間 へ被写体 を ス ト ロ ポ 的 に 表現 し た 映像 が あ る 。 従来技術 で は 、 時 間 的 に サ ン プ リ ン グ さ れた ス ト ロ ポ表現 し か 実現 で き な か っ た こ と に 加 え て 、 空 間的 にサ ン プ リ ン グ さ れ た ス 卜 ロ ボ表現 も 可能で あ る 。
図 1 3 に 時 間 、 空 間サ ン プ リ ン グ の ス ト ロ ボ表現 の様 子 を 示す。 1 3 0 1 が再合成 さ れたパ ノ ラ マ 空 間で あ る 1 3 0 2 が被写体 を 表 し て レゝ る 。 1 3 0 3 が空 間 的サ ン プ リ ン グ さ れた ス ト ロ ボ 表現で あ り 、 1 3 0 4 が時 間的 にサ ン プ リ ン グ さ れた ス ト ロ ポ表現 で あ る 。 1 3 0 4 は 被写体 の 配置が被写体 の 速度 も 表現 し て お り 、 一方 、 1 3 0 3 は 、 被写体 の 空 間 に お け る 変化 を 表現 し て い る 。 シ ョ ッ ト 間 関係情報 を 用 い て 、 異 な る シ ョ ッ 卜 に 存在す る 複数の被写体 を 一つ の 背 景 に 合 成す る こ と も 可能で あ る 。 例 え ば、 シ ョ ッ ト A に 撮影 さ れて い る 被写体 (選手 A ) を パ ノ ラ マ 空 間 上 に ス ト ロ ボ 表現 し 、 シ ョ ッ ト B に 撮影 さ れて い る 被写体 (選手 B ) を ス ト ロ ボ表現 上へォ 一バー ラ ッ プ し て 動画 と し て 表示す る こ と も 可能 で あ る こ こ で の シ ョ ッ ト A と シ ョ ッ 卜 B は空 間 的 に 共通 の 空 間 を 有す る 。 こ の 映像 の ェ ン ノ、 ン ス メ ン 卜 は 、 旨 い 選 出 、 下手 な選手 と の フ ォ ー ム の 違 い な ど を 視覚 で直感的 に 把 握す る こ と を ュ 一ザ に 容 易 に し て レ る 。
再合成部 1 1 0 で は 、 ユ ーザ入 力 部 1 1 2 か ら の ユー ザの 要求 に 応 じ て さ ま ざ ま な 表現 が可能 と な る 。 1 1 1 の 表示部 に お い て表示 さ れた 映像 か ら ユーザ は 、 1 1 2 の ュ 一ザ入 力 部 を 介 し て ユ ー ザ の 要求 に対す る 表現 の フ イ ー ド バ ッ ク が可 能で あ る 。 ま た 、 1 1 3 の 出 力 部 に お い て は 、 デ ジ 夕 ル , ァ ナ ロ グ 出 力 が可能で あ り 、 デ ジ 夕 ル 出 力 は 、 外部 の プ リ ン 夕一やノ 一 ソ ナル コ ン ピ ュ ー タ 等へ の 出 力 で あ り 、 ァ ナ ロ グ 出 力 は 、 モ ニ タ 等へ の 映像 信号 出 力 で あ る 。 な お 、 出 力 部 1 1 3 は必要 に 応 じ て 設 け る よ う に し て も 良 い 。
以上 、 本発 明 を 一実施形態例 に 基づ き 具体的 に 説 明 し た が、 本発 明 は、 前記実施形態例 に 限定 さ れ る こ と はな く 、 本発 明 の 要 旨 を逸脱 し な い 範 囲 に お い て種 々 の変更 が可能で あ る こ と は言 う ま で も な レゝ 。
産業上 の 利 用 可能性
以上 の よ う に 、 本発 明 に よ れば、 映像デー タ を 読み込 み 、 保存 さ れた画像つ—夕 列 を読み 出 し 、 カ メ ラ オ ン ォ フ 情報 と カ メ ラ 操作情報 を含む撮影状態情報 を検 出 し 、 こ の カ メ ラ 才 ン ォ フ 情報 に 基づ い て 映像 を シ ョ ッ 卜 毎 に 分割 し 、 カ メ ラ 操作情報 と 物理 的 な特徴量 を 用 い て フ レ — ム 毎 に 被写体 と 背 景 を 分離 し 、 分離 さ れた 被写体情報 を フ レ ー ム 間 で対応付 け を 行 っ て 被写体動 き 情報 を 抽 出 し 、 カ メ ラ 操作情報 と フ レ ー ム 毎 の 背景 か ら 撮影空 間 を 再合 成 し 、 複数 の シ ョ ッ 卜 か ら 各 々 再合成 さ れた 複数 の 撮影空 間 の 間 の 空 間 的 に シ ョ ッ ト 間 関係 を 算 出 し 、 以 上 で得 ら れた 情報 を 管理 , 蓄積す る よ う に し た の で 、 複数 映像 の 時空 間 的 な エ ン ハ ン ス メ ン ト 、 時空 間 的 、 統一的 な管理 , 表現 , 操作 を 可能 と す る 複数映像 の 時空 間統合 が実現可能 と な る 。
ま た 、 上記管理 · 蓄積 さ れて い る 情報 を 基 に 、 予 め 与 え た 条件やユーザか ら の 要求 に 従 っ て 、 一つ 又 は複数 の 撮影空 間 と 一つ 又 は複数 の 被写体 を 再合成 し 、 表示 し 又 は外部へ ア ナ ロ グ 、 デ ジ 夕 リレ形式 で 出 力 す る よ う に し た の 、 同 じ 空 間 を 撮影 し た 複数 の 映像 に対 し て 、 ユーザが 興味や 目 的 に 応 じ て 各 自 の ス タ イ ルで複数映像 の 情報 を 同 時 に 直感的 に 効率 よ く 取得す る こ と か 可能で あ る 。

Claims

求 の 範 囲
1 . 複数 の 映像 を 時 空 間 統合 、 管理す る 装置で あ っ て 映像デー タ を 読 み込 み 、 デー タ 列 と し て 保存す る 画像 デー タ 列 メ モ リ 部 と 、
一-一青
前記画像 デー タ 列 メ モ リ 部か ら デー タ 列 を 読み 出 し 、 カ メ ラ オ ン オ フ 情報 と カ メ ラ 操作情報 を 含 む撮影状態情 報 を検 出す る 撮影状態検 出 部 と 、 前記 カ メ ラ オ ン オ フ 情報 に 基づ い て 前記 デー タ 列 の 映 像 を シ ョ ッ ト 毎 に 分割す る 映像分割部 と 、 前記カ メ ラ 操作情報 と 物 理的な特徴量 を 用 い て 前記映 像 の フ レ ー ム 毎 に 被写体 と 背 景 を 分離す る 被写体, 背景 分離部 と 、
前記 フ レ ー ム 毎 に 分離 さ れた 被写体情報 を フ レ ー ム 間 で対応付 け る 被写体動 き 情報抽 出 部 と 、 前記 カ メ ラ 操作情報 と 前記 フ レ ー ム 毎 に 分離 さ れた背 景か ら 前記 映像が撮影 さ れ た 撮影空 間 を 再合成す る 撮影 空 間再合成部 と 、 前記分割 さ れた 複数 の シ ョ ッ ト か ら 前記撮影空 間再合 成部で各 々 再合成 さ れた 複数 の 撮影空 間 の 間 の 空 間 的な シ ョ ッ ト 間 関 係 を 算 出 す る シ ョ ッ ト 間 関係算 出 部 と 、 前記分離 さ れた 被写体 の 情報 、 前記対応付 け ら れた 被 写体 の 情報 、 前記撮影 状態情報 、 前記背 景 の 情報 、 前記 シ ョ ッ ト 間 関係 の 情報 を 管理 · 蓄積す る 映像構造情報管 理 · 蓄積部 と 、 を 具備す る こ と を 特徴 と す る 複数 映像 の 時空 間統合 、 管理装置。
2 . 前記抽 出 さ れた 被写体情報 , 撮影 状態情報, 背 景 情報 , シ ョ ッ ト 間 関 係情報及 び映像 デ一 夕 の すべ て 又 は そ の 一部 を 伝送又 は受信す る 映像構造化情報伝送受信部 を 、 更 に 具備す る こ と を 特徴 と す る 請求 の 範 囲第 1 項 に 記載 の複数 映像 の 時空 間統合 、 管理装置。
3 . 予 め 与 え た 条件 と ユ ー ザか ら の 要求 の い ずれか一 方又 は双方 に従 っ て 前記映像構造情報管理 · 蓄積部 に 蓄 積 · 管理 さ れて い る 情報 を 基 に一つ 又 は複数 の撮影空 間 と 一つ又 は複数 の 被写体 を 再合成す る 再合成部 と 、
前記再合成部で再合成 さ れた 映像 を 表示す る 表示部 と 前記表示部で表示 さ れて い る 映像 に 基づ い て 再合成 に 関す る 前記ユ ー ザ の 要求 を 入 力 す る ユー ザ入 力 部 と 、 具 備す る と と も に 、
必要 に 応 じ て 前記表示部 に表示 さ れた 映像 を デ ジ タ ル 又 は ア ナ ロ グ形式で 外部装置 に 出 力 す る 出 力 部 を 具備す る 、
こ と を 特徴 と す る 請求 の 範 囲第 1 項又 は第 2 項 に 記載 の 複数映像 の 時空 間統合 、 管理装置。
4 . 前記撮影状態検 出 部 は 、
画像 デー タ メ モ リ 部カゝ ら 読み 出 さ れた 画像 フ レ ー ム に 対 し て水平 、 垂直方 向 の 直線成分 を 各 々 算 出す る 直線成 分算 出 部 と 、
前記算 出 さ れた 水平 、 垂 直 直線成分 を 含む画像が有す る 時 間 空 間配置の 並べ替 え を 行 う 画像デー タ 配置並べ替 え 部 と 、
前記並 べ替 え で得 ら れた 画像デー タ に フ ィ ル タ ー処理 を 施す映像情報 フ ィ ル タ 一部 と 、
前記 フ ィ ル タ 一処理 の 結果か ら 特徴 を 抽 出す る 特徴抽 出部 と 、
前記抽 出 さ れた特徴 を統 計的 に 解析 し て カ メ ラ オ ン ォ フ 情報 と カ メ ラ 操作情報 を 検 出 す る 特徴統計解析部 と 、 を 具備す る こ と を 特徴 と す る 請求 の 範 囲第 1 項 、 第 2 項 、 又 は第 3 項 に 記載 の 複数 映像 の 時空 間統合 、 管理装
5 . 前記画像デ一 夕 並べ替 え 部 は 、 画像 の 法線 と 時間 軸 を 含む複数枚 の 時空 間 断面画像 に 画像デー タ 列 を 並べ 替 え る 画像デー タ 列再配置手段 を 具備す る 、
こ と を 特徴 と す る 請求 の 範 囲第 4 項 に 記載 の複数映像 の 時空 間統合 、 管理装置。
6 . 前記映像情報 フ ィ ル タ ー処理部 は 、 前記並べ替 え ら れた 画像デー タ の 映像情報 の エ ツ ジ ま た は線 を検 出す る 線分検 出 手段 を 具備す る 、
こ と を 特徴 と す る 請求 の 範 囲 第 4 項 に 記載 の複数映像 の 時空 間統合 、 管理 装置。
7 . 前記特徴抽 出 部 は 、
前記検 出 さ れた エ ツ ジ ま た は線 に 関す る 情報 を 画像 の 法線方 向 に 加算す る 積分手段 を 具備す る 、
こ と を 特徴 と す る 請求 の 範 囲第 6 項 に 記載 の 複数映像 の 時空 間統合 、 管理装置。
8 . 前記特徴統 計解析部 は 、 時 間 軸 と 空 間軸 と を 有す る 二次元画像 に表現 さ れた 抽 出 特徴 の 時 間軸 に 垂直 な 直 線 を検 出 し 、 カ メ ラ オ ン オ フ 情報 を 算 出す る カ メ ラ オ ン オ フ 検 出 手段 を 具備す る 、
こ と を特徴 と す る 請求 の 範囲第 4 項 に 記載 の複数映像 の 時空 間統合 、 管理装置。
9 . 前記特徴統 計解析部 は 、
時 間軸 と 空 間軸 と を 有す る 二次元画像 に 表現 さ れた抽 出特徴 の任意 の 2 つ の 時間 の 空 間 分布 を 比較 し 、 空 間座 標 の対応付 け を 行 う 対応付 け手段 と 、
前記対応付 け ら れた 空 間 座標 を 統 計処 理 し て カ メ ラ 操 作パ ラ メ 一 夕 を 算 出 す る カ メ ラ 操作パ ラ メ 一 夕 算 出 手段 と 、
を 具備す る と 特徴 と す る 請求 の 範 囲第 4 項 に記載 の複 数 映像 の 時空 間統 合 、 管理 装 置。
1 0 . 前記被写体 , 背景分離部 は 、
撮影状態検 出 部で検 出 さ れた カ メ ラ 操作情報 に 基づい て 隣接す る 画像デー タ 間 か ら カ メ ラ 操作 を 相殺す る カ メ ラ 操作相殺部 と 、
前記 カ メ ラ 操作情報が相殺 さ れた 画像デー タ 間 で 比較 を 行 う 画像デー タ 比較部 と 、
隣接す る 前記比較画像デー タ 間 で 比較 を 行 う 比較画像 デ一 夕 比較部 と 、
前記 比較画像デー タ 比較部か ら 算 出 さ れ る 比較デー タ か ら 被写体領域 を 抽 出す る 領域抽 出 部 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲第 1 項 、 第 2 項 、 又 は第 3 項 に 記載 の 複数映像 の 時空 間統合 、 管理装
1 1 . 前記 カ メ ラ 操作相殺部 は 、 カ メ ラ 操作 に よ る 変 形 · 変位分 を 相殺す る よ う に 前記 カ メ ラ 操作情報 に基づ い て 隣接す る 画像 フ レ ー ム を 変形 · 変位 さ せ る 映像 フ レ — ム 変形 手段 を 具備す る 、
こ と を 特徴 と す る 請求 の 範 囲第 1 0 項 に 記載 の 複数映 像 の 時空 間統合 、 管理装置。
1 2 . 前記画像 デー タ 比較部 は 、 カ メ ラ 操作が相殺 さ れた 隣接す る 画像デ一 夕 間 で輝度 、 色情報 の 差分処理 を 行 う 差分処理 手段 を 具備す る 、
こ と を 特徴 と す る 請求 の 範 囲第 1 0 項 に 記載 の 複数映 像 の 時空 間統合 、 管理 装置 。
1 3 . 前記抽 出 領域部 は 、
前記比較デー タ に 対 し て 、 二値化処理 を 行 う 二値化処 理手段 と 、
前記二値化処理 さ れた 二値化デー タ に 対 し て ラ ベ ル付 け を す る ラ ベ ル付 け手段 と 、
前記 ラ ベル付 け さ れた領域 の物 理 的 な特徴 を 算 出す る 物理 的特徴算 出 手段 と 、
前記算 出 さ れた 物理的な特徴 に 対 し て予 め 与 え た 条件 と 照合 し て 被写体領域 を 抽 出 す る 照合手段 と 、
を 具備す る こ と を特徴 と す る 請求 の 範 囲 第 1 0 項 に記 載 の 複数映像 の 時空 間統合 、 管理装置。
1 4 . 前記被写体, 背景 分離部 は 、 前記 領域抽 出 部で 抽 出 さ れた フ レ ー ム 毎 の 被写体領域 を フ レ ー ム 画像か ら 差 し 引 い て 背景 を 抽 出す る 背景抽 出 手段 を 具備す る 、 こ と を 特徴 と す る 請求 の 範 囲第 1 3 項 に 記載の 複数映 像 の 時空 間統合 、 管理装置。
1 5 . 前記被写体動 き 情報抽 出 部 は 、 前記領域抽 出 部 で抽 出 さ れた フ レ ー ム 毎 の 被写体領域 の 時 間 的 に 隣接す る 領域 の物理 的な 特徴 の 比較量 に 対 し て予 め 与 え た 条件 と 照合 し て フ レ ー ム 間 の 被写体情報 を 対応付 け る 照合手 段 を 具備す る 、 こ と を 特徴 と す る 請求 の 範 囲第 1 3 項 に 記載 の 複数映 像 の 時空 間統合 、 管理装置。
1 6 . 前記撮影 空 間再合 成部 は 、 前記撮影状態検 出 部 で検 出 さ れ た カ メ ラ 操作情報 に基づ い て 隣接す る 画像 フ レ ー ム を 変 形 ' 変位 さ せ 、 一つ の 連続す る 撮影 空 間 と し て重ね合わ せ る 空 間重ね合 わ せ手段 を 具備す る 、
こ と を 特徴 と す る 請求 の 範囲第 1 項 、 第 2 項 、 又 は第 3 項 に 記載 の 複数 映像 の 時空 間統合 、 管理 装置。
1 7 . 前記 シ ョ ッ ト 間 関 係算 出 部 は 、 撮影空 間再合成 部で作成 さ れた 各 シ ョ ッ ト 毎 の撮影空 間 に 対 し て 、 撮影 空 間 の 間 でそれ ら の 大 き さ と 位置が等 し く な る よ う に 撮 影空 間 を 変換す る 撮影空 間 変換手段 を 具備す る 、
こ と を 特徴 と す る 請求 の 範 囲第 1 項 、 第 2 項 、 又 は第 3 項 に 記載 の 複数映像 の 時空 間統合 、 管理装置。
1 8 . 前記映像構造情報管理 · 蓄積部は 、 前記抽 出 さ れた 被写体情報, 撮影 状態情報 , 背 景情報 , シ ョ ッ ト 間 関係情報 , 映像デー タ 、 並びに 撮影状態情報, 背景情報 シ ョ ッ ト 間 関 係情報 , 及び映像デ一 夕 を 用 い て 再合成 さ れた 複数 映像 の撮影空 間 の すべて 又 はそ の 一部 を デー タ 圧縮 し 、 時 間 空 間 的 に 管理 · 蓄積す る 手段 を 具備す る こ と を特徴 と す る 請求 の 範 囲第 1 項 に 記載 の 複数映像 の 時 空 間統合 、 管理装置 。
1 9 . 前記 映像構造情報管理 · 蓄積部 は 、 前記抽 出 さ れた 被写体情報 を 空 間 に 展 開 し 、 静止画像 と し て デ一 夕 圧縮す る 手段 と 、 再合 成 さ れた複数映像 の 撮影空 間 を 静 止画像 と し て デー タ 圧縮す る 手段 と 、 を 具備す る こ と を 特徴 と す る 請求 の 範 囲第 1 8 項 に 記載 の 複数 映像 の 時空 間統合 、 管理装置。
2 0 . 複数 の 映像 を 時空 間統合 、 管理す る 方法 で あ つ て 、
映像 7 夕 を み込み 、 デー タ 列 と し て保存す る 画像 デー タ 列保存過程 と 、
刖 ή画像デ一 夕 列 メ モ リ 部か ら デー タ 列 を 読み 出 し 、 カ メ ラ オ ン ォ フ 情報 と 力 メ ラ 操作情報 を含む撮影状態情 報 を検 出 す る 撮影 状態検 出 過程 と 、
カ メ ラ オ ン オ フ 情報 に 基づ い て 前記デー タ 列 の 映 像 を シ ョ ッ 卜 毎 に 分割す る 映像分割過程 と 、
刖 §己カ メ ラ 操作情報 と 物 理的な特徴量 を 用 い て 前記映 像 の フ レ ー ム 毎 に 被写体 と 背景 を 分離す る 被写体 , 背景 分離過程 と 、
フ レ ー ム 毎 に 分離 さ れた 被写体情報 を フ レ ー ム 間 で対応付 け る 被写体動 き 情報抽 出 過程 と 、
刖 Bfi カ メ ラ 操作情報 と 前記 フ レ ー ム 毎 に 分離 さ れた 背 景 か ら 前記 映像が撮影 さ れ た 撮影空 間 を 再合成す る 撮影 空 間 合成過程 と 、 前記分割 さ れた 複数 に シ ョ ッ 卜 か ら 前記撮影空 間再合 成過程で 各 々 再合成 さ れ た 複数 の 撮影 空 間 の 空 間 的な シ ヨ ッ ト 間 関 係 を 算 出 す る シ ョ ッ ト 間 関 係算 出過程 と 、 前記分離 さ れた 被写体 の 情報 、 前記対応付 け ら れた被 写体の 情報 、 前記撮影状態情報 、 前記 背 景 の 情報 、 前記 シ ョ ッ ト 間 関係 の 情報 を 管理 · 蓄積す る 映像構造情報管 理 · 蓄積過程 と 、
を 具備す る こ と を 特徴 と す る 複数映像 の 時空 間統合 、 管理方法。
2 1 . 前記抽 出 さ れた 被写体情報 , 撮影 状態情報, 背 景情報, シ ョ ッ ト 間 関係情報及 び映像デー タ のすべて又 はそ の一部 を 伝送又 は受信す る 映像構造化情報伝送受信 過程 を 、 更 に 具備す る こ と を特徴 と す る 請求 の 範 囲第 2 0 項 に 記載 の 複数 映像 の 時空 間統合 、 管理方法。
2 2 . 前記映像構造情報管理 · 蓄積過程 の 後 に 、 予め 与 え た 条件 と ユー ザか ら の 要求 の いずれか一方又 は双方 に 従 っ て 前記蓄積 · 管理 さ れて い る 情報 を 元 に一 つ 又 は複数 の撮影空 間 と 一つ 又 は複数 の 被写体 を 再合成 す る 再合成過程 と 、
前記再合成過程 で 再合 成 さ れた 映像 を 表示又 は 出 力 す る 表示 又 は出 力 過程 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲 第 2 0 項又 は 第 2 1 項 に 記載 の 複 数映像 の 時空 間統合 、 管理方 法。
2 3 . 前記撮影 状態検 出 過程 は 、
画像デー タ 列 メ モ リ 過程か ら 読 み 出 さ れた 画像 フ レ ー ム に対 し て 水平 、 垂直方 向 の 直線成分 を 各 々 算 出 す る 直 線成分算 出 過程 と 、
前記水平 、 垂直 直線成分 を含む画像が有す る 時 間空 間 配置 の 並べ替 え を 行 う 画像デー タ 配置並べ替 え過程 と 、 前記並べ替 え で得 ら れた 画像デー タ に フ ィ ル タ ー処理 を 施す映像情報 フ ィ ル 夕 一 処理過程 と 、
前記 フ ィ ル タ ー処理 の 結果か ら 特徴 を 抽 出す る 特徴抽 出過程 と 、
前記抽 出 さ れた 特徴 を 統 計的 に 解析 し て カ メ ラ オ ン ォ フ 操作情報 と カ メ ラ 操作情報 を検 出 す る 特徴統計解析過 程 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲第 2 0 項 、 第 2 1 項 、 又 は第 2 2 項 に 記載の 複数映像 の 時空 間統合 、 管理方法。
2 4 . 前記画像デー タ 配置並べ替 え 過程で は 、 画像 の 法線 と 時 間軸 を 含む複数枚 の 時空 間 断面画像 に画像デ一 夕 列 を 並べ替 え て再配置す る 、
こ と を 特徴 と す る 請求 の 範 囲第 2 3 項 に 記載 の 複 数映 像 の 時空 間統合 、 管理方法。
2 5 . 前記映像情報 フ ィ ル タ 一処理過程 で は 、 前記並 ベ替 え で得 ら れた 画像デー タ の 映像情報 の エ ッ ジ ま た は 線 を検 出 す る
こ と を 特徴 と す る 請求 の 範 囲 第 2 3 項 に 記載 の 複数映 像 の 時空 間統合 、 管理方法 。
2 6 . 前記特徴抽 出 過程 で は 、 前記検 出 さ れた エ ッ ジ ま た は線 に 関す る 情報 を 画像 の 法線方 向 に 加算 し て特徴 を抽 出す る 、
こ と を 特徴 と す る 請求 の 範 囲第 2 5 項 に 記載の 複数映 像 の 時空 間統合 、 管理方法。
2 7 . 前記特徴統 計解析過程 で は 、 時 間軸 と 空 間軸 と を 有す る 二次元画像 に 表現 さ れた 抽 出特徴 の 時間軸 に垂 直な 直線 を検出 し 、 カ メ ラ オ ン オ フ 情報 を 算 出す る 、 こ と を特徴 と す る 請求 の 範 囲第 2 3 項 に 記載 の 複数映 像 の 時空 間統合 、 管理方法。
2 8 . 前記特徴統計解析過程 は 、
時 間軸 と 空 間軸 と を有す る 二次元画像 に 表現 さ れた 抽 出特徴 の任意 の 2 つ の 時間 の 空 間 分布 を 比較 し 、 空 間座 標 の対応付 け を行 う 対応付 け過程 と 、
前記対応付 け ら れ た 空 間 座標 を 統計処理 し て カ メ ラ 操 作パ ラ メ ー タ を 算 出 す る カ メ ラ 操作 パ ラ メ ー タ 算 出 過程 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲 第 2 3 項 に 記 載 の複数 映像 の 時空 間統合 、 管理 方法。
2 9 . 前記被写体 , 背 景 分離過程 は、
撮影状態検 出 過程で検出 さ れ た カ メ ラ 操作情報 に 基づ い て 隣接す る 画像 デー タ 間 か ら カ メ ラ 操作 を 相殺す る 力 メ ラ 操作相殺過程 と 、
前記カ メ ラ 操作情報が相殺 さ れた 画像デー タ 間 で 比較 を行 う 画像デー タ 比較過程 と 、
隣接す る 前記 比較画像デー タ 間 で 比較 を 行 う 比較画像 デー タ 比較過程 と 、
前記比較画像デー タ 比較過程か ら 算 出 さ れ る 比較デー 夕 か ら 被写体領域 を 抽 出す る 領域抽 出過程 と 、
を 具備す る こ と を特徴 と す る 請求 の範 囲第 2 0 項 、 第 2 1 項、 又 は第 2 2 項 に 記載 の 複数映像 の 時空 間統合 、 管理方法。
3 0 . 前記 カ メ ラ 操作相殺過程 で は、 カ メ ラ 操作 に よ る 変形 · 変位分 を 相殺す る よ う に 前記 カ メ ラ 操作情報 に 基づい て 隣接す る 画像 フ レ ー ム を 変形 · 変位 さ せ る 、 こ と を 特徴 と す る 請求 の 範 囲第 2 9 項 に 記載 の複数映 像 の 時空 間統合 、 管理方法。
3 1 . 前記画像 デー タ 比較過程で は、 カ メ ラ 操作が相 殺 さ れた 隣接す る 画像 デー タ 間 で輝度 、 色情報 の 差分処 理 を行 う 、 こ と を 特徴 と す る 請求 の 範 囲 第 2 9 項 に 記載 の 複数映 像 の 時空 間統合 、 管理方 法 。
3 2 . 前記領域抽 出 過程 は、
前記 比較デー タ に 対 し て 、 二値化処理 を 行 う 二値化処 理過程 と 、
前記二値化処理 さ れた二値化デー タ に 対 し て ラ ベ ル付 け を す る ラ ベ ル付 け 過程 と 、
前記 ラ ベ ル付 け さ れた 領域の物理 的な 特徴 を 算 出 す る 物理 的特徴算 出 過程 と 、
前記算 出 さ れた 物理 的な 特徴 に 対 し て予 め 与 え た 条件 と 照合 し て 被写体領域 を 抽 出す る 照合過程 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲第 2 9 項 に記 載 の 複数 映像 の 時空 間統合 、 管理方法。
3 3 . 前記被写体 , 背景 分離過程 で は 、 前記領域抽 出 過程で抽 出 さ れた フ レ ー ム 毎の 被写体領域 を フ レ ー ム 画 像か ら 差 し 引 い て 背景 を 抽 出す る 、
こ と を 特徴 と す る 請求 の 範 囲第 3 2 項 に 記載 の 複数映 像 の 時空 間統合 、 管理方法。
3 4 . 前記被写体動 き 情報抽 出 過程 で は 、 前記領域抽 出過程で抽 出 さ れた フ レ ー ム 毎 の 被写体領域 の 時 間 的 に 隣接す る 領域 の 物理 的 な特徴 の 比較量 に 対 し て予 め 与 え た 条件 と 照 合 し て フ レ ー ム 間 の 被写体情報 を 対応付 け る こ と を 特徴 と す る 請求 の 範囲第 3 2 項 に 記載の 複数映 像 の 時空 間統合 、 管理方法。
3 5 . 前記撮影 空 間 再合 成過程 で は 、 前記撮影状態検 出過程で検 出 さ れた カ メ ラ 操作情報 に 基づ い て 隣接す る 画像 フ レ ー ム を 変形 ' 変位 さ せ 、 一 つ の 連続す る 撮影空 間 と し て重ね合わ せ る 、
こ と を 特徴 と す る 請求 の 範 囲第 2 0 項 、 第 2 1 項 、 又 は第 2 2 項 に 記載 の 複数 映像 の 時空 間統合 、 管理方法。
3 6 . 前記 シ ョ ッ ト 間 関 係算 出 過程で は 、 前記撮影空 間再合成過程で作成 さ れた 各 シ ョ ッ ト 毎 の撮影空 間 に対 し て 、 撮影空 間 の 間 でそれ ら の 大 き さ と 位置が等 し く な る よ う に 撮影空 間 を 変換す る 、
こ と を 特徴 と す る 請求 の 範 囲第 2 0 項 、 第 2 1 項 、 又 は第 2 2 項 に 記載 の 複数映像 の 時 空 間統合 、 管理方法。
3 7 . 前記映像構造情報管理 · 蓄積過程 は 、 前記抽 出 さ れた 被写体情報 , 撮影状態情報 , 背景情報, シ ョ ッ ト 間 関係情報 , 映像デー タ 、 並び に 撮影状態情報, 背景情 報 , シ ョ ッ ト 間 関係 情報 , 及び映像デー タ を 用 い て 再合 成 さ れた 複数 映像 の 撮影空 間 の すべて又 はそ の一部 を デ 一 夕 圧縮 し 、 時 間 空 間 的 に 管理 · 蓄積す る こ と 特徴 と す る 請求 の 範 囲第 2 0 項 に 記載 の 複数 映像 の 時空 間統合、 管理方法。
3 8 . 前記映像構造情報管理 · 蓄積過程 は 、 前記抽 出 さ れた 被写体情報 を 空 間 に 展 開 し 、 静止画像 と し て デー 夕 圧縮 し 、 再合成 さ れた 複数映像 の 撮影 空 間 を 静止画像 と し て デー タ 圧縮す る こ と を特徴 と す る 請求 の 範 囲第 3 7 項 に 記載 の 複数 映像 の 時空 間統合 、 管理方法。
3 9 . 複数 の 映像 を 時空 間統合 、 管理す る プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読 み取 り 可能な 記録媒体で あ つ て 、
映像デー タ を 読 み込み 、 デ一 夕 列 と し て保存す る 画像 デ一 夕 列保存過程 と 、
前記画像デ一 夕 列 メ モ リ 部か ら デー タ 列 を 読み 出 し 、 カ メ ラ オ ン オ フ 情報 と カ メ ラ 操作情報 を 含む撮影状態情 報 を検 出 す る 撮影状態検 出 過程 と 、
前記 力 メ ラ オ ン オ フ 情報 に基づ い て 前記 デー タ 列 の 映 像 を シ ョ ッ ト 毎 に 分割す る 映像分割過程 と 、
前記 カ メ ラ 操作情報 と 物 理的 な特徴量 を 用 い て 前記映 像 の フ レ ー ム 毎 に 被写体 と 背景 を 分離す る 被写体, 背景 分離過程 と 、
前記 フ レ ー ム 毎 に 分離 さ れた 被写体情報 を フ レ ー ム 間 で対応付 け る 被写体動 き 情報抽 出 過程 と 、
前記 カ メ ラ 操作情報 と 前記 フ レ ー ム 毎 に 分離 さ れた背 景か ら 前記 映像が撮影 さ れた撮影空 間 を 再合成す る 撮影 空 間 合成過程 と 、 前記分割 さ れた 複数 に シ ョ ッ 卜 か ら 前記撮影 空 間再合 成過程 で 各 々 再合成 さ れ た 複数 の 撮影 空 間 の 空 間 的な シ ヨ ッ ト 間 関係 を 算 出 す る シ ョ ッ 卜 間 関係算 出 過程 と 、 前記分離 さ れた 被 写体 の 情報 、 前記対応付 け ら れた 被 写体 の 情報 、 前記撮影 状態情報 、 前記背 景 の 情報 、 前記 シ ョ ッ ト 間 関係 の 情報 を 管理 · 蓄積す る 映像構造情報管 理 · 蓄積過程 と 、
を 具備す る こ と を 特徴 と す る 複 数映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読み取 り 可能な 記録媒体。
4 0 . 前記抽 出 さ れた 被写体情報 , 撮影状態情報, 背 景情報, シ ョ ッ ト 間 関係情報及び映像デー タ の すべて 又 はそ の 一部 を伝送又 は受信す る 映像構造化情報伝送受信 過程 を 、 更 に 具備す る こ と を 特徴 と す る 請求 の 範 囲第 3 9 項 に 記載 の 複数 映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読 み取 り 可能な 記録媒体。
4 1 . 前記映像構造情報管理 · 蓄積過程 の後 に 、
予 め 与 え た 条件 と ユー ザか ら の 要求 の い ずれか 一方又 は双方 に 従 っ て 前記蓄積 · 管理 さ れて い る 情報 を 元 に一 つ 又 は複数 の 撮影 空 間 と 一つ 又 は複数 の 被写体 を 再合成 す る 再合成過程 と 、
前記再合 成過程 で 再合 成 さ れた 映像 を 表示 又 は 出 力 す る 表示 又 は 出 力 過程 と 、 を 具備す る こ と を特徴 と す る 請求 の 範 囲 第 3 9 項又 は 第 4 0 項 に 記載 の 複数映像 の 時空 間統合 、 管理 プ ロ ダ ラ ム を 記録 し た コ ン ピ ュ ー タ 読 み取 り 可能な 記録媒体。
4 2 . 前記撮影状態検 出 過程 は 、
画像デー タ 列 メ モ リ 過程 か ら 読 み 出 さ れ た 画像 フ レ ー ム に対 し て水平、 垂直方 向 の 直線成分 を 各 々 算 出 す る 直 線成分算 出過程 と 、
前記水平 、 垂直直線成分 を含 む画像が有す る 時間空 間 配置 の並べ替 え を 行 う 画像 デー タ 配置並べ替 え過程 と 、 前記並べ替 え で得 ら れた 画像デー ダに フ ィ ル タ ー処理 を施す映像情報 フ ィ ル タ ー処理過程 と 、
前記 フ ィ ル タ ー 処理 の 結果か ら 特徴 を 抽 出 す る 特徴抽 出過程 と 、
前記抽 出 さ れた特徴 を 統 計的 に解析 し て カ メ ラ オ ン ォ フ 操作情報 と カ メ ラ 操作情報 を検 出 す る 特徴統 計解析過 程 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲 第 3 9 項 、 第 4 0 項 、 又 は第 4 1 項 に 記載 の複数映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読 み取 り 可能な 記録媒体。
4 3 . 前記画像デ一 夕 配置並べ替 え 過程 で は 、 画像 の 法線 と 時 間軸 を含む複数枚 の 時空 間 断面画像 に 画像デ一 夕 列 を 並べ替 え て 再配置す る 、 こ と を 特徴 と す る 請求 の 範 囲第 4 2 項 に 記載 の 複数映 像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ビ ユ ー 夕 読 み取 り 可 能な 記録媒体。
4 4 . 前記映像情報 フ ィ ル タ ー 処理過程で は、 前記並 ベ替 え で得 ら れた 画像デー タ の 映像情報 の エ ツ ジ ま た は 線 を検 出 す る
こ と を 特徴 と す る 請求 の 範 囲第 4 2 項 に 記載 の 複数映 像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ビ ユ ー 夕 読み取 り 可能な 記録媒体。
4 5 . 前記特徴抽 出 過程 で は、 前記検 出 さ れた エ ッ ジ ま た は線 に 関 す る 情報 を 画像 の 法線方向 に 加算 し て特徴 を抽 出す る 、
こ と を 特徴 と す る 請求 の 範囲第 4 4 項 に記載 の 複数映 像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ビ ユ ー 夕 読み取 り 可能な 記録媒体。
4 6 . 前記特徴統計解析過程で は 、 時間軸 と 空 間軸 と を 有す る 二次元画像 に 表現 さ れた 抽 出特徴 の 時 間軸 に垂 直 な 直線 を 検 出 し 、 カ メ ラ オ ン オ フ 情報 を 算 出 す る 、 こ と を 特徴 と す る 請求 の 範 囲第 4 2 項 に 記載 の 複数映 像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ビ ュ 一 夕 読み取 り 可能な 記録媒体。
4 7 . 前記特徴統 計解析過程 は 、
時間 軸 と 空 間軸 と を 有す る 二次元画像 に表現 さ れた 抽 出特徴 の 任意 の 2 つ の 時 間 の 空 間分布 を 比較 し 、 空 間 座 標 の 対応付 け を 行 う 対応付 け過程 と 、
前記対応付 け ら れ た 空 間 座標 を 統 計処 理 し て カ メ ラ 操 作パ ラ メ 一 夕 を 算 出 す る カ メ ラ 操作ノ ラ メ 一 夕 算 出 過程 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲第 4 2 項 に 記 載 の複数映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ビュ一夕 読 み取 り 可能な 記録媒体。
4 8 . 前記被写体, 背景分離過程 は 、
撮影状態検出過程 で検 出 さ れた 力 メ ラ 操作情報 に基づ い て 隣接す る 画像デー タ 間 か ら カ メ ラ 操作 を 相殺す る 力 メ ラ 操作相殺過程 と 、
前記 カ メ ラ 操作情報 が相殺 さ れた 画像 デー タ 間 で 比較 を 行 う 画像 デー タ 比較過程 と 、
隣接す る 前記 比較画像デー タ 間 で 比較 を 行 う 比較画像 デ一 夕 比較過程 と 、
前記 比較画像デー タ 比較過程か ら 算 出 さ れ る 比較デー 夕 か ら 被写体領域 を 抽 出 す る 領域抽 出 過程 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲第 3 9 項 、 第 4 0 項 、 又 は第 4 1 項 に 記載 の 複 数映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読 み取 り 可能な 記録媒体。
4 9 . 前記 カ メ ラ 操作相殺過程 で は、 カ メ ラ 操作 に よ る 変形 · 変位分 を 相 殺す る よ う に 前記 カ メ ラ 操作情報 に 基づ い て 隣接す る 画 像 フ レ ー ム を 変形 · 変位 さ せ る 、 こ と を特徴 と す る 請求 の 範 囲第 4 8 項 に 記載 の 複数映 像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー 夕 読 み取 り 可能な 記録媒体。
5 0 . 前記画像デー タ 比 較過程 で は 、 カ メ ラ 操作が相 殺 さ れた 隣接す る 画像 デー タ 間 で輝度 、 色情報 の 差分処 理 を 行 う 、
こ と を 特徴 と す る 請求 の 範 囲第 4 8 項 に 記載 の 複数映 像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ビ ユ ー 夕 読み取 り 可能 な 記録媒体。
5 1 . 前記領域抽 出 過程 は 、
前記比較デー タ に 対 し て 、 二値化処理 を 行 う 二値化処 理過程 と 、
前記二値化処理 さ れた 二値化デー タ に対 し て ラ ベル付 け を す る ラ ベ ル付 け過程 と 、
前記 ラ ベ ル付 け さ れた 領域 の 物理 的 な 特徴 を 算 出す る 物理 的特徴算 出 過程 と 、
前記算 出 さ れた物理 的 な特徴 に 対 し て 予 め 与 え た 条件 と 照合 し て 被写体領域 を 抽 出 す る 照合過程 と 、
を 具備す る こ と を 特徴 と す る 請求 の 範 囲第 4 8 項 に 記 載 の 複数映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読み取 り 可能 な 記録媒体。
5 2 . 前記被写体, 背景 分離過程で は 、 前記領域抽 出 過程 で抽 出 さ れた フ レ ー ム 毎 の 被写体領域 を フ レ ー ム 画 像か ら 差 し 引 い て 背 景 を 抽 出す る 、
こ と を特徴 と す る 請求 の 範 囲第 5 1 項 に 記載 の複数映 像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー 夕 読み取 り 可能な 記録媒体。
5 3 . 前記被写体動 き 情報抽 出 過程で は 、 前記領域抽 出過程 で抽 出 さ れた フ レ ー ム 毎 の被写体領域 の 時間的 に 隣接す る 領域 の物 理的 な 特徴 の 比較量 に 対 し て 予 め 与 え た 条件 と 照合 し て フ レ ー ム 間 の 被写体情報 を 対応付 け る こ と を特徴 と す る 請求 の 範囲第 5 1 項 に 記載 の 複数映 像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ビ ユ ー 夕 読み取 り 可能な 記録媒体。
5 4 . 前記撮影空 間再合 成過程で は 、 前記撮影 状態検 出 過程 で検 出 さ れ た カ メ ラ 操作情報 に 基づ い て 隣接す る 画像 フ レ ー ム を 変 形 ' 変位 さ せ 、 一つ の 連続す る 撮影空 間 と し て重ね合 わ せ る 、
こ と を 特徴 と す る 請求 の 範 囲第 3 9 項 、 第 4 0 項 、 又 は第 4 1 項 に 記載 の 複数 映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読み取 り 可能 な 記録媒体。
5 5 . 前記 シ ョ ッ 卜 間 関 係 算 出 過程 で は 、 前記撮影空 間再合成過程で作成 さ れ た 各 シ ョ ッ ト 毎の 撮影空 間 に対 し て 、 撮影 空 間 の 間 でそ れ ら の 大 き さ と 位置が等 し く な る よ う に 撮影空 間 を 変換す る 、
こ と を 特徴 と す る 請求 の 範 囲第 3 9 項 、 第 4 0 項、 又 は第 4 1 項 に 記載 の 複数 映像 の 時 空 間統合、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読み取 り 可能 な 記録媒体。
5 6 . 前記映像構造情報管理 · 蓄積過程 は 、 前記抽 出 さ れた 被写体情報 , 撮影状態情報 , 背景情報, シ ョ ッ ト 間 関係情報 , 映像デー タ 、 並 び に 撮影状態情報, 背景情 報, シ ョ ッ ト 間 関係情報 , 及 び映像デ一 夕 を 用 い て再合 成 さ れた 複数映像 の 撮影 空 間 のすべ て 又 はそ の 一部 を デ — 夕 圧縮 し 、 時 間 空 間 的 に 管理 · 蓄積す る こ と 特徴 と す る 請求 の 範 囲第 3 9 項 に 記載 の 複 数映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読み取 り 可能な 記録媒体。
5 7 . 前記 映像構造情報管理 · 蓄積過程 は、 前記抽 出 さ れた 被写体情報 を 空 間 に 展 開 し 、 静止画像 と し て デー 夕 圧縮 し 、 再合成 さ れた 複数 映像 の 撮影空 間 を 静止画像 と し て デ一 夕 圧縮す る こ と を 特徴 と す る 請求 の 範 囲第 5 6 項 に 記載 の 複数 映像 の 時空 間統合 、 管理 プ ロ グ ラ ム を 記録 し た コ ン ピ ュ ー タ 読 み取 り 可 能 な記録媒体。
PCT/JP1997/003526 1996-10-04 1997-10-02 Method for temporally and spatially integrating and managing a plurality of videos, device used for the same, and recording medium storing program of the method WO1998015117A1 (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE69732089T DE69732089T2 (de) 1996-10-04 1997-10-02 Vorrichtung und verfahren zur zeitlichen und räumlichen integration und verwaltung einer vielzahl von videos sowie speichermedium zur speicherung eines programms dafür
EP97943138A EP0866606B1 (en) 1996-10-04 1997-10-02 Method for temporally and spatially integrating and managing a plurality of videos, device used for the same, and recording medium storing program of the method
NO19982517A NO323034B1 (no) 1996-10-04 1998-06-02 Fremgangsmate for rom-tid integrasjon/behandling av en flerhet av videoer samt system for utforelse av samme, og lagringsmedium for lagring av et program for fremgangsmaten
US09/090,642 US6411339B1 (en) 1996-10-04 1998-06-04 Method of spatio-temporally integrating/managing a plurality of videos and system for embodying the same, and recording medium for recording a program for the method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP8/263986 1996-10-04
JP26398696 1996-10-04

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US09/090,642 Continuation US6411339B1 (en) 1996-10-04 1998-06-04 Method of spatio-temporally integrating/managing a plurality of videos and system for embodying the same, and recording medium for recording a program for the method

Publications (1)

Publication Number Publication Date
WO1998015117A1 true WO1998015117A1 (en) 1998-04-09

Family

ID=17396960

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP1997/003526 WO1998015117A1 (en) 1996-10-04 1997-10-02 Method for temporally and spatially integrating and managing a plurality of videos, device used for the same, and recording medium storing program of the method

Country Status (5)

Country Link
US (1) US6411339B1 (ja)
EP (1) EP0866606B1 (ja)
DE (1) DE69732089T2 (ja)
NO (1) NO323034B1 (ja)
WO (1) WO1998015117A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100370829C (zh) * 2001-09-26 2008-02-20 Lg电子株式会社 视频通信系统

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6748421B1 (en) * 1998-12-23 2004-06-08 Canon Kabushiki Kaisha Method and system for conveying video messages
US6798923B1 (en) * 2000-02-04 2004-09-28 Industrial Technology Research Institute Apparatus and method for providing panoramic images
JP4587416B2 (ja) * 2000-04-25 2010-11-24 富士通株式会社 デジタル映像コンテンツ閲覧装置及び方法
US6829371B1 (en) * 2000-04-29 2004-12-07 Cognex Corporation Auto-setup of a video safety curtain system
US20030043172A1 (en) * 2001-08-24 2003-03-06 Huiping Li Extraction of textual and graphic overlays from video
EP1491038A2 (en) * 2001-12-26 2004-12-29 YEDA RESEARCH AND DEVELOPMENT CO., Ltd. A system and method for increasing space or time resolution in video
JP2006109119A (ja) * 2004-10-06 2006-04-20 Omron Corp 動画記録装置および動画再生装置
US20070098274A1 (en) * 2005-10-28 2007-05-03 Honeywell International Inc. System and method for processing compressed video data
JP2008219428A (ja) * 2007-03-02 2008-09-18 Fujifilm Corp 撮像装置
KR100889936B1 (ko) * 2007-06-18 2009-03-20 한국전자통신연구원 디지털 비디오 특징점 비교 방법 및 이를 이용한 디지털비디오 관리 시스템
TWI343207B (en) * 2007-09-07 2011-06-01 Lite On Technology Corp Device and method for obtain a clear image
JP4626668B2 (ja) * 2008-04-03 2011-02-09 ソニー株式会社 画像処理装置、表示制御方法、プログラム及び記録媒体
US20110122224A1 (en) * 2009-11-20 2011-05-26 Wang-He Lou Adaptive compression of background image (acbi) based on segmentation of three dimentional objects
US8416990B2 (en) * 2010-08-17 2013-04-09 Microsoft Corporation Hierarchical video sub-volume search
US8335350B2 (en) 2011-02-24 2012-12-18 Eastman Kodak Company Extracting motion information from digital video sequences
US8384787B2 (en) 2011-02-24 2013-02-26 Eastman Kodak Company Method for providing a stabilized video sequence
US9210468B2 (en) * 2011-03-22 2015-12-08 Sony Corporation System and method for effectively implementing a stroboscopic visual effect
US9684830B2 (en) * 2014-11-14 2017-06-20 Intel Corporation Automatic target selection for multi-target object tracking
EP3249651B1 (en) 2016-05-23 2018-08-29 Axis AB Generating a summary video sequence from a source video sequence

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04373085A (ja) * 1991-06-24 1992-12-25 Nippon Telegr & Teleph Corp <Ntt> 背景画像置換装置
JPH0535874A (ja) * 1991-07-29 1993-02-12 Nippon Telegr & Teleph Corp <Ntt> 物体像の抽出処理方法
JPH0589243A (ja) * 1991-09-27 1993-04-09 Nippon Telegr & Teleph Corp <Ntt> 背景画像置換装置
JPH05225340A (ja) * 1992-02-10 1993-09-03 Nippon Telegr & Teleph Corp <Ntt> 物体像の抽出処理方法
JPH07193748A (ja) * 1993-12-27 1995-07-28 Nippon Telegr & Teleph Corp <Ntt> 動画像処理方法および装置
JPH07255009A (ja) * 1994-03-15 1995-10-03 Matsushita Electric Ind Co Ltd 画像データ管理装置

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5657402A (en) * 1991-11-01 1997-08-12 Massachusetts Institute Of Technology Method of creating a high resolution still image using a plurality of images and apparatus for practice of the method
JP3616111B2 (ja) 1991-11-01 2005-02-02 マサチューセッツ・インスティテュート・オブ・テクノロジー 異なる焦点距離又は異なる視域の複数の像を使用した高解像度静止画像を得る方法及び装置
US5689302A (en) * 1992-12-10 1997-11-18 British Broadcasting Corp. Higher definition video signals from lower definition sources
JP3058774B2 (ja) * 1993-01-29 2000-07-04 株式会社河合楽器製作所 映像合成装置及び映像合成方法
US5513854A (en) * 1993-04-19 1996-05-07 Daver; Gil J. G. System used for real time acquistion of data pertaining to persons in motion
JP2883265B2 (ja) * 1993-09-24 1999-04-19 キヤノン株式会社 画像処理装置
JP3192875B2 (ja) * 1994-06-30 2001-07-30 キヤノン株式会社 画像合成方法および画像合成装置
JPH08116490A (ja) * 1994-10-14 1996-05-07 Olympus Optical Co Ltd 画像処理装置
JP3258840B2 (ja) * 1994-12-27 2002-02-18 シャープ株式会社 動画像符号化装置および領域抽出装置
JP3823333B2 (ja) * 1995-02-21 2006-09-20 株式会社日立製作所 動画像の変化点検出方法、動画像の変化点検出装置、動画像の変化点検出システム
IL114838A0 (en) * 1995-08-04 1996-11-14 Spiegel Ehud Apparatus and method for object tracking
JP3689946B2 (ja) * 1995-10-05 2005-08-31 ソニー株式会社 データ処理装置及び方法
DE19601005A1 (de) * 1996-01-15 1997-07-17 Bosch Gmbh Robert Verfahren zur Erkennung bewegter Objekte in zeitlich aufeinanderfolgenden Bildern
US6049619A (en) * 1996-02-12 2000-04-11 Sarnoff Corporation Method and apparatus for detecting moving objects in two- and three-dimensional scenes
US5953056A (en) * 1996-12-20 1999-09-14 Whack & Track, Inc. System and method for enhancing display of a sporting event
US6320624B1 (en) * 1998-01-16 2001-11-20 ECOLE POLYTECHNIQUE FéDéRALE Method and system for combining video sequences with spatio-temporal alignment
US6141041A (en) * 1998-06-22 2000-10-31 Lucent Technologies Inc. Method and apparatus for determination and visualization of player field coverage in a sporting event
US6233007B1 (en) * 1998-06-22 2001-05-15 Lucent Technologies Inc. Method and apparatus for tracking position of a ball in real time

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04373085A (ja) * 1991-06-24 1992-12-25 Nippon Telegr & Teleph Corp <Ntt> 背景画像置換装置
JPH0535874A (ja) * 1991-07-29 1993-02-12 Nippon Telegr & Teleph Corp <Ntt> 物体像の抽出処理方法
JPH0589243A (ja) * 1991-09-27 1993-04-09 Nippon Telegr & Teleph Corp <Ntt> 背景画像置換装置
JPH05225340A (ja) * 1992-02-10 1993-09-03 Nippon Telegr & Teleph Corp <Ntt> 物体像の抽出処理方法
JPH07193748A (ja) * 1993-12-27 1995-07-28 Nippon Telegr & Teleph Corp <Ntt> 動画像処理方法および装置
JPH07255009A (ja) * 1994-03-15 1995-10-03 Matsushita Electric Ind Co Ltd 画像データ管理装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP0866606A4 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100370829C (zh) * 2001-09-26 2008-02-20 Lg电子株式会社 视频通信系统

Also Published As

Publication number Publication date
DE69732089T2 (de) 2005-12-08
NO323034B1 (no) 2006-12-27
US6411339B1 (en) 2002-06-25
EP0866606B1 (en) 2004-12-29
EP0866606A4 (en) 2002-07-31
EP0866606A1 (en) 1998-09-23
NO982517D0 (no) 1998-06-02
DE69732089D1 (de) 2005-02-03
NO982517L (no) 1998-07-27

Similar Documents

Publication Publication Date Title
WO1998015117A1 (en) Method for temporally and spatially integrating and managing a plurality of videos, device used for the same, and recording medium storing program of the method
US10334249B2 (en) System and method for high-resolution storage of images
US6400763B1 (en) Compression system which re-uses prior motion vectors
US10846529B2 (en) Image monitoring system and image monitoring program
US6912327B1 (en) Imagine information describing method, video retrieval method, video reproducing method, and video reproducing apparatus
US6937273B1 (en) Integrated motion-still capture system with indexing capability
JP3227478B2 (ja) 静止画撮像装置
US6040873A (en) Apparatus and method for processing moving image data
US20130071045A1 (en) Image transmitting apparatus, image receiving apparatus, image transmitting and receiving system, recording medium recording image transmitting program, and recording medium recording image receiving program
US20050219642A1 (en) Imaging system, image data stream creation apparatus, image generation apparatus, image data stream generation apparatus, and image data stream generation system
US7266771B1 (en) Video stream representation and navigation using inherent data
US6842540B1 (en) Surveillance system
US20070188624A1 (en) Image capturing method and image-capturing device thereof
CN101690163A (zh) 快门时间补偿
JP2000187477A (ja) 画像処理装置及び画像処理方法
US7075985B2 (en) Methods and systems for efficient video compression by recording various state signals of video cameras
US20130121588A1 (en) Method, apparatus, and program for compressing images, and method, apparatus, and program for decompressing images
US8873642B2 (en) Video content analysis methods and systems
US8174571B2 (en) Apparatus for processing images, apparatus for processing reproduced images, method of processing images, and method of processing reproduced images
CN113556462A (zh) 控制平移倾斜变焦相机
US20110129012A1 (en) Video Data Compression
KR101551915B1 (ko) 영상압축방법 및 영상압축장치
JP4574771B2 (ja) 画像情報記述方法
JP3499729B2 (ja) 複数映像の時空間統合、管理方法及びその装置並びにそのプログラムを記録した記録媒体
WO2009108124A1 (en) A method of recording quality images

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): NO US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE CH DE DK ES FI FR GB GR IE IT LU MC NL PT SE

WWE Wipo information: entry into national phase

Ref document number: 1997943138

Country of ref document: EP

Ref document number: 09090642

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 1997943138

Country of ref document: EP

WWG Wipo information: grant in national office

Ref document number: 1997943138

Country of ref document: EP

点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载