WO2007013194A1

WO2007013194A1 - 画像情報圧縮方法及び自由視点テレビシステム

Info

Publication number: WO2007013194A1
Application number: PCT/JP2006/300257
Authority: WO
Inventors: Masayuki Tanimoto; Toshiaki Fujii; Kenji Yamamoto
Original assignee: National University Corporation Nagoya University
Priority date: 2005-07-26
Filing date: 2006-01-12
Publication date: 2007-02-01
Also published as: JPWO2007013194A1; JP4825983B2

Abstract

　複数台のカメラによって取得された画像情報の符号化において圧縮効率を向上させることができる画像情報圧縮方法及びこの方法を適用したＦＴＶシステムであって、画像情報圧縮方法は、奇数番目のカメラ＃１，＃３によって取得された動画像のフレームＦＲ（＃１，ｎ－１）～ＦＲ（＃１，ｎ＋１），ＦＲ（＃３，ｎ－１）～ＦＲ（＃３，ｎ＋１）を符号化処理するステップと、偶数番目のカメラ＃２によって取得された動画像のフレームに対応する視点補間画像ＦＲｉｎｔ（＃２，ｎ）を生成するステップと、カメラ＃２によって取得された画像の符号化処理に際し、異なる時刻のフレームＦＲ（＃２，ｎ－１），ＦＲ（＃２，ｎ＋１）を参照して符号化処理する場合と、視点補間画像ＦＲｉｎｔ（＃２，ｎ）を参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力するステップとを有する。

Description

明細書

画像情報圧縮方法及び自由視点テレビシステム

技術分野

[0001] 本発明は、複数台のカメラによって取得された画像情報の符号ィ匕において符号ィ匕圧縮効率を向上させることができる画像情報圧縮方法及びこの方法を適用した自由視点テレビシステムに関するものである。

背景技術

[0002] 本出願の発明者は、見る者があた力もその場に、るかのように、自由に視点を変えて 3次元シーンを見ることのできる自由視点テレビ（Free viewpoint TV:FTV)を提案しており（例えば、非特許文献 1〜4参照）、さらに、 15台のカメラで取得した実写画像をもとにして水平面内で自由に視点を移動させてシーンを見ることができる F TVの実験装置を完成させてヽる (例えば、非特許文献 1参照)。

[0003] 非特許文献 1 :谷本正幸、「自由視点テレビ」、日本工業出版、画像ラボ、 2005年 2 月号、 23〜28頁

非特許文献 2：岡慎也、ナノンチャンプリム、藤井俊彰、谷本正幸、「自由視点テレビのための光線空間情報圧縮」、信学技報、 CS2003— 141、 7〜12頁、 2003年 1 2月

非特許文献 3 :谷本正幸、「5. 自由視点テレビ FTV、〜多視点画像処理を使って〜」、映像メディア情報学会誌、 Vol. 58、 No. 7、 pp. 898— 901、 2004年非特許文献 4:岡慎也、ナノンチャンプリム、藤井俊彰、谷本正幸、「自由視点テレビのための動的光線空間の情報圧縮」、 3D Image Conference 2004、 139〜 142頁、 2004年

[0004] なお、非特許文献 2の 9頁左欄には、「光線空間は時間軸にも空間軸にも画像同士が非常に類似しているため、動き (視差)予測を両軸に適応することによって高い圧縮率を得ることが可能であると考えられる。」との記載がある。また、非特許文献 3の 8 99頁左欄には「光線空間を補間すること」の記載があり、 900頁左欄には「補間は光線空間全体にではなく必要な部分のみに行えばよい。」との記載がある。また、非特許文献 4の 140頁左欄には「動的光線空間は時間、空間領域に大きな相関を持っていることが予想できる。」との記載があり、 140頁右欄から 141頁左欄には参照画像の例が示されている。

[0005] 図 1は、 FTVシステムの基本的な構成を概念的に示す図である。図 1に示される F TVシステムは、カメラによる撮影 (ステップ ST1)、画像の補間処理 (ステップ ST2又は ST2a)、画像情報の圧縮処理 (ステップ ST3)、及び入力された視点から見た画像の表示 (ステップ ST4及び ST5)を行う。 FTVシステムでは、 3次元実空間に存在する被写体 101の画像情報を複数台のカメラ（図 1には、符号 102〜102の 5台を

1 5 示すが、実際にはより多くのカメラが用いられる。 )によって取得し (ステップ ST1)、複数台のカメラによって取得した画像（図 1には、符号 103〜103の 5つ画像を示す

1 5

力実際にはより多くの画像が用いられる。）を光線空間 103に互いに配列し、 FTV 信号とする。なお、図 1において、 Xは、水平視野方向、 yは、垂直視野方向、 u(=ta n 0 )は、視域方向を示す。複数台のカメラ 102の配置の仕方には、図 2 (a)に示されるように、直線上に互いに平行な方向を向けて並ぶ直線配置、図 2 (b)に示されるように、円周上に円周の内側を向けて並ぶ円周配置 (又は円弧配置)、図 2 (c)に示されるように、平面上に互いに平行な方向を向けて並ぶ平面配置、図 2 (d)に示されるように、球面上に球面の内側を向けて並ぶ球面配置 (又は半球面配置）、図 2 (e)に示されるように、円筒上に円筒の内側を向けて並ぶ円筒配置等がある。複数台のカメラ 102の配置は、水平方向の自由視点のみを実現する場合には、図 2 (a)に示される直線配置又は図 2 (b)に示される円周配置とし、水平方向と垂直方向の両方の自由視点を実現する場合には、図 2 (c)に示される平面配置、図 2 (d)に示される円筒配置、又は図 2 (e)に示される球面配置とする。

[0006] また、光線空間法では、 3次元実空間の 1本の光線を、それを表すパラメータを座標とする多次元空間の 1点で表す。この仮想的な多次元空間を光線空間という。光線空間全体は、 3次元空間のすべての光線を過不足なく表現する。光線空間は、多くの視点力撮影された画像を集めることによって作られる。光線空間の点の値は、画像の画素値と同じであるから、画像力光線空間への変換は、単なる座標変換である。図 3 (a)に示されるように、実空間中の基準面 106を通過する光線 107は通過位置 (x, y)と通過方向 ( θ , φ )の 4つのパラメータによって一意に表現することができる。図 3 (a)において、 Xは、 3次元実空間における水平方向の座標軸であり、 Yは、垂直方向の座標軸であり、 Zは、奥行き方向の座標軸である。また、 Θは、基準面 1 06の法線に対する水平方向の角度、すなわち、基準面 106に対する水平方向の出射角であり、 φは、基準面 106の法線に対する垂直方向の角度、すなわち、基準面 106に対する垂直方向の出射角である。これにより、この 3次元実空間内の光線情報を輝度 f (x, y, θ , φ )と表すことができる。ここでは、説明を分力りやすくするために、垂直方向の視差 (角度 Φ )を無視する。図 3 (a)に示されるように、基準面 106に向けて、且つ、水平に配置された多数のカメラで撮影された画像は、図 3 (b)に示されるように、 X, y, u (=tan 0 )の軸を持つ 3次元空間において、点線で描かれる断面 10 3〜103に位置していることになる。図 3 (b)に示される光線空間 103から任意の面

1 5

を切り取ることによって、実空間における水平方向の任意の視点から見た画像を生成することが可能となる。例えば、図 4 (a)に示される光線空間 103から断面 103aを切り出すと、図 4 (b)に示されるような画像がディスプレイ 105に表示され、図 4 (a)に示される光線空間 103から断面 103bを切り出すと、図 4 (c)に示されるような画像がディスプレイ 105に表示される。

[0007] また、光線空間 103に配列された画像（断面 103〜103 )の間にはデータがない

1 5

ため、これを補間によって作る（図 1のステップ ST2又は ST2a)。なお、補間は、光線空間の全体についてではなぐ必要な部分についてのみ行えばよい。また、補間を行う場所は、 VOD (Video On Demend)のような用途では画像情報の送信側 (ステツプ ST2)となり、放送のような用途では画像情報の受信側 (ステップ ST2a)となる

[0008] 画像情報の圧縮（図 1のステップ ST3)は、 FTVシステムの各構成が同じ場所にある場合には、必須の処理ではないが、カメラとユーザーとが別の場所に存在し、インターネット等を利用して画像情報を配信する場合には必須の処理となる。従来の画像情報圧縮方法としては、例えば、 H. 264ZAVC規格に準拠したものがある（例えば、特許文献 1参照)。

特許文献 1 :特開 2003— 348595号公報（図 1及び図 2) 発明の開示

発明が解決しょうとする課題

[0009] しかしながら、 FTVシステムにおいて配信される画像情報は、従来の TVシステムにおける画像情報に比べて、カメラの台数分だけ情報量が多くなる。このため、従来の画像情報圧縮方法を用いるのみでは、圧縮効率が不十分であり、画像情報の伝送を伴う FTVシステムを実用化するためには、さらに効率的な圧縮を行うことができる画像情報圧縮方法が必要不可欠である。

[0010] そこで、本発明は、上記従来技術の課題を解決するためになされたものであり、その目的は、複数台のカメラによって取得された画像情報の符号ィ匕において符号ィ匕圧縮効率を向上させることができる画像情報圧縮方法及びこの方法を適用した FTVシステムを提供することである。

課題を解決するための手段

[0011] 本発明の画像情報圧縮方法は、

3台以上のカメラの中力も選択された 2台以上のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を、フレーム内符号化及びフレーム間の時間的相関を利用したフレーム間予測符号ィ匕を用いて符号ィ匕処理するステップと、前記選択されたカメラによって取得された画像情報に基づ、て、前記選択された力メラ以外のカメラによって取得された動画像の時間軸方向に並ぶフレームに対応する第 1の視点補間画像を生成するステップと、

前記選択されたカメラ以外のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を符号ィ匕処理するステップとを有し、

前記選択されたカメラ以外のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を符号ィ匕処理する前記ステップが、前記選択されたカメラ以外のカメラによって取得された画像情報であって符号ィ匕対象のフレームと異なる時刻のフレームの画像情報を参照して符号化処理する場合と、前記符号化対象のフレームに対応する前記第 1の視点補間画像を参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力するステップを含むことを特徴とするものである。

[0012] また、本発明の他の画像情報圧縮方法は、

複数台のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を、フレーム内符号ィ匕及びフレーム間の時間的相関を利用したフレーム間予測符号化によって符号化処理するステップと、

前記複数台のカメラによって取得された動画像のフレームであって、前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記時間的相関を利用したフレーム間予測符号ィ匕と同じアルゴリズムによる同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理するステップとを有する

ことを特徴とするものである。

[0013] さらに、本発明の FTVシステムは、

上記画像情報圧縮方法を実行する画像情報符号化装置と、

前記画像情報符号化装置に映像信号を供給する複数台のカメラと、

前記画像情報符号化装置から出力された符号化情報を復号する画像情報復号装置と、

見る者の視点位置を入力するユーザーインターフェースと、

前記複数台のカメラによって撮影された同時刻の画像から、前記ユーザーインターフェースによって入力された視点力見た画像を抽出する画像情報抽出部とを有することを特徴とするものである。

発明の効果

[0014] 本発明の画像情報圧縮方法及び FTVシステムによれば、複数台のカメラによって取得された動画像のフレームを、同時刻のフレーム間の相関を利用したフレーム間予測符号化によって符号化処理するので、符号ィヒ圧縮効率を向上させることができるという効果を得ることができる。

[0015] また、本発明の他の画像情報圧縮方法及び FTVシステムによれば、選択された 2 台以上のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を符号化処理し、選択されたカメラ以外のカメラによって取得された動画像のフレームに対応する第 1の視点補間画像を生成し、選択されたカメラ以外のカメラによって取得された画像情報であって符号ィ匕対象のフレームと異なる時刻のフレームの画像情報を参照して符号化処理する場合と、第 1の視点補間画像を参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力するので、出力される画像情報の符号ィ匕圧縮効率を向上させることができるという効果を得ることができる。

図面の簡単な説明

[図 1]FTVシステムの基本的な構成を概念的に示す図である。

[図 2] (a)〜（e)は複数台のカメラの配置例を示す図であり、（a)は直線配置、（b)は円周配置、（c)は平面配置、（d)は円筒配置、（e)は球面配置を示す。

[図 3] (a)は実空間上における物体、直線配置されたカメラ、基準面、及び光線を示す図であり、（b)は光線空間を示す図である。

[図 4] (a)は光線空間を示す図であり、 (b)は光線空間から切り出された画像を示す図であり、（c)は光線空間から切り出された他の画像を示す図である。

[図 5]本発明の画像情報圧縮方法を実施することができる画像情報符号ィ匕装置の構成を概略的に示すブロック図である。

[図 6]複数台のカメラによって撮影された動画像のフレームが時間軸方向に並び、且つ、同時刻のフレームがカメラの配列順に並ぶことを概念的に示す図である。

[図 7]図 5に示される画像情報符号ィ匕装置の動作を示すフローチャートである。

[図 8]図 7に示される補間画像生成 ·補償ステップの動作の一例を示すフローチャートである。

[図 9]図 7に示される選択ステップの動作の一例を示すフローチャートである。

[図 10]本発明の画像情報圧縮方法によって符号化された画像情報を復号することができる画像情報復号装置の構成を概略的に示すブロック図である。

[図 11]図 10に示される画像情報復号装置の動作を示すフローチャートである。

[図 12]図 10に示される補間画像生成 ·補償ステップの動作の一例を示すフローチヤートである。

[図 13]本発明の第 1の実施形態の画像情報圧縮方法の説明図 (その 1)である。

[図 14]本発明の第 1の実施形態の画像情報圧縮方法の説明図 (その 2)である。 [図 15]本発明の第 2の実施形態の画像情報圧縮方法の説明図 (その 1)である。

[図 16]本発明の第 2の実施形態の画像情報圧縮方法の説明図 (その 2)である。

[図 17]本発明の第 2の実施形態の画像情報圧縮方法の説明図 (その 3)である。

[図 18]本発明の第 2の実施形態の画像情報圧縮方法の説明図（その 4)である。

[図 19]本発明の第 3の実施形態の画像情報圧縮方法の説明図である。

[図 20]本発明の第 4の実施形態の画像情報圧縮方法の説明図である。

[図 21]本発明の第 5の実施形態の画像情報圧縮方法の説明図 (その 1)である。

[図 22]本発明の第 5の実施形態の画像情報圧縮方法の説明図 (その 2)である。

[図 23]本発明の第 5の実施形態の画像情報圧縮方法の説明図 (その 3)である。

[図 24]本発明の第 5の実施形態の画像情報圧縮方法の説明図（その 4)である。

[図 25]本発明の第 5の実施形態の画像情報圧縮方法の説明図（その 5)である。

[図 26]本発明の第 5の実施形態の画像情報圧縮方法の説明図（その 6)である。

[図 27]本発明の第 6の実施形態の画像情報圧縮方法において光線空間の水平断面の一例を示す図である。

[図 28]本発明の第 6の実施形態の画像情報圧縮方法における動きベクトルの予測方法の説明図である。

[図 29]本発明の第 6の実施形態の比較例としての H. 264ZAVCにおける動きべクトルの予測方法の説明図である。

[図 30] (a)及び (b)は、実空間上の点と光線空間の水平断面における直線の関係を示す説明図である。 FTVシステムの基本的な構成を概念的に示す図である。

[図 31]本発明の第 7の実施形態の FTVシステムの基本的な構成を概念的に示す図である。

符号の説明

101 被写体 (物体）

102, 102〜102 カメラ

1 5

103 光線空間

103〜103 実写画像

1 5

103a, 103b 光線空間の垂直断面 104 ユーザーインターフェース

105 ディスプレイ

106 基準面

107 光線

200 画像情報符号化装置

201 〜201 入力端子

1 N

202 〜202 AZD変換部

1 N

203 画面並べ替えノッファ

204 加算器

205 直交変換部

206 量子化部

207 可変符号化部

208 蓄積バッファ

209 出力端子

210 レート制御部

211 逆量子化部

212 逆直交変換部

213 マルチカメラフレームメモリ

214 符号化処理部

215 動き予測，補償部

216 補間画像生成，補償部

217 選択部

250 FTVシステムの送信側の装置

300 画像情報復号装置

301 入力端子

302 蓄積バッファ

303 可変復号部

304 逆量子化部 305 逆直交変換部

306 加算器

307 画面並べ替えバッファ

308〜308 DZA変換部

1 N

309〜309 出力端子

1 N

310 マルチカメラフレームメモリ

311 復号処理部

312 動き予測，補償部

313 補間画像生成 ·補償部

314 選択部

350 FTVシステムの受信側の装置

351 画像情報抽出部

#1, #2, #3, ···, #n, #n+l,… カメラ番号

FR フレーム（画像）

FR(#1, n-1) カメラ #1によって取得された t=n—l時のフレーム FR(#1, n) カメラ #1によって取得された t=n時のフレーム FR(#1, n+1) カメラ #1によって取得された t=n+l時のフレーム FR(#2, n-1) カメラ #2によって取得された t=n—l時のフレーム FR(#2, n) カメラ #2によって取得された t=n時のフレーム FR(#2, n+1) カメラ #2によって取得された t=n+l時のフレーム FR(#3, n-1) カメラ #3によって取得された t=n—l時のフレーム FR(#3, n) カメラ #3によって取得された t=n時のフレーム FR(#3, n+1) カメラ #3によって取得された t=n+l時のフレーム FR ( # 2, n) フレーム FR ( # 2, n)に対応する視点補間画像

mt

FR ( # 2, n) フレーム FR ( # 2, n)に対応する視点補間画像 intl

FR ( # 2, n) フレーム FR ( # 2, n)に対応する視点補間画像 int2

t 時間軸 GOP グループ'ォブ 'ピクチヤ（所定数のフレームからなる時間軸 t方向の画像グループ）

G 複数の同時刻のフレーム力もなる空間軸 S方向の画像グループ

s

I フレーム内符号化フレーム（Iピクチャ）

P フレーム間予測符号ィ匕フレーム（Pピクチャ）

B フレーム間双方向予測符号ィ匕フレーム (Bピクチャ）

発明を実施するための最良の形態

[0018] <本発明の画像情報圧縮方法を実施する装置の説明 >

図 5は、本発明の画像情報圧縮方法を実施することができる画像情報符号ィヒ装置

200の構成を概略的に示すブロック図である。

[0019] 図 5に示されるように、画像情報符号ィ匕装置 200は、 N個（Nは 2以上の整数)の入力端子 201〜201 と、 N個の AZD変換部 202〜202と、画面並べ替えバッファ

1 N 1 N

203と、加算器 204と、直交変換部 205と、量子化部 206と、可変符号化部 207と、蓄積バッファ 208と、出力端子 209と、レート制御部 210とを備えている。また、画像情報符号化装置 200は、逆量子化部 211と、逆直交変換部 212と、マルチカメラフレーム 213と、動き予測 ·補償部 215と、補間画像生成 ·補償部 216と、動き予測，補償部 215及び補間画像生成 ·補償部 216の出力信号のいずれかを選択的に出力する選択部 217とを備えている。動き予測 ·補償部 215、補間画像生成 ·補償部 216、及び選択部 217は、本発明の画像情報圧縮方法を実施する符号化処理部 214を構成している。図 5に示される画像情報符号ィ匕装置 200は、複数台のカメラからの画像情報を受信できる点、及び、本発明の画像情報圧縮方法を実施できる符号化処理部 2 14を備えてヽる点が、上記特許文献 1に開示されてヽる従来の画像情報符号化装置と相違する。

[0020] 画像情報符号化装置 200の入力端子 201〜201 のそれぞれには、配置位置及

1 N

び撮影方向が既知である N台のカメラによって取得されたアナログ映像信号が入力される。 N台のカメラは、通常は解像度等の性能が同一のものであり、例えば、図 2 (a ；)〜（e)に示されるように規則的に配置されている。ただし、実際の FTVシステムにおいては、通常、カメラの台数は、数十台、百数十台、又はそれ以上の台数になる。また、カメラの配置は、図 2 (a)〜（e)に示されるものに限定されない。入力端子 SO^ 201 に入力されたアナログ映像信号はそれぞれ、 AZD変換部 202〜202でデ

N 1 N ジタル映像信号に変換され、画面並べ替えバッファ 203に保持される。なお、変形例として、入力端子 201〜201 にデジタル映像信号が入力される場合は、 AZD変

1 N

換部 202〜202 は不要である。

1 N

[0021] 図 6は、複数台のカメラ # 1〜# 5によって撮影された動画像のフレーム（「画像 (ピクチャ）」とも言う。）FRが時間軸 t方向に並び、且つ、カメラ # 1〜# 5によって取得された同時刻のフレームがカメラの配列順に空間軸 S方向に並ぶことを概念的に示す図である。図 6に示されるように、各カメラ # 1〜# 5によって撮影された動画像のフレーム FRは、時間軸 t方向に時系列的に並んで所定数のフレーム力なる画像グループである GOP (Group of Pictures)を構成する。また、図 6に示されるように、各力メラ # 1〜 # 5によって撮影された動画像の同時刻に撮影されたフレーム、すなわち、同時刻のフレームは、カメラの配列順である空間軸 S方向（図 6においては水平方向）に並ぶ所定数の同時刻のフレームの画像グループ Gを構成する。

S

[0022] 画像情報符号ィ匕装置 200の画面並べ替えバッファ 203は、 AZD変換部 202〜2 02力供給された画像情報の GOP構造に応じて、フレームの並べ替えを行う。画

N

面並べ替えバッファ 203は、フレーム内符号ィ匕 (イントラ符号化）が行われる画像に対しては、フレーム全体の画像情報を直交変換部 205に供給する。直交変換部 205は、画像情報に対して離散コサイン変換等の直交変換を施し、変換係数を量子化部 2 06に供給する。量子化部 206は、直交変換部 205から供給された変換係数に対して量子化処理を施す。

[0023] 可変符号ィ匕部 207は、量子化部 206から供給された量子化された変換係数や量子化スケール等力符号ィ匕モードを決定し、この符号化モードに対して可変長符号ィ匕、又は算術符号化等の可変符号化を施し、画像符号ィ匕単位のヘッダ部に挿入される情報を形成する。そして、可変符号ィ匕部 207は、符号化された符号化モードを蓄積バッファ 208に供給して蓄積させる。この符号化された符号ィ匕モードは、画像圧縮情報として出力端子 209から出力される。また、可変符号ィ匕部 207は、量子化された変換係数に対して可変長符号ィ匕又は算術符号ィ匕等の可変符号ィ匕を施し、符号ィ匕された変換係数を蓄積バッファ 208に供給して蓄積させる。この符号化された変換係数は、画像圧縮情報として出力端子 209より出力される。

[0024] 量子化部 206の挙動は、蓄積バッファ 208に蓄積された変換係数のデータ量に基づいて、レート制御部 210によって制御される。また、量子化部 206は、量子化後の変換係数を逆量子化部 211に供給し、逆量子化部 211は、その量子化後の変換係数を逆量子化する。逆直交変換部 212は、逆量子化された変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をマルチカメラフレームメモリ 213に供給して蓄積させる。

[0025] また、画面並べ替えバッファ 203は、フレーム間予測符号化 (インター符号化）が行われる画像に関しては、画像情報を符号化処理部 214に供給する。符号化処理部 2 14は、後述する本発明の第 1〜第 6の実施形態の画像情報圧縮方法を用いて画像情報に符号化処理を施す。符号化処理部 214は、生成した参照画像情報を加算器 204に供給し、加算器 204は、参照画像情報を対応する画像情報との差分信号に変換する。また、符号化処理部 214は、同時に動きベクトル情報を可変符号ィ匕部 20 7に供給する。

[0026] 可変符号化部 207は、量子化部 206からの量子化された変換係数及び量子化スケール、並びに符号ィ匕処理部 214から供給された動きベクトル情報等に基づいて符号化モードを決定し、その決定した符号化モードに対して可変長符号化又は算術符号化等の可変符号化を施し、画像符号ィ匕単位のヘッダ部に挿入される情報を生成する。そして、可変符号ィ匕部 207は、符号化された符号ィ匕モードを蓄積バッファ 208 に供給して蓄積させる。この符号化された符号ィ匕モードは、画像圧縮情報として出力される。

[0027] また、可変符号ィ匕部 207は、その動きベクトル情報に対して可変長符号ィ匕又は算術符号化等の可変符号化処理を施し、画像符号ィ匕単位のヘッダ部に挿入される情報を生成する。また、イントラ符号化と異なり、インター符号ィ匕の場合、直交変換部 20 5に入力される画像情報は、加算器 204より得られた差分信号である。なお、その他の処理については、イントラ符号ィ匕による画像圧縮の場合と同様である。

[0028] 図 7は、図 5に示される画像情報符号化装置 200の符号化処理を示すフローチヤートである。図 7に示されるように、画像情報符号ィ匕装置 200は、 AZD変換部 20 〜202 によって、入力されたアナログ映像信号の AZD変換を行い (ステップ ST11

N

)、画面並べ替えバッファ 203によって画面の並べ替えを行い（ステップ ST12)、その後、動き予測'補償部 215による動き予測'補償 (ステップ ST21)、補間画像生成'補償部 216による補間画像の生成 ·補償 (ステップ ST22)、選択部 217による補間画像を参照する符号化又は動き予測 ·補償による符号ィヒの、ずれを選択するかの決定（ステップ ST23)を行う。ただし、従来の画像情報の圧縮符号ィ匕処理 (例えば、 H. 26 4ZAVC規格に準拠した処理)を行う場合、後述する第 1の実施形態の場合には、補間画像生成 ·補償部 216による補間画像の生成 ·補償を行う必要はない。

[0029] その後、直交変換部 205によって生成された画像情報を直交変換し (ステップ ST2 3)、量子化部 206及びレート制御部 210によって量子化及び量子化レート制御を行い (ステップ ST25, 26)、可変符号ィ匕部 207により可変符号ィ匕を行い (ステップ ST2 7)、逆量子化部 211により逆量子化を行い (ステップ ST28)、逆直交変換部 212により逆直交変換 (ステップ ST29)を行う。ステップ ST21〜ST29の処理を、フレーム内の所定画素数からなるブロックのすべてに対して行い、ステップ ST11及び ST12 と全ブロックについてのステップ ST21〜ST29の処理を、全フレームに対して行う。

[0030] 図 8は、図 7に示される補間画像生成 ·補償ステップ ST22の動作の一例を示すフロ一チャートである。補間画像生成 '補償に際しては、ブロック内の各画素で奥行き推定をして補間画素（例えば、画素値 0〜255)を生成し、生成された補間画素の画素値に基づく評価値 Eを算出し、ブロックの奥行き範囲における評価値 Eの最小値 E

min を求める（ステップ ST221〜ST223)。ここで、生成された補間画素の画素値を I (i

int

, j)、奥行きを D (i, j)と定義し、（i, j)は画像上の位置を示し、符号化される画像の

mt

画素値を I (i, j)と定義したときに、評価値 Eは、例えば、

en

abs (l (i, j) -I (i, j) )

int en

とすることができる。ここで、 abs ( は、括弧内の絶対値を示す。ただし、評価値 Eの定義は、

abs (l (i, j) -I (i, j) )

int en

abs (D. (i, j)— D. (i- 1, j) ) としてもよい。なお、本発明において、評価値 Eは、上記定義に限定されず、他の定義を採用することもできる。

[0031] 次に、最小値 E となる奥行きを用いて補間画素を生成する (ステップ ST224)。ス

min

テツプ ST221〜ST224の処理を、ブロック内画素の全体に対して行い、補間画素によって生成された推定ブロックが実際のブロックとどの程度似ているかを示す指標である評価銜を算出する (ステップ ST225)。ここで、評価銜は、ブロック内の推定

mt 1

画素の集合 S を I (i, j)、a< i< b、cく; j < dとし、符号ィ匕する画像の画素の集合 T

est int e を I (i, j)、a< i< b、cく; j < dとすると、評価銜は、例えば、

n en mt

∑{abs (l (i, j) -I (i, j) ) }、a< i< b、c<j < d

int en

と定義できる。または、評価銜 mtは、例えば、

∑{abs (l (i, j) -I (i, j) ) * abs (I (i, j) I (i, j) ) }、 a< i< b、 c<j < d

int en int en

と定義することができる。ここで、 a、 b、 c、 dは、ブロックの範囲を示す値である。なお、以上に説明した補間方法は、一例に過ぎず、本発明における補間方法としては、何を用いてもよぐ装置の製造者又は使用者が、既知のフレーム補間方法の中から自由に選択できるように構成してもよ、。

[0032] 図 9は、図 7に示される補間画像又は動き予測補償のいずれかの選択ステップの動作の一例を示すフローチャートである。図 9に示されるように、補間画像又は動き予測補償のいずれかの選択ステップにおいては、評価銜 mtを算出するが、評価銜 int力 S 動き予測補償を採用した場合の評価銜 motより大きい場合には、動き予測補償を採用し、評価銜 mtが動き予測補償を採用した場合の評価銜 mot以下の場合には、補間画像を選択する (ステップ ST231〜ST233)。ただし、従来の画像情報の圧縮符号化処理 (例えば、 H. 264ZAVC規格に準拠した処理)を行う場合、又は、後述する第 1の実施形態の画像情報圧縮方法を行う場合には、動き予測補償により符号化された画像情報を選択する。

[0033] 図 10は、画像情報符号ィ匕装置 200に対応する画像情報復号装置 300の構成を概略的に示すブロック図である。

[0034] 図 10に示されるように、画像情報復号装置 300は、入力端子 301と、蓄積バッファ 302と、可変復号部 203と、逆量子化部 304と、逆直交変換部 305と、加算器 306と、画面並べ替えバッファ 307と、 N個の DZ A変換部 308〜308 と、 N個の出力端

1 N

子 309〜309 とを備えている。また、画像情報復号装置 300は、マルチカメラフレ

1 N

ームメモリ 310と、動き予測 ·補償部 312と、補間画像生成 ·補償部 313と、動き予測 · 補償部 312及び補間画像生成'補償部 313の出力の内のいずれかを選択的に出力する選択部 314とを備えている。動き予測'補償部 312、補間画像生成'補償部 313 、及び選択部 314は、画像情報復号を実施する復号処理部 311を構成している。図 10に示される画像情報復号装置 300は、本発明の画像情報圧縮方法によって符号化された画像情報を復号できる復号処理部 311を備えている点、及び、複数のカメラ力もの画像情報に相当する複数のアナログ映像信号を出力できる点が、上記特許文献 1に開示されている画像情報復号装置と相違する。なお、変形例として、 N個の出力端子 309〜309カゝらデジタル映像信号を出力する場合は、 N個の DZA変換部

1 N

308〜308 は不要となる。

1 N

[0035] 図 10に示した画像情報復号装置 300において、入力端子 301から入力された画像圧縮情報は、蓄積バッファ 302において一時的に格納された後、可変復号部 303 に転送される。可変復号部 303は、定められた画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可変長復号又は算術復号等の処理を施し、ヘッダ部に格納された符号ィ匕モード情報を取得し逆量子化部 304等に供給する。また同様に、可変復号部 303は、量子化された変換係数を取得し逆量子化部 304に供給する。さらに、可変復号部 303は、復号するフレーム力インター符号ィ匕されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を復号処理部 311に供給する。

[0036] 逆量子化部 304は、可変復号部 303から供給された量子化後の変換係数を逆量子化し、変換係数を逆直交変換部 305に供給する。逆直交変換部 305は、定められた画像圧縮情報のフォーマットに基づき、変換係数に対して逆離散コサイン変換等の逆直交変換を施す。ここで、対象となるフレーム力 Sイントラ符号ィ匕されたものである場合、逆直交変換処理が施された画像情報は、画面並べ替えバッファ 307に格納され、 DZA変換部 308〜308 における DZA変換処理の後に、出力端子 309〜3

1 N 1

09力出力される。 [0037] また、対象となるフレーム力インター符号ィ匕されたものである場合、復号処理部 311 は、可変復号処理が施された動きベクトル情報とマルチカメラフレームメモリ 310に格納された画像情報とに基づいて参照画像を生成し、加算器 306に供給する。加算器 306は、この参照画像と逆直交変換部 305からの出力とを合成する。なお、その他の処理につ、ては、イントラ符号ィ匕されたフレームと同様である。

[0038] 図 11は、図 10に示される画像情報復号装置 300の符号ィ匕処理を示すフローチヤートである。図 11に示されるように、画像情報復号装置 300は、入力信号の可変復号 (ステップ ST31)、逆量子化 (ステップ ST32)、逆直交変換 (ステップ ST33)後、画像情報が動き予測補償されたものであれば、動き予測補償を用いて復号し (ステツプ ST34, ST35)、補間画像を用いて補償したものであれば補間画像を用いた復号をする（ステップ ST36, ST37)。ステップ ST31〜ST37の処理を、全ブロックについて行い、さらに、ステップ ST31〜ST37の処理を全ブロックについて行う処理を、全フレームについて行う。その後、得られた復号データに基づいて、画面の並べ替え（ステップ ST41)、 DZA変換 (ステップ ST42)を行う。

[0039] 図 12は、図 10に示される補間画像生成 ·補償ステップ ST37の動作の一例を示すフローチャートである。図 12のステップ ST371〜ST374の処理は、図 8のステップ S T221〜ST224の処理と同様である。補間画像生成'補償に際しては、ブロック内の各画素で奥行き推定をして補間画素（例えば、画素値 0〜255)を生成し、生成された補間画素の画素値に基づく評価値 Eを算出し、ブロックの奥行き範囲における評価値 Eの最小値 E を求める（ステップ ST371〜ST373)。その後、最小値 E とな

mm min る奥行きを用いて補間画素を生成する（ステップ ST374)。ステップ ST221〜ST22 4の処理を、ブロック内画素の全体に対して行う。

[0040] 以上は、本発明の画像情報圧縮方法を実施することができる画像情報符号ィ匕装置 200と、本発明の画像情報圧縮方法によって符号化された画像情報を復号することができる画像情報復号装置 300を例示して説明したが、本発明の画像情報圧縮方法を実施することができる画像情報符号ィ匕装置 200及び画像情報復号装置 300は、上記構成のものに限定されず、他の構成の装置にも本発明の画像情報圧縮方法を適用できる。次に、本発明の画像情報圧縮方法の実施形態及び本発明の画像情報圧縮方法を適用した FTVシステムを説明する。

[0041] <第 1の実施形態の画像情報圧縮方法の説明 >

以下に、本発明の第 1の実施形態の画像情報圧縮方法を説明する。第 1の実施形態の画像情報圧縮方法は、後述する視点間予測符号化を適用したものであり、例えば、図 5に示されるマルチカメラフレームメモリ 213と、符号ィ匕処理部 214の動き予測 '補償部 215によって実行される。

[0042] 図 13及び図 14は、本発明の第 1の実施形態の画像情報圧縮方法の説明図（その 1及び 2)である。図 13及び図 14において、 tは、時間軸を示し、 Sは、カメラの配列順又はカメラの配列方向の空間軸を示す。また、図 13及び図 14において、 # 1〜# 7 はカメラの配列順に付されたカメラ番号を示す。ただし、第 1の実施形態においては、カメラの台数は、 2台以上であれば、図示された台数以外の台数であってもよい。また、カメラの配置は、図 2 (a)〜（e)の中のいずれかの配置、又は、それ以外の配置であってもよい。また、図 13及び図 14において、 Iは、フレーム内符号化フレーム（Iピクチャ）、 Pは、フレーム間予測符号ィ匕フレーム（Pピクチャ）、 Bは、フレーム間双方向予測符号ィ匕フレーム (Bピクチャ）を示す。図 13及び図 14において、空間軸 S方向に並ぶフレームは、同時刻のフレームである。また、図 13及び図 14において、時間軸 t 方向に並ぶ所定数のフレームは、所定数のフレームカゝら構成される画像グループである GOPを構成している。例えば、カメラ # 1については、時間軸 t方向に並ぶ I, B, B, P, B, B, P,…の所定数のピクチヤによって GOPが構成されている。

[0043] 第 1の実施形態の画像情報圧縮方法においては、先ず、図 13に示されるように、複数台のカメラによって取得された動画像の時間軸 t方向に並ぶフレームの画像情報を、フレーム内符号ィ匕 (イントラ符号化)及びフレーム間の時間的相関を利用したフレーム間予測符号ィ匕 (インター符号化）によって符号化処理する。時間的相関を利用したフレーム間予測符号ィ匕は、例えば、 H. 264ZAVC規格に準拠した符号化方式である。ただし、時間的相関を利用したフレーム間予測符号ィ匕は、上記方式に限定されず、他の符号ィ匕方式を採用してもよい。符号化処理の結果、例えば、図 13に示されるような、動画像のフレーム、すなわち、符号化された画像が得られる。時間軸 t 方向に並ぶ所定数のフレームによって構成される GOP内の時間的に最初のフレームの符号化処理は、フレーム内符号ィ匕によって行われており、最初のフレームは Iピクチャである。また、同じ GOP内の最初のフレーム以外のフレームの符号化処理は、時間的相関を利用したフレーム間予測符号ィ匕によって行われており、符号化された画像は、 Pピクチャ又は Bピクチャである。

[0044] 次に、複数台のカメラによって取得された動画像のフレームであって、カメラの配列順に空間軸 S方向に並ぶ同時刻のフレームの画像情報を、時間的相関を利用したフレーム間予測符号ィ匕と同じアルゴリズムによる同時刻のフレーム間の相関を利用したフレーム間予測符号化によって符号化処理する。この同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕は、空間軸 S方向に並ぶ同時刻の所定数のフレームによって構成される画像グループ（図 6に示される G )単位で実行される。このように

S

、同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕は、各視点（例えば、隣接する各カメラ位置)で取得したフレーム間の相関を利用したフレーム間予測符号ィ匕であることから、「視点間予測符号化」と称する。第 1の実施形態においては、同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理されるフレームは、 GOP内のフレームの最初のフレーム、すなわち、 Iピクチャである。この視点間予測符号ィ匕の処理により、図 14に示されるように、 GOP内の最初のフレームがカメラの配列方向の空間軸 S方向に、 I, B, B, P, B, B, P,…ピクチャに符号ィ匕される。

[0045] 以上に説明した視点間予測符号ィ匕を、複数台のカメラによって取得された各 GOP の最初のフレームについて、実行する。このように、第 1の実施形態の画像情報圧縮方法は、互いの位置関係が既知である複数台のカメラによって同時刻に撮影された画像間には、 H. 264ZAVC規格等において用いられている時間的相関に類似した空間的相関が存在することに着目し、特に情報量の大きい、 GOPの最初のフレーム (Iピクチャ）に、視点間予測符号化処理を施すことを提案するものである。このように、第 1の実施形態の画像情報圧縮方法を用いれば、空間軸 S方向に並ぶ、 GOP 内の最初のフレームに対して、時間軸 t方向に並ぶフレームに対するフレーム間予測符号化と同じアルゴリズムに基づくフレーム間予測符号化、すなわち、視点間予測符号ィ匕を施すので、符号ィ匕圧縮効率を向上させることができる。 [0046] また、視点間予測符号化処理は、時間軸 t方向に並ぶフレームに対するフレーム間予測符号化と同じアルゴリズムに基づく処理であるので、視点間予測符号ィ匕処理には既存の動き予測 ·補償部 215を転用することも可能である。このため、第 1の実施形態の画像情報圧縮方法を実施するために、大幅な構成（回路又はソフトウェア）の追加は必要なぐ 1の実施形態の画像情報圧縮方法はコスト面でも有利である。

[0047] <第 2の実施形態の画像情報圧縮方法の説明 >

以下に、本発明の第 2の実施形態の画像情報圧縮方法を説明する。第 2の実施形態の画像情報圧縮方法は、後述する視点補間を利用するものであり、図 5に示されるマルチフレームメモリ 213と、符号ィ匕処理部 214の動き予測'補償部 215、補間画像生成'補償部 216、及び選択部 217によって実行される。

[0048] 図 15から図 18までは、本発明の第 2の実施形態の画像情報圧縮方法の説明図（その 1〜4)である。図 15から図 18までにおいて、 tは、時間軸を示し、 Sは、カメラの配列順又はカメラの配列方向の空間軸である。また、図には、カメラ # 1〜# 5によつて取得されたフレームのみを示す力カメラの台数はフレーム補間を行うことが可能な台数、すなわち、 3台 (符号化対象のフレームを撮影するカメラが 1台と、符号化対象のフレームに対応する補間画像を生成するために参照するフレームを撮影する力メラが 2台の、合計 3台）以上であれば、何台であってもよい。また、図において、 I、 P 、 Bはそれぞれ、 Iピクチャ、 Pピクチャ、 Bピクチャである。また、図 15から図 17までにおいて、空間軸 S方向に並ぶフレームは同時刻のフレームである。

[0049] 第 2の実施形態の画像情報圧縮方法においては、先ず、図 15に示されるように、奇数番目のカメラ # 1, # 3, # 5,…を選択し、選択されたカメラ # 1, # 3, # 5,… によって取得された動画像の時間軸 t方向に並ぶフレームの画像情報を、フレーム内符号ィ匕及びフレーム間の時間的相関を利用したフレーム間予測符号ィ匕を用いて符号化処理する。

[0050] 次に、図 16に示されるように、選択された奇数番目のカメラ # 1, # 3, # 5,…によつて取得された画像情報に基づいて、選択されたカメラ以外のカメラである偶数番目のカメラ # 2, # 4,…によって取得された動画像の時間軸 t方向に並ぶフレームに対応する補間画像を生成する。すなわち、隣接するカメラの撮影画像に基づくフレーム補間を実行する。このように、隣接するカメラによって (すなわち、隣接する視点から）撮影された同時刻のフレームに基づいて、補間画像を生成する処理を「視点補間」と称し、視点補間によって生成された画像を「視点補間画像」と称する。なお、視点補間に用いる補間方法は、どのような補間方法であってもよぐ本発明の画像情報圧縮方法を実施する装置に要求される性能又は装置使用者の要望などの各種要因に基づいて、既知のフレーム補間方法の中から選択すればよい。また、撮影対象の動きに特定の法則性があることがわ力ている場合には、撮影対象の動きに適した補間方法を選択すればよい。また、図 16に示される視点補間画像を生成する前又は後に、 GOP内の最初のフレームに対して、上記第 1の実施形態において説明した視点間予測符号化を実行して、最初のフレームの情報量を圧縮してもよ、。

[0051] 次に、図 17に示されるように、選択されたカメラ以外の偶数番目のカメラ # 2, # 4, • · -によって取得された動画像の時間軸 t方向に並ぶフレームの画像情報を、フレーム内符号ィ匕及びフレーム間の時間的相関を利用したフレーム間予測符号ィ匕を用いて符号化処理する。

[0052] この際、画像情報符号ィ匕装置 200の選択部 217は、選択されたカメラ以外の偶数番目のカメラ # 2, # 4,…によって取得された画像であって符号ィ匕対象のフレームと異なる時刻のフレームの画像を参照して符号化処理する場合と、符号化対象のフレームに対応する視点補間画像を参照して符号化処理する場合の中で、最も符号ィ匕圧縮効率が高くなる場合の符号化処理結果を選択的に出力する。この処理の説明図を図 18に示す。図 18において、 FR( # 1, n—l)は、カメラ # 1によって取得された t=n— 1時のフレームであり、 FR( # 1, n)は、カメラ # 1によって取得された t=n 時のフレームであり、 FR( # 1, n+ 1)は、カメラ # 1によって取得された t=n+ 1時のフレームである。また、 FR( # 2, n— 1)は、カメラ # 2によって取得された t=n— 1時のフレームであり、 FR( # 2, n)は、カメラ # 2によって取得された t=n時のフレームであり、 FR ( # 2, n+ 1)は、カメラ # 2によって取得された t=n+ 1時のフレームである。さらに、 FR ( # 3, n- 1)は、カメラ # 3によって取得された t=n— 1時のフレームであり、 FR ( # 3, n)は、カメラ # 3によって取得された t=n時のフレームであり、 FR( # 3, n+ 1)は、カメラ # 3によって取得された t=n+ l時のフレームである。また、 FR (#2, n)は、フレーム FR(#2, n)の隣接フレーム FR(#1, n)と FR(#3, n)に基 int

づいて生成された、フレーム FR(#2, n)に対応する視点補間画像である。

[0053] なお、図 18においては、符号化対象のフレーム FR(#2, n)が、異なる時刻のフレームとして、フレーム FR(#2, 11—1)と 1^(#2, n+1)を参照（太い実線で描かれている。）している力参照するフレームはフレーム FR(# 2, n— 1)と FR(#2, n+1 )に限らない。符号ィ匕対象のフレーム FR(# 2, n)力フレーム FR(#2, n— 1)若しくは FR(#2, n+1)の一方を参照する場合、又は、図示されたフレーム以外の異なる時間のフレームを参照する場合もある。そして、図 5に示される選択部 217は、異なる時間のフレームを参照してフレーム間の時間的相関を利用したフレーム間予測符号ィ匕を用いて符号ィ匕処理する場合 (例えば、 H.264ZAVCによる処理を実行する場合)と、符号化対象のフレーム FR( # 2, n)に対応する視点補間画像 FR ( # 2,

mt n)を参照してフレーム FR (#2, n)の符号化処理をする場合 (例えば、視点補間画像をフレーム FR(#2, n)の符号化された画像情報とする場合)の中で、最も符号ィ匕圧縮効率が高くなる場合の符号化処理結果を選択して出力する。

[0054] このような処理を行う理由は、符号ィ匕対象のフレーム FR(# 2, n)がどの画像に似ているかという問題を考えた場合に、同じカメラ # 2で撮影した異なる時間のフレーム力隣接カメラ # 1、 # 3で撮影した同時刻フレームに基づく視点補間画像 FR ( # 2

int

, n)よりも似ている場合と、隣接カメラ #1、 #3で撮影した同時刻フレームに基づく視点補間画像 FR ( # 2, n)が同じカメラ # 2で撮影した異なる時間のフレームよりも似

mt

ている場合とがあり、いずれの場合であるかは、撮影対象の瞬間の動きによって異なるカゝらである。第 2の実施形態の画像情報圧縮方法は、このように、隣接カメラ #1、

# 3で撮影した同時刻フレームに基づく視点補間画像 FR ( # 2, n)力同じカメラ

int

# 2で撮影した異なる時間のフレームよりも符号ィ匕対象のフレーム FR( # 2, n)に似ている場合があるという点に着目し、視点補間画像 FR (#2, n)をも参照の対象と、

int

複数の圧縮方法の中の最も符号ィ匕圧縮効率の高い方法を選ぶことによって、符号化圧縮効率を向上させるものである。

[0055] 以上に説明したように、第 2の実施形態の画像情報圧縮方法によれば、選択されたカメラ以外のカメラ #2, #4,…によって取得された画像情報であって符号ィ匕対象のフレーム FR( # 2, n)と異なる時刻のフレームの画像情報を参照して符号ィ匕処理する場合と、符号ィ匕対象のフレーム FR (#2, n)に対応する視点補間画像 FR ( # 2,

mt n)を参照して符号化処理する場合の中で、最も符号ィ匕圧縮効率が高くなる場合の符号化処理結果を選択的に出力するので、出力される画像情報の符号化圧縮効率を向上させることができる。

[0056] なお、上記説明においては、選択されたカメラが奇数番目（#1、 #3、 #5、 #7、 ···)のカメラであり、選択されたカメラ以外のカメラが偶数番目（#2、 #4、 #6、 ···）のカメラである場合を説明した力選択されたカメラが偶数番目のカメラであり、選択されたカメラ以外のカメラが奇数番目のカメラであってもよい。また、図 18には、白抜きの矢印で示されるように内挿補間によって視点補間画像を生成する場合を示しているが、外挿補間によって視点補間画像を生成してもよい。

[0057] また、選択されたカメラは、偶数番目又は奇数番目に限定されず、例えば、カメラ番号が #3n— 2で示される 3台に 1台のカメラを選択されたカメラ (具体的には、 #1、 # 4、 #7、 ···）とし、残りのカメラを選択されたカメラ以外のカメラ (具体的には、 #2、 # 3、 #5、 #6、…；)とする等の、他の方法を採用してもよい。例えば、選択されたカメラの一部のグループは、偶数番目（#2、 #4、 #6、 ···）又は奇数番目（#1、 #3、 #5 、 ···）とし、残りのグループの部分では、カメラ番号が #3n— 2で示される 3台に 1台のカメラを選択されたカメラとし、残りのカメラを選択されたカメラ以外のカメラとすることもできる。また、更に他の変形例としては、選択されたカメラの一部のグループは、力メラ番号が #3n— 2で示される 3台に 1台のカメラを選択されたカメラとし、残りのカメラを選択されたカメラ以外のカメラとし、残りのグループの部分では、偶数番目（#2、 #4、 #6、 ···）又は奇数番目（#1、 #3、 #5、 ···）としてもよい。すなわち、偶数番目又は奇数番目のカメラを選択されたカメラとする方法と、所定台数毎の 1台を選択されたカメラとする方法とを組み合わせた方法を採用することもできる。

[0058] <第 3の実施形態の画像情報圧縮方法の説明 >

以下に、本発明の第 3の実施形態の画像情報圧縮方法を説明する。第 3の実施形態の画像情報圧縮方法は、視点補間を利用するものであり、図 5に示されるマルチフレームメモリ 213と、符号ィ匕処理部 214の動き予測 ·補償部 215、補間画像生成'補償部 216、及び選択部 217によって実行される。第 3の実施形態の画像情報圧縮方法は、上記第 2の実施形態の画像情報圧縮方法の改良型であり、複数の視点補間画像を参照する点が上記第 2の実施形態の画像情報圧縮方法と相違する。

[0059] 図 19は、本発明の第 3の実施形態の画像情報圧縮方法の説明図である。図 19にお!、て、 FR( # 1, n- 1)は、カメラ # 1によって取得された t=n— 1時のフレームであり、 FR(# 1, n)は、カメラ # 1によって取得された t=n時のフレームであり、 FR(#

1, n+1)は、カメラ #1によって取得された t=n+l時のフレームである。また、 FR( # 2, n- 1)は、カメラ # 2によって取得された t=n— 1時のフレームであり、 FR( # 2 , n)は、カメラ #2によって取得された t=n時のフレームであり、 FR(# 2, n+1)は、カメラ #2によって取得された t=n+l時のフレームである。さらに、 FR(#3, n— 1) は、カメラ #3によって取得された t=n—l時のフレームであり、 FR(#3, n)は、カメラ # 3によって取得された t=n時のフレームであり、 FR( # 3, n+ 1)は、カメラ # 3によって取得された t=n+l時のフレームである。また、図 19において、 FR (#2, n

intl

)は、第 1の補間方法を用いて生成された、フレーム FR(#2, n)に対応する視点補間画像 (図では、補間画像 1とする。）であり、 FR (#2, n)は、第 1の補間方法と異

int2

なる第 2の補間方法を用いて生成された、フレーム FR(#2, n)に対応する視点補間画像（図では、補間画像 2とする。）である。図 19には、 2種類の視点補間画像 FR

intl

(#2, n)と FR (#2, n)を示しているが、 3種類以上の補間方法を用いることによ

int2

つて 3種類以上の補間画像を生成してもよい。なお、第 1の補間方法、第 2の補間方法は、特定の方法に限定されるものはなぐ装置に要求される性能、装置使用者が要求する性能などの各種要因に基づいて決定すればよぐ既知のフレーム補間方法の中から自由に選択すればよい。また、撮影対象の動きに特定の法則性があることがわカゝつてヽる場合には、撮影対象の動きに適した補間方法を選択すればよ!ヽ。

[0060] なお、図 19においては、符号化対象のフレーム FR(#2, n)が、異なる時刻のフレームとして、フレーム FR(#2, 11—1)と 1^(#2, n+1)を参照（太い実線で描かれている。）する場合を示している力参照するフレームはフレーム FR(# 2, n— 1)と F R(#2, n+1)に限らない。符号ィ匕対象のフレーム FR(# 2, n)が、フレーム FR(#

2, n— 1)若しくは FR(#2, n+ 1)の一方を参照する場合、又は、図示されたフレーム以外の異なる時間のフレームを参照する場合もある。そして、図 5に示される選択部 217は、異なる時間のフレームを参照してフレーム間の時間的相関を利用したフレーム間予測符号ィ匕を用いて符号ィ匕処理する場合 (例えば、 H. 264ZAVCによる処理を実行する場合)と、符号化対象のフレーム FR( # 2, n)に対応する視点補間画像 FR ( # 2, n)を参照してフレーム FR( # 2, n)の符号化処理をする場合 (例えば intl

、視点補間画像 FR ( # 2, n)をフレーム FR ( # 2, n)の符号化された画像情報と

intl

する場合)と、符号化対象のフレーム FR ( # 2, n)に対応する視点補間画像 FR (

int2

# 2, n)を参照してフレーム FR ( # 2, n)の符号化処理をする場合 (例えば、視点補間画像 FR ( # 2, n)をフレーム FR ( # 2, n)の符号化された画像情報とする場合）

intl

の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択して出力する

[0061] このような処理を行う理由は、符号ィ匕対象のフレーム FR( # 2, n)がどの画像に似ているかという問題を考えた場合に、同じカメラ # 2で撮影した異なる時間のフレーム力隣接カメラ # 1、 # 3で撮影した同時刻フレームに基づく視点補間画像 FR ( #

intl

2, n)及び FR ( # 2, n)よりも似ている場合と、隣接カメラ # 1、 # 3で撮影した同時

int2

刻フレームに基づく視点補間画像 FR ( # 2, n)が同じカメラ # 2で撮影した異なる

intl

時間のフレーム及び視点補間画像 FR ( # 2, n)よりも似て!/、る場合と、隣接カメラ

int2

# 1、 # 3で撮影した同時刻フレームに基づく視点補間画像 FR ( # 2, n)が同じ力

int2

メラ # 2で撮影した異なる時間のフレーム及び視点補間画像 FR ( # 2, n)よりも似

intl

ている場合とがあり、いずれの場合であるかは、撮影対象の瞬間の動きによって異なるカゝらである。第 2の実施形態の画像情報圧縮方法は、このように、隣接カメラ # 1、 # 3で撮影した同時刻フレームに基づく視点補間画像 FR ( # 2, n)又は FR ( #

intl int2

2, n)が、同じカメラ # 2で撮影した異なる時間のフレームよりも符号ィ匕対象のフレーム FR( # 2, n)に似ている場合があるという点に着目し、視点補間画像 FR ( # 2,

intl n)及び FR ( # 2, n)をも参照の対象とすることによって、符号ィ匕圧縮効率を向上さ

int2

·¾:るものである。

[0062] 以上説明したように、第 3の実施形態の画像情報圧縮方法によれば、選択された力メラ以外のカメラ # 2, # 4,…によって取得された画像情報であって符号ィ匕対象のフレーム FR( # 2, n)と異なる時刻のフレームの画像情報を参照して符号ィ匕処理する場合と、符号化対象のフレーム FR( # 2, n)に対応する視点補間画像 FR ( # 2, n

intl

)を参照して符号化処理する場合と、符号化対象のフレーム FR( # 2, n)に対応する視点補間画像 FR ( # 2, n)を参照して符号化処理する場合の中で、最も符号ィ匕

int2

圧縮効率が高くなる場合の符号化処理結果を選択的に出力するので、出力される画像情報の符号ィ匕圧縮効率を向上させることができる。

[0063] なお、上記説明にお、ては、選択されたカメラが奇数番目のカメラであり、それ以外のカメラが偶数番目のカメラである場合を説明したが、選択されたカメラが偶数番目のカメラであり、それ以外のカメラが奇数番目のカメラとしてもよい。また、図 19には、白抜きの矢印で示されるように内挿補間によって視点補間画像を生成する場合を示して、るが、外挿補間によって視点補間画像を生成してもよ!、。

[0064] また、選択されたカメラは、偶数番目又は奇数番目に限定されず、例えば、カメラ番号が # 3n— 2で示される 3台に 1台のカメラを選択されたカメラとし、残りのカメラを選択されたカメラ以外のカメラとする等の、他の方法を採用してもよい。例えば、選択されたカメラの一部のグループは、偶数番目（# 2、 # 4、 # 6、 · ··）又は奇数番目（# 1 、 # 3、 # 5、 · ··）とし、残りのグループの部分では、カメラ番号が # 3n— 2で示される 3台に 1台のカメラを選択されたカメラとし、残りのカメラを選択されたカメラ以外のカメラとすることもできる。また、更に他の変形例としては、選択されたカメラの一部のダループは、カメラ番号が # 3n— 2で示される 3台に 1台のカメラを選択されたカメラとし、残りのカメラを選択されたカメラ以外のカメラとし、残りのグループの部分では、偶数番目（# 2、 # 4、 # 6、 · ··）又は奇数番目（# 1、 # 3、 # 5、 · ··）としてもよい。

[0065] なお、第 3の実施形態において、上記以外の点は、上記第 2の実施形態の場合と同じである。

[0066] <第 4の実施形態の画像情報圧縮方法の説明 >

以下に、本発明の第 4の実施形態の画像情報圧縮方法を説明する。第 4の実施形態の画像情報圧縮方法は、視点補間を利用するものであり、図 5に示されるマルチフレームメモリ 213と、符号ィ匕処理部 214の動き予測 ·補償部 215、補間画像生成'補償部 216、及び選択部 217によって実行される。第 4の実施形態の画像情報圧縮方法は、上記第 2の実施形態の画像情報圧縮方法の改良型であり、視点補間画像に加えて同時刻の隣接画像をも参照する点が上記第 2の実施形態の画像情報圧縮方法と相違する。

[0067] 図 20は、本発明の第 4の実施形態の画像情報圧縮方法の説明図である。図 20にお!、て、 FR( # 1, n- 1)は、カメラ # 1によって取得された t=n— 1時のフレームであり、 FR(# 1, n)は、カメラ # 1によって取得された t=n時のフレームであり、 FR(# 1, n+1)は、カメラ #1によって取得された t=n+l時のフレームである。また、 FR( # 2, n- 1)は、カメラ # 2によって取得された t=n— 1時のフレームであり、 FR( # 2 , n)は、カメラ #2によって取得された t=n時のフレームであり、 FR(# 2, n+1)は、カメラ #2によって取得された t=n+l時のフレームである。さらに、 FR(#3, n— 1) は、カメラ #3によって取得された t=n—l時のフレームであり、 FR(#3, n)は、カメラ # 3によって取得された t=n時のフレームであり、 FR( # 3, n+ 1)は、カメラ # 3によって取得された t=n+l時のフレームである。図 20において、 FR (#2, n)は、

int

符号ィ匕対象のフレーム FR( # 2, n)に対応する視点補間画像である。

[0068] なお、図 20においては、符号化対象のフレーム FR( # 2, n)力異なる時刻のフレームとして、フレーム FR(#2, n—i;^FR(#2, n+ 1)を参照（図 20において、太い実線で描かれている。）している力参照するフレームはフレーム FR(# 2, n-1) と FR(#2, n+1)に限らない。符号化対象のフレーム FR(#2, n)が、フレーム FR( #2, 11—1)又は？1^(#2, n+1)の一方を参照する場合、又は、図示されたフレーム以外の異なる時間のフレームを参照する場合もある。

[0069] そして、図 5に示される選択部 217は、異なる時間のフレームを参照してフレーム間の時間的相関を利用したフレーム間予測符号ィ匕を用いて符号ィ匕処理する場合 (例えば、 H.264ZAVCによる処理を実行する場合）と、符号化対象のフレーム FR(#2 , n)に対応する視点補間画像 FR ( # 2, n)を参照してフレーム FR( # 2, n)の符号

mt

化処理をする場合と、符号化対象のフレーム FR(#2, n)に隣接するフレーム FR( #1, n)又は FR(#3, n)を参照してフレーム FR(#2, n)の符号化処理をする場合 (例えば、 H.264ZAVCによる処理と同じアルゴリズムを空間軸 S方向に適用する場合)の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択して出力する。

[0070] このような処理を行う理由は、符号化対象のフレームがどの画像に似ているかという問題を考えた場合に、同じカメラ # 2で撮影した異なる時間のフレームが最もよく似ている場合と、隣接カメラ # 1、 # 3で撮影した同時刻フレームに基づく視点補間画像が最もよく似ている場合と、隣接カメラ # 1、 # 3で撮影した同時刻フレームが最もよく似ている場合とがあり、いずれの場合であるかは、撮影対象の瞬間の動きによって異なる力もである。第 4の実施形態の画像情報圧縮方法は、この点に着目して、同じ力メラで撮影した異なる時間のフレーム、隣接カメラで撮影した同時刻フレームに基づく視点補間画像、隣接カメラで撮影した同時刻フレームのうちの、最も似ている画像を用いて、符号化対象フレームの符号化を行っている。

[0071] 以上説明したように、第 4の実施形態の画像情報圧縮方法によれば、選択された力メラ以外のカメラ # 2, # 4,…によって取得された画像情報であって符号ィ匕対象のフレーム FR( # 2, n)と異なる時刻のフレームの画像情報を参照して符号ィ匕処理する場合と、符号化対象のフレーム FR( # 2, n)に対応する視点補間画像 FR ( # 2, n

mt

)を参照して符号化処理する場合と、符号化対象のフレーム FR( # 2, n)に隣接するフレーム FR( # 1, n)及び FR ( # 3, n)を参照して符号化処理する場合の中で、最も符号ィ匕圧縮効率が高くなる場合の符号ィ匕処理結果を選択的に出力するので、出力される画像情報の符号ィ匕圧縮効率を向上させることができる。

[0072] なお、上記説明にお、ては、選択されたカメラが奇数番目のカメラであり、それ以外のカメラが偶数番目のカメラである場合を説明したが、選択されたカメラが偶数番目のカメラであり、それ以外のカメラが奇数番目のカメラとしてもよい。また、図 20には、白抜きの矢印で示されるように内挿補間によって視点補間画像を生成する場合を示して、るが、外挿補間によって視点補間画像を生成してもよ!、。

[0073] また、選択されたカメラは、偶数番目又は奇数番目に限定されず、例えば、カメラ番号が # 3n— 2で示される 3台に 1台のカメラを選択されたカメラとし、残りのカメラを選択されたカメラ以外のカメラとする等の、他の方法を採用してもよい。例えば、選択されたカメラの一部のグループは、偶数番目（# 2、 # 4、 # 6、 ···）又は奇数番目（# 1 、 # 3、 # 5、 ···）とし、残りのグループの部分では、カメラ番号が # 3n— 2で示される 3台に 1台のカメラを選択されたカメラとし、残りのカメラを選択されたカメラ以外のカメラとすることもできる。また、更に他の変形例としては、選択されたカメラの一部のダループは、カメラ番号が # 3n— 2で示される 3台に 1台のカメラを選択されたカメラとし、残りのカメラを選択されたカメラ以外のカメラとし、残りのグループの部分では、偶数番目（# 2、 # 4、 # 6、···）又は奇数番目（# 1、 # 3、 # 5、···）としてもよい。

[0074] さらに、第 4の実施形態に、第 3の実施形態を組み合わせて、視点補間画像を複数種類生成してもよい。

[0075] なお、第 4の実施形態において、上記以外の点は、上記第 2の実施形態の場合と同じである。

[0076] <第 5の実施形態の画像情報圧縮方法の説明 >

以下に、本発明の第 5の実施形態の画像情報圧縮方法を説明する。第 5の実施形態の画像情報圧縮方法は、第 1の実施形態の画像情報圧縮方法に改良を加えたものである。第 5の実施形態の画像情報圧縮方法は、 GOP内の時間的に最初のフレームに対して行う視点間予測符号ィ匕に際して、補間画像をも参照する点が、第 1の実施形態の画像情報圧縮方法と相違する。第 5の実施形態の画像情報圧縮方法は、図 5に示されるマルチフレームメモリ 213と、符号ィ匕処理部 214の動き予測'補償部 215、補間画像生成'補償部 216、及び選択部 217によって実行される。

[0077] 図 21から図 26までは、本発明の第 5の実施形態の画像情報圧縮方法の説明図である。図 21から図 26までにおいて、 tは、時間軸方向を示し、 Sは、カメラの配列順又はカメラの配列方向に対応する空間軸である。また、図には、カメラ # 1〜# 9について示すが、カメラの数は 9台に限定されない。また、図において、 Iは、 Iピクチャ、 Pは、 Pピクチャ、 Bは、 Bピクチャを示す。また、 Pは、補間画像をも参照した Pピクチャ）、 Bは、補間画像をも参照した Bピクチャを示す。

[0078] 第 5の実施形態の画像情報圧縮方法においては、先ず、図 21に示されるように、複数台のカメラによって取得された動画像の時間軸 t方向に並ぶフレームの画像情報を、フレーム内符号ィ匕及びフレーム間の時間的相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理 (例えば、 H. 264ZAVCによる処理)する。その結果、例えば、図 21に示されるように、動画像のフレームの画像情報が得られる。時間軸 t方向に並ぶ所定数のフレームによって構成される GOP内の時間的に最初のフレームの符号化処理は、フレーム内符号ィ匕によって行われており、最初のフレームは Iピクチヤである。また、同じ GOP内の最初のフレーム以外のフレームの符号化処理は、時間的相関を利用したフレーム間予測符号ィ匕によって行われる。

[0079] 次に、図 22に示されるように、 GOP内の最初のフレームにつ!/、て、空間軸 S方向に第 1の実施形態の画像情報圧縮方法で説明した視点間予測符号ィ匕処理、すなわち、カメラの配列順に並ぶ同時刻のフレームの画像情報を、同時刻のフレーム間の相関を利用したフレーム間予測符号化によって符号化処理する。図 21及び図 22の処理は、上記第 1の実施形態の場合と同じである。

[0080] 次に、図 23に示されるように、 GOP内の最初のフレームから、 Iピクチャであるフレーム FR(#1, 1)を第 1の基準フレームとして選択し、 Pピクチャであるフレーム FR( #3, 1)を第 2の基準フレームとして選択する。フレーム FR(#1, 1)とフレーム FR( #3, 1)に基づく補間 (外挿）によって、視点補間画像 FR を生成する。次に、カメラ

int

の配列順に並ぶ同時刻のフレームの中の符号化対象のフレームと異なるフレームの画像情報を参照して符号化処理 (第 1の実施形態の視点間予測符号化)する場合と

、符号化対象のフレームに対応する視点補間画像 FR を参照して符号化処理する

int

場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を、符号化対象のフレーム (例えば、 FR(#5, 1))の符号ィ匕された画像情報、例えば、 Piピクチャとする。次に、フレーム FR(#3, 1)の画像と、生成された Piピクチャに基づく外揷補間によつて、視点補間画像 FR を順次生成し、同様の処理を繰り返す。ここで、視点

int

補間画像は、図 24に示されるように、異なる補間方法によってフレーム FR (#n+

intl

4, 1)及び FR (#n+4, 1)のように複数種類作成してもよい。さらに、図 24に示さ

int2

れるように、 GOP内の最初のフレームにおいて、 Iピクチャ、 Pピクチャ、 Piピクチャが生成された後に、補間フレーム FR (#n+l, 1)及び FR (#n+l, 1)、又は、

intl mt2

補間フレーム FR (#n+3, 1)及び FR ( #n+3, 1)を作成する。次に、カメラの

mtl mt2

配列順に並ぶ同時刻のフレームの中の符号化対象のフレームと異なるフレームの画像情報を参照して符号化処理 (第 1の実施形態の視点間予測符号化)する場合と、符号ィ匕対象のフレームに対応する視点補間画像 FR (#n+l, 1)若しくは FR ( # n+ l, 1)、又は、補間フレーム FR ( # n+ 3, 1)若しくは FR ( # n+ 3, 1) FR

intl int2

mtを参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を、符号ィ匕対象のフレーム (例えば、 FR ( # 4, 1) )の符号化された画像情報、例えば、 Biピクチャとする。

[0081] 次に、カメラの配列順に並ぶ同時刻のフレームの中の符号ィ匕対象のフレームと異なるフレームの画像情報を参照して符号化処理する場合と、符号化対象のフレームに対応する視点補間画像を参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力する。その結果、図 25に示されるように、 t= l時の最初のフレームが、符号化効率の最も高い方法で符号化される。

[0082] 次に、図 6に示されるように、次の GOPに対して同様の処理を繰り返す。

[0083] このような処理を行う理由は、 GOP内の最初のフレームお!/、て、符号化対象のフレームがどの画像に似ているかという問題を考えた場合に、隣接カメラで撮影した同時刻フレームに基づいて第 1の実施形態の視点間予測符号ィ匕を実施することによって符号化された画像が最もよく似ている場合と、隣接カメラで撮影した基準フレームに基づ、て作成された補間画像が最もよく似て!/、る場合とがあり、 V、ずれの場合であるかは、撮影対象の瞬間の動きによって異なるからである。第 5の実施形態の画像情報圧縮方法は、この点に着目して、隣接カメラで撮影した同時刻フレームに基づいて第 1の実施形態の視点間予測符号ィ匕を実施することによって符号化された画像が最もよく似て、る場合と、隣接カメラで撮影した基準フレームに基づ、て作成された補間画像が最もよく似ている場合のうちの、最も似ている画像を用いて、符号化対象フレームの符号化を行って、る。

[0084] 以上説明したように、第 5の実施形態の画像情報圧縮方法によれば、第 1の実施形態の視点間予測符号ィ匕を実施することによって符号化された画像が最もよく似ている場合と、隣接カメラで撮影した基準フレームに基づヽて作成された補間画像が最もよく似ている場合のうちの、最も似ている画像を用いて、符号化対象フレームの符号化を行っているので、出力される画像情報の符号ィ匕圧縮効率を向上させることができる。 [0085] なお、第 5の実施形態において、上記以外の点は、上記第 1の実施形態の場合と同じである。

[0086] <第 6の実施形態の画像情報圧縮方法の説明 >

以下に、本発明の第 6の実施形態の画像情報圧縮方法を説明する。図 27は、本発明の第 6の実施形態の画像情報圧縮方法において参照する光線空間の水平断面の一例を示す図である。また、図 28は、本発明の第 6の実施形態の画像情報圧縮方法における動きベクトルの予測方法の説明図である。また、図 29は、本発明の第 6の実施形態の比較例としての H. 264ZAVCにおける動きベクトルの予測方法の説明図である。

[0087] 第 6の実施形態の画像情報圧縮方法は、第 1の実施形態の画像情報圧縮方法に改良を加えたものである。第 6の実施形態の画像情報圧縮方法は、複数台のカメラが互いに平行に 1列に直線配置されていることを前提とする。第 6の実施形態の画像情報圧縮方法は、カメラの配列順に並ぶ同時刻のフレームの画像情報を、同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理するステツプ (第 1の実施形態における視点間予測符号ィ匕のステップ）における動き補償予測符号化にぉ、て用いられる動きベクトルを、光線空間を水平方向に切断したときの水平断面画像（EPI :Epipolar Plane Image)に現れる直線に基づいて求めることを特徴としている。第 6の実施形態の画像情報圧縮方法は、図 5に示されるマルチフレームメモリ 213と、符号ィ匕処理部 214の動き予測'補償部 215によって実行される。

[0088] H. 264ZAVCによる画像の符号化では、図 29に示されるように、カメラによって取得された動画像のフレーム FR内の該当ブロック BL に隣接する符号化済の隣接

en

ブロック BL , BL , BL 力も動きベクトルを予測している。この方法は、該当ブ

neil nei2 nei3

ロック BL と参照ブロック BL , BL , BL とが大きく異なる場合に、多くのビット

en neii nei2 nei3

を発生させてしまう欠点がある。

[0089] そこで、第 6の実施形態の画像情報圧縮方法にぉ、ては、複数台のカメラが互!ヽに平行に 1列に直線配置されており、複数台のカメラによって取得された動画像の同時刻のフレームを、複数台のカメラの配列順に互いに平行に立てて並べることによつて光線空間を構成した場合には、光線空間における水平断面構造が直線構造の集まりで表現される性質を利用する。この性質は、フレームの動きが、連続して起こる、且つ、動きが重複する領域（図 27において直線が交差する領域)では、直線の傾きの大きい直線で表現されている点を優先する。傾きの大きい直線は、 3次元空間中の手前の点に相当する。

[0090] ここで、複数台のカメラの配列順に互いに平行に立てて並べることによって光線空間を構成した場合には、光線空間における水平断面構造が直線構造の集まりで表現される性質を、図 3 (a)及び (b)と図 30 (a)及び (b)を参考にしながら説明する。縦方向の視差（ Φ )を無視して、 yが一定である断面を考えて、図 30 (a)に示されるように、 (X, Z)を実空間における一点 Pの座標とし、 X, z, 0を光線が基準面 106を通過する位置及び角度とする。このとき、 X=x+Z'tan Θの関係が成り立つ。すなわち、実空間で一点を通る光線群は光線空間の水平断面 (y=—定の断面）上では直線に並ぶという特徴を持っている。図 30 (b)は、実空間上の点 Xを光線空間の水平断面上に示している。

[0091] このように、第 6の実施形態の画像情報圧縮方法においては、図 29に示されるように、隣接ブロックの動きベクトルと用いないので、適切な動きベクトルを予測できる。第 6の実施形態によれば、適切な動きベクトルを予測できるので、画像圧縮効率を向上させることができる。

[0092] なお、以上の説明においては、第 6の実施形態の画像情報圧縮方法を第 1の実施形態に適用した場合を説明したが、第 6の実施形態の画像情報圧縮方法を、第 2〜第 5の実施形態に適用することもできる。

[0093] <第 7の実施形態の FTVシステムの説明 >

図 30は、本発明の第 7の実施形態の FTVシステムの基本的な構成を概念的に示す図である。図 30において、図 1に示される構成と同一又は対応する構成には、同じ符号を付す。

[0094] 第 7の実施形態の FTVシステムは、送信側の装置 250と、受信側の装置 350とが離れた場所にあり、送信側の装置 250から受信側の装置 350まで、例えば、インターネットなどを用いて、 FTV信号を伝送するシステムである。

[0095] 図 30に示されるように、送信側の装置 250は、複数台のカメラ（図 30には、符号 10 2〜102の 5台を示すが、実際にはより多くのカメラが用いられる。）と、複数台の力

1 5

メラによって取得された映像情報を圧縮符号ィ匕する、上記実施の形態 1〜6において説明された構成及び機能を有する画像情報符号化装置 200とを備えてヽる。画像情報符号ィ匕装置 200で圧縮符号化された画像情報は、図示しない通信装置によって受信側の装置 350に送られる。

[0096] また、受信側の装置 350は、図示しな、受信装置と、上記実施の形態 1にお!、て説明された画像情報復号装置 300と、画像情報復号装置 300からの出力信号に基づいて光線空間 103を形成し、ユーザーインターフェース 104から入力された視点位置に応じて光線空間 103から断面を抽出して表示する。

[0097] 図 3 (a) , (b)及び図 4 (a)〜（c)に示されるように、例えば、光線空間法を用いることにより、光線空間 103から任意の面を切り取ることによって、実空間における水平方向の任意の視点から見た画像を生成することが可能である。例えば、図 4 (a)に示される光線空間 103から断面 103aを切り出すと、図 4 (b)に示されるような画像が生成され、図 4 (a)に示される光線空間 103から断面 103bを切り出すと、図 4 (c)に示されるような画像が生成される。

[0098] 以上説明したように、第 7の実施形態の FTVシステムにおいては、上記第 1〜第 6 の実施形態で説明された画像情報圧縮方法を用いてヽるので、 FTVシステムにおける FTV信号の符号ィ匕圧縮効率を向上させることができる。

Claims

請求の範囲

[1] 3台以上のカメラの中力も選択された 2台以上のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を、フレーム内符号化及びフレーム間の時間的相関を利用したフレーム間予測符号ィ匕を用いて符号ィ匕処理するステップと、前記選択されたカメラによって取得された画像情報に基づ、て、前記選択された力メラ以外のカメラによって取得された動画像の時間軸方向に並ぶフレームに対応する第 1の視点補間画像を生成するステップと、

前記選択されたカメラ以外のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を符号ィ匕処理するステップと

を有し、

前記選択されたカメラ以外のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を符号ィ匕処理する前記ステップが、前記選択されたカメラ以外のカメラによって取得された画像情報であって符号ィ匕対象のフレームと異なる時刻のフレームの画像情報を参照して符号化処理する場合と、前記符号化対象のフレームに対応する前記第 1の視点補間画像を参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力するステップを含む

ことを特徴とする画像情報圧縮方法。

[2] 前記第 1の視点補間画像を生成する前記ステップにおいて、前記第 1の視点補間画像が、 1つのフレームに対して異なる補間方法を用いて複数種類生成され、前記選択されたカメラ以外のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を符号ィ匕処理する前記ステップが、前記選択されたカメラ以外のカメラによって取得された画像情報であって符号ィ匕対象のフレームと異なる時刻のフレームの画像情報を参照して符号化処理する場合と、前記符号化対象のフレームに対応する複数種類の前記第 1の視点補間画像のいずれかを参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力するステップを含む

ことを特徴とする請求項 1に記載の画像情報圧縮方法。

[3] 前記選択されたカメラ以外のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を符号ィ匕処理する前記ステップが、前記選択されたカメラ以外のカメラによって取得された画像情報であって符号ィ匕対象のフレームと異なる時刻のフレームの画像情報を参照して符号化処理する場合と、前記符号化対象のフレームに対応する前記第 1の視点補間画像を参照して符号化処理する場合と、前記選択されたカメラによって取得された画像情報であって符号ィ匕対象のフレームと同時刻のフレームの画像情報を参照して符号ィ匕処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力するステップを含む

ことを特徴とする請求項 1に記載の画像情報圧縮方法。

[4] 前記カメラによって取得された動画像のフレームであって、前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記時間的相関を利用したフレーム間予測符号ィ匕と同じアルゴリズムによる同時刻のフレーム間の相関を利用したフレーム間予測符号化によって符号化処理するステップをさらに有する

ことを特徴とする請求項 1に記載の画像情報圧縮方法。

[5] 前記時間軸方向に並ぶフレームの画像情報を、フレーム内符号化及びフレーム間の時間的相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理する前記ステツプにおいて、

前記時間軸方向に並ぶ所定数のフレームによって構成される画像グループ内の時間的に最初のフレームの前記符号ィ匕処理力フレーム内符号ィ匕によって行われ、前記画像グループ内の前記最初のフレーム以外のフレームの前記符号ィヒ処理力時間的相関を利用したフレーム間予測符号ィ匕によって行われる

ことを特徴とする請求項 4に記載の画像情報圧縮方法。

[6] 前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理する前記ステップにおいて、

前記同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕されるフレーム力前記カメラの配列順に並ぶ複数の前記最初のフレームであることを特徴とする請求項 4に記載の画像情報圧縮方法。

[7] 前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理する前記ステップが、

前記カメラの配列順に並ぶ前記同時刻のフレームの中から 2つ以上の基準フレームを選択するステップと、

前記基準フレーム又は前記基準フレームに基づ、て生成されたフレームに基づヽて、前記カメラの配列順に並ぶ同時刻のフレームの中のいずれかに対応する第 2の視点補間画像を生成するステップと、

前記カメラの配列順に並ぶ同時刻のフレームの中の符号ィ匕対象のフレームと異なるフレームの画像情報を参照して符号化処理する場合と、前記符号化対象のフレームに対応する前記第 2の視点補間画像を参照して符号ィ匕処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力するステップとを含む

ことを特徴とする請求項 6に記載の画像情報圧縮方法。

[8] 前記第 2の視点補間画像を生成する前記ステップにお、て、前記第 2の視点補間画像が、 1つのフレームに対して異なる補間方法を用いて複数種類生成され、前記カメラの配列順に並ぶ同時刻のフレームの中の前記基準フレーム以外のフレームの画像情報を符号ィ匕処理する前記ステップが、前記カメラの配列順に並ぶ同時刻のフレームの中の符号ィ匕対象のフレームと異なるフレームの画像情報を参照して符号化処理する場合と、前記符号化対象のフレームに対応する前記複数種類の第 2 の視点補間画像のいずれかを参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号ィ匕処理結果を選択的に出力するステップを含むことを特徴とする請求項 7に記載の画像情報圧縮方法。

[9] 前記複数台のカメラが互いに平行に 1列に直線配置されており、

前記複数台のカメラによって取得された動画像の同時刻のフレームを、前記複数台のカメラの配列順に互いに平行に立てて並べることによって光線空間を構成し、前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理する前記ステップ力前記フレームの一部によって構成されるブロックの動きベクトルを用いる動き補償予測符号ィ匕によって実行され、

前記動きベクトルを、前記光線空間を水平方向に切断したときの水平断面画像に現れる直線に基づヽて求める

ことを特徴とする請求項 4に記載の画像情報圧縮方法。

[10] 複数台のカメラによって取得された動画像の時間軸方向に並ぶフレームの画像情報を、フレーム内符号ィ匕及びフレーム間の時間的相関を利用したフレーム間予測符号化によって符号化処理するステップと、

前記複数台のカメラによって取得された動画像のフレームであって、前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記時間的相関を利用したフレーム間予測符号ィ匕と同じアルゴリズムによる同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理するステップと

を有することを特徴とする画像情報圧縮方法。

[11] 前記時間軸方向に並ぶフレームの画像情報を、フレーム内符号化及びフレーム間の時間的相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理する前記ステツプにおいて、

時間軸方向に並ぶ所定数のフレームによって構成される画像グループ内の時間的に最初のフレームの前記符号ィ匕処理力フレーム内符号ィ匕によって行われ、前記画像グループ内の前記最初のフレーム以外のフレームの前記符号ィヒ処理力時間的相関を利用したフレーム間予測符号ィ匕によって行われる

ことを特徴とする請求項 10に記載の画像情報圧縮方法。

[12] 前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理する前記ステップにおいて、

前記同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理されるフレーム力前記カメラの配列順に並ぶ複数の前記最初のフレームであることを特徴とする請求項 10に記載の画像情報圧縮方法。

[13] 前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理する前記ステップが、

前記基準フレーム又は前記基準フレームに基づ、て生成されたフレームに基づヽて、前記カメラの配列順に並ぶ同時刻のフレームの中のいずれかに対応する視点補間画像を生成するステップと、

前記カメラの配列順に並ぶ同時刻のフレームの中の符号ィ匕対象のフレームと異なるフレームの画像情報を参照して符号化処理する場合と、前記符号化対象のフレームに対応する前記視点補間画像を参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号化処理結果を選択的に出力するステップとを含むことを特徴とする請求項 12に記載の画像情報圧縮方法。

[14] 前記視点補間画像を生成する前記ステップにお、て、前記視点補間画像が、 1つのフレームに対して異なる補間方法を用いて複数種類生成され、

前記カメラの配列順に並ぶ同時刻のフレームの中の前記基準フレーム以外のフレームの画像情報を符号ィ匕処理する前記ステップが、前記カメラの配列順に並ぶ同時刻のフレームの中の符号ィ匕対象のフレームと異なるフレームの画像情報を参照して符号化処理する場合と、前記符号化対象のフレームに対応する前記複数種類の視点補間画像のヽずれかを参照して符号化処理する場合の中で、最も符号化圧縮効率が高くなる場合の符号ィ匕処理結果を選択的に出力するステップを含む

ことを特徴とする請求項 13に記載の画像情報圧縮方法。

[15] 前記複数台のカメラが互いに平行に 1列に直線配置されており、

前記複数台のカメラによって取得された動画像の同時刻のフレームを、前記複数台のカメラの配列順に互いに平行に立てて並べることによって光線空間を構成し、前記カメラの配列順に並ぶ同時刻のフレームの画像情報を、前記同時刻のフレーム間の相関を利用したフレーム間予測符号ィ匕によって符号ィ匕処理する前記ステップ力前記フレームの一部によって構成されるブロックの動きベクトルを用いる動き補償予測符号ィ匕によって実行され、前記動きベクトルを、前記光線空間を水平方向に切断したときの水平断面画像に現れる直線に基づヽて求める

ことを特徴とする請求項 10に記載の画像情報圧縮方法。

[16] 請求項 1に記載の画像情報圧縮方法を実行する画像情報符号化装置と、

前記複数台のカメラによって撮影された同時刻の画像から、前記ユーザーインターフェースによって入力された視点力見た画像を抽出する画像情報抽出部とを有することを特徴とする自由視点テレビシステム。

[17] 前記画像情報抽出部が、前記カメラによって撮影された同時刻の画像であって、前記画像情報復号装置によって復号された画像情報に基づく画像を、前記カメラの配列順に立てて互いに平行に並べて構成された光線空間を、前記ユーザーインターフエースによって入力された視点位置に基づいた面で切断することによって前記視点位置から見た画像情報を抽出することを特徴とする請求項 16に記載の自由視点テレビシステム。

[18] 前記カメラが、直線上に互いに平行な方向を向けて並ぶ直線配置、円周上に円周の内側を向けて並ぶ円周配置、平面上に互いに平行な方向を向けて並ぶ平面配置、球面上に球面の内側を向けて並ぶ球面配置、及び円筒上に円筒の内側を向けて並ぶ円筒配置のいずれかの配置で設置されていることを特徴とする請求項 16に記載の自由視点テレビシステム。

[19] 前記カメラ力直線上に互いに平行な方向を向けて並ぶ直線配置で設置されており、

前記光線空間を切断する前記面が、前記光線空間内の垂直平面であることを特徴とする請求項 17に記載の自由視点テレビシステム。

[20] 前記カメラが、円周上に円周の内側を向けて並ぶ円周配置で設置されており、前記光線空間を切断する前記面が、前記光線空間内の水平平面で正弦波曲線となる面である

ことを特徴とする請求項 17に記載の自由視点テレビシステム。