WO2000021301A1

WO2000021301A1 - Image transform device and method, learning device and method, and recording medium

Info

Publication number: WO2000021301A1
Application number: PCT/JP1999/005495
Authority: WO
Inventors: Tetsujiro Kondo; Naoki Kobayashi; Kenji Takahasi; Yoshinori Watanabe
Original assignee: Sony Corporation
Priority date: 1998-10-05
Filing date: 1999-10-05
Publication date: 2000-04-13
Also published as: EP1037471A1; US6414717B1; EP1037471B1; EP1037471A4

Description

明細書

画像変換装置および方法、学習装置および方法、並びに記録媒体技術分野

この発明は、画像変換装置および方法、学習装置および方法、並びに記録媒体に関し、特に、原画像とほぼ同一の画像を復元できる圧縮画像を生成する画像変換装置および方法、学習装置および方法、並びに記録媒体に関する。

背景技術

本願発明者によって、特開平 1 0— 9 3 9 8 0号公報に開示されているように、低解像度の画像を用いて、高解像度の画像を生成する技術が提案されており、高解像度の原画像を縮小した低解像度画像を用いて原画像とほぼ同一の高解像度画像を復元することができるとされている。この提案においては、例えば第 1図に示すように、低解像度画像（上位階層画像）の注目画素 Iに対応する位置の高解像度画像（復元画像）の画素 iを中心とする 3 X 3個の画素 a乃至 iの画素値を、その近傍に位置する低解像度画像の複数の画素（例えば、 3 X 3個の画素 A乃至 I ) と所定の予測係数との線形 1次結合等を演算することにより求めている。さらに、その復元画像の画素値と原画像の画素値との誤差を演算し、その結果に対応して低解像度画像の画素値、および予測係数の更新を繰り返している。

ところで、上述した従来における低解像度画像の画素値の更新は、 1画素毎に近傍の画素の画素値を固定した条件の下で行われていた。すなわち、図 1に示すように、低解像度画像の注目画素 Iの画素値は、注目画素 Iを中心とする 8個の画素 Aないし Hの画素値、および所定の予測係数の値を固定した条件下において最適な値に更新されていた。したがって、画素 I の画素値を更新した後、画素 Dの画素値を更新した場合、画素 Dは、画素 Iの画素値を更新したときに画素値が固定された画素であるので、先ほど更新された画素 Iの画素値は、更新された画素 Dに対しては最適ではない。よって、低解像度画像（上位階層画像）の画素値を 1画素毎に順次更新した場合、最終的に全画素値が更新された低解像度画像（上位階層画像）は、必ずしも原画像を復元できる最適なものであるとはいえない問題があった。

この問題は、低解像度画像（上位階層画像）の隣接する複数の画素の画素値を、同時に最適な値に更新すれば解決できるが、その演算量は膨大であって、演算に長い時間がかかるとともに、演算回路の規模が大きくなり、実質的には不可能であった。

この発明はこのような状況に鑑みてなされたものであり、隣接する複数の画素の画素値を同時に更新することにより、原画像とほぼ同一の高解像度画像を復元することが可能な低解像度画像を短時間で得ることができるようにするものである。

発明の開示.

請求の範囲 1の発明は、第 1の画像データを、第 1の画像データより低質な第 2の画像データに変換する画像データ変換装置において、第 1 の画像データから、第 2の画像データとほぼ同質な中間画像デ —タを生成する中間画像データ生成部と、

中間画像データを記憶する記憶部と、

中間画像データから、一画面中の一部であるブロック毎の複数の画素データを抽出するプロック抽出部と、

生成され、または予め取得された予測係数を出力する予測係数生成部と、

予測係数と中間画像データと第 1の画像データとに基づいてプロック抽出部で抽出された中間画像データの画素値を更新する画素値更新部と、

画素値更新部で画素値が更新された中間画像データと予測係数とに基づいて、第 1の画像データとほぼ同質な予測画像データを生成する予測画像データ生成部と、

第 1の画像データと予測画像データの誤差を検出する誤差検出部と誤差に基づいて、中間画像データを出力画像とするか否かを決定する制御部とを備えることを特徴とする画像データ変換装置である。請求の範囲 6の発明は、第 1の画像データを、第 1の画像データより低質な第 2の画像データに変換する画像データ変換方法において、第 1の画像データから第 2の画像データとほぼ同質な中間画像データを生成するステップと、

中間画像データから、一画面中の一部であるブロック毎の複数の画素データを抽出するステップと、

生成され、または予め取得された予測係数を出力するステップと、予測係数と中間画像データと第 1の画像データとに基づいてプロック抽出部で抽出された中間画像データの画素値を更新するステップと画素値が更新された中間画像データと予測係数とに基づいて、第 1 の画像データとほぼ同質な予測画像データを生成するステップと、第 1の画像データと予測画像データの誤差を検出するステップと、誤差に基づいて、中間画像データを出力画像とするか否かを決定するステップとを有することを特徴とする画像データ変換方法である。請求の範囲 1 1の発明は、第 1の画像データを、第 1の画像データより低質な第 2の画像データに変換する時に、第 2の画像データの画素値を学習する学習装置において、

第 1の画像データから、第 2の画像データとほぼ同質な中間画像データを生成する中間画像データ生成部と、

中間画像データを記憶する記憶部と、

第 1の画像データと予測画像データの誤差を検出する誤差検出部と誤差に基づいて、中間画像データを出力画像とするか否かを決定する制御部とを備え、

画素値更新部は、予測係数を生徒データとし、対応する第 1の画像データを教師データとして、最小二乗法によって、中間画像データの画素値を更新することを特徴とする学習装置である。

請求の範囲 1 2の発明は、第 1の画像データを、第 1の画像データより低質な第 2の画像データに変換する時に、第 2の画像データの画素値を学習する学習方法において、

第 1の画像データから第 2の画像データとほぼ同質な中間画像データを生成するステップと、中間画像データから、一画面中の一部であるブロック毎の複数の画素データを抽出するステップと、

生成され、または予め取得された予測係数を出力するステップと、予測係数と中間画像データと第 1の画像データとに基づいて抽出された中間画像データの画素値を更新するステップと、

画素値が更新された中間画像データと予測係数とに基づいて、第 1 の画像データとほぼ同質な予測画像データを生成するステップと、第 1の画像データと予測画像データの誤差を検出するステップと、誤差に基づいて、中間画像データを出力画像とするか否かを決定するステップとを備え、

画素値を更新するステップは、予測係数を生徒データとし、対応する第 1の画像データを教師データとして、最小二乗法によって、中間画像データの画素値を更新することを特徴とする学習方法である。請求の範囲 1 3の発明は、第 1の画像データを、第 1の画像データより低質な第 2の画像データに変換する画像データ変換するためのコンピュータ制御可能なプログラムが記録された記録媒体において、プログラムは、

第 1の画像データから第 2の画像データとほぼ同質な中間画像デ一タを生成するステップと、

抽出された中間画像と抽出された中間画像データに対応する位置の第 1の画像データとに基づいて予測係数を生成するステップと、予測係数と中間画像データと第 1の画像データとに基づいて抽出された中間画像データの画素値を更新するステップと、

画素値が更新された中間画像データと予測係数とに基づいて、第 1 の画像データとほぼ同質な予測画像データを生成するステップと、第 1の画像データと予測画像データの誤差を検出するステップと、誤差に基づいて、中間画像データを出力画像とするか否かを決定するステップとからなることを特徴とする記録媒体である。

図面の簡単な説明

第 1図は、先に提案したェンコ一ドを説明するための画素の配列を示す略線図である。

第 2図は、この発明を適用した画像データ変換装置の全体的構成を示すブロック図である。

第 3図は、第 2図中の送信装置の機能的構成例を示すブロック図である。

第 4図は、この発明を適用したエンコーダの構成例を示すプロック図である。

第 5図は、第 4図の予測タップ取得回路 3の処理を説明する図である。

第 6図は、. 予測係数タップを説明する図である。

第 7図は、下位階層画像を説明する図である。

第 8図は、第 4図の画素値更新回路 5の構成例を示すプロック図である。

第 9図は、第 4図のエンコーダの最適画素値生成処理の概略を説明するフローチャートである。

第 1 0図は、第 4図のエンコーダの最適画素値生成処理の一例を説明するフローチャートである。

第 1 1図は、第 4図のエンコーダの最適画素値生成処理の他の例を説明するフローチャートである。

第 1 2図は、第 4図のエンコーダの最適画素値生成処理のさらに他の例を説明するフローチャートである。

第 1 3図は、第 4図のエンコーダにより生成された最適上位画像から原画像を復元するデコーダの構成例を示すプロック図である。第 1 4図は、第 1 3図のデコーダの原画像復元処理を説明するフロ一チャートである。

発明を実施するための最良の形態

以下、この発明の実施の形態を説明する。第 2図は、この発明を適用した画像処理装置の一実施の形態の構成を示している。

送信装置 1 0 1には、ディジタル化された画像データが供給されるようになされている。送信装置 1 0 1は、入力された画像データの複数画素毎の平均値を形成し、複数画素を平均値に置き換えることによつて、データ量を圧縮し、その結果得られる符号化データを光デイスク、磁気テープ等の記録媒体 1 0 2に記録し、または放送回線（衛星放送等）、電話回線、インターネット等の伝送路 1 0 3を介して伝送する。

受信装置 1 0 4は、記録媒体 1 ◦ 2に記録されている符号化データを再生し、または伝送路 1 0 3を介して伝送される符号化データを受信し、符号化データを復号する。すなわち、間引かれた画素の値が復元される。受信装置 1 0 4から得られる復号画像がディスプレイ（図示せず）に供給され、ディスプレイ上に表示される。

第 3図は、送信装置 1 0 1の一例を示す。 I / F (インターフュース） 1 1 1は、外部から供給される画像データの受信処理と、送信機 Z記録装置 1 1 6に対する符号化データの送信処理を行う。 R O M 1 1 2は、 I P L (Initial Program Loading) 用のプログラム等を記憶している。 R A M I 1 3は、外部記憶装置 1 1 5に記録されているシステムプログラム（O S (Operating System) ) やアプリケーションプログラムを記憶したり、また、 C P U 1 1 4の動作に必要なデータを記憶する。

C PU 1 1 4は、 ROM 1 1 2に記憶されている I P Lプログラムに従って外部記憶装置 1 1 5からシステムプログラムおよびアプリケ —シヨンプログラムを RAMI 1 3に展開し、そのシステムプロダラムの制御の下でアプリケーシヨンプログラムを実行する。すなわち、インターフェース 1 1 1から供給される画像データに対して、後述するような符号化処理を行う。

外部記憶装置 1 1 5は、例えばハードディスクであって、システムプログラム、アプリケーションプログラム、データを記憶する。送信機記憶装置 1 1 6は、インタ一フェース 1 1 1から供給される符号化データを記録媒体 1 02に記録し、または伝送路 1 0 3を介して伝送する。インターフェース 1 1 1、 ROM1 1 2、 RAM 1 1 3、 C PU 1 1 4、および外部記憶装置 1 1 5は、バスを介して互いに接続されている。

上述した構成を有する送信装置 1 0 1においては、インターフエ一ス 1 1 1に画像データが供給されると、その画像データが C PU 1 1 4に供給される。 C PU 1 1 4は、画像データを符号化し、その結果得られる符号化データをィンターフェース 1 1 1に供給する。インタ —フェース 1 1 1が符号化データを送信機/記録装置 1 1 6を介して記録媒体 1 02に記録し、または伝送路 1 03に送出する。

第 4図は、送信機 Z記録装置 1 1 6以外の第 3図の送信装置 1 0 1 、すなわち、エンコーダの機能的な構成を示すものである。ェンコ一ダは、ハードウェア、ソフトウェアまたは両者の組み合わせで実現することが可能である。例えば後述するフローチャートに示されるようなェンコ一ド処理のプログラムが格納された記録媒体をドライブに装着することによって、このプログラムを外部記憶装置 1 1 5にインストールし、エンコーダとしての機能を実現できる。

なお、上述したような処理を行うコンピュータプログラムをユーザに提供する記録媒体としては、磁気ディスク、 C D— R O M、固体メモリなどの記録媒体の他、ネットワーク、衛星などの通信媒体を利用することができる。

第 4図に示すエンコーダにおいては、入力される原画像データが画像データが画像縮小回路 1、予測係数演算回路 4、画素値更新回路 5 、および誤差演算回路 7に供給されるようになされている。画像縮小回路 1は、供給された原画像（高解像度画像）を、例えば第 1図に示したように、 3 X 3画素からなるブロックに分割し、各ブロック内の 9画素の画素値の平均値をプロックの中心に位置する上位階層画像（低解像度画像）の画素の画素値として初期上位階層画像を生成し、上位階層画像メモリ 2に出力するようになされている。したがって、上位階層画像（以下、上位画像と記述する）は、原画像の縦および横のサイズが 1 3に縮小されたものとなる。

なお、初期上位画像を形成する場合、平均値以外に、各ブロックの中心に位置する画素の値、各ブロックの複数の画素値の中間値、各ブ口ックの複数の画素値の最も多い値、間引きで形成された画素等を用いても良い。

上位階層画像メモリ 2は、画像縮小回路 1から入力された上位画像を記憶するようになされている。また上位階層画像メモリ 2は、画素値更新回路 5から入力される画素値を用いて、記憶している上位画像の画素値を更新するようになされている。さらに、上位階層画像メモリ 2は、記憶している上位画像データをスィッチ 8を介してフレームメモリ 9に出力するようになされている。予測タップ取得回路 3は、上位階層画像メモリ 2に記憶されている上位画像の画素を、順次、注目画素に決定し、注目画素とその近傍の画素の画素値を予測係数演算回路 4、画素値更新回路 5、およびマツビング回路 6に供給する。

簡単のために、第 5図に示すように、更新画素値ブロック（予測タップ）のサイズが 3 X 3、予測係数タップのサイズが 3 X 3の場合について説明する。なお、更新画素値ブロック（予測タップ）は、予測のために抽出される複数の画素で構成されるプロックを意味する。また、予測係数タップは、予測に使用される複数の係数群を意味する。第 5図中で、 Xは、更新する画素を示し、 Xは、画素値が固定されている画素を示す。また、後述する cが係数を意味し、 Y' が予測値を示し、 Yが原画像の画素値を示す。

例えば、第 5図に示す画素 x5 が注目画素に決定された場合、予測係数演算回路 4には、注目画素 x5 を中心とする 3 X 3画素（画素 X 1 乃至 x9 ) からなる予測タップが供給される。画素値更新回路 5には、注目画素 x5 を中心とする 3 X 3の 9個の画素のいずれかが 3 X 3画素内に含まれる全ての予測タップ（第 5図において破線に囲まれた、注目画素 X 5 を中心とする 7 X 7画素）が供給される。マツピング回路 6には、注目画素 X 5 を中心とする 7 X 7画素から、注目画素 x5 を中心とする 3 X 3画素を除いた 4 0 (- 4 9 - 9 ) 個の画素（画素 XI 乃至 X40) が供給される。

予測係数演算回路 4は、予測タップ取得回路 3から供給された注目画素 x5 を中心とする予測タップ（画素 xl 乃至 x9 ) を学習データ (生徒データ）とし、対応する原画像の画素を教師データとして観測方程式を生成して、最小自乗法により観測方程式を解くことにより、第 6図に示すような、 9モード分（モード 1乃至モード 9) の予測係数を演算して、画素値更新回路 5、およびマッピング回路 6に供給するようになされている。

なお、 3 X 3個の予測係数からなる各モードの予測係数タップは、注目画素に対応する位置の下位階層画像（以下、下位画像と記述する ) の画素を中心とする 3 X 3画素のそれぞれの画素値を予測するときに用いられる。

より具体的には、第 1図の画素の配列において、画素 aを予測する時に使用される予測係数タップがモード 1 の予測係数タップであり、画素 bを予測する時に使用される予測係数タップがモード 2の予測係数タップであり、画素 cを予測する時に使用される予測係数タップがモード 3の予測係数タップであり、画素 hを予測する時に使用される予測係数タップがモード 4の予測係数タップであり、画素 iを予測する時に使用される予測係数タップがモード 5の予測係数タップであり、画素 dを予測する時に使用される予測係数タップがモード 6の予測係数タップであり、画素 gを予測する時に使用される予測係数タップがモード 7の予測係数タップであり、画素 f を予測する時に使用される予測係数タップがモード 8の予測係数タップであり、画素 eを予測する時に使用される予測係数タップがモード 9の予測係数タップである。

第 7図 Aは、第 5図に示した上位画像から予測される下位画像を示している。例えば、モード 1 の予測係数タップ（予測係数 c 11乃至 c 19) と、画素 x 3 を中心とする予測タップを構成する画素（画素 X I I ， X 12, X 13, χ 2 , x 3 ， X 17, χ 5 , χ β , X 21 ) の画素値との線形 1次結合により、注目画素に対応する位置の下位画像の画素（第 7図 Βの画素 Υ 5 ' ) の左上に隣接する画素（第 7図 Βの画素 Y 1 ' ) の画素値が演算される。また、モード 9の予測係数タップ（予測係数 c 91乃至 c 99) と、画素 x 3 を中心とする予測タップを構成する画素の画素値との線形 1次結合により、注目画素に対応する位置の下位画像の画素の右下に隣接する画素（第 7図 Βの画素 Υ 9 ' ) の画素値が演算される。

画素値更新回路 5は、注目画素を中心とする 3 X 3画素の画素値を同時に更新し、更新した画素値を上位階層画像メモリ 2、およびマツビング回路 6に出力するようになされている。

第 8図は、画素値更新回路 5の詳細な構成例を示している。正規方程式生成回路 1 1は、予測係数演算回路 4から入力された予測係数、予測タップ取得回路 3から入力された予測タップを構成する画素の画素値、原画像の対応する画素値を用いて、予測値と真値（原画像の画素値）より正規方程式を生成し、画素値決定回路 1 2に出力するようになされている。画素値決定回路 1 2は、入力された正規方程式によつて予測値と真値との誤差を最小とする、上位画像の注目画素を中心とする 3 X 3画素の画素値（更新値）を同時に演算するようになされている。以下においては、同時に更新される 9個の画素を更新画素値タップと記述する。

ここで、生成される正規方程式について説明する。正規方程式は、更新画素値タップと予測係数タップが部分的に重なる範囲の画素値を用いて生成される。例えば、第 5図に示した画素 χ 5 を中心とする 3 Χ 3画素（画素 x l 乃至 x 9 ) の画素値を更新する（更新画素値タツプとする）場合、破線で囲まれた領域中の更新画素値タップ以外の画素（画素 X I 乃至 X 40) の画素値、および全ての予測係数 c l 1 乃至 c 99を固定し、予測係数タップを、破線で囲まれた領域内で移動して下位画像の画素値を予測する。

例えば、予測係数タップの中心が画素 x 3 と重なる位置に移動されたときにおいては、モード 1の予測係数タップ（予測係数 c 11乃至 c 19) と、画素 x3 を中心とする 3 X 3画素（画素 XII, X12, X13, χ2 , x3 , X17, χ5 ， χ6 , X21) との画素値の線形 1次結合で、画素 χ3 の位置に対応する下位画像の画素 Υ5 ' の左上の画素 Y1 ' の画素値（予測値）が演算される。この画素値 ΥΓは、次式（1 ) で表すことができる。

ΥΓ - c 11X11 + c 12X12 + c 13X13 + c 14 x 2+ c 15 x 31 c 16X17

+ c 17x5+ c 18x6+ c 19X21

… - (1 ) 同様に、画素値 Y2 ' 乃至 Υ9 ' も、予測係数と上位画像の画素値との線形 1次結合で表し、得られた 9本の式を行列を用いて書き換えれば、次式のような観測方程式が成立する。

Y' = c X

ただし、 Y' は画素値 Y1 ，乃至 Υ9 ' の集合で成る行列であり、 c は予測係数 c ll乃至 c99の集合で成る行列であり、 Xは上位画像の画素値の集合で成る行列である。

次に、この観測方程式に最小二乗法を適用して、原画像の画素値に近い予測値 Y' を求めることを考える。

ここで、再び観測方程式の元となった式（ 1 ) に注目すれば、予測値 Y1 ' と、対応する原画像の画素値 Y1 との差は、次式（2) に示すようになる。

Yl-Yl' =Y1 - (c llXll + c 12X12 + c 13X13 + c 14x2

+ c 15x3+ c 16X17 + c 17 x5- c 18x6+ c 19X21)

• · · ( 2) 式（2) の右辺を整理すれば、次式（3) を得る。

Yl-Yl' =Y1 -（c llXll + c 12X12 + c 13X13 + c 16X17 + c 19X21) -( c 14x2+ c 15 x 3+ c 17 x 5+ c 18 x6)

• · · (3) 予測値 Yl ' と、対応する原画像の画素値 Yl との差、すなわち式 (3) の左辺を残差とし、右辺の定数項を左辺に移項して整理すれば、次式（4) を得る。

Yl -( c 11X11 I c 12X12 + c 13X13 + c 16X17 + c 19X21)1 e 1 = (c 14x21 c 15x3+ c 17x5+ c 18x6)

• · · (4) さらに、予測係数タップの他のモード（モ一ド 2乃至モード 9) を用いて、 Yn - Υη ' (ηは 2乃至 9) からも、式（4) と同様の次式（5) 乃至（1 2) を得る。

Υ2 -( c 21X11 + c 22X12 + c 23X13 + c 26X17 + c 29X21)+ e 2 = (c2 x2+c25x3+c27x5+c28x6)

• · · (5) Y3 -(c 31X11 + c 32X12 + c 33X13 + c 36X17 + c 39X21)+ e3 = ( c 34 x 2+ c 35 x 3+ c 37 x 5+ c 38 x 6)

• · · (6)

Y4 -( c 41X11 + c 42X12 + c 43X13 + c 46X17 + c 49X21)+ e4

= ( c 44 x 2+ c 45 x 3+ c 47 x 5+ c 48 x 6)

· · · ( 7)

Y5 -( c 51X11 I c 52X12 I c 53X13 + c 56X17 + c 59X21) + e 5

= ( c 54 x 2+ c 55 x 3+ c 57 x 5+ c 58 x 6)

• · · (8)

Y6 -( c 61X11 + c 62X12 + c 63X13 + c 66X17 + c 69X21)+ e 6 = (c64x2+c65 3+ c67x5+ c68x6)

• · · (9) Y7 -( c 71X11 + c 72X12 + c 73X13 + c 76X17 + c 79X21)+ e 7 = (c 74x2+ c 75x3+ c 77x5+ c 78x6)

• · · ( 1 0)

Y8 -( c 81X11 + c 82X12 + c 83X13 + c 86X17 +c89X21) + e8 = ( c 84 x 2+ c 85 x 3+ c 87 x 5+ c 88 x 6)

• · · ( 1 1 )

Y9 -(c 91X11 + c 92X12 + c 93X13 + c 96X17 + c 99X21) + e 9 = ( c 94 x 21 c 95 x 3+ c 97 x 5+ c 98 x 6)

• · · ( 1 2) 同様に、予測係数タップの位置を、第 5図の破線で囲まれた領域内で移動し、すなわち、予測係数タップの中心を、画素 X9 ， X13, X 28, X32を頂点とする矩形領域内の全ての画素（2 5画素）と順次重なるように移動し、予測係数タップの全てのモードを用いて、 2 2 5 (= 9 2 5) 本の式（4) 乃至（ 1 2) と同様な式を得る。

この 2 2 5本の式を行列で表せば、次式（ 1 3) に示すような、 [ 教師データ] + [残差 e ] = [学習データ c ] X [予測画素値 X ] の形をした残差方程式となる。

•

V \

~ ^C\\^A\\ ^^C[2^A\2 ^{+ c}13^13 + c₁₆A₁₇十 ^C\9^A2\) ^ek+l ' γ₂ - (^C21 + c₂₂A_I2 + ^c23 13 ⁺ 26^17

- (^c3i υ ⁺

Y4 - (^c41 1】 ^{+ C}42^12 ^{+ c}43 3 + ^c46^17 + c₄₉X_2x; ^ek₊4

Y5 -、 ^c51 11 ^C52 ^{+ C}53^13 + ^α56^Λ\Ί ^{+ C}59^2l) + ^ek+5

Υβ -、 ^C61 11 + ^C62^12 ^{+ C}63^13 + ^C66^17 + ^c69 21) ^ek+6

-、 ^c71 1 ^{+ C}72 2 ^{+ c}73^13 ^{+ C}76^17 + c_{79 2}i) ^ek ₊ 1 一 °8 11 ^{+ C}82 + C₈₃ v₁₃ + c_{86 7} + ^c ₈ ^2l) ^ek+&

Y9 -[c_9lX_u +

^ek+9

0 ^c14 Cl5 0 ^c17 ^C18 0 0 0 x\

0 ^c24 C₂5 0 27 ^c28 0 0 0 ズ 2

0 C₃4 C35 0 ^c37 ^c38 0 0 0 3

0 ^c44 45 0 ^c47 ^c48 0 0 0 ズ 4

0 ^c54 C55 0 C57 ^C58 0 0 0 5

0 ^c64 C₆5 0 ^c67 ^c68 0 0 0 ズ 6

0 4 ^75 0 7 ^c78 0 0 0 ズ 7

0 ^c84 ^c85 0 ^c87 ^c88 0 0 0 Γ₈

0 ^c94 ^c95 0 ^c97 ^c 8 0 0 0 X ₉

ただし、式（ 1 3) は、表記を簡略化するために、式（4) 乃至（ 1 2) に対応する部分だけを示している。また、 a ij ( i = l， 2， • • •， m (= 2 2 5) 、 j = l , 2， · ' ·， 9) は、行列 [学習データ c ] の i行 j列に存在するデータに等しい。

この場合、原画像の画素値 Yに近い予測値 Y，を求めるための予測画素値 xi は、自乗誤差

を最小にすることで求めることができる。

したがって、上述した自乗誤差を予測画素値 xi で微分したものが 0になる場合、すなわち、次式を満たす予測画素値 xi 、原画像の画素値 Yに近い予測値 Y' を求めるための最適値となる。

de de ■(15)

そこで、まず、式（ 1 3 ) を予測画素値 χ i で微分することにより、次式が成立する。 = = (16

«,1 ",2, · · ·，^" = ^ai,リ '••

9 ι'二—土，¹^，、，^m,''')ノ )

9

式（ 1 4) および式（ 1 6) より、式（ 1 7) が得られる

さらに、式（1 3) の教師データ（原画像の画素値 Y—定数項）を Y，，とし、教師データ Y' ' 、予測係数 (：、予測画素値 χ、および残差 eの関係を考慮すると、式（ 1 7) から、次式（ 1 8) のような正規方程式を得ことができる。

m m

=1 =1

(∑ ^ai9^an)^xi + (∑ a_{i9 i2})x₂ + ··· + (∑ a_l9a_i9 )x₉ = ( α ₎Υ- )

,=i =1

■(18) 得られた正規方程式を、例えば、掃き出し法（Gauss-Jordanの消去法）などを適用して解くことにより、予測係数演算回路 4から供給された予測係数タップに対応する、更新画素値タップの最適な画素値を求めることができる。

第 4図の説明に戻る。マッピング回路 6は、画素値更新回路 5から供給された注目画素を中心とする更新画素値タップの 9個の画素の画素値、予測タップ取得回路 3から供給された、注目画素を中心とする 7 X 7画素から注目画素を中心とする 3 X 3画素を除いた 4 0個の画素の画素値、および予測係数演算回路 4から入力された 9モード分の予測係数タップの予測係数を線形 1次結合することにより、下位画像の画素値を部分的に（更新画素値タップの画素が影響する範囲を）口一カルデコ一ドする。ローカルデコ一ドされた下位画像の画素値は誤差演算回路 7に供給されるようになされている。

誤差演算回路 7は、マツビング回路 6からのローカルデコ一ドされた下位画像の画素値と、原画像の対応する画素値との誤差を演算する。以下の説明では、誤差として S/N を用いる。 S/N =201og , o (255/e rr) (err :誤差の標準偏差）の関係にある。 S/N が閾値以上である場合には、最適な画素が生成されたと判断して、スィッチ 8をオンに制御するようになされている。この場合、部分的にローカルデコードした画像で S/N を評価する代えて、画像全体にわたって S/N を評価するようにしても良い。

フレームメモリ 9は、上位階層画像メモリ 2からスィッチ 8を介して入力される、部分的に最適化された上位画像を、入力される度に更新して記憶するようになされている。したがって、上位階層画像メモリ 2に記憶されている上位画像の全ての画素が注目画素とされた後、フレームメモリ 9には、全ての画素が最適化された最適上位画像が記憶されるよ .うになされている。

フレームメモリ 9に記憶された最適上位画像は、 9モード分の予測係数タップとともに所定のタイミングでデコーダ（第 1 3図を参照して後述する）に出力されるようになされている。以下に説明するェンコーダの処理を制御するために、制御部 1 0が設けられている。制御部 1 0は、誤差演算回路 7の出力を受け取り、スィッチ 8を制御する信号を発生する。また、エンコーダの処理を行うために、各ブロックに対して種々の制御信号を供給する。

次に、このエンコーダの最適上位画素値生成処理の概略について、第 9図のフローチャートを参照して説明する。以下に説明する処理は、第 4図の構成と対応して説明されている。しかしながら、第 4図の構成を有するハードウエアにより実現されるものに限らず、外部からインストールされ、または第 3図中の ROM1 1 2に格納されているソフトウエアプログラムに従って C PU 1 1 4が行うようにしても良レ、。その場合には、各ステップの処理は、ソフトウェアプログラムに従って C PU 1 1 4の制御の下でなされる。

ステップ S 1において、画像縮小回路 1は、供給された原画像（高解像度画像）を、 3 X 3画素からなるブロックに分割し、各ブロック内の 9画素の画素値の平均値をブロックの中心に位置する上位画像（低解像度画像）の画素の画素値として初期上位画像を生成し、上位階層画像メモリ 2に記憶させる。

予測タップ取得回路 3は、上位階層画像メモリ 2に記憶されている上位画像の画素を、順次、注目画素に決定して、上位階層画像メモリ 2から注目画素を中心とする 7 X 7画素の画素値を取得する。取得した 4 9個の画素値のうちの注目画素を中心とする 3 X 3画素の画素値は、予測係数演算回路 4に供給される。また、画素値更新回路 5には、取得した全ての画素値が供給される。さらに、取得した 4 9個の画素値のうちの注目画素を中心とする 3 X 3画素を除いた 40 (- 4 9 — 9) 個の画素の画素値がマッピング回路 6に供給される。例えば、第 5図に示す画素 x5 が注目画素に決定された場合、注目画素 x5 を中心とする 3 X 3画素（画素 xl 乃至 x9 ) の予測係数タップの画素値は、予測係数演算回路 4に供給され、注目画素 x5 を中心とする 7 X 7画素の画素値は、画素値更新回路 5に供給され、注目画素 x5 を中心とする 7 X 7画素から注目画素 X 5 を中心とする 3 X 3画素を除いた 40 (=4 9 - 9) 画素の画素値は、マッピング回路 6に供給される。

ステップ S 2において、予測係数演算回路 4は、予測タップ取得回路 3から供給された注目画素を中心とする 3 X 3画素の予測タップを学習データ（生徒データ）とし、対応する原画像の画素を教師データとして観測方程式を生成し、最小自乗法を適用して解くことにより 9 モード分の予測係数タップを求め、画素値更新回路 5、およびマツピング回路 6に供給する。予測係数う求める時には、画面中の全画素について方程式をたてるようになされる。

ステップ S 3において、画素値更新回路 5の正規方程式生成回路 1 1は、予測係数演算回路 4から入力された予測係数タップ、予測タツプ取得回路 3から供給された注目画素を中心とする 7 X 7画素の画素値、および原画像の対応する画素値を用いて、式（ 1 3 ) に示すような観測方程式を生成して、画素値決定回路 1 2に出力する。画素値決定回路 1 2は、入力された観測方程式に最小自乗法を適用して解き、得られた更新画素値タップの画素値を上位階層画像メモリ 2、およびマッビング回路 6に出力する。

上位階層画像メモリ 2は、画素値更新回路 5から入力された更新画素値タップの画素値を用いて、いままで記憶していた上位画像の対応する画素の画素値を更新する。マッピング回路 6は、画素値更新回路 5から入力された更新画素値タップの画素値、予測タップ取得回路 3 から入力された、注目画素を中心とする 7 X 7画素から注目画素を中心とする 3 X 3画素を除いた 4 0画素の画素値、および予測係数演算回路 4から入力された 9モード分の予測係数タップとの線形 1次結合を演算して、下位画像の画素値を部分的にローカルデコードする。口一カルデコードされた下位画像の画素値は、誤差演算回路 7に供給される。

ステップ S 4において、誤差演算回路 7は、マッピング回路 6からのローカルデコードされた下位画像の画素値と、原画像の対応する画素値との S/N を演算し、 S/N が所定の閾値以上であるか否かを判定する。 S/N が所定の閾値以上ではないと判定された場合、ステップ S 2 乃至 S 4の処理が繰り返される。 S/N が所定の閾値以上であると判定された場合、ステップ S 5に進む。

ステップ S 5において、誤差演算回路 7の制御によりスィッチ 8がオンとされ、上位階層画像メモリ 2からスィッチ 8を介してフレームメモリ 9に部分的に最適化された上位画像が出力される。

この最適上位画素値生成処理を、上位階層画像メモリ 2に記憶されている上位画像の全ての画素に対して実行することにより、フレームメモリ 9には、全ての画素が最適化された最適上位画像が記憶される

。記憶された最適上位画像は、 9モード分の予測係数タップとともに所定のタイミングでデコーダに出力される。

第 9図のエンコーダの処理についての幾つかの例について説明する

。第 1 0図のフローチャートに示す第 1の方式は、 1回の予測係数の更新に対して、各画素 1回の更新を行う例である。

ステップ S 2 1において、エンコーダは、原画像を縮小処理することによって、上位画像を生成する。そして、エンコーダは、画面全体の全画素の予測係数を更新する（ステップ S 2 2 ) 。次のステップ S

2 3において、エンコーダは、ブロック（更新画素値タップと同義である）の画素値を更新する。ステップ S 2 4では、全ブロックの処理が終了したかどうかが決定され、若し、終了していないならば、ステップ S 2 2に戻り、処理が繰り返される。

ステップ S 2 4において、全ブロックの画素値の更新が終了したと決定されると、エンコーダは、更新後の上位画像をマッピング（ローカルデコード）して、下位画像との誤差を示す S/N を計算する（ステップ S 2 5 ) 。ステップ S 2 6では、エンコーダは、 S/N が閾値以上かどうかが決定される。 S/N が閾値以上であれば、フレームメモリ 9 に更新後の上位画像を出力し、また、予測係数を出力する（ステップ S 2 7 ) 。若し、ステップ S 2 6において、 S/N が閾値より小であれば、ステップ S 2 2に戻り、ステップ S 2 2以降の処理を繰り返す。第 1 1図は、第 2の方式を示すフローチャートである。第 2の方式は、 1回の予測係数の更新に対して、 1ブロックのみ画素値を更新するものである。したがって、全ブロックの画素値の更新が終了していないときに、処理がステップ S 2 3 (画素値の更新）ではなく、ステップ S 2 2の全画面の予測係数の更新処理に戾る点のみが、第 1 0図のプロ一チャートと相違する。

さらに、第 1 2図は、第 3の方式を示すフローチャートである。第 3の方式では、更新画素値の評価を予測係数の更新後と、画素値の更新後のそれぞれで行うものである。

第 1 2図で、原画像の縮小処理（ステップ S 3 1 ) の後に、全画素の予測係数の更新がなされる（ステップ S 3 2 ) 。エンコーダは、更新後の上位画像をマッピングして、下位画像との誤差である S/N を計算する（ステップ S 3 3 ) 。ステップ S 3 4では、 S/N が閾値以上かどうかが決定される。 S/N が閾値以上であれば、エンコーダは、フレームメモリ 9に更新後の上位画像を出力し、また、予測係数を出力する（ステップ S 3 5 ) 。

若し、ステップ S 3 4において、 S/N が閾値より小であれば、ステップ S 3 6に移り、ステップ S 3 6において、エンコーダは、ブロックの画素値を更新する。ステップ S 3 7では、全ブロックの処理が終了したかどうかが決定され、若し、終了していないならば、ステップ S 3 6に戻り、処理が繰り返される。

ステップ S 3 7において、全プロックの画素値の更新が終了したと決定されると、エンコーダは、更新後の上位画像をマッピングして、下位画像との誤差である S/N を計算する（ステップ S 3 8 ) 。ステツプ S 3 9では、 S/N が閾値以上かどうかが決定される。 S/N が閾値以上であれば、エンコーダは、フレームメモリ 9に更新後の上位画像を出力し、また、予測係数を出力する（ステップ S 3 5 ) 。若し、ステップ S 3 9において、 S/N が閾値より小であれば、ステップ S 3 2に戻り、上述したステップ S 3 2以降の処理を繰り返す。

上述したこの発明の一実施形態では、予測係数および上位画像の画素値の両方を最適化するようにしている。しかしながら、この発明においては、予め予測係数を求めておくことによって、画素値のみを最適化することも可能である。この場合、予測係数は、係数決定用のディジタル画像を使用して、エンコーダにおける予測係数生成処理と同様の処理を行うことによって予め生成されている。また、この予測係数は、エンコーダおよびデコーダにおいて共用されるので、記録媒体への記録または伝送が不要である。

次に、エンコーダから出力された最適上位画像から原画像を復元する（下位画像を予測する）デコーダの構成例について、第 1 3図を参照して説明する。このデコーダにおいては、エンコーダから入力された最適上位画像は、最適上位階層画像メモリ 2 1に記憶され、 9モード分の予測係数タップは、マッピング回路 2 3に供給されるようになされている。

予測タップ取得回路 2 2は、最適上位階層画像メモリ 2 1に記憶されている最適上位画像の画素を、順次、注目画素に決定し、最適上位階層画像メモリ 2 1から注目画素を中心とする 3 X 3画素の予測タップを取得してマツビング回路 2 3に出力するようになされている。マツビング回路 2 3は、予測タップ取得回路 2 2から入力された予測タップをなす 9個の画素の画素値と、エンコーダから供給された 9 モード分の予測係数タップとの線形 1次結合を演算することにより、注目画素の位置に対応する下位画像の画素を中心とする 3 X 3画素の画素値を予測する（原画像の画素を復元する）。予測された下位画像の 3 X 3画素の画素値は、フレームメモリ 2 4に出力され、記憶されるようになされている。フレームメモリ 2 4に記憶された下位画像の画素値は、フレーム毎に所定のタイミングで図示せぬディスプレイ等に出力されるようになされている。

このデコーダの原画像復元処理について、第 1 4図にフローチヤ一トを参照して説明する。この原画像復元処理は、エンコーダにより生成された最適上位画像が最適上位階層画像メモリ 2 1に記憶され、 9 モード分の予測係数タップが、マツビング回路 2 3に供給された後、開始される。

ステップ S I 1において、予測タップ取得回路 2 2は、最適上位階層画像メモリ 2 1に記憶されている最適上位画像の画素のうちの 1個の画素を注目画素に決定する。ステップ S 1 2において、予測タップ取得回路 2 2は、最適上位階層画像メモリ 2 1から注目画素を中心とする 3 X 3画素の予測タップを取得してマツビング回路 2 3に出力する。

ステップ S 1 3において、マッピング回路 2 3は、予測タップ取得回路 2 2から入力された予測タップをなす 9個の画素の画素値と、ェンコーダから供給された 9モード分の予測係数タップとの線形 1次結合を演算することにより、注目画素の位置に対応する下位画像の画素を中心とする 3 X 3画素の画素値を予測する（原画像の画素を復元する）。予測された下位画像の 3 X 3画素の画素値は、フレームメモリ 2 4に出力され、記憶される。ステップ S I 4において、予測タップ取得回路 2 2は、最適上位階層画像メモリ 2 1に記憶されている最適上位画像の全ての画素を注目画素に決定したか否かを判定し、全ての画素を注目画素に決定したと判定するまで、ステップ S 1 1乃至 S 1 4の処理が繰り返される。全ての画素を注目画素に決定したと判定された場合、ステップ S 1 5に進む。

ステップ S 1 5において、フレームメモリ 2 4に記憶された下位画像の画素値は、フレーム毎に所定のタイミングで図示せぬディスプレィ等に出力される。

本実施の形態によれば、従来の方法に比べて、復元した画像の S/N が大きい上位画像を得ることができる。

以上のように、この発明によれば、複数画素の画素値を同時に、ブロック単位で最適化することができる。それによつて、処理を単純化することができ、また、処理時間を短縮できる。

Claims

請求の範囲

1 . 第 1の画像データを、上記第 1の画像データより低質な第 2の画像データに変換する画像データ変換装置において、

上記第 1の画像データから、上記第 2の画像データとほぼ同質な中間画像データを生成する中間画像データ生成部と、

上記中間画像データを記憶する記憶部と、

上記中間画像データから、一画面中の一部であるブロック毎の複数の画素データを抽出するプロック抽出部と、

上記予測係数と上記中間画像データと上記第 1の画像データとに基づいて上記ブロック抽出部で抽出された中間画像データの画素値を更新する画素値更新部と、

上記画素値更新部で画素値が更新された中間画像データと上記予測係数とに基づいて、上記第 1の画像データとほぼ同質な予測画像データを生成する予測画像デ一タ生成部と、

上記第 1の画像データと上記予測画像データの誤差を検出する誤差検出部と、

上記誤差に基づいて、上記中間画像データを出力画像とするか否かを決定する制御部とを備えることを特徴とする画像データ変換装置。

2 . 上記予測係数生成部は、上記ブロック抽出部で抽出された中間画像と上記抽出された中間画像データに対応する位置の第 1の画像データとに基づいて予測係数を生成することを特徴とする請求の範囲 1に記載の画像データ変換装置。

3 . 上記誤差検出部は、一画面分の上記第 1の画像データと一画面分の上記予測画素データとの誤差を検出することを特徴とする請求の範囲 1に記載の画像データ変換装置。

4 . 上記画素値更新部は、

上記予測係数と上記中間画像データと上記第 1の画像データとに基づいて、正規方程式を生成する正規方程式生成部と、

上記正規方程式を解くことにより上記中間画像データの更新された画素値を決定する画素値決定部とを備えることを特徴とする請求の範囲 1に記載の画像データ変換装置。

5 . 上記画素値決定部は、最小二乗法を用いて上記正規方程式を解くことを特徴とする請求の範囲 3に記載の画像データ変換装置。

6 . 第 1の画像データを、上記第 1の画像データより低質な第 2の画像データに変換する画像データ変換方法において、

第 1の画像データから第 2の画像データとほぼ同質な中間画像データを生成するステップと、

上記中間画像データから、一画面中の一部であるブロック毎の複数の画素データを抽出するステップと、

生成され、または予め取得された予測係数を出力するステップと、上記予測係数と上記中間画像データと上記第 1の画像データとに基づいて上記プロック抽出部で抽出された中間画像データの画素値を更新するステップと、

上記画素値が更新された中間画像データと上記予測係数とに基づいて、上記第 1の画像データとほぼ同質な予測画像データを生成するステツプと、

上記第 1の画像データと上記予測画像データの誤差を検出するステップと、

上記誤差に基づいて、上記中間画像データを出力画像とするか否かを決定するステップとを有することを特徴とする画像データ変換方法

7 . 予測係数を出力するステップは、抽出された中間画像と上記抽出された中間画像データに対応する位置の第 1の画像データとに基づいて生成することを特徴とする請求の範囲 6に記載の画像データ変換方法。

8 . 上記誤差を検出するステップは、一画面分の上記第 1の画像デ一タと一画面分の上記予測画素データとの誤差を検出することを特徴とする請求の範囲 6に記載の画像データ変換方法。

9 . 上記画素値を更新するステップは、

上記予測係数と上記中間画像データと上記第 1 の画像データとに基づいて、正規方程式を生成するステップと、

上記正規方程式を解くことにより上記中間画像データの更新された画素値を決定するステップとからなることを特徴とする請求の範囲 6 に記載の画像データ変換方法。

1 0 . 上記画素値を決定するステップは、最小二乗法を用いて上記正規方程式を解くことを特徴とする請求の範囲 8に記載の画像データ変換方法。

1 1 . 第 1の画像データを、上記第 1の画像データより低質な第 2の画像データに変換する時に、上記第 2の画像データの画素値を学習する学習装置において、

上記第 1 の画像データから、上記第 2の画像データとほぼ同質な中間画像データを生成する中間画像データ生成部と、

上記中間画像データを記憶する記憶部と、

上記中間画像データから、一画面中の一部であるプロック毎の複数の画素データを抽出するブロック抽出部と、

上記予測係数と上記中間画像データと上記第 1の画像データとに基づいて上記プロック抽出部で抽出された中間画像データの画素値を更新する画素値更新部と、

上記画素値更新部で画素値が更新された中間画像データと上記予測係数とに基づいて、上記第 1の画像データとほぼ同質な予測画像データを生成する予測画像データ生成部と、

上記誤差に基づいて、上記中間画像データを出力画像とするか否かを決定する制御部とを備え、

上記画素値更新部は、上記予測係数を生徒データとし、対応する上記第 1の画像データを教師データとして、最小二乗法によって、上記中間画像データの画素値を更新することを特徴とする学習装置。

1 2 . 第 1の画像データを、上記第 1の画像データより低質な第 2の画像データに変換する時に、上記第 2の画像データの画素値を学習する学習方法において、

生成され、または予め取得された予測係数を出力するステップと、上記予測係数と上記中間画像データと上記第 1の画像データとに基づいて抽出された中間画像データの画素値を更新するステップと、上記画素値が更新された中間画像データと上記予測係数とに基づいて、上記第 1の画像データとほぼ同質な予測画像データを生成するステップと、

上記誤差に基づいて、上記中間画像データを出力画像とするか否かを決定するステップとを備え、

画素値を更新するステップは、上記予測係数を生徒データとし、対応する上記第 1の画像データを教師データとして、最小二乗法によつて、上記中間画像データの画素値を更新することを特徴とする学習方法。

1 3 . 第 1の画像データを、上記第 1の画像データより低質な第 2の画像データに変換する画像データ変換するためのコンピュータ制御可能なプログラムが記録された記録媒体において、

上記プログラムは、

上記抽出された中間画像と上記抽出された中間画像データに対応する位置の第 1の画像データとに基づいて予測係数を生成するステップと、

上記予測係数と上記中間画像データと上記第 1の画像デ一タとに基づいて上記抽出された中間画像データの画素値を更新するステップと上記画素値が更新された中間画像データと上記予測係数とに基づいて、上記第 1の画像データとほぼ同質な予測画像データを生成するステツプと、上記第 1の画像データと上記予測画像データの誤差を検出するステップと、

上記誤差に基づいて、上記中間画像データを出力画像とするか否かを決定するステップとからなることを特徴とする記録媒体。