WO2011024602A1 - 画像符号化装置および画像復号装置 - Google Patents

画像符号化装置および画像復号装置 Download PDF

Info

Publication number
WO2011024602A1
WO2011024602A1 PCT/JP2010/062889 JP2010062889W WO2011024602A1 WO 2011024602 A1 WO2011024602 A1 WO 2011024602A1 JP 2010062889 W JP2010062889 W JP 2010062889W WO 2011024602 A1 WO2011024602 A1 WO 2011024602A1
Authority
WO
WIPO (PCT)
Prior art keywords
unit
mode
prediction
conversion
scan
Prior art date
Application number
PCT/JP2010/062889
Other languages
English (en)
French (fr)
Inventor
知宏 猪飼
Original Assignee
シャープ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by シャープ株式会社 filed Critical シャープ株式会社
Priority to EP10811653A priority Critical patent/EP2472872A1/en
Priority to US13/392,386 priority patent/US20120195515A1/en
Priority to JP2011528721A priority patent/JPWO2011024602A1/ja
Priority to CN2010800377633A priority patent/CN102484720A/zh
Publication of WO2011024602A1 publication Critical patent/WO2011024602A1/ja

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Definitions

  • the present invention relates to an image encoding apparatus that encodes an image and outputs encoded data, and an image decoding apparatus that decodes code data encoded by the image encoding apparatus.
  • Image coding technology is applied to many familiar video devices, from television receivers to mobile phones capable of image processing.
  • image data is divided into a plurality of blocks, and coding is performed in units of divided blocks.
  • block unit coding the generation of a prediction signal close to the input signal, the calculation of the residual signal that is the difference between the input signal and the prediction signal, the conversion of the calculated residual signal, and the quantization of the transform coefficient obtained by the conversion.
  • coding processing such as scanning of the quantized transform coefficient (scanning) and variable length coding of the quantized / scanned transform coefficient is performed.
  • information indicating a prediction signal generation method is encoded in addition to the transform coefficient.
  • the prediction signal generation method includes intra-screen prediction generated using a reproduced image around the target block and inter-screen prediction generated using a reproduced image of an already encoded / decoded frame.
  • In-screen prediction includes a plurality of prediction modes such as DC prediction, horizontal prediction, and vertical prediction, and information indicating which prediction mode is used is encoded as a flag.
  • inter-frame prediction a frame ID for specifying a reference frame used for prediction, and a position and a motion vector in the frame are encoded by a flag.
  • the encoding method of the flag includes the following, for example, the prediction mode in intra prediction is the method (2), and the motion vector in inter prediction is encoded as the difference from the prediction vector by the method (3). It becomes.
  • a method of encoding as it is.
  • a method for selecting an optimum method from a plurality of methods (modes) prepared in advance and encoding a flag for mode identification is a general method.
  • a scan method, a conversion method, and a variable length are used. It is used in encoding tables.
  • Japanese Patent Application Laid-Open No. 2004-228561 discloses a technique for determining a predicted image using a prediction image without explicitly encoding a flag indicating a scanning method. For example, the horizontal edge of the predicted image is compared with the vertical edge, and if more horizontal edges are included than the vertical edges, the horizontal edge is used and the vertical edge is used as the horizontal edge. If more are included, a scanning method giving priority to the vertical direction is used.
  • the video encoding device generates a determination formula for determining whether there are more vertical edges or horizontal edges and stores it in the encoded stream, and the video decoding device stores it in the encoded stream. Decoding is performed using the scanning method determined by the determined determination formula.
  • Patent Document 2 discloses a technique for determining a conversion method using encoded data that has already been decoded without explicitly encoding a flag indicating the conversion method. That is, the conversion method is determined based on the quantization parameter, the encoding mode, and the number of motion vectors in the encoded data.
  • Non-Patent Document 1 is a technique for reducing the code amount of a motion vector, which is a flag for inter-screen prediction, and is obtained by dequantizing a decoded transform coefficient and a residual signal decoded by inverse transform and a block in a reference frame. The amount of code of the flag is reduced by estimating the motion vector by matching.
  • Patent Document 1 and Patent Document 2 a flag indicating a scan method and a conversion method is used without being explicitly encoded and estimated. However, in these methods, unlike the method of explicitly encoding a flag, the mode determined by estimation may be inappropriate, and in this case, the code amount may increase.
  • Non-Patent Document 1 calculates a prediction vector with high accuracy by estimating the motion vector using information on the transform coefficient of the target block, and reduces the code amount of the motion vector. Although this technique considers the characteristics of transform coefficients, motion vector estimation using a residual signal is effective only when the transform coefficients are particularly large. Moreover, since matching is performed in the decoding device using information obtained from the transform coefficients, the calculation load is extremely high.
  • the mode is estimated without using the characteristics of the transform coefficient, so the mode estimation accuracy is low and the coding efficiency is low.
  • the coding efficiency is lowered because the mode is limited to one estimated even when the effect of mode switching is large. Even when the effect of mode switching is small, the encoding efficiency is lowered because the flag for identifying the mode to be used is encoded.
  • the present invention has been made in consideration of the above-described situation, and an image encoding device and an image decoding device that improve mode estimation accuracy and encoding efficiency by using the characteristics of transform coefficients.
  • the purpose is to provide.
  • an image encoding device blocks an input signal, generates a prediction signal of the input signal in units of the block, and a residual between the input signal and the prediction signal
  • a transform unit that transforms a signal to calculate a transform coefficient; a quantization unit that quantizes the transform coefficient; a scan unit that arranges the transformed transform coefficients in a one-dimensional manner; and codes the scanned transform coefficients
  • An image coding apparatus that includes a variable-length coding unit that generates coded data and includes any one of the following configurations (1) to (3).
  • the image coding apparatus includes a transform coefficient evaluation unit that calculates an evaluation value based on characteristics of the transform coefficient, and the prediction unit, the conversion unit, or the scan unit according to the evaluation value.
  • a mode estimation unit that estimates a mode to be used, a mode restriction unit that limits a range of selectable modes used in the prediction unit, the conversion unit, or the scan unit according to the evaluation value; and
  • a mode selection unit that selects a mode having a minimum encoding cost from predetermined modes within a range, and the mode selection unit is used in the prediction unit, the conversion unit, or the scan unit.
  • the prediction unit, the transform unit, the quantization unit, the scan unit, and the variable length coding unit are operated on the input signal while switching the mode.
  • the image coding apparatus of the present invention includes a transform coefficient evaluation unit that calculates an evaluation value based on the characteristics of the transform coefficient, and the prediction unit, the conversion unit, or the scan unit according to the evaluation value.
  • a mode restriction unit that limits a range of selectable modes to be used, and a mode selection unit that selects a mode with the lowest encoding cost from among predetermined modes within the range of selectable modes,
  • the mode selection unit is configured to switch the predetermined mode used in the prediction unit, the conversion unit, or the scan unit, while the prediction unit, the conversion unit, the quantization unit, the scan unit,
  • the variable length coding unit is operated, and the mode that minimizes the coding cost is selected using the evaluation value calculated by the transform coefficient evaluation unit, and the variable length coding unit Encoding a flag for identifying the parts or mode used in the conversion unit or the scan unit.
  • the image coding apparatus of the present invention includes a transform coefficient evaluation unit that calculates an evaluation value based on the characteristics of the transform coefficient, and the prediction unit, the conversion unit, or the scan unit according to the evaluation value.
  • a mode estimation unit that estimates a mode to be used, and a mode selection unit that selects a mode that minimizes the coding cost from a predetermined mode, and the mode selection unit includes the prediction unit, the conversion unit, or the
  • the transform coefficient evaluation unit operates the prediction unit, the transform unit, the quantization unit, the scan unit, and the variable length coding unit with respect to the input signal while switching the predetermined mode used in the scan unit.
  • the mode that minimizes the coding cost is selected, and the variable length coding unit, when the estimated mode and the selected mode are the same Encode information that uses the estimated mode, and if different, use a flag for identifying a mode to be used in the prediction unit, the conversion unit, or the scan unit, and the estimated mode Encode information not to do.
  • the image decoding apparatus of the present invention blocks the input signal, and reverse-scans the encoded data obtained by arranging and transforming the transform coefficients quantized and transformed in one block in a one-dimensional manner by the inverse scan unit.
  • the image decoding apparatus that decodes the encoded data from the residual signal that has been inversely quantized by the inverse quantization unit and that has been inversely transformed by the inverse transform unit and the prediction signal that has been predicted from the signal that has already been decoded by the prediction unit, (4) to (6).
  • the image decoding apparatus includes a variable length decoding unit that decodes a transform coefficient from the encoded data and a flag for identifying a mode used in the prediction unit, the inverse conversion unit, or the inverse scan unit.
  • a conversion coefficient evaluation unit that calculates an evaluation value based on the characteristics of the conversion coefficient; and a mode estimation unit that estimates a mode used in the prediction unit, the inverse conversion unit, or the inverse scan unit according to the evaluation value;
  • a mode restriction unit for limiting a range of selectable modes used in the prediction unit, the inverse transform unit, or the inverse scan unit according to the evaluation value; and the prediction unit, the inverse transform unit, or the inverse scan unit.
  • the mode used in the mode is the mode estimated by the mode estimation unit.
  • a mode decoding unit that uses a mode identified by a flag, and operates the prediction unit, the inverse transform unit, or the inverse scan unit using the mode decoded by the mode decoding unit, and the encoded data. Is decrypted.
  • the image decoding apparatus of the present invention includes a variable length decoding unit that decodes a transform coefficient from the encoded data and a flag for identifying a mode used in the prediction unit, the inverse transform unit, or the inverse scan unit.
  • a conversion coefficient evaluation unit that calculates an evaluation value based on the characteristics of the conversion coefficient, a mode restriction unit that limits a range of modes used in the prediction unit or the inverse conversion unit or the inverse scan unit, and the prediction unit or
  • the mode is within a range limited by the mode limit unit, and in the case of a plurality of modes,
  • a mode decoding unit configured to be a mode identified by the flag, and using the mode decoded by the mode decoding unit, the prediction unit or the inverse transform unit or the previous It operates the inverse scanning unit for decoding the encoded data.
  • the image decoding apparatus includes a transform coefficient from the encoded data, information on whether to use an estimated mode, and a mode used in the prediction unit, the inverse transform unit, or the inverse scan unit.
  • a variable length decoding unit that decodes a flag for identifying, a transform coefficient evaluating unit that calculates an evaluation value based on the characteristics of the transform coefficient, and depending on the evaluation value, the prediction unit or the inverse transform unit or
  • the mode estimated by the mode estimation unit is used, and when the information indicating that the estimated mode is not used is decoded, the mode identified by the flag is set. Comprising a chromatography de decoding unit, and by using a mode that is decoded by the mode decoder, the prediction unit or by operating the inverse transformation unit or the inverse scanning unit to decode the encoded data
  • the evaluation value of the transform coefficient evaluation unit is a transform other than zero.
  • the mode estimation unit of the image encoding device according to (1) or (3) or the image decoding device according to (4) or (6) above If the mode is estimated based on the mode of the block that has already been reproduced or the pixel value of the block that has already been reproduced, and the evaluation value is greater than the predetermined value, the predetermined mode is used.
  • the selectable options of the mode are limited according to the characteristics of the transform coefficient, so that the code amount of the flag necessary for expressing the mode is reduced and the coding efficiency is improved. Further, since the mode is estimated according to the characteristics of the transform coefficient, the mode estimation accuracy is improved and the coding efficiency is also improved.
  • Embodiments 1 and 2 relate to an image encoding device and an image decoding device when a scan mode is selected
  • Embodiments 3 and 4 relate to an image encoding device and an image decoding when a conversion mode is selected
  • Embodiments 5 and 6 relate to an image encoding device and an image decoding device when a prediction mode is selected.
  • modes other than the selection target are determined in advance.
  • the present invention can be similarly applied not only to individually select the scan mode, the conversion mode, and the prediction mode as described above but also to select the modes in an arbitrary combination.
  • Embodiment 1 a case where a scan mode is selected and encoded will be described. In this case, the conversion method and the quantization method are determined in advance.
  • FIG. 1 is a block diagram showing a configuration of an image encoding device 100 according to Embodiment 1 of the present invention.
  • an image encoding device 100 includes a prediction unit 111, a conversion unit 112, a quantization unit 113, a scan unit 114, a variable length encoding unit 115, an inverse quantization unit 116, an inverse conversion unit 117, a frame memory 118, A conversion coefficient evaluation unit 121, a mode selection unit 122, a mode estimation unit 123, a mode restriction unit 124, a subtraction unit 101, and an addition unit 102 are provided.
  • 103 is a transform coefficient output from the transform unit 112
  • 104 is a quantized transform coefficient output from the quantization unit 113
  • 105 is a scanned transform coefficient output from the scan unit 114
  • 106 is variable.
  • the information of the transform coefficient which is output from the long encoding unit 115 and is variable length encoded, for example, the code amount is shown.
  • the image encoding apparatus 100 decomposes an input image into blocks, and first operates the mode selection unit 122 for each block. Then, the conversion unit 112, the quantization unit 113, the scanning unit 114, a variable length code, and the like. The conversion unit 115, the transform coefficient evaluation unit 121, the mode estimation unit 123, and the mode restriction unit 124 are operated to select a scan mode, and the selected scan mode is sent to the scan unit 114 and the variable length encoding unit 115. Next, a conventional encoding process is performed on the input image using the selected scan mode.
  • the prediction unit 111, the conversion unit 112, the quantization unit 113, the scan unit 114, the variable length encoding unit 115, the inverse quantization unit 116, the inverse conversion unit 117, the frame memory 118, the subtraction unit 101, and the addition unit 102 are Since it is a conventional encoding process, it will be briefly described below.
  • the prediction unit 111 generates a prediction signal of the input signal.
  • the subtraction unit 101 obtains a residual signal from the difference between the input signal and the prediction signal.
  • the conversion unit 112 calculates a conversion coefficient by DCT conversion or the like for the residual signal.
  • the quantization unit 113 quantizes the transform coefficient.
  • the quantized transform coefficients are arranged one-dimensionally by the scanning unit 114 and encoded by the variable-length encoding unit 115.
  • the quantized transform coefficient is inversely quantized by the inverse quantizing unit 116 and inversely transformed by the inverse transforming unit 117 to reproduce a residual signal.
  • the regenerated residual signal and the predicted signal are added by the adder 102 to regenerate the local decoded block.
  • the reproduced local decoded block is stored in the frame memory 118.
  • FIG. 2 is a diagram for explaining a scanning method used in the present invention.
  • FIG. 2 shows 4 ⁇ 4 transform coefficients, and the values 0 to 15 in the figure indicate the scanning order for each transform coefficient position.
  • the vertical priority scan shown in FIG. 2B is effective for a block having a horizontal pattern in which non-zero transform coefficients are concentrated in the vertical direction.
  • the horizontal priority scan shown in FIG. This is effective for a block having a vertical pattern in which non-zero transform coefficients are concentrated in the horizontal direction.
  • the zigzag scan in FIG. 2A is a scan that has neither vertical priority nor horizontal priority.
  • the scan unit 114 uses any one of scan methods (hereinafter, scan mode) selected from zigzag scan, vertical priority scan, and horizontal priority scan.
  • scan mode any one of scan methods (hereinafter, scan mode) selected from zigzag scan, vertical priority scan, and horizontal priority scan.
  • the selection of the scan mode is performed by the mode selection unit 122. Note that it is not necessary to limit the scan mode to these three modes, and other scan modes such as a scan based on the appearance probability as described later may be used.
  • the mode number for identifying the scan mode is 1 for zigzag scan, 2 for vertical direction priority, and 3 for horizontal direction priority.
  • the mode number when using another scan mode is 0.
  • the conversion coefficient evaluation unit 121 calculates an evaluation value xC indicating the feature from the information of the conversion coefficient by a preset evaluation method.
  • the input to the conversion coefficient evaluation unit 121 varies depending on the evaluation method.
  • the evaluation depends on the code amount
  • the code amount of 106 is input. If it depends on the scanning method, the conversion coefficient after 105 scans is input. If it depends on the quantization method, 104 quantized transform coefficients are input. If it depends on the conversion method, 103 conversion coefficients are input.
  • 1C is defined as an evaluation value xC.
  • 1C indicates the maximum value of the number of consecutive conversion coefficients that are 0 in the one-dimensionally arranged conversion coefficients.
  • 1C represents the maximum value of the number of consecutive conversion coefficients that are 0 in the case of a conversion coefficient that is one-dimensionally arranged other than the last continuous conversion coefficient that is 0.
  • mC is the absolute value maximum value of the transform coefficient after quantization, the sum of absolute values of the transform coefficients after quantization, or the sum of squares of the transform coefficients after quantization.
  • Method C The code amount rC when the transform coefficient in the target block is encoded is set as the evaluation value xC.
  • vC The variation vC of the conversion coefficient is set as an evaluation value xC.
  • vC is the variance of transform coefficients in the target block or the standard deviation of transform coefficients in the target block.
  • Method E A coding efficiency eC calculated from the size mC of the transform coefficient after quantization and the number nC of transform coefficients other than zero is defined as an evaluation value xC.
  • the signal obtained by dequantizing the transform coefficient and performing the inverse transform is a residual signal. However, if more residual energy can be expressed with less nC, the method is considered to have high coding efficiency, and eC is This represents this efficiency.
  • the coding efficiency eC may be calculated using the code amount rC of the transform coefficient instead of the number nC of transform coefficients other than zero, for example, mC / rC.
  • the mC evaluation method is as described in Method B, and any method may be used as long as it relates to the energy of the residual signal obtained by inverse quantization of the transform coefficient and inverse transform.
  • the function for calculating eC (inputs are mC, nC, and rC) may be any function that is monotonically increasing for mC and monotonically decreasing for nC and rC, regardless of the above description.
  • a value dC indicating whether or not the lowest order conversion coefficient is zero is defined as an evaluation value xC.
  • the transform coefficient of the lowest order is a DC coefficient.
  • dC 0 (when the conversion coefficient of the lowest order is zero)
  • dC 1 (when the conversion coefficient of the lowest order is non-zero)
  • an equation calculated by using a plurality of values nC, 1C, mC, rC, vC, eC, fC, dC described in the method A to the method G, for example, (nC + vC) may be used as the evaluation value xC.
  • the mode estimation unit 123 estimates a scan mode in accordance with the evaluation value xC output from the transform coefficient evaluation unit 121, and outputs it as a mode estimation signal.
  • the evaluation value xC indicating the characteristics of the transform coefficient is small, such as when the number of transform coefficients is small, it indicates that the residual signal is small, that is, the predicted signal matches the original picture well.
  • the encoding target block is similar to surrounding blocks.
  • inter-frame prediction if the encoding target block moves significantly different from the surrounding blocks, it is considered that the prediction will not be successful.
  • the block and the surrounding blocks are considered somewhat similar. Further, it is considered that the block to be encoded and the block of the reference frame used for generating the predicted image are similar.
  • the encoding target block and the surrounding blocks have the same properties, and the already encoded surrounding block (or the reference frame block) is highly accurate. Mode can be estimated.
  • the evaluation value xC is large, the difference between the already encoded surrounding blocks is large and the mode estimation is difficult.
  • the mode estimation unit 123 selects the scan mode with the higher priority among the upper block scan mode and the left block scan mode. If the evaluation value xC is large, the zigzag scan is used as the mode estimation signal.
  • the priority order is zigzag scan, vertical priority scan, and horizontal priority scan. In the case of the present embodiment, since the mode numbers are assigned in the descending order of priority, the mode with the higher priority can be selected simply by selecting the smaller mode number.
  • the threshold value for determining whether or not the evaluation value xC indicating the characteristic of the conversion coefficient is small is determined by the following experiment. First, after preparing a plurality of test images, a plurality of predetermined threshold values are determined. By selecting one of the predetermined threshold values for one of the test images and performing encoding in order, encoding is performed for all test images and combinations of all threshold values. Next, using the encoding result, the RD cost is calculated from the code amount of the entire sequence and the residual between the locally decoded image and the input image for the entire sequence. Subsequently, an average RD cost for the threshold is calculated by averaging the test images used for each threshold. Finally, an optimum threshold parameter can be determined by selecting a threshold that minimizes the average RD cost.
  • the RD cost is a cost calculated from the distortion amount D, the code amount R, and a predetermined constant ⁇ , and is obtained by the following equation (1).
  • RD cost D + ⁇ R (1)
  • is a value for balancing the distortion amount D and the code amount R, and is usually determined by the value of the quantization parameter.
  • the distortion amount D is obtained by performing inverse quantization and inverse transform in the selected encoding mode, generating a local decoded image by the sum with the prediction signal, and calculating the absolute value difference sum (or 2) between the local decoded image and the input image.
  • the sum of squared differences) is defined as a distortion amount D.
  • the code amount R is calculated from the sum of the code amount of the encoding mode and the code amount of the transform coefficient.
  • the RD cost is a value that decreases when the distortion amount D is small or when the code amount R is small. After calculating the RD cost in a plurality of encoding modes, the encoding with the minimum RD cost is performed. By selecting a mode and performing encoding, encoding can be performed in an optimal encoding mode in the sense that the amount of distortion D is reduced while the amount of code R is suppressed. In addition, as an encoding cost used when selecting an encoding mode, the distortion amount D, the code amount R, etc. can be used besides RD cost.
  • the priority order of the scan order may be encoded in header information encoded for each sequence, each frame, or each set of a plurality of blocks, and may be changed in an appropriate unit.
  • FIG. 3 is a block diagram showing a configuration of the mode estimation unit 123 using an estimation method based on the appearance frequency.
  • a mode estimation unit 123 determines a frequency storage unit 1001 for storing the appearance frequency, a frequency measurement unit 1002 for measuring the appearance frequency, a frequency evaluation unit 1003 for evaluating the bias of the appearance frequency, and a mode estimation signal.
  • the mode estimation signal determination unit 1004 is configured.
  • the frequency storage unit 1001 stores integer values corresponding to the number of transform coefficient positions (4 ⁇ 4 in the example of FIG. 2).
  • the position of the transform coefficient is indicated by (x, y)
  • the held value (frequency) is indicated by M (x, y).
  • the frequency measurement unit 1002 initializes all frequencies M (x, y) in the frequency storage unit 1001 to zero in the case of the frame head or the slice head.
  • the frequency M (x, y) held in the frequency storage unit 1001 is incremented by 1. To do.
  • the frequency evaluation unit 1003 evaluates the value of the frequency storage unit 1001 and outputs a value indicating how the appearance frequencies are concentrated. For example, an evaluation value H indicating whether the appearance positions are concentrated in the horizontal direction and an evaluation value V indicating whether the appearance positions are concentrated in the vertical direction are calculated. If H is a predetermined constant or more and H> V, 3 , 2 is output if V is equal to or greater than a predetermined constant and V> H, otherwise 1 is output.
  • the mode estimation signal determination unit 1004 determines a mode estimation signal according to the output of the frequency evaluation unit 1003. For example, if it is 1, zigzag scan, if it is 2, if it is vertical scan, if it is 3, if it is horizontal scan, the mode estimation signal is used. By the above method, it is possible to estimate the scan mode according to the appearance frequency at each position of the already encoded transform coefficient other than zero.
  • FIG. 4 is a block diagram showing another configuration of the mode estimation unit 123 using the estimation method based on the appearance frequency.
  • the mode estimation unit 123 includes a frequency storage unit 1001, a frequency measurement unit 1002, a scan order generation unit 1103 that generates a scan order from the appearance frequency, and a mode estimation signal determination unit 1104 that determines a mode estimation signal. Yes. Since the frequency storage unit 1001 and the frequency measurement unit 1002 have already been described, description thereof will be omitted.
  • the scan order generation unit 1103 arranges the positions of the transform coefficients in descending order of appearance frequency stored in the frequency storage unit 1001.
  • the positions of the arranged transform coefficients can be used as a scan mode.
  • FIG. 5 is a diagram illustrating a method for generating such a scan mode.
  • FIG. 5A illustrates the appearance frequency for each transform coefficient
  • FIG. 5B illustrates the order of appearance frequency in the scan order. Is a scan mode.
  • the mode estimation signal determination unit 1104 outputs a signal indicating the mode type and a signal indicating the specific mode contents as a mode estimation signal.
  • the mode type is number 0 (as described above, the number is 0 for modes other than zigzag scan, vertical priority scan, and horizontal priority scan), and information indicating the contents of the scan mode is generated in scan order.
  • the scan order generated by the unit 1103 (a signal in which position information is arranged) is used.
  • the mode restriction unit 124 restricts selectable scan modes in accordance with the evaluation value xC output from the transform coefficient evaluation unit 121, and outputs it as a mode restriction signal.
  • the mode restriction signal is a signal indicating the number of selectable scan modes and the range of selectable scan modes. However, when the number of selectable scan modes is one, the range of selectable scan modes is unnecessary, and only the number of selectable scan modes is sufficient.
  • the amount of code of the flag for identifying the scan mode can be reduced.
  • the amount of code can be reduced by switching the scan mode when the bias of the transform coefficient that becomes zero is increased, that is, when the transform coefficient that becomes zero is biased so as to continue for a longer time, and the transform coefficient that becomes zero This is a case where it can be biased toward the second half of the scan order. Therefore, when the number nC of transform coefficients other than zero is particularly small in the target block, and conversely, when nC is particularly large, switching of the scan mode has a small effect.
  • the code amount rC when the code amount rC is small, if the scan mode is switched from many options using a flag, the code amount of the flag becomes larger than the code amount rC, and the code amount may increase as a whole. is there. For this reason, when the code amount rC is particularly small, the number of options is small, for example, one.
  • FIG. 6 is a diagram for explaining the operation of the mode restriction unit 124.
  • the conversion coefficient evaluation value xC is smaller than a predetermined value THX0
  • the number of selectable scan modes is limited to one. If the value is equal to or greater than the predetermined value THX0, the number of selectable scan modes is N (N> 1).
  • the number of selectable scan modes is limited to one.
  • the number of selectable scan modes is N1 (N1> 1). If the value is equal to or greater than the predetermined value THX1, the number of selectable scan modes is N2.
  • a list of mode numbers is output as the selectable scan mode range in addition to the number of selectable scan modes.
  • 1 and 2 indicating the mode number are output if there are two, and 1, 2, and 3 are output if there are three.
  • the mode estimation unit 123 and the mode restriction unit 124 may use different conversion coefficient evaluation values xC. That is, the mode estimation unit 123 may use the code amount rC, and the mode restriction unit 124 may use the number nC of transform coefficients.
  • the predetermined values THX0 and THX1 are determined by the following experiment. First, after preparing a plurality of test images, several kinds of combinations (threshold parameters) of predetermined values THX0 and THX1 are determined. By selecting one of the predetermined threshold parameters for one of the test images and performing encoding in order, encoding is performed for all test images and combinations of all threshold parameters. Next, using the encoding result, the RD cost is calculated from the code amount of the entire sequence and the residual between the locally decoded image and the input image for the entire sequence. Subsequently, for each threshold parameter, an average RD cost for the threshold parameter is calculated by averaging the test images used. Finally, an optimum threshold parameter can be determined by selecting a threshold parameter that minimizes the average RD cost.
  • the scan mode to be restricted when the mode is restricted is determined by the following experiment.
  • an image encoding device to which a plurality of test images are prepared and a device for counting the number of selected scan modes is added is provided.
  • This image encoding device operates without mode restriction, and does not have to be the image encoding device described in this specification, and may be a conventional image encoding device.
  • the scan modes used by the mode restriction unit 124 are N scan modes in descending order of the number selected. For the N number, the selection rate selected for each scan mode is calculated, and the value of the cumulative selection rate when the M selection rates from the highest selection rate are totaled is a predetermined ratio (for example, 50%). Use the first value of M that exceeds.
  • the mode selection unit 122 selects a scan mode based on the output values of the mode estimation unit 123 and the mode restriction unit 124.
  • the operation of the mode selection unit 122 will be described using the flowchart of FIG. (Note that the left bracketed symbol in the following description, for example, (S1001) and the like corresponds to the processing box in FIG. 7).
  • the prediction unit 111 generates a prediction signal.
  • the subtraction unit 101 generates a residual signal from the difference between the prediction signal and the input signal.
  • the conversion unit 112 converts the residual signal.
  • the transform unit 113 quantizes the transform coefficient.
  • the scan unit 114 scans in the scan mode corresponding to the control variable k (the scan mode with the mode number k).
  • (S1006) Variable length coding of the transform coefficient quantized and scanned by the variable length coding unit 115 is performed.
  • the conversion coefficient evaluation unit 121 obtains an evaluation value xC indicating the characteristics of the conversion coefficient.
  • (S1008) According to the evaluation value xC of the transform coefficient evaluation unit 121, the mode estimation unit 123 estimates the scan mode to obtain a mode estimation signal.
  • the scan modes that can be selected by the mode restriction unit 124 are restricted, and a mode restriction signal is obtained.
  • (S1010) Referring to the mode control signal, it is determined whether the scan mode corresponding to the control variable k can be selected. If it can be selected, the process proceeds to S1011.
  • (S1011) The variable length encoding unit 115 encodes the flag.
  • (S1012) The cost is calculated using the RD cost calculated from the distortion amount D and the code amount R.
  • the code amount R is the code amount of the transform coefficient and the code amount of the flag.
  • (S1013) The cost corresponding to the control variable k is set to the maximum value so that this scan mode is not selected.
  • the scan mode is estimated according to the characteristics of the conversion coefficient, and the selectable scan mode is limited according to the evaluation value xC, so that the optimum scan mode can be selected.
  • variable length encoding unit 115 encodes the quantized transform coefficients arranged one-dimensionally by the scanning unit 114, and when the scan mode selectable by the mode limiting unit 124 is limited to one, the scan mode is changed. Do not encode as a flag. Further, when the scan mode estimated by the mode estimation unit 123 is the same as the selected scan mode, a value indicating whether the mode estimation signal is used is encoded as 1, and the selected scan mode is used as a flag. Do not encode. Whether or not the mode estimation signal is used when the number of scan modes that can be selected by the mode restriction unit 124 is not limited to one, or when the mode estimation signal (estimated mode) is different from the selected scan mode. A value indicating such is encoded as 0, and a flag for identifying the selected scan mode is encoded.
  • the encoding performed by the variable length encoding unit 115 while the scan mode is selected by the mode selection unit 122 is provisional encoding for measuring the code amount, and the encoded data is not output to the outside. Discard it.
  • the flag encoding method includes a method of encoding a difference between a selected scan mode and a mode estimation signal.
  • Encoded data of the present invention In the present invention, whether or not a flag exists in the encoded data is determined based on the characteristics of the transform coefficient. Therefore, the encoded data needs to have a configuration in which the flag code is positioned after the code of the transform coefficient, or a configuration in which the flag code is positioned after the code indicating the characteristics of the transform coefficient.
  • FIG. 8 is a diagram showing a configuration of conventional encoded data
  • FIG. 9 is a diagram showing a configuration of encoded data of the present invention.
  • the flag in FIG. 9 is a scan method flag, a conversion method flag, or a prediction method flag.
  • the transform coefficient is encoded after the flag as shown in FIG. 8, but in the present invention, the flag is encoded after the transform coefficient as shown in FIG. 9A. Note that the flag does not exist when the encoding of the flag is not necessary.
  • the configurations shown in FIGS. 9B to 9E can be employed.
  • the transform coefficient is divided into two or more, a part is encoded before the flag, and the remaining part is encoded after the flag.
  • the low frequency component is divided into the first half and the high frequency component is divided into the second half.
  • the information (run) indicating the position of the non-zero conversion coefficient is set to the first half, and the non-zero conversion coefficient value is set. There is a way to divide into the second half. Information on the number of non-zero transform coefficients can also be obtained from the position of the non-zero transform coefficient.
  • FIG. 9C information indicating the characteristics of the transform coefficient is encoded before the flag, and the transform coefficient is encoded after the flag.
  • Features of the transform coefficient include cbp, the number of transform coefficients, and a flag indicating a table for variable-length coding of transform coefficients.
  • FIG. 9D shows a case where the characteristic of the conversion coefficient in FIG. 9C is cbp.
  • FIG. 9E shows a configuration in which the transform coefficient run is encoded before the flag, and the transform coefficient level is encoded after the flag.
  • the transform coefficient is usually encoded by dividing it into a run indicating the position of the transform coefficient and a level indicating the magnitude of the transform coefficient. For example, when transform coefficients that are (1, 2, 0, 0, ⁇ 4,...) Are encoded in the scan order, (0, 1), (0, 2) are combinations of runs and levels. , (2, -4),... Are sequentially encoded.
  • the image encoding apparatus 100 described above uses the characteristics of the transform coefficient to limit the selectable scan modes depending on whether or not the scan mode switching is effective.
  • the code amount of the flag is reduced, and encoding can be performed with high encoding efficiency. Further, since the scan mode estimation method is changed according to the characteristics of the transform coefficient, the scan mode estimation accuracy is improved, and the code amount of the flag is reduced, thereby improving the coding efficiency.
  • the configuration including both the mode estimation unit 123 and the mode restriction unit 124 has been described. However, as a modification, only the mode estimation unit 123 and the mode limitation unit 124 are not provided, and the mode estimation is performed. A configuration including only the mode restriction unit 124 without including the unit 123 is also conceivable.
  • FIG. 10 is a flowchart for explaining the operation of the mode selection unit 122 according to the first modification that does not include the mode restriction unit 124 but includes the mode estimation unit 123.
  • the operation of the mode selection unit 122 in this case is basically the same as that described with reference to FIG. 7, but the operation for obtaining the mode restriction signal in S1009, the determination / branch operation in S1010, and the scan mode in S1013 are the same. The difference is that there is no operation to set the cost so that it is not selected.
  • FIG. 11 is a flowchart for explaining the operation of the mode selection unit 122 according to the second modification that does not include the mode estimation unit 123 but includes the mode restriction unit 124.
  • the operation of the mode selection unit 122 in this case is basically the same as that described with reference to FIG. 7 except that there is no operation for obtaining the mode estimation signal in S1008.
  • the mode restriction unit 124 described above in addition to the number of selectable scan modes, lists mode numbers as selectable scan mode ranges. In the case of the second modification, even when the number of scan modes that can be selected is one, the range of scan modes that can be selected (here, one scan mode) is set. Output.
  • Embodiment 2 The image decoding apparatus according to the second embodiment decodes the encoded data generated by the image encoding apparatus 100 according to the first embodiment.
  • FIG. 12 is a block diagram showing the configuration of the image decoding apparatus 200 according to Embodiment 2 of the present invention.
  • an image decoding apparatus 200 includes a variable length coding / decoding unit 201, an inverse scan unit 202, a prediction unit 111, an inverse quantization unit 116, an inverse transform unit 117, a frame memory 118, a transform coefficient evaluation unit 121, and a mode estimation.
  • symbol is attached
  • the encoded data input to the image decoding device 200 is first input to the variable length encoding / decoding unit 201.
  • the variable length coding / decoding unit 201 decodes a signal indicating a prediction method and a transform coefficient that is a transformed / quantized residual signal by variable length decoding of the coded data.
  • the decoded transform coefficient is output to the transform coefficient evaluation unit 121 and the reverse scan unit 202.
  • the conversion coefficient evaluation unit 121 evaluates the characteristics of the conversion coefficient and outputs the evaluation value xC to the mode estimation unit 123 and the mode restriction unit 124.
  • the mode estimation unit 123 estimates the scan mode according to the evaluation value xC, and outputs it to the mode decoding unit 222 as a mode estimation signal.
  • the mode restriction unit 124 restricts selectable scan modes according to the evaluation value xC, and outputs a mode restriction signal to the variable length coding / decoding unit 201 and the mode decoding unit 222.
  • the variable length coding / decoding unit 201 receives a mode restriction signal and, when decoding of a flag is necessary, selects a flag for identifying one scan mode from selectable scan modes restricted by the mode restriction signal. Decode and output to mode decoding unit 222.
  • the mode decoding unit 222 decodes the scan mode using the mode estimation signal, the mode restriction signal, and the flag.
  • the reverse scan unit 202 rearranges the conversion coefficients necessary for the reverse conversion according to the decoded scan mode.
  • the inversely scanned transform coefficients are inversely quantized by the inverse quantizing unit 116 and inversely transformed by the inverse transforming unit 117 to reproduce a residual signal.
  • the regenerated residual signal and the predicted signal are added by the adder 102 to regenerate the local decoded block.
  • the reproduced local decoded block is stored in the frame memory 118.
  • the mode decoding unit 222 decodes the scan mode using the mode restriction signal, the mode estimation signal, and the flag.
  • the scan mode is limited to one by the mode limit signal, or when the value indicating whether the mode estimation signal is used is 1, the scan mode specified by the mode estimation signal is set. Further, when there are a plurality of scan modes by the mode restriction signal, or when the value indicating whether or not the mode estimation signal is used is 0, the scan mode indicated by the flag is set.
  • FIG. 13 is a flowchart for explaining the operation of the image decoding apparatus 200 according to Embodiment 2 of the present invention.
  • the variable length coding / decoding unit 201 decodes the transform coefficient. However, when the transform coefficient feature and the transform coefficient are divided and encoded as shown in FIGS. 9B to 9E, the transform coefficient feature or a part of the transform coefficient is decoded.
  • the conversion coefficient evaluation unit 121 calculates an evaluation value xC of the conversion coefficient.
  • the mode estimation unit 123 estimates the scan mode according to the evaluation value xC of the transform coefficient.
  • the mode restriction unit 124 restricts selectable scan modes according to the evaluation value xC of the conversion coefficient.
  • S1105 If the scan mode is limited to one, it is determined that decoding of the flag is unnecessary, and the process proceeds to S1107. If it is necessary to decode the flag, the process proceeds to S1106. (S1106) The flag is decoded. For example, when the value indicating whether or not the mode estimation signal is used is 0, an additional flag is further decoded. Alternatively, the difference between the scan mode and the mode estimation signal is decoded. (S1107) When the number of scan modes is limited to one, or when the value indicating whether or not the mode estimation signal is used is 1, the estimated scan mode is decoded as a scan mode. In other cases, the scan mode to be used is decoded from the selectable modes using an additional flag.
  • the scan mode to be used is decoded from the difference between the mode estimation signals.
  • the variable length coding / decoding unit 201 determines whether the transform coefficient has been decoded. If the transform coefficient feature or part of the transform coefficient is decoded in S1101, the process proceeds to S1109. If all transform coefficients have been decoded, the process proceeds to S1110. For example, if cbp is decoded and cbp becomes 0 in S1101, the process proceeds to S1110. (S1109) The variable length coding / decoding unit 201 decodes the remaining transform coefficients. (S1110) The inverse scan unit 202 performs inverse scan of the transform coefficient.
  • the inverse quantization unit 116 performs inverse quantization of the transform coefficient.
  • the inverse transform unit 117 performs inverse transform and decodes the residual signal.
  • the prediction unit 111 generates a prediction signal.
  • the adder 102 sums the prediction signal and the residual signal to generate a reproduction signal.
  • the mode identification flag is used to limit the selectable scan modes according to whether or not the scan mode switching is effective by using the feature of the transform coefficient.
  • the encoded data encoded with high encoding efficiency can be decoded.
  • the scan mode estimation method is changed according to the characteristics of the transform coefficient, it is possible to decode the encoded data with high scan mode estimation accuracy and a reduced flag code amount.
  • the configuration including both the mode estimation unit 123 and the mode restriction unit 124 has been described.
  • the configuration including the mode estimation unit 123 and not including the mode limitation unit 124, and the mode estimation A configuration in which the mode restriction unit 124 is provided without the unit 123 is also possible.
  • FIG. 14 is a flowchart for explaining the operation of the image decoding apparatus 200 according to the third modification that does not include the mode restriction unit 124 but includes the mode estimation unit 123.
  • the operation of the mode selection unit 122 in this case is basically the same as that described with reference to FIG. 13 except that the operation for obtaining the mode restriction signal in S1104 is different from the determination and branching in S1105. .
  • the value indicating whether or not the mode estimation signal is used is 1, decoding is performed using the estimated mode, and when the value is 0, decoding is performed using the mode specified by the flag.
  • FIG. 15 is a flowchart for explaining the operation of the image decoding apparatus 200 according to the modified example 4 that does not include the mode estimation unit 123 but includes the mode restriction unit 124.
  • the operation of the mode selection unit 122 in this case is basically the same as that described with reference to FIG. 13, except that there is no operation for obtaining the mode estimation signal in S1103.
  • the mode restriction unit 124 also outputs a selectable scan mode even when the number of selectable scan modes is one.
  • Embodiment 3 a case where a conversion mode is selected and encoded will be described. In this case, the quantization method and the scan method are determined in advance.
  • FIG. 16 is a block diagram showing a configuration of an image encoding device 300 according to Embodiment 3 of the present invention.
  • an image encoding device 300 includes a prediction unit 111, a conversion unit 112, a quantization unit 113, a scanning unit 114, a variable length encoding unit 115, an inverse quantization unit 116, an inverse conversion unit 117, a frame memory 118, A conversion coefficient evaluation unit 121, a mode selection unit 322, a mode estimation unit 323, a mode restriction unit 324, a subtraction unit 101, and an addition unit 102 are provided.
  • symbol is attached
  • the image encoding device 300 decomposes an input image into blocks, and first operates the mode selection unit 322 for each block. Then, the conversion unit 112, the quantization unit 113, the scanning unit 114, the variable length code The conversion unit 115, the conversion coefficient evaluation unit 121, the mode estimation unit 323, and the mode restriction unit 324 are operated to select a conversion mode, and the selected conversion mode is the conversion unit 112, the inverse conversion unit 117, and the variable length encoding unit 115. Sent to. Next, a conventional encoding process is executed on the input image using the selected conversion mode.
  • the conversion method used by the conversion unit 112 is DCT conversion, two-dimensional KLT conversion, and one-dimensional KLT conversion.
  • the KLT transform is a linear orthogonal transform similar to the DCT transform.
  • the DCT transformation is a basis based on a discrete cosine basis
  • the KLT transformation uses a basis calculated using an actual image so that energy is concentrated on a small number of transformation coefficients in advance.
  • horizontal KLT conversion and vertical KLT conversion are performed in series.
  • one time KLT conversion is performed on a numerical sequence rearranged in one dimension in units of blocks.
  • DCT conversion and KLT conversion but also DST conversion, wavelet conversion, Gabor conversion, slant conversion, etc., which are discrete sine conversions, may be used.
  • the mode number indicating the conversion method is set to DCT conversion, 1-dimensional KLT conversion is 2, and 1-dimensional KLT conversion is 3.
  • the mode estimation unit 323 estimates the conversion mode according to the evaluation value xC output from the conversion coefficient evaluation unit 121, and outputs it as a mode estimation signal.
  • the evaluation value xC indicating the characteristics of the transform coefficient is small, it is considered that estimation using block information is performed from the surroundings. Therefore, the mode number having the higher priority of the upper block and the left block is selected as the mode estimation signal.
  • the coding efficiency of the KLT transform is higher than that of the DCT transform, and the coding efficiency of the two-dimensional transform is higher than that of the one-dimensional transform. Therefore, the two-dimensional KLT transform, the DCT transform, and the one-dimensional KLT transform are selected in this order. To do.
  • the mode number (1) indicating the DCT conversion is used as the mode estimation signal without performing the prediction using the information of the surrounding blocks.
  • FIG. 17 is a block diagram illustrating a configuration of the mode estimation unit 323 using the estimation method based on the appearance frequency.
  • the mode estimation unit 323 determines a conversion mode storage unit 1201 that stores the conversion mode used, a conversion mode measurement unit 1202, a conversion mode frequency evaluation unit 1203 that evaluates the frequency of the conversion mode, and a mode estimation signal.
  • the mode estimation signal determination unit 1204 is configured.
  • the conversion mode storage unit 1201 stores the type of conversion mode used for each block position. For each block position (x, y), the type T (x, y) of the used conversion mode is stored.
  • the conversion mode measurement unit 1202 initializes all types T (x, y) in the conversion mode storage unit 1201 to zero in the case of the frame head or the slice head. Further, when encoding the transform coefficient, the value of the used transform mode is stored in T (x, y).
  • the conversion mode frequency evaluation unit 1203 refers to the conversion mode type T (x, y) in the conversion mode storage unit 1201 and evaluates the appearance frequency of the conversion mode. For example, referring to T (x, y) of blocks around the encoding target block, the number of appearances of each conversion mode is totaled, and the value of the conversion mode having the maximum appearance frequency is output by the totalization.
  • the mode estimation signal determination unit 1204 outputs a signal indicating the type of conversion mode and a signal indicating the specific content of the conversion mode as a mode estimation signal.
  • the mode type is number 0 (the mode number is 0 in the case of a conversion method other than the above-described DCT conversion, two-dimensional KLT conversion, and one-dimensional KLT conversion), and information indicating the mode content is conversion mode frequency.
  • the conversion mode with the maximum appearance frequency output from the evaluation unit 1203 is used.
  • the mode restriction unit 324 restricts selectable conversion modes according to the evaluation value xC obtained by the conversion coefficient evaluation unit 121, and outputs it as a mode restriction signal.
  • the switching of the conversion mode is intended to improve the encoding efficiency when a large amount of energy can be concentrated on a small number of transform coefficients or when the number of transform coefficients that become zero can be increased.
  • the number of transform coefficients is particularly small, or when the transform coefficients are concentrated on the DC component, it is considered that there is no significant difference regardless of which transform mode is used.
  • the mode selection unit 322 selects a conversion mode based on the output values of the mode estimation unit 323 and the mode restriction unit 324. The operation of the mode selection unit 322 will be described using the flowchart of FIG.
  • the prediction unit 111 generates a prediction signal.
  • the subtraction unit (residual calculation unit) 101 generates a residual signal from the difference between the prediction signal and the input signal.
  • the control variable k is changed from 1 to 3, and the following S1203 to S1213 are repeatedly executed. Thereafter, the process proceeds to S1214.
  • the conversion unit 112 converts the residual signal in the conversion mode (conversion mode of mode number k) indicated by the mode corresponding to the control variable k.
  • the transform unit 113 quantizes the transform coefficient.
  • Scanning is performed by the scanning unit 114.
  • Variable length coding of the transform coefficient quantized and scanned by the variable length coding unit 115 is performed.
  • the conversion coefficient evaluation unit 121 obtains an evaluation value xC indicating the characteristics of the conversion coefficient.
  • the mode estimation unit 323 estimates the conversion mode to obtain a mode estimation signal.
  • the features of the transform coefficient are used to limit the selectable transform mode options depending on whether or not the transform mode switching is valid.
  • the code amount of the flag is reduced, and encoding can be performed with high encoding efficiency.
  • the estimation method of the conversion mode is changed according to the characteristics of the conversion coefficient, the estimation accuracy of the conversion mode is improved, and further, the code amount of the flag is reduced and the encoding efficiency is improved.
  • the configuration including both the mode estimation unit 323 and the mode restriction unit 324 has been described.
  • the configuration includes the mode estimation unit 323 and does not include the mode limitation unit 324.
  • a configuration that includes the mode restriction unit 324 and does not include the mode estimation unit 323 is also possible.
  • Embodiment 4 The image decoding apparatus according to the fourth embodiment decodes the encoded data generated by the image encoding apparatus 300 according to the third embodiment.
  • FIG. 19 is a block diagram showing a configuration of an image decoding device 400 according to Embodiment 4 of the present invention.
  • an image decoding apparatus 400 includes a variable length coding / decoding unit 201, an inverse scanning unit 202, a prediction unit 111, an inverse quantization unit 116, an inverse transformation unit 117, a frame memory 118, a transform coefficient evaluation unit 121, and mode decoding.
  • symbol is attached
  • the encoded data input to the image decoding device 400 is first input to the variable length encoding / decoding unit 201.
  • the variable length coding / decoding unit 201 decodes a signal indicating a prediction method and a transform coefficient that is a transformed / quantized residual signal by variable length decoding of the coded data.
  • the decoded transform coefficient is output to the transform coefficient evaluation unit 121 and the reverse scan unit 202.
  • the conversion coefficient evaluation unit 121 calculates an evaluation value xC based on the characteristics of the conversion coefficient, and outputs the evaluation value xC to the mode estimation unit 323 and the mode restriction unit 324.
  • the mode estimation unit 323 estimates the conversion mode according to the evaluation value xC, and outputs it to the mode decoding unit 422 as a mode estimation signal.
  • the mode restriction unit 324 restricts selectable conversion modes according to the evaluation value xC, and outputs the conversion modes to the variable length coding / decoding unit 201 and the mode decoding unit 422 as mode restriction signals.
  • the variable length coding / decoding unit 201 receives a mode restriction signal, and when decoding a flag is necessary, identifies one conversion mode from selectable conversion modes restricted by the mode restriction signal. The flag is decoded and output to the mode decoding unit 422.
  • the mode decoding unit 422 decodes the conversion mode using the mode estimation signal, the mode restriction signal, and the flag.
  • the reverse scan unit 202 rearranges the conversion coefficients necessary for the reverse conversion.
  • the inversely scanned transform coefficient is inversely quantized by the inverse quantization unit 116, and inverse transform is performed by the inverse transform unit 117 using the transform mode decoded by the mode decoding unit 422, and a residual signal is reproduced. .
  • the regenerated residual signal and the predicted signal are added by the adder 102 to regenerate the local decoded block.
  • the reproduced local decoded block is stored in the frame memory 118.
  • the mode decoding unit 422 decodes the conversion mode using the mode restriction signal, the mode estimation signal, and the flag.
  • the conversion mode is limited to one by the mode restriction signal, or when the value indicating whether the mode estimation signal is used is 1, the conversion mode specified by the mode estimation signal is set. Further, when there are a plurality of conversion modes by the mode restriction signal, or when the value indicating whether or not the mode estimation signal is used is 0, the conversion mode indicated by the flag is set.
  • the operation of the image decoding apparatus 400 is the same as that shown in the flowchart of FIG. 13 described above, but in this embodiment, the scan mode in FIG. 13 is replaced with the conversion mode, and the inverse conversion performed in S1112 is S1107.
  • the conversion is performed in the conversion mode decoded by (mode decoding unit 422).
  • the mode identification flag is used to limit the selection of conversion modes that can be selected depending on whether or not conversion mode switching is effective by using the characteristics of the conversion coefficient.
  • the encoded data encoded with high encoding efficiency can be decoded.
  • the conversion mode estimation method is changed according to the characteristics of the transform coefficient, it is possible to decode encoded data with a high estimation accuracy of the conversion mode and a reduced code amount of the flag.
  • the configuration including both the mode estimation unit 323 and the mode restriction unit 324 has been described.
  • the mode estimation unit 323 is provided and the mode restriction unit 524 is not provided, as in the second embodiment.
  • a configuration or a mode restriction unit 324 and no mode estimation unit 323 are also possible.
  • Embodiment 5 a case where the prediction mode is selected and encoded will be described. In this case, the conversion method, quantization method, and scan method are determined in advance.
  • FIG. 20 is a block diagram showing a configuration of an image encoding device 500 according to Embodiment 5 of the present invention.
  • an image encoding apparatus 500 includes a prediction unit 111, a conversion unit 112, a quantization unit 113, a scan unit 114, a variable length encoding unit 115, an inverse quantization unit 116, an inverse conversion unit 117, a frame memory 118, A conversion coefficient evaluation unit 121, a mode selection unit 522, a mode estimation unit 523, a mode restriction unit 524, a subtraction unit 101, and an addition unit 102 are provided.
  • symbol is attached
  • the image coding apparatus 500 decomposes an input image into blocks, and first operates the mode selection unit 522 for each block. Then, the transform unit 112, the quantization unit 113, the scanning unit 114, the variable length code The prediction unit is selected by operating the conversion unit 115, the transform coefficient evaluation unit 121, the mode estimation unit 523, and the mode restriction unit 524, and the selected prediction mode is sent to the prediction unit 111 and the variable length encoding unit 115. Next, a conventional encoding process is executed on the input image using the selected conversion mode.
  • FIG. 21 is a diagram for explaining intra-screen prediction.
  • In-screen prediction is to predict the pixel value of a target block using a reproduced image around the target block.
  • FIG. 21A is a diagram showing direction prediction (line prediction, one-dimensional prediction). The direction prediction is performed by extending the pixel value of the already reproduced pixel of the block adjacent to the target block in a specific direction.
  • an arrow and a number indicating the direction of intra prediction are shown. This number is a value of mode numbers 0 to 8 for identifying the prediction mode.
  • in-screen prediction includes DC prediction in addition to direction prediction.
  • the mode number for DC prediction is 2.
  • FIG. 21 (B) is a diagram showing block prediction (surface prediction, two-dimensional prediction).
  • block prediction a block is cut out from a reproduced image around the target block and the pixel value of the target block is predicted.
  • the block to be cut out is called a reference block.
  • variable-length encoding unit 115 encodes a position vector (corresponding to a motion vector for inter-screen prediction) indicating the position of a reference block as a mode identification flag.
  • the mode estimation unit 523 estimates the prediction mode according to the evaluation value xC obtained by the transform coefficient evaluation unit 121 and outputs it as a mode estimation signal.
  • the prediction mode estimation method includes function prediction and matching prediction. Function prediction is used for estimation of a prediction mode of direction prediction, and matching prediction is used for mode estimation of both direction prediction and block prediction.
  • the prediction mode is composed of a signal (mode number) indicating the type of the prediction mode and a signal indicating the content of the prediction mode, and the mode estimation signal is composed of these two.
  • prediction mode m the prediction mode of mode number m (m is an integer from 0 to 10) is referred to as prediction mode m.
  • FIG. 22 is a diagram for explaining a mode estimation method (function prediction and matching prediction) of the in-screen mode.
  • FIG. 22A estimates the prediction mode of the target block from the prediction modes of the blocks around the target block, and is called function prediction.
  • a function for determining the estimation mode is determined from the prediction mode of the block located to the left of the target block and the prediction mode of the block located above the target block, and the output of the function is used as the prediction mode. is there.
  • This function outputs the mode number of the smaller one when the prediction modes are arranged in the descending order of occurrence probability from the smallest mode number. In this case, the prediction mode with high probability can be predicted.
  • similar prediction methods are arranged close to each other, it is preferable to use the average of the prediction mode numbers.
  • the prediction mode of the block using the direction prediction is set as the mode estimation signal.
  • 0 prediction mode 0
  • 22 (B) and 22 (C) are diagrams illustrating a method for estimating a prediction mode using matching prediction.
  • 22B shows a method for estimating the prediction mode for direction prediction
  • FIG. 22C shows a method for estimating the prediction mode for block prediction.
  • the matching prediction is performed by cutting out two areas from the already reproduced area and selecting the one having the smallest sum of absolute value differences between the areas. Two regions in the case of estimating the prediction mode of the direction prediction are determined for each mode of the direction prediction as shown in FIG. Here, for each prediction mode, a value (normalized absolute value difference sum D) obtained by dividing the absolute value difference sum of pixel values between two already encoded regions by the number of pixels used for the sum is calculated. Next, a prediction mode that minimizes the normalized absolute value difference sum D is set as a mode estimation signal.
  • the two areas used for calculating the normalized absolute value difference sum D are the pixel area adjacent to the target block and the area obtained by extending the area in the direction opposite to the prediction direction for each direction corresponding to the prediction mode. Between pixel areas are used. Also, in prediction mode 2 (DC prediction), there is no direction corresponding to the prediction mode, so two areas cannot be defined. Therefore, calculation of D corresponding to the prediction mode 2 is not performed, and when all the normalized absolute value difference sums D calculated in the other prediction modes are less than a predetermined value, the prediction mode 2 is set to the mode estimation signal. And
  • the method for estimating the prediction mode using the pixel values of the already encoded region is not limited to the above, and other existing methods may be used.
  • FIG. 22B shows a method of obtaining the normalized absolute value difference sum D in prediction mode 0, prediction mode 1, and prediction mode 4, respectively, in order from the top.
  • prediction mode 0 in a block adjacent on the target block, an area adjacent to the target block (diagonal line area) and an area positioned in the direction extended in the direction of prediction mode 0 (vertical direction) (vertical line) Normalized absolute value difference sum D is calculated between (regions).
  • direction prediction from prediction mode 0 to prediction mode 8 There are nine types of direction prediction from prediction mode 0 to prediction mode 8. Here, not all directions are used, but only directions that are easy to estimate (prediction mode) (for example, vertical direction prediction mode). (Only 0 and prediction mode 1 in the horizontal direction) may be limited.
  • FIG. 22C is a diagram illustrating a method for obtaining a prediction mode of block prediction by matching prediction.
  • the inverse L-shaped pixel value adjacent to the target block is compared with the pixel value obtained by cutting out the same inverted L-shape from the reproduced image, and the position vector of the smallest absolute value difference sum is obtained. Ask.
  • This method is also called template matching.
  • FIG. 23 is a flowchart for explaining the operation of the mode estimation unit 523 that estimates the prediction mode according to the evaluation value xC output from the transform coefficient evaluation unit 121.
  • S1301 If the evaluation value xC output by evaluating the conversion coefficient is equal to or smaller than the predetermined value TH, the process proceeds to S1302, and if larger than the predetermined value TH, the process proceeds to S1303.
  • S1302 A prediction mode is estimated using matching prediction from surrounding pixel values that have already been encoded.
  • S1303 A prediction mode is estimated from the prediction modes of surrounding blocks using function prediction.
  • FIG. 24 is a flowchart for explaining another operation of the mode estimation unit 523.
  • the control variable k is changed from 0 to 8, and the following S1401 is repeatedly executed. Thereafter, the process proceeds to S1402.
  • S1401 A normalized absolute value difference sum D is calculated from two already encoded regions corresponding to the control variable k.
  • S1402 A selection order is assigned in descending order of correlation between pixels. That is, the selection order is set so that the prediction modes are selected in ascending order of normalized absolute value difference sum D.
  • S1403 A prediction mode is estimated by function prediction. That is, the prediction mode with the higher selection order determined in S1402 (the mode with the smaller mode number) is selected from the prediction mode of the block adjacent to the left of the target block and the prediction mode of the block adjacent above.
  • the mode estimation unit 523 may generate a prediction signal using inter-screen prediction.
  • the motion vector is estimated using block matching.
  • the motion vector is estimated using the median value of the motion vectors of the left block, the upper block, and the upper right block around the encoding target block. The median is calculated for each vector element (X direction vector and Y direction vector are different).
  • the mode estimation signal at this time is a prediction mode 10 indicating that the mode type is inter-screen prediction, and a motion vector (and frame ID and block position) indicating the mode contents.
  • nC of transform coefficients other than zero when the number nC of transform coefficients other than zero is small, it is estimated that the prediction is successful. In this case, since the feature of the target block and the surrounding pixel values are considered to be similar, it is considered that an appropriate motion vector can be predicted by matching prediction using the already reproduced pixel value of the target block. On the other hand, when nC is large, it is considered that there is a difference in characteristics between the target block and surrounding pixel values, and good prediction cannot be made using already reproduced pixel values. In this case, function prediction using simply the prediction mode of adjacent blocks is used. A similar switching method can be applied to other evaluation values obtained by the conversion coefficient evaluation unit 121 regardless of the number nC of conversion coefficients other than zero.
  • the mode restriction unit 524 restricts selectable prediction modes according to the evaluation value xC obtained by the transform coefficient evaluation unit 121, and outputs it as a mode restriction signal.
  • the mode limit signal is the number of selectable prediction modes and the range of selectable prediction modes. However, when the number of selectable prediction modes is one, the range of selectable prediction modes is unnecessary, and only the number of selectable prediction modes is sufficient.
  • nC of transform coefficients other than zero When the number nC of transform coefficients other than zero is small, it is often because the prediction is good, so it is preferable to limit the number of prediction modes to be small. On the other hand, when nC is large, it means that the prediction is not successful. Therefore, it is considered inefficient to use a large amount of code in the prediction mode.
  • FIG. 6 is a diagram illustrating the mode restriction unit 524.
  • the number of prediction modes that can be selected according to the evaluation value xC of the transform coefficient and the predetermined values THX0 and THX1 is one or N (N> 1). Alternatively, the number is limited to one, N1, and N2.
  • the number of selectable prediction modes is larger than 1, the number of selectable prediction modes is output as a mode restriction signal in addition to the number of selectable prediction modes.
  • a list of mode numbers that is, mode numbers from mode number 0 to mode number N ⁇ 1 is output as a range of selectable prediction modes.
  • the mode selection unit 522 selects a prediction mode based on the output values of the mode estimation unit 523 and the mode restriction unit 524. The operation of the mode selection unit 522 will be described using the flowchart of FIG.
  • the prediction unit 111 generates a prediction signal by a prediction method (a prediction mode of mode number k) corresponding to the control variable k. For example, when k is 0 to 8, direction prediction indicated by the mode number k is used, and when k is 9, block prediction is used. When k is 10, inter prediction is used.
  • the subtraction unit (residual calculation unit) 101 generates a residual signal from the difference between the prediction signal and the input signal.
  • the conversion unit 112 converts the residual signal.
  • the transform unit 113 quantizes the transform coefficient.
  • Scanning is performed by the scanning unit 114.
  • (S1506) Variable length coding of the transform coefficient quantized and scanned by the variable length coding unit 115 is performed.
  • the conversion coefficient evaluation unit 121 obtains an evaluation value xC indicating the characteristics of the conversion coefficient.
  • the mode estimation unit 523 estimates the prediction mode and obtains a mode estimation signal.
  • the prediction modes that can be selected by the mode restriction unit 524 are restricted, and a mode restriction signal is obtained.
  • (S1510) With reference to the mode restriction signal, it is determined whether the prediction mode corresponding to the control variable k can be selected. If it can be selected, the process proceeds to S1511.
  • the variable length encoding unit 115 encodes the flag.
  • the cost is calculated using the RD cost.
  • the code amount R is the code amount of the transform coefficient and the code amount of the flag.
  • the cost corresponding to the control variable k is set to the maximum value so that this prediction mode is not selected.
  • variable length coding unit 115 (Description of variable length coding unit 115) A flag encoding method in the variable length encoding unit 115 according to the fifth embodiment will be described.
  • the selected prediction mode is direction prediction, a value indicating whether or not the mode estimation signal is used, and when the prediction mode corresponding to the mode estimation signal is not used, it is other than the mode estimation signal.
  • a flag for selecting the prediction mode is encoded. The value indicating whether or not the mode estimation signal is used is 1 if the prediction mode corresponding to the mode estimation signal is not selected and 0 if the mode estimation signal is used.
  • the difference between the selected prediction mode and the mode estimation signal is encoded.
  • the difference between the prediction modes is a vector (difference vector).
  • the difference vector is encoded in the order of the horizontal direction and the vertical direction.
  • the feature of the transform coefficient is used to limit selectable prediction mode options depending on whether the prediction mode switching is effective.
  • the amount of codes is reduced, and encoding can be performed with high encoding efficiency.
  • the estimation method of the prediction mode is changed according to the characteristics of the transform coefficient, the estimation accuracy of the prediction mode is high, and the code amount of the flag is reduced, thereby improving the coding efficiency.
  • FIG. 26 is a flowchart for explaining another operation of the mode selection unit 522.
  • the operation example of FIG. 26 is a special example of the operation of FIG. This is because the prediction mode is estimated by matching prediction in the mode estimation unit 523 when the cbp (Coded Block Pattern) is used for evaluation of the transform coefficient, and the cbp is 0, and the prediction mode that can be selected in the mode restriction unit 524 Is limited to one.
  • cbp Coded Block Pattern
  • the control variable k is changed from 0 to 8, and the following S1606 to S1616 are repeatedly executed. Thereafter, the process proceeds to S1617.
  • the mode estimation unit 523 estimates the prediction mode when cbp ⁇ 0. In this embodiment, function prediction is used.
  • the mode estimation unit 523 restricts the mode when cbp ⁇ 0. Here, the prediction modes 0 to 8 are limited.
  • the prediction unit 111 generates a prediction signal by the prediction method (prediction mode of mode number k) indicated by the mode corresponding to the control variable k.
  • the subtraction unit (residual calculation unit) 101 generates a residual signal from the difference between the prediction signal and the input signal.
  • the transform unit 112, the quantization unit 113, and the scan unit 114 transform, quantize, and scan the residual signal.
  • the conversion coefficient evaluation unit 121 calculates an evaluation value xC of the conversion coefficient.
  • cbp is an evaluation value xC.
  • the variable length coding unit 115 codes the transform coefficient feature (cbp), the transform coefficient, and the prediction mode identification flag.
  • the cost is calculated using the RD cost calculated from the distortion amount D and the code amount R.
  • the code amount R is calculated from the transform coefficient feature (cbp), the quantized and scanned residual signal, and the code amount when the prediction mode identification flag is variable-length encoded. (S1616)
  • the cost corresponding to this control variable k is set to the maximum value so that this prediction mode is not selected.
  • the mode is estimated according to the characteristics of the transform coefficient, particularly according to whether cbp is 0 or not.
  • the mode is estimated by matching prediction using already encoded pixel values.
  • the method can be estimated with high estimation accuracy.
  • the selectable prediction mode is limited to one, the code amount of the flag indicating the prediction mode can be set to zero. Thereby, encoding efficiency can be improved.
  • the configuration including both the mode estimation unit 523 and the mode restriction unit 524 has been described.
  • the mode estimation unit 523 is provided, and the mode limitation unit 524 is not provided.
  • a configuration including the mode restriction unit 524 and not including the mode estimation unit 523 is also possible.
  • Embodiment 6 The image decoding apparatus according to the sixth embodiment decodes the encoded data generated by the image encoding apparatus 500 according to the fifth embodiment.
  • FIG. 27 is a block diagram showing a configuration of an image decoding device 600 according to Embodiment 6 of the present invention.
  • an image decoding apparatus 600 includes a variable length coding / decoding unit 201, an inverse scan unit 202, a prediction unit 111, an inverse quantization unit 116, an inverse transform unit 117, a frame memory 118, a transform coefficient evaluation unit 121, and mode decoding.
  • symbol is attached
  • the encoded data input to the image decoding device 600 is first input to the variable length encoding / decoding unit 201.
  • the variable length coding / decoding unit 201 decodes a transform coefficient, which is a residual signal transformed and quantized by variable length decoding of the coded data.
  • the decoded transform coefficient is output to the transform coefficient evaluation unit 121 and the reverse scan unit 202.
  • the conversion coefficient evaluation unit 121 calculates an evaluation value xC based on the characteristics of the conversion coefficient, and outputs the evaluation value xC to the mode estimation unit 523 and the mode restriction unit 524.
  • the mode estimation unit 523 estimates the prediction mode according to the evaluation value xC, and outputs it to the mode decoding unit 622 as a mode estimation signal.
  • the mode restriction unit 524 restricts selectable prediction modes according to the evaluation value xC, and outputs the prediction mode as a mode restriction signal to the variable length coding / decoding unit 201 and the mode decoding unit 622.
  • the variable length coding / decoding unit 201 receives a mode restriction signal and, when decoding of a flag is necessary, identifies one prediction mode from selectable prediction modes restricted by the mode restriction signal. The flag is decoded and output to the mode decoding unit 622.
  • the mode decoding unit 622 decodes the prediction mode using the mode estimation signal, the mode restriction signal, and the flag.
  • the reverse scanning unit 202 rearranges the conversion coefficients necessary for the reverse conversion.
  • the inversely scanned transform coefficient is inversely quantized by the inverse quantization unit 116, and inverse transform is performed by the inverse transform unit 117, thereby reproducing a residual signal.
  • the prediction unit 111 refers to the decoded image stored in the frame memory 118 according to the decoded prediction signal, and generates a prediction signal in the decoded prediction mode.
  • the adder 102 generates a local decoded block by adding the prediction signal and the regenerated residual signal, and stores them in the frame memory 118.
  • the mode decoding unit 622 decodes the prediction mode using the mode restriction signal, the mode estimation signal, and the flag.
  • the prediction mode is limited to one by the mode restriction signal, or when the value indicating whether the mode estimation signal is used is 1, the prediction mode specified by the mode estimation signal is set. Further, when there are a plurality of prediction modes by the mode restriction signal or when the value indicating whether or not the mode estimation signal is used is 0, the prediction mode indicated by the flag is set.
  • the operation of the image decoding apparatus 600 is the same as that shown in the flowchart of FIG. 13 described above, but in this embodiment, the scan mode in FIG. 13 is replaced with the prediction mode, and the inverse transformation performed in S1112 is S1113. This is performed in the prediction mode decoded by (mode decoding unit 422).
  • the mode identification flag is used to limit the prediction mode options that can be selected depending on whether or not the prediction mode switching is effective by using the feature of the transform coefficient.
  • the encoded data encoded with high encoding efficiency can be decoded. Further, since the estimation method of the prediction mode is changed according to the characteristics of the transform coefficient, the estimation accuracy of the prediction mode is improved, and the encoded data with the flag code amount reduced can be decoded.
  • FIG. 28 is a flowchart for explaining another operation of the image decoding apparatus 600.
  • the variable length coding / decoding unit 201 decodes cbp.
  • S1702 If cbp is other than zero, the process proceeds to S1703, and if it is 0, the process proceeds to S1709.
  • the mode estimation unit 523 estimates the prediction mode when cbp is other than 0, and the mode restriction unit 524 restricts the prediction mode.
  • a direction prediction is used here.
  • the mode decoding unit 622 decodes the prediction mode.
  • the variable length coding / decoding unit 201 decodes the transform coefficient.
  • the inverse scan unit 202 performs reverse scan of the transform coefficient.
  • the inverse quantization unit 116 performs inverse quantization of the transform coefficient.
  • the inverse transform unit 117 performs inverse transform, reproduces the residual signal, and proceeds to S1710.
  • the mode estimation unit 523 estimates the prediction mode when cbp is 0, and the mode restriction unit 524 restricts the prediction mode to one. Since the prediction mode is limited to one, the estimated prediction mode is selected.
  • the residual signal is set to 0. Note that the method described in the fifth embodiment is used for estimating the prediction mode when cbp is 0.
  • the prediction unit 111 generates a prediction signal using the decoded prediction mode.
  • the adder 102 generates a reproduction signal based on the sum of the prediction signal and the residual signal.
  • the prediction mode is estimated according to the characteristics of the transform coefficient, in particular, whether cbp is 0, thereby improving the prediction mode estimation accuracy and the coding efficiency. Further, the number of prediction modes that can be selected when cbp is 0 is limited to one, and the flag is not decoded, so that the amount of code of the flag indicating the prediction mode is reduced, and the encoded data is encoded with high encoding efficiency. Can be decrypted.
  • the configuration including both the mode estimation unit 523 and the mode restriction unit 524 has been described.
  • the mode estimation unit 523 is provided and the mode restriction unit 524 is not provided.
  • a configuration including the mode restriction unit 524 and not including the mode estimation unit 523 is also possible.

Abstract

 変換係数の特徴を用いて、モードの推定精度の向上と符号化効率の向上を図る画像符号化装置を提供する。変換係数の特徴に基づいて算出した評価値に応じて、推定するモードと選択可能なモードの範囲を制限し、制限されたモードの範囲内の所定のモードの中から符号化コストが最小となるモードを選択し、前記制限されたモードの個数が1個の場合、モードを識別するためのフラグを符号化せず、また、複数個の場合には、前記選択されたモードを符号化する。このため、モード識別用のフラグの符号化コスト量が削減され高い符号化効率で符号化でき、モードの推定精度が向上し、さらに、フラグの符号量が削減され符号化効率が向上する。

Description

画像符号化装置および画像復号装置
 本発明は、画像を符号化して符号化データを出力する画像符号化装置および該画像符号化装置で符号化された符号データを復号する画像復号装置に関する。
 画像符号化技術は、テレビジョン受像機から画像処理の可能な携帯電話まで、身近にある多くの映像機器に応用されている。
 画像符号化技術の分野では、一般に画像データ(画像情報)を複数のブロックに分割し、分割したブロック単位で符号化が行われる。ブロック単位の符号化では、入力信号に近い予測信号の生成、入力信号と予測信号の差分である残差信号の算出、算出された残差信号の変換、変換で得られた変換係数の量子化、量子化された変換係数のスキャン(走査)、量子化・スキャンされた変換係数の可変長符号化等の符号化処理がなされる。
 この可変長符号化の処理では、変換係数の他、予測信号の生成方法を示す情報も符号化される。
 予測信号の生成方法には、対象ブロック周囲の再生画像を用いて生成する画面内予測と既に符号化/復号されたフレームの再生画像を用いて生成する画面間予測がある。
 画面内予測には、DC予測、水平予測、垂直予測など複数の予測モードがあり、いずれの予測モードを用いるかを示す情報が、フラグとして符号化される。
 また、画面間予測では、予測に使う参照フレームを特定するためのフレームID、および、フレーム内の位置と動きベクトルがフラグにより符号化される。
 尚、複数の方法(モード)の候補から選択した方法を示す情報を本明細書では「フラグ」と呼ぶことにする。フラグの符号化方法としては、次のもの等があり、例えば、画面内予測における予測モードは(2)の方法、画面間予測における動きベクトルは予測ベクトルとの差分として(3)の方法で符号化される。
(1)そのまま符号化する方法。
(2)予測が当たったか否かを示す情報と予測が外れた場合の識別用の情報を符号化する方法。
(3)予測値との差分を符号化する方法。
 予め用意された複数の方法(モード)から最適な方法を選択し、モード識別用のフラグを符号化する手法は一般的なものであり、予測モード以外にも、スキャン方法、変換方法、可変長符号化テーブルなどで用いられている。
 また、フラグの符号量が大きくなる場合には、フラグを符号化することによって逆に符号化効率が低下することもあるため、フラグを明示的に符号化せず、既に符号化/復号された情報を用いて、適用するモードを決定する技術も知られている。
 特許文献1では、スキャン方法を示すフラグを明示的に符号化せず、予測画像を用いて決定する技術が開示されている。例えば、予測画像の水平方向のエッジと垂直方向のエッジを比較し、水平方向のエッジを垂直方向のエッジより多く含めば水平方向を優先するスキャン方法を用い、垂直方向のエッジを水平方向のエッジより多く含めば垂直方向を優先するスキャン方法を用いている。
 映像符号化装置では、この垂直方向のエッジか水平方向のエッジのいずれが多いかを判定する判定式を生成して符号化ストリーム内に格納し、映像復号化装置では、符号化ストリーム内に格納された判定式によって判定されたスキャン方法を用いて復号している。
 特許文献2では、変換方法を示すフラグを明示的には符号化せず、既に復号した符号化データを用いて変換方法を決定する技術が開示されている。即ち、符号化データ内の量子化パラメータ、符号化モード、動きベクトルの個数情報に基づいて変換方法を決定している。
 非特許文献1では、画面間予測のフラグである動きベクトルの符号量を削減する技術であり、復号した変換係数を逆量子化、逆変換により復号した残差信号と参照フレーム内のブロックとのマッチングを取ることによって、動きベクトルを推定することで、フラグの符号量を削減している。
特開2006-211304号公報 特開2003-204550号公報
谷田隆一他(NTT)、「画像マッチングを用いた予測ベクトル決定方法に関する一検討」、2008年画像符号化シンポジウム、P5-10
 上記の特許文献1、特許文献2では、スキャン方法および変換方法を示すフラグを明示的には符号化せず推定されたモードを用いている。しかしながら、これらの方法では、明示的にフラグを符号化する方法と異なり、推定により決定されたモードが不適切であることがあり、この場合符号量が増加してしまうことがある。
 また、変換係数の特徴(例えば、変換係数の数)とモードを切り替えた場合の効果の間には所定の関係があるにも関わらず、特許文献1、特許文献2の方法では、このような性質を活かしていない。
 例えば、変換係数の数が多い場合には、スキャン順切替の効果が大きいが、この性質を活かしていない。また、変換係数の数によって、スキャン方法や予測方法の推定の当りやすさが異なると考えられるが、変換係数の特徴に応じて推定方法を変更しないためこの性質も活かしていない。
 尚、非特許文献1は、対象ブロックの変換係数の情報を用いて、動きベクトルの推定を行うことにより、精度の高い予測ベクトルを算出し、動きベクトルの符号量を削減している。この技術は、変換係数の特徴を考慮しているが、残差信号を用いた動きベクトル推定は、変換係数が特に多い場合のみに効果がある。
 また、変換係数から得られる情報を用いて復号装置でマッチングを行うため、極めて演算負荷が高い。
 即ち、従来の符号化技術では、変換係数の特徴を用いずにモードを推定しているため、モードの推定精度が低く符号化効率も低い。
 また、変換係数の特徴を用いずにモードを決定しているため、モード切替の効果が大きい場合にもモードを推定された1個に制限するため符号化効率が低下してしまっている。
 また、モード切替の効果が小さい場合にも、使用するモードを識別するフラグを符号化するため符号化効率が低下してしまっている。
 本発明は、上述のような実情を考慮してなされたものであり、変換係数の特徴を用いて、モードの推定精度の向上と符号化効率の向上を図る画像符号化装置および画像復号装置を提供することを目的とする。
 上記課題を解決するために、本発明の画像符号化装置は、入力信号をブロック化し、該ブロック単位で前記入力信号の予測信号を生成する予測部と、前記入力信号と前記予測信号の残差信号を変換して変換係数を算出する変換部と、前記変換係数を量子化する量子化部と、前記量子化後の変換係数を一次元に並べるスキャン部と、前記スキャンされた変換係数を符号化する可変長符号化部と、を備えて符号化データを生成する画像符号化装置において、次の(1)から(3)のいずれかの構成からなる。
(1)本発明の画像符号化装置は、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを推定するモード推定部と、前記評価値に応じて、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる選択可能なモードの範囲を限定するモード制限部と、前記選択可能なモードの範囲内にある所定のモードの中から符号化コストが最小となるモードを選択するモード選択部と、を備え、前記モード選択部は、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる前記所定のモードを切り替えながら、前記入力信号に対して前記予測部、前記変換部、前記量子化部、前記スキャン部、前記可変長符号化部を動作させ、前記変換係数評価部で算出した評価値を用いて、符号化コストが最小となるモードを選択し、前記可変長符号化部は、前記制限されたモードの個数が複数個の場合には、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを識別するためのフラグを符号化する。
(2)本発明の画像符号化装置は、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる選択可能なモードの範囲を限定するモード制限部と、前記選択可能なモードの範囲内にある所定のモードの中から符号化コストが最小となるモードを選択するモード選択部と、を備え、前記モード選択部は、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる前記所定のモードを切り替えながら、前記入力信号に対して前記予測部、前記変換部、前記量子化部、前記スキャン部、前記可変長符号化部を動作させ、前記変換係数評価部で算出した評価値を用いて、符号化コストが最小となるモードを選択し、前記可変長符号化部は、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを識別するためのフラグを符号化する。
(3)本発明の画像符号化装置は、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを推定するモード推定部と、符号化コストが最小となるモードを所定のモードの中から選択するモード選択部と、を備え、前記モード選択部は、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる前記所定のモードを切り替えながら、前記入力信号に対して前記予測部、前記変換部、前記量子化部、前記スキャン部、前記可変長符号化部を動作させ、前記変換係数評価部で算出した評価値を用いて、符号化コストが最小となるモードを選択し、前記可変長符号化部は、前記推定されたモードと前記選択されたモードが同じ場合には、前記推定されたモードを利用するという情報を符号化し、また、異なる場合には、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを識別するためのフラグと、前記推定されたモードを利用しないという情報を符号化する。
 また、本発明の画像復号装置は、入力信号をブロック化し、該ブロック単位で、変換を施して量子化された変換係数を一次元に並べて符号化した符号化データを逆スキャン部によって逆スキャンし、逆量子化部によって逆量子化し、逆変換部により逆変換を施した残差信号と予測部によって既に復号された信号から予測した予測信号から前記符号化データを復号する画像復号装置において、次の(4)から(6)のいずれかの構成からなる。
(4)本発明の画像復号装置は、前記符号化データから変換係数と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを識別するためのフラグを復号する可変長復号部と、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを推定するモード推定部と、前記評価値に応じて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いる選択可能なモードの範囲を限定するモード制限部と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを、前記制限されたモードの個数が1個の場合には、前記モード推定部で推定されたモードとし、また、複数個の場合には、前記フラグで識別されるモードとするモード復号部と、を備え、前記モード復号部で復号されたモードを用いて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部を動作させて前記符号化データを復号する。
(5)本発明の画像復号装置は、前記符号化データから変換係数と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを識別するためのフラグを復号する可変長復号部と、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードの範囲を限定するモード制限部と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを、前記限定されたモードの個数が1個の場合は、前記モード制限部で限定された範囲内のモードとし、また、複数の場合には、前記フラグで識別されるモードとするモード復号部と、を備え、前記モード復号部で復号されたモードを用いて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部を動作させて前記符号化データを復号する。
(6)本発明の画像復号装置は、前記符号化データから変換係数と、推定されたモードを利用するか否かの情報と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを識別するためのフラグを復号する可変長復号部と、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを推定するモード推定部と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを、推定されたモードを利用するという情報が復号された場合には、前記モード推定部で推定されたモードとし、また、推定されたモードを利用しないという情報が復号された場合には、前記フラグで識別されるモードとするモード復号部と、を備え、前記モード復号部で復号されたモードを用いて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部を動作させて前記符号化データを復号する。
 また、上記の(1)から(3)の画像符号化装置、または、上記(4)から(6)の画像復号装置にあっては、前記変換係数評価部の評価値は、ゼロ以外の変換係数があるか否かを示す値、ゼロ以外の変換係数の個数、変換係数のゼロが続く長さ、量子化後の変換係数の大きさ、変換係数を符号化したときの符号化コスト、変換係数のばらつき、量子化後の変換係数の大きさに基づいて計算される符号化効率および最低次数の変換係数が0であるか否かを示す値のいずれか、これらの値を用いて所定の関数から算出される値、あるいは、モード推定あるいはモード限定に使われる組み合わせである。
 さらに、上記の(1)または(2)の画像符号化装置、または、上記(4)または(5)の画像復号装置の前記モード限定部は、(7)前記評価値が所定の値以下である場合よりも大きい場合に、選択可能なモードの範囲を小さく設定するか、または、(8)第一の所定値よりも大きい第二の所定値を有し、前記評価値が前記第一の所定値以下である場合、および、前記第二の所定値よりも大きい場合の選択可能なモードの範囲を、前記評価値が前記第一の所定値よりも大きく、且つ、前記第二の所定値以下である場合の選択可能なモードの範囲よりも小さく設定する。
 また、上記の(1)または(3)の画像符号化装置、または、上記(4)または(6)の画像復号装置の前記モード推定部は、前記評価値が所定の値以下である場合、既に再生済みのブロックのモード、または、既に再生済みブロックの画素値に基づいてモードを推定し、前記評価値が所定の値よりも大きい場合、所定のモードを用いる。
 本発明によれば、変換係数の特徴に応じて、モードの選択可能な選択肢を制限するため、モードの表現に必要なフラグの符号量が削減され符号化効率が向上する。
 また、変換係数の特徴に応じてモードを推定するため、モードの推定精度が向上し、符号化効率も向上する。
本発明の実施形態1に係る画像符号化装置の構成を示すブロック図である。 本発明の実施形態1,2のスキャン方法を説明する図である。 本発明の実施形態1,2における出現頻度によりモードを推定するモード推定部の構成を示すブロック図である。 本発明の実施形態1,2における出現頻度によりモードを推定するモード推定部の他の構成を示すブロック図である。 出現頻度によりスキャン方法を生成する方法を説明する図である。 本発明の実施形態1,5に係るモード制限部を説明する図である。 本発明の実施形態1に係るモード選択部の動作を説明するフローチャートである。 従来の符号化データの構成を説明する図である。 本発明の符号化データの構成を説明する図である。 本発明の実施形態1に係る変形例1のモード選択部の動作を説明するフローチャートである。 本発明の実施形態1に係る変形例2のモード選択部の動作を説明するフローチャートである。 本発明の実施形態2に係る画像復号装置の構成を示すブロック図である。 本発明の実施形態2に係る画像復号装置の動作を説明するフローチャートである。 本発明の実施形態2に係る変形例3の動作を説明するフローチャートである。 本発明の実施形態2に係る変形例4の動作を説明するフローチャートである。 本発明の実施形態3に係る画像符号化装置の構成を示すブロック図である。 本発明の実施形態3,4における出現頻度によりモードを推定するモード推定部の構成を示すブロック図である。 本発明の実施形態3に係るモード選択部の動作を説明するフローチャートである。 本発明の実施形態4に係る画像復号装置の構成を示すブロック図である。 本発明の実施形態5に係る画像符号化装置の構成を示すブロック図である。 方向予測とブロック予測を説明する図である。 関数予測とマッチング予測を説明する図である。 本発明の実施形態5,6に係るモード推定部の動作を説明するフローチャートである。 本発明の実施形態5,6に係るモード推定部の他の動作を説明するフローチャートである。 本発明の実施形態5に係るモード選択部の動作を説明するフローチャートである。 本発明の実施形態5に係るモード選択部の他の動作を説明するフローチャートである。 本発明の実施形態6に係る画像復号装置の構成を示すブロック図である。 本発明の実施形態6に係る画像復号装置の他の動作説明するフローチャートである。
 以下、図面を参照して本発明に係る実施の形態について説明する。
 尚、実施形態1および2は、スキャンモードを選択する場合の画像符号化装置および画像復号装置に関するものであり、実施形態3および4は、変換モードを選択する場合の画像符号化装置および画像復号装置に関するものであり、実施形態5および6は、予測モードを選択する場合の画像符号化装置および画像復号装置に関するものである。
 この場合、選択対象以外のモードについてはあらかじめ定めておくものとする。
 本発明は、このようにスキャンモード、変換モード、予測モードを個々に選択するだけでなく、任意の組み合わせでモードを選択するものとしても同様に適用できる。
<<実施形態1>>
 実施形態1では、スキャンモードを選択して符号化する場合について説明する。この場合、変換方式、量子化方式はあらかじめ定めておくものとする。
(画像符号化装置100の構成)
 図1は、本発明の実施形態1に係る画像符号化装置100の構成を示すブロック図である。同図において、画像符号化装置100は、予測部111、変換部112、量子化部113、スキャン部114、可変長符号化部115、逆量子化部116、逆変換部117、フレームメモリ118、変換係数評価部121、モード選択部122、モード推定部123、モード制限部124、減算部101、加算部102を備えている。図中の符号、103は変換部112から出力される変換係数、104は量子化部113から出力される量子化済み変換係数、105はスキャン部114から出力されるスキャン済み変換係数、106は可変長符号化部115から出力される可変長符号化される変換係数の情報、例えば、符号量を示している。
(画像符号化装置100の動作)
 画像符号化装置100は、入力された画像をブロックに分解し、各ブロックに対して、まず、モード選択部122を動作させると、変換部112、量子化部113、スキャン部114、可変長符号化部115、変換係数評価部121、モード推定部123、モード制限部124を動作させてスキャンモードを選択し、選択されたスキャンモードがスキャン部114、可変長符号化部115に送られる。
 次に、入力された画像に対して、選択されたスキャンモードを用いて従来の符号化処理を実行する。
 尚、予測部111、変換部112、量子化部113、スキャン部114、可変長符号化部115、逆量子化部116、逆変換部117、フレームメモリ118、減算部101、加算部102は、従来の符号化処理であるので、以下簡単に説明する。
 予測部111は、入力信号の予測信号を生成する。
 減算部101は、入力信号と予測信号の差分から残差信号を得る。
 変換部112は、残差信号に対しDCT変換などにより変換係数を算出する。
 量子化部113は変換係数を量子化する。量子化された変換係数は、一方では、スキャン部114で一次元に並べられ、可変長符号化部115で符号化される。量子化された変換係数は他方では、逆量子化部116で逆量子化、逆変換部117で逆変換が行われ、残差信号が再生される。
 再生された残差信号と予測信号は、加算部102で加算され局所復号ブロックが再生される。再生された局所復号ブロックは、フレームメモリ118に格納される。
 次に、本発明に係る構成要素(変換係数評価部121、モード選択部122、モード推定部123、モード制限部124)および上述の従来の構成要素のうち追加機能について説明する。
 図2は、本発明で用いるスキャン方法を説明する図である。図2は、4×4の変換係数を表し、図中の0から15の値は、変換係数の位置毎にスキャンされる順番を示す。
 図2(B)に示す垂直優先スキャンは、垂直方向にゼロでない変換係数が集中するような横方向の模様があるブロックで有効であり、逆に、図2(C)に示す水平優先スキャンは、水平方向にゼロでない変換係数が集中するような縦方向の模様があるブロックに有効である。図2(A)のジグザグスキャンは、垂直優先でも水平優先でもないスキャンである。
 スキャン部114は、ジグザグスキャン、垂直優先スキャン、水平優先スキャンから選択されたいずれかのスキャン方法(以下、スキャンモード)を用いる。スキャンモードの選択は、モード選択部122で行われる。
 尚、スキャンモードをこれら3つに制限する必要は無く、後述するように出現確率に基づくスキャンなど他のスキャンモードを用いても良い。本実施形態1ではスキャンモードを識別するためのモード番号を、ジグザグスキャンを1、垂直方向優先を2、水平方向優先を3とする。他のスキャンモードを用いる場合のモード番号は0とする。
(変換係数評価部121の説明)
 変換係数評価部121は、予め設定しておいた評価方法によって変換係数の情報からその特徴を示す評価値xCを算出する。
 変換係数評価部121への入力は、評価方法により異なる。評価が符号量に依存する場合は、106の符号量を入力する。スキャン方法に依存する場合は、105のスキャン後の変換係数を入力する。量子化方法に依存する場合には、104の量子化済み変換係数を入力する。変換方法に依存する場合には、103の変換係数を入力する。
 評価値xCの算出方法には様々なものがあり、以下に主な算出方法を説明する。
(方法A)
 対象ブロック内のゼロ以外の変換係数の数nCを評価値xCとする。
(方法A´)
 一次元に並べられた変換係数のうち、0が続く変換係数の長さ(0である変換係数が長く並ぶほど大きくなる値)lCを評価値xCとする。
 例えば、lCは、一次元に並べられた変換係数において、0である変換係数が連続する数の最大値を示す。また、lCは、一次元に並べられた変換係数のうち、0である変換係数の最後の連続以外の場合の、0である変換係数が連続する数の最大値を示す。
(方法B)
 量子化後の変換係数の大きさmCを評価値xCとする。
 例えば、mCは、量子化後の変換係数の絶対値最大値、あるいは、量子化後の変換係数の絶対値の和、あるいは、量子化後の変換係数の2乗の和等とする。
(方法C)
 対象ブロック内の変換係数を符号化した場合の符号量rCを評価値xCとする。
(方法D)
 変換係数のばらつきvCを評価値xCとする。
 例えば、vCは、対象ブロック内の変換係数の分散、あるいは、対象ブロック内の変換係数の標準偏差等とする。
(方法E)
 量子化後の変換係数の大きさmCと、ゼロ以外の変換係数の数nCから計算される符号化効率eCを評価値xCとする。
 変換係数を逆量子化し、逆変換して得られる信号が残差信号であるが、少ないnCでより多くの残差のエネルギーを表現できれば、その方法は符号化効率が高いと考えられ、eCは、この効率を表現するものである。
 eCの算出方法は、様々なものがあり、例えば、mC/nCなどがある。
(方法E´)
 また、ゼロ以外の変換係数の数nCの代わりに変換係数の符号量rCを用いて符号化効率eCを算出してもよく、例えば、mC/rCなどがある。
 なお、mCの評価方法は、方法Bで説明したものであり、変換係数を逆量子化し、逆変換して得られる残差信号のエネルギーに関わるものであれば良い。
 尚、eCを計算する関数(入力はmC、nC、rC)は、上記説明によらず、mCについて単調増加、nC、rCについて単調減少する関数であればいずれでも構わない。
(方法F)
 ゼロ以外の変換係数が存在する(ゼロ以外の変換係数の数nCが0でない)か否かを示すcbp(Coded Block Pattern)の値fCを評価値xCとする。
 fC=0(nCが0の場合)
 fC=1(nCが0以外の場合)
(方法G)
 最低次数の変換係数がゼロであるか否かを示す値dCを評価値xCとする。DCT変換、アダマール変換では、最低次数の変換係数はDC係数になる。
 dC=0(最低次数の変換係数がゼロの場合)
 dC=1(最低次数の変換係数がゼロ以外の場合)
 また、方法Aから方法Gで説明した値nC、lC、mC、rC、vC、eC、fC、dCを複数個用いて算出される式、例えば(nC+vC)を評価値xCとしてもよい。
(モード推定部123の説明)
 モード推定部123は、変換係数評価部121から出力される評価値xCに応じて、スキャンモードを推定し、モード推定信号として出力する。
 変換係数の数が小さい場合など、変換係数の特徴を示す評価値xCが小さい場合には、残差信号が小さい、即ち、予測信号が原画とよく合っていることを示している。
 予測画像を画面内予測によって求める場合には、符号化対象ブロックが周囲のブロックと似ていることが考えられる。
 画面間予測を行っている場合に、符号化対象ブロックがその周囲のブロックと大きく異なる動きをしているときには、予測が当らなくなると考えられるから、それ以外は画面間予測においても、符号化対象ブロックとその周囲のブロックはある程度、似ていると考えられる。また、符号化対象ブロックと予測画像の生成に用いた参照フレームのブロックは似ていると考えられる。
 このように、符号化対象ブロックとその周囲のブロック間(もしくは、参照フレームのブロック)で同じような性質を持つと考えられ、既に符号化した周囲のブロック(もしくは参照フレームのブロック)から高精度にモードを推定できる。
 逆に、評価値xCが大きい場合には既に符号化した周囲のブロックとの違いが大きくモードの推定は困難である。
 モード推定部123は、この性質に基づき、変換係数の特徴を示す評価値xCが小さい場合には、上ブロックのスキャンモードと左ブロックのスキャンモードのうち、優先順位の高い方のスキャンモードをモード推定信号とし、評価値xCが大きい場合には、ジグザグスキャンをモード推定信号とする。ここでは、優先順位はジグザグスキャン、垂直優先スキャン、水平優先スキャンの順である。本実施形態の場合、優先順位の高い順にモード番号が振られているので、モード番号の小さい方を選択するだけで優先順位の高い方のモードを選択できる。
 尚、変換係数の特徴を示す評価値xCが小さいかどうかを判定するための閾値は、以下のような実験により定める。
 まず、複数のテスト画像を準備した上で、所定の閾値を複数、定める。テスト画像の一つに対してある定めた閾値の1つを選択し順に符号化を行うことで、すべてのテスト画像、すべての閾値の組み合わせについて符号化を行う。
 次に、符号化結果を用いて、シーケンス全体の符号量と、シーケンス全体に対する局所復号画像と入力画像の残差から、RDコストを算出する。
 続いて、閾値毎に、用いたテスト画像で平均することで閾値に対する平均RDコストを算出する。
 最後に、平均RDコストが最小となる閾値を選択することで、最適な閾値パラメータを定めることができる。
(RDコストの説明)
 RDコストは、歪み量Dと符号量Rおよび所定の定数λから計算されるコストであり、次の式(1)で求める。
 RDコスト = D + λR   … (1)
 ここで、λは、歪み量Dと符号量Rのバランスをとるための値であり、通常、量子化パラメータの値によって定める。
 歪み量Dは、選択した符号化モードにおいて、逆量子化、逆変換を行い、予測信号との和により、局所復号画像を生成し、局所復号画像と入力画像との絶対値差分和(もしくは2乗差分和)を歪み量Dとする。符号量Rは、符号化モードの符号量と、変換係数の符号量の和から算出する。
 このRDコストは、歪み量Dが小さい場合、また、符号量Rが小さい場合に小さくなる値であり、複数の符号化モードにおけるRDコストを算出しておいた上で、RDコスト最小の符号化モードを選択し符号化を行うことで、符号量Rを抑えながら、歪み量Dを小さくするという意味で最適な符号化モードで符号化が可能である。尚、符号化モードを選択する場合に用いる符号化コストとしては、RDコスト以外に、歪み量D、符号量Rなども用いることができる。
 一般に、残差信号においては、横方向にエッジがある場合が、縦方向にエッジがある場合よりも多いことから上記の順序(ジグザグスキャン、垂直優先スキャン、水平優先スキャンの優先順位)を用いているが、シーケンス毎、フレーム毎、複数のブロックの組毎に符号化するヘッダ情報に、スキャン順の優先順序を符号化し、適当な単位で変更しても良い。
 尚、スキャンモードの推定には他の方法も適用可能である。例えば、すでに符号化されたゼロ以外の変換係数の位置毎の出現頻度(もしくは、出現確率)を算出することを用いた方法が考えられ、以下に、2つの方法を示す。
 図3は、出現頻度に基づく推定方法を用いたモード推定部123の構成を示すブロック図である。同図において、モード推定部123は、出現頻度を格納するための頻度格納部1001、出現頻度を測定する頻度測定部1002、出現頻度の偏りを評価する頻度評価部1003、モード推定信号を決定するモード推定信号決定部1004から構成されている。
 頻度格納部1001は、変換係数の位置の個数分(図2の例では、4×4個)の整数値を格納する。以下、変換係数の位置を(x、y)で示す場合に、保持される値(頻度)をM(x、y)で表す。
 頻度測定部1002は、フレーム先頭もしくはスライス先頭の場合に、頻度格納部1001のすべての頻度M(x、y)をゼロに初期化する。変換係数を符号化する場合に、すべての変換係数の位置に対して、その位置の変換係数がゼロ以外であれば、頻度格納部1001で保持される頻度M(x、y)を1だけインクリメントする。
 頻度評価部1003は、頻度格納部1001の値を評価し、出現頻度がどのように集中しているかを示す値を出力する。例えば、出現位置が水平方向に集中しているかを示す評価値Hと、垂直方向に集中しているかを示す評価値Vを算出し、Hが所定の定数以上でありH>Vであれば3、Vが所定の定数以上でありV>Hであれば2、どちらでもなければ1を出力する。
 モード推定信号決定部1004は、頻度評価部1003の出力に従いモード推定信号を決定する。例えば、1であればジグザグスキャン、2であれば垂直スキャン、3であれば水平スキャンをモード推定信号とする。
 以上の方法により、既に符号化されたゼロ以外の変換係数の位置毎の出現頻度に応じてスキャンモードの推定が可能である。
 図4は、出現頻度に基づく推定方法を用いたモード推定部123の他の構成を示すブロック図である。同図において、モード推定部123は、頻度格納部1001、頻度測定部1002、出現頻度からスキャン順を生成するスキャン順生成部1103、モード推定信号を決定するモード推定信号決定部1104から構成されている。頻度格納部1001と頻度測定部1002は既に説明した通りなので説明を省略する。
 スキャン順生成部1103は、頻度格納部1001に格納された出現頻度の大きい順に、変換係数の位置を並べる。並べられた変換係数の位置は、スキャンモードとして用いることができる。
 例えば、図5は、このようなスキャンモードを生成する方法を示す図であり、図5(A)は変換係数毎の出現頻度を表し、図5(B)は出現頻度の高い順をスキャン順序とするスキャンモードである。
 モード推定信号決定部1104は、モードの種別を示す信号と、具体的なモードの内容を示す信号をモード推定信号として出力する。例えば、モード種別は番号0(上述したように、ジグザグスキャン、垂直優先スキャン、水平優先スキャン以外のモードのときは番号を0としている。)とし、スキャンモードの内容を示す情報は、スキャン順生成部1103で生成されたスキャン順(位置情報を並べた信号)とする。
(モード制限部124の説明)
 モード制限部124は、変換係数評価部121から出力された評価値xCに応じて、選択可能なスキャンモードを制限し、モード制限信号として出力する。モード制限信号は、選択可能なスキャンモードの数と、選択可能なスキャンモードの範囲を示す信号である。但し、選択可能なスキャンモードが1個の場合には、選択可能なスキャンモードの範囲は不要とし、選択可能なスキャンモードの数のみで良い。
 選択可能なスキャンモードを制限するほど、スキャンモードを識別するためのフラグの符号量を削減することができ、特に、選択可能なスキャンモードが1個の場合には、フラグの符号化は不要となる。
 スキャンモードの切替により符号量が削減できるのは、ゼロとなる変換係数の偏りを大きくする、即ち、ゼロとなる変換係数がより長く連続するように偏らせる場合、および、ゼロとなる変換係数をスキャン順の後半に偏らせることができる場合である。
 そのため、対象ブロックにおいてゼロ以外の変換係数の数nCが特に少ない場合、逆にnCが特に多い場合にはスキャンモードの切替えは効果が小さい。
 また、符号量rCが小さい場合には、フラグを用いて多くの選択肢からスキャンモードの切替を行うと、符号量rCに比べてフラグの符号量が大きくなり全体として符号量が増加する可能性がある。そのため、符号量rCが特に小さい場合には、選択肢の数は少なく、例えば1個にするのがよい。
 次に、変換係数の大きさmC、ばらつきvC、符号化効率eC、cbpのfC、dCとの関係を以下に説明する。
 量子化後の変換係数の大きさmCが大きい場合には、大きい変換係数を先に符号化した方が高い符号化効率となることから、そうなるようにスキャン順を変更する効果が大きい。そのため選択肢をmCが小さい場合より多くする。
 ばらつきvCが大きい場合も、大きな変換係数を先に符号化する効果があるため、選択肢をvCが小さい場合より多くする。符号化効率が高い場合もスキャン順の選択肢を多くする。
 cbpのfCがゼロの場合には選択肢をゼロとする。
 最低次数の変換係数dCが大きい場合には、通常のジグザグスキャンの場合にも、大きな変換係数が先に符号化される効果が得られることから、選択肢をdCが小さい場合より少なくする。
 図6は、モード制限部124の動作を説明する図である。図6(A)に示すように一つの方法では、変換係数の評価値xCが所定の値THX0よりも小さい場合には、選択可能なスキャンモードの数を1個に制限する。所定の値THX0以上である場合には、選択可能なスキャンモードの数をN個(N>1)とする。
 他の方法では、図6(B)に示すように、変換係数の評価値xCが所定の値THX0よりも小さい場合には、選択可能なスキャンモードの数を1個に制限する。所定の値THX0以上であり他の所定の値THX1より小さい場合には、選択可能なスキャンモードの数をN1個(N1>1)とする。所定の値THX1以上である場合には、選択可能なスキャンモードの数をN2個とする。
 選択可能なスキャンモードの数が1個より大きい場合には、選択可能なスキャンモードの数に加え、選択可能なスキャンモードの範囲としてモード番号のリストを出力する。ここでは2個であればモード番号を示す1、2を出力し、3個であれば、1、2、3を出力する。
 尚、モード推定部123とモード制限部124は異なる変換係数の評価値xCを用いても構わない。即ち、モード推定部123では符号量rCを用い、モード制限部124では変換係数の数nCを用いる構成でも良い。
 また、所定の値THX0、THX1は、以下のような実験により定める。
 まず、複数のテスト画像を準備した上で、所定の値THX0、THX1の数種類の組合せ(閾値パラメータ)を定める。テスト画像の一つに対してある定めた閾値パラメータの1つを選択し順に符号化を行うことで、すべてのテスト画像、すべての閾値パラメータの組み合わせについて符号化を行う。
 次に、符号化結果を用いて、シーケンス全体の符号量と、シーケンス全体に対する局所復号画像と入力画像の残差から、RDコストを算出する。
 続いて、閾値パラメータ毎に、用いたテスト画像で平均することで閾値パラメータに対する平均RDコストを算出する。
 最後に、平均RDコストが最小となる閾値パラメータを選択することで、最適な閾値パラメータを定めることができる。
 また、モード制限を行う場合の制限するスキャンモードは、以下のような実験により定める。
 まず、複数のテスト画像を準備し、選択されたスキャンモードの数を数える装置を追加した画像符号化装置を設ける。この画像符号化装置は、モード制限を行わずに動作するものとし、本明細書で説明する画像符号化装置である必要はなく、従来からある画像符号化装置で構わない。
 このモード選択を行わない画像符号化装置を用いて、準備したすべてのテスト画像に対して符号化を行う。
 次に、選択された数に対し、テスト画像を用いて平均した値を算出する。モード制限部124で用いるスキャンモードは、選択された数が多い順にN個分のスキャンモードとする。N個の数は、スキャンモード毎に選択された選択率を算出し、選択率が高いものからM個の選択率を合計した場合の累積選択率の値が所定の割合(例えば、50%)を超える初めてのMの値を用いる。
(モード選択部122の説明)
 モード選択部122は、モード推定部123およびモード制限部124の出力値に基づいてスキャンモードを選択する。図7のフローチャートを用いて、モード選択部122の動作を説明する。(尚、以下の説明の左端の括弧付きの記号、例えば、(S1001)等は、図7の処理ボックスに対応している。)
(S1001)予測部111により予測信号を生成する。
(S1002)減算部101により予測信号と入力信号の差分から残差信号を生成する。
(S1003)変換部112により残差信号を変換する。
(S1004)量子化部113により変換係数を量子化する。
(L1001)制御変数kを1から3まで変化させて、以下のS1005~S1013を繰り返し実行する。その後S1014に進む。尚、出現確率に基づくスキャンモードを用いる場合には、このモード番号を0として、制御変数k=0,1,2,3に対して以下の処理を行う。
(S1005)スキャン部114により制御変数kに対応するスキャンモード(モード番号kのスキャンモード)でスキャンする。
(S1006)可変長符号化部115により量子化、スキャンされた変換係数の可変長符号化を行う。
(S1007)変換係数評価部121で変換係数の特徴を示す評価値xCを得る。
(S1008)変換係数評価部121の評価値xCに従い、モード推定部123でスキャンモードを推定し、モード推定信号を得る。
(S1009)変換係数評価部121の評価値xCに従い、モード制限部124で選択可能なスキャンモードを制限し、モード制限信号を得る。
(S1010)モード制御信号を参照して、制御変数kに対応するスキャンモードが選択可能かを判定する。選択可能な場合はS1011、選択不可能な場合にはS1013に進む。
(S1011)可変長符号化部115によりフラグを符号化する。
(S1012)歪み量Dと符号量Rから算出されるRDコストを用いてコストを算出する。符号量Rは、変換係数の符号量とフラグの符号量とする。
(S1013)このスキャンモードが選択されないように、制御変数kに対応するコストを最大値に設定する。
(S1014)コスト最小となるスキャンモードを選択し、スキャン部114および可変長符号化部115に出力する。
 このような動作により、変換係数の特徴に従いスキャンモードが推定され、またその評価値xCに従い選択可能なスキャンモードを制限するので、最適なスキャンモードを選択することができる。
(可変長符号化部115の説明)
 可変長符号化部115は、スキャン部114で一次元に並べられた量子化変換係数を符号化するとともに、モード制限部124で選択可能なスキャンモードが1個に制限される場合、スキャンモードをフラグとして符号化しない。また、モード推定部123で推定されたスキャンモードと選択されたスキャンモードが同じ場合には、モード推定信号が用いられるか否かを示す値を1として符号化し、選択されたスキャンモードをフラグとして符号化しない。
 また、モード制限部124で選択可能なスキャンモードが1個に制限されない場合や、モード推定信号(推定されたモード)と選択されたスキャンモードが異なる場合には、モード推定信号が用いられるか否かを示す値を0として符号化し、選択されたスキャンモードを識別するためのフラグを符号化する。
 尚、モード選択部122でスキャンモードを選択する間に、可変長符号化部115で行う符号化は、符号量を測定するための仮の符号化であり、符号化データは外部に出力せずに破棄する。
 また、フラグの符号化方法には、選択されたスキャンモードとモード推定信号の差分を符号化する方法もある。
(本発明の符号化データ)
 本発明では、符号化データ中にフラグが存在するかどうかを、変換係数の特徴により判定する。そのため、符号化データは、変換係数の符号よりもフラグの符号が後に位置する構成、もしくは、変換係数の特徴を示す符号よりもフラグの符号が後に位置する構成にする必要がある。
 図8は、従来の符号化データの構成を示す図であり、図9は本発明の符号化データの構成を示す図である。図9のフラグは、スキャン方法のフラグ、変換方法のフラグあるいは予測方法のフラグである。従来は、図8のようにフラグの次に変換係数が符号化されていたが、本発明では、図9(A)のように変換係数の次にフラグが符号化される。尚、フラグの符号化が必要ではない場合にはフラグは存在しない。これ以外にも、図9(B)乃至(E)の構成をとることができる。
 図9(B)は、変換係数を2つ以上に分け、一部分をフラグの前で符号化し、残る部分をフラグの後で符号化する。2つに分ける方法としては、例えば、低周波成分を前半、高周波成分は後半に分ける方法、また、例えば、ゼロでない変換係数の位置を示す情報(ラン)を前半、ゼロでない変換係数の値を後半に分ける方法がある。ゼロでない変換係数の位置からはゼロでない変換係数の数の情報も取得することができる。
 図9(C)は、変換係数の特徴を示す情報をフラグの前に符号化し、変換係数をフラグの後に符号化する。変換係数の特徴としては、cbp、変換係数の数、変換係数を可変長符号化するテーブルを示すフラグなどがある。
 図9(D)は、図9(C)の変換係数の特徴がcbpの場合を示している。
 図9(E)は、変換係数のランをフラグの前に符号化し、変換係数のレベルをフラグの後に符号化する構成を示している。
 変換係数は、通常、変換係数の位置を示すランと、変換係数の大きさを示すレベルに分けて符号化される。例えば、スキャン順に、(1,2,0,0,-4,・・・)となる変換係数を符号化する場合には、ランとレベルの組として(0,1)、(0、2)、(2、-4)、・・・を順に符号化する。
 以上、説明した画像符号化装置100では、変換係数の特徴を用いることにより、スキャンモードの切替が有効であるか否かに応じて選択可能なスキャンモードの選択肢を制限するため、モード識別用のフラグの符号量が削減され高い符号化効率で符号化できる。
 また、変換係数の特徴に応じて、スキャンモードの推定方法を変えるため、スキャンモードの推定精度が向上し、さらに、フラグの符号量が削減され符号化効率が向上する。
 上述の実施形態1では、モード推定部123とモード制限部124の両者を備える構成を説明したが、変形例として、モード推定部123のみを備えモード制限部124を備えない構成、および、モード推定部123を備えず、モード制限部124のみを備える構成も考えられる。
<<変形例1>>
(モード推定部123のみを備える構成)
 図10は、モード制限部124を備えず、モード推定部123を備える変形例1のモード選択部122の動作を説明するフローチャートである。
 この場合のモード選択部122の動作は、図7を用いて説明したものと基本的に同じであるが、S1009のモード制限信号を得る動作、S1010の判定/分岐の動作、S1013のスキャンモードが選択されないようにコストを設定する動作がない点が異なっている。
<<変形例2>>
(モード制限部124のみを備える構成)
 図11は、モード推定部123を備えず、モード制限部124を備える変形例2のモード選択部122の動作を説明するフローチャートである。
 この場合のモード選択部122の動作は、図7を用いて説明したものと基本的に同じであるが、S1008のモード推定信号を得る動作がない点が異なっている。
 また、先に説明したモード制限部124は、選択可能なスキャンモードの数が1個より大きい場合には、選択可能なスキャンモードの数に加え、選択可能なスキャンモードの範囲としてモード番号のリストを出力する動作であったが、本変形例2の場合には、選択可能なスキャンモードの数が1個の場合にも、選択可能なスキャンモードの範囲(ここでは1個なのでスキャンモード)を出力する。
<<実施形態2>>
 実施形態2の画像復号装置は、実施形態1の画像符号化装置100で生成された符号化データを復号する。
(画像復号装置200の構成)
 図12は、本発明の実施形態2に係る画像復号装置200の構成を示すブロック図である。同図において、画像復号装置200は、可変長符号化復号部201、逆スキャン部202、予測部111、逆量子化部116、逆変換部117、フレームメモリ118、変換係数評価部121、モード推定部123、モード制限部124、モード復号部222、加算部102を備えている。尚、上記構成のうち、実施形態1と同様の構成要素に関しては同一の符号を付し、その説明を省略する。
(画像復号装置200の動作)
 画像復号装置200に入力された符号化データは、まず、可変長符号化復号部201に入力される。可変長符号化復号部201は、符号化データの可変長復号により、予測方法を示す信号と変換・量子化された残差信号である変換係数を復号する。復号された変換係数は、変換係数評価部121および逆スキャン部202に出力される。
 変換係数評価部121は、変換係数の特徴を評価し、評価値xCをモード推定部123、モード制限部124に出力する。
 モード推定部123は、評価値xCに応じてスキャンモードを推定し、モード推定信号としてモード復号部222に出力する。
 モード制限部124は、評価値xCに応じて選択可能なスキャンモードを制限し、モード制限信号を可変長符号化復号部201、モード復号部222に出力する。
 可変長符号化復号部201は、モード制限信号を受信し、フラグの復号が必要な場合には、モード制限信号によって制限された選択可能なスキャンモードから、1個のスキャンモードを識別するフラグを復号し、モード復号部222に出力する。
 モード復号部222は、モード推定信号、モード制限信号、フラグを用いてスキャンモードを復号する。
 逆スキャン部202は、復号されたスキャンモードにより逆変換に必要な並びに変換係数を並びかえる。逆スキャンされた変換係数は、逆量子化部116で逆量子化、逆変換部117で逆変換が行われ、残差信号が再生される。再生された残差信号と予測信号は加算部102で加算され局所復号ブロックが再生される。再生された局所復号ブロックはフレームメモリ118に格納される。
(モード復号部222の説明)
 モード復号部222は、モード制限信号、モード推定信号、フラグを用いてスキャンモードを復号する。モード制限信号によりスキャンモードが1個に制限される場合や、モード推定信号が用いられるか否かを示す値が1の場合には、モード推定信号で指定されるスキャンモードとする。
 また、モード制限信号によりスキャンモードが複数である場合や、モード推定信号が用いられるか否かを示す値が0の場合には、フラグが指示するスキャンモードとする。
 図13は、本発明の実施形態2に係る画像復号装置200の動作を説明するフローチャートである。
(S1101)可変長符号化復号部201で、変換係数を復号する。但し、図9の(B)乃至(E)のように変換係数の特徴と変換係数が分割されて符号化されている場合には、変換係数の特徴あるいは変換係数の一部を復号する。
(S1102)変換係数評価部121で、変換係数の評価値xCを算出する。
(S1103)モード推定部123で、変換係数の評価値xCに応じてスキャンモードを推定する。
(S1104)モード制限部124で、変換係数の評価値xCに応じて選択可能なスキャンモードの制限を行う。
(S1105)スキャンモードが1個に制限される場合には、フラグの復号が不要と判定され、S1107に進む。フラグの復号が必要な場合には、S1106に進む。
(S1106)フラグを復号する。例えば、モード推定信号をもちいるか否かを示す値が0の場合には、さらに追加のフラグを復号する。または、スキャンモードとモード推定信号の差分を復号する。
(S1107)スキャンモードが1個に制限される場合、もしくは、モード推定信号をもちいるか否かの値が1の場合には、推定されたスキャンモードを使用するスキャンモードとして復号する。それ以外の場合には追加のフラグを用いて、選択可能なモードの中から使用するスキャンモードを復号する。または、モード推定信号の差分から、使用するスキャンモードを復号する。
(S1108)可変長符号化復号部201で、変換係数が復号済みかを判定する。S1101で変換係数の特徴もしくは変換係数の一部を復号した場合にはS1109に進み、全ての変換係数が復号済みであればS1110に進む。例えば、S1101でcbpが復号されcbpが0となる場合はS1110に進む。
(S1109)可変長符号化復号部201で、残りの変換係数を復号する。
(S1110)逆スキャン部202で、変換係数を逆スキャンする。
(S1111)逆量子化部116で、変換係数の逆量子化を行う。
(S1112)逆変換部117で、逆変換を行い、残差信号を復号する。
(S1113)予測部111で、予測信号を生成する。
(S1114)加算部102で、予測信号と残差信号の和をとり、再生信号を生成する。
 以上、説明した画像復号装置200では、変換係数の特徴を用いることにより、スキャンモードの切替が有効であるか否かに応じて選択可能なスキャンモードの選択肢を制限するため、モード識別用のフラグの符号量が削減され高い符号化効率で符号化された符号化データを復号できる。
 また、変換係数の特徴に応じて、スキャンモードの推定方法を変えるため、スキャンモードの推定精度が高く、さらに、フラグの符号量が削減された符号化データを復号できる。
 上述の実施形態2では、モード推定部123とモード制限部124の両者を備える構成を説明したが、変形例として、モード推定部123を備え、モード制限部124を備えない構成、および、モード推定部123を備えず、モード制限部124を備える構成も可能である。
<<変形例3>>
(モード推定部123のみを備える構成)
 図14は、モード制限部124を備えず、モード推定部123を備える変形例3の画像復号装置200の動作を説明するフローチャートである。
 この場合のモード選択部122の動作は、図13を用いて説明したものと基本的に同じであるが、S1104のモード制限信号を得る動作と、S1105の判定、分岐がない点が異なっている。また、モード推定信号をもちいるか否かの値が1である場合には、推定したモードを用いて復号し、値が0の場合にはフラグで指定されているモードをもちいて復号する。
<<変形例4>>
(モード制限部124のみを備える構成)
 図15は、モード推定部123を備えず、モード制限部124を備える変形例4の画像復号装置200の動作を説明するフローチャートである。
 この場合のモード選択部122の動作は、図13を用いて説明したものと基本的に同じであるが、S1103のモード推定信号を得る動作がない点が異なっている。
 また、この場合のモード制限部124は、選択可能なスキャンモードの数が1個の場合にも、選択可能なスキャンモードを出力する。
<<実施形態3>>
 実施形態3では、変換モードを選択して符号化する場合について説明する。この場合、量子化方式、スキャン方式はあらかじめ定めておくものとする。
(画像符号化装置300の構成)
 図16は、本発明の実施形態3に係る画像符号化装置300の構成を示すブロック図である。同図において、画像符号化装置300は、予測部111、変換部112、量子化部113、スキャン部114、可変長符号化部115、逆量子化部116、逆変換部117、フレームメモリ118、変換係数評価部121、モード選択部322、モード推定部323、モード制限部324、減算部101、加算部102を備えている。尚、上記構成のうち、実施形態1と同様の構成要素に関しては同一の符号を付し、その説明を省略する。
(画像符号化装置300の動作)
 画像符号化装置300は、入力された画像をブロックに分解し、各ブロックに対して、まず、モード選択部322を動作させると、変換部112、量子化部113、スキャン部114、可変長符号化部115、変換係数評価部121、モード推定部323、モード制限部324を動作させて変換モードを選択し、選択された変換モードが変換部112、逆変換部117、可変長符号化部115に送られる。
 次に、入力された画像に対して、選択された変換モードを用いて従来の符号化処理を実行する。
 尚、変換部112が用いる変換方法は、本実施形態では、DCT変換、2次元KLT変換、1次元KLT変換とする。KLT変換は、DCT変換と同じく線形直交変換である。但し、DCT変換が離散コサイン基底に基づく基底であるのに対し、KLT変換は、実画像を用いて予め小数の変換係数にエネルギーが集中するように計算された基底を用いる。
 2次元KLT変換は、水平方向のKLT変換と、垂直方向のKLT変換を直列に行う。
 1次元KLT変換は、ブロック単位に1次元に並べ替えた数値列に対し1回のKLT変換を行う。尚、DCT変換、KLT変換に限らず離散サイン変換であるDST変換、ウェーブレット変換、ガボール変換、スラント変換などを用いても良い。
 本実施形態では、変換方法(変換モード)を示すモード番号を、DCT変換を1、2次元KLT変換を2、1次元KLT変換を3とする。
(モード推定部323の説明)
 モード推定部323は、変換係数評価部121から出力された評価値xCに応じて変換モードを推定し、モード推定信号として出力する。
 変換係数の特徴を示す評価値xCが小さい場合には、周囲からブロックの情報を用いた推定が当ると考えられるので上ブロックと左ブロックのうち、優先度の高い方のモード番号をモード推定信号とする。一般に、KLT変換の方がDCT変換よりも符号化効率が高く、2次元変換の方が1次元変換よりも符号化効率が高いので、2次元KLT変換、DCT変換、1次元KLT変換の順に選択する。
 また、評価値xCが大きい場合には、予測が当りにくいと考えられるので、周囲のブロックの情報を利用した予測は行わず固定的にDCT変換を示すモード番号(1)をモード推定信号とする。
 また、すでに符号化されたブロックの変換モードの出現頻度を利用してモード推定信号を定める方法もある。
 図17は、出現頻度に基づく推定方法を用いたモード推定部323の構成を示すブロック図である。図17において、モード推定部323は、使用された変換モードを格納する変換モード格納部1201、変換モード測定部1202、変換モードの頻度を評価する変換モード頻度評価部1203、モード推定信号を決定するモード推定信号決定部1204から構成されている。
 変換モード格納部1201は、ブロックの位置ごとに、使用された変換モードの種別を格納する。ブロックの位置(x、y)ごとに、使用された変換モードの種別T(x、y)を格納する。
 変換モード測定部1202は、フレーム先頭もしくはスライス先頭の場合に、変換モード格納部1201のすべての種別T(x、y)をゼロに初期化する。また、変換係数を符号化する場合に、使用された変換モードの値をT(x、y)に格納する。
 変換モード頻度評価部1203は、変換モード格納部1201の変換モードの種別T(x、y)を参照して、変換モードの出現頻度を評価する。例えば、符号化対象ブロックの周囲のブロックのT(x、y)を参照し、各変換モードの出現回数を集計し、集計により出現頻度が最大となった変換モードの値を出力する。
 モード推定信号決定部1204は、変換モードの種別を示す信号と、具体的な変換モードの内容を示す信号をモード推定信号として出力する。例えば、モード種別は番号0(上述したDCT変換、2次元KLT変換、1次元KLT変換以外の変換方法のときはモード番号を0としている。)とし、モードの内容を示す情報は、変換モード頻度評価部1203から出力された出現頻度最大の変換モードとする。
(モード制限部324の説明)
 モード制限部324は、変換係数評価部121で得られる評価値xCに応じて、選択可能な変換モードを制限し、モード制限信号として出力する。
 変換モードの切替は、少ない変換係数に多くのエネルギーを集中させられる場合、また、ゼロとなる変換係数の数を多くできる場合に符号化効率の向上を図るものである。変換係数の数が特に小さい場合や、変換係数がDC成分に集中する場合には、どの変換モードを用いても大きな差がないと考えられる。
 例えば、ゼロ以外の変換係数の数nCが小さい場合、変換係数の符号量rC、また、最低次数の変換係数dCがゼロである場合には、変換係数の符号量に比べ、フラグの符号量が大きくなることから、評価値xCが所定の値以下であれば、選択可能な変換モードを1個に制限する。
 それ以外、評価値xCが所定の値よりも大きい場合には、選択可能な変換モードを3個とし、選択可能な変換モードの範囲を示すモード番号1、2、3をモード制限信号として出力する。尚、選択可能な変換モードの数をそれ以上(例えば4個)とし、選択可能な変換モードの範囲を示すモード番号を0、1、2、3とする方法もある。
(モード選択部322の説明)
 モード選択部322は、モード推定部323およびモード制限部324の出力値に基づいて変換モードを選択する。図18のフローチャートを用いて、モード選択部322の動作を説明する。
(S1201)予測部111により予測信号を生成する。
(S1202)減算部(残差算出部)101により予測信号と入力信号の差分から残差信号を生成する。
(L1201)制御変数kを1から3まで変化させて、以下のS1203~S1213を繰り返し実行する。その後S1214に進む。尚、出現確率に基づく変換モードを用いる場合には、出現確率に基づく変換モードのモード番号0を処理対象に加えて、制御変数k=0,1,2,3に対して以下の処理を行う。
(S1203)変換部112により制御変数kに対応するモードの示す変換モード(モード番号kの変換モード)で残差信号を変換する。
(S1204)量子化部113により変換係数を量子化する。
(S1205)スキャン部114によりスキャンする。
(S1206)可変長符号化部115により量子化、スキャンされた変換係数の可変長符号化を行う。
(S1207)変換係数評価部121で変換係数の特徴を示す評価値xCを得る。
(S1208)変換係数評価部121の評価値xCに従い、モード推定部323で変換モードを推定し、モード推定信号を得る。
(S1209)変換係数評価部121の評価値xCに従い、モード制限部324で選択可能な変換モードを制限し、モード制限信号を得る。
(S1210)モード制御信号を参照して、制御変数kに対応する変換モードが選択可能かを判定する。選択可能な場合はS1211、選択不可能な場合にはS1213に進む。
(S1211)可変長符号化部115によりフラグを符号化する。
(S1212)RDコストを用いてコストを算出する。符号量Rは、変換係数の符号量とフラグの符号量とする。
(S1213)この変換モードが選択されないように、制御変数kに対応するコストを最大値に設定する。
(S1214)コスト最小となる変換モードを選択し、変換部112、逆変換部117および可変長符号化部115に出力する。
 以上、説明した画像符号化装置300では、変換係数の特徴を用いることにより、変換モードの切替が有効であるか否かに応じて選択可能な変換モードの選択肢を制限するため、モード識別用のフラグの符号量が削減され高い符号化効率で符号化できる。
 また、変換係数の特徴に応じて、変換モードの推定方法を変えるため、変換モードの推定精度が向上し、さらに、フラグの符号量が削減され符号化効率が向上する。
 また、上記の実施形態3では、モード推定部323とモード制限部324の両者を備える構成を説明したが、実施形態1と同様に、モード推定部323を備え、モード制限部324を備えない構成や、モード制限部324を備え、モード推定部323を備えない構成も可能である。
<<実施形態4>>
 実施形態4の画像復号装置は、実施形態3の画像符号化装置300で生成された符号化データを復号する。
(画像復号装置400の構成)
 図19は、本発明の実施形態4に係る画像復号装置400の構成を示すブロック図である。同図において、画像復号装置400は、可変長符号化復号部201、逆スキャン部202、予測部111、逆量子化部116、逆変換部117、フレームメモリ118、変換係数評価部121、モード復号部422、モード推定部323、モード制限部324、加算部102を備えている。尚、上記構成のうち、実施形態1、実施形態2および実施形態3と同様の構成要素に関しては同一の符号を付し、その説明を省略する。
(画像復号装置400の動作)
 画像復号装置400に入力された符号化データは、まず、可変長符号化復号部201に入力される。可変長符号化復号部201は、符号化データの可変長復号により、予測方法を示す信号と変換・量子化された残差信号である変換係数を復号する。復号された変換係数は、変換係数評価部121および逆スキャン部202に出力される。
 変換係数評価部121は、変換係数の特徴に基づいて評価値xCを算出し、評価値xCをモード推定部323、モード制限部324に出力する。
 モード推定部323は、評価値xCに応じて変換モードを推定し、モード推定信号としてモード復号部422に出力する。
 モード制限部324は、評価値xCに応じて選択可能な変換モードを制限し、モード制限信号として可変長符号化復号部201、モード復号部422に出力する。
 可変長符号化復号部201は、モード制限信号を受信し、フラグの復号が必要な場合には、モード制限信号によって制限された選択可能な変換モードから、1個の変換モードを識別するためのフラグを復号し、モード復号部422に出力する。
 モード復号部422は、モード推定信号、モード制限信号、フラグを用いて変換モードを復号する。
 逆スキャン部202は、逆変換に必要な並びに変換係数を並びかえる。逆スキャンされた変換係数は、逆量子化部116で逆量子化され、モード復号部422で復号された変換モードを用いて逆変換部117で逆変換が行われ、残差信号が再生される。再生された残差信号と予測信号は加算部102で加算され局所復号ブロックが再生される。再生された局所復号ブロックはフレームメモリ118に格納される。
(モード復号部422の説明)
 モード復号部422は、モード制限信号、モード推定信号、フラグを用いて変換モードを復号する。モード制限信号により変換モードが1個に制限される場合や、モード推定信号が用いられるか否かを示す値が1の場合には、モード推定信号で指定される変換モードとする。
 また、モード制限信号により変換モードが複数である場合や、モード推定信号が用いられるか否かを示す値が0の場合には、フラグが指示する変換モードとする。
 画像復号装置400の動作は、上記した図13のフローチャートで示したものと同様であるが、本実施形態では、図13中のスキャンモードを変換モードと置き換え、S1112で行われる逆変換は、S1107(モード復号部422)で復号された変換モードで行う。
 以上、説明した画像復号装置400では、変換係数の特徴を用いることにより、変換モードの切替が有効であるか否かに応じて選択可能な変換モードの選択肢を制限するため、モード識別用のフラグの符号量が削減され高い符号化効率で符号化された符号化データを復号できる。
 また、変換係数の特徴に応じて、変換モードの推定方法を変えるため、変換モードの推定精度が高く、さらに、フラグの符号量が削減された符号化データを復号できる。
 上述の実施形態4では、モード推定部323とモード制限部324の両者を備える構成を説明したが、変形例として、実施形態2と同様、モード推定部323を備え、モード制限部524を備えない構成や、モード制限部324を備え、モード推定部323を備えない構成も可能である。
<<実施形態5>>
 実施形態5では、予測モードを選択して符号化する場合について説明する。この場合、変換方式、量子化方式、スキャン方式はあらかじめ定めておくものとする。
(画像符号化装置500の構成)
 図20は、本発明の実施形態5に係る画像符号化装置500の構成を示すブロック図である。同図において、画像符号化装置500は、予測部111、変換部112、量子化部113、スキャン部114、可変長符号化部115、逆量子化部116、逆変換部117、フレームメモリ118、変換係数評価部121、モード選択部522、モード推定部523、モード制限部524、減算部101、加算部102を備えている。尚、上記構成のうち、実施形態1および実施形態3と同様の構成要素に関しては同一の符号を付し、その説明を省略する。
(画像符号化装置500の動作)
 画像符号化装置500は、入力された画像をブロックに分解し、各ブロックに対して、まず、モード選択部522を動作させると、変換部112、量子化部113、スキャン部114、可変長符号化部115、変換係数評価部121、モード推定部523、モード制限部524を動作させて予測モードを選択し、選択された予測モードが予測部111、可変長符号化部115に送られる。
 次に、入力された画像に対して、選択された変換モードを用いて従来の符号化処理を実行する。
(画面内予測の説明)
 図21は、画面内予測を説明する図である。画面内予測は、対象ブロックの周囲の再生済み画像を用いて、対象ブロックの画素値を予測するものである。
 図21(A)は、方向予測(線予測、1次元予測)を示す図である。方向予測は、対象ブロックに隣接するブロックの既に再生された画素の画素値を特定の方向に延長することによって行われる。図(A)には、画面内予測の方向を示す矢印と数字が示されている。この数字は、予測モードを識別するためのモード番号0~8の値である。図示されていないが、画面内予測には方向予測のほかDC予測がある。DC予測のモード番号は2である。
 図21(B)は、ブロック予測(面予測、2次元予測)を示す図である。ブロック予測は、対象ブロックの周囲の再生画像からブロックを切り出し、対象ブロックの画素値を予測するものであり、モード番号を9とする。切り出されるブロックは、参照ブロックと呼ばれる。
 対象ブロックを符号化する時点で、参照ブロックに未再生領域が存在する場合には、未再生領域に隣接する再生画像の画素値を用いて補間(パディング)を行う。図21(B)では、図中斜め線および縦線で示された領域が参照ブロックになるが、参照ブロックと対象ブロックとが重なる領域(図中、縦線領域)があり、この領域が未再生領域になる。
 ブロック予測では、可変長符号化部115において参照ブロックの位置を示す位置ベクトル(画面間予測の動きベクトルに相当)がモード識別用のフラグとして符号化される。
(モード推定部523の説明)
 モード推定部523は、変換係数評価部121で得られる評価値xCに応じて予測モードを推定し、モード推定信号として出力する。
 予測モードの推定方法には、関数予測とマッチング予測がある、関数予測は方向予測の予測モードの推定に用いられ、マッチング予測は、方向予測、ブロック予測の両者のモード推定に用いられる。
 予測モードは、予測モードの種別を示す信号(モード番号)と、予測モードの内容を示す信号から構成され、モード推定信号はこの2つからなる。
 尚、方向予測の場合は、モード番号だけで内容が確定するので予測モードの内容を示す信号は不要である。ブロック予測の場合には、予測モードの内容を示す信号として参照ブロックの位置を示す位置ベクトルが用いられる。以下、モード番号m(mは、0から10の整数)の予測モードを予測モードmと呼ぶ。
 図22は、画面内モードのモード推定方法(関数予測とマッチング予測)を説明する図である。
 図22(A)は、対象ブロックの周囲のブロックの予測モードから、対象ブロックの予測モードを推定するもので関数予測と呼ぶ。この方法では、対象ブロックの左に位置するブロックの予測モードと、対象ブロックの上に位置するブロックの予測モードから、推定モードを決定する関数を定め、その関数の出力を予測モードとするものである。
 この関数は、発生確率が高い順に、モード番号の小さい方から予測モードを並べておいた場合には、小さい方のモード番号を出力する。この場合、確率の高い予測モードの予測が可能である。また、似た予測方法を近くに並べる場合には、予測モードの番号の平均を用いると良い。
 尚、左のブロック、もしくは、上のブロックのいずれかがブロック予測や画面間予測など方向予測以外の予測モードである場合には、方向予測を用いているブロックの予測モードをモード推定信号とする。また、左ブロック、上ブロックがともに方向予測を用いていない場合には、0(予測モード0)をモード推定信号とする。
 図22(B)、図22(C)は、マッチング予測を用いて予測モードを推定する方法を説明する図である。図22(B)では、方向予測の予測モードを推定する方法を示し、図22(C)は、ブロック予測の予測モードを推定する方法を示している。
 マッチング予測は、既再生領域から2つの領域を切り出し、領域間の絶対値差分和が最小であるものを選択することによって推定を行う。
 方向予測の予測モードを推定する場合の2つの領域は、図22(B)に示したように方向予測のモード毎に定める。
 ここでは、予測モードごとに、既に符号化した2つの領域間の画素値の絶対値差分和を、その和に使用した画素数で割った値(正規化絶対値差分和D)を算出し、ついで正規化絶対値差分和Dを最小とする予測モードをモード推定信号とする。
 尚、正規化絶対値差分和Dの算出に用いる2つの領域は、予測モードに対応する方向ごとに、対象ブロックに隣接する画素領域と、その領域を、予測方向の逆方向に延長した先の画素領域間を用いる。
 また、予測モード2(DC予測)では、予測モードに対応する方向がないため2つの領域を定めることはできない。そのため、予測モード2に対応するDの算出は行わず、これ以外の予測モードで算出したすべての正規化絶対値差分和Dが所定の値未満である場合には、予測モード2をモード推定信号とする。
 尚、既に符号化された領域の画素値を用いて、予測モードを推定する方法は上記によらず、既存のほかの方法を用いても構わない。
 図22(B)は、上から順に、それぞれ予測モード0、予測モード1、予測モード4の正規化絶対値差分和Dを求める方法を示している。
 例えば、予測モード0では、対象ブロックの上に隣接するブロックにおいて、対象ブロックに隣接する領域(斜め線領域)と、予測モード0の方向(垂直方向)に延長した先に位置する領域(縦線領域)間で正規化絶対値差分和Dを算出する。
 方向予測には、予測モード0から予測モード8までの9種類の方向があるが、ここでは全ての方向を用いるのではなく、推定しやすい方向(予測モード)のみ(例えば、垂直方向の予測モード0と水平方向の予測モード1のみ)に制限するようにしてもよい。
 次に、図22(C)は、マッチング予測でブロック予測の予測モードを求める方法を説明する図である。
 この方法は、対象ブロックに隣接する逆L字型の画素値と、再生画像から同じ逆L字型を切り取って得られる画素値を比較し、その絶対値差分和が最小であるものの位置ベクトルを求める。この方法はテンプレートマッチングとも呼ばれる。
 図23は、変換係数評価部121から出力された評価値xCに応じて予測モードを推定するモード推定部523の動作を説明するフローチャートである。
(S1301)変換係数を評価して出力された評価値xCが所定値TH以下である場合にはS1302に進み、所定値THより大きい場合にはS1303に進む。
(S1302)既に符号化済みの周囲の画素値からマッチング予測を用いて予測モードを推定する。
(S1303)周囲のブロックの予測モードから関数予測を用いて予測モードを推定する。
(モード推定部523の別の動作)
 図24は、モード推定部523の別の動作を説明するフローチャートである。
(L1401)制御変数kを0から8まで変化させて、以下のS1401を繰り返し実行する。その後S1402に進む。
(S1401)制御変数kに対応する既に符号化済みの2つの領域から正規化絶対値差分和Dを算出する。
(S1402)画素間相関が大きい順に選択順序を割り当てる。即ち、正規化絶対値差分和Dが小さい順に予測モードが選ばれるよう選択順序を設定する。
(S1403)関数予測により予測モードを推定する。即ち、対象ブロックの左に隣接するブロックの予測モードと、上に隣接するブロックの予測モードのうち、S1402で定められた選択順序の高い予測モード(モード番号の小さい方のモード)を選択する。
(モード推定部523の別の動作)
 モード推定部523は、画面間予測を用いて予測信号生成するようにしてもよい。
 この場合、変換係数の特徴を示す評価値xCが小さいときには、ブロックマッチングを用いて動きベクトルを推定する。
 逆に、評価値xCが大きいときには、符号化対象ブロック周囲の左ブロック、上ブロック、右上ブロックの動きベクトルの中央値を用いて動きベクトルを推定する。中央値の算出は、ベクトルの要素ごと(X方向ベクトル、Y方向ベクトルは別々)に行われる。
 このときのモード推定信号は、モードの種別が画面間予測であることを示す予測モード10と、モードの内容を示す動きベクトル(およびフレームID、ブロックの位置)とする。
 例えば、ゼロ以外の変換係数の数nCが小さい場合には、予測がよく当たっていると推定される。この場合、対象ブロックと周囲の画素値の特徴が似ていると考えられることから、対象ブロックの既に再生済みの画素値を用いて、マッチング予測により適切な動きベクトルが予測できると考えられる。
 逆に、nCが大きい場合には、対象ブロックと周囲の画素値の特徴に違いがあると考えられ、既に再生済みの画素値を用いては良い予測ができない。この場合、単に隣接するブロックの予測モードを用いる関数予測を用いる。同様の切替方法は、ゼロ以外の変換係数の数nCによらず、変換係数評価部121で得られる別の評価値にも適用できる。
(モード制限部524の説明)
 モード制限部524は、変換係数評価部121で得られた評価値xCに応じて、選択可能な予測モードを制限し、モード制限信号として出力する。モード制限信号は、選択可能な予測モードの数と、選択可能な予測モードの範囲とする。但し、選択可能な予測モードが1個の場合には、選択可能な予測モードの範囲は不要とし、選択可能な予測モードの数のみで良い。
 ゼロ以外の変換係数の数nCが小さい場合は、予測が良く当たっていることから多いため、予測モードの数を少なく制限するのがよい。
 また、逆に、nCが大きい場合も、予測が当たらないことを意味するから、予測モードに多くの符号量を使うことは非効率と考えられる。
 図6は、モード制限部524を説明する図である。図6(A)、図6(B)に示すように、変換係数の評価値xCと所定の値THX0、THX1に応じて選択可能な予測モードの数を1個もしくはN個(N>1)もしくは、1個、N1個、N2個に制限する。
 選択可能な予測モードの数が1個より大きい場合には、選択可能な予測モードの数に加え、選択可能な予測モードの番号をモード制限信号として出力する。例えば、選択可能な予測モードがN個の場合には、選択可能な予測モードの範囲としてモード番号のリスト、即ち、モード番号0からモード番号N-1までのモード番号を出力する。
(モード選択部522の説明)
 モード選択部522は、モード推定部523およびモード制限部524の出力値に基づいて予測モードを選択する。図25のフローチャートを用いて、モード選択部522の動作を説明する。
(L1501)制御変数kを0から8まで変化させて、以下のS1501~S1513を繰り返し実行する。その後S1514に進む。
 モード推定部523でマッチング予測を用いる場合には、ブロック予測を示すモード番号9を処理対象に加え、制御変数k=0…9に対して処理する。kが9の場合は、さらに位置ベクトルを所定のサーチ範囲で変化させながら、以下のS1501~S1513を繰り返す。ここで、位置ベクトルのサーチ範囲を、マッチング予測で得られる位置ベクトル(もしくはその周辺)に限定するようにすると、演算量が削減可能である。
 また、画面間予測を用いる場合には、これをモード番号10として加え、以下のS1501~S1513を繰り返す。
(S1501)予測部111により制御変数kに対応する予測方法(モード番号kの予測モード)で予測信号を生成する。例えば、kが0~8の場合はモード番号kで示される方向予測、kが9の場合はブロック予測を用いる。kが10の場合は画面間予測を用いる。
(S1502)減算部(残差算出部)101により予測信号と入力信号の差分から残差信号を生成する。
(S1503)変換部112により残差信号を変換する。
(S1504)量子化部113により変換係数を量子化する。
(S1505)スキャン部114によりスキャンする。
(S1506)可変長符号化部115により量子化、スキャンされた変換係数の可変長符号化を行う。
(S1507)変換係数評価部121で変換係数の特徴を示す評価値xCを得る。
(S1508)変換係数評価部121の評価値xCに従い、モード推定部523で予測モードを推定し、モード推定信号を得る。
(S1509)変換係数評価部121の評価値xCに従い、モード制限部524で選択可能な予測モードを制限し、モード制限信号を得る。
(S1510)モード制限信号を参照して、制御変数kに対応する予測モードが選択可能かを判定する。選択可能な場合はS1511、選択不可能な場合にはS1513に進む。
(S1511)可変長符号化部115によりフラグを符号化する。
(S1512)RDコストを用いてコストを算出する。符号量Rは、変換係数の符号量とフラグの符号量とする。
(S1513)この予測モードが選択されないように、制御変数kに対応するコストを最大値に設定する。
(S1514)コスト最小となる予測モードを選択し、予測部111および可変長符号化部115に出力する。
(可変長符号化部115の説明)
 実施形態5の可変長符号化部115におけるフラグの符号化方法を説明する。
 選択された予測モードが方向予測である場合には、モード推定信号が用いられるか否かを示す値、および、モード推定信号に対応する予測モードが用いられない場合には、さらにモード推定信号以外の予測モードを選択するためのフラグを符号化する。
 上記モード推定信号が用いられるか否かを示す値は、モード推定信号に対応する予測モードが選択された予測モードでなければ1とし、モード推定信号が用いる場合には0とする。
 また、選択された予測モードがブロック予測の場合には、選択された予測モードとモード推定信号の差分を符号化する。ブロック予測の場合、予測モードを示す情報は、ベクトルとなるので、予測モード間の差分はベクトル(差分ベクトル)になる。差分ベクトルは、水平方向、垂直方向の順に符号化する。
 以上、説明した画像符号化装置500では、変換係数の特徴を用いることにより、予測モードの切替が有効であるかに応じて選択可能な予測モードの選択肢を制限するため、モード識別用のフラグの符号量が削減され高い符号化効率で符号化できる。
 また、変換係数の特徴に応じて、予測モードの推定方法を変えるため、予測モードの推定精度が高く、さらに、フラグの符号量が削減され符号化効率が向上する。
(モード選択部522の他の動作の説明)
 図26は、モード選択部522の他の動作を説明するフローチャートである。図26の動作例は、図25の動作の特殊例である。
 これは、変換係数の評価にcbp(Coded Block Pattern)を用い、cbpが0の場合に、モード推定部523においてマッチング予測によって予測モードを推定し、また、モード制限部524において選択可能な予測モードを1個に制限するものである。
(S1601)モード推定部523でcbp=0の場合の予測モードを推定する。本実施形態では、cbp=0であるからマッチング予測を用いる。
(S1602)モード推定部523でcbp=0の場合の予測モードを制限する。cbp=0であるから1個に制限する。
(S1603)予測部111により、S1601で推定された予測モードを用いて予測信号を生成する。
(S1604)変換係数の特徴、変換係数、予測モードを識別するフラグを符号化する。ここではcbp=0であるのでcbpのみを符号化し、変換係数の特徴の符号化は不要である。予測モードも1個に制限するためモード識別用のフラグの符号化も不要である。
(S1605)RDコストを用いてコストを算出する。
(L1601)制御変数kを0から8まで変化させて、以下のS1606~S1616を繰り返し実行する。その後S1617に進む。
(S1606)モード推定部523でcbp≠0の場合の予測モードを推定する。本実施形態では、関数予測を用いる。
(S1607)モード推定部523でcbp≠0の場合のモードを制限する。ここでは予測モード0から予測モード8までに制限する。
(S1608)予測部111により制御変数kに対応するモードの示す予測方法(モード番号kの予測モード)で予測信号を生成する。
(S1609)減算部(残差算出部)101により、予測信号と入力信号の差分から残差信号を生成する。
(S1610)変換部112、量子化部113、スキャン部114により、残差信号を変換、量子化、スキャンする。
(S1611)変換係数評価部121により変換係数の評価値xCを算出する。ここではcbpを評価値xCとする。
(S1612)cbpが0の場合にはS1613に進む。cbpがゼロ以外の場合にはS1614に進む。
(S1613)cbp=0の場合に、ゼロ以外の変換係数の数が0である変換係数の符号化が許される場合にはS1614に進む。そうでなければS1616に進む。
 尚、cbp=0の場合に、ゼロ以外の変換係数の数が0である変換係数の符号化が許される場合とは、cbp=1を符号化した後に、1個の変換係数も符号化しないような符号化データが生成できる場合である。例えば、ランレングス符号化の変換係数において変換係数の値=0が最後のデータと決まっている場合に、最初の変換係数を変換係数の値=0と符号化すればこのような符号化データを生成可能である。
(S1614)可変長符号化部115で、変換係数の特徴(cbp)、変換係数、予測モード識別用フラグを符号化する。
(S1615)歪み量Dと符号量Rから算出されるRDコストを用いてコストを算出する。符号量Rは、変換係数の特徴(cbp)、量子化されスキャンされた残差信号、予測モード識別用フラグを可変長符号化した場合の符号量から計算する。
(S1616)この予測モードが選択されないように、この制御変数kに対応するコストを最大値に設定する。
(S1617)コスト最小となる予測方法を選択し、予測部111および可変長符号化部115に出力する。
 以上、説明した方法により、変換係数の特徴、特にcbpが0であるか否かに従い、モードの推定が行われる。cbpが0となるような、周囲の既に符号化済みの画素から精度の高いモードが推定できると考えられる場合には、既に符号化済みの画素値を用いるマッチング予測でモードを推定するため、予測方法を高い推定精度で推定できる。
 また、この場合の選択可能な予測モードを1個に制限するため、予測モードを示すフラグの符号量を0とすることができる。これにより、符号化効率を向上させることができる。
 また、上記の実施形態5では、モード推定部523とモード制限部524の両者を備える構成を説明したが、実施形態1と同様、モード推定部523を備え、モード制限部524を備えない構成や、モード制限部524を備え、モード推定部523を備えない構成も可能である。
<<実施形態6>>
 実施形態6の画像復号装置は、実施形態5の画像符号化装置500で生成された符号化データを復号する。
(画像復号装置600の構成)
 図27は、本発明の実施形態6に係る画像復号装置600の構成を示すブロック図である。同図において、画像復号装置600は、可変長符号化復号部201、逆スキャン部202、予測部111、逆量子化部116、逆変換部117、フレームメモリ118、変換係数評価部121、モード復号部622、モード推定部523、モード制限部524、加算部102を備えている。尚、上記構成のうち、実施形態1、実施形態2および実施形態5と同様の構成要素に関しては同一の符号を付し、その説明を省略する。
(画像復号装置600の動作)
 画像復号装置600に入力された符号化データは、まず、可変長符号化復号部201に入力される。可変長符号化復号部201は、符号化データの可変長復号により、変換・量子化された残差信号である変換係数を復号する。復号された変換係数は変換係数評価部121および逆スキャン部202に出力される。
 変換係数評価部121は、変換係数の特徴に基づいて評価値xCを算出し、評価値xCをモード推定部523、モード制限部524に出力する。
 モード推定部523は、評価値xCに応じて予測モードを推定し、モード推定信号としてモード復号部622に出力する。
 モード制限部524は、評価値xCに応じて選択可能な予測モードを制限し、モード制限信号として可変長符号化復号部201、モード復号部622に出力する。
 可変長符号化復号部201は、モード制限信号を受信し、フラグの復号が必要な場合には、モード制限信号によって制限された選択可能な予測モードから、1個の予測モードを識別するためのフラグを復号し、モード復号部622に出力する。
 モード復号部622は、モード推定信号、モード制限信号、フラグを用いて予測モードを復号する。
 逆スキャン部202は、逆変換に必要な並びに変換係数を並びかえる。逆スキャンされた変換係数は逆量子化部116で逆量子化され、逆変換部117で逆変換が行われ、残差信号が再生される。
 予測部111は、復号された予測信号に従って、フレームメモリ118に格納された復号済みの画像を参照し、復号された予測モードで予測信号を生成する。加算部102は、予測信号と再生された残差信号の加算により局所復号ブロックを生成し、フレームメモリ118に格納する。
(モード復号部622の説明)
 モード復号部622は、モード制限信号、モード推定信号、フラグを用いて予測モードを復号する。モード制限信号により予測モードが1個に制限される場合や、モード推定信号が用いられるか否かを示す値が1の場合には、モード推定信号で指定される予測モードとする。
 また、モード制限信号により予測モードが複数である場合や、モード推定信号が用いられるか否かを示す値が0の場合には、フラグが指示する予測モードとする。
 画像復号装置600の動作は、上記した図13のフローチャートで示したものと同様であるが、本実施形態では、図13中のスキャンモードを予測モードと置き換え、S1112で行われる逆変換は、S1113(モード復号部422)で復号された予測モードで行われる。
 以上、説明した画像復号装置600では、変換係数の特徴を用いることにより、予測モードの切替が有効であるか否かに応じて選択可能な予測モードの選択肢を制限するため、モード識別用のフラグの符号量が削減され高い符号化効率で符号化された符号化データを復号できる。
 また、変換係数の特徴に応じて、予測モードの推定方法を変えるため、予測モードの推定精度が向上し、さらに、フラグの符号量が削減された符号化データを復号できる。
(画像復号装置600の別の動作の説明)
 図28は、画像復号装置600の他の動作を説明するフローチャートである。
(S1701)可変長符号化復号部201でcbpを復号する。
(S1702)cbpがゼロ以外の場合はS1703に進み、0の場合にはS1709に進む。
(S1703)モード推定部523でcbpが0以外の場合の予測モードを推定し、モード制限部524で予測モードを制限する。
 尚、cbpが0以外の場合の予測モードの推定については実施形態5で説明した方法を用いるが、ここでは方向予測を用いる。
(S1704)モード復号部622で予測モードを復号する。
(S1705)可変長符号化復号部201で変換係数を復号する。
(S1706)逆スキャン部202で変換係数を逆スキャンする。
(S1707)逆量子化部116で変換係数の逆量子化を行う。
(S1708)逆変換部117で逆変換を行い、残差信号を再生し、S1710に進む。
(S1709)モード推定部523でcbpが0の場合の予測モードを推定し、モード制限部524で予測モードを1つに制限する。予測モードが1つに制限されているので推定された予測モードを選択する。また、残差信号を0とする。
 尚、cbpが0の場合の予測モードの推定については実施形態5で説明した方法を用いる。
(S1710)予測部111で、復号された予測モードにより予測信号を生成する。
(S1711)加算部102で予測信号と残差信号の和により、再生信号を生成する。
 以上、説明した上記の動作によれば、変換係数の特徴、特にcbpが0であるか否かによって予測モードが推定されることにより、予測モードの推定精度が向上し符号化効率が向上する。さらにcbpが0である場合に選択可能な予測モードを1個に制限し、フラグを復号しないことにより、予測モードを示すフラグの符号量が削減され高い符号化効率で符号化された符号化データを復号できる。
 また、上記の実施形態6では、モード推定部523とモード制限部524の両者を備える構成を説明したが、実施形態2と同様、モード推定部523を備え、モード制限部524を備えない構成や、モード制限部524を備え、モード推定部523を備えない構成も可能である。
 また、本発明は上述した実施形態に限定されず、本発明の要旨を逸脱しない範囲内で各種の変形、修正が可能であるのは勿論である。
100,300,500…画像符号化装置、111…予測部、112…変換部、113…量子化部、114…スキャン部、115…可変長符号化部、116…逆量子化部、117…逆変換部、118…フレームメモリ、101…減算部(残差算出部)、102…加算部、121…変換係数評価部、122,322,522…モード選択部、123,323,523…モード推定部、124,324,524…モード制限部、1001…頻度格納部、1002…頻度測定部、1003…頻度評価部、1004…モード推定信号決定部、1103…スキャン順生成部、1104…モード推定信号決定部、1201…変換モード格納部、1202…変換モード測定部、1203…変換モード頻度評価部、1204…モード推定信号決定部、
200,400,600…画像復号装置、201…可変長符号化復号部、202…逆スキャン部、222,422,622…モード復号部。
 

Claims (10)

  1.  入力信号をブロック化し、該ブロック単位で前記入力信号の予測信号を生成する予測部と、前記入力信号と前記予測信号の残差信号を変換して変換係数を算出する変換部と、前記変換係数を量子化する量子化部と、前記量子化後の変換係数を一次元に並べるスキャン部と、前記スキャンされた変換係数を符号化する可変長符号化部と、を備えて符号化データを生成する画像符号化装置において、
     前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを推定するモード推定部と、前記評価値に応じて、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる選択可能なモードの範囲を限定するモード制限部と、前記選択可能なモードの範囲内にある所定のモードの中から符号化コストが最小となるモードを選択するモード選択部と、を備え、
     前記モード選択部は、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる前記所定のモードを切り替えながら、前記入力信号に対して前記予測部、前記変換部、前記量子化部、前記スキャン部、前記可変長符号化部を動作させ、前記変換係数評価部で算出した評価値を用いて、符号化コストが最小となるモードを選択し、
     前記可変長符号化部は、前記制限されたモードの個数が複数個の場合には、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを識別するためのフラグを符号化することを特徴とする画像符号化装置。
  2.  入力信号をブロック化し、該ブロック単位で前記入力信号の予測信号を生成する予測部と、前記入力信号と前記予測信号の残差信号を変換して変換係数を算出する変換部と、前記変換係数を量子化する量子化部と、前記量子化後の変換係数を一次元に並べるスキャン部と、前記スキャンされた変換係数を符号化する可変長符号化部と、を備えて符号化データを生成する画像符号化装置において、
     前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる選択可能なモードの範囲を限定するモード制限部と、前記選択可能なモードの範囲内にある所定のモードの中から符号化コストが最小となるモードを選択するモード選択部と、を備え、
     前記モード選択部は、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる前記所定のモードを切り替えながら、前記入力信号に対して前記予測部、前記変換部、前記量子化部、前記スキャン部、前記可変長符号化部を動作させ、前記変換係数評価部で算出した評価値を用いて、符号化コストが最小となるモードを選択し、
     前記可変長符号化部は、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを識別するためのフラグを符号化することを特徴とする画像符号化装置。
  3.  入力信号をブロック化し、該ブロック単位で前記入力信号の予測信号を生成する予測部と、前記入力信号と前記予測信号の残差信号を変換して変換係数を算出する変換部と、前記変換係数を量子化する量子化部と、前記量子化後の変換係数を一次元に並べるスキャン部と、前記スキャンされた変換係数を符号化する可変長符号化部と、を備えて符号化データを生成する画像符号化装置において、
     前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを推定するモード推定部と、符号化コストが最小となるモードを所定のモードの中から選択するモード選択部と、を備え、
     前記モード選択部は、前記予測部もしくは前記変換部もしくは前記スキャン部で用いる前記所定のモードを切り替えながら、前記入力信号に対して前記予測部、前記変換部、前記量子化部、前記スキャン部、前記可変長符号化部を動作させ、前記変換係数評価部で算出した評価値を用いて、符号化コストが最小となるモードを選択し、
     前記可変長符号化部は、前記推定されたモードと前記選択されたモードが同じ場合には、前記推定されたモードを利用するという情報を符号化し、また、異なる場合には、前記予測部もしくは前記変換部もしくは前記スキャン部で用いるモードを識別するためのフラグと、前記推定されたモードを利用しないという情報を符号化することを特徴とする画像符号化装置。
  4.  入力信号をブロック化し、該ブロック単位で、変換を施して量子化された変換係数を一次元に並べて符号化した符号化データを逆スキャン部によって逆スキャンし、逆量子化部によって逆量子化し、逆変換部により逆変換を施した残差信号と予測部によって既に復号された信号から予測した予測信号から前記符号化データを復号する画像復号装置において、
     前記符号化データから変換係数と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを識別するためのフラグを復号する可変長復号部と、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを推定するモード推定部と、前記評価値に応じて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いる選択可能なモードの範囲を限定するモード制限部と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを、前記制限されたモードの個数が1個の場合には、前記モード推定部で推定されたモードとし、また、複数個の場合には、前記フラグで識別されるモードとするモード復号部と、を備え、
     前記モード復号部で復号されたモードを用いて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部を動作させて前記符号化データを復号することを特徴とする画像復号装置。
  5.  入力信号をブロック化し、該ブロック単位で、変換を施して量子化された変換係数を一次元に並べて符号化した符号化データを逆スキャン部によって逆スキャンし、逆量子化部によって逆量子化し、逆変換部により逆変換を施した残差信号と予測部によって既に復号された信号から予測した予測信号から前記符号化データを復号する画像復号装置において、
     前記符号化データから変換係数と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを識別するためのフラグを復号する可変長復号部と、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードの範囲を限定するモード制限部と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを、前記限定されたモードの個数が1個の場合は、前記モード制限部で限定された範囲内のモードとし、また、複数の場合には、前記フラグで識別されるモードとするモード復号部と、を備え、
     前記モード復号部で復号されたモードを用いて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部を動作させて前記符号化データを復号することを特徴とする画像復号装置。
  6.  入力信号をブロック化し、該ブロック単位で、変換を施して量子化された変換係数を一次元に並べて符号化した符号化データを逆スキャン部によって逆スキャンし、逆量子化部によって逆量子化し、逆変換部により逆変換を施した残差信号と予測部によって既に復号された信号から予測した予測信号から前記符号化データを復号する画像復号装置において、
     前記符号化データから変換係数と、推定されたモードを利用するか否かの情報と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを識別するためのフラグを復号する可変長復号部と、前記変換係数の特徴に基づいて評価値を算出する変換係数評価部と、前記評価値に応じて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを推定するモード推定部と、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部で用いるモードを、推定されたモードを利用するという情報が復号された場合には、前記モード推定部で推定されたモードとし、また、推定されたモードを利用しないという情報が復号された場合には、前記フラグで識別されるモードとするモード復号部と、を備え、
     前記モード復号部で復号されたモードを用いて、前記予測部もしくは前記逆変換部もしくは前記逆スキャン部を動作させて前記符号化データを復号することを特徴とする画像復号装置。
  7.  前記変換係数評価部の評価値は、ゼロ以外の変換係数があるか否かを示す値、ゼロ以外の変換係数の個数、変換係数のゼロが続く長さ、量子化後の変換係数の大きさ、変換係数を符号化したときの符号化コスト、変換係数のばらつき、量子化後の変換係数の大きさに基づいて計算される符号化効率および最低次数の変換係数が0であるか否かを示す値のいずれか、これらの値を用いて所定の関数から算出される値、あるいは、モード推定あるいはモード限定に使われる組み合わせであることを特徴とする、請求項1、2または3に記載の画像符号化装置、または、請求項4、5または6に記載の画像復号装置。
  8.  前記モード限定部は、前記評価値が所定の値以下である場合よりも大きい場合に、選択可能なモードの範囲を小さく設定することを特徴とする請求項1または2に記載の画像符号化装置、または、請求項4または5に記載の画像復号装置。
  9.  前記モード限定部は、第一の所定値よりも大きい第二の所定値を有し、前記評価値が前記第一の所定値以下である場合、および、前記第二の所定値よりも大きい場合の選択可能なモードの範囲を、前記評価値が前記第一の所定値よりも大きく、且つ、前記第二の所定値以下である場合の選択可能なモードの範囲よりも小さく設定することを特徴とする請求項1または2に記載の画像符号化装置、または、請求項4または5に記載の画像復号装置。
  10.  前記モード推定部は、前記評価値が所定の値以下である場合、既に再生済みのブロックのモード、または、既に再生済みブロックの画素値に基づいてモードを推定し、前記評価値が所定の値よりも大きい場合、所定のモードを用いることを特徴とする請求項1または3に記載の画像符号化装置、または、請求項4または6に記載の画像復号装置。
PCT/JP2010/062889 2009-08-26 2010-07-30 画像符号化装置および画像復号装置 WO2011024602A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
EP10811653A EP2472872A1 (en) 2009-08-26 2010-07-30 Image encoding device and image decoding device
US13/392,386 US20120195515A1 (en) 2009-08-26 2010-07-30 Image encoding device and image decoding device
JP2011528721A JPWO2011024602A1 (ja) 2009-08-26 2010-07-30 画像符号化装置および画像復号装置
CN2010800377633A CN102484720A (zh) 2009-08-26 2010-07-30 图像编码装置以及图像解码装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2009194961 2009-08-26
JP2009-194961 2009-08-26

Publications (1)

Publication Number Publication Date
WO2011024602A1 true WO2011024602A1 (ja) 2011-03-03

Family

ID=43627712

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2010/062889 WO2011024602A1 (ja) 2009-08-26 2010-07-30 画像符号化装置および画像復号装置

Country Status (5)

Country Link
US (1) US20120195515A1 (ja)
EP (1) EP2472872A1 (ja)
JP (1) JPWO2011024602A1 (ja)
CN (1) CN102484720A (ja)
WO (1) WO2011024602A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017103722A (ja) * 2015-12-04 2017-06-08 日本放送協会 符号化装置、復号装置、及びプログラム
JP2017147508A (ja) * 2016-02-15 2017-08-24 日本放送協会 符号化装置、復号装置、及びプログラム
US10531110B2 (en) 2014-07-21 2020-01-07 Gurulogic Microsystems Oy Encoder, decoder and method

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108712649A (zh) * 2012-06-29 2018-10-26 韩国电子通信研究院 视频解码方法、视频编码方法和计算机可读介质
JP2015015595A (ja) * 2013-07-04 2015-01-22 富士通株式会社 動画像符号化装置、符号化モード判定方法及び符号化プログラム
WO2015078420A1 (en) * 2013-11-29 2015-06-04 Mediatek Inc. Methods and apparatus for intra picture block copy in video compression
WO2018119609A1 (zh) * 2016-12-26 2018-07-05 华为技术有限公司 一种基于模板匹配的编解码方法及装置
US10694205B2 (en) * 2017-12-18 2020-06-23 Google Llc Entropy coding of motion vectors using categories of transform blocks
CN113261284A (zh) * 2018-11-01 2021-08-13 交互数字Vc控股公司 使用多重变换选择进行视频编码和解码

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04189092A (ja) * 1990-11-22 1992-07-07 Victor Co Of Japan Ltd 直交変換符号化装置及び復号化装置
JPH0522715A (ja) * 1991-07-12 1993-01-29 Sony Corp 画像符号化装置
JPH08256266A (ja) * 1995-03-17 1996-10-01 Mitsubishi Electric Corp 画像符号化方式
JP2007208543A (ja) * 2006-01-31 2007-08-16 Victor Co Of Japan Ltd 動画像符号化装置
JP2009118233A (ja) * 2007-11-07 2009-05-28 Kddi Corp 動画像符号化装置および復号装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4951140A (en) * 1988-02-22 1990-08-21 Kabushiki Kaisha Toshiba Image encoding apparatus
JP3012698B2 (ja) * 1991-01-29 2000-02-28 オリンパス光学工業株式会社 画像データの符号化装置および符号化方法
KR0134504B1 (ko) * 1992-09-09 1998-04-23 배순훈 적응적 주파수 변환기를 가진 영상 부호화기
US6571019B1 (en) * 1995-10-26 2003-05-27 Hyundai Curitel, Inc Apparatus and method of encoding/decoding a coded block pattern
CN100508610C (zh) * 2007-02-02 2009-07-01 清华大学 H.264/avc视频编码中速率和失真的快速估计方法
CN100574447C (zh) * 2007-08-24 2009-12-23 上海广电(集团)有限公司中央研究院 基于avs视频编码的快速帧间预测模式选择方法
CN101415121B (zh) * 2007-10-15 2010-09-29 华为技术有限公司 一种自适应的帧预测的方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04189092A (ja) * 1990-11-22 1992-07-07 Victor Co Of Japan Ltd 直交変換符号化装置及び復号化装置
JPH0522715A (ja) * 1991-07-12 1993-01-29 Sony Corp 画像符号化装置
JPH08256266A (ja) * 1995-03-17 1996-10-01 Mitsubishi Electric Corp 画像符号化方式
JP2007208543A (ja) * 2006-01-31 2007-08-16 Victor Co Of Japan Ltd 動画像符号化装置
JP2009118233A (ja) * 2007-11-07 2009-05-28 Kddi Corp 動画像符号化装置および復号装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10531110B2 (en) 2014-07-21 2020-01-07 Gurulogic Microsystems Oy Encoder, decoder and method
JP2017103722A (ja) * 2015-12-04 2017-06-08 日本放送協会 符号化装置、復号装置、及びプログラム
JP2017147508A (ja) * 2016-02-15 2017-08-24 日本放送協会 符号化装置、復号装置、及びプログラム

Also Published As

Publication number Publication date
US20120195515A1 (en) 2012-08-02
CN102484720A (zh) 2012-05-30
JPWO2011024602A1 (ja) 2013-01-24
EP2472872A1 (en) 2012-07-04

Similar Documents

Publication Publication Date Title
WO2011024602A1 (ja) 画像符号化装置および画像復号装置
CA3073674C (en) Method and apparatus for configuring transform for video compression
US8374243B2 (en) Method and apparatus for encoding and decoding based on intra prediction
EP2582140A2 (en) System and method for encoding/decoding videos using edge-adaptive transform
US9317896B2 (en) Image interpolation method and apparatus
US11736707B2 (en) Method and apparatus for processing video signal using affine prediction
US20110038419A1 (en) Method and apparatus for encoding/decoding image by controlling accuracy of motion vector
WO2007004678A1 (ja) 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法及び動画像復号プログラム
US11259041B2 (en) Image decoding method and apparatus based on affine motion prediction in image coding system
KR20220110834A (ko) 영상 디코딩 방법 및 그 장치
JP2023145639A (ja) 画像デコード方法、及びその装置
KR101441879B1 (ko) 영상 부호화 장치 및 방법, 및 거기에 이용되는 변환 부호화 장치 및 방법, 변환기저 생성장치 및 방법, 및 영상 복호화 장치 및 방법
KR101601854B1 (ko) 공간적 예측장치 및 그 예측방법, 그것을 이용한 영상 부호화 장치 및 방법, 및 영상 복호화 장치 및 방법
WO2007043613A1 (ja) 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム、および動画像復号化プログラム
KR102641457B1 (ko) 크로마 성분에 대한 영상 디코딩 방법 및 그 장치
KR20120025111A (ko) 참조 화소들의 특성을 이용하여 예측모드 정보의 전송을 생략할 수 있는 화면 내 예측 부호화/복호화 장치 및 그 방법
KR20230151080A (ko) 크로마 성분에 대한 영상 디코딩 방법 및 그 장치
JP5020260B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム及び動画像復号プログラム
KR102637085B1 (ko) 영상 디코딩 방법 및 그 장치
KR102644970B1 (ko) 영상 디코딩 방법 및 그 장치
US11240527B2 (en) Image decoding method and device on basis of affine motion prediction using constructed affine MVP candidate in image coding system
KR102640264B1 (ko) 크로마 양자화 파라미터 데이터에 대한 영상 디코딩 방법 및 그 장치
CN114097231A (zh) 图像编码系统中使用bdpcm来解码图像的方法及装置
RU2787210C1 (ru) Способ и устройство для кодирования/декодирования видео с использованием режима внутриблочного копирования и способ для передачи потока битов
RU2794519C2 (ru) Способ и устройство для кодирования/декодирования видео с использованием режима внутриблочного копирования и способ для передачи потока битов

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201080037763.3

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10811653

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 2011528721

Country of ref document: JP

WWE Wipo information: entry into national phase

Ref document number: 13392386

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2010811653

Country of ref document: EP