PR/Applications/VSs/VSs__H264__App: libavcodec/h264

annotate libavcodec/h264_pred.c @ 2:897f711a7157

rearrange to work with autoconf

author	Nina Engelhardt <nengel@mailbox.tu-berlin.de>
date	Tue, 25 Sep 2012 15:55:33 +0200
parents
children

rev	line source
nengel@2	1 /*
nengel@2	2 * H.26L/H.264/AVC/JVT/14496-10/... encoder/decoder
nengel@2	3 * Copyright (c) 2003 Michael Niedermayer <michaelni@gmx.at>
nengel@2	4 *
nengel@2	5 * This file is part of FFmpeg.
nengel@2	6 *
nengel@2	7 * FFmpeg is free software; you can redistribute it and/or
nengel@2	8 * modify it under the terms of the GNU Lesser General Public
nengel@2	9 * License as published by the Free Software Foundation; either
nengel@2	10 * version 2.1 of the License, or (at your option) any later version.
nengel@2	11 *
nengel@2	12 * FFmpeg is distributed in the hope that it will be useful,
nengel@2	13 * but WITHOUT ANY WARRANTY; without even the implied warranty of
nengel@2	14 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
nengel@2	15 * Lesser General Public License for more details.
nengel@2	16 *
nengel@2	17 * You should have received a copy of the GNU Lesser General Public
nengel@2	18 * License along with FFmpeg; if not, write to the Free Software
nengel@2	19 * Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301 USA
nengel@2	20 */
nengel@2	21
nengel@2	22 /**
nengel@2	23 * @file
nengel@2	24 * H.264 / AVC / MPEG4 part10 prediction functions.
nengel@2	25 * @author Michael Niedermayer <michaelni@gmx.at>
nengel@2	26 */
nengel@2	27
nengel@2	28 #include "avcodec.h"
nengel@2	29 #include "h264_pred.h"
nengel@2	30 //#include "dsputil.h"
nengel@2	31
nengel@2	32 static void pred4x4_vertical_c(uint8_t src, uint8_t topright, int stride){
nengel@2	33 (void) topright;
nengel@2	34 const uint32_t a= ((uint32_t*)(src-stride))[0];
nengel@2	35 ((uint32_t)(src+0stride))[0]= a;
nengel@2	36 ((uint32_t)(src+1stride))[0]= a;
nengel@2	37 ((uint32_t)(src+2stride))[0]= a;
nengel@2	38 ((uint32_t)(src+3stride))[0]= a;
nengel@2	39 }
nengel@2	40
nengel@2	41 static void pred4x4_horizontal_c(uint8_t src, uint8_t topright, int stride){
nengel@2	42 (void) topright;
nengel@2	43 ((uint32_t)(src+0stride))[0]= src[-1+0stride]0x01010101;
nengel@2	44 ((uint32_t)(src+1stride))[0]= src[-1+1stride]0x01010101;
nengel@2	45 ((uint32_t)(src+2stride))[0]= src[-1+2stride]0x01010101;
nengel@2	46 ((uint32_t)(src+3stride))[0]= src[-1+3stride]0x01010101;
nengel@2	47 }
nengel@2	48
nengel@2	49 static void pred4x4_dc_c(uint8_t src, uint8_t topright, int stride){
nengel@2	50 (void) topright;
nengel@2	51 const int dc= ( src[-stride] + src[1-stride] + src[2-stride] + src[3-stride]
nengel@2	52 + src[-1+0stride] + src[-1+1stride] + src[-1+2stride] + src[-1+3stride] + 4) >>3;
nengel@2	53
nengel@2	54 ((uint32_t)(src+0stride))[0]=
nengel@2	55 ((uint32_t)(src+1stride))[0]=
nengel@2	56 ((uint32_t)(src+2stride))[0]=
nengel@2	57 ((uint32_t)(src+3stride))[0]= dc* 0x01010101;
nengel@2	58 }
nengel@2	59
nengel@2	60 static void pred4x4_left_dc_c(uint8_t src, uint8_t topright, int stride){
nengel@2	61 (void) topright;
nengel@2	62 const int dc= ( src[-1+0stride] + src[-1+1stride] + src[-1+2stride] + src[-1+3stride] + 2) >>2;
nengel@2	63
nengel@2	64 ((uint32_t)(src+0stride))[0]=
nengel@2	65 ((uint32_t)(src+1stride))[0]=
nengel@2	66 ((uint32_t)(src+2stride))[0]=
nengel@2	67 ((uint32_t)(src+3stride))[0]= dc* 0x01010101;
nengel@2	68 }
nengel@2	69
nengel@2	70 static void pred4x4_top_dc_c(uint8_t src, uint8_t topright, int stride){
nengel@2	71 (void) topright;
nengel@2	72 const int dc= ( src[-stride] + src[1-stride] + src[2-stride] + src[3-stride] + 2) >>2;
nengel@2	73
nengel@2	74 ((uint32_t)(src+0stride))[0]=
nengel@2	75 ((uint32_t)(src+1stride))[0]=
nengel@2	76 ((uint32_t)(src+2stride))[0]=
nengel@2	77 ((uint32_t)(src+3stride))[0]= dc* 0x01010101;
nengel@2	78 }
nengel@2	79
nengel@2	80 static void pred4x4_128_dc_c(uint8_t src, uint8_t topright, int stride){
nengel@2	81 (void) topright;
nengel@2	82 ((uint32_t)(src+0stride))[0]=
nengel@2	83 ((uint32_t)(src+1stride))[0]=
nengel@2	84 ((uint32_t)(src+2stride))[0]=
nengel@2	85 ((uint32_t)(src+3stride))[0]= 128U*0x01010101U;
nengel@2	86 }
nengel@2	87
nengel@2	88
nengel@2	89 #define LOAD_TOP_RIGHT_EDGE\
nengel@2	90 const int av_unused t4= topright[0];\
nengel@2	91 const int av_unused t5= topright[1];\
nengel@2	92 const int av_unused t6= topright[2];\
nengel@2	93 const int av_unused t7= topright[3];\
nengel@2	94
nengel@2	95 #define LOAD_DOWN_LEFT_EDGE\
nengel@2	96 const int av_unused l4= src[-1+4*stride];\
nengel@2	97 const int av_unused l5= src[-1+5*stride];\
nengel@2	98 const int av_unused l6= src[-1+6*stride];\
nengel@2	99 const int av_unused l7= src[-1+7*stride];\
nengel@2	100
nengel@2	101 #define LOAD_LEFT_EDGE\
nengel@2	102 const int av_unused l0= src[-1+0*stride];\
nengel@2	103 const int av_unused l1= src[-1+1*stride];\
nengel@2	104 const int av_unused l2= src[-1+2*stride];\
nengel@2	105 const int av_unused l3= src[-1+3*stride];\
nengel@2	106
nengel@2	107 #define LOAD_TOP_EDGE\
nengel@2	108 const int av_unused t0= src[ 0-1*stride];\
nengel@2	109 const int av_unused t1= src[ 1-1*stride];\
nengel@2	110 const int av_unused t2= src[ 2-1*stride];\
nengel@2	111 const int av_unused t3= src[ 3-1*stride];\
nengel@2	112
nengel@2	113 static void pred4x4_down_right_c(uint8_t src, uint8_t topright, int stride){
nengel@2	114 (void) topright;
nengel@2	115 const int lt= src[-1-1*stride];
nengel@2	116 LOAD_TOP_EDGE
nengel@2	117 LOAD_LEFT_EDGE
nengel@2	118
nengel@2	119 src[0+3stride]=(l3 + 2l2 + l1 + 2)>>2;
nengel@2	120 src[0+2*stride]=
nengel@2	121 src[1+3stride]=(l2 + 2l1 + l0 + 2)>>2;
nengel@2	122 src[0+1*stride]=
nengel@2	123 src[1+2*stride]=
nengel@2	124 src[2+3stride]=(l1 + 2l0 + lt + 2)>>2;
nengel@2	125 src[0+0*stride]=
nengel@2	126 src[1+1*stride]=
nengel@2	127 src[2+2*stride]=
nengel@2	128 src[3+3stride]=(l0 + 2lt + t0 + 2)>>2;
nengel@2	129 src[1+0*stride]=
nengel@2	130 src[2+1*stride]=
nengel@2	131 src[3+2stride]=(lt + 2t0 + t1 + 2)>>2;
nengel@2	132 src[2+0*stride]=
nengel@2	133 src[3+1stride]=(t0 + 2t1 + t2 + 2)>>2;
nengel@2	134 src[3+0stride]=(t1 + 2t2 + t3 + 2)>>2;
nengel@2	135 }
nengel@2	136
nengel@2	137 static void pred4x4_down_left_c(uint8_t src, uint8_t topright, int stride){
nengel@2	138 LOAD_TOP_EDGE
nengel@2	139 LOAD_TOP_RIGHT_EDGE
nengel@2	140 // LOAD_LEFT_EDGE
nengel@2	141
nengel@2	142 src[0+0stride]=(t0 + t2 + 2t1 + 2)>>2;
nengel@2	143 src[1+0*stride]=
nengel@2	144 src[0+1stride]=(t1 + t3 + 2t2 + 2)>>2;
nengel@2	145 src[2+0*stride]=
nengel@2	146 src[1+1*stride]=
nengel@2	147 src[0+2stride]=(t2 + t4 + 2t3 + 2)>>2;
nengel@2	148 src[3+0*stride]=
nengel@2	149 src[2+1*stride]=
nengel@2	150 src[1+2*stride]=
nengel@2	151 src[0+3stride]=(t3 + t5 + 2t4 + 2)>>2;
nengel@2	152 src[3+1*stride]=
nengel@2	153 src[2+2*stride]=
nengel@2	154 src[1+3stride]=(t4 + t6 + 2t5 + 2)>>2;
nengel@2	155 src[3+2*stride]=
nengel@2	156 src[2+3stride]=(t5 + t7 + 2t6 + 2)>>2;
nengel@2	157 src[3+3stride]=(t6 + 3t7 + 2)>>2;
nengel@2	158 }
nengel@2	159
nengel@2	160 static void pred4x4_vertical_right_c(uint8_t src, uint8_t topright, int stride){
nengel@2	161 (void) topright;
nengel@2	162 const int lt= src[-1-1*stride];
nengel@2	163 LOAD_TOP_EDGE
nengel@2	164 LOAD_LEFT_EDGE
nengel@2	165
nengel@2	166 src[0+0*stride]=
nengel@2	167 src[1+2*stride]=(lt + t0 + 1)>>1;
nengel@2	168 src[1+0*stride]=
nengel@2	169 src[2+2*stride]=(t0 + t1 + 1)>>1;
nengel@2	170 src[2+0*stride]=
nengel@2	171 src[3+2*stride]=(t1 + t2 + 1)>>1;
nengel@2	172 src[3+0*stride]=(t2 + t3 + 1)>>1;
nengel@2	173 src[0+1*stride]=
nengel@2	174 src[1+3stride]=(l0 + 2lt + t0 + 2)>>2;
nengel@2	175 src[1+1*stride]=
nengel@2	176 src[2+3stride]=(lt + 2t0 + t1 + 2)>>2;
nengel@2	177 src[2+1*stride]=
nengel@2	178 src[3+3stride]=(t0 + 2t1 + t2 + 2)>>2;
nengel@2	179 src[3+1stride]=(t1 + 2t2 + t3 + 2)>>2;
nengel@2	180 src[0+2stride]=(lt + 2l0 + l1 + 2)>>2;
nengel@2	181 src[0+3stride]=(l0 + 2l1 + l2 + 2)>>2;
nengel@2	182 }
nengel@2	183
nengel@2	184 static void pred4x4_vertical_left_c(uint8_t src, uint8_t topright, int stride){
nengel@2	185 LOAD_TOP_EDGE
nengel@2	186 LOAD_TOP_RIGHT_EDGE
nengel@2	187
nengel@2	188 src[0+0*stride]=(t0 + t1 + 1)>>1;
nengel@2	189 src[1+0*stride]=
nengel@2	190 src[0+2*stride]=(t1 + t2 + 1)>>1;
nengel@2	191 src[2+0*stride]=
nengel@2	192 src[1+2*stride]=(t2 + t3 + 1)>>1;
nengel@2	193 src[3+0*stride]=
nengel@2	194 src[2+2*stride]=(t3 + t4+ 1)>>1;
nengel@2	195 src[3+2*stride]=(t4 + t5+ 1)>>1;
nengel@2	196 src[0+1stride]=(t0 + 2t1 + t2 + 2)>>2;
nengel@2	197 src[1+1*stride]=
nengel@2	198 src[0+3stride]=(t1 + 2t2 + t3 + 2)>>2;
nengel@2	199 src[2+1*stride]=
nengel@2	200 src[1+3stride]=(t2 + 2t3 + t4 + 2)>>2;
nengel@2	201 src[3+1*stride]=
nengel@2	202 src[2+3stride]=(t3 + 2t4 + t5 + 2)>>2;
nengel@2	203 src[3+3stride]=(t4 + 2t5 + t6 + 2)>>2;
nengel@2	204 }
nengel@2	205
nengel@2	206 static void pred4x4_horizontal_up_c(uint8_t src, uint8_t topright, int stride){
nengel@2	207 (void) topright;
nengel@2	208 LOAD_LEFT_EDGE
nengel@2	209
nengel@2	210 src[0+0*stride]=(l0 + l1 + 1)>>1;
nengel@2	211 src[1+0stride]=(l0 + 2l1 + l2 + 2)>>2;
nengel@2	212 src[2+0*stride]=
nengel@2	213 src[0+1*stride]=(l1 + l2 + 1)>>1;
nengel@2	214 src[3+0*stride]=
nengel@2	215 src[1+1stride]=(l1 + 2l2 + l3 + 2)>>2;
nengel@2	216 src[2+1*stride]=
nengel@2	217 src[0+2*stride]=(l2 + l3 + 1)>>1;
nengel@2	218 src[3+1*stride]=
nengel@2	219 src[1+2stride]=(l2 + 2l3 + l3 + 2)>>2;
nengel@2	220 src[3+2*stride]=
nengel@2	221 src[1+3*stride]=
nengel@2	222 src[0+3*stride]=
nengel@2	223 src[2+2*stride]=
nengel@2	224 src[2+3*stride]=
nengel@2	225 src[3+3*stride]=l3;
nengel@2	226 }
nengel@2	227
nengel@2	228
nengel@2	229 static void pred4x4_horizontal_down_c(uint8_t src, uint8_t topright, int stride){
nengel@2	230 (void) topright;
nengel@2	231 const int lt= src[-1-1*stride];
nengel@2	232 LOAD_TOP_EDGE
nengel@2	233 LOAD_LEFT_EDGE
nengel@2	234
nengel@2	235 src[0+0*stride]=
nengel@2	236 src[2+1*stride]=(lt + l0 + 1)>>1;
nengel@2	237 src[1+0*stride]=
nengel@2	238 src[3+1stride]=(l0 + 2lt + t0 + 2)>>2;
nengel@2	239 src[2+0stride]=(lt + 2t0 + t1 + 2)>>2;
nengel@2	240 src[3+0stride]=(t0 + 2t1 + t2 + 2)>>2;
nengel@2	241 src[0+1*stride]=
nengel@2	242 src[2+2*stride]=(l0 + l1 + 1)>>1;
nengel@2	243 src[1+1*stride]=
nengel@2	244 src[3+2stride]=(lt + 2l0 + l1 + 2)>>2;
nengel@2	245 src[0+2*stride]=
nengel@2	246 src[2+3*stride]=(l1 + l2+ 1)>>1;
nengel@2	247 src[1+2*stride]=
nengel@2	248 src[3+3stride]=(l0 + 2l1 + l2 + 2)>>2;
nengel@2	249 src[0+3*stride]=(l2 + l3 + 1)>>1;
nengel@2	250 src[1+3stride]=(l1 + 2l2 + l3 + 2)>>2;
nengel@2	251 }
nengel@2	252
nengel@2	253 static void pred16x16_vertical_c(uint8_t *src, int stride){
nengel@2	254 int i;
nengel@2	255 const uint32_t a= ((uint32_t*)(src-stride))[0];
nengel@2	256 const uint32_t b= ((uint32_t*)(src-stride))[1];
nengel@2	257 const uint32_t c= ((uint32_t*)(src-stride))[2];
nengel@2	258 const uint32_t d= ((uint32_t*)(src-stride))[3];
nengel@2	259
nengel@2	260 for(i=0; i<16; i++){
nengel@2	261 ((uint32_t)(src+istride))[0]= a;
nengel@2	262 ((uint32_t)(src+istride))[1]= b;
nengel@2	263 ((uint32_t)(src+istride))[2]= c;
nengel@2	264 ((uint32_t)(src+istride))[3]= d;
nengel@2	265 }
nengel@2	266 }
nengel@2	267
nengel@2	268 static void pred16x16_horizontal_c(uint8_t *src, int stride){
nengel@2	269 int i;
nengel@2	270
nengel@2	271 for(i=0; i<16; i++){
nengel@2	272 ((uint32_t)(src+istride))[0]=
nengel@2	273 ((uint32_t)(src+istride))[1]=
nengel@2	274 ((uint32_t)(src+istride))[2]=
nengel@2	275 ((uint32_t)(src+istride))[3]= src[-1+istride]0x01010101;
nengel@2	276 }
nengel@2	277 }
nengel@2	278
nengel@2	279 static void pred16x16_dc_c(uint8_t *src, int stride){
nengel@2	280 int i, dc=0;
nengel@2	281
nengel@2	282 for(i=0;i<16; i++){
nengel@2	283 dc+= src[-1+i*stride];
nengel@2	284 }
nengel@2	285
nengel@2	286 for(i=0;i<16; i++){
nengel@2	287 dc+= src[i-stride];
nengel@2	288 }
nengel@2	289
nengel@2	290 dc= 0x01010101*((dc + 16)>>5);
nengel@2	291
nengel@2	292 for(i=0; i<16; i++){
nengel@2	293 ((uint32_t)(src+istride))[0]=
nengel@2	294 ((uint32_t)(src+istride))[1]=
nengel@2	295 ((uint32_t)(src+istride))[2]=
nengel@2	296 ((uint32_t)(src+istride))[3]= dc;
nengel@2	297 }
nengel@2	298 }
nengel@2	299
nengel@2	300 static void pred16x16_left_dc_c(uint8_t *src, int stride){
nengel@2	301 int i, dc=0;
nengel@2	302
nengel@2	303 for(i=0;i<16; i++){
nengel@2	304 dc+= src[-1+i*stride];
nengel@2	305 }
nengel@2	306
nengel@2	307 dc= 0x01010101*((dc + 8)>>4);
nengel@2	308
nengel@2	309 for(i=0; i<16; i++){
nengel@2	310 ((uint32_t)(src+istride))[0]=
nengel@2	311 ((uint32_t)(src+istride))[1]=
nengel@2	312 ((uint32_t)(src+istride))[2]=
nengel@2	313 ((uint32_t)(src+istride))[3]= dc;
nengel@2	314 }
nengel@2	315 }
nengel@2	316
nengel@2	317 static void pred16x16_top_dc_c(uint8_t *src, int stride){
nengel@2	318 int i, dc=0;
nengel@2	319
nengel@2	320 for(i=0;i<16; i++){
nengel@2	321 dc+= src[i-stride];
nengel@2	322 }
nengel@2	323 dc= 0x01010101*((dc + 8)>>4);
nengel@2	324
nengel@2	325 for(i=0; i<16; i++){
nengel@2	326 ((uint32_t)(src+istride))[0]=
nengel@2	327 ((uint32_t)(src+istride))[1]=
nengel@2	328 ((uint32_t)(src+istride))[2]=
nengel@2	329 ((uint32_t)(src+istride))[3]= dc;
nengel@2	330 }
nengel@2	331 }
nengel@2	332
nengel@2	333 static void pred16x16_128_dc_c(uint8_t *src, int stride){
nengel@2	334 int i;
nengel@2	335
nengel@2	336 for(i=0; i<16; i++){
nengel@2	337 ((uint32_t)(src+istride))[0]=
nengel@2	338 ((uint32_t)(src+istride))[1]=
nengel@2	339 ((uint32_t)(src+istride))[2]=
nengel@2	340 ((uint32_t)(src+istride))[3]= 0x01010101U*128U;
nengel@2	341 }
nengel@2	342 }
nengel@2	343
nengel@2	344 static inline void pred16x16_plane_compat_c(uint8_t *src, int stride, const int svq3, const int rv40){
nengel@2	345 int i, j, k;
nengel@2	346 int a;
nengel@2	347 uint8_t *cm = ff_cropTbl + MAX_NEG_CROP;
nengel@2	348 const uint8_t * const src0 = src+7-stride;
nengel@2	349 const uint8_t src1 = src+8stride-1;
nengel@2	350 const uint8_t src2 = src1-2stride; // == src+6*stride-1;
nengel@2	351 int H = src0[1] - src0[-1];
nengel@2	352 int V = src1[0] - src2[ 0];
nengel@2	353 for(k=2; k<=8; ++k) {
nengel@2	354 src1 += stride; src2 -= stride;
nengel@2	355 H += k*(src0[k] - src0[-k]);
nengel@2	356 V += k*(src1[0] - src2[ 0]);
nengel@2	357 }
nengel@2	358 if(svq3){
nengel@2	359 H = ( 5*(H/4) ) / 16;
nengel@2	360 V = ( 5*(V/4) ) / 16;
nengel@2	361
nengel@2	362 /* required for 100% accuracy */
nengel@2	363 i = H; H = V; V = i;
nengel@2	364 }else if(rv40){
nengel@2	365 H = ( H + (H>>2) ) >> 4;
nengel@2	366 V = ( V + (V>>2) ) >> 4;
nengel@2	367 }else{
nengel@2	368 H = ( 5*H+32 ) >> 6;
nengel@2	369 V = ( 5*V+32 ) >> 6;
nengel@2	370 }
nengel@2	371
nengel@2	372 a = 16(src1[0] + src2[16] + 1) - 7(V+H);
nengel@2	373 for(j=16; j>0; --j) {
nengel@2	374 int b = a;
nengel@2	375 a += V;
nengel@2	376 for(i=-16; i<0; i+=4) {
nengel@2	377 src[16+i] = cm[ (b ) >> 5 ];
nengel@2	378 src[17+i] = cm[ (b+ H) >> 5 ];
nengel@2	379 src[18+i] = cm[ (b+2*H) >> 5 ];
nengel@2	380 src[19+i] = cm[ (b+3*H) >> 5 ];
nengel@2	381 b += 4*H;
nengel@2	382 }
nengel@2	383 src += stride;
nengel@2	384 }
nengel@2	385 }
nengel@2	386
nengel@2	387 static void pred16x16_plane_c(uint8_t *src, int stride){
nengel@2	388 pred16x16_plane_compat_c(src, stride, 0, 0);
nengel@2	389 }
nengel@2	390
nengel@2	391
nengel@2	392 static void pred8x8_vertical_c(uint8_t *src, int stride){
nengel@2	393 int i;
nengel@2	394 const uint32_t a= ((uint32_t*)(src-stride))[0];
nengel@2	395 const uint32_t b= ((uint32_t*)(src-stride))[1];
nengel@2	396
nengel@2	397 for(i=0; i<8; i++){
nengel@2	398 ((uint32_t)(src+istride))[0]= a;
nengel@2	399 ((uint32_t)(src+istride))[1]= b;
nengel@2	400 }
nengel@2	401 }
nengel@2	402
nengel@2	403 static void pred8x8_horizontal_c(uint8_t *src, int stride){
nengel@2	404 int i;
nengel@2	405
nengel@2	406 for(i=0; i<8; i++){
nengel@2	407 ((uint32_t)(src+istride))[0]=
nengel@2	408 ((uint32_t)(src+istride))[1]= src[-1+istride]0x01010101;
nengel@2	409 }
nengel@2	410 }
nengel@2	411
nengel@2	412 static void pred8x8_128_dc_c(uint8_t *src, int stride){
nengel@2	413 int i;
nengel@2	414
nengel@2	415 for(i=0; i<8; i++){
nengel@2	416 ((uint32_t)(src+istride))[0]=
nengel@2	417 ((uint32_t)(src+istride))[1]= 0x01010101U*128U;
nengel@2	418 }
nengel@2	419 }
nengel@2	420
nengel@2	421 static void pred8x8_left_dc_c(uint8_t *src, int stride){
nengel@2	422 int i;
nengel@2	423 int dc0, dc2;
nengel@2	424
nengel@2	425 dc0=dc2=0;
nengel@2	426 for(i=0;i<4; i++){
nengel@2	427 dc0+= src[-1+i*stride];
nengel@2	428 dc2+= src[-1+(i+4)*stride];
nengel@2	429 }
nengel@2	430 dc0= 0x01010101*((dc0 + 2)>>2);
nengel@2	431 dc2= 0x01010101*((dc2 + 2)>>2);
nengel@2	432
nengel@2	433 for(i=0; i<4; i++){
nengel@2	434 ((uint32_t)(src+istride))[0]=
nengel@2	435 ((uint32_t)(src+istride))[1]= dc0;
nengel@2	436 }
nengel@2	437 for(i=4; i<8; i++){
nengel@2	438 ((uint32_t)(src+istride))[0]=
nengel@2	439 ((uint32_t)(src+istride))[1]= dc2;
nengel@2	440 }
nengel@2	441 }
nengel@2	442
nengel@2	443
nengel@2	444 static void pred8x8_top_dc_c(uint8_t *src, int stride){
nengel@2	445 int i;
nengel@2	446 int dc0, dc1;
nengel@2	447
nengel@2	448 dc0=dc1=0;
nengel@2	449 for(i=0;i<4; i++){
nengel@2	450 dc0+= src[i-stride];
nengel@2	451 dc1+= src[4+i-stride];
nengel@2	452 }
nengel@2	453 dc0= 0x01010101*((dc0 + 2)>>2);
nengel@2	454 dc1= 0x01010101*((dc1 + 2)>>2);
nengel@2	455
nengel@2	456 for(i=0; i<4; i++){
nengel@2	457 ((uint32_t)(src+istride))[0]= dc0;
nengel@2	458 ((uint32_t)(src+istride))[1]= dc1;
nengel@2	459 }
nengel@2	460 for(i=4; i<8; i++){
nengel@2	461 ((uint32_t)(src+istride))[0]= dc0;
nengel@2	462 ((uint32_t)(src+istride))[1]= dc1;
nengel@2	463 }
nengel@2	464 }
nengel@2	465
nengel@2	466 static void pred8x8_dc_c(uint8_t *src, int stride){
nengel@2	467 int i;
nengel@2	468 int dc0, dc1, dc2, dc3;
nengel@2	469
nengel@2	470 dc0=dc1=dc2=0;
nengel@2	471 for(i=0;i<4; i++){
nengel@2	472 dc0+= src[-1+i*stride] + src[i-stride];
nengel@2	473 dc1+= src[4+i-stride];
nengel@2	474 dc2+= src[-1+(i+4)*stride];
nengel@2	475 }
nengel@2	476 dc3= 0x01010101*((dc1 + dc2 + 4)>>3);
nengel@2	477 dc0= 0x01010101*((dc0 + 4)>>3);
nengel@2	478 dc1= 0x01010101*((dc1 + 2)>>2);
nengel@2	479 dc2= 0x01010101*((dc2 + 2)>>2);
nengel@2	480
nengel@2	481 for(i=0; i<4; i++){
nengel@2	482 ((uint32_t)(src+istride))[0]= dc0;
nengel@2	483 ((uint32_t)(src+istride))[1]= dc1;
nengel@2	484 }
nengel@2	485 for(i=4; i<8; i++){
nengel@2	486 ((uint32_t)(src+istride))[0]= dc2;
nengel@2	487 ((uint32_t)(src+istride))[1]= dc3;
nengel@2	488 }
nengel@2	489 }
nengel@2	490
nengel@2	491 //the following 4 function should not be optimized!
nengel@2	492 static void pred8x8_mad_cow_dc_l0t(uint8_t *src, int stride){
nengel@2	493 pred8x8_top_dc_c(src, stride);
nengel@2	494 pred4x4_dc_c(src, NULL, stride);
nengel@2	495 }
nengel@2	496
nengel@2	497 static void pred8x8_mad_cow_dc_0lt(uint8_t *src, int stride){
nengel@2	498 pred8x8_dc_c(src, stride);
nengel@2	499 pred4x4_top_dc_c(src, NULL, stride);
nengel@2	500 }
nengel@2	501
nengel@2	502 static void pred8x8_mad_cow_dc_l00(uint8_t *src, int stride){
nengel@2	503 pred8x8_left_dc_c(src, stride);
nengel@2	504 pred4x4_128_dc_c(src + 4*stride , NULL, stride);
nengel@2	505 pred4x4_128_dc_c(src + 4*stride + 4, NULL, stride);
nengel@2	506 }
nengel@2	507
nengel@2	508 static void pred8x8_mad_cow_dc_0l0(uint8_t *src, int stride){
nengel@2	509 pred8x8_left_dc_c(src, stride);
nengel@2	510 pred4x4_128_dc_c(src , NULL, stride);
nengel@2	511 pred4x4_128_dc_c(src + 4, NULL, stride);
nengel@2	512 }
nengel@2	513
nengel@2	514 static void pred8x8_plane_c(uint8_t *src, int stride){
nengel@2	515 int j, k;
nengel@2	516 int a;
nengel@2	517 uint8_t *cm = ff_cropTbl + MAX_NEG_CROP;
nengel@2	518 const uint8_t * const src0 = src+3-stride;
nengel@2	519 const uint8_t src1 = src+4stride-1;
nengel@2	520 const uint8_t src2 = src1-2stride; // == src+2*stride-1;
nengel@2	521 int H = src0[1] - src0[-1];
nengel@2	522 int V = src1[0] - src2[ 0];
nengel@2	523 for(k=2; k<=4; ++k) {
nengel@2	524 src1 += stride; src2 -= stride;
nengel@2	525 H += k*(src0[k] - src0[-k]);
nengel@2	526 V += k*(src1[0] - src2[ 0]);
nengel@2	527 }
nengel@2	528 H = ( 17*H+16 ) >> 5;
nengel@2	529 V = ( 17*V+16 ) >> 5;
nengel@2	530
nengel@2	531 a = 16(src1[0] + src2[8]+1) - 3(V+H);
nengel@2	532 for(j=8; j>0; --j) {
nengel@2	533 int b = a;
nengel@2	534 a += V;
nengel@2	535 src[0] = cm[ (b ) >> 5 ];
nengel@2	536 src[1] = cm[ (b+ H) >> 5 ];
nengel@2	537 src[2] = cm[ (b+2*H) >> 5 ];
nengel@2	538 src[3] = cm[ (b+3*H) >> 5 ];
nengel@2	539 src[4] = cm[ (b+4*H) >> 5 ];
nengel@2	540 src[5] = cm[ (b+5*H) >> 5 ];
nengel@2	541 src[6] = cm[ (b+6*H) >> 5 ];
nengel@2	542 src[7] = cm[ (b+7*H) >> 5 ];
nengel@2	543 src += stride;
nengel@2	544 }
nengel@2	545 }
nengel@2	546
nengel@2	547 #define SRC(x,y) src[(x)+(y)*stride]
nengel@2	548 #define PL(y) \
nengel@2	549 const int l##y = (SRC(-1,y-1) + 2*SRC(-1,y) + SRC(-1,y+1) + 2) >> 2;
nengel@2	550 #define PREDICT_8x8_LOAD_LEFT \
nengel@2	551 const int l0 = ((has_topleft ? SRC(-1,-1) : SRC(-1,0)) \
nengel@2	552 + 2*SRC(-1,0) + SRC(-1,1) + 2) >> 2; \
nengel@2	553 PL(1) PL(2) PL(3) PL(4) PL(5) PL(6) \
nengel@2	554 const int l7 av_unused = (SRC(-1,6) + 3*SRC(-1,7) + 2) >> 2
nengel@2	555
nengel@2	556 #define PT(x) \
nengel@2	557 const int t##x = (SRC(x-1,-1) + 2*SRC(x,-1) + SRC(x+1,-1) + 2) >> 2;
nengel@2	558 #define PREDICT_8x8_LOAD_TOP \
nengel@2	559 const int t0 = ((has_topleft ? SRC(-1,-1) : SRC(0,-1)) \
nengel@2	560 + 2*SRC(0,-1) + SRC(1,-1) + 2) >> 2; \
nengel@2	561 PT(1) PT(2) PT(3) PT(4) PT(5) PT(6) \
nengel@2	562 const int t7 av_unused = ((has_topright ? SRC(8,-1) : SRC(7,-1)) \
nengel@2	563 + 2*SRC(7,-1) + SRC(6,-1) + 2) >> 2
nengel@2	564
nengel@2	565 #define PTR(x) \
nengel@2	566 t##x = (SRC(x-1,-1) + 2*SRC(x,-1) + SRC(x+1,-1) + 2) >> 2;
nengel@2	567 #define PREDICT_8x8_LOAD_TOPRIGHT \
nengel@2	568 int t8, t9, t10, t11, t12, t13, t14, t15; \
nengel@2	569 if(has_topright) { \
nengel@2	570 PTR(8) PTR(9) PTR(10) PTR(11) PTR(12) PTR(13) PTR(14) \
nengel@2	571 t15 = (SRC(14,-1) + 3*SRC(15,-1) + 2) >> 2; \
nengel@2	572 } else t8=t9=t10=t11=t12=t13=t14=t15= SRC(7,-1);
nengel@2	573
nengel@2	574 #define PREDICT_8x8_LOAD_TOPLEFT \
nengel@2	575 const int lt = (SRC(-1,0) + 2*SRC(-1,-1) + SRC(0,-1) + 2) >> 2
nengel@2	576
nengel@2	577 #define PREDICT_8x8_DC(v) \
nengel@2	578 int y; \
nengel@2	579 for( y = 0; y < 8; y++ ) { \
nengel@2	580 ((uint32_t*)src)[0] = \
nengel@2	581 ((uint32_t*)src)[1] = v; \
nengel@2	582 src += stride; \
nengel@2	583 }
nengel@2	584
nengel@2	585 static void pred8x8l_128_dc_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	586 (void) has_topleft; (void) has_topright;
nengel@2	587 PREDICT_8x8_DC(0x80808080);
nengel@2	588 }
nengel@2	589
nengel@2	590 static void pred8x8l_left_dc_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	591 (void) has_topleft; (void) has_topright;
nengel@2	592 PREDICT_8x8_LOAD_LEFT;
nengel@2	593 const uint32_t dc = ((l0+l1+l2+l3+l4+l5+l6+l7+4) >> 3) * 0x01010101;
nengel@2	594 PREDICT_8x8_DC(dc);
nengel@2	595 }
nengel@2	596
nengel@2	597 static void pred8x8l_top_dc_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	598 PREDICT_8x8_LOAD_TOP;
nengel@2	599 const uint32_t dc = ((t0+t1+t2+t3+t4+t5+t6+t7+4) >> 3) * 0x01010101;
nengel@2	600 PREDICT_8x8_DC(dc);
nengel@2	601 }
nengel@2	602
nengel@2	603 static void pred8x8l_dc_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	604 PREDICT_8x8_LOAD_LEFT;
nengel@2	605 PREDICT_8x8_LOAD_TOP;
nengel@2	606 const uint32_t dc = ((l0+l1+l2+l3+l4+l5+l6+l7
nengel@2	607 +t0+t1+t2+t3+t4+t5+t6+t7+8) >> 4) * 0x01010101;
nengel@2	608 PREDICT_8x8_DC(dc);
nengel@2	609 }
nengel@2	610
nengel@2	611 static void pred8x8l_horizontal_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	612 (void) has_topleft; (void) has_topright;
nengel@2	613 PREDICT_8x8_LOAD_LEFT;
nengel@2	614 #define ROW(y) ((uint32_t)(src+ystride))[0] =\
nengel@2	615 ((uint32_t)(src+ystride))[1] = 0x01010101 * l##y
nengel@2	616 ROW(0); ROW(1); ROW(2); ROW(3); ROW(4); ROW(5); ROW(6); ROW(7);
nengel@2	617 #undef ROW
nengel@2	618 }
nengel@2	619
nengel@2	620 static void pred8x8l_vertical_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	621 int y;
nengel@2	622 PREDICT_8x8_LOAD_TOP;
nengel@2	623 src[0] = t0;
nengel@2	624 src[1] = t1;
nengel@2	625 src[2] = t2;
nengel@2	626 src[3] = t3;
nengel@2	627 src[4] = t4;
nengel@2	628 src[5] = t5;
nengel@2	629 src[6] = t6;
nengel@2	630 src[7] = t7;
nengel@2	631 for( y = 1; y < 8; y++ )
nengel@2	632 (uint64_t)(src+ystride) = (uint64_t*)src;
nengel@2	633 }
nengel@2	634
nengel@2	635 static void pred8x8l_down_left_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	636 PREDICT_8x8_LOAD_TOP;
nengel@2	637 PREDICT_8x8_LOAD_TOPRIGHT;
nengel@2	638 SRC(0,0)= (t0 + 2*t1 + t2 + 2) >> 2;
nengel@2	639 SRC(0,1)=SRC(1,0)= (t1 + 2*t2 + t3 + 2) >> 2;
nengel@2	640 SRC(0,2)=SRC(1,1)=SRC(2,0)= (t2 + 2*t3 + t4 + 2) >> 2;
nengel@2	641 SRC(0,3)=SRC(1,2)=SRC(2,1)=SRC(3,0)= (t3 + 2*t4 + t5 + 2) >> 2;
nengel@2	642 SRC(0,4)=SRC(1,3)=SRC(2,2)=SRC(3,1)=SRC(4,0)= (t4 + 2*t5 + t6 + 2) >> 2;
nengel@2	643 SRC(0,5)=SRC(1,4)=SRC(2,3)=SRC(3,2)=SRC(4,1)=SRC(5,0)= (t5 + 2*t6 + t7 + 2) >> 2;
nengel@2	644 SRC(0,6)=SRC(1,5)=SRC(2,4)=SRC(3,3)=SRC(4,2)=SRC(5,1)=SRC(6,0)= (t6 + 2*t7 + t8 + 2) >> 2;
nengel@2	645 SRC(0,7)=SRC(1,6)=SRC(2,5)=SRC(3,4)=SRC(4,3)=SRC(5,2)=SRC(6,1)=SRC(7,0)= (t7 + 2*t8 + t9 + 2) >> 2;
nengel@2	646 SRC(1,7)=SRC(2,6)=SRC(3,5)=SRC(4,4)=SRC(5,3)=SRC(6,2)=SRC(7,1)= (t8 + 2*t9 + t10 + 2) >> 2;
nengel@2	647 SRC(2,7)=SRC(3,6)=SRC(4,5)=SRC(5,4)=SRC(6,3)=SRC(7,2)= (t9 + 2*t10 + t11 + 2) >> 2;
nengel@2	648 SRC(3,7)=SRC(4,6)=SRC(5,5)=SRC(6,4)=SRC(7,3)= (t10 + 2*t11 + t12 + 2) >> 2;
nengel@2	649 SRC(4,7)=SRC(5,6)=SRC(6,5)=SRC(7,4)= (t11 + 2*t12 + t13 + 2) >> 2;
nengel@2	650 SRC(5,7)=SRC(6,6)=SRC(7,5)= (t12 + 2*t13 + t14 + 2) >> 2;
nengel@2	651 SRC(6,7)=SRC(7,6)= (t13 + 2*t14 + t15 + 2) >> 2;
nengel@2	652 SRC(7,7)= (t14 + 3*t15 + 2) >> 2;
nengel@2	653 }
nengel@2	654
nengel@2	655 static void pred8x8l_down_right_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	656 PREDICT_8x8_LOAD_TOP;
nengel@2	657 PREDICT_8x8_LOAD_LEFT;
nengel@2	658 PREDICT_8x8_LOAD_TOPLEFT;
nengel@2	659 SRC(0,7)= (l7 + 2*l6 + l5 + 2) >> 2;
nengel@2	660 SRC(0,6)=SRC(1,7)= (l6 + 2*l5 + l4 + 2) >> 2;
nengel@2	661 SRC(0,5)=SRC(1,6)=SRC(2,7)= (l5 + 2*l4 + l3 + 2) >> 2;
nengel@2	662 SRC(0,4)=SRC(1,5)=SRC(2,6)=SRC(3,7)= (l4 + 2*l3 + l2 + 2) >> 2;
nengel@2	663 SRC(0,3)=SRC(1,4)=SRC(2,5)=SRC(3,6)=SRC(4,7)= (l3 + 2*l2 + l1 + 2) >> 2;
nengel@2	664 SRC(0,2)=SRC(1,3)=SRC(2,4)=SRC(3,5)=SRC(4,6)=SRC(5,7)= (l2 + 2*l1 + l0 + 2) >> 2;
nengel@2	665 SRC(0,1)=SRC(1,2)=SRC(2,3)=SRC(3,4)=SRC(4,5)=SRC(5,6)=SRC(6,7)= (l1 + 2*l0 + lt + 2) >> 2;
nengel@2	666 SRC(0,0)=SRC(1,1)=SRC(2,2)=SRC(3,3)=SRC(4,4)=SRC(5,5)=SRC(6,6)=SRC(7,7)= (l0 + 2*lt + t0 + 2) >> 2;
nengel@2	667 SRC(1,0)=SRC(2,1)=SRC(3,2)=SRC(4,3)=SRC(5,4)=SRC(6,5)=SRC(7,6)= (lt + 2*t0 + t1 + 2) >> 2;
nengel@2	668 SRC(2,0)=SRC(3,1)=SRC(4,2)=SRC(5,3)=SRC(6,4)=SRC(7,5)= (t0 + 2*t1 + t2 + 2) >> 2;
nengel@2	669 SRC(3,0)=SRC(4,1)=SRC(5,2)=SRC(6,3)=SRC(7,4)= (t1 + 2*t2 + t3 + 2) >> 2;
nengel@2	670 SRC(4,0)=SRC(5,1)=SRC(6,2)=SRC(7,3)= (t2 + 2*t3 + t4 + 2) >> 2;
nengel@2	671 SRC(5,0)=SRC(6,1)=SRC(7,2)= (t3 + 2*t4 + t5 + 2) >> 2;
nengel@2	672 SRC(6,0)=SRC(7,1)= (t4 + 2*t5 + t6 + 2) >> 2;
nengel@2	673 SRC(7,0)= (t5 + 2*t6 + t7 + 2) >> 2;
nengel@2	674 }
nengel@2	675
nengel@2	676 static void pred8x8l_vertical_right_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	677 PREDICT_8x8_LOAD_TOP;
nengel@2	678 PREDICT_8x8_LOAD_LEFT;
nengel@2	679 PREDICT_8x8_LOAD_TOPLEFT;
nengel@2	680 SRC(0,6)= (l5 + 2*l4 + l3 + 2) >> 2;
nengel@2	681 SRC(0,7)= (l6 + 2*l5 + l4 + 2) >> 2;
nengel@2	682 SRC(0,4)=SRC(1,6)= (l3 + 2*l2 + l1 + 2) >> 2;
nengel@2	683 SRC(0,5)=SRC(1,7)= (l4 + 2*l3 + l2 + 2) >> 2;
nengel@2	684 SRC(0,2)=SRC(1,4)=SRC(2,6)= (l1 + 2*l0 + lt + 2) >> 2;
nengel@2	685 SRC(0,3)=SRC(1,5)=SRC(2,7)= (l2 + 2*l1 + l0 + 2) >> 2;
nengel@2	686 SRC(0,1)=SRC(1,3)=SRC(2,5)=SRC(3,7)= (l0 + 2*lt + t0 + 2) >> 2;
nengel@2	687 SRC(0,0)=SRC(1,2)=SRC(2,4)=SRC(3,6)= (lt + t0 + 1) >> 1;
nengel@2	688 SRC(1,1)=SRC(2,3)=SRC(3,5)=SRC(4,7)= (lt + 2*t0 + t1 + 2) >> 2;
nengel@2	689 SRC(1,0)=SRC(2,2)=SRC(3,4)=SRC(4,6)= (t0 + t1 + 1) >> 1;
nengel@2	690 SRC(2,1)=SRC(3,3)=SRC(4,5)=SRC(5,7)= (t0 + 2*t1 + t2 + 2) >> 2;
nengel@2	691 SRC(2,0)=SRC(3,2)=SRC(4,4)=SRC(5,6)= (t1 + t2 + 1) >> 1;
nengel@2	692 SRC(3,1)=SRC(4,3)=SRC(5,5)=SRC(6,7)= (t1 + 2*t2 + t3 + 2) >> 2;
nengel@2	693 SRC(3,0)=SRC(4,2)=SRC(5,4)=SRC(6,6)= (t2 + t3 + 1) >> 1;
nengel@2	694 SRC(4,1)=SRC(5,3)=SRC(6,5)=SRC(7,7)= (t2 + 2*t3 + t4 + 2) >> 2;
nengel@2	695 SRC(4,0)=SRC(5,2)=SRC(6,4)=SRC(7,6)= (t3 + t4 + 1) >> 1;
nengel@2	696 SRC(5,1)=SRC(6,3)=SRC(7,5)= (t3 + 2*t4 + t5 + 2) >> 2;
nengel@2	697 SRC(5,0)=SRC(6,2)=SRC(7,4)= (t4 + t5 + 1) >> 1;
nengel@2	698 SRC(6,1)=SRC(7,3)= (t4 + 2*t5 + t6 + 2) >> 2;
nengel@2	699 SRC(6,0)=SRC(7,2)= (t5 + t6 + 1) >> 1;
nengel@2	700 SRC(7,1)= (t5 + 2*t6 + t7 + 2) >> 2;
nengel@2	701 SRC(7,0)= (t6 + t7 + 1) >> 1;
nengel@2	702 }
nengel@2	703
nengel@2	704 static void pred8x8l_horizontal_down_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	705 PREDICT_8x8_LOAD_TOP;
nengel@2	706 PREDICT_8x8_LOAD_LEFT;
nengel@2	707 PREDICT_8x8_LOAD_TOPLEFT;
nengel@2	708 SRC(0,7)= (l6 + l7 + 1) >> 1;
nengel@2	709 SRC(1,7)= (l5 + 2*l6 + l7 + 2) >> 2;
nengel@2	710 SRC(0,6)=SRC(2,7)= (l5 + l6 + 1) >> 1;
nengel@2	711 SRC(1,6)=SRC(3,7)= (l4 + 2*l5 + l6 + 2) >> 2;
nengel@2	712 SRC(0,5)=SRC(2,6)=SRC(4,7)= (l4 + l5 + 1) >> 1;
nengel@2	713 SRC(1,5)=SRC(3,6)=SRC(5,7)= (l3 + 2*l4 + l5 + 2) >> 2;
nengel@2	714 SRC(0,4)=SRC(2,5)=SRC(4,6)=SRC(6,7)= (l3 + l4 + 1) >> 1;
nengel@2	715 SRC(1,4)=SRC(3,5)=SRC(5,6)=SRC(7,7)= (l2 + 2*l3 + l4 + 2) >> 2;
nengel@2	716 SRC(0,3)=SRC(2,4)=SRC(4,5)=SRC(6,6)= (l2 + l3 + 1) >> 1;
nengel@2	717 SRC(1,3)=SRC(3,4)=SRC(5,5)=SRC(7,6)= (l1 + 2*l2 + l3 + 2) >> 2;
nengel@2	718 SRC(0,2)=SRC(2,3)=SRC(4,4)=SRC(6,5)= (l1 + l2 + 1) >> 1;
nengel@2	719 SRC(1,2)=SRC(3,3)=SRC(5,4)=SRC(7,5)= (l0 + 2*l1 + l2 + 2) >> 2;
nengel@2	720 SRC(0,1)=SRC(2,2)=SRC(4,3)=SRC(6,4)= (l0 + l1 + 1) >> 1;
nengel@2	721 SRC(1,1)=SRC(3,2)=SRC(5,3)=SRC(7,4)= (lt + 2*l0 + l1 + 2) >> 2;
nengel@2	722 SRC(0,0)=SRC(2,1)=SRC(4,2)=SRC(6,3)= (lt + l0 + 1) >> 1;
nengel@2	723 SRC(1,0)=SRC(3,1)=SRC(5,2)=SRC(7,3)= (l0 + 2*lt + t0 + 2) >> 2;
nengel@2	724 SRC(2,0)=SRC(4,1)=SRC(6,2)= (t1 + 2*t0 + lt + 2) >> 2;
nengel@2	725 SRC(3,0)=SRC(5,1)=SRC(7,2)= (t2 + 2*t1 + t0 + 2) >> 2;
nengel@2	726 SRC(4,0)=SRC(6,1)= (t3 + 2*t2 + t1 + 2) >> 2;
nengel@2	727 SRC(5,0)=SRC(7,1)= (t4 + 2*t3 + t2 + 2) >> 2;
nengel@2	728 SRC(6,0)= (t5 + 2*t4 + t3 + 2) >> 2;
nengel@2	729 SRC(7,0)= (t6 + 2*t5 + t4 + 2) >> 2;
nengel@2	730 }
nengel@2	731
nengel@2	732 static void pred8x8l_vertical_left_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	733 PREDICT_8x8_LOAD_TOP;
nengel@2	734 PREDICT_8x8_LOAD_TOPRIGHT;
nengel@2	735 SRC(0,0)= (t0 + t1 + 1) >> 1;
nengel@2	736 SRC(0,1)= (t0 + 2*t1 + t2 + 2) >> 2;
nengel@2	737 SRC(0,2)=SRC(1,0)= (t1 + t2 + 1) >> 1;
nengel@2	738 SRC(0,3)=SRC(1,1)= (t1 + 2*t2 + t3 + 2) >> 2;
nengel@2	739 SRC(0,4)=SRC(1,2)=SRC(2,0)= (t2 + t3 + 1) >> 1;
nengel@2	740 SRC(0,5)=SRC(1,3)=SRC(2,1)= (t2 + 2*t3 + t4 + 2) >> 2;
nengel@2	741 SRC(0,6)=SRC(1,4)=SRC(2,2)=SRC(3,0)= (t3 + t4 + 1) >> 1;
nengel@2	742 SRC(0,7)=SRC(1,5)=SRC(2,3)=SRC(3,1)= (t3 + 2*t4 + t5 + 2) >> 2;
nengel@2	743 SRC(1,6)=SRC(2,4)=SRC(3,2)=SRC(4,0)= (t4 + t5 + 1) >> 1;
nengel@2	744 SRC(1,7)=SRC(2,5)=SRC(3,3)=SRC(4,1)= (t4 + 2*t5 + t6 + 2) >> 2;
nengel@2	745 SRC(2,6)=SRC(3,4)=SRC(4,2)=SRC(5,0)= (t5 + t6 + 1) >> 1;
nengel@2	746 SRC(2,7)=SRC(3,5)=SRC(4,3)=SRC(5,1)= (t5 + 2*t6 + t7 + 2) >> 2;
nengel@2	747 SRC(3,6)=SRC(4,4)=SRC(5,2)=SRC(6,0)= (t6 + t7 + 1) >> 1;
nengel@2	748 SRC(3,7)=SRC(4,5)=SRC(5,3)=SRC(6,1)= (t6 + 2*t7 + t8 + 2) >> 2;
nengel@2	749 SRC(4,6)=SRC(5,4)=SRC(6,2)=SRC(7,0)= (t7 + t8 + 1) >> 1;
nengel@2	750 SRC(4,7)=SRC(5,5)=SRC(6,3)=SRC(7,1)= (t7 + 2*t8 + t9 + 2) >> 2;
nengel@2	751 SRC(5,6)=SRC(6,4)=SRC(7,2)= (t8 + t9 + 1) >> 1;
nengel@2	752 SRC(5,7)=SRC(6,5)=SRC(7,3)= (t8 + 2*t9 + t10 + 2) >> 2;
nengel@2	753 SRC(6,6)=SRC(7,4)= (t9 + t10 + 1) >> 1;
nengel@2	754 SRC(6,7)=SRC(7,5)= (t9 + 2*t10 + t11 + 2) >> 2;
nengel@2	755 SRC(7,6)= (t10 + t11 + 1) >> 1;
nengel@2	756 SRC(7,7)= (t10 + 2*t11 + t12 + 2) >> 2;
nengel@2	757 }
nengel@2	758
nengel@2	759 static void pred8x8l_horizontal_up_c(uint8_t *src, int has_topleft, int has_topright, int stride){
nengel@2	760 (void) has_topleft; (void) has_topright;
nengel@2	761 PREDICT_8x8_LOAD_LEFT;
nengel@2	762 SRC(0,0)= (l0 + l1 + 1) >> 1;
nengel@2	763 SRC(1,0)= (l0 + 2*l1 + l2 + 2) >> 2;
nengel@2	764 SRC(0,1)=SRC(2,0)= (l1 + l2 + 1) >> 1;
nengel@2	765 SRC(1,1)=SRC(3,0)= (l1 + 2*l2 + l3 + 2) >> 2;
nengel@2	766 SRC(0,2)=SRC(2,1)=SRC(4,0)= (l2 + l3 + 1) >> 1;
nengel@2	767 SRC(1,2)=SRC(3,1)=SRC(5,0)= (l2 + 2*l3 + l4 + 2) >> 2;
nengel@2	768 SRC(0,3)=SRC(2,2)=SRC(4,1)=SRC(6,0)= (l3 + l4 + 1) >> 1;
nengel@2	769 SRC(1,3)=SRC(3,2)=SRC(5,1)=SRC(7,0)= (l3 + 2*l4 + l5 + 2) >> 2;
nengel@2	770 SRC(0,4)=SRC(2,3)=SRC(4,2)=SRC(6,1)= (l4 + l5 + 1) >> 1;
nengel@2	771 SRC(1,4)=SRC(3,3)=SRC(5,2)=SRC(7,1)= (l4 + 2*l5 + l6 + 2) >> 2;
nengel@2	772 SRC(0,5)=SRC(2,4)=SRC(4,3)=SRC(6,2)= (l5 + l6 + 1) >> 1;
nengel@2	773 SRC(1,5)=SRC(3,4)=SRC(5,3)=SRC(7,2)= (l5 + 2*l6 + l7 + 2) >> 2;
nengel@2	774 SRC(0,6)=SRC(2,5)=SRC(4,4)=SRC(6,3)= (l6 + l7 + 1) >> 1;
nengel@2	775 SRC(1,6)=SRC(3,5)=SRC(5,4)=SRC(7,3)= (l6 + 3*l7 + 2) >> 2;
nengel@2	776 SRC(0,7)=SRC(1,7)=SRC(2,6)=SRC(2,7)=SRC(3,6)=
nengel@2	777 SRC(3,7)=SRC(4,5)=SRC(4,6)=SRC(4,7)=SRC(5,5)=
nengel@2	778 SRC(5,6)=SRC(5,7)=SRC(6,4)=SRC(6,5)=SRC(6,6)=
nengel@2	779 SRC(6,7)=SRC(7,4)=SRC(7,5)=SRC(7,6)=SRC(7,7)= l7;
nengel@2	780 }
nengel@2	781 #undef PREDICT_8x8_LOAD_LEFT
nengel@2	782 #undef PREDICT_8x8_LOAD_TOP
nengel@2	783 #undef PREDICT_8x8_LOAD_TOPLEFT
nengel@2	784 #undef PREDICT_8x8_LOAD_TOPRIGHT
nengel@2	785 #undef PREDICT_8x8_DC
nengel@2	786 #undef PTR
nengel@2	787 #undef PT
nengel@2	788 #undef PL
nengel@2	789 #undef SRC
nengel@2	790
nengel@2	791 static void pred4x4_vertical_add_c(uint8_t pix, const DCTELEM block, int stride){
nengel@2	792 int i;
nengel@2	793 pix -= stride;
nengel@2	794 for(i=0; i<4; i++){
nengel@2	795 uint8_t v = pix[0];
nengel@2	796 pix[1*stride]= v += block[0];
nengel@2	797 pix[2*stride]= v += block[4];
nengel@2	798 pix[3*stride]= v += block[8];
nengel@2	799 pix[4*stride]= v + block[12];
nengel@2	800 pix++;
nengel@2	801 block++;
nengel@2	802 }
nengel@2	803 }
nengel@2	804
nengel@2	805 static void pred4x4_horizontal_add_c(uint8_t pix, const DCTELEM block, int stride){
nengel@2	806 int i;
nengel@2	807 for(i=0; i<4; i++){
nengel@2	808 uint8_t v = pix[-1];
nengel@2	809 pix[0]= v += block[0];
nengel@2	810 pix[1]= v += block[1];
nengel@2	811 pix[2]= v += block[2];
nengel@2	812 pix[3]= v + block[3];
nengel@2	813 pix+= stride;
nengel@2	814 block+= 4;
nengel@2	815 }
nengel@2	816 }
nengel@2	817
nengel@2	818 static void pred8x8l_vertical_add_c(uint8_t pix, const DCTELEM block, int stride){
nengel@2	819 int i;
nengel@2	820 pix -= stride;
nengel@2	821 for(i=0; i<8; i++){
nengel@2	822 uint8_t v = pix[0];
nengel@2	823 pix[1*stride]= v += block[0];
nengel@2	824 pix[2*stride]= v += block[8];
nengel@2	825 pix[3*stride]= v += block[16];
nengel@2	826 pix[4*stride]= v += block[24];
nengel@2	827 pix[5*stride]= v += block[32];
nengel@2	828 pix[6*stride]= v += block[40];
nengel@2	829 pix[7*stride]= v += block[48];
nengel@2	830 pix[8*stride]= v + block[56];
nengel@2	831 pix++;
nengel@2	832 block++;
nengel@2	833 }
nengel@2	834 }
nengel@2	835
nengel@2	836 static void pred8x8l_horizontal_add_c(uint8_t pix, const DCTELEM block, int stride){
nengel@2	837 int i;
nengel@2	838 for(i=0; i<8; i++){
nengel@2	839 uint8_t v = pix[-1];
nengel@2	840 pix[0]= v += block[0];
nengel@2	841 pix[1]= v += block[1];
nengel@2	842 pix[2]= v += block[2];
nengel@2	843 pix[3]= v += block[3];
nengel@2	844 pix[4]= v += block[4];
nengel@2	845 pix[5]= v += block[5];
nengel@2	846 pix[6]= v += block[6];
nengel@2	847 pix[7]= v + block[7];
nengel@2	848 pix+= stride;
nengel@2	849 block+= 8;
nengel@2	850 }
nengel@2	851 }
nengel@2	852
nengel@2	853 static void pred16x16_vertical_add_c(uint8_t pix, const int block_offset, const DCTELEM *block, int stride){
nengel@2	854 int i;
nengel@2	855 for(i=0; i<16; i++)
nengel@2	856 pred4x4_vertical_add_c(pix + block_offset[i], block + i*16, stride);
nengel@2	857 }
nengel@2	858
nengel@2	859 static void pred16x16_horizontal_add_c(uint8_t pix, const int block_offset, const DCTELEM *block, int stride){
nengel@2	860 int i;
nengel@2	861 for(i=0; i<16; i++)
nengel@2	862 pred4x4_horizontal_add_c(pix + block_offset[i], block + i*16, stride);
nengel@2	863 }
nengel@2	864
nengel@2	865 static void pred8x8_vertical_add_c(uint8_t pix, const int block_offset, const DCTELEM *block, int stride){
nengel@2	866 int i;
nengel@2	867 for(i=0; i<4; i++)
nengel@2	868 pred4x4_vertical_add_c(pix + block_offset[i], block + i*16, stride);
nengel@2	869 }
nengel@2	870
nengel@2	871 static void pred8x8_horizontal_add_c(uint8_t pix, const int block_offset, const DCTELEM *block, int stride){
nengel@2	872 int i;
nengel@2	873 for(i=0; i<4; i++)
nengel@2	874 pred4x4_horizontal_add_c(pix + block_offset[i], block + i*16, stride);
nengel@2	875 }
nengel@2	876
nengel@2	877
nengel@2	878 /**
nengel@2	879 * Sets the intra prediction function pointers.
nengel@2	880 */
nengel@2	881 void ff_h264_pred_init(H264PredContext *h){
nengel@2	882
nengel@2	883 h->pred4x4[VERT_PRED ]= pred4x4_vertical_c;
nengel@2	884 h->pred4x4[HOR_PRED ]= pred4x4_horizontal_c;
nengel@2	885 h->pred4x4[DC_PRED ]= pred4x4_dc_c;
nengel@2	886 h->pred4x4[DIAG_DOWN_LEFT_PRED ]= pred4x4_down_left_c;
nengel@2	887 h->pred4x4[DIAG_DOWN_RIGHT_PRED]= pred4x4_down_right_c;
nengel@2	888 h->pred4x4[VERT_RIGHT_PRED ]= pred4x4_vertical_right_c;
nengel@2	889 h->pred4x4[HOR_DOWN_PRED ]= pred4x4_horizontal_down_c;
nengel@2	890 h->pred4x4[VERT_LEFT_PRED ]= pred4x4_vertical_left_c;
nengel@2	891 h->pred4x4[HOR_UP_PRED ]= pred4x4_horizontal_up_c;
nengel@2	892 h->pred4x4[LEFT_DC_PRED ]= pred4x4_left_dc_c;
nengel@2	893 h->pred4x4[TOP_DC_PRED ]= pred4x4_top_dc_c;
nengel@2	894 h->pred4x4[DC_128_PRED ]= pred4x4_128_dc_c;
nengel@2	895
nengel@2	896 h->pred8x8l[VERT_PRED ]= pred8x8l_vertical_c;
nengel@2	897 h->pred8x8l[HOR_PRED ]= pred8x8l_horizontal_c;
nengel@2	898 h->pred8x8l[DC_PRED ]= pred8x8l_dc_c;
nengel@2	899 h->pred8x8l[DIAG_DOWN_LEFT_PRED ]= pred8x8l_down_left_c;
nengel@2	900 h->pred8x8l[DIAG_DOWN_RIGHT_PRED]= pred8x8l_down_right_c;
nengel@2	901 h->pred8x8l[VERT_RIGHT_PRED ]= pred8x8l_vertical_right_c;
nengel@2	902 h->pred8x8l[HOR_DOWN_PRED ]= pred8x8l_horizontal_down_c;
nengel@2	903 h->pred8x8l[VERT_LEFT_PRED ]= pred8x8l_vertical_left_c;
nengel@2	904 h->pred8x8l[HOR_UP_PRED ]= pred8x8l_horizontal_up_c;
nengel@2	905 h->pred8x8l[LEFT_DC_PRED ]= pred8x8l_left_dc_c;
nengel@2	906 h->pred8x8l[TOP_DC_PRED ]= pred8x8l_top_dc_c;
nengel@2	907 h->pred8x8l[DC_128_PRED ]= pred8x8l_128_dc_c;
nengel@2	908
nengel@2	909 h->pred8x8[VERT_PRED8x8 ]= pred8x8_vertical_c;
nengel@2	910 h->pred8x8[HOR_PRED8x8 ]= pred8x8_horizontal_c;
nengel@2	911 h->pred8x8[PLANE_PRED8x8 ]= pred8x8_plane_c;
nengel@2	912
nengel@2	913 h->pred8x8[DC_PRED8x8 ]= pred8x8_dc_c;
nengel@2	914 h->pred8x8[LEFT_DC_PRED8x8]= pred8x8_left_dc_c;
nengel@2	915 h->pred8x8[TOP_DC_PRED8x8 ]= pred8x8_top_dc_c;
nengel@2	916 h->pred8x8[ALZHEIMER_DC_L0T_PRED8x8 ]= pred8x8_mad_cow_dc_l0t;
nengel@2	917 h->pred8x8[ALZHEIMER_DC_0LT_PRED8x8 ]= pred8x8_mad_cow_dc_0lt;
nengel@2	918 h->pred8x8[ALZHEIMER_DC_L00_PRED8x8 ]= pred8x8_mad_cow_dc_l00;
nengel@2	919 h->pred8x8[ALZHEIMER_DC_0L0_PRED8x8 ]= pred8x8_mad_cow_dc_0l0;
nengel@2	920
nengel@2	921 h->pred8x8[DC_128_PRED8x8 ]= pred8x8_128_dc_c;
nengel@2	922
nengel@2	923 h->pred16x16[DC_PRED8x8 ]= pred16x16_dc_c;
nengel@2	924 h->pred16x16[VERT_PRED8x8 ]= pred16x16_vertical_c;
nengel@2	925 h->pred16x16[HOR_PRED8x8 ]= pred16x16_horizontal_c;
nengel@2	926 h->pred16x16[PLANE_PRED8x8 ]= pred16x16_plane_c;
nengel@2	927
nengel@2	928 h->pred16x16[PLANE_PRED8x8 ]= pred16x16_plane_c;
nengel@2	929
nengel@2	930 h->pred16x16[LEFT_DC_PRED8x8]= pred16x16_left_dc_c;
nengel@2	931 h->pred16x16[TOP_DC_PRED8x8 ]= pred16x16_top_dc_c;
nengel@2	932 h->pred16x16[DC_128_PRED8x8 ]= pred16x16_128_dc_c;
nengel@2	933
nengel@2	934 //special lossless h/v prediction for h264
nengel@2	935 h->pred4x4_add [VERT_PRED ]= pred4x4_vertical_add_c;
nengel@2	936 h->pred4x4_add [ HOR_PRED ]= pred4x4_horizontal_add_c;
nengel@2	937 h->pred8x8l_add [VERT_PRED ]= pred8x8l_vertical_add_c;
nengel@2	938 h->pred8x8l_add [ HOR_PRED ]= pred8x8l_horizontal_add_c;
nengel@2	939 h->pred8x8_add [VERT_PRED8x8]= pred8x8_vertical_add_c;
nengel@2	940 h->pred8x8_add [ HOR_PRED8x8]= pred8x8_horizontal_add_c;
nengel@2	941 h->pred16x16_add[VERT_PRED8x8]= pred16x16_vertical_add_c;
nengel@2	942 h->pred16x16_add[ HOR_PRED8x8]= pred16x16_horizontal_add_c;
nengel@2	943
nengel@2	944 if (HAVE_NEON) ff_h264_pred_init_arm(h);
nengel@2	945 }

Mercurial > cgi-bin > hgwebdir.cgi > PR > Applications > VSs > VSs__H264__App

annotate libavcodec/h264_pred.c @ 2:897f711a7157

Mercurial > cgi-bin > hgwebdir.cgi > PR > Applications > VSs > VSsH264App