Assorted spelling fixes.
[wine] / dlls / d3d8 / shader.c
1 /*
2  * shaders implementation
3  *
4  * Copyright 2002-2004 Raphael Junqueira
5  * Copyright 2004 Jason Edmeades
6  * Copyright 2004 Christian Costa
7  *
8  * This library is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * This library is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with this library; if not, write to the Free Software
20  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
21  */
22
23 #include "config.h"
24
25 #include <math.h>
26 #include <stdarg.h>
27 #include <stdio.h>
28
29 #include "windef.h"
30 #include "winbase.h"
31 #include "winuser.h"
32 #include "wingdi.h"
33 #include "wine/debug.h"
34
35 #include "d3d8_private.h"
36
37 WINE_DEFAULT_DEBUG_CHANNEL(d3d_shader);
38 WINE_DECLARE_DEBUG_CHANNEL(d3d_hw_shader);
39
40 /* Shader debugging - Change the following line to enable debugging of software
41       vertex shaders                                                             */
42 #if 0 /* Must not be 1 in cvs version */
43 # define VSTRACE(A) TRACE A
44 # define TRACE_VSVECTOR(name) TRACE( #name "=(%f, %f, %f, %f)\n", name.x, name.y, name.z, name.w)
45 #else 
46 # define VSTRACE(A) 
47 # define TRACE_VSVECTOR(name)
48 #endif
49
50 /**
51  * DirectX9 SDK download
52  *  http://msdn.microsoft.com/library/default.asp?url=/downloads/list/directx.asp
53  *
54  * Exploring D3DX
55  *  http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dndrive/html/directx07162002.asp
56  *
57  * Using Vertex Shaders
58  *  http://msdn.microsoft.com/library/default.asp?url=/library/en-us/dndrive/html/directx02192001.asp
59  *
60  * Dx9 New
61  *  http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/whatsnew.asp
62  *
63  * Dx9 Shaders
64  *  http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/reference/Shaders/VertexShader2_0/VertexShader2_0.asp
65  *  http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/reference/Shaders/VertexShader2_0/Instructions/Instructions.asp
66  *  http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/programmingguide/GettingStarted/VertexDeclaration/VertexDeclaration.asp
67  *  http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/reference/Shaders/VertexShader3_0/VertexShader3_0.asp
68  *
69  * Dx9 D3DX
70  *  http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/programmingguide/advancedtopics/VertexPipe/matrixstack/matrixstack.asp
71  *
72  * FVF
73  *  http://msdn.microsoft.com/library/en-us/directx9_c/directx/graphics/programmingguide/GettingStarted/VertexFormats/vformats.asp
74  *
75  * NVIDIA: DX8 Vertex Shader to NV Vertex Program
76  *  http://developer.nvidia.com/view.asp?IO=vstovp
77  *
78  * NVIDIA: Memory Management with VAR
79  *  http://developer.nvidia.com/view.asp?IO=var_memory_management 
80  */
81
82 typedef void (*shader_fct_t)();
83
84 typedef struct SHADER_OPCODE {
85   CONST BYTE    opcode;
86   const char*   name;
87   CONST UINT    num_params;
88   shader_fct_t  soft_fct;
89   DWORD         min_version;
90   DWORD         max_version;
91 } SHADER_OPCODE;
92
93 /*******************************
94  * vshader functions software VM
95  */
96
97 void vshader_add(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
98   d->x = s0->x + s1->x;
99   d->y = s0->y + s1->y;
100   d->z = s0->z + s1->z;
101   d->w = s0->w + s1->w;
102   VSTRACE(("executing add: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
103                  s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
104 }
105
106 void vshader_dp3(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
107   d->x = d->y = d->z = d->w = s0->x * s1->x + s0->y * s1->y + s0->z * s1->z;
108   VSTRACE(("executing dp3: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
109                  s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
110 }
111
112 void vshader_dp4(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
113   d->x = d->y = d->z = d->w = s0->x * s1->x + s0->y * s1->y + s0->z * s1->z + s0->w * s1->w;
114   VSTRACE(("executing dp4: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
115           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
116 }
117
118 void vshader_dst(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
119   d->x = 1.0f;
120   d->y = s0->y * s1->y;
121   d->z = s0->z;
122   d->w = s1->w;
123   VSTRACE(("executing dst: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
124           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
125 }
126
127 void vshader_expp(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
128   union {
129     float f;
130     DWORD d;
131   } tmp;
132
133   tmp.f = floorf(s0->w);
134   d->x  = powf(2.0f, tmp.f);
135   d->y  = s0->w - tmp.f;
136
137   tmp.f = powf(2.0f, s0->w);
138   tmp.d &= 0xFFFFFF00U;
139   d->z  = tmp.f;
140   d->w  = 1.0f;
141   VSTRACE(("executing exp: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
142                 s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
143 }
144
145 void vshader_lit(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
146   d->x = 1.0f;
147   d->y = (0.0f < s0->x) ? s0->x : 0.0f;
148   d->z = (0.0f < s0->x && 0.0f < s0->y) ? powf(s0->y, s0->w) : 0.0f;
149   d->w = 1.0f;
150   VSTRACE(("executing lit: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
151                  s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
152 }
153
154 void vshader_logp(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
155   float tmp_f = fabsf(s0->w); 
156   d->x = d->y = d->z = d->w = (0.0f != tmp_f) ? logf(tmp_f) / logf(2.0f) : -HUGE_VAL;
157   VSTRACE(("executing logp: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
158                  s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
159 }
160
161 void vshader_mad(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1, D3DSHADERVECTOR* s2) {
162   d->x = s0->x * s1->x + s2->x;
163   d->y = s0->y * s1->y + s2->y;
164   d->z = s0->z * s1->z + s2->z;
165   d->w = s0->w * s1->w + s2->w;
166   VSTRACE(("executing mad: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) s2=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
167           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, s2->x, s2->y, s2->z, s2->w, d->x, d->y, d->z, d->w));
168 }
169
170 void vshader_max(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
171   d->x = (s0->x >= s1->x) ? s0->x : s1->x;
172   d->y = (s0->y >= s1->y) ? s0->y : s1->y;
173   d->z = (s0->z >= s1->z) ? s0->z : s1->z;
174   d->w = (s0->w >= s1->w) ? s0->w : s1->w;
175   VSTRACE(("executing max: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
176           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
177 }
178
179 void vshader_min(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
180   d->x = (s0->x < s1->x) ? s0->x : s1->x;
181   d->y = (s0->y < s1->y) ? s0->y : s1->y;
182   d->z = (s0->z < s1->z) ? s0->z : s1->z;
183   d->w = (s0->w < s1->w) ? s0->w : s1->w;
184   VSTRACE(("executing min: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
185           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
186 }
187
188 void vshader_mov(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
189   d->x = s0->x;
190   d->y = s0->y;
191   d->z = s0->z;
192   d->w = s0->w;
193   VSTRACE(("executing mov: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
194           s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
195 }
196
197 void vshader_mul(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
198   d->x = s0->x * s1->x;
199   d->y = s0->y * s1->y;
200   d->z = s0->z * s1->z;
201   d->w = s0->w * s1->w;
202   VSTRACE(("executing mul: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
203           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
204 }
205
206 void vshader_nop(void) {
207   /* NOPPPP ahhh too easy ;) */
208 }
209
210 void vshader_rcp(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
211   d->x = d->y = d->z = d->w = (0.0f == s0->w) ? HUGE_VAL : 1.0f / s0->w;
212   VSTRACE(("executing rcp: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
213           s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
214 }
215
216 void vshader_rsq(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
217   float tmp_f = fabsf(s0->w);
218   d->x = d->y = d->z = d->w = (0.0f == tmp_f) ? HUGE_VAL : ((1.0f != tmp_f) ? 1.0f / sqrtf(tmp_f) : 1.0f);
219   VSTRACE(("executing rsq: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
220           s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
221 }
222
223 void vshader_sge(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
224   d->x = (s0->x >= s1->x) ? 1.0f : 0.0f;
225   d->y = (s0->y >= s1->y) ? 1.0f : 0.0f;
226   d->z = (s0->z >= s1->z) ? 1.0f : 0.0f;
227   d->w = (s0->w >= s1->w) ? 1.0f : 0.0f;
228   VSTRACE(("executing sge: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
229           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
230 }
231
232 void vshader_slt(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
233   d->x = (s0->x < s1->x) ? 1.0f : 0.0f;
234   d->y = (s0->y < s1->y) ? 1.0f : 0.0f;
235   d->z = (s0->z < s1->z) ? 1.0f : 0.0f;
236   d->w = (s0->w < s1->w) ? 1.0f : 0.0f;
237   VSTRACE(("executing slt: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
238           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
239 }
240
241 void vshader_sub(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
242   d->x = s0->x - s1->x;
243   d->y = s0->y - s1->y;
244   d->z = s0->z - s1->z;
245   d->w = s0->w - s1->w;
246   VSTRACE(("executing sub: s0=(%f, %f, %f, %f) s1=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
247           s0->x, s0->y, s0->z, s0->w, s1->x, s1->y, s1->z, s1->w, d->x, d->y, d->z, d->w));
248 }
249
250 /**
251  * Version 1.1 specific
252  */
253
254 void vshader_exp(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
255   d->x = d->y = d->z = d->w = powf(2.0f, s0->w);
256   VSTRACE(("executing exp: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
257           s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
258 }
259
260 void vshader_log(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
261   float tmp_f = fabsf(s0->w); 
262   d->x = d->y = d->z = d->w = (0.0f != tmp_f) ? logf(tmp_f) / logf(2.0f) : -HUGE_VAL;
263   VSTRACE(("executing log: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
264           s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
265 }
266
267 void vshader_frc(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
268   d->x = s0->x - floorf(s0->x);
269   d->y = s0->y - floorf(s0->y);
270   d->z = 0.0f;
271   d->w = 1.0f;
272   VSTRACE(("executing frc: s0=(%f, %f, %f, %f) => d=(%f, %f, %f, %f)\n",
273           s0->x, s0->y, s0->z, s0->w, d->x, d->y, d->z, d->w));
274 }
275
276 typedef FLOAT D3DMATRIX44[4][4];
277 typedef FLOAT D3DMATRIX43[4][3];
278 typedef FLOAT D3DMATRIX34[4][4];
279 typedef FLOAT D3DMATRIX33[4][3];
280 typedef FLOAT D3DMATRIX32[4][2];
281
282 void vshader_m4x4(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, /*D3DSHADERVECTOR* mat1*/ D3DMATRIX44 mat) {
283   /*
284    * BuGGY CODE: here only if cast not work for copy/paste
285   D3DSHADERVECTOR* mat2 = mat1 + 1;
286   D3DSHADERVECTOR* mat3 = mat1 + 2;
287   D3DSHADERVECTOR* mat4 = mat1 + 3; 
288   d->x = mat1->x * s0->x + mat2->x * s0->y + mat3->x * s0->z + mat4->x * s0->w;
289   d->y = mat1->y * s0->x + mat2->y * s0->y + mat3->y * s0->z + mat4->y * s0->w;
290   d->z = mat1->z * s0->x + mat2->z * s0->y + mat3->z * s0->z + mat4->z * s0->w;
291   d->w = mat1->w * s0->x + mat2->w * s0->y + mat3->w * s0->z + mat4->w * s0->w;
292   */
293   d->x = mat[0][0] * s0->x + mat[0][1] * s0->y + mat[0][2] * s0->z + mat[0][3] * s0->w;
294   d->y = mat[1][0] * s0->x + mat[1][1] * s0->y + mat[1][2] * s0->z + mat[1][3] * s0->w;
295   d->z = mat[2][0] * s0->x + mat[2][1] * s0->y + mat[2][2] * s0->z + mat[2][3] * s0->w;
296   d->w = mat[3][0] * s0->x + mat[3][1] * s0->y + mat[3][2] * s0->z + mat[3][3] * s0->w;
297   VSTRACE(("executing m4x4(1): mat=(%f, %f, %f, %f)    s0=(%f)     d=(%f) \n", mat[0][0], mat[0][1], mat[0][2], mat[0][3], s0->x, d->x));
298   VSTRACE(("executing m4x4(2): mat=(%f, %f, %f, %f)       (%f)       (%f) \n", mat[1][0], mat[1][1], mat[1][2], mat[1][3], s0->y, d->y));
299   VSTRACE(("executing m4x4(3): mat=(%f, %f, %f, %f) X     (%f)  =    (%f) \n", mat[2][0], mat[2][1], mat[2][2], mat[2][3], s0->z, d->z));
300   VSTRACE(("executing m4x4(4): mat=(%f, %f, %f, %f)       (%f)       (%f) \n", mat[3][0], mat[3][1], mat[3][2], mat[3][3], s0->w, d->w));
301 }
302
303 void vshader_m4x3(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DMATRIX43 mat) {
304   d->x = mat[0][0] * s0->x + mat[0][1] * s0->y + mat[0][2] * s0->z + mat[0][3] * s0->w;
305   d->y = mat[1][0] * s0->x + mat[1][1] * s0->y + mat[1][2] * s0->z + mat[1][3] * s0->w;
306   d->z = mat[2][0] * s0->x + mat[2][1] * s0->y + mat[2][2] * s0->z + mat[2][3] * s0->w;
307   d->w = 1.0f;
308   VSTRACE(("executing m4x3(1): mat=(%f, %f, %f, %f)    s0=(%f)     d=(%f) \n", mat[0][0], mat[0][1], mat[0][2], mat[0][3], s0->x, d->x));
309   VSTRACE(("executing m4x3(2): mat=(%f, %f, %f, %f)       (%f)       (%f) \n", mat[1][0], mat[1][1], mat[1][2], mat[1][3], s0->y, d->y));
310   VSTRACE(("executing m4x3(3): mat=(%f, %f, %f, %f) X     (%f)  =    (%f) \n", mat[2][0], mat[2][1], mat[2][2], mat[2][3], s0->z, d->z));
311   VSTRACE(("executing m4x3(4):                            (%f)       (%f) \n", s0->w, d->w));
312 }
313
314 void vshader_m3x4(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DMATRIX34 mat) {
315   d->x = mat[0][0] * s0->x + mat[0][1] * s0->y + mat[0][2] * s0->z;
316   d->y = mat[1][0] * s0->x + mat[1][1] * s0->y + mat[1][2] * s0->z;
317   d->z = mat[2][0] * s0->x + mat[2][1] * s0->y + mat[2][2] * s0->z;
318   d->w = mat[3][0] * s0->x + mat[3][1] * s0->y + mat[3][2] * s0->z;
319   VSTRACE(("executing m3x4(1): mat=(%f, %f, %f)    s0=(%f)     d=(%f) \n", mat[0][0], mat[0][1], mat[0][2], s0->x, d->x));
320   VSTRACE(("executing m3x4(2): mat=(%f, %f, %f)       (%f)       (%f) \n", mat[1][0], mat[1][1], mat[1][2], s0->y, d->y));
321   VSTRACE(("executing m3x4(3): mat=(%f, %f, %f) X     (%f)  =    (%f) \n", mat[2][0], mat[2][1], mat[2][2], s0->z, d->z));
322   VSTRACE(("executing m3x4(4): mat=(%f, %f, %f)       (%f)       (%f) \n", mat[3][0], mat[3][1], mat[3][2], s0->w, d->w));
323 }
324
325 void vshader_m3x3(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DMATRIX33 mat) {
326   d->x = mat[0][0] * s0->x + mat[0][1] * s0->y + mat[0][2] * s0->z;
327   d->y = mat[1][0] * s0->x + mat[1][1] * s0->y + mat[1][2] * s0->z;
328   d->z = mat[2][0] * s0->x + mat[2][1] * s0->y + mat[2][2] * s0->z;
329   d->w = 1.0f;
330   VSTRACE(("executing m3x3(1): mat=(%f, %f, %f)    s0=(%f)     d=(%f) \n", mat[0][0], mat[0][1], mat[0][2], s0->x, d->x));
331   VSTRACE(("executing m3x3(2): mat=(%f, %f, %f)       (%f)       (%f) \n", mat[1][0], mat[1][1], mat[1][2], s0->y, d->y));
332   VSTRACE(("executing m3x3(3): mat=(%f, %f, %f) X     (%f)  =    (%f) \n", mat[2][0], mat[2][1], mat[2][2], s0->z, d->z));
333   VSTRACE(("executing m3x3(4):                                       (%f) \n", d->w));
334 }
335
336 void vshader_m3x2(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DMATRIX32 mat) {
337   FIXME("check\n");
338   d->x = mat[0][0] * s0->x + mat[0][1] * s0->y + mat[0][2] * s0->z;
339   d->y = mat[1][0] * s0->x + mat[1][1] * s0->y + mat[1][2] * s0->z;
340   d->z = 0.0f;
341   d->w = 1.0f;
342 }
343
344 /**
345  * Version 2.0 specific
346  */
347 void vshader_lrp(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1, D3DSHADERVECTOR* s2, D3DSHADERVECTOR* s3) {
348   d->x = s0->x * (s1->x - s2->x) + s2->x; 
349   d->y = s0->y * (s1->y - s2->y) + s2->y; 
350   d->z = s0->z * (s1->z - s2->z) + s2->z; 
351   d->w = s0->w * (s1->w - s2->w) + s2->x; 
352 }
353
354 /**
355  * log, exp, frc, m*x* seems to be macros ins ... to see
356  *   Note opcode must be in uppercase if direct mapping to GL hw shaders
357  */
358 static CONST SHADER_OPCODE vshader_ins [] = {
359   {D3DSIO_NOP,  "NOP",  0, vshader_nop, 0, 0},
360   {D3DSIO_MOV,  "MOV",  2, vshader_mov, 0, 0},
361   {D3DSIO_ADD,  "ADD",  3, vshader_add, 0, 0},
362   {D3DSIO_SUB,  "SUB",  3, vshader_sub, 0, 0},
363   {D3DSIO_MAD,  "MAD",  4, vshader_mad, 0, 0},
364   {D3DSIO_MUL,  "MUL",  3, vshader_mul, 0, 0},
365   {D3DSIO_RCP,  "RCP",  2, vshader_rcp, 0, 0},
366   {D3DSIO_RSQ,  "RSQ",  2, vshader_rsq, 0, 0},
367   {D3DSIO_DP3,  "DP3",  3, vshader_dp3, 0, 0},
368   {D3DSIO_DP4,  "DP4",  3, vshader_dp4, 0, 0},
369   {D3DSIO_MIN,  "MIN",  3, vshader_min, 0, 0},
370   {D3DSIO_MAX,  "MAX",  3, vshader_max, 0, 0},
371   {D3DSIO_SLT,  "SLT",  3, vshader_slt, 0, 0},
372   {D3DSIO_SGE,  "SGE",  3, vshader_sge, 0, 0},
373   {D3DSIO_EXP,  "EXP",  2, vshader_exp, 0, 0},
374   {D3DSIO_LOG,  "LOG",  2, vshader_log, 0, 0},
375   {D3DSIO_LIT,  "LIT",  2, vshader_lit, 0, 0},
376   {D3DSIO_DST,  "DST",  3, vshader_dst, 0, 0},
377   {D3DSIO_LRP,  "LRP",  5, vshader_lrp, 0, 0},
378   {D3DSIO_FRC,  "FRC",  2, vshader_frc, 0, 0},
379   {D3DSIO_M4x4, "M4X4", 3, vshader_m4x4, 0, 0},
380   {D3DSIO_M4x3, "M4X3", 3, vshader_m4x3, 0, 0},
381   {D3DSIO_M3x4, "M3X4", 3, vshader_m3x4, 0, 0},
382   {D3DSIO_M3x3, "M3X3", 3, vshader_m3x3, 0, 0},
383   {D3DSIO_M3x2, "M3X2", 3, vshader_m3x2, 0, 0},
384   /** FIXME: use direct access so add the others opcodes as stubs */
385   {D3DSIO_EXPP, "EXPP", 2, vshader_expp, 0, 0},
386   {D3DSIO_LOGP, "LOGP", 2, vshader_logp, 0, 0},
387
388   {0, NULL, 0, NULL, 0, 0}
389 };
390
391
392 inline static const SHADER_OPCODE* vshader_program_get_opcode(const DWORD code) {
393   DWORD i = 0;
394   /** TODO: use dichotomic search */
395   while (NULL != vshader_ins[i].name) {
396     if ((code & D3DSI_OPCODE_MASK) == vshader_ins[i].opcode) {
397       return &vshader_ins[i];
398     }
399     ++i;
400   }
401   return NULL;
402 }
403
404 inline static BOOL vshader_is_version_token(DWORD token) {
405   return 0xFFFE0000 == (token & 0xFFFE0000);
406 }
407
408 inline static BOOL vshader_is_comment_token(DWORD token) {
409   return D3DSIO_COMMENT == (token & D3DSI_OPCODE_MASK);
410 }
411
412 inline static void vshader_program_dump_param(const DWORD param, int input) {
413   static const char* rastout_reg_names[] = { "oPos", "oFog", "oPts" };
414   static const char swizzle_reg_chars[] = "xyzw";
415
416   DWORD reg = param & 0x00001FFF;
417   DWORD regtype = ((param & D3DSP_REGTYPE_MASK) >> D3DSP_REGTYPE_SHIFT);
418
419   if ((param & D3DSP_SRCMOD_MASK) == D3DSPSM_NEG) TRACE("-");
420   
421   switch (regtype << D3DSP_REGTYPE_SHIFT) {
422   case D3DSPR_TEMP:
423     TRACE("R[%lu]", reg);
424     break;
425   case D3DSPR_INPUT:
426     TRACE("V[%lu]", reg);
427     break;
428   case D3DSPR_CONST:
429     TRACE("C[%s%lu]", (param & D3DVS_ADDRMODE_RELATIVE) ? "a0.x + " : "", reg);
430     break;
431   case D3DSPR_ADDR: /*case D3DSPR_TEXTURE:*/
432     TRACE("a[%lu]", reg);
433     break;
434   case D3DSPR_RASTOUT:
435     TRACE("%s", rastout_reg_names[reg]);
436     break;
437   case D3DSPR_ATTROUT:
438     TRACE("oD[%lu]", reg);
439     break;
440   case D3DSPR_TEXCRDOUT:
441     TRACE("oT[%lu]", reg);
442     break;
443   default:
444     break;
445   }
446
447   if (!input) {
448     /** operand output */
449     if ((param & D3DSP_WRITEMASK_ALL) != D3DSP_WRITEMASK_ALL) {
450       if (param & D3DSP_WRITEMASK_0) TRACE(".x");
451       if (param & D3DSP_WRITEMASK_1) TRACE(".y");
452       if (param & D3DSP_WRITEMASK_2) TRACE(".z");
453       if (param & D3DSP_WRITEMASK_3) TRACE(".w");
454     }
455   } else {
456     /** operand input */
457     DWORD swizzle = (param & D3DVS_SWIZZLE_MASK) >> D3DVS_SWIZZLE_SHIFT;
458     DWORD swizzle_x = swizzle & 0x03;
459     DWORD swizzle_y = (swizzle >> 2) & 0x03;
460     DWORD swizzle_z = (swizzle >> 4) & 0x03;
461     DWORD swizzle_w = (swizzle >> 6) & 0x03;
462     /**
463      * swizzle bits fields:
464      *  WWZZYYXX
465      */
466     if ((D3DVS_NOSWIZZLE >> D3DVS_SWIZZLE_SHIFT) != swizzle) { /* ! D3DVS_NOSWIZZLE == 0xE4 << D3DVS_SWIZZLE_SHIFT */
467       if (swizzle_x == swizzle_y && 
468           swizzle_x == swizzle_z && 
469           swizzle_x == swizzle_w) {
470         TRACE(".%c", swizzle_reg_chars[swizzle_x]);
471       } else {
472         TRACE(".%c%c%c%c", 
473                 swizzle_reg_chars[swizzle_x], 
474                 swizzle_reg_chars[swizzle_y], 
475                 swizzle_reg_chars[swizzle_z], 
476                 swizzle_reg_chars[swizzle_w]);
477       }
478     }
479   }
480 }
481
482 inline static void vshader_program_add_param(const DWORD param, int input, char *hwLine) {
483   /*static const char* rastout_reg_names[] = { "oPos", "oFog", "oPts" }; */
484   static const char* hwrastout_reg_names[] = { "result.position", "result.fogcoord", "result.pointsize" };
485   static const char swizzle_reg_chars[] = "xyzw";
486
487   DWORD reg = param & 0x00001FFF;
488   DWORD regtype = ((param & D3DSP_REGTYPE_MASK) >> D3DSP_REGTYPE_SHIFT);
489   char  tmpReg[255];
490
491   if ((param & D3DSP_SRCMOD_MASK) == D3DSPSM_NEG) {
492       strcat(hwLine, " -");
493   } else {
494       strcat(hwLine, " ");
495   }
496   
497   switch (regtype << D3DSP_REGTYPE_SHIFT) {
498   case D3DSPR_TEMP:
499     sprintf(tmpReg, "T%lu", reg);
500     strcat(hwLine, tmpReg);
501     break;
502   case D3DSPR_INPUT:
503     sprintf(tmpReg, "vertex.attrib[%lu]", reg);
504     strcat(hwLine, tmpReg);
505     break;
506   case D3DSPR_CONST:
507     sprintf(tmpReg, "C[%s%lu]", (param & D3DVS_ADDRMODE_RELATIVE) ? "A0.x + " : "", reg);
508     strcat(hwLine, tmpReg);
509     break;
510   case D3DSPR_ADDR: /*case D3DSPR_TEXTURE:*/
511     sprintf(tmpReg, "A%lu", reg);
512     strcat(hwLine, tmpReg);
513     break;
514   case D3DSPR_RASTOUT:
515     sprintf(tmpReg, "%s", hwrastout_reg_names[reg]);
516     strcat(hwLine, tmpReg);
517     break;
518   case D3DSPR_ATTROUT:
519     if (reg==0) {
520        strcat(hwLine, "result.color.primary");
521     } else {
522        strcat(hwLine, "result.color.secondary");
523     }
524     break;
525   case D3DSPR_TEXCRDOUT:
526     sprintf(tmpReg, "result.texcoord[%lu]", reg);
527     strcat(hwLine, tmpReg);
528     break;
529   default:
530     break;
531   }
532
533   if (!input) {
534     /** operand output */
535     if ((param & D3DSP_WRITEMASK_ALL) != D3DSP_WRITEMASK_ALL) {
536       strcat(hwLine, ".");
537       if (param & D3DSP_WRITEMASK_0) {
538           strcat(hwLine, "x");
539       }
540       if (param & D3DSP_WRITEMASK_1) {
541           strcat(hwLine, "y");
542       }
543       if (param & D3DSP_WRITEMASK_2) {
544           strcat(hwLine, "z");
545       }
546       if (param & D3DSP_WRITEMASK_3) {
547           strcat(hwLine, "w");
548       }
549     }
550   } else {
551     /** operand input */
552     DWORD swizzle = (param & D3DVS_SWIZZLE_MASK) >> D3DVS_SWIZZLE_SHIFT;
553     DWORD swizzle_x = swizzle & 0x03;
554     DWORD swizzle_y = (swizzle >> 2) & 0x03;
555     DWORD swizzle_z = (swizzle >> 4) & 0x03;
556     DWORD swizzle_w = (swizzle >> 6) & 0x03;
557     /**
558      * swizzle bits fields:
559      *  WWZZYYXX
560      */
561     if ((D3DVS_NOSWIZZLE >> D3DVS_SWIZZLE_SHIFT) != swizzle) { /* ! D3DVS_NOSWIZZLE == 0xE4 << D3DVS_SWIZZLE_SHIFT */
562       if (swizzle_x == swizzle_y && 
563           swizzle_x == swizzle_z && 
564           swizzle_x == swizzle_w) {
565         sprintf(tmpReg, ".%c", swizzle_reg_chars[swizzle_x]);
566         strcat(hwLine, tmpReg);
567       } else {
568         sprintf(tmpReg, ".%c%c%c%c", 
569                 swizzle_reg_chars[swizzle_x], 
570                 swizzle_reg_chars[swizzle_y], 
571                 swizzle_reg_chars[swizzle_z], 
572                 swizzle_reg_chars[swizzle_w]);
573         strcat(hwLine, tmpReg);
574       }
575     }
576   }
577 }
578
579 DWORD MacroExpansion[4*4];
580
581 int ExpandMxMacro(DWORD macro_opcode, const DWORD* args) {
582   int i;
583   int nComponents = 0;
584   DWORD opcode =0;
585   switch(macro_opcode) {
586     case D3DSIO_M4x4:
587       nComponents = 4;
588       opcode = D3DSIO_DP4;
589       break;
590     case D3DSIO_M4x3:
591       nComponents = 3;
592       opcode = D3DSIO_DP4;
593       break;
594     case D3DSIO_M3x4:
595       nComponents = 4;
596       opcode = D3DSIO_DP3;
597       break;
598     case D3DSIO_M3x3:
599       nComponents = 3;
600       opcode = D3DSIO_DP3;
601       break;
602     case D3DSIO_M3x2:
603       nComponents = 2;
604       opcode = D3DSIO_DP3;
605       break;
606     default:
607       break;
608   }
609   for (i = 0; i < nComponents; i++) {
610     MacroExpansion[i*4+0] = opcode;
611     MacroExpansion[i*4+1] = ((*args) & ~D3DSP_WRITEMASK_ALL)|(D3DSP_WRITEMASK_0<<i);
612     MacroExpansion[i*4+2] = *(args+1);
613     MacroExpansion[i*4+3] = (*(args+2))+i;
614   }
615   return nComponents;
616 }       
617
618 /**
619  * Function parser ...
620  */
621 inline static VOID IDirect3DVertexShaderImpl_GenerateProgramArbHW(IDirect3DVertexShaderImpl* vshader, CONST DWORD* pFunction) {
622   const DWORD* pToken = pFunction;
623   const DWORD* pSavedToken = NULL;
624   const SHADER_OPCODE* curOpcode = NULL;
625   int nRemInstr = -1;
626   DWORD i;
627   unsigned lineNum = 0;
628   char *pgmStr = NULL;
629   char  tmpLine[255];
630   DWORD nUseAddressRegister = 0;
631   DWORD nUseTempRegister = 0;
632   DWORD regtype;
633   DWORD reg;
634   IDirect3DDevice8Impl* This = vshader->device;
635
636   pgmStr = HeapAlloc(GetProcessHeap(), HEAP_ZERO_MEMORY, 65535); /* 64kb should be enough */
637
638   /**
639    * First pass to determine what we need to declare:
640    *  - Temporary variables
641    *  - Address variables
642    */ 
643   if (NULL != pToken) {
644     while (D3DVS_END() != *pToken) {
645       if (vshader_is_version_token(*pToken)) {
646         /** skip version */
647         ++pToken;
648         continue;
649       } 
650       if (vshader_is_comment_token(*pToken)) { /** comment */
651         DWORD comment_len = (*pToken & D3DSI_COMMENTSIZE_MASK) >> D3DSI_COMMENTSIZE_SHIFT;
652         ++pToken;
653         pToken += comment_len;
654         continue;
655       }
656       curOpcode = vshader_program_get_opcode(*pToken);
657       ++pToken;
658       if (NULL == curOpcode) {
659         while (*pToken & 0x80000000) {
660           /* skip unrecognized opcode */
661           ++pToken;
662         }
663       } else {
664         if (curOpcode->num_params > 0) {
665           regtype = ((((*pToken) & D3DSP_REGTYPE_MASK) >> D3DSP_REGTYPE_SHIFT) << D3DSP_REGTYPE_SHIFT);
666           reg = ((*pToken)  & 0x00001FFF);
667           /** we should validate GL_MAX_PROGRAM_ADDRESS_REGISTERS_AR limits here */
668           if (D3DSPR_ADDR == regtype && nUseAddressRegister <= reg) nUseAddressRegister = reg + 1;
669           /** we should validate GL_MAX_PROGRAM_LOCAL_PARAMETERS_ARB limits here */
670           if (D3DSPR_TEMP == regtype && nUseTempRegister <= reg) nUseTempRegister = reg + 1;
671           ++pToken;
672           for (i = 1; i < curOpcode->num_params; ++i) {
673             regtype = ((((*pToken) & D3DSP_REGTYPE_MASK) >> D3DSP_REGTYPE_SHIFT) << D3DSP_REGTYPE_SHIFT);
674             reg = ((*pToken)  & 0x00001FFF);
675             /** we should validate GL_MAX_PROGRAM_LOCAL_PARAMETERS_ARB limits here */
676             if (D3DSPR_TEMP == regtype && nUseTempRegister <= reg) nUseTempRegister = reg + 1;
677             ++pToken;
678           }
679         }
680       }
681     }
682   }
683
684   /** second pass, now generate */
685   pToken = pFunction;
686
687   if (NULL != pToken) {
688     while (D3DVS_END() != *pToken) {
689       tmpLine[0] = 0;
690
691       if ((nRemInstr >= 0) && (--nRemInstr == -1))
692         /* Macro is finished, continue normal path */ 
693         pToken = pSavedToken;
694
695       if (vshader_is_version_token(*pToken)) { /** version */
696
697         /* Extract version *10 into integer value (ie. 1.0 == 10, 1.1==11 etc */
698         int version = (((*pToken >> 8) & 0x0F) * 10) + (*pToken & 0x0F);
699         int numTemps;
700         int numConstants;
701
702         TRACE_(d3d_hw_shader)("vs.%lu.%lu;\n", (*pToken >> 8) & 0x0F, (*pToken & 0x0F));
703
704         /* Each release of vertex shaders has had different numbers of temp registers */
705         switch (version) {
706         case 10:
707         case 11: numTemps=12; 
708                  numConstants=96;
709                  strcpy(tmpLine, "!!ARBvp1.0\n");
710                  TRACE_(d3d_hw_shader)("GL HW (%u) : %s", strlen(pgmStr), tmpLine); /* Don't add \n to this line as already in tmpLine */
711                  break;
712         case 20: numTemps=12;
713                  numConstants=256;
714                  strcpy(tmpLine, "!!ARBvp2.0\n");
715                  FIXME_(d3d_hw_shader)("No work done yet to support vs2.0 in hw\n");
716                  TRACE_(d3d_hw_shader)("GL HW (%u) : %s", strlen(pgmStr), tmpLine); /* Don't add \n to this line as already in tmpLine */
717                  break;
718         case 30: numTemps=32; 
719                  numConstants=256;
720                  strcpy(tmpLine, "!!ARBvp3.0\n");
721                  FIXME_(d3d_hw_shader)("No work done yet to support vs3.0 in hw\n");
722                  TRACE_(d3d_hw_shader)("GL HW (%u) : %s", strlen(pgmStr), tmpLine); /* Don't add \n to this line as already in tmpLine */
723                  break;
724         default:
725                  numTemps=12;
726                  numConstants=96;
727                  strcpy(tmpLine, "!!ARBvp1.0\n");
728                  FIXME_(d3d_hw_shader)("Unrecognized vertex shader version!\n");
729         }
730         strcat(pgmStr,tmpLine);
731         ++lineNum;
732
733         for (i = 0; i < nUseTempRegister/*we should check numTemps here*/; i++) {
734             sprintf(tmpLine, "TEMP T%ld;\n", i);
735             ++lineNum;
736             TRACE_(d3d_hw_shader)("GL HW (%u, %u) : %s", lineNum, strlen(pgmStr), tmpLine); /* Don't add \n to this line as already in tmpLine */
737             strcat(pgmStr,tmpLine);
738         }
739         for (i = 0; i < nUseAddressRegister; i++) {
740             sprintf(tmpLine, "ADDRESS A%ld;\n", i);
741             ++lineNum;
742             TRACE_(d3d_hw_shader)("GL HW (%u, %u) : %s", lineNum, strlen(pgmStr), tmpLine); /* Don't add \n to this line as already in tmpLine */
743             strcat(pgmStr,tmpLine);
744         }
745         /* Due to the dynamic constants binding mechanism, we need to declare
746          * all the constants for relative addressing. */
747         /* Mesa supports only 95 constants for VS1.X although we should have at least 96.
748          * Let's declare max constants minus one for now. */
749         sprintf(tmpLine, "PARAM C[%d] = { program.env[0..%d] };\n", numConstants-1, numConstants-2);
750         TRACE("GL HW (%u) : %s", strlen(pgmStr), tmpLine); /* Don't add \n to this line as already in tmpLine */
751         strcat(pgmStr, tmpLine);
752
753         ++pToken;
754         continue;
755       } 
756       if (vshader_is_comment_token(*pToken)) { /** comment */
757         DWORD comment_len = (*pToken & D3DSI_COMMENTSIZE_MASK) >> D3DSI_COMMENTSIZE_SHIFT;
758         ++pToken;
759         /*TRACE("comment[%ld] ;%s\n", comment_len, (char*)pToken);*/
760         pToken += comment_len;
761         continue;
762       }
763       curOpcode = vshader_program_get_opcode(*pToken);
764       ++pToken;
765       if (NULL == curOpcode) {
766         /* unkown current opcode ... */
767         while (*pToken & 0x80000000) {
768           TRACE_(d3d_hw_shader)("unrecognized opcode: %08lx\n", *pToken);
769           ++pToken;
770         }
771       } else {
772         /* Build opcode for GL vertex_program */
773         switch (curOpcode->opcode) {
774         case D3DSIO_MOV:
775             /* Address registers must be loaded with the ARL instruction */
776             if (((*pToken) & D3DSP_REGTYPE_MASK) == D3DSPR_ADDR) {
777                 if (0 < nUseAddressRegister) {
778                     strcpy(tmpLine, "ARL");
779                     break;
780                 } else
781                    FIXME_(d3d_hw_shader)("Try to load an undeclared address register!\n");
782             }
783             /* fall through */
784         case D3DSIO_ADD: 
785         case D3DSIO_SUB: 
786         case D3DSIO_MAD: 
787         case D3DSIO_MUL: 
788         case D3DSIO_RCP: 
789         case D3DSIO_RSQ: 
790         case D3DSIO_DP3: 
791         case D3DSIO_DP4: 
792         case D3DSIO_MIN: 
793         case D3DSIO_MAX: 
794         case D3DSIO_SLT: 
795         case D3DSIO_SGE:
796         case D3DSIO_LIT: 
797         case D3DSIO_DST:
798         case D3DSIO_FRC:
799             strcpy(tmpLine, curOpcode->name); 
800             break;
801
802         case D3DSIO_EXPP:
803             strcpy(tmpLine, "EXP"); 
804             break;
805         case D3DSIO_LOGP:
806             strcpy(tmpLine, "LOG"); 
807             break;
808         case D3DSIO_EXP: 
809             strcpy(tmpLine, "EX2"); 
810             break;
811         case D3DSIO_LOG: 
812             strcpy(tmpLine, "LG2"); 
813             break;
814
815         case D3DSIO_M4x4:
816         case D3DSIO_M4x3:
817         case D3DSIO_M3x4:
818         case D3DSIO_M3x3:
819         case D3DSIO_M3x2:
820             /* Expand the macro and get number of generated instruction */
821             nRemInstr = ExpandMxMacro(curOpcode->opcode, pToken);
822             /* Save point to next instruction */
823             pSavedToken = pToken + 3;
824             /* Execute expanded macro */
825             pToken = MacroExpansion;
826             continue;
827
828         default:
829             FIXME_(d3d_hw_shader)("Can't handle opcode %s in hwShader\n", curOpcode->name);
830         }
831
832         if (curOpcode->num_params > 0) {
833           vshader_program_add_param(*pToken, 0, tmpLine);
834           
835           ++pToken;
836           for (i = 1; i < curOpcode->num_params; ++i) {
837             strcat(tmpLine, ",");
838             vshader_program_add_param(*pToken, 1, tmpLine);
839             ++pToken;
840           }
841         }
842         strcat(tmpLine,";\n");
843         ++lineNum;
844         TRACE_(d3d_hw_shader)("GL HW (%u, %u) : %s", lineNum, strlen(pgmStr), tmpLine); /* Don't add \n to this line as already in tmpLine */
845         strcat(pgmStr, tmpLine);
846       }
847     }
848     strcpy(tmpLine, "END\n"); 
849     ++lineNum;
850     TRACE_(d3d_hw_shader)("GL HW (%u, %u) : %s", lineNum, strlen(pgmStr), tmpLine); /* Don't add \n to this line as already in tmpLine */
851     strcat(pgmStr, tmpLine);
852   }
853   
854   /*  Create the hw shader */
855   GL_EXTCALL(glGenProgramsARB(1, &vshader->prgId));
856   TRACE_(d3d_hw_shader)("Creating a hw vertex shader, prg=%d\n", vshader->prgId);
857
858   GL_EXTCALL(glBindProgramARB(GL_VERTEX_PROGRAM_ARB, vshader->prgId));
859
860   /* Create the program and check for errors */
861   GL_EXTCALL(glProgramStringARB(GL_VERTEX_PROGRAM_ARB, GL_PROGRAM_FORMAT_ASCII_ARB, strlen(pgmStr), pgmStr));
862   if (glGetError() == GL_INVALID_OPERATION) {
863     GLint errPos;
864     glGetIntegerv(GL_PROGRAM_ERROR_POSITION_ARB, &errPos);
865     FIXME_(d3d_hw_shader)("HW VertexShader Error at position: %d\n%s\n", errPos, glGetString(GL_PROGRAM_ERROR_STRING_ARB));
866     vshader->prgId = -1;
867   }
868   
869   HeapFree(GetProcessHeap(), 0, pgmStr);
870 }
871
872 inline static VOID IDirect3DVertexShaderImpl_ParseProgram(IDirect3DVertexShaderImpl* vshader, CONST DWORD* pFunction, int useHW) {
873   const DWORD* pToken = pFunction;
874   const SHADER_OPCODE* curOpcode = NULL;
875   DWORD len = 0;  
876   DWORD i;
877
878   if (NULL != pToken) {
879     while (D3DVS_END() != *pToken) {
880       if (vshader_is_version_token(*pToken)) { /** version */
881         TRACE("vs.%lu.%lu\n", (*pToken >> 8) & 0x0F, (*pToken & 0x0F));
882         ++pToken;
883         ++len;
884         continue;
885       } 
886       if (vshader_is_comment_token(*pToken)) { /** comment */
887         DWORD comment_len = (*pToken & D3DSI_COMMENTSIZE_MASK) >> D3DSI_COMMENTSIZE_SHIFT;
888         ++pToken;
889         /*TRACE("comment[%ld] ;%s\n", comment_len, (char*)pToken);*/
890         pToken += comment_len;
891         len += comment_len + 1;
892         continue;
893       }
894       curOpcode = vshader_program_get_opcode(*pToken);
895       ++pToken;
896       ++len;
897       if (NULL == curOpcode) {
898         /* unkown current opcode ... */
899         while (*pToken & 0x80000000) {
900           TRACE("unrecognized opcode: %08lx\n", *pToken);
901           ++pToken;
902           ++len;
903         }
904       } else {
905         TRACE("%s ", curOpcode->name);
906         if (curOpcode->num_params > 0) {
907           vshader_program_dump_param(*pToken, 0);
908           ++pToken;
909           ++len;
910           for (i = 1; i < curOpcode->num_params; ++i) {
911             TRACE(", ");
912             vshader_program_dump_param(*pToken, 1);
913             ++pToken;
914             ++len;
915           }
916         }
917         TRACE("\n");
918       }
919     }
920     vshader->functionLength = (len + 1) * sizeof(DWORD);
921   } else {
922     vshader->functionLength = 1; /* no Function defined use fixed function vertex processing */
923   }
924
925   /* Generate HW shader in needed */
926   if (useHW && NULL != pFunction) {
927     IDirect3DVertexShaderImpl_GenerateProgramArbHW(vshader, pFunction);
928   }
929
930   /* copy the function ... because it will certainly be released by application */
931   if (NULL != pFunction) {
932     vshader->function = HeapAlloc(GetProcessHeap(), HEAP_ZERO_MEMORY, vshader->functionLength);
933     memcpy(vshader->function, pFunction, vshader->functionLength);
934   } else {
935     vshader->function = NULL;
936   }
937 }
938
939 HRESULT WINAPI IDirect3DDeviceImpl_CreateVertexShader(IDirect3DDevice8Impl* This, CONST DWORD* pFunction, DWORD Usage, IDirect3DVertexShaderImpl** ppVertexShader) {
940   IDirect3DVertexShaderImpl* object;
941   int useHW;
942   
943   object = HeapAlloc(GetProcessHeap(), HEAP_ZERO_MEMORY, sizeof(IDirect3DVertexShaderImpl));
944   if (NULL == object) {
945     *ppVertexShader = NULL;
946     return D3DERR_OUTOFVIDEOMEMORY;
947   }
948   /*object->lpVtbl = &Direct3DVextexShader9_Vtbl;*/
949   object->device = This; /* FIXME: AddRef(This) */
950   object->ref = 1;
951   
952   object->usage = Usage;
953   object->data = HeapAlloc(GetProcessHeap(), HEAP_ZERO_MEMORY, sizeof(VSHADERDATA8));
954
955   useHW = (((vs_mode == VS_HW) && GL_SUPPORT(ARB_VERTEX_PROGRAM)) &&
956             This->devType != D3DDEVTYPE_REF &&
957             object->usage != D3DUSAGE_SOFTWAREPROCESSING);
958   
959   IDirect3DVertexShaderImpl_ParseProgram(object, pFunction, useHW);
960
961   *ppVertexShader = object;
962   return D3D_OK;
963 }
964
965 BOOL IDirect3DVertexShaderImpl_ExecuteHAL(IDirect3DVertexShaderImpl* vshader, VSHADERINPUTDATA8* input, VSHADEROUTPUTDATA8* output) {
966   /** 
967    * TODO: use the NV_vertex_program (or 1_1) extension 
968    *  and specifics vendors (ARB_vertex_program??) variants for it 
969    */
970   return TRUE;
971 }
972
973 HRESULT WINAPI IDirect3DVertexShaderImpl_ExecuteSW(IDirect3DVertexShaderImpl* vshader, VSHADERINPUTDATA8* input, VSHADEROUTPUTDATA8* output) {
974   /** Vertex Shader Temporary Registers */
975   D3DSHADERVECTOR R[12];
976   /*D3DSHADERSCALAR A0;*/
977   D3DSHADERVECTOR A[1];
978   /** temporary Vector for modifier management */
979   D3DSHADERVECTOR d;
980   D3DSHADERVECTOR s[3];
981   /** parser datas */
982   const DWORD* pToken = vshader->function;
983   const SHADER_OPCODE* curOpcode = NULL;
984   /** functions parameters */
985   D3DSHADERVECTOR* p[4];
986   D3DSHADERVECTOR* p_send[4];
987   DWORD i;
988
989   /** init temporary register */
990   memset(R, 0, 12 * sizeof(D3DSHADERVECTOR));
991
992   /* vshader_program_parse(vshader); */
993 #if 0 /* Must not be 1 in cvs */
994   TRACE("Input:\n");
995   TRACE_VSVECTOR(vshader->data->C[0]);
996   TRACE_VSVECTOR(vshader->data->C[1]);
997   TRACE_VSVECTOR(vshader->data->C[2]);
998   TRACE_VSVECTOR(vshader->data->C[3]);
999   TRACE_VSVECTOR(vshader->data->C[4]);
1000   TRACE_VSVECTOR(vshader->data->C[5]);
1001   TRACE_VSVECTOR(vshader->data->C[6]);
1002   TRACE_VSVECTOR(vshader->data->C[7]);
1003   TRACE_VSVECTOR(vshader->data->C[8]);
1004   TRACE_VSVECTOR(vshader->data->C[64]);
1005   TRACE_VSVECTOR(input->V[D3DVSDE_POSITION]);
1006   TRACE_VSVECTOR(input->V[D3DVSDE_BLENDWEIGHT]);
1007   TRACE_VSVECTOR(input->V[D3DVSDE_BLENDINDICES]);
1008   TRACE_VSVECTOR(input->V[D3DVSDE_NORMAL]);
1009   TRACE_VSVECTOR(input->V[D3DVSDE_PSIZE]);
1010   TRACE_VSVECTOR(input->V[D3DVSDE_DIFFUSE]);
1011   TRACE_VSVECTOR(input->V[D3DVSDE_SPECULAR]);
1012   TRACE_VSVECTOR(input->V[D3DVSDE_TEXCOORD0]);
1013   TRACE_VSVECTOR(input->V[D3DVSDE_TEXCOORD1]);
1014 #endif
1015
1016   TRACE_VSVECTOR(vshader->data->C[64]);
1017
1018   /* the first dword is the version tag */
1019   /* TODO: parse it */
1020   
1021   if (vshader_is_version_token(*pToken)) { /** version */
1022     ++pToken;
1023   }
1024   while (D3DVS_END() != *pToken) {
1025     if (vshader_is_comment_token(*pToken)) { /** comment */
1026       DWORD comment_len = (*pToken & D3DSI_COMMENTSIZE_MASK) >> D3DSI_COMMENTSIZE_SHIFT;
1027       ++pToken;
1028       pToken += comment_len;
1029       continue ;
1030     }
1031     curOpcode = vshader_program_get_opcode(*pToken);
1032     ++pToken;
1033     if (NULL == curOpcode) {
1034       i = 0;
1035       /* unkown current opcode ... */
1036       while (*pToken & 0x80000000) {
1037         if (i == 0) {
1038           TRACE("unrecognized opcode: pos=%d token=%08lX\n", (pToken - 1) - vshader->function, *(pToken - 1));
1039         }
1040         TRACE("unrecognized opcode param: pos=%d token=%08lX what=", pToken - vshader->function, *pToken);
1041         vshader_program_add_param(*pToken, i, NULL); /* Add function just used for trace error scenario */
1042         TRACE("\n");
1043         ++i;
1044         ++pToken;
1045       }
1046       /*return FALSE;*/
1047     } else {     
1048       if (curOpcode->num_params > 0) {  
1049         /*TRACE(">> execting opcode: pos=%d opcode_name=%s token=%08lX\n", pToken - vshader->function, curOpcode->name, *pToken);*/
1050         for (i = 0; i < curOpcode->num_params; ++i) {
1051           DWORD reg = pToken[i] & 0x00001FFF;
1052           DWORD regtype = ((pToken[i] & D3DSP_REGTYPE_MASK) >> D3DSP_REGTYPE_SHIFT);
1053
1054           switch (regtype << D3DSP_REGTYPE_SHIFT) {
1055           case D3DSPR_TEMP:
1056             /*TRACE("p[%d]=R[%d]\n", i, reg);*/
1057             p[i] = &R[reg];
1058             break;
1059           case D3DSPR_INPUT:
1060             /*TRACE("p[%d]=V[%s]\n", i, VertexShaderDeclRegister[reg]);*/
1061             p[i] = &input->V[reg];
1062             break;
1063           case D3DSPR_CONST:
1064             if (pToken[i] & D3DVS_ADDRMODE_RELATIVE) {
1065               p[i] = &vshader->data->C[(DWORD) A[0].x + reg];
1066             } else {
1067               p[i] = &vshader->data->C[reg];
1068             }
1069             break;
1070           case D3DSPR_ADDR: /*case D3DSPR_TEXTURE:*/
1071             if (0 != reg) {
1072               ERR("cannot handle address registers != a0, forcing use of a0\n");
1073               reg = 0;
1074             }
1075             /*TRACE("p[%d]=A[%d]\n", i, reg);*/
1076             p[i] = &A[reg];
1077             break;
1078           case D3DSPR_RASTOUT:
1079             switch (reg) {
1080             case D3DSRO_POSITION:
1081               p[i] = &output->oPos;
1082               break;
1083             case D3DSRO_FOG:
1084               p[i] = &output->oFog;
1085               break;
1086             case D3DSRO_POINT_SIZE:
1087               p[i] = &output->oPts;
1088               break;
1089             }
1090             break;
1091           case D3DSPR_ATTROUT:
1092             /*TRACE("p[%d]=oD[%d]\n", i, reg);*/
1093             p[i] = &output->oD[reg];
1094             break;
1095           case D3DSPR_TEXCRDOUT:
1096             /*TRACE("p[%d]=oT[%d]\n", i, reg);*/
1097             p[i] = &output->oT[reg];
1098             break;
1099           default:
1100             break;
1101           }
1102           
1103           if (i > 0) { /* input reg */
1104             DWORD swizzle = (pToken[i] & D3DVS_SWIZZLE_MASK) >> D3DVS_SWIZZLE_SHIFT;
1105             UINT isNegative = ((pToken[i] & D3DSP_SRCMOD_MASK) == D3DSPSM_NEG);
1106
1107             if (!isNegative && (D3DVS_NOSWIZZLE >> D3DVS_SWIZZLE_SHIFT) == swizzle) {
1108               /*TRACE("p[%d] not swizzled\n", i);*/
1109               p_send[i] = p[i];
1110             } else {
1111               DWORD swizzle_x = swizzle & 0x03;
1112               DWORD swizzle_y = (swizzle >> 2) & 0x03;
1113               DWORD swizzle_z = (swizzle >> 4) & 0x03;
1114               DWORD swizzle_w = (swizzle >> 6) & 0x03;
1115               /*TRACE("p[%d] swizzled\n", i);*/
1116               float* tt = (float*) p[i];
1117               s[i].x = (isNegative) ? -tt[swizzle_x] : tt[swizzle_x];
1118               s[i].y = (isNegative) ? -tt[swizzle_y] : tt[swizzle_y];
1119               s[i].z = (isNegative) ? -tt[swizzle_z] : tt[swizzle_z];
1120               s[i].w = (isNegative) ? -tt[swizzle_w] : tt[swizzle_w];
1121               p_send[i] = &s[i];
1122             }
1123           } else { /* output reg */
1124             if ((pToken[i] & D3DSP_WRITEMASK_ALL) == D3DSP_WRITEMASK_ALL) {
1125               p_send[i] = p[i];
1126             } else {
1127               p_send[i] = &d; /* to be post-processed for modifiers management */
1128             }
1129           }
1130         }      
1131       }
1132
1133       switch (curOpcode->num_params) {  
1134       case 0:
1135         curOpcode->soft_fct();
1136         break;
1137       case 1:
1138         curOpcode->soft_fct(p_send[0]);
1139         break;
1140       case 2:
1141         curOpcode->soft_fct(p_send[0], p_send[1]);
1142         break;
1143       case 3:
1144         curOpcode->soft_fct(p_send[0], p_send[1], p_send[2]);
1145         break;
1146       case 4:
1147         curOpcode->soft_fct(p_send[0], p_send[1], p_send[2], p_send[3]);
1148         break;
1149       case 5:
1150         curOpcode->soft_fct(p_send[0], p_send[1], p_send[2], p_send[3], p_send[4]);
1151         break;
1152       default:
1153         ERR("%s too many params: %u\n", curOpcode->name, curOpcode->num_params);
1154       }
1155
1156       /* check if output reg modifier post-process */
1157       if (curOpcode->num_params > 0 && (pToken[0] & D3DSP_WRITEMASK_ALL) != D3DSP_WRITEMASK_ALL) {
1158         if (pToken[0] & D3DSP_WRITEMASK_0) p[0]->x = d.x; 
1159         if (pToken[0] & D3DSP_WRITEMASK_1) p[0]->y = d.y; 
1160         if (pToken[0] & D3DSP_WRITEMASK_2) p[0]->z = d.z; 
1161         if (pToken[0] & D3DSP_WRITEMASK_3) p[0]->w = d.w; 
1162       }
1163       
1164 #if 0
1165       TRACE_VSVECTOR(output->oPos);
1166       TRACE_VSVECTOR(output->oD[0]);
1167       TRACE_VSVECTOR(output->oD[1]);
1168       TRACE_VSVECTOR(output->oT[0]);
1169       TRACE_VSVECTOR(output->oT[1]);
1170       TRACE_VSVECTOR(R[0]);
1171       TRACE_VSVECTOR(R[1]);
1172       TRACE_VSVECTOR(R[2]);
1173       TRACE_VSVECTOR(R[3]);
1174       TRACE_VSVECTOR(R[4]);
1175       TRACE_VSVECTOR(R[5]);
1176 #endif
1177
1178       /* to next opcode token */
1179       pToken += curOpcode->num_params;
1180     }
1181 #if 0
1182     TRACE("End of current instruction:\n");
1183     TRACE_VSVECTOR(output->oPos);
1184     TRACE_VSVECTOR(output->oD[0]);
1185     TRACE_VSVECTOR(output->oD[1]);
1186     TRACE_VSVECTOR(output->oT[0]);
1187     TRACE_VSVECTOR(output->oT[1]);
1188     TRACE_VSVECTOR(R[0]);
1189     TRACE_VSVECTOR(R[1]);
1190     TRACE_VSVECTOR(R[2]);
1191     TRACE_VSVECTOR(R[3]);
1192     TRACE_VSVECTOR(R[4]);
1193     TRACE_VSVECTOR(R[5]);
1194 #endif
1195   }
1196 #if 0 /* Must not be 1 in cvs */
1197     TRACE("Output:\n");
1198     TRACE_VSVECTOR(output->oPos);
1199     TRACE_VSVECTOR(output->oD[0]);
1200     TRACE_VSVECTOR(output->oD[1]);
1201     TRACE_VSVECTOR(output->oT[0]);
1202     TRACE_VSVECTOR(output->oT[1]);
1203 #endif
1204   return D3D_OK;
1205 }
1206
1207 HRESULT WINAPI IDirect3DVertexShaderImpl_GetFunction(IDirect3DVertexShaderImpl* This, VOID* pData, UINT* pSizeOfData) {
1208   if (NULL == pData) {
1209     *pSizeOfData = This->functionLength;
1210     return D3D_OK;
1211   }
1212   if (*pSizeOfData < This->functionLength) {
1213     *pSizeOfData = This->functionLength;
1214     return D3DERR_MOREDATA;
1215   }
1216   if (NULL == This->function) { /* no function defined */
1217     TRACE("(%p) : GetFunction no User Function defined using NULL to %p\n", This, pData);
1218     (*(DWORD **) pData) = NULL;
1219   } else {
1220     TRACE("(%p) : GetFunction copying to %p\n", This, pData);
1221     memcpy(pData, This->function, This->functionLength);
1222   }
1223   return D3D_OK;
1224 }
1225
1226 HRESULT WINAPI IDirect3DVertexShaderImpl_SetConstantF(IDirect3DVertexShaderImpl* This, UINT StartRegister, CONST FLOAT* pConstantData, UINT Vector4fCount) {
1227   if (StartRegister + Vector4fCount > D3D8_VSHADER_MAX_CONSTANTS) {
1228     return D3DERR_INVALIDCALL;
1229   }
1230   if (NULL == This->data) { /* temporary while datas not supported */
1231     FIXME("(%p) : VertexShader_SetConstant not fully supported yet\n", This);
1232     return D3DERR_INVALIDCALL;
1233   }
1234   memcpy(&This->data->C[StartRegister], pConstantData, Vector4fCount * 4 * sizeof(FLOAT));
1235   return D3D_OK;
1236 }
1237
1238 HRESULT WINAPI IDirect3DVertexShaderImpl_GetConstantF(IDirect3DVertexShaderImpl* This, UINT StartRegister, FLOAT* pConstantData, UINT Vector4fCount) {
1239   if (StartRegister + Vector4fCount > D3D8_VSHADER_MAX_CONSTANTS) {
1240     return D3DERR_INVALIDCALL;
1241   }
1242   if (NULL == This->data) { /* temporary while datas not supported */
1243     return D3DERR_INVALIDCALL;
1244   }
1245   memcpy(pConstantData, &This->data->C[StartRegister], Vector4fCount * 4 * sizeof(FLOAT));
1246   return D3D_OK;
1247 }
1248
1249
1250 /**********************************************************************************************************************************************
1251  **********************************************************************************************************************************************
1252  **********************************************************************************************************************************************
1253  **********************************************************************************************************************************************
1254  **********************************************************************************************************************************************/
1255
1256 void pshader_texcoord(D3DSHADERVECTOR* d) {
1257 }
1258
1259 void pshader_texkill(D3DSHADERVECTOR* d) {
1260 }
1261
1262 void pshader_tex(D3DSHADERVECTOR* d) {
1263 }
1264
1265 void pshader_texbem(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1266 }
1267
1268 void pshader_texbeml(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1269 }
1270
1271 void pshader_texreg2ar(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1272 }
1273
1274 void pshader_texreg2gb(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1275 }
1276
1277 void pshader_texm3x2pad(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1278 }
1279
1280 void pshader_texm3x2tex(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1281 }
1282
1283 void pshader_texm3x3pad(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1284 }
1285
1286 void pshader_texm3x3tex(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1287 }
1288
1289 void pshader_texm3x3diff(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1290 }
1291
1292 void pshader_texm3x3spec(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
1293 }
1294
1295 void pshader_texm3x3vspec(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1296 }
1297
1298 void pshader_cnd(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1, D3DSHADERVECTOR* s2) {
1299 }
1300
1301 void pshader_def(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1, D3DSHADERVECTOR* s2, D3DSHADERVECTOR* s3) {
1302 }
1303
1304 void pshader_texreg2rgb(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1305 }
1306
1307 void pshader_texdp3tex(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1308 }
1309
1310 void pshader_texm3x2depth(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1311 }
1312
1313 void pshader_texdp3(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1314 }
1315
1316 void pshader_texm3x3(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0) {
1317 }
1318
1319 void pshader_texdepth(D3DSHADERVECTOR* d) {
1320 }
1321
1322 void pshader_cmp(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1, D3DSHADERVECTOR* s2) {
1323 }
1324
1325 void pshader_bem(D3DSHADERVECTOR* d, D3DSHADERVECTOR* s0, D3DSHADERVECTOR* s1) {
1326 }
1327
1328 static CONST SHADER_OPCODE pshader_ins [] = {
1329   {D3DSIO_NOP,  "nop",  0, vshader_nop, 0, 0},
1330   {D3DSIO_MOV,  "mov",  2, vshader_mov, 0, 0},
1331   {D3DSIO_ADD,  "add",  3, vshader_add, 0, 0},
1332   {D3DSIO_SUB,  "sub",  3, vshader_sub, 0, 0},
1333   {D3DSIO_MAD,  "mad",  4, vshader_mad, 0, 0},
1334   {D3DSIO_MUL,  "mul",  3, vshader_mul, 0, 0},
1335   {D3DSIO_RCP,  "rcp",  2, vshader_rcp, 0, 0},
1336   {D3DSIO_RSQ,  "rsq",  2, vshader_rsq, 0, 0},
1337   {D3DSIO_DP3,  "dp3",  3, vshader_dp3, 0, 0},
1338   {D3DSIO_DP4,  "dp4",  3, vshader_dp4, 0, 0},
1339   {D3DSIO_MIN,  "min",  3, vshader_min, 0, 0},
1340   {D3DSIO_MAX,  "max",  3, vshader_max, 0, 0},
1341   {D3DSIO_SLT,  "slt",  3, vshader_slt, 0, 0},
1342   {D3DSIO_SGE,  "sge",  3, vshader_sge, 0, 0},
1343   {D3DSIO_EXP,  "exp",  2, vshader_exp, 0, 0},
1344   {D3DSIO_LOG,  "log",  2, vshader_log, 0, 0},
1345   {D3DSIO_LIT,  "lit",  2, vshader_lit, 0, 0},
1346   {D3DSIO_DST,  "dst",  3, vshader_dst, 0, 0},
1347   {D3DSIO_LRP,  "lrp",  5, vshader_lrp, 0, 0},
1348   {D3DSIO_FRC,  "frc",  2, vshader_frc, 0, 0},
1349   {D3DSIO_M4x4, "m4x4", 3, vshader_m4x4, 0, 0},
1350   {D3DSIO_M4x3, "m4x3", 3, vshader_m4x3, 0, 0},
1351   {D3DSIO_M3x4, "m3x4", 3, vshader_m3x4, 0, 0},
1352   {D3DSIO_M3x3, "m3x3", 3, vshader_m3x3, 0, 0},
1353   {D3DSIO_M3x2, "m3x2", 3, vshader_m3x2, 0, 0},
1354
1355   {D3DSIO_TEXCOORD,     "texcoord",     1, pshader_texcoord,     D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)},
1356   {D3DSIO_TEXKILL,      "texkill",      1, pshader_texkill,      D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)},
1357   {D3DSIO_TEX,          "tex",          1, pshader_tex,          D3DPS_VERSION(1,1), D3DPS_VERSION(1,4)}, 
1358   {D3DSIO_TEXBEM,       "texbem",       2, pshader_texbem,       D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1359   {D3DSIO_TEXBEML,      "texbeml",      2, pshader_texbeml,      D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1360   {D3DSIO_TEXREG2AR,    "texreg2ar",    2, pshader_texreg2ar,    D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1361   {D3DSIO_TEXREG2GB,    "texreg2gb",    2, pshader_texreg2gb,    D3DPS_VERSION(1,2), D3DPS_VERSION(1,3)}, 
1362   {D3DSIO_TEXM3x2PAD,   "texm3x2pad",   2, pshader_texm3x2pad,   D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1363   {D3DSIO_TEXM3x2TEX,   "texm3x2tex",   2, pshader_texm3x2tex,   D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1364   {D3DSIO_TEXM3x3PAD,   "texm3x3pad",   2, pshader_texm3x3pad,   D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1365   {D3DSIO_TEXM3x3TEX,   "texm3x3tex",   2, pshader_texm3x3tex,   D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1366   {D3DSIO_TEXM3x3DIFF,  "texm3x3diff",  2, pshader_texm3x3diff,  D3DPS_VERSION(0,0), D3DPS_VERSION(0,0)}, 
1367   {D3DSIO_TEXM3x3SPEC,  "texm3x3spec",  3, pshader_texm3x3spec,  D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1368   {D3DSIO_TEXM3x3VSPEC, "texm3x3vspec", 2, pshader_texm3x3vspec, D3DPS_VERSION(1,1), D3DPS_VERSION(1,3)}, 
1369
1370   {D3DSIO_EXPP,         "expp",         2, vshader_expp, 0, 0},
1371   {D3DSIO_LOGP,         "logp",         2, vshader_logp, 0, 0},
1372
1373   {D3DSIO_CND,          "cnd",          4, pshader_cnd,          D3DPS_VERSION(1,1), D3DPS_VERSION(1,4)},
1374   {D3DSIO_DEF,          "def",          5, pshader_def,          D3DPS_VERSION(1,1), D3DPS_VERSION(3,0)},
1375   {D3DSIO_TEXREG2RGB,   "texbreg2rgb",  2, pshader_texreg2rgb,   D3DPS_VERSION(1,2), D3DPS_VERSION(1,3)}, 
1376   
1377   {D3DSIO_TEXDP3TEX,    "texdp3tex",    2, pshader_texdp3tex,    D3DPS_VERSION(1,2), D3DPS_VERSION(1,3)}, 
1378   {D3DSIO_TEXM3x2DEPTH, "texm3x2depth", 2, pshader_texm3x2depth, D3DPS_VERSION(1,3), D3DPS_VERSION(1,3)}, 
1379   {D3DSIO_TEXDP3,       "texdp3",       2, pshader_texdp3,       D3DPS_VERSION(1,2), D3DPS_VERSION(1,3)}, 
1380   {D3DSIO_TEXM3x3,      "texm3x3",      2, pshader_texm3x3,      D3DPS_VERSION(1,2), D3DPS_VERSION(1,3)},
1381   {D3DSIO_TEXDEPTH,     "texdepth",     1, pshader_texdepth,     D3DPS_VERSION(1,4), D3DPS_VERSION(1,4)},
1382   {D3DSIO_CMP,          "cmp",          4, pshader_cmp,          D3DPS_VERSION(1,1), D3DPS_VERSION(3,0)}, 
1383   {D3DSIO_BEM,          "bem",          3, pshader_bem,          D3DPS_VERSION(1,4), D3DPS_VERSION(1,4)}, 
1384
1385   {0, NULL, 0, NULL}
1386 };
1387
1388 inline static const SHADER_OPCODE* pshader_program_get_opcode(const DWORD code) {
1389   DWORD i = 0;
1390   /** TODO: use dichotomic search */
1391   while (NULL != pshader_ins[i].name) {
1392     if ((code & D3DSI_OPCODE_MASK) == pshader_ins[i].opcode) {
1393       return &pshader_ins[i];
1394     }
1395     ++i;
1396   }
1397   return NULL;
1398 }
1399
1400 inline static void pshader_program_dump_opcode(const SHADER_OPCODE* curOpcode, const DWORD code, const DWORD output) {
1401   if (0 != (code & ~D3DSI_OPCODE_MASK)) {
1402     DWORD mask = (code & ~D3DSI_OPCODE_MASK);
1403     switch (mask) {
1404     case 0x40000000:    TRACE("+"); break;
1405     default:
1406       TRACE(" unhandled modifier(0x%08lx) ", mask);
1407     }
1408   }
1409   TRACE("%s", curOpcode->name);
1410   /**
1411    * normally this is a destination reg modifier 
1412    * but in pixel shaders asm code its specified as:
1413    *  dp3_x4 t1.rgba, r1, c1
1414    * or
1415    *  dp3_x2_sat r0, t0_bx2, v0_bx2
1416    * so for better debbuging i use the same norm
1417    */
1418   if (0 != (output & D3DSP_DSTSHIFT_MASK)) {
1419     DWORD shift = (output & D3DSP_DSTSHIFT_MASK) >> D3DSP_DSTSHIFT_SHIFT;
1420     if (shift > 0) {
1421       TRACE("_x%u", 1 << shift);
1422     }
1423   } 
1424   /**
1425    * TODO: fix the divide shifts: d2, d4, d8
1426    *  so i have to find a sample
1427    */
1428   if (0 != (output & D3DSP_DSTMOD_MASK)) {
1429     DWORD mask = output & D3DSP_DSTMOD_MASK;
1430     switch (mask) {
1431     case D3DSPDM_SATURATE: TRACE("_sat"); break;
1432     default:
1433       TRACE("_unhandled_modifier(0x%08lx)", mask);
1434     }
1435   }
1436   TRACE(" ");
1437 }
1438
1439 inline static void pshader_program_dump_param(const DWORD param, int input) {
1440   static const char* rastout_reg_names[] = { "oC0", "oC1", "oC2", "oC3", "oDepth" };
1441   static const char swizzle_reg_chars[] = "rgba";
1442
1443   DWORD reg = param & 0x00001FFF;
1444   DWORD regtype = ((param & D3DSP_REGTYPE_MASK) >> D3DSP_REGTYPE_SHIFT);
1445
1446   if ((param & D3DSP_SRCMOD_MASK) == D3DSPSM_NEG) {
1447     TRACE("-");
1448   }
1449   
1450   switch (regtype << D3DSP_REGTYPE_SHIFT) {
1451   case D3DSPR_TEMP:
1452     TRACE("R[%lu]", reg);
1453     break;
1454   case D3DSPR_INPUT:
1455     TRACE("V[%lu]", reg);
1456     break;
1457   case D3DSPR_CONST:
1458     TRACE("C[%s%lu]", (param & D3DVS_ADDRMODE_RELATIVE) ? "a0.x + " : "", reg);
1459     break;
1460   case D3DSPR_TEXTURE: /* case D3DSPR_ADDR: */
1461     TRACE("t[%lu]", reg);
1462     break;
1463   case D3DSPR_RASTOUT:
1464     TRACE("%s", rastout_reg_names[reg]);
1465     break;
1466   case D3DSPR_ATTROUT:
1467     TRACE("oD[%lu]", reg);
1468     break;
1469   case D3DSPR_TEXCRDOUT:
1470     TRACE("oT[%lu]", reg);
1471     break;
1472   default:
1473     break;
1474   }
1475
1476   if (!input) {
1477     /** operand output */
1478     /**
1479      * for better debugging traces it's done into opcode dump code
1480      * @see pshader_program_dump_opcode
1481     if (0 != (param & D3DSP_DSTMOD_MASK)) {
1482       DWORD mask = param & D3DSP_DSTMOD_MASK;
1483       switch (mask) {
1484       case D3DSPDM_SATURATE: TRACE("_sat"); break;
1485       default:
1486       TRACE("_unhandled_modifier(0x%08lx)", mask);
1487       }
1488     }
1489     if (0 != (param & D3DSP_DSTSHIFT_MASK)) {
1490       DWORD shift = (param & D3DSP_DSTSHIFT_MASK) >> D3DSP_DSTSHIFT_SHIFT;
1491       if (shift > 0) {
1492         TRACE("_x%u", 1 << shift);
1493       }
1494     }
1495     */
1496     if ((param & D3DSP_WRITEMASK_ALL) != D3DSP_WRITEMASK_ALL) {
1497       if (param & D3DSP_WRITEMASK_0) TRACE(".r");
1498       if (param & D3DSP_WRITEMASK_1) TRACE(".g");
1499       if (param & D3DSP_WRITEMASK_2) TRACE(".b");
1500       if (param & D3DSP_WRITEMASK_3) TRACE(".a");
1501     }
1502   } else {
1503     /** operand input */
1504     DWORD swizzle = (param & D3DSP_SWIZZLE_MASK) >> D3DSP_SWIZZLE_SHIFT;
1505     DWORD swizzle_x = swizzle & 0x03;
1506     DWORD swizzle_y = (swizzle >> 2) & 0x03;
1507     DWORD swizzle_z = (swizzle >> 4) & 0x03;
1508     DWORD swizzle_w = (swizzle >> 6) & 0x03;
1509     /**
1510      * swizzle bits fields:
1511      *  WWZZYYXX
1512      */
1513     if ((D3DSP_NOSWIZZLE >> D3DSP_SWIZZLE_SHIFT) != swizzle) { /* ! D3DVS_NOSWIZZLE == 0xE4 << D3DVS_SWIZZLE_SHIFT */
1514       if (swizzle_x == swizzle_y && 
1515           swizzle_x == swizzle_z && 
1516           swizzle_x == swizzle_w) {
1517         TRACE(".%c", swizzle_reg_chars[swizzle_x]);
1518       } else {
1519         TRACE(".%c%c%c%c", 
1520               swizzle_reg_chars[swizzle_x], 
1521               swizzle_reg_chars[swizzle_y], 
1522               swizzle_reg_chars[swizzle_z], 
1523               swizzle_reg_chars[swizzle_w]);
1524       }
1525     }
1526     if (0 != (param & D3DSP_SRCMOD_MASK)) {
1527       DWORD mask = param & D3DSP_SRCMOD_MASK;
1528       /*TRACE("_modifier(0x%08lx) ", mask);*/
1529       switch (mask) {
1530       case D3DSPSM_NONE:    break;
1531       case D3DSPSM_NEG:     break;
1532       case D3DSPSM_BIAS:    TRACE("_bias"); break;
1533       case D3DSPSM_BIASNEG: TRACE("_bias"); break;
1534       case D3DSPSM_SIGN:    TRACE("_sign"); break;
1535       case D3DSPSM_SIGNNEG: TRACE("_sign"); break;
1536       case D3DSPSM_COMP:    TRACE("_comp"); break;
1537       case D3DSPSM_X2:      TRACE("_x2"); break;
1538       case D3DSPSM_X2NEG:   TRACE("_bx2"); break;
1539       case D3DSPSM_DZ:      TRACE("_dz"); break;
1540       case D3DSPSM_DW:      TRACE("_dw"); break;
1541       default:
1542         TRACE("_unknown(0x%08lx)", mask);
1543       }
1544     }
1545   }
1546 }
1547
1548 inline static BOOL pshader_is_version_token(DWORD token) {
1549   return 0xFFFF0000 == (token & 0xFFFF0000);
1550 }
1551
1552 inline static BOOL pshader_is_comment_token(DWORD token) {
1553   return D3DSIO_COMMENT == (token & D3DSI_OPCODE_MASK);
1554 }
1555
1556
1557
1558 /**
1559  * Pixel Shaders
1560  *
1561  * http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/reference/Shaders/PixelShader1_X/modifiers/sourceregistermodifiers.asp
1562  * http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/reference/Shaders/PixelShader2_0/Registers/Registers.asp
1563  * http://msdn.microsoft.com/library/default.asp?url=/library/en-us/directx9_c/directx/graphics/reference/d3d/interfaces/IDirect3DPixelShader9/_IDirect3DPixelShader9.asp
1564  *
1565  */
1566 inline static VOID IDirect3DPixelShaderImpl_ParseProgram(IDirect3DPixelShaderImpl* pshader, CONST DWORD* pFunction) {
1567   const DWORD* pToken = pFunction;
1568   const SHADER_OPCODE* curOpcode = NULL;
1569   DWORD code;
1570   DWORD len = 0;  
1571   DWORD i;
1572
1573   if (NULL != pToken) {
1574     while (D3DPS_END() != *pToken) { 
1575       if (pshader_is_version_token(*pToken)) { /** version */
1576         TRACE("ps.%lu.%lu\n", (*pToken >> 8) & 0x0F, (*pToken & 0x0F));
1577         ++pToken;
1578         ++len;
1579         continue;
1580       } 
1581       if (pshader_is_comment_token(*pToken)) { /** comment */
1582         DWORD comment_len = (*pToken & D3DSI_COMMENTSIZE_MASK) >> D3DSI_COMMENTSIZE_SHIFT;
1583         ++pToken;
1584         /*TRACE("comment[%ld] ;%s\n", comment_len, (char*)pToken);*/
1585         pToken += comment_len;
1586         len += comment_len + 1;
1587         continue;
1588       }
1589       code = *pToken;
1590       curOpcode = pshader_program_get_opcode(code);
1591       ++pToken;
1592       ++len;
1593       if (NULL == curOpcode) {
1594         /* unkown current opcode ... */
1595         while (*pToken & 0x80000000) {
1596           TRACE("unrecognized opcode: %08lx\n", *pToken);
1597           ++pToken;
1598           ++len;
1599         }
1600       } else {
1601         TRACE(" ");
1602         pshader_program_dump_opcode(curOpcode, code, *pToken);
1603         if (curOpcode->num_params > 0) {
1604           pshader_program_dump_param(*pToken, 0);
1605           ++pToken;
1606           ++len;
1607           for (i = 1; i < curOpcode->num_params; ++i) {
1608             TRACE(", ");
1609             if (D3DSIO_DEF != code) {
1610               pshader_program_dump_param(*pToken, 1);
1611             } else {
1612               TRACE("%f", *((float*) pToken));
1613             }
1614             ++pToken;
1615             ++len;
1616           }
1617         }
1618         TRACE("\n");
1619       }
1620       pshader->functionLength = (len + 1) * sizeof(DWORD);
1621     } 
1622   } else {
1623     pshader->functionLength = 1; /* no Function defined use fixed function vertex processing */
1624   }
1625   if (NULL != pFunction) {
1626     pshader->function = HeapAlloc(GetProcessHeap(), HEAP_ZERO_MEMORY, pshader->functionLength);
1627     memcpy(pshader->function, pFunction, pshader->functionLength);
1628   } else {
1629     pshader->function = NULL;
1630   }
1631 }
1632
1633 HRESULT WINAPI IDirect3DDeviceImpl_CreatePixelShader(IDirect3DDevice8Impl* This, CONST DWORD* pFunction, IDirect3DPixelShaderImpl** ppPixelShader) {
1634   IDirect3DPixelShaderImpl* object;
1635
1636   object = HeapAlloc(GetProcessHeap(), HEAP_ZERO_MEMORY, sizeof(IDirect3DPixelShaderImpl));
1637   if (NULL == object) {
1638     *ppPixelShader = NULL;
1639     return D3DERR_OUTOFVIDEOMEMORY;
1640   }
1641   /*object->lpVtbl = &Direct3DPixelShader9_Vtbl;*/
1642   object->device = This;
1643   object->ref = 1;
1644   
1645   object->data = HeapAlloc(GetProcessHeap(), HEAP_ZERO_MEMORY, sizeof(PSHADERDATA8));
1646     
1647   IDirect3DPixelShaderImpl_ParseProgram(object, pFunction);
1648
1649   *ppPixelShader = object;
1650   return D3D_OK;
1651 }
1652
1653 HRESULT WINAPI IDirect3DPixelShaderImpl_GetFunction(IDirect3DPixelShaderImpl* This, VOID* pData, UINT* pSizeOfData) {
1654   if (NULL == pData) {
1655     *pSizeOfData = This->functionLength;
1656     return D3D_OK;
1657   }
1658   if (*pSizeOfData < This->functionLength) {
1659     *pSizeOfData = This->functionLength;
1660     return D3DERR_MOREDATA;
1661   }
1662   if (NULL == This->function) { /* no function defined */
1663     TRACE("(%p) : GetFunction no User Function defined using NULL to %p\n", This, pData);
1664     (*(DWORD **) pData) = NULL;
1665   } else {
1666     TRACE("(%p) : GetFunction copying to %p\n", This, pData);
1667     memcpy(pData, This->function, This->functionLength);
1668   }
1669   return D3D_OK;
1670 }
1671
1672 HRESULT WINAPI IDirect3DPixelShaderImpl_SetConstantF(IDirect3DPixelShaderImpl* This, UINT StartRegister, CONST FLOAT* pConstantData, UINT Vector4fCount) {
1673   if (StartRegister + Vector4fCount > D3D8_VSHADER_MAX_CONSTANTS) {
1674     return D3DERR_INVALIDCALL;
1675   }
1676   if (NULL == This->data) { /* temporary while datas not supported */
1677     FIXME("(%p) : VertexShader_SetConstant not fully supported yet\n", This);
1678     return D3DERR_INVALIDCALL;
1679   }
1680   memcpy(&This->data->C[StartRegister], pConstantData, Vector4fCount * 4 * sizeof(FLOAT));
1681   return D3D_OK;
1682 }
1683
1684 HRESULT WINAPI IDirect3DPixelShaderImpl_GetConstantF(IDirect3DPixelShaderImpl* This, UINT StartRegister, FLOAT* pConstantData, UINT Vector4fCount) {
1685   if (StartRegister + Vector4fCount > D3D8_VSHADER_MAX_CONSTANTS) {
1686     return D3DERR_INVALIDCALL;
1687   }
1688   if (NULL == This->data) { /* temporary while datas not supported */
1689     return D3DERR_INVALIDCALL;
1690   }
1691   memcpy(pConstantData, &This->data->C[StartRegister], Vector4fCount * 4 * sizeof(FLOAT));
1692   return D3D_OK;
1693 }
1694
1695
1696 /**********************************************************************************************************************************************
1697  **********************************************************************************************************************************************
1698  **********************************************************************************************************************************************
1699  **********************************************************************************************************************************************
1700  **********************************************************************************************************************************************/
1701
1702 /***********************************************************************
1703  *              ValidateVertexShader (D3D8.@)
1704  */
1705 BOOL WINAPI ValidateVertexShader(LPVOID what, LPVOID toto) {
1706   FIXME("(void): stub: %p %p\n", what, toto);
1707   return TRUE;
1708 }
1709
1710 /***********************************************************************
1711  *              ValidatePixelShader (D3D8.@)
1712  */
1713 BOOL WINAPI ValidatePixelShader(LPVOID what, LPVOID toto) {
1714   FIXME("(void): stub: %p %p\n", what, toto);
1715   return TRUE;
1716 }