Setup exception frame around 16-bit calls to unwind stack properly.
[wine] / tools / winebuild / relay.c
1 /*
2  * Relay calls helper routines
3  *
4  * Copyright 1993 Robert J. Amstadt
5  * Copyright 1995 Martin von Loewis
6  * Copyright 1995, 1996, 1997 Alexandre Julliard
7  * Copyright 1997 Eric Youngdale
8  * Copyright 1999 Ulrich Weigand
9  *
10  * This library is free software; you can redistribute it and/or
11  * modify it under the terms of the GNU Lesser General Public
12  * License as published by the Free Software Foundation; either
13  * version 2.1 of the License, or (at your option) any later version.
14  *
15  * This library is distributed in the hope that it will be useful,
16  * but WITHOUT ANY WARRANTY; without even the implied warranty of
17  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
18  * Lesser General Public License for more details.
19  *
20  * You should have received a copy of the GNU Lesser General Public
21  * License along with this library; if not, write to the Free Software
22  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
23  */
24
25 #include "config.h"
26 #include "wine/port.h"
27
28 #include <ctype.h>
29
30 #include "thread.h"
31 #include "stackframe.h"
32
33 #include "build.h"
34
35 #if defined(__GNUC__) && !defined(__svr4__)
36 static const int use_stabs = 1;
37 #else
38 static const int use_stabs = 0;
39 #endif
40
41 #ifdef __i386__
42
43 static void function_header( FILE *outfile, const char *name )
44 {
45     fprintf( outfile, "\n\t.align %d\n", get_alignment(4) );
46     if (use_stabs)
47         fprintf( outfile, "\t.stabs \"%s:F1\",36,0,0," __ASM_NAME("%s") "\n", name, name);
48     fprintf( outfile, "\t" __ASM_FUNC("%s") "\n", name );
49     fprintf( outfile, "\t.globl " __ASM_NAME("%s") "\n", name );
50     fprintf( outfile, __ASM_NAME("%s") ":\n", name );
51 }
52
53
54 /*******************************************************************
55  *         BuildCallFrom16Core
56  *
57  * This routine builds the core routines used in 16->32 thunks:
58  * CallFrom16Word, CallFrom16Long, CallFrom16Register, and CallFrom16Thunk.
59  *
60  * These routines are intended to be called via a far call (with 32-bit
61  * operand size) from 16-bit code.  The 16-bit code stub must push %bp,
62  * the 32-bit entry point to be called, and the argument conversion
63  * routine to be used (see stack layout below).
64  *
65  * The core routine completes the STACK16FRAME on the 16-bit stack and
66  * switches to the 32-bit stack.  Then, the argument conversion routine
67  * is called; it gets passed the 32-bit entry point and a pointer to the
68  * 16-bit arguments (on the 16-bit stack) as parameters. (You can either
69  * use conversion routines automatically generated by BuildCallFrom16,
70  * or write your own for special purposes.)
71  *
72  * The conversion routine must call the 32-bit entry point, passing it
73  * the converted arguments, and return its return value to the core.
74  * After the conversion routine has returned, the core switches back
75  * to the 16-bit stack, converts the return value to the DX:AX format
76  * (CallFrom16Long), and returns to the 16-bit call stub.  All parameters,
77  * including %bp, are popped off the stack.
78  *
79  * The 16-bit call stub now returns to the caller, popping the 16-bit
80  * arguments if necessary (pascal calling convention).
81  *
82  * In the case of a 'register' function, CallFrom16Register fills a
83  * CONTEXT86 structure with the values all registers had at the point
84  * the first instruction of the 16-bit call stub was about to be
85  * executed.  A pointer to this CONTEXT86 is passed as third parameter
86  * to the argument conversion routine, which typically passes it on
87  * to the called 32-bit entry point.
88  *
89  * CallFrom16Thunk is a special variant used by the implementation of
90  * the Win95 16->32 thunk functions C16ThkSL and C16ThkSL01 and is
91  * implemented as follows:
92  * On entry, the EBX register is set up to contain a flat pointer to the
93  * 16-bit stack such that EBX+22 points to the first argument.
94  * Then, the entry point is called, while EBP is set up to point
95  * to the return address (on the 32-bit stack).
96  * The called function returns with CX set to the number of bytes
97  * to be popped of the caller's stack.
98  *
99  * Stack layout upon entry to the core routine (STACK16FRAME):
100  *  ...           ...
101  * (sp+24) word   first 16-bit arg
102  * (sp+22) word   cs
103  * (sp+20) word   ip
104  * (sp+18) word   bp
105  * (sp+14) long   32-bit entry point (reused for Win16 mutex recursion count)
106  * (sp+12) word   ip of actual entry point (necessary for relay debugging)
107  * (sp+8)  long   relay (argument conversion) function entry point
108  * (sp+4)  long   cs of 16-bit entry point
109  * (sp)    long   ip of 16-bit entry point
110  *
111  * Added on the stack:
112  * (sp-2)  word   saved gs
113  * (sp-4)  word   saved fs
114  * (sp-6)  word   saved es
115  * (sp-8)  word   saved ds
116  * (sp-12) long   saved ebp
117  * (sp-16) long   saved ecx
118  * (sp-20) long   saved edx
119  * (sp-24) long   saved previous stack
120  */
121 static void BuildCallFrom16Core( FILE *outfile, int reg_func, int thunk, int short_ret )
122 {
123     char *name = thunk? "thunk" : reg_func? "regs" : short_ret? "word" : "long";
124
125     /* Function header */
126     if (thunk) function_header( outfile, "__wine_call_from_16_thunk" );
127     else if (reg_func) function_header( outfile, "__wine_call_from_16_regs" );
128     else if (short_ret) function_header( outfile, "__wine_call_from_16_word" );
129     else function_header( outfile, "__wine_call_from_16_long" );
130
131     /* Create STACK16FRAME (except STACK32FRAME link) */
132     fprintf( outfile, "\tpushw %%gs\n" );
133     fprintf( outfile, "\tpushw %%fs\n" );
134     fprintf( outfile, "\tpushw %%es\n" );
135     fprintf( outfile, "\tpushw %%ds\n" );
136     fprintf( outfile, "\tpushl %%ebp\n" );
137     fprintf( outfile, "\tpushl %%ecx\n" );
138     fprintf( outfile, "\tpushl %%edx\n" );
139
140     /* Save original EFlags register */
141     fprintf( outfile, "\tpushfl\n" );
142
143     if ( UsePIC )
144     {
145         /* Get Global Offset Table into %ecx */
146         fprintf( outfile, "\tcall .L__wine_call_from_16_%s.getgot1\n", name );
147         fprintf( outfile, ".L__wine_call_from_16_%s.getgot1:\n", name );
148         fprintf( outfile, "\tpopl %%ecx\n" );
149         fprintf( outfile, "\taddl $_GLOBAL_OFFSET_TABLE_+[.-.L__wine_call_from_16_%s.getgot1], %%ecx\n", name );
150     }
151
152     if (UsePIC)
153     {
154         fprintf( outfile, "\t.byte 0x2e\n\tmovl " __ASM_NAME("CallTo16_DataSelector@GOT") "(%%ecx), %%edx\n" );
155         fprintf( outfile, "\t.byte 0x2e\n\tmovl (%%edx), %%edx\n" );
156     }
157     else
158         fprintf( outfile, "\t.byte 0x2e\n\tmovl " __ASM_NAME("CallTo16_DataSelector") ",%%edx\n" );
159
160     /* Load 32-bit segment registers */
161 #ifdef __svr4__
162     fprintf( outfile, "\tdata16\n");
163 #endif
164     fprintf( outfile, "\tmovw %%dx, %%ds\n" );
165 #ifdef __svr4__
166     fprintf( outfile, "\tdata16\n");
167 #endif
168     fprintf( outfile, "\tmovw %%dx, %%es\n" );
169
170     if ( UsePIC )
171     {
172         fprintf( outfile, "\tmovl " __ASM_NAME("SYSLEVEL_Win16CurrentTeb@GOT") "(%%ecx), %%edx\n" );
173         fprintf( outfile, "\tmovw (%%edx), %%fs\n" );
174     }
175     else
176         fprintf( outfile, "\tmovw " __ASM_NAME("SYSLEVEL_Win16CurrentTeb") ", %%fs\n" );
177
178     /* Get address of wine_ldt_copy array into %ecx */
179     if ( UsePIC )
180         fprintf( outfile, "\tmovl " __ASM_NAME("wine_ldt_copy@GOT") "(%%ecx), %%ecx\n" );
181     else
182         fprintf( outfile, "\tmovl $" __ASM_NAME("wine_ldt_copy") ", %%ecx\n" );
183
184     /* Translate STACK16FRAME base to flat offset in %edx */
185     fprintf( outfile, "\tmovw %%ss, %%dx\n" );
186     fprintf( outfile, "\tandl $0xfff8, %%edx\n" );
187     fprintf( outfile, "\tshrl $1, %%edx\n" );
188     fprintf( outfile, "\tmovl (%%ecx,%%edx), %%edx\n" );
189     fprintf( outfile, "\tmovzwl %%sp, %%ebp\n" );
190     fprintf( outfile, "\tleal (%%ebp,%%edx), %%edx\n" );
191
192     /* Get saved flags into %ecx */
193     fprintf( outfile, "\tpopl %%ecx\n" );
194
195     /* Get the 32-bit stack pointer from the TEB and complete STACK16FRAME */
196     fprintf( outfile, "\t.byte 0x64\n\tmovl (%d), %%ebp\n", STACKOFFSET );
197     fprintf( outfile, "\tpushl %%ebp\n" );
198
199     /* Switch stacks */
200 #ifdef __svr4__
201     fprintf( outfile,"\tdata16\n");
202 #endif
203     fprintf( outfile, "\t.byte 0x64\n\tmovw %%ss, (%d)\n", STACKOFFSET + 2 );
204     fprintf( outfile, "\t.byte 0x64\n\tmovw %%sp, (%d)\n", STACKOFFSET );
205     fprintf( outfile, "\tpushl %%ds\n" );
206     fprintf( outfile, "\tpopl %%ss\n" );
207     fprintf( outfile, "\tmovl %%ebp, %%esp\n" );
208     fprintf( outfile, "\taddl $%d, %%ebp\n", STRUCTOFFSET(STACK32FRAME, ebp) );
209
210
211     /* At this point:
212        STACK16FRAME is completely set up
213        DS, ES, SS: flat data segment
214        FS: current TEB
215        ESP: points to last STACK32FRAME
216        EBP: points to ebp member of last STACK32FRAME
217        EDX: points to current STACK16FRAME
218        ECX: contains saved flags
219        all other registers: unchanged */
220
221     /* Special case: C16ThkSL stub */
222     if ( thunk )
223     {
224         /* Set up registers as expected and call thunk */
225         fprintf( outfile, "\tleal %d(%%edx), %%ebx\n", sizeof(STACK16FRAME)-22 );
226         fprintf( outfile, "\tleal -4(%%esp), %%ebp\n" );
227
228         fprintf( outfile, "\tcall *%d(%%edx)\n", STACK16OFFSET(entry_point) );
229
230         /* Switch stack back */
231         fprintf( outfile, "\t.byte 0x64\n\tmovw (%d), %%ss\n", STACKOFFSET+2 );
232         fprintf( outfile, "\t.byte 0x64\n\tmovzwl (%d), %%esp\n", STACKOFFSET );
233         fprintf( outfile, "\t.byte 0x64\n\tpopl (%d)\n", STACKOFFSET );
234
235         /* Restore registers and return directly to caller */
236         fprintf( outfile, "\taddl $8, %%esp\n" );
237         fprintf( outfile, "\tpopl %%ebp\n" );
238         fprintf( outfile, "\tpopw %%ds\n" );
239         fprintf( outfile, "\tpopw %%es\n" );
240         fprintf( outfile, "\tpopw %%fs\n" );
241         fprintf( outfile, "\tpopw %%gs\n" );
242         fprintf( outfile, "\taddl $20, %%esp\n" );
243
244         fprintf( outfile, "\txorb %%ch, %%ch\n" );
245         fprintf( outfile, "\tpopl %%ebx\n" );
246         fprintf( outfile, "\taddw %%cx, %%sp\n" );
247         fprintf( outfile, "\tpush %%ebx\n" );
248
249         fprintf( outfile, "\t.byte 0x66\n" );
250         fprintf( outfile, "\tlret\n" );
251
252         return;
253     }
254
255
256     /* Build register CONTEXT */
257     if ( reg_func )
258     {
259         fprintf( outfile, "\tsubl $%d, %%esp\n", sizeof(CONTEXT86) );
260
261         fprintf( outfile, "\tmovl %%ecx, %d(%%esp)\n", CONTEXTOFFSET(EFlags) );
262
263         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(Eax) );
264         fprintf( outfile, "\tmovl %%ebx, %d(%%esp)\n", CONTEXTOFFSET(Ebx) );
265         fprintf( outfile, "\tmovl %%esi, %d(%%esp)\n", CONTEXTOFFSET(Esi) );
266         fprintf( outfile, "\tmovl %%edi, %d(%%esp)\n", CONTEXTOFFSET(Edi) );
267
268         fprintf( outfile, "\tmovl %d(%%edx), %%eax\n", STACK16OFFSET(ebp) );
269         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(Ebp) );
270         fprintf( outfile, "\tmovl %d(%%edx), %%eax\n", STACK16OFFSET(ecx) );
271         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(Ecx) );
272         fprintf( outfile, "\tmovl %d(%%edx), %%eax\n", STACK16OFFSET(edx) );
273         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(Edx) );
274
275         fprintf( outfile, "\tmovzwl %d(%%edx), %%eax\n", STACK16OFFSET(ds) );
276         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(SegDs) );
277         fprintf( outfile, "\tmovzwl %d(%%edx), %%eax\n", STACK16OFFSET(es) );
278         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(SegEs) );
279         fprintf( outfile, "\tmovzwl %d(%%edx), %%eax\n", STACK16OFFSET(fs) );
280         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(SegFs) );
281         fprintf( outfile, "\tmovzwl %d(%%edx), %%eax\n", STACK16OFFSET(gs) );
282         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(SegGs) );
283
284         fprintf( outfile, "\tmovzwl %d(%%edx), %%eax\n", STACK16OFFSET(cs) );
285         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(SegCs) );
286         fprintf( outfile, "\tmovzwl %d(%%edx), %%eax\n", STACK16OFFSET(ip) );
287         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(Eip) );
288
289         fprintf( outfile, "\t.byte 0x64\n\tmovzwl (%d), %%eax\n", STACKOFFSET+2 );
290         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(SegSs) );
291         fprintf( outfile, "\t.byte 0x64\n\tmovzwl (%d), %%eax\n", STACKOFFSET );
292         fprintf( outfile, "\taddl $%d, %%eax\n", STACK16OFFSET(ip) );
293         fprintf( outfile, "\tmovl %%eax, %d(%%esp)\n", CONTEXTOFFSET(Esp) );
294 #if 0
295         fprintf( outfile, "\tfsave %d(%%esp)\n", CONTEXTOFFSET(FloatSave) );
296 #endif
297
298         /* Push address of CONTEXT86 structure -- popped by the relay routine */
299         fprintf( outfile, "\tpushl %%esp\n" );
300     }
301
302
303     /* Print debug info before call */
304     if ( debugging )
305     {
306         if ( UsePIC )
307         {
308             fprintf( outfile, "\tpushl %%ebx\n" );
309
310             /* Get Global Offset Table into %ebx (for PLT call) */
311             fprintf( outfile, "\tcall .L__wine_call_from_16_%s.getgot2\n", name );
312             fprintf( outfile, ".L__wine_call_from_16_%s.getgot2:\n", name );
313             fprintf( outfile, "\tpopl %%ebx\n" );
314             fprintf( outfile, "\taddl $_GLOBAL_OFFSET_TABLE_+[.-.L__wine_call_from_16_%s.getgot2], %%ebx\n", name );
315         }
316
317         fprintf( outfile, "\tpushl %%edx\n" );
318         if ( reg_func )
319             fprintf( outfile, "\tleal -%d(%%ebp), %%eax\n\tpushl %%eax\n",
320                               sizeof(CONTEXT) + STRUCTOFFSET(STACK32FRAME, ebp) );
321         else
322             fprintf( outfile, "\tpushl $0\n" );
323
324         if ( UsePIC )
325             fprintf( outfile, "\tcall " __ASM_NAME("RELAY_DebugCallFrom16@PLT") "\n ");
326         else
327             fprintf( outfile, "\tcall " __ASM_NAME("RELAY_DebugCallFrom16") "\n ");
328
329         fprintf( outfile, "\tpopl %%edx\n" );
330         fprintf( outfile, "\tpopl %%edx\n" );
331
332         if ( UsePIC )
333             fprintf( outfile, "\tpopl %%ebx\n" );
334     }
335
336     /* Call relay routine (which will call the API entry point) */
337     fprintf( outfile, "\tleal %d(%%edx), %%eax\n", sizeof(STACK16FRAME) );
338     fprintf( outfile, "\tpushl %%eax\n" );
339     fprintf( outfile, "\tpushl %d(%%edx)\n", STACK16OFFSET(entry_point) );
340     fprintf( outfile, "\tcall *%d(%%edx)\n", STACK16OFFSET(relay) );
341
342     /* Print debug info after call */
343     if ( debugging )
344     {
345         if ( UsePIC )
346         {
347             fprintf( outfile, "\tpushl %%ebx\n" );
348
349             /* Get Global Offset Table into %ebx (for PLT call) */
350             fprintf( outfile, "\tcall .L__wine_call_from_16_%s.getgot3\n", name );
351             fprintf( outfile, ".L__wine_call_from_16_%s.getgot3:\n", name );
352             fprintf( outfile, "\tpopl %%ebx\n" );
353             fprintf( outfile, "\taddl $_GLOBAL_OFFSET_TABLE_+[.-.L__wine_call_from_16_%s.getgot3], %%ebx\n", name );
354         }
355
356         fprintf( outfile, "\tpushl %%eax\n" );
357         if ( reg_func )
358             fprintf( outfile, "\tleal -%d(%%ebp), %%eax\n\tpushl %%eax\n",
359                               sizeof(CONTEXT) + STRUCTOFFSET(STACK32FRAME, ebp) );
360         else
361             fprintf( outfile, "\tpushl $0\n" );
362
363         if ( UsePIC )
364             fprintf( outfile, "\tcall " __ASM_NAME("RELAY_DebugCallFrom16Ret@PLT") "\n ");
365         else
366             fprintf( outfile, "\tcall " __ASM_NAME("RELAY_DebugCallFrom16Ret") "\n ");
367
368         fprintf( outfile, "\tpopl %%eax\n" );
369         fprintf( outfile, "\tpopl %%eax\n" );
370
371         if ( UsePIC )
372             fprintf( outfile, "\tpopl %%ebx\n" );
373     }
374
375
376     if ( reg_func )
377     {
378         fprintf( outfile, "\tmovl %%esp, %%ebx\n" );
379
380         /* Switch stack back */
381         fprintf( outfile, "\t.byte 0x64\n\tmovw (%d), %%ss\n", STACKOFFSET+2 );
382         fprintf( outfile, "\t.byte 0x64\n\tmovzwl (%d), %%esp\n", STACKOFFSET );
383         fprintf( outfile, "\t.byte 0x64\n\tpopl (%d)\n", STACKOFFSET );
384
385         /* Get return address to CallFrom16 stub */
386         fprintf( outfile, "\taddw $%d, %%sp\n", STACK16OFFSET(callfrom_ip)-4 );
387         fprintf( outfile, "\tpopl %%eax\n" );
388         fprintf( outfile, "\tpopl %%edx\n" );
389
390         /* Restore all registers from CONTEXT */
391         fprintf( outfile, "\tmovw %d(%%ebx), %%ss\n", CONTEXTOFFSET(SegSs) );
392         fprintf( outfile, "\tmovl %d(%%ebx), %%esp\n", CONTEXTOFFSET(Esp) );
393         fprintf( outfile, "\taddl $4, %%esp\n" );  /* room for final return address */
394
395         fprintf( outfile, "\tpushw %d(%%ebx)\n", CONTEXTOFFSET(SegCs) );
396         fprintf( outfile, "\tpushw %d(%%ebx)\n", CONTEXTOFFSET(Eip) );
397         fprintf( outfile, "\tpushl %%edx\n" );
398         fprintf( outfile, "\tpushl %%eax\n" );
399         fprintf( outfile, "\tpushl %d(%%ebx)\n", CONTEXTOFFSET(EFlags) );
400         fprintf( outfile, "\tpushl %d(%%ebx)\n", CONTEXTOFFSET(SegDs) );
401
402         fprintf( outfile, "\tmovw %d(%%ebx), %%es\n", CONTEXTOFFSET(SegEs) );
403         fprintf( outfile, "\tmovw %d(%%ebx), %%fs\n", CONTEXTOFFSET(SegFs) );
404         fprintf( outfile, "\tmovw %d(%%ebx), %%gs\n", CONTEXTOFFSET(SegGs) );
405
406         fprintf( outfile, "\tmovl %d(%%ebx), %%ebp\n", CONTEXTOFFSET(Ebp) );
407         fprintf( outfile, "\tmovl %d(%%ebx), %%esi\n", CONTEXTOFFSET(Esi) );
408         fprintf( outfile, "\tmovl %d(%%ebx), %%edi\n", CONTEXTOFFSET(Edi) );
409         fprintf( outfile, "\tmovl %d(%%ebx), %%eax\n", CONTEXTOFFSET(Eax) );
410         fprintf( outfile, "\tmovl %d(%%ebx), %%edx\n", CONTEXTOFFSET(Edx) );
411         fprintf( outfile, "\tmovl %d(%%ebx), %%ecx\n", CONTEXTOFFSET(Ecx) );
412         fprintf( outfile, "\tmovl %d(%%ebx), %%ebx\n", CONTEXTOFFSET(Ebx) );
413
414         fprintf( outfile, "\tpopl %%ds\n" );
415         fprintf( outfile, "\tpopfl\n" );
416         fprintf( outfile, "\tlret\n" );
417     }
418     else
419     {
420         /* Switch stack back */
421         fprintf( outfile, "\t.byte 0x64\n\tmovw (%d), %%ss\n", STACKOFFSET+2 );
422         fprintf( outfile, "\t.byte 0x64\n\tmovzwl (%d), %%esp\n", STACKOFFSET );
423         fprintf( outfile, "\t.byte 0x64\n\tpopl (%d)\n", STACKOFFSET );
424
425         /* Restore registers */
426         fprintf( outfile, "\tpopl %%edx\n" );
427         fprintf( outfile, "\tpopl %%ecx\n" );
428         fprintf( outfile, "\tpopl %%ebp\n" );
429         fprintf( outfile, "\tpopw %%ds\n" );
430         fprintf( outfile, "\tpopw %%es\n" );
431         fprintf( outfile, "\tpopw %%fs\n" );
432         fprintf( outfile, "\tpopw %%gs\n" );
433
434         /* Prepare return value and set flags accordingly */
435         if ( !short_ret )
436             fprintf( outfile, "\tshldl $16, %%eax, %%edx\n" );
437         fprintf( outfile, "\torl %%eax, %%eax\n" );
438
439         /* Return to return stub which will return to caller */
440         fprintf( outfile, "\tlret $12\n" );
441     }
442 }
443
444
445 /*******************************************************************
446  *         BuildCallTo16Core
447  *
448  * This routine builds the core routines used in 32->16 thunks:
449  *
450  *   extern void WINAPI wine_call_to_16_word( SEGPTR target, int nb_args );
451  *   extern void WINAPI wine_call_to_16_long( SEGPTR target, int nb_args );
452  *   extern void WINAPI wine_call_to_16_regs_short( const CONTEXT86 *context, int nb_args );
453  *   extern void WINAPI wine_call_to_16_regs_long ( const CONTEXT86 *context, int nb_args );
454  *
455  * These routines can be called directly from 32-bit code.
456  *
457  * All routines expect that the 16-bit stack contents (arguments) were
458  * already set up by the caller; nb_args must contain the number of bytes
459  * to be conserved.  The 16-bit SS:SP will be set accordinly.
460  *
461  * All other registers are either taken from the CONTEXT86 structure
462  * or else set to default values.  The target routine address is either
463  * given directly or taken from the CONTEXT86.
464  *
465  * If you want to call a 16-bit routine taking only standard argument types
466  * (WORD and LONG), you can also have an appropriate argument conversion
467  * stub automatically generated (see BuildCallTo16); you'd then call this
468  * stub, which in turn would prepare the 16-bit stack and call the appropiate
469  * core routine.
470  *
471  */
472 static void BuildCallTo16Core( FILE *outfile, int short_ret, int reg_func )
473 {
474     char *name = reg_func == 2 ? "regs_long" :
475                  reg_func == 1 ? "regs_short" :
476                  short_ret? "word" : "long";
477
478     /* Function header */
479     if (reg_func == 2) function_header( outfile, "wine_call_to_16_regs_long" );
480     else if (reg_func == 1) function_header( outfile, "wine_call_to_16_regs_short" );
481     else if (short_ret) function_header( outfile, "wine_call_to_16_word" );
482     else function_header( outfile, "wine_call_to_16_long" );
483
484     /* Function entry sequence */
485     fprintf( outfile, "\tpushl %%ebp\n" );
486     fprintf( outfile, "\tmovl %%esp, %%ebp\n" );
487
488     /* Save the 32-bit registers */
489     fprintf( outfile, "\tpushl %%ebx\n" );
490     fprintf( outfile, "\tpushl %%ecx\n" );
491     fprintf( outfile, "\tpushl %%edx\n" );
492     fprintf( outfile, "\tpushl %%esi\n" );
493     fprintf( outfile, "\tpushl %%edi\n" );
494
495     if ( UsePIC )
496     {
497         /* Get Global Offset Table into %ebx */
498         fprintf( outfile, "\tcall .Lwine_call_to_16_%s.getgot1\n", name );
499         fprintf( outfile, ".Lwine_call_to_16_%s.getgot1:\n", name );
500         fprintf( outfile, "\tpopl %%ebx\n" );
501         fprintf( outfile, "\taddl $_GLOBAL_OFFSET_TABLE_+[.-.Lwine_call_to_16_%s.getgot1], %%ebx\n", name );
502     }
503
504     /* Print debugging info */
505     if (debugging)
506     {
507         /* Push flags, number of arguments, and target */
508         fprintf( outfile, "\tpushl $%d\n", reg_func );
509         fprintf( outfile, "\tpushl 12(%%ebp)\n" );
510         fprintf( outfile, "\tpushl  8(%%ebp)\n" );
511
512         if ( UsePIC )
513             fprintf( outfile, "\tcall " __ASM_NAME("RELAY_DebugCallTo16@PLT") "\n" );
514         else
515             fprintf( outfile, "\tcall " __ASM_NAME("RELAY_DebugCallTo16") "\n" );
516
517         fprintf( outfile, "\taddl $12, %%esp\n" );
518     }
519
520     /* Enter Win16 Mutex */
521     if ( UsePIC )
522         fprintf( outfile, "\tcall " __ASM_NAME("_EnterWin16Lock@PLT") "\n" );
523     else
524         fprintf( outfile, "\tcall " __ASM_NAME("_EnterWin16Lock") "\n" );
525
526     /* Setup exception frame */
527     fprintf( outfile, "\t.byte 0x64\n\tpushl (%d)\n", STACKOFFSET );
528     if (UsePIC)
529         fprintf( outfile, "\tpushl " __ASM_NAME("__wine_callto16_handler@GOT") "(%%ebx)\n" );
530     else
531         fprintf( outfile, "\tpushl $" __ASM_NAME("__wine_callto16_handler") "\n" );
532     fprintf( outfile, "\t.byte 0x64\n\tpushl (%d)\n", STRUCTOFFSET(TEB,except) );
533     fprintf( outfile, "\t.byte 0x64\n\tmovl %%esp,(%d)\n", STRUCTOFFSET(TEB,except) );
534
535     /* Get return address */
536     if ( UsePIC )
537     {
538         fprintf( outfile, "\tmovl " __ASM_NAME("CallTo16_RetAddr@GOT") "(%%ebx), %%ecx\n" );
539         fprintf( outfile, "\tmovl (%%ecx), %%ecx\n" );
540     }
541     else
542         fprintf( outfile, "\tmovl " __ASM_NAME("CallTo16_RetAddr") ", %%ecx\n" );
543
544     /* Call the actual CallTo16 routine (simulate a lcall) */
545     fprintf( outfile, "\tpushl %%cs\n" );
546     fprintf( outfile, "\tcall .Lwine_call_to_16_%s\n", reg_func ? name : "long" );
547
548     /* Remove exception frame */
549     fprintf( outfile, "\t.byte 0x64\n\tpopl (%d)\n", STRUCTOFFSET(TEB,except) );
550     fprintf( outfile, "\taddl $4, %%esp\n" );
551     fprintf( outfile, "\t.byte 0x64\n\tpopl (%d)\n", STACKOFFSET );
552
553     if ( !reg_func )
554     {
555         /* Convert and push return value */
556         if ( short_ret )
557         {
558             fprintf( outfile, "\tmovzwl %%ax, %%eax\n" );
559             fprintf( outfile, "\tpushl %%eax\n" );
560         }
561         else
562         {
563             fprintf( outfile, "\tshll $16,%%edx\n" );
564             fprintf( outfile, "\tmovw %%ax,%%dx\n" );
565             fprintf( outfile, "\tpushl %%edx\n" );
566         }
567     }
568     else
569     {
570         /*
571          * Modify CONTEXT86 structure to contain new values
572          *
573          * NOTE:  We restore only EAX, EBX, EDX, EDX, EBP, and ESP.
574          *        The segment registers as well as ESI and EDI should
575          *        not be modified by a well-behaved 16-bit routine in
576          *        any case.  [If necessary, we could restore them as well,
577          *        at the cost of a somewhat less efficient return path.]
578          */
579
580         fprintf( outfile, "\tmovl %d(%%esp), %%edi\n", STACK32OFFSET(target) - STACK32OFFSET(edi));
581                 /* everything above edi has been popped already */
582
583         fprintf( outfile, "\tmovl %%eax, %d(%%edi)\n", CONTEXTOFFSET(Eax) );
584         fprintf( outfile, "\tmovl %%ebx, %d(%%edi)\n", CONTEXTOFFSET(Ebx) );
585         fprintf( outfile, "\tmovl %%ecx, %d(%%edi)\n", CONTEXTOFFSET(Ecx) );
586         fprintf( outfile, "\tmovl %%edx, %d(%%edi)\n", CONTEXTOFFSET(Edx) );
587         fprintf( outfile, "\tmovl %%ebp, %d(%%edi)\n", CONTEXTOFFSET(Ebp) );
588         fprintf( outfile, "\tmovl %%esi, %d(%%edi)\n", CONTEXTOFFSET(Esp) );
589                  /* The return glue code saved %esp into %esi */
590
591         fprintf( outfile, "\tpushl %%edi\n" );
592     }
593
594     if ( UsePIC )
595     {
596         /* Get Global Offset Table into %ebx (might have been overwritten) */
597         fprintf( outfile, "\tcall .Lwine_call_to_16_%s.getgot2\n", name );
598         fprintf( outfile, ".Lwine_call_to_16_%s.getgot2:\n", name );
599         fprintf( outfile, "\tpopl %%ebx\n" );
600         fprintf( outfile, "\taddl $_GLOBAL_OFFSET_TABLE_+[.-.Lwine_call_to_16_%s.getgot2], %%ebx\n", name );
601     }
602
603     /* Leave Win16 Mutex */
604     if ( UsePIC )
605         fprintf( outfile, "\tcall " __ASM_NAME("_LeaveWin16Lock@PLT") "\n" );
606     else
607         fprintf( outfile, "\tcall " __ASM_NAME("_LeaveWin16Lock") "\n" );
608
609     /* Print debugging info */
610     if (debugging)
611     {
612         fprintf( outfile, "\tpushl $%d\n", reg_func );
613
614         if ( UsePIC )
615             fprintf( outfile, "\tcall " __ASM_NAME("RELAY_DebugCallTo16Ret@PLT") "\n" );
616         else
617             fprintf( outfile, "\tcall " __ASM_NAME("RELAY_DebugCallTo16Ret") "\n" );
618
619         fprintf( outfile, "\taddl $4, %%esp\n" );
620     }
621
622     /* Get return value */
623     fprintf( outfile, "\tpopl %%eax\n" );
624
625     /* Restore the 32-bit registers */
626     fprintf( outfile, "\tpopl %%edi\n" );
627     fprintf( outfile, "\tpopl %%esi\n" );
628     fprintf( outfile, "\tpopl %%edx\n" );
629     fprintf( outfile, "\tpopl %%ecx\n" );
630     fprintf( outfile, "\tpopl %%ebx\n" );
631
632     /* Function exit sequence */
633     fprintf( outfile, "\tpopl %%ebp\n" );
634     fprintf( outfile, "\tret $8\n" );
635
636
637     /* Start of the actual CallTo16 routine */
638
639     if (!reg_func && short_ret) return;  /* call_to_16_word uses call_to_16_long backend routine */
640
641     fprintf( outfile, ".Lwine_call_to_16_%s:\n", name );
642
643     /* Switch to the 16-bit stack */
644     fprintf( outfile, "\tmovl %%esp,%%edx\n" );
645 #ifdef __svr4__
646     fprintf( outfile,"\tdata16\n");
647 #endif
648     fprintf( outfile, "\t.byte 0x64\n\tmovw (%d),%%ss\n", STACKOFFSET + 2);
649     fprintf( outfile, "\t.byte 0x64\n\tmovw (%d),%%sp\n", STACKOFFSET );
650     fprintf( outfile, "\t.byte 0x64\n\tmovl %%edx,(%d)\n", STACKOFFSET );
651
652     /* Make %bp point to the previous stackframe (built by CallFrom16) */
653     fprintf( outfile, "\tmovzwl %%sp,%%ebp\n" );
654     fprintf( outfile, "\tleal %d(%%ebp),%%ebp\n", STACK16OFFSET(bp) );
655
656     /* Add the specified offset to the new sp */
657     fprintf( outfile, "\tsubw %d(%%edx), %%sp\n", STACK32OFFSET(nb_args) );
658
659     /* Push the return address
660      * With sreg suffix, we push 16:16 address (normal lret)
661      * With lreg suffix, we push 16:32 address (0x66 lret, for KERNEL32_45)
662      */
663     if (reg_func != 2)
664         fprintf( outfile, "\tpushl %%ecx\n" );
665     else
666     {
667         fprintf( outfile, "\tshldl $16, %%ecx, %%eax\n" );
668         fprintf( outfile, "\tpushw $0\n" );
669         fprintf( outfile, "\tpushw %%ax\n" );
670         fprintf( outfile, "\tpushw $0\n" );
671         fprintf( outfile, "\tpushw %%cx\n" );
672     }
673
674     if (reg_func)
675     {
676         /* Push the called routine address */
677         fprintf( outfile, "\tmovl %d(%%edx),%%edx\n", STACK32OFFSET(target) );
678         fprintf( outfile, "\tpushw %d(%%edx)\n", CONTEXTOFFSET(SegCs) );
679         fprintf( outfile, "\tpushw %d(%%edx)\n", CONTEXTOFFSET(Eip) );
680
681         /* Get the registers */
682         fprintf( outfile, "\tpushw %d(%%edx)\n", CONTEXTOFFSET(SegDs) );
683         fprintf( outfile, "\tmovl %d(%%edx),%%eax\n", CONTEXTOFFSET(SegEs) );
684         fprintf( outfile, "\tmovw %%ax,%%es\n" );
685         fprintf( outfile, "\tmovl %d(%%edx),%%eax\n", CONTEXTOFFSET(SegFs) );
686         fprintf( outfile, "\tmovw %%ax,%%fs\n" );
687         fprintf( outfile, "\tmovl %d(%%edx),%%ebp\n", CONTEXTOFFSET(Ebp) );
688         fprintf( outfile, "\tmovl %d(%%edx),%%esi\n", CONTEXTOFFSET(Esi) );
689         fprintf( outfile, "\tmovl %d(%%edx),%%edi\n", CONTEXTOFFSET(Edi) );
690         fprintf( outfile, "\tmovl %d(%%edx),%%eax\n", CONTEXTOFFSET(Eax) );
691         fprintf( outfile, "\tmovl %d(%%edx),%%ebx\n", CONTEXTOFFSET(Ebx) );
692         fprintf( outfile, "\tmovl %d(%%edx),%%ecx\n", CONTEXTOFFSET(Ecx) );
693         fprintf( outfile, "\tmovl %d(%%edx),%%edx\n", CONTEXTOFFSET(Edx) );
694
695         /* Get the 16-bit ds */
696         fprintf( outfile, "\tpopw %%ds\n" );
697     }
698     else  /* not a register function */
699     {
700         /* Push the called routine address */
701         fprintf( outfile, "\tpushl %d(%%edx)\n", STACK32OFFSET(target) );
702
703         /* Set %fs to the value saved by the last CallFrom16 */
704         fprintf( outfile, "\tmovw %d(%%ebp),%%ax\n", STACK16OFFSET(fs)-STACK16OFFSET(bp) );
705         fprintf( outfile, "\tmovw %%ax,%%fs\n" );
706
707         /* Set %ds and %es (and %ax just in case) equal to %ss */
708         fprintf( outfile, "\tmovw %%ss,%%ax\n" );
709         fprintf( outfile, "\tmovw %%ax,%%ds\n" );
710         fprintf( outfile, "\tmovw %%ax,%%es\n" );
711     }
712
713     /* Jump to the called routine */
714     fprintf( outfile, "\t.byte 0x66\n" );
715     fprintf( outfile, "\tlret\n" );
716 }
717
718
719 /*******************************************************************
720  *         BuildRet16Func
721  *
722  * Build the return code for 16-bit callbacks
723  */
724 static void BuildRet16Func( FILE *outfile )
725 {
726     /*
727      *  Note: This must reside in the .data section to allow
728      *        run-time relocation of the SYSLEVEL_Win16CurrentTeb symbol
729      */
730
731     function_header( outfile, "CallTo16_Ret" );
732
733     /* Save %esp into %esi */
734     fprintf( outfile, "\tmovl %%esp,%%esi\n" );
735
736     /* Restore 32-bit segment registers */
737
738     fprintf( outfile, "\t.byte 0x2e\n\tmovl " __ASM_NAME("CallTo16_DataSelector") "-" __ASM_NAME("Call16_Ret_Start") ",%%edi\n" );
739 #ifdef __svr4__
740     fprintf( outfile, "\tdata16\n");
741 #endif
742     fprintf( outfile, "\tmovw %%di,%%ds\n" );
743 #ifdef __svr4__
744     fprintf( outfile, "\tdata16\n");
745 #endif
746     fprintf( outfile, "\tmovw %%di,%%es\n" );
747
748     fprintf( outfile, "\tmovw " __ASM_NAME("SYSLEVEL_Win16CurrentTeb") ",%%fs\n" );
749
750     /* Restore the 32-bit stack */
751
752 #ifdef __svr4__
753     fprintf( outfile, "\tdata16\n");
754 #endif
755     fprintf( outfile, "\tmovw %%di,%%ss\n" );
756     fprintf( outfile, "\t.byte 0x64\n\tmovl (%d),%%esp\n", STACKOFFSET );
757
758     /* Return to caller */
759
760     fprintf( outfile, "\tlret\n" );
761
762     /* Declare the return address and data selector variables */
763
764     fprintf( outfile, "\n\t.align %d\n", get_alignment(4) );
765     fprintf( outfile, "\t.globl " __ASM_NAME("CallTo16_DataSelector") "\n" );
766     fprintf( outfile, __ASM_NAME("CallTo16_DataSelector") ":\t.long 0\n" );
767     fprintf( outfile, "\t.globl " __ASM_NAME("CallTo16_RetAddr") "\n" );
768     fprintf( outfile, __ASM_NAME("CallTo16_RetAddr") ":\t.long 0\n" );
769 }
770
771
772 /*******************************************************************
773  *         BuildCallTo32CBClient
774  *
775  * Call a CBClient relay stub from 32-bit code (KERNEL.620).
776  *
777  * Since the relay stub is itself 32-bit, this should not be a problem;
778  * unfortunately, the relay stubs are expected to switch back to a
779  * 16-bit stack (and 16-bit code) after completion :-(
780  *
781  * This would conflict with our 16- vs. 32-bit stack handling, so
782  * we simply switch *back* to our 32-bit stack before returning to
783  * the caller ...
784  *
785  * The CBClient relay stub expects to be called with the following
786  * 16-bit stack layout, and with ebp and ebx pointing into the 16-bit
787  * stack at the designated places:
788  *
789  *    ...
790  *  (ebp+14) original arguments to the callback routine
791  *  (ebp+10) far return address to original caller
792  *  (ebp+6)  Thunklet target address
793  *  (ebp+2)  Thunklet relay ID code
794  *  (ebp)    BP (saved by CBClientGlueSL)
795  *  (ebp-2)  SI (saved by CBClientGlueSL)
796  *  (ebp-4)  DI (saved by CBClientGlueSL)
797  *  (ebp-6)  DS (saved by CBClientGlueSL)
798  *
799  *   ...     buffer space used by the 16-bit side glue for temp copies
800  *
801  *  (ebx+4)  far return address to 16-bit side glue code
802  *  (ebx)    saved 16-bit ss:sp (pointing to ebx+4)
803  *
804  * The 32-bit side glue code accesses both the original arguments (via ebp)
805  * and the temporary copies prepared by the 16-bit side glue (via ebx).
806  * After completion, the stub will load ss:sp from the buffer at ebx
807  * and perform a far return to 16-bit code.
808  *
809  * To trick the relay stub into returning to us, we replace the 16-bit
810  * return address to the glue code by a cs:ip pair pointing to our
811  * return entry point (the original return address is saved first).
812  * Our return stub thus called will then reload the 32-bit ss:esp and
813  * return to 32-bit code (by using and ss:esp value that we have also
814  * pushed onto the 16-bit stack before and a cs:eip values found at
815  * that position on the 32-bit stack).  The ss:esp to be restored is
816  * found relative to the 16-bit stack pointer at:
817  *
818  *  (ebx-4)   ss  (flat)
819  *  (ebx-8)   sp  (32-bit stack pointer)
820  *
821  * The second variant of this routine, CALL32_CBClientEx, which is used
822  * to implement KERNEL.621, has to cope with yet another problem: Here,
823  * the 32-bit side directly returns to the caller of the CBClient thunklet,
824  * restoring registers saved by CBClientGlueSL and cleaning up the stack.
825  * As we have to return to our 32-bit code first, we have to adapt the
826  * layout of our temporary area so as to include values for the registers
827  * that are to be restored, and later (in the implementation of KERNEL.621)
828  * we *really* restore them. The return stub restores DS, DI, SI, and BP
829  * from the stack, skips the next 8 bytes (CBClient relay code / target),
830  * and then performs a lret NN, where NN is the number of arguments to be
831  * removed. Thus, we prepare our temporary area as follows:
832  *
833  *     (ebx+22) 16-bit cs  (this segment)
834  *     (ebx+20) 16-bit ip  ('16-bit' return entry point)
835  *     (ebx+16) 32-bit ss  (flat)
836  *     (ebx+12) 32-bit sp  (32-bit stack pointer)
837  *     (ebx+10) 16-bit bp  (points to ebx+24)
838  *     (ebx+8)  16-bit si  (ignored)
839  *     (ebx+6)  16-bit di  (ignored)
840  *     (ebx+4)  16-bit ds  (we actually use the flat DS here)
841  *     (ebx+2)  16-bit ss  (16-bit stack segment)
842  *     (ebx+0)  16-bit sp  (points to ebx+4)
843  *
844  * Note that we ensure that DS is not changed and remains the flat segment,
845  * and the 32-bit stack pointer our own return stub needs fits just
846  * perfectly into the 8 bytes that are skipped by the Windows stub.
847  * One problem is that we have to determine the number of removed arguments,
848  * as these have to be really removed in KERNEL.621. Thus, the BP value
849  * that we place in the temporary area to be restored, contains the value
850  * that SP would have if no arguments were removed. By comparing the actual
851  * value of SP with this value in our return stub we can compute the number
852  * of removed arguments. This is then returned to KERNEL.621.
853  *
854  * The stack layout of this function:
855  * (ebp+20)  nArgs     pointer to variable receiving nr. of args (Ex only)
856  * (ebp+16)  esi       pointer to caller's esi value
857  * (ebp+12)  arg       ebp value to be set for relay stub
858  * (ebp+8)   func      CBClient relay stub address
859  * (ebp+4)   ret addr
860  * (ebp)     ebp
861  */
862 static void BuildCallTo32CBClient( FILE *outfile, BOOL isEx )
863 {
864     char *name = isEx? "CBClientEx" : "CBClient";
865     int size = isEx? 24 : 12;
866
867     /* Function header */
868
869     fprintf( outfile, "\n\t.align %d\n", get_alignment(4) );
870     if (use_stabs)
871         fprintf( outfile, ".stabs \"CALL32_%s:F1\",36,0,0," __ASM_NAME("CALL32_%s") "\n",
872                  name, name );
873     fprintf( outfile, "\t.globl " __ASM_NAME("CALL32_%s") "\n", name );
874     fprintf( outfile, __ASM_NAME("CALL32_%s") ":\n", name );
875
876     /* Entry code */
877
878     fprintf( outfile, "\tpushl %%ebp\n" );
879     fprintf( outfile, "\tmovl %%esp,%%ebp\n" );
880     fprintf( outfile, "\tpushl %%edi\n" );
881     fprintf( outfile, "\tpushl %%esi\n" );
882     fprintf( outfile, "\tpushl %%ebx\n" );
883
884     /* Get the 16-bit stack */
885
886     fprintf( outfile, "\t.byte 0x64\n\tmovl (%d),%%ebx\n", STACKOFFSET);
887
888     /* Convert it to a flat address */
889
890     fprintf( outfile, "\tshldl $16,%%ebx,%%eax\n" );
891     fprintf( outfile, "\tandl $0xfff8,%%eax\n" );
892     fprintf( outfile, "\tshrl $1,%%eax\n" );
893     fprintf( outfile, "\tmovl " __ASM_NAME("wine_ldt_copy") "(%%eax),%%esi\n" );
894     fprintf( outfile, "\tmovw %%bx,%%ax\n" );
895     fprintf( outfile, "\taddl %%eax,%%esi\n" );
896
897     /* Allocate temporary area (simulate STACK16_PUSH) */
898
899     fprintf( outfile, "\tpushf\n" );
900     fprintf( outfile, "\tcld\n" );
901     fprintf( outfile, "\tleal -%d(%%esi), %%edi\n", size );
902     fprintf( outfile, "\tmovl $%d, %%ecx\n", sizeof(STACK16FRAME) );
903     fprintf( outfile, "\trep\n\tmovsb\n" );
904     fprintf( outfile, "\tpopf\n" );
905
906     fprintf( outfile, "\t.byte 0x64\n\tsubw $%d,(%d)\n", size, STACKOFFSET );
907
908     fprintf( outfile, "\tpushl %%edi\n" );  /* remember address */
909
910     /* Set up temporary area */
911
912     if ( !isEx )
913     {
914         fprintf( outfile, "\tleal 4(%%edi), %%edi\n" );
915
916         fprintf( outfile, "\tleal -8(%%esp), %%eax\n" );
917         fprintf( outfile, "\tmovl %%eax, -8(%%edi)\n" );    /* 32-bit sp */
918
919         fprintf( outfile, "\tmovw %%ss, %%ax\n" );
920         fprintf( outfile, "\tandl $0x0000ffff, %%eax\n" );
921         fprintf( outfile, "\tmovl %%eax, -4(%%edi)\n" );    /* 32-bit ss */
922
923         fprintf( outfile, "\taddl $%d, %%ebx\n", sizeof(STACK16FRAME)-size+4 + 4 );
924         fprintf( outfile, "\tmovl %%ebx, 0(%%edi)\n" );    /* 16-bit ss:sp */
925
926         fprintf( outfile, "\tmovl " __ASM_NAME("CALL32_%s_RetAddr") ", %%eax\n", name );
927         fprintf( outfile, "\tmovl %%eax, 4(%%edi)\n" );   /* overwrite return address */
928     }
929     else
930     {
931         fprintf( outfile, "\taddl $%d, %%ebx\n", sizeof(STACK16FRAME)-size+4 );
932         fprintf( outfile, "\tmovl %%ebx, 0(%%edi)\n" );
933
934         fprintf( outfile, "\tmovw %%ds, %%ax\n" );
935         fprintf( outfile, "\tmovw %%ax, 4(%%edi)\n" );
936
937         fprintf( outfile, "\taddl $20, %%ebx\n" );
938         fprintf( outfile, "\tmovw %%bx, 10(%%edi)\n" );
939
940         fprintf( outfile, "\tleal -8(%%esp), %%eax\n" );
941         fprintf( outfile, "\tmovl %%eax, 12(%%edi)\n" );
942
943         fprintf( outfile, "\tmovw %%ss, %%ax\n" );
944         fprintf( outfile, "\tandl $0x0000ffff, %%eax\n" );
945         fprintf( outfile, "\tmovl %%eax, 16(%%edi)\n" );
946
947         fprintf( outfile, "\tmovl " __ASM_NAME("CALL32_%s_RetAddr") ", %%eax\n", name );
948         fprintf( outfile, "\tmovl %%eax, 20(%%edi)\n" );
949     }
950
951     /* Set up registers and call CBClient relay stub (simulating a far call) */
952
953     fprintf( outfile, "\tmovl 16(%%ebp), %%esi\n" );
954     fprintf( outfile, "\tmovl (%%esi), %%esi\n" );
955
956     fprintf( outfile, "\tmovl %%edi, %%ebx\n" );
957     fprintf( outfile, "\tmovl 8(%%ebp), %%eax\n" );
958     fprintf( outfile, "\tmovl 12(%%ebp), %%ebp\n" );
959
960     fprintf( outfile, "\tpushl %%cs\n" );
961     fprintf( outfile, "\tcall *%%eax\n" );
962
963     /* Return new esi value to caller */
964
965     fprintf( outfile, "\tmovl 32(%%esp), %%edi\n" );
966     fprintf( outfile, "\tmovl %%esi, (%%edi)\n" );
967
968     /* Cleanup temporary area (simulate STACK16_POP) */
969
970     fprintf( outfile, "\tpop %%esi\n" );
971
972     fprintf( outfile, "\tpushf\n" );
973     fprintf( outfile, "\tstd\n" );
974     fprintf( outfile, "\tdec %%esi\n" );
975     fprintf( outfile, "\tleal %d(%%esi), %%edi\n", size );
976     fprintf( outfile, "\tmovl $%d, %%ecx\n", sizeof(STACK16FRAME) );
977     fprintf( outfile, "\trep\n\tmovsb\n" );
978     fprintf( outfile, "\tpopf\n" );
979
980     fprintf( outfile, "\t.byte 0x64\n\taddw $%d,(%d)\n", size, STACKOFFSET );
981
982     /* Return argument size to caller */
983     if ( isEx )
984     {
985         fprintf( outfile, "\tmovl 32(%%esp), %%ebx\n" );
986         fprintf( outfile, "\tmovl %%ebp, (%%ebx)\n" );
987     }
988
989     /* Restore registers and return */
990
991     fprintf( outfile, "\tpopl %%ebx\n" );
992     fprintf( outfile, "\tpopl %%esi\n" );
993     fprintf( outfile, "\tpopl %%edi\n" );
994     fprintf( outfile, "\tpopl %%ebp\n" );
995     fprintf( outfile, "\tret\n" );
996 }
997
998 static void BuildCallTo32CBClientRet( FILE *outfile, BOOL isEx )
999 {
1000     char *name = isEx? "CBClientEx" : "CBClient";
1001
1002     /* '16-bit' return stub */
1003
1004     fprintf( outfile, "\n\t.globl " __ASM_NAME("CALL32_%s_Ret") "\n", name );
1005     fprintf( outfile, __ASM_NAME("CALL32_%s_Ret") ":\n", name );
1006
1007     if ( !isEx )
1008     {
1009         fprintf( outfile, "\tmovzwl %%sp, %%ebx\n" );
1010         fprintf( outfile, "\tlssl %%ss:-16(%%ebx), %%esp\n" );
1011     }
1012     else
1013     {
1014         fprintf( outfile, "\tmovzwl %%bp, %%ebx\n" );
1015         fprintf( outfile, "\tsubw %%bp, %%sp\n" );
1016         fprintf( outfile, "\tmovzwl %%sp, %%ebp\n" );
1017         fprintf( outfile, "\tlssl %%ss:-12(%%ebx), %%esp\n" );
1018     }
1019     fprintf( outfile, "\tlret\n" );
1020
1021     /* Declare the return address variable */
1022
1023     fprintf( outfile, "\n\t.globl " __ASM_NAME("CALL32_%s_RetAddr") "\n", name );
1024     fprintf( outfile, __ASM_NAME("CALL32_%s_RetAddr") ":\t.long 0\n", name );
1025 }
1026
1027
1028 /*******************************************************************
1029  *         BuildCallFrom32Regs
1030  *
1031  * Build a 32-bit-to-Wine call-back function for a 'register' function.
1032  * 'args' is the number of dword arguments.
1033  *
1034  * Stack layout:
1035  *   ...
1036  * (ebp+12)  first arg
1037  * (ebp+8)   ret addr to user code
1038  * (ebp+4)   ret addr to relay code
1039  * (ebp+0)   saved ebp
1040  * (ebp-128) buffer area to allow stack frame manipulation
1041  * (ebp-332) CONTEXT86 struct
1042  * (ebp-336) CONTEXT86 *argument
1043  *  ....     other arguments copied from (ebp+12)
1044  *
1045  * The entry point routine is called with a CONTEXT* extra argument,
1046  * following the normal args. In this context structure, EIP_reg
1047  * contains the return address to user code, and ESP_reg the stack
1048  * pointer on return (with the return address and arguments already
1049  * removed).
1050  */
1051 static void BuildCallFrom32Regs( FILE *outfile )
1052 {
1053     static const int STACK_SPACE = 128 + sizeof(CONTEXT86);
1054
1055     /* Function header */
1056
1057     function_header( outfile, "__wine_call_from_32_regs" );
1058
1059     /* Allocate some buffer space on the stack */
1060
1061     fprintf( outfile, "\tpushl %%ebp\n" );
1062     fprintf( outfile, "\tmovl %%esp,%%ebp\n ");
1063     fprintf( outfile, "\tleal -%d(%%esp), %%esp\n", STACK_SPACE );
1064
1065     /* Build the context structure */
1066
1067     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(Eax) - STACK_SPACE );
1068     fprintf( outfile, "\tpushfl\n" );
1069     fprintf( outfile, "\tpopl %%eax\n" );
1070     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(EFlags) - STACK_SPACE );
1071     fprintf( outfile, "\tmovl 0(%%ebp),%%eax\n" );
1072     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(Ebp) - STACK_SPACE );
1073     fprintf( outfile, "\tmovl %%ebx,%d(%%ebp)\n", CONTEXTOFFSET(Ebx) - STACK_SPACE );
1074     fprintf( outfile, "\tmovl %%ecx,%d(%%ebp)\n", CONTEXTOFFSET(Ecx) - STACK_SPACE );
1075     fprintf( outfile, "\tmovl %%edx,%d(%%ebp)\n", CONTEXTOFFSET(Edx) - STACK_SPACE );
1076     fprintf( outfile, "\tmovl %%esi,%d(%%ebp)\n", CONTEXTOFFSET(Esi) - STACK_SPACE );
1077     fprintf( outfile, "\tmovl %%edi,%d(%%ebp)\n", CONTEXTOFFSET(Edi) - STACK_SPACE );
1078
1079     fprintf( outfile, "\txorl %%eax,%%eax\n" );
1080     fprintf( outfile, "\tmovw %%cs,%%ax\n" );
1081     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(SegCs) - STACK_SPACE );
1082     fprintf( outfile, "\tmovw %%es,%%ax\n" );
1083     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(SegEs) - STACK_SPACE );
1084     fprintf( outfile, "\tmovw %%fs,%%ax\n" );
1085     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(SegFs) - STACK_SPACE );
1086     fprintf( outfile, "\tmovw %%gs,%%ax\n" );
1087     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(SegGs) - STACK_SPACE );
1088     fprintf( outfile, "\tmovw %%ss,%%ax\n" );
1089     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(SegSs) - STACK_SPACE );
1090     fprintf( outfile, "\tmovw %%ds,%%ax\n" );
1091     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(SegDs) - STACK_SPACE );
1092     fprintf( outfile, "\tmovw %%ax,%%es\n" );  /* set %es equal to %ds just in case */
1093
1094     fprintf( outfile, "\tmovl $0x%x,%%eax\n", CONTEXT86_FULL );
1095     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(ContextFlags) - STACK_SPACE );
1096
1097     fprintf( outfile, "\tmovl 8(%%ebp),%%eax\n" ); /* Get %eip at time of call */
1098     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(Eip) - STACK_SPACE );
1099
1100     /* Transfer the arguments */
1101
1102     fprintf( outfile, "\tmovl 4(%%ebp),%%ebx\n" );   /* get relay code addr */
1103     fprintf( outfile, "\tpushl %%esp\n" );           /* push ptr to context struct */
1104     fprintf( outfile, "\tmovzbl 4(%%ebx),%%ecx\n" ); /* fetch number of args to copy */
1105     fprintf( outfile, "\tjecxz 1f\n" );
1106     fprintf( outfile, "\tsubl %%ecx,%%esp\n" );
1107     fprintf( outfile, "\tleal 12(%%ebp),%%esi\n" );  /* get %esp at time of call */
1108     fprintf( outfile, "\tmovl %%esp,%%edi\n" );
1109     fprintf( outfile, "\tshrl $2,%%ecx\n" );
1110     fprintf( outfile, "\tcld\n" );
1111     fprintf( outfile, "\trep\n\tmovsl\n" );  /* copy args */
1112
1113     fprintf( outfile, "1:\tmovzbl 5(%%ebx),%%eax\n" ); /* fetch number of args to remove */
1114     fprintf( outfile, "\tleal 12(%%ebp,%%eax),%%eax\n" );
1115     fprintf( outfile, "\tmovl %%eax,%d(%%ebp)\n", CONTEXTOFFSET(Esp) - STACK_SPACE );
1116
1117     /* Call the entry point */
1118
1119     fprintf( outfile, "\tcall *0(%%ebx)\n" );
1120
1121     /* Store %eip and %ebp onto the new stack */
1122
1123     fprintf( outfile, "\tmovl %d(%%ebp),%%edx\n", CONTEXTOFFSET(Esp) - STACK_SPACE );
1124     fprintf( outfile, "\tmovl %d(%%ebp),%%eax\n", CONTEXTOFFSET(Eip) - STACK_SPACE );
1125     fprintf( outfile, "\tmovl %%eax,-4(%%edx)\n" );
1126     fprintf( outfile, "\tmovl %d(%%ebp),%%eax\n", CONTEXTOFFSET(Ebp) - STACK_SPACE );
1127     fprintf( outfile, "\tmovl %%eax,-8(%%edx)\n" );
1128
1129     /* Restore the context structure */
1130
1131     /* Note: we don't bother to restore %cs, %ds and %ss
1132      *       changing them in 32-bit code is a recipe for disaster anyway
1133      */
1134     fprintf( outfile, "\tmovl %d(%%ebp),%%eax\n", CONTEXTOFFSET(SegEs) - STACK_SPACE );
1135     fprintf( outfile, "\tmovw %%ax,%%es\n" );
1136     fprintf( outfile, "\tmovl %d(%%ebp),%%eax\n", CONTEXTOFFSET(SegFs) - STACK_SPACE );
1137     fprintf( outfile, "\tmovw %%ax,%%fs\n" );
1138     fprintf( outfile, "\tmovl %d(%%ebp),%%eax\n", CONTEXTOFFSET(SegGs) - STACK_SPACE );
1139     fprintf( outfile, "\tmovw %%ax,%%gs\n" );
1140
1141     fprintf( outfile, "\tmovl %d(%%ebp),%%edi\n", CONTEXTOFFSET(Edi) - STACK_SPACE );
1142     fprintf( outfile, "\tmovl %d(%%ebp),%%esi\n", CONTEXTOFFSET(Esi) - STACK_SPACE );
1143     fprintf( outfile, "\tmovl %d(%%ebp),%%edx\n", CONTEXTOFFSET(Edx) - STACK_SPACE );
1144     fprintf( outfile, "\tmovl %d(%%ebp),%%ecx\n", CONTEXTOFFSET(Ecx) - STACK_SPACE );
1145     fprintf( outfile, "\tmovl %d(%%ebp),%%ebx\n", CONTEXTOFFSET(Ebx) - STACK_SPACE );
1146
1147     fprintf( outfile, "\tmovl %d(%%ebp),%%eax\n", CONTEXTOFFSET(EFlags) - STACK_SPACE );
1148     fprintf( outfile, "\tpushl %%eax\n" );
1149     fprintf( outfile, "\tpopfl\n" );
1150     fprintf( outfile, "\tmovl %d(%%ebp),%%eax\n", CONTEXTOFFSET(Eax) - STACK_SPACE );
1151
1152     fprintf( outfile, "\tmovl %d(%%ebp),%%ebp\n", CONTEXTOFFSET(Esp) - STACK_SPACE );
1153     fprintf( outfile, "\tleal -8(%%ebp),%%esp\n" );
1154     fprintf( outfile, "\tpopl %%ebp\n" );
1155     fprintf( outfile, "\tret\n" );
1156 }
1157
1158
1159 /*******************************************************************
1160  *         BuildRelays16
1161  *
1162  * Build all the 16-bit relay callbacks
1163  */
1164 void BuildRelays16( FILE *outfile )
1165 {
1166     char buffer[1024];
1167
1168     /* File header */
1169
1170     fprintf( outfile, "/* File generated automatically. Do not edit! */\n\n" );
1171     fprintf( outfile, "\t.text\n" );
1172
1173     if (output_file_name && use_stabs)
1174     {
1175         getcwd(buffer, sizeof(buffer));
1176         fprintf( outfile, "\t.file\t\"%s\"\n", output_file_name );
1177
1178         /*
1179          * The stabs help the internal debugger as they are an indication that it
1180          * is sensible to step into a thunk/trampoline.
1181          */
1182         fprintf( outfile, ".stabs \"%s/\",100,0,0,Code_Start\n", buffer);
1183         fprintf( outfile, ".stabs \"%s\",100,0,0,Code_Start\n", output_file_name );
1184         fprintf( outfile, "Code_Start:\n\n" );
1185     }
1186
1187     fprintf( outfile, __ASM_NAME("Call16_Start") ":\n" );
1188     fprintf( outfile, "\t.globl " __ASM_NAME("Call16_Start") "\n" );
1189     fprintf( outfile, "\t.byte 0\n\n" );
1190
1191     /* Standard CallFrom16 routine (WORD return) */
1192     BuildCallFrom16Core( outfile, FALSE, FALSE, TRUE );
1193
1194     /* Standard CallFrom16 routine (DWORD return) */
1195     BuildCallFrom16Core( outfile, FALSE, FALSE, FALSE );
1196
1197     /* Register CallFrom16 routine */
1198     BuildCallFrom16Core( outfile, TRUE, FALSE, FALSE );
1199
1200     /* C16ThkSL CallFrom16 routine */
1201     BuildCallFrom16Core( outfile, FALSE, TRUE, FALSE );
1202
1203     /* Standard CallTo16 routine (WORD return) */
1204     BuildCallTo16Core( outfile, TRUE, FALSE );
1205
1206     /* Standard CallTo16 routine (DWORD return) */
1207     BuildCallTo16Core( outfile, FALSE, FALSE );
1208
1209     /* Register CallTo16 routine (16:16 retf) */
1210     BuildCallTo16Core( outfile, FALSE, 1 );
1211
1212     /* Register CallTo16 routine (16:32 retf) */
1213     BuildCallTo16Core( outfile, FALSE, 2 );
1214
1215     /* CBClientThunkSL routine */
1216     BuildCallTo32CBClient( outfile, FALSE );
1217
1218     /* CBClientThunkSLEx routine */
1219     BuildCallTo32CBClient( outfile, TRUE  );
1220
1221     fprintf( outfile, __ASM_NAME("Call16_End") ":\n" );
1222     fprintf( outfile, "\t.globl " __ASM_NAME("Call16_End") "\n" );
1223
1224     if (use_stabs)
1225     {
1226         fprintf( outfile, "\t.stabs \"\",100,0,0,.Letext\n");
1227         fprintf( outfile, ".Letext:\n");
1228
1229         /* Some versions of gdb need to have the filename data for
1230            each section, so output it again for the data section. */
1231         if (output_file_name)
1232         {
1233             fprintf( outfile, ".stabs \"%s/\",100,0,0,Data_Start\n", buffer);
1234             fprintf( outfile, ".stabs \"%s\",100,0,0,Data_Start\n", output_file_name );
1235             fprintf( outfile, "Data_Start:\n\n" );
1236         }
1237     }
1238
1239     /* The whole Call16_Ret segment must lie within the .data section */
1240     fprintf( outfile, "\n\t.data\n" );
1241     fprintf( outfile, "\t.globl " __ASM_NAME("Call16_Ret_Start") "\n" );
1242     fprintf( outfile, __ASM_NAME("Call16_Ret_Start") ":\n" );
1243
1244     /* Standard CallTo16 return stub */
1245     BuildRet16Func( outfile );
1246
1247     /* CBClientThunkSL return stub */
1248     BuildCallTo32CBClientRet( outfile, FALSE );
1249
1250     /* CBClientThunkSLEx return stub */
1251     BuildCallTo32CBClientRet( outfile, TRUE  );
1252
1253     /* End of Call16_Ret segment */
1254     fprintf( outfile, "\n\t.globl " __ASM_NAME("Call16_Ret_End") "\n" );
1255     fprintf( outfile, __ASM_NAME("Call16_Ret_End") ":\n" );
1256 }
1257
1258 /*******************************************************************
1259  *         BuildRelays32
1260  *
1261  * Build all the 32-bit relay callbacks
1262  */
1263 void BuildRelays32( FILE *outfile )
1264 {
1265     /* File header */
1266
1267     fprintf( outfile, "/* File generated automatically. Do not edit! */\n\n" );
1268     fprintf( outfile, "\t.text\n" );
1269
1270     if (output_file_name && use_stabs)
1271     {
1272         char buffer[1024];
1273         getcwd(buffer, sizeof(buffer));
1274         fprintf( outfile, "\t.file\t\"%s\"\n", output_file_name );
1275
1276         /*
1277          * The stabs help the internal debugger as they are an indication that it
1278          * is sensible to step into a thunk/trampoline.
1279          */
1280         fprintf( outfile, ".stabs \"%s/\",100,0,0,Code_Start\n", buffer);
1281         fprintf( outfile, ".stabs \"%s\",100,0,0,Code_Start\n", output_file_name );
1282         fprintf( outfile, "Code_Start:\n\n" );
1283     }
1284
1285     /* 32-bit register entry point */
1286     BuildCallFrom32Regs( outfile );
1287
1288     if (use_stabs)
1289     {
1290         fprintf( outfile, "\t.stabs \"\",100,0,0,.Letext\n");
1291         fprintf( outfile, ".Letext:\n");
1292     }
1293 }
1294
1295 #else /* __i386__ */
1296
1297 void BuildRelays16( FILE *outfile )
1298 {
1299     fprintf( outfile, "/* File not used with this architecture. Do not edit! */\n\n" );
1300 }
1301
1302 void BuildRelays32( FILE *outfile )
1303 {
1304     fprintf( outfile, "/* File not used with this architecture. Do not edit! */\n\n" );
1305 }
1306
1307 #endif  /* __i386__ */