Fix another error under Win9x (hopefully).
[wine] / dlls / kernel / thunk.c
1 /*
2  * KERNEL32 thunks and other undocumented stuff
3  *
4  * Copyright 1996, 1997 Alexandre Julliard
5  * Copyright 1997, 1998 Marcus Meissner
6  * Copyright 1998       Ulrich Weigand
7  *
8  * This library is free software; you can redistribute it and/or
9  * modify it under the terms of the GNU Lesser General Public
10  * License as published by the Free Software Foundation; either
11  * version 2.1 of the License, or (at your option) any later version.
12  *
13  * This library is distributed in the hope that it will be useful,
14  * but WITHOUT ANY WARRANTY; without even the implied warranty of
15  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
16  * Lesser General Public License for more details.
17  *
18  * You should have received a copy of the GNU Lesser General Public
19  * License along with this library; if not, write to the Free Software
20  * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
21  */
22
23 #include "config.h"
24
25 #include <string.h>
26 #include <sys/types.h>
27 #include <stdarg.h>
28 #include <stdio.h>
29 #ifdef HAVE_UNISTD_H
30 # include <unistd.h>
31 #endif
32
33 #include "windef.h"
34 #include "winbase.h"
35 #include "winerror.h"
36 #include "winreg.h"
37 #include "winternl.h"
38 #include "wownt32.h"
39 #include "wine/winbase16.h"
40
41 #include "wine/debug.h"
42 #include "wine/library.h"
43 #include "flatthunk.h"
44 #include "module.h"
45 #include "miscemu.h"
46 #include "selectors.h"
47 #include "stackframe.h"
48 #include "task.h"
49
50 WINE_DEFAULT_DEBUG_CHANNEL(thunk);
51
52 #ifdef __i386__
53 extern void __wine_call_from_16_thunk();
54 #else
55 static void __wine_call_from_16_thunk() { }
56 #endif
57
58 /* Push a DWORD on the 32-bit stack */
59 static inline void stack32_push( CONTEXT86 *context, DWORD val )
60 {
61     context->Esp -= sizeof(DWORD);
62     *(DWORD *)context->Esp = val;
63 }
64
65 /* Pop a DWORD from the 32-bit stack */
66 static inline DWORD stack32_pop( CONTEXT86 *context )
67 {
68     DWORD ret = *(DWORD *)context->Esp;
69     context->Esp += sizeof(DWORD);
70     return ret;
71 }
72
73 /***********************************************************************
74  *                                                                     *
75  *                 Win95 internal thunks                               *
76  *                                                                     *
77  ***********************************************************************/
78
79 /***********************************************************************
80  *           LogApiThk    (KERNEL.423)
81  */
82 void WINAPI LogApiThk( LPSTR func )
83 {
84     TRACE( "%s\n", debugstr_a(func) );
85 }
86
87 /***********************************************************************
88  *           LogApiThkLSF    (KERNEL32.42)
89  *
90  * NOTE: needs to preserve all registers!
91  */
92 void WINAPI LogApiThkLSF( LPSTR func, CONTEXT86 *context )
93 {
94     TRACE( "%s\n", debugstr_a(func) );
95 }
96
97 /***********************************************************************
98  *           LogApiThkSL    (KERNEL32.44)
99  *
100  * NOTE: needs to preserve all registers!
101  */
102 void WINAPI LogApiThkSL( LPSTR func, CONTEXT86 *context )
103 {
104     TRACE( "%s\n", debugstr_a(func) );
105 }
106
107 /***********************************************************************
108  *           LogCBThkSL    (KERNEL32.47)
109  *
110  * NOTE: needs to preserve all registers!
111  */
112 void WINAPI LogCBThkSL( LPSTR func, CONTEXT86 *context )
113 {
114     TRACE( "%s\n", debugstr_a(func) );
115 }
116
117 /***********************************************************************
118  * Generates a FT_Prolog call.
119  *
120  *  0FB6D1                  movzbl edx,cl
121  *  8B1495xxxxxxxx          mov edx,[4*edx + targetTable]
122  *  68xxxxxxxx              push FT_Prolog
123  *  C3                      lret
124  */
125 static void _write_ftprolog(LPBYTE relayCode ,DWORD *targetTable) {
126         LPBYTE  x;
127
128         x       = relayCode;
129         *x++    = 0x0f;*x++=0xb6;*x++=0xd1; /* movzbl edx,cl */
130         *x++    = 0x8B;*x++=0x14;*x++=0x95;*(DWORD**)x= targetTable;
131         x+=4;   /* mov edx, [4*edx + targetTable] */
132         *x++    = 0x68; *(DWORD*)x = (DWORD)GetProcAddress(GetModuleHandleA("KERNEL32"),"FT_Prolog");
133         x+=4;   /* push FT_Prolog */
134         *x++    = 0xC3;         /* lret */
135         /* fill rest with 0xCC / int 3 */
136 }
137
138 /***********************************************************************
139  *      _write_qtthunk                                  (internal)
140  * Generates a QT_Thunk style call.
141  *
142  *  33C9                    xor ecx, ecx
143  *  8A4DFC                  mov cl , [ebp-04]
144  *  8B148Dxxxxxxxx          mov edx, [4*ecx + targetTable]
145  *  B8yyyyyyyy              mov eax, QT_Thunk
146  *  FFE0                    jmp eax
147  */
148 static void _write_qtthunk(
149         LPBYTE relayCode,       /* [in] start of QT_Thunk stub */
150         DWORD *targetTable      /* [in] start of thunk (for index lookup) */
151 ) {
152         LPBYTE  x;
153
154         x       = relayCode;
155         *x++    = 0x33;*x++=0xC9; /* xor ecx,ecx */
156         *x++    = 0x8A;*x++=0x4D;*x++=0xFC; /* movb cl,[ebp-04] */
157         *x++    = 0x8B;*x++=0x14;*x++=0x8D;*(DWORD**)x= targetTable;
158         x+=4;   /* mov edx, [4*ecx + targetTable */
159         *x++    = 0xB8; *(DWORD*)x = (DWORD)GetProcAddress(GetModuleHandleA("KERNEL32"),"QT_Thunk");
160         x+=4;   /* mov eax , QT_Thunk */
161         *x++    = 0xFF; *x++ = 0xE0;    /* jmp eax */
162         /* should fill the rest of the 32 bytes with 0xCC */
163 }
164
165 /***********************************************************************
166  *           _loadthunk
167  */
168 static LPVOID _loadthunk(LPCSTR module, LPCSTR func, LPCSTR module32,
169                          struct ThunkDataCommon *TD32, DWORD checksum)
170 {
171     struct ThunkDataCommon *TD16;
172     HMODULE16 hmod;
173     int ordinal;
174
175     if ((hmod = LoadLibrary16(module)) <= 32)
176     {
177         ERR("(%s, %s, %s): Unable to load '%s', error %d\n",
178                    module, func, module32, module, hmod);
179         return 0;
180     }
181
182     if (   !(ordinal = NE_GetOrdinal(hmod, func))
183         || !(TD16 = MapSL((SEGPTR)NE_GetEntryPointEx(hmod, ordinal, FALSE))))
184     {
185         ERR("Unable to find thunk data '%s' in %s, required by %s (conflicting/incorrect DLL versions !?).\n",
186                    func, module, module32);
187         return 0;
188     }
189
190     if (TD32 && memcmp(TD16->magic, TD32->magic, 4))
191     {
192         ERR("(%s, %s, %s): Bad magic %c%c%c%c (should be %c%c%c%c)\n",
193                    module, func, module32,
194                    TD16->magic[0], TD16->magic[1], TD16->magic[2], TD16->magic[3],
195                    TD32->magic[0], TD32->magic[1], TD32->magic[2], TD32->magic[3]);
196         return 0;
197     }
198
199     if (TD32 && TD16->checksum != TD32->checksum)
200     {
201         ERR("(%s, %s, %s): Wrong checksum %08lx (should be %08lx)\n",
202                    module, func, module32, TD16->checksum, TD32->checksum);
203         return 0;
204     }
205
206     if (!TD32 && checksum && checksum != *(LPDWORD)TD16)
207     {
208         ERR("(%s, %s, %s): Wrong checksum %08lx (should be %08lx)\n",
209                    module, func, module32, *(LPDWORD)TD16, checksum);
210         return 0;
211     }
212
213     return TD16;
214 }
215
216 /***********************************************************************
217  *           GetThunkStuff    (KERNEL32.53)
218  */
219 LPVOID WINAPI GetThunkStuff(LPSTR module, LPSTR func)
220 {
221     return _loadthunk(module, func, "<kernel>", NULL, 0L);
222 }
223
224 /***********************************************************************
225  *           GetThunkBuff    (KERNEL32.52)
226  * Returns a pointer to ThkBuf in the 16bit library SYSTHUNK.DLL.
227  */
228 LPVOID WINAPI GetThunkBuff(void)
229 {
230     return GetThunkStuff("SYSTHUNK.DLL", "ThkBuf");
231 }
232
233 /***********************************************************************
234  *              ThunkConnect32          (KERNEL32.@)
235  * Connects a 32bit and a 16bit thunkbuffer.
236  */
237 UINT WINAPI ThunkConnect32(
238         struct ThunkDataCommon *TD,  /* [in/out] thunkbuffer */
239         LPSTR thunkfun16,            /* [in] win16 thunkfunction */
240         LPSTR module16,              /* [in] name of win16 dll */
241         LPSTR module32,              /* [in] name of win32 dll */
242         HMODULE hmod32,            /* [in] hmodule of win32 dll */
243         DWORD dwReason               /* [in] initialisation argument */
244 ) {
245     BOOL directionSL;
246
247     if (!strncmp(TD->magic, "SL01", 4))
248     {
249         directionSL = TRUE;
250
251         TRACE("SL01 thunk %s (%lx) <- %s (%s), Reason: %ld\n",
252                      module32, (DWORD)TD, module16, thunkfun16, dwReason);
253     }
254     else if (!strncmp(TD->magic, "LS01", 4))
255     {
256         directionSL = FALSE;
257
258         TRACE("LS01 thunk %s (%lx) -> %s (%s), Reason: %ld\n",
259                      module32, (DWORD)TD, module16, thunkfun16, dwReason);
260     }
261     else
262     {
263         ERR("Invalid magic %c%c%c%c\n",
264                    TD->magic[0], TD->magic[1], TD->magic[2], TD->magic[3]);
265         return 0;
266     }
267
268     switch (dwReason)
269     {
270         case DLL_PROCESS_ATTACH:
271         {
272             struct ThunkDataCommon *TD16;
273             if (!(TD16 = _loadthunk(module16, thunkfun16, module32, TD, 0L)))
274                 return 0;
275
276             if (directionSL)
277             {
278                 struct ThunkDataSL32 *SL32 = (struct ThunkDataSL32 *)TD;
279                 struct ThunkDataSL16 *SL16 = (struct ThunkDataSL16 *)TD16;
280                 struct SLTargetDB *tdb;
281
282                 if (SL16->fpData == NULL)
283                 {
284                     ERR("ThunkConnect16 was not called!\n");
285                     return 0;
286                 }
287
288                 SL32->data = SL16->fpData;
289
290                 tdb = HeapAlloc(GetProcessHeap(), 0, sizeof(*tdb));
291                 tdb->process = GetCurrentProcessId();
292                 tdb->targetTable = (DWORD *)(thunkfun16 + SL32->offsetTargetTable);
293
294                 tdb->next = SL32->data->targetDB;   /* FIXME: not thread-safe! */
295                 SL32->data->targetDB = tdb;
296
297                 TRACE("Process %08lx allocated TargetDB entry for ThunkDataSL %08lx\n",
298                              GetCurrentProcessId(), (DWORD)SL32->data);
299             }
300             else
301             {
302                 struct ThunkDataLS32 *LS32 = (struct ThunkDataLS32 *)TD;
303                 struct ThunkDataLS16 *LS16 = (struct ThunkDataLS16 *)TD16;
304
305                 LS32->targetTable = MapSL(LS16->targetTable);
306
307                 /* write QT_Thunk and FT_Prolog stubs */
308                 _write_qtthunk ((LPBYTE)TD + LS32->offsetQTThunk,  LS32->targetTable);
309                 _write_ftprolog((LPBYTE)TD + LS32->offsetFTProlog, LS32->targetTable);
310             }
311             break;
312         }
313
314         case DLL_PROCESS_DETACH:
315             /* FIXME: cleanup */
316             break;
317     }
318
319     return 1;
320 }
321
322 /**********************************************************************
323  *              QT_Thunk                        (KERNEL32.@)
324  *
325  * The target address is in EDX.
326  * The 16bit arguments start at ESP.
327  * The number of 16bit argument bytes is EBP-ESP-0x40 (64 Byte thunksetup).
328  * So the stack layout is 16bit argument bytes and then the 64 byte
329  * scratch buffer.
330  * The scratch buffer is used as work space by Windows' QT_Thunk
331  * function.
332  * As the programs unfortunately don't always provide a fixed size
333  * scratch buffer (danger, stack corruption ahead !!), we simply resort
334  * to copying over the whole EBP-ESP range to the 16bit stack
335  * (as there's no way to safely figure out the param count
336  * due to this misbehaviour of some programs).
337  * [ok]
338  *
339  * See DDJ article 9614c for a very good description of QT_Thunk (also
340  * available online !).
341  *
342  * FIXME: DDJ talks of certain register usage rules; I'm not sure
343  * whether we cover this 100%.
344  */
345 void WINAPI QT_Thunk( CONTEXT86 *context )
346 {
347     CONTEXT86 context16;
348     DWORD argsize;
349
350     memcpy(&context16,context,sizeof(context16));
351
352     context16.SegCs = HIWORD(context->Edx);
353     context16.Eip   = LOWORD(context->Edx);
354     /* point EBP to the STACK16FRAME on the stack
355      * for the call_to_16 to set up the register content on calling */
356     context16.Ebp   = OFFSETOF( NtCurrentTeb()->cur_stack )
357                            + (WORD)&((STACK16FRAME*)0)->bp;
358
359     /*
360      * used to be (problematic):
361      * argsize = context->Ebp - context->Esp - 0x40;
362      * due to some programs abusing the API, we better assume the full
363      * EBP - ESP range for copying instead: */
364     argsize = context->Ebp - context->Esp;
365
366     /* ok, too much is insane; let's limit param count a bit again */
367     if (argsize > 64)
368         argsize = 64; /* 32 WORDs */
369
370     WOWCallback16Ex( 0, WCB16_REGS, argsize, (void *)context->Esp, (DWORD *)&context16 );
371     context->Eax = context16.Eax;
372     context->Edx = context16.Edx;
373     context->Ecx = context16.Ecx;
374
375     /* make sure to update the Win32 ESP, too, in order to throw away
376      * the number of parameters that the Win16 function
377      * accepted (that it popped from the corresponding Win16 stack) */
378     context->Esp +=   LOWORD(context16.Esp) -
379                         ( OFFSETOF( NtCurrentTeb()->cur_stack ) - argsize );
380 }
381
382
383 /**********************************************************************
384  *              FT_Prolog                       (KERNEL32.@)
385  *
386  * The set of FT_... thunk routines is used instead of QT_Thunk,
387  * if structures have to be converted from 32-bit to 16-bit
388  * (change of member alignment, conversion of members).
389  *
390  * The thunk function (as created by the thunk compiler) calls
391  * FT_Prolog at the beginning, to set up a stack frame and
392  * allocate a 64 byte buffer on the stack.
393  * The input parameters (target address and some flags) are
394  * saved for later use by FT_Thunk.
395  *
396  * Input:  EDX  16-bit target address (SEGPTR)
397  *         CX   bits  0..7   target number (in target table)
398  *              bits  8..9   some flags (unclear???)
399  *              bits 10..15  number of DWORD arguments
400  *
401  * Output: A new stackframe is created, and a 64 byte buffer
402  *         allocated on the stack. The layout of the stack
403  *         on return is as follows:
404  *
405  *  (ebp+4)  return address to caller of thunk function
406  *  (ebp)    old EBP
407  *  (ebp-4)  saved EBX register of caller
408  *  (ebp-8)  saved ESI register of caller
409  *  (ebp-12) saved EDI register of caller
410  *  (ebp-16) saved ECX register, containing flags
411  *  (ebp-20) bitmap containing parameters that are to be converted
412  *           by FT_Thunk; it is initialized to 0 by FT_Prolog and
413  *           filled in by the thunk code before calling FT_Thunk
414  *  (ebp-24)
415  *    ...    (unclear)
416  *  (ebp-44)
417  *  (ebp-48) saved EAX register of caller (unclear, never restored???)
418  *  (ebp-52) saved EDX register, containing 16-bit thunk target
419  *  (ebp-56)
420  *    ...    (unclear)
421  *  (ebp-64)
422  *
423  *  ESP is EBP-64 after return.
424  *
425  */
426
427 void WINAPI FT_Prolog( CONTEXT86 *context )
428 {
429     /* Build stack frame */
430     stack32_push(context, context->Ebp);
431     context->Ebp = context->Esp;
432
433     /* Allocate 64-byte Thunk Buffer */
434     context->Esp -= 64;
435     memset((char *)context->Esp, '\0', 64);
436
437     /* Store Flags (ECX) and Target Address (EDX) */
438     /* Save other registers to be restored later */
439     *(DWORD *)(context->Ebp -  4) = context->Ebx;
440     *(DWORD *)(context->Ebp -  8) = context->Esi;
441     *(DWORD *)(context->Ebp - 12) = context->Edi;
442     *(DWORD *)(context->Ebp - 16) = context->Ecx;
443
444     *(DWORD *)(context->Ebp - 48) = context->Eax;
445     *(DWORD *)(context->Ebp - 52) = context->Edx;
446 }
447
448 /**********************************************************************
449  *              FT_Thunk                        (KERNEL32.@)
450  *
451  * This routine performs the actual call to 16-bit code,
452  * similar to QT_Thunk. The differences are:
453  *  - The call target is taken from the buffer created by FT_Prolog
454  *  - Those arguments requested by the thunk code (by setting the
455  *    corresponding bit in the bitmap at EBP-20) are converted
456  *    from 32-bit pointers to segmented pointers (those pointers
457  *    are guaranteed to point to structures copied to the stack
458  *    by the thunk code, so we always use the 16-bit stack selector
459  *    for those addresses).
460  *
461  *    The bit #i of EBP-20 corresponds here to the DWORD starting at
462  *    ESP+4 + 2*i.
463  *
464  * FIXME: It is unclear what happens if there are more than 32 WORDs
465  *        of arguments, so that the single DWORD bitmap is no longer
466  *        sufficient ...
467  */
468
469 void WINAPI FT_Thunk( CONTEXT86 *context )
470 {
471     DWORD mapESPrelative = *(DWORD *)(context->Ebp - 20);
472     DWORD callTarget     = *(DWORD *)(context->Ebp - 52);
473
474     CONTEXT86 context16;
475     DWORD i, argsize;
476     DWORD newstack[32];
477     LPBYTE oldstack;
478
479     memcpy(&context16,context,sizeof(context16));
480
481     context16.SegCs = HIWORD(callTarget);
482     context16.Eip   = LOWORD(callTarget);
483     context16.Ebp   = OFFSETOF( NtCurrentTeb()->cur_stack )
484                            + (WORD)&((STACK16FRAME*)0)->bp;
485
486     argsize  = context->Ebp-context->Esp-0x40;
487     if (argsize > sizeof(newstack)) argsize = sizeof(newstack);
488     oldstack = (LPBYTE)context->Esp;
489
490     memcpy( newstack, oldstack, argsize );
491
492     for (i = 0; i < 32; i++)    /* NOTE: What about > 32 arguments? */
493         if (mapESPrelative & (1 << i))
494         {
495             SEGPTR *arg = (SEGPTR *)newstack[i];
496             *arg = MAKESEGPTR(SELECTOROF(NtCurrentTeb()->cur_stack),
497                               OFFSETOF(NtCurrentTeb()->cur_stack) - argsize
498                               + (*(LPBYTE *)arg - oldstack));
499         }
500
501     WOWCallback16Ex( 0, WCB16_REGS, argsize, newstack, (DWORD *)&context16 );
502     context->Eax = context16.Eax;
503     context->Edx = context16.Edx;
504     context->Ecx = context16.Ecx;
505
506     context->Esp +=   LOWORD(context16.Esp) -
507                         ( OFFSETOF( NtCurrentTeb()->cur_stack ) - argsize );
508
509     /* Copy modified buffers back to 32-bit stack */
510     memcpy( oldstack, newstack, argsize );
511 }
512
513 /**********************************************************************
514  *              FT_ExitNN               (KERNEL32.218 - 232)
515  *
516  * One of the FT_ExitNN functions is called at the end of the thunk code.
517  * It removes the stack frame created by FT_Prolog, moves the function
518  * return from EBX to EAX (yes, FT_Thunk did use EAX for the return
519  * value, but the thunk code has moved it from EAX to EBX in the
520  * meantime ... :-), restores the caller's EBX, ESI, and EDI registers,
521  * and perform a return to the CALLER of the thunk code (while removing
522  * the given number of arguments from the caller's stack).
523  */
524
525 static void FT_Exit(CONTEXT86 *context, int nPopArgs)
526 {
527     /* Return value is in EBX */
528     context->Eax = context->Ebx;
529
530     /* Restore EBX, ESI, and EDI registers */
531     context->Ebx = *(DWORD *)(context->Ebp -  4);
532     context->Esi = *(DWORD *)(context->Ebp -  8);
533     context->Edi = *(DWORD *)(context->Ebp - 12);
534
535     /* Clean up stack frame */
536     context->Esp = context->Ebp;
537     context->Ebp = stack32_pop(context);
538
539     /* Pop return address to CALLER of thunk code */
540     context->Eip = stack32_pop(context);
541     /* Remove arguments */
542     context->Esp += nPopArgs;
543 }
544
545 /***********************************************************************
546  *              FT_Exit0 (KERNEL32.@)
547  */
548 void WINAPI FT_Exit0 (CONTEXT86 *context) { FT_Exit(context,  0); }
549
550 /***********************************************************************
551  *              FT_Exit4 (KERNEL32.@)
552  */
553 void WINAPI FT_Exit4 (CONTEXT86 *context) { FT_Exit(context,  4); }
554
555 /***********************************************************************
556  *              FT_Exit8 (KERNEL32.@)
557  */
558 void WINAPI FT_Exit8 (CONTEXT86 *context) { FT_Exit(context,  8); }
559
560 /***********************************************************************
561  *              FT_Exit12 (KERNEL32.@)
562  */
563 void WINAPI FT_Exit12(CONTEXT86 *context) { FT_Exit(context, 12); }
564
565 /***********************************************************************
566  *              FT_Exit16 (KERNEL32.@)
567  */
568 void WINAPI FT_Exit16(CONTEXT86 *context) { FT_Exit(context, 16); }
569
570 /***********************************************************************
571  *              FT_Exit20 (KERNEL32.@)
572  */
573 void WINAPI FT_Exit20(CONTEXT86 *context) { FT_Exit(context, 20); }
574
575 /***********************************************************************
576  *              FT_Exit24 (KERNEL32.@)
577  */
578 void WINAPI FT_Exit24(CONTEXT86 *context) { FT_Exit(context, 24); }
579
580 /***********************************************************************
581  *              FT_Exit28 (KERNEL32.@)
582  */
583 void WINAPI FT_Exit28(CONTEXT86 *context) { FT_Exit(context, 28); }
584
585 /***********************************************************************
586  *              FT_Exit32 (KERNEL32.@)
587  */
588 void WINAPI FT_Exit32(CONTEXT86 *context) { FT_Exit(context, 32); }
589
590 /***********************************************************************
591  *              FT_Exit36 (KERNEL32.@)
592  */
593 void WINAPI FT_Exit36(CONTEXT86 *context) { FT_Exit(context, 36); }
594
595 /***********************************************************************
596  *              FT_Exit40 (KERNEL32.@)
597  */
598 void WINAPI FT_Exit40(CONTEXT86 *context) { FT_Exit(context, 40); }
599
600 /***********************************************************************
601  *              FT_Exit44 (KERNEL32.@)
602  */
603 void WINAPI FT_Exit44(CONTEXT86 *context) { FT_Exit(context, 44); }
604
605 /***********************************************************************
606  *              FT_Exit48 (KERNEL32.@)
607  */
608 void WINAPI FT_Exit48(CONTEXT86 *context) { FT_Exit(context, 48); }
609
610 /***********************************************************************
611  *              FT_Exit52 (KERNEL32.@)
612  */
613 void WINAPI FT_Exit52(CONTEXT86 *context) { FT_Exit(context, 52); }
614
615 /***********************************************************************
616  *              FT_Exit56 (KERNEL32.@)
617  */
618 void WINAPI FT_Exit56(CONTEXT86 *context) { FT_Exit(context, 56); }
619
620 /***********************************************************************
621  *              ThunkInitLS     (KERNEL32.43)
622  * A thunkbuffer link routine
623  * The thunkbuf looks like:
624  *
625  *      00: DWORD       length          ? don't know exactly
626  *      04: SEGPTR      ptr             ? where does it point to?
627  * The pointer ptr is written into the first DWORD of 'thunk'.
628  * (probably correctly implemented)
629  * [ok probably]
630  * RETURNS
631  *      segmented pointer to thunk?
632  */
633 DWORD WINAPI ThunkInitLS(
634         LPDWORD thunk,  /* [in] win32 thunk */
635         LPCSTR thkbuf,  /* [in] thkbuffer name in win16 dll */
636         DWORD len,      /* [in] thkbuffer length */
637         LPCSTR dll16,   /* [in] name of win16 dll */
638         LPCSTR dll32    /* [in] name of win32 dll (FIXME: not used?) */
639 ) {
640         LPDWORD         addr;
641
642         if (!(addr = _loadthunk( dll16, thkbuf, dll32, NULL, len )))
643                 return 0;
644
645         if (!addr[1])
646                 return 0;
647         *(DWORD*)thunk = addr[1];
648
649         return addr[1];
650 }
651
652 /***********************************************************************
653  *              Common32ThkLS   (KERNEL32.45)
654  *
655  * This is another 32->16 thunk, independent of the QT_Thunk/FT_Thunk
656  * style thunks. The basic difference is that the parameter conversion
657  * is done completely on the *16-bit* side here. Thus we do not call
658  * the 16-bit target directly, but call a common entry point instead.
659  * This entry function then calls the target according to the target
660  * number passed in the DI register.
661  *
662  * Input:  EAX    SEGPTR to the common 16-bit entry point
663  *         CX     offset in thunk table (target number * 4)
664  *         DX     error return value if execution fails (unclear???)
665  *         EDX.HI number of DWORD parameters
666  *
667  * (Note that we need to move the thunk table offset from CX to DI !)
668  *
669  * The called 16-bit stub expects its stack to look like this:
670  *     ...
671  *   (esp+40)  32-bit arguments
672  *     ...
673  *   (esp+8)   32 byte of stack space available as buffer
674  *   (esp)     8 byte return address for use with 0x66 lret
675  *
676  * The called 16-bit stub uses a 0x66 lret to return to 32-bit code,
677  * and uses the EAX register to return a DWORD return value.
678  * Thus we need to use a special assembly glue routine
679  * (CallRegisterLongProc instead of CallRegisterShortProc).
680  *
681  * Finally, we return to the caller, popping the arguments off
682  * the stack.  The number of arguments to be popped is returned
683  * in the BL register by the called 16-bit routine.
684  *
685  */
686 void WINAPI Common32ThkLS( CONTEXT86 *context )
687 {
688     CONTEXT86 context16;
689     DWORD argsize;
690
691     memcpy(&context16,context,sizeof(context16));
692
693     context16.Edi   = LOWORD(context->Ecx);
694     context16.SegCs = HIWORD(context->Eax);
695     context16.Eip   = LOWORD(context->Eax);
696     context16.Ebp   = OFFSETOF( NtCurrentTeb()->cur_stack )
697                            + (WORD)&((STACK16FRAME*)0)->bp;
698
699     argsize = HIWORD(context->Edx) * 4;
700
701     /* FIXME: hack for stupid USER32 CallbackGlueLS routine */
702     if (context->Edx == context->Eip)
703         argsize = 6 * 4;
704
705     /* Note: the first 32 bytes we copy are just garbage from the 32-bit stack, in order to reserve
706      *       the space. It is safe to do that since the register function prefix has reserved
707      *       a lot more space than that below context->Esp.
708      */
709     WOWCallback16Ex( 0, WCB16_REGS, argsize + 32, (LPBYTE)context->Esp - 32, (DWORD *)&context16 );
710     context->Eax = context16.Eax;
711
712     /* Clean up caller's stack frame */
713     context->Esp += BL_reg(&context16);
714 }
715
716 /***********************************************************************
717  *              OT_32ThkLSF     (KERNEL32.40)
718  *
719  * YET Another 32->16 thunk. The difference to Common32ThkLS is that
720  * argument processing is done on both the 32-bit and the 16-bit side:
721  * The 32-bit side prepares arguments, copying them onto the stack.
722  *
723  * When this routine is called, the first word on the stack is the
724  * number of argument bytes prepared by the 32-bit code, and EDX
725  * contains the 16-bit target address.
726  *
727  * The called 16-bit routine is another relaycode, doing further
728  * argument processing and then calling the real 16-bit target
729  * whose address is stored at [bp-04].
730  *
731  * The call proceeds using a normal CallRegisterShortProc.
732  * After return from the 16-bit relaycode, the arguments need
733  * to be copied *back* to the 32-bit stack, since the 32-bit
734  * relaycode processes output parameters.
735  *
736  * Note that we copy twice the number of arguments, since some of the
737  * 16-bit relaycodes in SYSTHUNK.DLL directly access the original
738  * arguments of the caller!
739  *
740  * (Note that this function seems only to be used for
741  *  OLECLI32 -> OLECLI and OLESVR32 -> OLESVR thunking.)
742  */
743 void WINAPI OT_32ThkLSF( CONTEXT86 *context )
744 {
745     CONTEXT86 context16;
746     DWORD argsize;
747
748     memcpy(&context16,context,sizeof(context16));
749
750     context16.SegCs = HIWORD(context->Edx);
751     context16.Eip   = LOWORD(context->Edx);
752     context16.Ebp   = OFFSETOF( NtCurrentTeb()->cur_stack )
753                            + (WORD)&((STACK16FRAME*)0)->bp;
754
755     argsize = 2 * *(WORD *)context->Esp + 2;
756
757     WOWCallback16Ex( 0, WCB16_REGS, argsize, (void *)context->Esp, (DWORD *)&context16 );
758     context->Eax = context16.Eax;
759     context->Edx = context16.Edx;
760
761     /* Copy modified buffers back to 32-bit stack */
762     memcpy( (LPBYTE)context->Esp,
763             (LPBYTE)CURRENT_STACK16 - argsize, argsize );
764
765     context->Esp +=   LOWORD(context16.Esp) -
766                         ( OFFSETOF( NtCurrentTeb()->cur_stack ) - argsize );
767 }
768
769 /***********************************************************************
770  *              ThunkInitLSF            (KERNEL32.41)
771  * A thunk setup routine.
772  * Expects a pointer to a preinitialized thunkbuffer in the first argument
773  * looking like:
774  *|     00..03:         unknown (pointer, check _41, _43, _46)
775  *|     04: EB1E                jmp +0x20
776  *|
777  *|     06..23:         unknown (space for replacement code, check .90)
778  *|
779  *|     24:>E800000000          call offset 29
780  *|     29:>58                  pop eax            ( target of call )
781  *|     2A: 2D25000000          sub eax,0x00000025 ( now points to offset 4 )
782  *|     2F: BAxxxxxxxx          mov edx,xxxxxxxx
783  *|     34: 68yyyyyyyy          push KERNEL32.90
784  *|     39: C3                  ret
785  *|
786  *|     3A: EB1E                jmp +0x20
787  *|     3E ... 59:      unknown (space for replacement code?)
788  *|     5A: E8xxxxxxxx          call <32bitoffset xxxxxxxx>
789  *|     5F: 5A                  pop edx
790  *|     60: 81EA25xxxxxx        sub edx, 0x25xxxxxx
791  *|     66: 52                  push edx
792  *|     67: 68xxxxxxxx          push xxxxxxxx
793  *|     6C: 68yyyyyyyy          push KERNEL32.89
794  *|     71: C3                  ret
795  *|     72: end?
796  * This function checks if the code is there, and replaces the yyyyyyyy entries
797  * by the functionpointers.
798  * The thunkbuf looks like:
799  *
800  *|     00: DWORD       length          ? don't know exactly
801  *|     04: SEGPTR      ptr             ? where does it point to?
802  * The segpointer ptr is written into the first DWORD of 'thunk'.
803  * [ok probably]
804  * RETURNS
805  *      unclear, pointer to win16 thkbuffer?
806  */
807 LPVOID WINAPI ThunkInitLSF(
808         LPBYTE thunk,   /* [in] win32 thunk */
809         LPCSTR thkbuf,  /* [in] thkbuffer name in win16 dll */
810         DWORD len,      /* [in] length of thkbuffer */
811         LPCSTR dll16,   /* [in] name of win16 dll */
812         LPCSTR dll32    /* [in] name of win32 dll */
813 ) {
814         HMODULE hkrnl32 = GetModuleHandleA("KERNEL32");
815         LPDWORD         addr,addr2;
816
817         /* FIXME: add checks for valid code ... */
818         /* write pointers to kernel32.89 and kernel32.90 (+ordinal base of 1) */
819         *(DWORD*)(thunk+0x35) = (DWORD)GetProcAddress(hkrnl32,(LPSTR)90);
820         *(DWORD*)(thunk+0x6D) = (DWORD)GetProcAddress(hkrnl32,(LPSTR)89);
821
822
823         if (!(addr = _loadthunk( dll16, thkbuf, dll32, NULL, len )))
824                 return 0;
825
826         addr2 = MapSL(addr[1]);
827         if (HIWORD(addr2))
828                 *(DWORD*)thunk = (DWORD)addr2;
829
830         return addr2;
831 }
832
833 /***********************************************************************
834  *              FT_PrologPrime                  (KERNEL32.89)
835  *
836  * This function is called from the relay code installed by
837  * ThunkInitLSF. It replaces the location from where it was
838  * called by a standard FT_Prolog call stub (which is 'primed'
839  * by inserting the correct target table pointer).
840  * Finally, it calls that stub.
841  *
842  * Input:  ECX    target number + flags (passed through to FT_Prolog)
843  *        (ESP)   offset of location where target table pointer
844  *                is stored, relative to the start of the relay code
845  *        (ESP+4) pointer to start of relay code
846  *                (this is where the FT_Prolog call stub gets written to)
847  *
848  * Note: The two DWORD arguments get popped off the stack.
849  *
850  */
851 void WINAPI FT_PrologPrime( CONTEXT86 *context )
852 {
853     DWORD  targetTableOffset;
854     LPBYTE relayCode;
855
856     /* Compensate for the fact that the Wine register relay code thought
857        we were being called, although we were in fact jumped to */
858     context->Esp -= 4;
859
860     /* Write FT_Prolog call stub */
861     targetTableOffset = stack32_pop(context);
862     relayCode = (LPBYTE)stack32_pop(context);
863     _write_ftprolog( relayCode, *(DWORD **)(relayCode+targetTableOffset) );
864
865     /* Jump to the call stub just created */
866     context->Eip = (DWORD)relayCode;
867 }
868
869 /***********************************************************************
870  *              QT_ThunkPrime                   (KERNEL32.90)
871  *
872  * This function corresponds to FT_PrologPrime, but installs a
873  * call stub for QT_Thunk instead.
874  *
875  * Input: (EBP-4) target number (passed through to QT_Thunk)
876  *         EDX    target table pointer location offset
877  *         EAX    start of relay code
878  *
879  */
880 void WINAPI QT_ThunkPrime( CONTEXT86 *context )
881 {
882     DWORD  targetTableOffset;
883     LPBYTE relayCode;
884
885     /* Compensate for the fact that the Wine register relay code thought
886        we were being called, although we were in fact jumped to */
887     context->Esp -= 4;
888
889     /* Write QT_Thunk call stub */
890     targetTableOffset = context->Edx;
891     relayCode = (LPBYTE)context->Eax;
892     _write_qtthunk( relayCode, *(DWORD **)(relayCode+targetTableOffset) );
893
894     /* Jump to the call stub just created */
895     context->Eip = (DWORD)relayCode;
896 }
897
898 /***********************************************************************
899  *              ThunkInitSL (KERNEL32.46)
900  * Another thunkbuf link routine.
901  * The start of the thunkbuf looks like this:
902  *      00: DWORD       length
903  *      04: SEGPTR      address for thunkbuffer pointer
904  * [ok probably]
905  */
906 VOID WINAPI ThunkInitSL(
907         LPBYTE thunk,           /* [in] start of thunkbuffer */
908         LPCSTR thkbuf,          /* [in] name/ordinal of thunkbuffer in win16 dll */
909         DWORD len,              /* [in] length of thunkbuffer */
910         LPCSTR dll16,           /* [in] name of win16 dll containing the thkbuf */
911         LPCSTR dll32            /* [in] win32 dll. FIXME: strange, unused */
912 ) {
913         LPDWORD         addr;
914
915         if (!(addr = _loadthunk( dll16, thkbuf, dll32, NULL, len )))
916                 return;
917
918         *(DWORD*)MapSL(addr[1]) = (DWORD)thunk;
919 }
920
921 /**********************************************************************
922  *           SSInit             (KERNEL.700)
923  * RETURNS
924  *      TRUE for success.
925  */
926 BOOL WINAPI SSInit16()
927 {
928     return TRUE;
929 }
930
931 /**********************************************************************
932  *           SSOnBigStack       (KERNEL32.87)
933  * Check if thunking is initialized (ss selector set up etc.)
934  * We do that differently, so just return TRUE.
935  * [ok]
936  * RETURNS
937  *      TRUE for success.
938  */
939 BOOL WINAPI SSOnBigStack()
940 {
941     TRACE("Yes, thunking is initialized\n");
942     return TRUE;
943 }
944
945 /**********************************************************************
946  *           SSConfirmSmallStack     (KERNEL.704)
947  *
948  * Abort if not on small stack.
949  *
950  * This must be a register routine as it has to preserve *all* registers.
951  */
952 void WINAPI SSConfirmSmallStack( CONTEXT86 *context )
953 {
954     /* We are always on the small stack while in 16-bit code ... */
955 }
956
957 /**********************************************************************
958  *           SSCall (KERNEL32.88)
959  * One of the real thunking functions. This one seems to be for 32<->32
960  * thunks. It should probably be capable of crossing processboundaries.
961  *
962  * And YES, I've seen nr=48 (somewhere in the Win95 32<->16 OLE coupling)
963  * [ok]
964  */
965 DWORD WINAPIV SSCall(
966         DWORD nr,       /* [in] number of argument bytes */
967         DWORD flags,    /* [in] FIXME: flags ? */
968         FARPROC fun,    /* [in] function to call */
969         ...             /* [in/out] arguments */
970 ) {
971     DWORD i,ret;
972     DWORD *args = ((DWORD *)&fun) + 1;
973
974     if(TRACE_ON(thunk))
975     {
976       DPRINTF("(%ld,0x%08lx,%p,[",nr,flags,fun);
977       for (i=0;i<nr/4;i++)
978           DPRINTF("0x%08lx,",args[i]);
979       DPRINTF("])\n");
980     }
981     switch (nr) {
982     case 0:     ret = fun();
983                 break;
984     case 4:     ret = fun(args[0]);
985                 break;
986     case 8:     ret = fun(args[0],args[1]);
987                 break;
988     case 12:    ret = fun(args[0],args[1],args[2]);
989                 break;
990     case 16:    ret = fun(args[0],args[1],args[2],args[3]);
991                 break;
992     case 20:    ret = fun(args[0],args[1],args[2],args[3],args[4]);
993                 break;
994     case 24:    ret = fun(args[0],args[1],args[2],args[3],args[4],args[5]);
995                 break;
996     case 28:    ret = fun(args[0],args[1],args[2],args[3],args[4],args[5],args[6]);
997                 break;
998     case 32:    ret = fun(args[0],args[1],args[2],args[3],args[4],args[5],args[6],args[7]);
999                 break;
1000     case 36:    ret = fun(args[0],args[1],args[2],args[3],args[4],args[5],args[6],args[7],args[8]);
1001                 break;
1002     case 40:    ret = fun(args[0],args[1],args[2],args[3],args[4],args[5],args[6],args[7],args[8],args[9]);
1003                 break;
1004     case 44:    ret = fun(args[0],args[1],args[2],args[3],args[4],args[5],args[6],args[7],args[8],args[9],args[10]);
1005                 break;
1006     case 48:    ret = fun(args[0],args[1],args[2],args[3],args[4],args[5],args[6],args[7],args[8],args[9],args[10],args[11]);
1007                 break;
1008     default:
1009         WARN("Unsupported nr of arguments, %ld\n",nr);
1010         ret = 0;
1011         break;
1012
1013     }
1014     TRACE(" returning %ld ...\n",ret);
1015     return ret;
1016 }
1017
1018 /**********************************************************************
1019  *           W32S_BackTo32                      (KERNEL32.51)
1020  */
1021 void WINAPI W32S_BackTo32( CONTEXT86 *context )
1022 {
1023     LPDWORD stack = (LPDWORD)context->Esp;
1024     FARPROC proc = (FARPROC)context->Eip;
1025
1026     context->Eax = proc( stack[1], stack[2], stack[3], stack[4], stack[5],
1027                                stack[6], stack[7], stack[8], stack[9], stack[10] );
1028
1029     context->Eip = stack32_pop(context);
1030 }
1031
1032 /**********************************************************************
1033  *                      AllocSLCallback         (KERNEL32.@)
1034  *
1035  * NOTES
1036  * Win95 uses some structchains for callbacks. It allocates them
1037  * in blocks of 100 entries, size 32 bytes each, layout:
1038  * blockstart:
1039  *|     0:      PTR     nextblockstart
1040  *|     4:      entry   *first;
1041  *|     8:      WORD    sel ( start points to blockstart)
1042  *|     A:      WORD    unknown
1043  * 100xentry:
1044  *|     00..17:         Code
1045  *|     18:     PDB     *owning_process;
1046  *|     1C:     PTR     blockstart
1047  *
1048  * We ignore this for now. (Just a note for further developers)
1049  * FIXME: use this method, so we don't waste selectors...
1050  *
1051  * Following code is then generated by AllocSLCallback. The code is 16 bit, so
1052  * the 0x66 prefix switches from word->long registers.
1053  *
1054  *|     665A            pop     edx
1055  *|     6668x arg2 x    pushl   <arg2>
1056  *|     6652            push    edx
1057  *|     EAx arg1 x      jmpf    <arg1>
1058  *
1059  * returns the startaddress of this thunk.
1060  *
1061  * Note, that they look very similar to the ones allocates by THUNK_Alloc.
1062  * RETURNS
1063  *      A segmented pointer to the start of the thunk
1064  */
1065 DWORD WINAPI
1066 AllocSLCallback(
1067         DWORD finalizer,        /* [in] Finalizer function */
1068         DWORD callback          /* [in] Callback function */
1069 ) {
1070         LPBYTE  x,thunk = HeapAlloc( GetProcessHeap(), 0, 32 );
1071         WORD    sel;
1072
1073         x=thunk;
1074         *x++=0x66;*x++=0x5a;                            /* popl edx */
1075         *x++=0x66;*x++=0x68;*(DWORD*)x=finalizer;x+=4;  /* pushl finalizer */
1076         *x++=0x66;*x++=0x52;                            /* pushl edx */
1077         *x++=0xea;*(DWORD*)x=callback;x+=4;             /* jmpf callback */
1078
1079         *(DWORD*)(thunk+18) = GetCurrentProcessId();
1080
1081         sel = SELECTOR_AllocBlock( thunk, 32, WINE_LDT_FLAGS_CODE );
1082         return (sel<<16)|0;
1083 }
1084
1085 /**********************************************************************
1086  *              FreeSLCallback          (KERNEL32.@)
1087  * Frees the specified 16->32 callback
1088  */
1089 void WINAPI
1090 FreeSLCallback(
1091         DWORD x /* [in] 16 bit callback (segmented pointer?) */
1092 ) {
1093         FIXME("(0x%08lx): stub\n",x);
1094 }
1095
1096
1097 /**********************************************************************
1098  *              GetTEBSelectorFS        (KERNEL.475)
1099  *      Set the 16-bit %fs to the 32-bit %fs (current TEB selector)
1100  */
1101 void WINAPI GetTEBSelectorFS16(void)
1102 {
1103     CURRENT_STACK16->fs = wine_get_fs();
1104 }
1105
1106 /**********************************************************************
1107  *              IsPeFormat              (KERNEL.431)
1108  *
1109  * Determine if a file is a PE format executable.
1110  *
1111  * RETURNS
1112  *  TRUE, if it is.
1113  *  FALSE if the file could not be opened or is not a PE file.
1114  *
1115  * NOTES
1116  *  If fn is given as NULL then the function expects hf16 to be valid.
1117  */
1118 BOOL16 WINAPI IsPeFormat16(
1119         LPSTR   fn,     /* [in] Filename to the executeable */
1120         HFILE16 hf16)   /* [in] An open file handle */
1121 {
1122     BOOL ret = FALSE;
1123     IMAGE_DOS_HEADER mzh;
1124     OFSTRUCT ofs;
1125     DWORD xmagic;
1126
1127     if (fn) hf16 = OpenFile16(fn,&ofs,OF_READ);
1128     if (hf16 == HFILE_ERROR16) return FALSE;
1129     _llseek16(hf16,0,SEEK_SET);
1130     if (sizeof(mzh)!=_lread16(hf16,&mzh,sizeof(mzh))) goto done;
1131     if (mzh.e_magic!=IMAGE_DOS_SIGNATURE) goto done;
1132     _llseek16(hf16,mzh.e_lfanew,SEEK_SET);
1133     if (sizeof(DWORD)!=_lread16(hf16,&xmagic,sizeof(DWORD))) goto done;
1134     ret = (xmagic == IMAGE_NT_SIGNATURE);
1135  done:
1136     _lclose16(hf16);
1137     return ret;
1138 }
1139
1140
1141 /***********************************************************************
1142  *           K32Thk1632Prolog                   (KERNEL32.@)
1143  */
1144 void WINAPI K32Thk1632Prolog( CONTEXT86 *context )
1145 {
1146    LPBYTE code = (LPBYTE)context->Eip - 5;
1147
1148    /* Arrrgh! SYSTHUNK.DLL just has to re-implement another method
1149       of 16->32 thunks instead of using one of the standard methods!
1150       This means that SYSTHUNK.DLL itself switches to a 32-bit stack,
1151       and does a far call to the 32-bit code segment of OLECLI32/OLESVR32.
1152       Unfortunately, our CallTo/CallFrom mechanism is therefore completely
1153       bypassed, which means it will crash the next time the 32-bit OLE
1154       code thunks down again to 16-bit (this *will* happen!).
1155
1156       The following hack tries to recognize this situation.
1157       This is possible since the called stubs in OLECLI32/OLESVR32 all
1158       look exactly the same:
1159         00   E8xxxxxxxx    call K32Thk1632Prolog
1160         05   FF55FC        call [ebp-04]
1161         08   E8xxxxxxxx    call K32Thk1632Epilog
1162         0D   66CB          retf
1163
1164       If we recognize this situation, we try to simulate the actions
1165       of our CallTo/CallFrom mechanism by copying the 16-bit stack
1166       to our 32-bit stack, creating a proper STACK16FRAME and
1167       updating cur_stack. */
1168
1169    if (   code[5] == 0xFF && code[6] == 0x55 && code[7] == 0xFC
1170        && code[13] == 0x66 && code[14] == 0xCB)
1171    {
1172       WORD  stackSel  = NtCurrentTeb()->stack_sel;
1173       DWORD stackBase = GetSelectorBase(stackSel);
1174
1175       DWORD argSize = context->Ebp - context->Esp;
1176       char *stack16 = (char *)context->Esp - 4;
1177       char *stack32 = (char *)NtCurrentTeb()->cur_stack - argSize;
1178       STACK16FRAME *frame16 = (STACK16FRAME *)stack16 - 1;
1179
1180       TRACE("before SYSTHUNK hack: EBP: %08lx ESP: %08lx cur_stack: %08lx\n",
1181                    context->Ebp, context->Esp, NtCurrentTeb()->cur_stack);
1182
1183       memset(frame16, '\0', sizeof(STACK16FRAME));
1184       frame16->frame32 = (STACK32FRAME *)NtCurrentTeb()->cur_stack;
1185       frame16->ebp = context->Ebp;
1186
1187       memcpy(stack32, stack16, argSize);
1188       NtCurrentTeb()->cur_stack = MAKESEGPTR(stackSel, (DWORD)frame16 - stackBase);
1189
1190       context->Esp = (DWORD)stack32 + 4;
1191       context->Ebp = context->Esp + argSize;
1192
1193       TRACE("after  SYSTHUNK hack: EBP: %08lx ESP: %08lx cur_stack: %08lx\n",
1194                    context->Ebp, context->Esp, NtCurrentTeb()->cur_stack);
1195    }
1196
1197     /* entry_point is never used again once the entry point has
1198        been called.  Thus we re-use it to hold the Win16Lock count */
1199    ReleaseThunkLock(&CURRENT_STACK16->entry_point);
1200 }
1201
1202 /***********************************************************************
1203  *           K32Thk1632Epilog                   (KERNEL32.@)
1204  */
1205 void WINAPI K32Thk1632Epilog( CONTEXT86 *context )
1206 {
1207    LPBYTE code = (LPBYTE)context->Eip - 13;
1208
1209    RestoreThunkLock(CURRENT_STACK16->entry_point);
1210
1211    /* We undo the SYSTHUNK hack if necessary. See K32Thk1632Prolog. */
1212
1213    if (   code[5] == 0xFF && code[6] == 0x55 && code[7] == 0xFC
1214        && code[13] == 0x66 && code[14] == 0xCB)
1215    {
1216       STACK16FRAME *frame16 = MapSL(NtCurrentTeb()->cur_stack);
1217       char *stack16 = (char *)(frame16 + 1);
1218       DWORD argSize = frame16->ebp - (DWORD)stack16;
1219       char *stack32 = (char *)frame16->frame32 - argSize;
1220
1221       DWORD nArgsPopped = context->Esp - (DWORD)stack32;
1222
1223       TRACE("before SYSTHUNK hack: EBP: %08lx ESP: %08lx cur_stack: %08lx\n",
1224                    context->Ebp, context->Esp, NtCurrentTeb()->cur_stack);
1225
1226       NtCurrentTeb()->cur_stack = (DWORD)frame16->frame32;
1227
1228       context->Esp = (DWORD)stack16 + nArgsPopped;
1229       context->Ebp = frame16->ebp;
1230
1231       TRACE("after  SYSTHUNK hack: EBP: %08lx ESP: %08lx cur_stack: %08lx\n",
1232                    context->Ebp, context->Esp, NtCurrentTeb()->cur_stack);
1233    }
1234 }
1235
1236 /*********************************************************************
1237  *                   PK16FNF [KERNEL32.91]
1238  *
1239  *  This routine fills in the supplied 13-byte (8.3 plus terminator)
1240  *  string buffer with the 8.3 filename of a recently loaded 16-bit
1241  *  module.  It is unknown exactly what modules trigger this
1242  *  mechanism or what purpose this serves.  Win98 Explorer (and
1243  *  probably also Win95 with IE 4 shell integration) calls this
1244  *  several times during initialization.
1245  *
1246  *  FIXME: find out what this really does and make it work.
1247  */
1248 void WINAPI PK16FNF(LPSTR strPtr)
1249 {
1250        FIXME("(%p): stub\n", strPtr);
1251
1252        /* fill in a fake filename that'll be easy to recognize */
1253        strcpy(strPtr, "WINESTUB.FIX");
1254 }
1255
1256 /***********************************************************************
1257  * 16->32 Flat Thunk routines:
1258  */
1259
1260 /***********************************************************************
1261  *              ThunkConnect16          (KERNEL.651)
1262  * Connects a 32bit and a 16bit thunkbuffer.
1263  */
1264 UINT WINAPI ThunkConnect16(
1265         LPSTR module16,              /* [in] name of win16 dll */
1266         LPSTR module32,              /* [in] name of win32 dll */
1267         HINSTANCE16 hInst16,         /* [in] hInst of win16 dll */
1268         DWORD dwReason,              /* [in] initialisation argument */
1269         struct ThunkDataCommon *TD,  /* [in/out] thunkbuffer */
1270         LPSTR thunkfun32,            /* [in] win32 thunkfunction */
1271         WORD cs                      /* [in] CS of win16 dll */
1272 ) {
1273     BOOL directionSL;
1274
1275     if (!strncmp(TD->magic, "SL01", 4))
1276     {
1277         directionSL = TRUE;
1278
1279         TRACE("SL01 thunk %s (%lx) -> %s (%s), Reason: %ld\n",
1280               module16, (DWORD)TD, module32, thunkfun32, dwReason);
1281     }
1282     else if (!strncmp(TD->magic, "LS01", 4))
1283     {
1284         directionSL = FALSE;
1285
1286         TRACE("LS01 thunk %s (%lx) <- %s (%s), Reason: %ld\n",
1287               module16, (DWORD)TD, module32, thunkfun32, dwReason);
1288     }
1289     else
1290     {
1291         ERR("Invalid magic %c%c%c%c\n",
1292             TD->magic[0], TD->magic[1], TD->magic[2], TD->magic[3]);
1293         return 0;
1294     }
1295
1296     switch (dwReason)
1297     {
1298         case DLL_PROCESS_ATTACH:
1299             if (directionSL)
1300             {
1301                 struct ThunkDataSL16 *SL16 = (struct ThunkDataSL16 *)TD;
1302                 struct ThunkDataSL   *SL   = SL16->fpData;
1303
1304                 if (SL == NULL)
1305                 {
1306                     SL = HeapAlloc(GetProcessHeap(), 0, sizeof(*SL));
1307
1308                     SL->common   = SL16->common;
1309                     SL->flags1   = SL16->flags1;
1310                     SL->flags2   = SL16->flags2;
1311
1312                     SL->apiDB    = MapSL(SL16->apiDatabase);
1313                     SL->targetDB = NULL;
1314
1315                     lstrcpynA(SL->pszDll16, module16, 255);
1316                     lstrcpynA(SL->pszDll32, module32, 255);
1317
1318                     /* We should create a SEGPTR to the ThunkDataSL,
1319                        but since the contents are not in the original format,
1320                        any access to this by 16-bit code would crash anyway. */
1321                     SL16->spData = 0;
1322                     SL16->fpData = SL;
1323                 }
1324
1325
1326                 if (SL->flags2 & 0x80000000)
1327                 {
1328                     TRACE("Preloading 32-bit library\n");
1329                     LoadLibraryA(module32);
1330                 }
1331             }
1332             else
1333             {
1334                 /* nothing to do */
1335             }
1336             break;
1337
1338         case DLL_PROCESS_DETACH:
1339             /* FIXME: cleanup */
1340             break;
1341     }
1342
1343     return 1;
1344 }
1345
1346
1347 /***********************************************************************
1348  *           C16ThkSL                           (KERNEL.630)
1349  */
1350
1351 void WINAPI C16ThkSL(CONTEXT86 *context)
1352 {
1353     LPBYTE stub = MapSL(context->Eax), x = stub;
1354     WORD cs = wine_get_cs();
1355     WORD ds = wine_get_ds();
1356
1357     /* We produce the following code:
1358      *
1359      *   mov ax, __FLATDS
1360      *   mov es, ax
1361      *   movzx ecx, cx
1362      *   mov edx, es:[ecx + $EDX]
1363      *   push bp
1364      *   push edx
1365      *   push dx
1366      *   push edx
1367      *   call __FLATCS:__wine_call_from_16_thunk
1368      */
1369
1370     *x++ = 0xB8; *((WORD *)x)++ = ds;
1371     *x++ = 0x8E; *x++ = 0xC0;
1372     *x++ = 0x66; *x++ = 0x0F; *x++ = 0xB7; *x++ = 0xC9;
1373     *x++ = 0x67; *x++ = 0x66; *x++ = 0x26; *x++ = 0x8B;
1374                  *x++ = 0x91; *((DWORD *)x)++ = context->Edx;
1375
1376     *x++ = 0x55;
1377     *x++ = 0x66; *x++ = 0x52;
1378     *x++ = 0x52;
1379     *x++ = 0x66; *x++ = 0x52;
1380     *x++ = 0x66; *x++ = 0x9A; *((DWORD *)x)++ = (DWORD)__wine_call_from_16_thunk;
1381                               *((WORD *)x)++ = cs;
1382
1383     /* Jump to the stub code just created */
1384     context->Eip = LOWORD(context->Eax);
1385     context->SegCs  = HIWORD(context->Eax);
1386
1387     /* Since C16ThkSL got called by a jmp, we need to leave the
1388        original return address on the stack */
1389     context->Esp -= 4;
1390 }
1391
1392 /***********************************************************************
1393  *           C16ThkSL01                         (KERNEL.631)
1394  */
1395
1396 void WINAPI C16ThkSL01(CONTEXT86 *context)
1397 {
1398     LPBYTE stub = MapSL(context->Eax), x = stub;
1399
1400     if (stub)
1401     {
1402         struct ThunkDataSL16 *SL16 = MapSL(context->Edx);
1403         struct ThunkDataSL *td = SL16->fpData;
1404
1405         DWORD procAddress = (DWORD)GetProcAddress16(GetModuleHandle16("KERNEL"), (LPCSTR)631);
1406         WORD cs = wine_get_cs();
1407
1408         if (!td)
1409         {
1410             ERR("ThunkConnect16 was not called!\n");
1411             return;
1412         }
1413
1414         TRACE("Creating stub for ThunkDataSL %08lx\n", (DWORD)td);
1415
1416
1417         /* We produce the following code:
1418          *
1419          *   xor eax, eax
1420          *   mov edx, $td
1421          *   call C16ThkSL01
1422          *   push bp
1423          *   push edx
1424          *   push dx
1425          *   push edx
1426          *   call __FLATCS:__wine_call_from_16_thunk
1427          */
1428
1429         *x++ = 0x66; *x++ = 0x33; *x++ = 0xC0;
1430         *x++ = 0x66; *x++ = 0xBA; *((DWORD *)x)++ = (DWORD)td;
1431         *x++ = 0x9A; *((DWORD *)x)++ = procAddress;
1432
1433         *x++ = 0x55;
1434         *x++ = 0x66; *x++ = 0x52;
1435         *x++ = 0x52;
1436         *x++ = 0x66; *x++ = 0x52;
1437         *x++ = 0x66; *x++ = 0x9A; *((DWORD *)x)++ = (DWORD)__wine_call_from_16_thunk;
1438                                   *((WORD *)x)++ = cs;
1439
1440         /* Jump to the stub code just created */
1441         context->Eip = LOWORD(context->Eax);
1442         context->SegCs  = HIWORD(context->Eax);
1443
1444         /* Since C16ThkSL01 got called by a jmp, we need to leave the
1445            orginal return address on the stack */
1446         context->Esp -= 4;
1447     }
1448     else
1449     {
1450         struct ThunkDataSL *td = (struct ThunkDataSL *)context->Edx;
1451         DWORD targetNr = CX_reg(context) / 4;
1452         struct SLTargetDB *tdb;
1453
1454         TRACE("Process %08lx calling target %ld of ThunkDataSL %08lx\n",
1455               GetCurrentProcessId(), targetNr, (DWORD)td);
1456
1457         for (tdb = td->targetDB; tdb; tdb = tdb->next)
1458             if (tdb->process == GetCurrentProcessId())
1459                 break;
1460
1461         if (!tdb)
1462         {
1463             TRACE("Loading 32-bit library %s\n", td->pszDll32);
1464             LoadLibraryA(td->pszDll32);
1465
1466             for (tdb = td->targetDB; tdb; tdb = tdb->next)
1467                 if (tdb->process == GetCurrentProcessId())
1468                     break;
1469         }
1470
1471         if (tdb)
1472         {
1473             context->Edx = tdb->targetTable[targetNr];
1474
1475             TRACE("Call target is %08lx\n", context->Edx);
1476         }
1477         else
1478         {
1479             WORD *stack = MapSL( MAKESEGPTR(context->SegSs, LOWORD(context->Esp)) );
1480             SET_DX( context, HIWORD(td->apiDB[targetNr].errorReturnValue) );
1481             SET_AX( context, LOWORD(td->apiDB[targetNr].errorReturnValue) );
1482             context->Eip = stack[2];
1483             context->SegCs  = stack[3];
1484             context->Esp += td->apiDB[targetNr].nrArgBytes + 4;
1485
1486             ERR("Process %08lx did not ThunkConnect32 %s to %s\n",
1487                 GetCurrentProcessId(), td->pszDll32, td->pszDll16);
1488         }
1489     }
1490 }
1491
1492
1493 /***********************************************************************
1494  * 16<->32 Thunklet/Callback API:
1495  */
1496
1497 #include "pshpack1.h"
1498 typedef struct _THUNKLET
1499 {
1500     BYTE        prefix_target;
1501     BYTE        pushl_target;
1502     DWORD       target;
1503
1504     BYTE        prefix_relay;
1505     BYTE        pushl_relay;
1506     DWORD       relay;
1507
1508     BYTE        jmp_glue;
1509     DWORD       glue;
1510
1511     BYTE        type;
1512     HINSTANCE16 owner;
1513     struct _THUNKLET *next;
1514 } THUNKLET;
1515 #include "poppack.h"
1516
1517 #define THUNKLET_TYPE_LS  1
1518 #define THUNKLET_TYPE_SL  2
1519
1520 static HANDLE  ThunkletHeap = 0;
1521 static WORD ThunkletCodeSel;
1522 static THUNKLET *ThunkletAnchor = NULL;
1523
1524 static FARPROC ThunkletSysthunkGlueLS = 0;
1525 static SEGPTR    ThunkletSysthunkGlueSL = 0;
1526
1527 static FARPROC ThunkletCallbackGlueLS = 0;
1528 static SEGPTR    ThunkletCallbackGlueSL = 0;
1529
1530
1531 /* map a thunk allocated on ThunkletHeap to a 16-bit pointer */
1532 inline static SEGPTR get_segptr( void *thunk )
1533 {
1534     if (!thunk) return 0;
1535     return MAKESEGPTR( ThunkletCodeSel, (char *)thunk - (char *)ThunkletHeap );
1536 }
1537
1538 /***********************************************************************
1539  *           THUNK_Init
1540  */
1541 static BOOL THUNK_Init(void)
1542 {
1543     LPBYTE thunk;
1544
1545     ThunkletHeap = HeapCreate( 0, 0x10000, 0x10000 );
1546     if (!ThunkletHeap) return FALSE;
1547
1548     ThunkletCodeSel = SELECTOR_AllocBlock( (void *)ThunkletHeap, 0x10000, WINE_LDT_FLAGS_CODE );
1549
1550     thunk = HeapAlloc( ThunkletHeap, 0, 5 );
1551     if (!thunk) return FALSE;
1552
1553     ThunkletSysthunkGlueLS = (FARPROC)thunk;
1554     *thunk++ = 0x58;                             /* popl eax */
1555     *thunk++ = 0xC3;                             /* ret      */
1556
1557     ThunkletSysthunkGlueSL = get_segptr( thunk );
1558     *thunk++ = 0x66; *thunk++ = 0x58;            /* popl eax */
1559     *thunk++ = 0xCB;                             /* lret     */
1560
1561     return TRUE;
1562 }
1563
1564 /***********************************************************************
1565  *     SetThunkletCallbackGlue             (KERNEL.560)
1566  */
1567 void WINAPI SetThunkletCallbackGlue16( FARPROC glueLS, SEGPTR glueSL )
1568 {
1569     ThunkletCallbackGlueLS = glueLS;
1570     ThunkletCallbackGlueSL = glueSL;
1571 }
1572
1573
1574 /***********************************************************************
1575  *     THUNK_FindThunklet
1576  */
1577 THUNKLET *THUNK_FindThunklet( DWORD target, DWORD relay,
1578                               DWORD glue, BYTE type )
1579 {
1580     THUNKLET *thunk;
1581
1582     for (thunk = ThunkletAnchor; thunk; thunk = thunk->next)
1583         if (    thunk->type   == type
1584              && thunk->target == target
1585              && thunk->relay  == relay
1586              && ( type == THUNKLET_TYPE_LS ?
1587                     ( thunk->glue == glue - (DWORD)&thunk->type )
1588                   : ( thunk->glue == glue ) ) )
1589             return thunk;
1590
1591      return NULL;
1592 }
1593
1594 /***********************************************************************
1595  *     THUNK_AllocLSThunklet
1596  */
1597 FARPROC THUNK_AllocLSThunklet( SEGPTR target, DWORD relay,
1598                                  FARPROC glue, HTASK16 owner )
1599 {
1600     THUNKLET *thunk = THUNK_FindThunklet( (DWORD)target, relay, (DWORD)glue,
1601                                           THUNKLET_TYPE_LS );
1602     if (!thunk)
1603     {
1604         TDB *pTask = GlobalLock16( owner );
1605
1606         if (!ThunkletHeap) THUNK_Init();
1607         if ( !(thunk = HeapAlloc( ThunkletHeap, 0, sizeof(THUNKLET) )) )
1608             return 0;
1609
1610         thunk->prefix_target = thunk->prefix_relay = 0x90;
1611         thunk->pushl_target  = thunk->pushl_relay  = 0x68;
1612         thunk->jmp_glue = 0xE9;
1613
1614         thunk->target  = (DWORD)target;
1615         thunk->relay   = (DWORD)relay;
1616         thunk->glue    = (DWORD)glue - (DWORD)&thunk->type;
1617
1618         thunk->type    = THUNKLET_TYPE_LS;
1619         thunk->owner   = pTask? pTask->hInstance : 0;
1620
1621         thunk->next    = ThunkletAnchor;
1622         ThunkletAnchor = thunk;
1623     }
1624
1625     return (FARPROC)thunk;
1626 }
1627
1628 /***********************************************************************
1629  *     THUNK_AllocSLThunklet
1630  */
1631 SEGPTR THUNK_AllocSLThunklet( FARPROC target, DWORD relay,
1632                               SEGPTR glue, HTASK16 owner )
1633 {
1634     THUNKLET *thunk = THUNK_FindThunklet( (DWORD)target, relay, (DWORD)glue,
1635                                           THUNKLET_TYPE_SL );
1636     if (!thunk)
1637     {
1638         TDB *pTask = GlobalLock16( owner );
1639
1640         if (!ThunkletHeap) THUNK_Init();
1641         if ( !(thunk = HeapAlloc( ThunkletHeap, 0, sizeof(THUNKLET) )) )
1642             return 0;
1643
1644         thunk->prefix_target = thunk->prefix_relay = 0x66;
1645         thunk->pushl_target  = thunk->pushl_relay  = 0x68;
1646         thunk->jmp_glue = 0xEA;
1647
1648         thunk->target  = (DWORD)target;
1649         thunk->relay   = (DWORD)relay;
1650         thunk->glue    = (DWORD)glue;
1651
1652         thunk->type    = THUNKLET_TYPE_SL;
1653         thunk->owner   = pTask? pTask->hInstance : 0;
1654
1655         thunk->next    = ThunkletAnchor;
1656         ThunkletAnchor = thunk;
1657     }
1658
1659     return get_segptr( thunk );
1660 }
1661
1662 /**********************************************************************
1663  *     IsLSThunklet
1664  */
1665 BOOL16 WINAPI IsLSThunklet( THUNKLET *thunk )
1666 {
1667     return    thunk->prefix_target == 0x90 && thunk->pushl_target == 0x68
1668            && thunk->prefix_relay  == 0x90 && thunk->pushl_relay  == 0x68
1669            && thunk->jmp_glue == 0xE9 && thunk->type == THUNKLET_TYPE_LS;
1670 }
1671
1672 /**********************************************************************
1673  *     IsSLThunklet                        (KERNEL.612)
1674  */
1675 BOOL16 WINAPI IsSLThunklet16( THUNKLET *thunk )
1676 {
1677     return    thunk->prefix_target == 0x66 && thunk->pushl_target == 0x68
1678            && thunk->prefix_relay  == 0x66 && thunk->pushl_relay  == 0x68
1679            && thunk->jmp_glue == 0xEA && thunk->type == THUNKLET_TYPE_SL;
1680 }
1681
1682
1683
1684 /***********************************************************************
1685  *     AllocLSThunkletSysthunk             (KERNEL.607)
1686  */
1687 FARPROC WINAPI AllocLSThunkletSysthunk16( SEGPTR target,
1688                                           FARPROC relay, DWORD dummy )
1689 {
1690     if (!ThunkletSysthunkGlueLS) THUNK_Init();
1691     return THUNK_AllocLSThunklet( (SEGPTR)relay, (DWORD)target,
1692                                   ThunkletSysthunkGlueLS, GetCurrentTask() );
1693 }
1694
1695 /***********************************************************************
1696  *     AllocSLThunkletSysthunk             (KERNEL.608)
1697  */
1698 SEGPTR WINAPI AllocSLThunkletSysthunk16( FARPROC target,
1699                                        SEGPTR relay, DWORD dummy )
1700 {
1701     if (!ThunkletSysthunkGlueSL) THUNK_Init();
1702     return THUNK_AllocSLThunklet( (FARPROC)relay, (DWORD)target,
1703                                   ThunkletSysthunkGlueSL, GetCurrentTask() );
1704 }
1705
1706
1707 /***********************************************************************
1708  *     AllocLSThunkletCallbackEx           (KERNEL.567)
1709  */
1710 FARPROC WINAPI AllocLSThunkletCallbackEx16( SEGPTR target,
1711                                             DWORD relay, HTASK16 task )
1712 {
1713     THUNKLET *thunk = MapSL( target );
1714     if ( !thunk ) return NULL;
1715
1716     if (   IsSLThunklet16( thunk ) && thunk->relay == relay
1717         && thunk->glue == (DWORD)ThunkletCallbackGlueSL )
1718         return (FARPROC)thunk->target;
1719
1720     return THUNK_AllocLSThunklet( target, relay,
1721                                   ThunkletCallbackGlueLS, task );
1722 }
1723
1724 /***********************************************************************
1725  *     AllocSLThunkletCallbackEx           (KERNEL.568)
1726  */
1727 SEGPTR WINAPI AllocSLThunkletCallbackEx16( FARPROC target,
1728                                          DWORD relay, HTASK16 task )
1729 {
1730     THUNKLET *thunk = (THUNKLET *)target;
1731     if ( !thunk ) return 0;
1732
1733     if (   IsLSThunklet( thunk ) && thunk->relay == relay
1734         && thunk->glue == (DWORD)ThunkletCallbackGlueLS - (DWORD)&thunk->type )
1735         return (SEGPTR)thunk->target;
1736
1737     return THUNK_AllocSLThunklet( target, relay,
1738                                   ThunkletCallbackGlueSL, task );
1739 }
1740
1741 /***********************************************************************
1742  *     AllocLSThunkletCallback             (KERNEL.561)
1743  *     AllocLSThunkletCallback_dup         (KERNEL.606)
1744  */
1745 FARPROC WINAPI AllocLSThunkletCallback16( SEGPTR target, DWORD relay )
1746 {
1747     return AllocLSThunkletCallbackEx16( target, relay, GetCurrentTask() );
1748 }
1749
1750 /***********************************************************************
1751  *     AllocSLThunkletCallback             (KERNEL.562)
1752  *     AllocSLThunkletCallback_dup         (KERNEL.605)
1753  */
1754 SEGPTR WINAPI AllocSLThunkletCallback16( FARPROC target, DWORD relay )
1755 {
1756     return AllocSLThunkletCallbackEx16( target, relay, GetCurrentTask() );
1757 }
1758
1759 /***********************************************************************
1760  *     FindLSThunkletCallback              (KERNEL.563)
1761  *     FindLSThunkletCallback_dup          (KERNEL.609)
1762  */
1763 FARPROC WINAPI FindLSThunkletCallback( SEGPTR target, DWORD relay )
1764 {
1765     THUNKLET *thunk = MapSL( target );
1766     if (   thunk && IsSLThunklet16( thunk ) && thunk->relay == relay
1767         && thunk->glue == (DWORD)ThunkletCallbackGlueSL )
1768         return (FARPROC)thunk->target;
1769
1770     thunk = THUNK_FindThunklet( (DWORD)target, relay,
1771                                 (DWORD)ThunkletCallbackGlueLS,
1772                                 THUNKLET_TYPE_LS );
1773     return (FARPROC)thunk;
1774 }
1775
1776 /***********************************************************************
1777  *     FindSLThunkletCallback              (KERNEL.564)
1778  *     FindSLThunkletCallback_dup          (KERNEL.610)
1779  */
1780 SEGPTR WINAPI FindSLThunkletCallback( FARPROC target, DWORD relay )
1781 {
1782     THUNKLET *thunk = (THUNKLET *)target;
1783     if (   thunk && IsLSThunklet( thunk ) && thunk->relay == relay
1784         && thunk->glue == (DWORD)ThunkletCallbackGlueLS - (DWORD)&thunk->type )
1785         return (SEGPTR)thunk->target;
1786
1787     thunk = THUNK_FindThunklet( (DWORD)target, relay,
1788                                 (DWORD)ThunkletCallbackGlueSL,
1789                                 THUNKLET_TYPE_SL );
1790     return get_segptr( thunk );
1791 }
1792
1793
1794 /***********************************************************************
1795  *     FreeThunklet            (KERNEL.611)
1796  */
1797 BOOL16 WINAPI FreeThunklet16( DWORD unused1, DWORD unused2 )
1798 {
1799     return FALSE;
1800 }
1801
1802
1803 /***********************************************************************
1804  * Callback Client API
1805  */
1806
1807 #define N_CBC_FIXED    20
1808 #define N_CBC_VARIABLE 10
1809 #define N_CBC_TOTAL    (N_CBC_FIXED + N_CBC_VARIABLE)
1810
1811 static SEGPTR CBClientRelay16[ N_CBC_TOTAL ];
1812 static FARPROC *CBClientRelay32[ N_CBC_TOTAL ];
1813
1814 /***********************************************************************
1815  *     RegisterCBClient                    (KERNEL.619)
1816  */
1817 INT16 WINAPI RegisterCBClient16( INT16 wCBCId,
1818                                  SEGPTR relay16, FARPROC *relay32 )
1819 {
1820     /* Search for free Callback ID */
1821     if ( wCBCId == -1 )
1822         for ( wCBCId = N_CBC_FIXED; wCBCId < N_CBC_TOTAL; wCBCId++ )
1823             if ( !CBClientRelay16[ wCBCId ] )
1824                 break;
1825
1826     /* Register Callback ID */
1827     if ( wCBCId > 0 && wCBCId < N_CBC_TOTAL )
1828     {
1829         CBClientRelay16[ wCBCId ] = relay16;
1830         CBClientRelay32[ wCBCId ] = relay32;
1831     }
1832     else
1833         wCBCId = 0;
1834
1835     return wCBCId;
1836 }
1837
1838 /***********************************************************************
1839  *     UnRegisterCBClient                  (KERNEL.622)
1840  */
1841 INT16 WINAPI UnRegisterCBClient16( INT16 wCBCId,
1842                                    SEGPTR relay16, FARPROC *relay32 )
1843 {
1844     if (    wCBCId >= N_CBC_FIXED && wCBCId < N_CBC_TOTAL
1845          && CBClientRelay16[ wCBCId ] == relay16
1846          && CBClientRelay32[ wCBCId ] == relay32 )
1847     {
1848         CBClientRelay16[ wCBCId ] = 0;
1849         CBClientRelay32[ wCBCId ] = 0;
1850     }
1851     else
1852         wCBCId = 0;
1853
1854     return wCBCId;
1855 }
1856
1857
1858 /***********************************************************************
1859  *     InitCBClient                        (KERNEL.623)
1860  */
1861 void WINAPI InitCBClient16( FARPROC glueLS )
1862 {
1863     HMODULE16 kernel = GetModuleHandle16( "KERNEL" );
1864     SEGPTR glueSL = (SEGPTR)GetProcAddress16( kernel, (LPCSTR)604 );
1865
1866     SetThunkletCallbackGlue16( glueLS, glueSL );
1867 }
1868
1869 /***********************************************************************
1870  *     CBClientGlueSL                      (KERNEL.604)
1871  */
1872 void WINAPI CBClientGlueSL( CONTEXT86 *context )
1873 {
1874     /* Create stack frame */
1875     SEGPTR stackSeg = stack16_push( 12 );
1876     LPWORD stackLin = MapSL( stackSeg );
1877     SEGPTR glue, *glueTab;
1878
1879     stackLin[3] = (WORD)context->Ebp;
1880     stackLin[2] = (WORD)context->Esi;
1881     stackLin[1] = (WORD)context->Edi;
1882     stackLin[0] = (WORD)context->SegDs;
1883
1884     context->Ebp = OFFSETOF( stackSeg ) + 6;
1885     context->Esp = OFFSETOF( stackSeg ) - 4;
1886     context->SegGs = 0;
1887
1888     /* Jump to 16-bit relay code */
1889     glueTab = MapSL( CBClientRelay16[ stackLin[5] ] );
1890     glue = glueTab[ stackLin[4] ];
1891     context->SegCs = SELECTOROF( glue );
1892     context->Eip   = OFFSETOF  ( glue );
1893 }
1894
1895 /***********************************************************************
1896  *     CBClientThunkSL                      (KERNEL.620)
1897  */
1898 extern DWORD CALL32_CBClient( FARPROC proc, LPWORD args, DWORD *esi );
1899 void WINAPI CBClientThunkSL( CONTEXT86 *context )
1900 {
1901     /* Call 32-bit relay code */
1902
1903     LPWORD args = MapSL( MAKESEGPTR( context->SegSs, LOWORD(context->Ebp) ) );
1904     FARPROC proc = CBClientRelay32[ args[2] ][ args[1] ];
1905
1906     context->Eax = CALL32_CBClient( proc, args, &context->Esi );
1907 }
1908
1909 /***********************************************************************
1910  *     CBClientThunkSLEx                    (KERNEL.621)
1911  */
1912 extern DWORD CALL32_CBClientEx( FARPROC proc, LPWORD args, DWORD *esi, INT *nArgs );
1913 void WINAPI CBClientThunkSLEx( CONTEXT86 *context )
1914 {
1915     /* Call 32-bit relay code */
1916
1917     LPWORD args = MapSL( MAKESEGPTR( context->SegSs, LOWORD(context->Ebp) ) );
1918     FARPROC proc = CBClientRelay32[ args[2] ][ args[1] ];
1919     INT nArgs;
1920     LPWORD stackLin;
1921
1922     context->Eax = CALL32_CBClientEx( proc, args, &context->Esi, &nArgs );
1923
1924     /* Restore registers saved by CBClientGlueSL */
1925     stackLin = (LPWORD)((LPBYTE)CURRENT_STACK16 + sizeof(STACK16FRAME) - 4);
1926     context->Ebp = (context->Ebp & ~0xffff) | stackLin[3];
1927     SET_SI( context, stackLin[2] );
1928     SET_DI( context, stackLin[1] );
1929     context->SegDs = stackLin[0];
1930     context->Esp += 16+nArgs;
1931
1932     /* Return to caller of CBClient thunklet */
1933     context->SegCs = stackLin[9];
1934     context->Eip   = stackLin[8];
1935 }
1936
1937
1938 /***********************************************************************
1939  *           Get16DLLAddress       (KERNEL32.@)
1940  *
1941  * This function is used by a Win32s DLL if it wants to call a Win16 function.
1942  * A 16:16 segmented pointer to the function is returned.
1943  * Written without any docu.
1944  */
1945 SEGPTR WINAPI Get16DLLAddress(HMODULE16 handle, LPSTR func_name)
1946 {
1947     static WORD code_sel32;
1948     FARPROC16 proc_16;
1949     LPBYTE thunk;
1950
1951     if (!code_sel32)
1952     {
1953         if (!ThunkletHeap) THUNK_Init();
1954         code_sel32 = SELECTOR_AllocBlock( (void *)ThunkletHeap, 0x10000,
1955                                           WINE_LDT_FLAGS_CODE | WINE_LDT_FLAGS_32BIT );
1956         if (!code_sel32) return 0;
1957     }
1958     if (!(thunk = HeapAlloc( ThunkletHeap, 0, 32 ))) return 0;
1959
1960     if (!handle) handle = GetModuleHandle16("WIN32S16");
1961     proc_16 = GetProcAddress16(handle, func_name);
1962
1963     /* movl proc_16, $edx */
1964     *thunk++ = 0xba;
1965     *(FARPROC16 *)thunk = proc_16;
1966     thunk += sizeof(FARPROC16);
1967
1968      /* jmpl QT_Thunk */
1969     *thunk++ = 0xea;
1970     *(FARPROC *)thunk = GetProcAddress(GetModuleHandleA("KERNEL32"),"QT_Thunk");
1971     thunk += sizeof(FARPROC16);
1972     *(WORD *)thunk = wine_get_cs();
1973
1974     return MAKESEGPTR( code_sel32, (char *)thunk - (char *)ThunkletHeap );
1975 }
1976
1977
1978 /***********************************************************************
1979  *              GetWin16DOSEnv                  (KERNEL32.34)
1980  * Returns some internal value.... probably the default environment database?
1981  */
1982 DWORD WINAPI GetWin16DOSEnv()
1983 {
1984         FIXME("stub, returning 0\n");
1985         return 0;
1986 }
1987
1988 /**********************************************************************
1989  *           GetPK16SysVar    (KERNEL32.92)
1990  */
1991 LPVOID WINAPI GetPK16SysVar(void)
1992 {
1993     static BYTE PK16SysVar[128];
1994
1995     FIXME("()\n");
1996     return PK16SysVar;
1997 }
1998
1999 /**********************************************************************
2000  *           CommonUnimpStub    (KERNEL32.17)
2001  */
2002 void WINAPI CommonUnimpStub( CONTEXT86 *context )
2003 {
2004     if (context->Eax)
2005         MESSAGE( "*** Unimplemented Win32 API: %s\n", (LPSTR)context->Eax );
2006
2007     switch ((context->Ecx >> 4) & 0x0f)
2008     {
2009     case 15:  context->Eax = -1;   break;
2010     case 14:  context->Eax = 0x78; break;
2011     case 13:  context->Eax = 0x32; break;
2012     case 1:   context->Eax = 1;    break;
2013     default:  context->Eax = 0;    break;
2014     }
2015
2016     context->Esp += (context->Ecx & 0x0f) * 4;
2017 }
2018
2019 /**********************************************************************
2020  *           HouseCleanLogicallyDeadHandles    (KERNEL32.33)
2021  */
2022 void WINAPI HouseCleanLogicallyDeadHandles(void)
2023 {
2024     /* Whatever this is supposed to do, our handles probably
2025        don't need it :-) */
2026 }
2027
2028 /**********************************************************************
2029  *              @ (KERNEL32.100)
2030  */
2031 BOOL WINAPI _KERNEL32_100(HANDLE threadid,DWORD exitcode,DWORD x)
2032 {
2033         FIXME("(%p,%ld,0x%08lx): stub\n",threadid,exitcode,x);
2034         return TRUE;
2035 }
2036
2037 /**********************************************************************
2038  *              @ (KERNEL32.99)
2039  *
2040  * Checks whether the clock has to be switched from daylight
2041  * savings time to standard time or vice versa.
2042  *
2043  */
2044 DWORD WINAPI _KERNEL32_99(DWORD x)
2045 {
2046         FIXME("(0x%08lx): stub\n",x);
2047         return 1;
2048 }
2049
2050
2051 /**********************************************************************
2052  *           Catch    (KERNEL.55)
2053  *
2054  * Real prototype is:
2055  *   INT16 WINAPI Catch( LPCATCHBUF lpbuf );
2056  */
2057 void WINAPI Catch16( LPCATCHBUF lpbuf, CONTEXT86 *context )
2058 {
2059     /* Note: we don't save the current ss, as the catch buffer is */
2060     /* only 9 words long. Hopefully no one will have the silly    */
2061     /* idea to change the current stack before calling Throw()... */
2062
2063     /* Windows uses:
2064      * lpbuf[0] = ip
2065      * lpbuf[1] = cs
2066      * lpbuf[2] = sp
2067      * lpbuf[3] = bp
2068      * lpbuf[4] = si
2069      * lpbuf[5] = di
2070      * lpbuf[6] = ds
2071      * lpbuf[7] = unused
2072      * lpbuf[8] = ss
2073      */
2074
2075     lpbuf[0] = LOWORD(context->Eip);
2076     lpbuf[1] = context->SegCs;
2077     /* Windows pushes 4 more words before saving sp */
2078     lpbuf[2] = LOWORD(context->Esp) - 4 * sizeof(WORD);
2079     lpbuf[3] = LOWORD(context->Ebp);
2080     lpbuf[4] = LOWORD(context->Esi);
2081     lpbuf[5] = LOWORD(context->Edi);
2082     lpbuf[6] = context->SegDs;
2083     lpbuf[7] = 0;
2084     lpbuf[8] = context->SegSs;
2085     SET_AX( context, 0 );  /* Return 0 */
2086 }
2087
2088
2089 /**********************************************************************
2090  *           Throw    (KERNEL.56)
2091  *
2092  * Real prototype is:
2093  *   INT16 WINAPI Throw( LPCATCHBUF lpbuf, INT16 retval );
2094  */
2095 void WINAPI Throw16( LPCATCHBUF lpbuf, INT16 retval, CONTEXT86 *context )
2096 {
2097     STACK16FRAME *pFrame;
2098     STACK32FRAME *frame32;
2099
2100     SET_AX( context, retval );
2101
2102     /* Find the frame32 corresponding to the frame16 we are jumping to */
2103     pFrame = CURRENT_STACK16;
2104     frame32 = pFrame->frame32;
2105     while (frame32 && frame32->frame16)
2106     {
2107         if (OFFSETOF(frame32->frame16) < OFFSETOF(NtCurrentTeb()->cur_stack))
2108             break;  /* Something strange is going on */
2109         if (OFFSETOF(frame32->frame16) > lpbuf[2])
2110         {
2111             /* We found the right frame */
2112             pFrame->frame32 = frame32;
2113             break;
2114         }
2115         frame32 = ((STACK16FRAME *)MapSL(frame32->frame16))->frame32;
2116     }
2117     RtlUnwind( &pFrame->frame32->frame, NULL, NULL, 0 );
2118
2119     context->Eip = lpbuf[0];
2120     context->SegCs  = lpbuf[1];
2121     context->Esp = lpbuf[2] + 4 * sizeof(WORD) - sizeof(WORD) /*extra arg*/;
2122     context->Ebp = lpbuf[3];
2123     context->Esi = lpbuf[4];
2124     context->Edi = lpbuf[5];
2125     context->SegDs  = lpbuf[6];
2126
2127     if (lpbuf[8] != context->SegSs)
2128         ERR("Switching stack segment with Throw() not supported; expect crash now\n" );
2129 }