vbscript: Added multiplicative expression parser/compiler implementation.
[wine] / dlls / vbscript / compile.c
1 /*
2  * Copyright 2011 Jacek Caban for CodeWeavers
3  *
4  * This library is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU Lesser General Public
6  * License as published by the Free Software Foundation; either
7  * version 2.1 of the License, or (at your option) any later version.
8  *
9  * This library is distributed in the hope that it will be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12  * Lesser General Public License for more details.
13  *
14  * You should have received a copy of the GNU Lesser General Public
15  * License along with this library; if not, write to the Free Software
16  * Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
17  */
18
19 #include <assert.h>
20
21 #include "vbscript.h"
22 #include "parse.h"
23 #include "parser.tab.h"
24
25 #include "wine/debug.h"
26
27 WINE_DEFAULT_DEBUG_CHANNEL(vbscript);
28 WINE_DECLARE_DEBUG_CHANNEL(vbscript_disas);
29
30 typedef struct {
31     parser_ctx_t parser;
32
33     unsigned instr_cnt;
34     unsigned instr_size;
35     vbscode_t *code;
36
37     unsigned *labels;
38     unsigned labels_size;
39     unsigned labels_cnt;
40
41     dim_decl_t *dim_decls;
42     dynamic_var_t *global_vars;
43 } compile_ctx_t;
44
45 static HRESULT compile_expression(compile_ctx_t*,expression_t*);
46 static HRESULT compile_statement(compile_ctx_t*,statement_t*);
47
48 static const struct {
49     const char *op_str;
50     instr_arg_type_t arg1_type;
51     instr_arg_type_t arg2_type;
52 } instr_info[] = {
53 #define X(n,a,b,c) {#n,b,c},
54 OP_LIST
55 #undef X
56 };
57
58 static void dump_instr_arg(instr_arg_type_t type, instr_arg_t *arg)
59 {
60     switch(type) {
61     case ARG_STR:
62     case ARG_BSTR:
63         TRACE_(vbscript_disas)("\t%s", debugstr_w(arg->str));
64         break;
65     case ARG_INT:
66         TRACE_(vbscript_disas)("\t%d", arg->uint);
67         break;
68     case ARG_UINT:
69     case ARG_ADDR:
70         TRACE_(vbscript_disas)("\t%u", arg->uint);
71         break;
72     case ARG_DOUBLE:
73         TRACE_(vbscript_disas)("\t%lf", *arg->dbl);
74         break;
75     case ARG_NONE:
76         break;
77     default:
78         assert(0);
79     }
80 }
81
82 static void dump_code(compile_ctx_t *ctx)
83 {
84     instr_t *instr;
85
86     for(instr = ctx->code->instrs; instr < ctx->code->instrs+ctx->instr_cnt; instr++) {
87         TRACE_(vbscript_disas)("%d:\t%s", instr-ctx->code->instrs, instr_info[instr->op].op_str);
88         dump_instr_arg(instr_info[instr->op].arg1_type, &instr->arg1);
89         dump_instr_arg(instr_info[instr->op].arg2_type, &instr->arg2);
90         TRACE_(vbscript_disas)("\n");
91     }
92 }
93
94 static inline void *compiler_alloc(vbscode_t *vbscode, size_t size)
95 {
96     return vbsheap_alloc(&vbscode->heap, size);
97 }
98
99 static WCHAR *compiler_alloc_string(vbscode_t *vbscode, const WCHAR *str)
100 {
101     size_t size;
102     WCHAR *ret;
103
104     size = (strlenW(str)+1)*sizeof(WCHAR);
105     ret = compiler_alloc(vbscode, size);
106     if(ret)
107         memcpy(ret, str, size);
108     return ret;
109 }
110
111 static inline instr_t *instr_ptr(compile_ctx_t *ctx, unsigned id)
112 {
113     assert(id < ctx->instr_cnt);
114     return ctx->code->instrs + id;
115 }
116
117 static unsigned push_instr(compile_ctx_t *ctx, vbsop_t op)
118 {
119     assert(ctx->instr_size && ctx->instr_size >= ctx->instr_cnt);
120
121     if(ctx->instr_size == ctx->instr_cnt) {
122         instr_t *new_instr;
123
124         new_instr = heap_realloc(ctx->code->instrs, ctx->instr_size*2*sizeof(instr_t));
125         if(!new_instr)
126             return -1;
127
128         ctx->code->instrs = new_instr;
129         ctx->instr_size *= 2;
130     }
131
132     ctx->code->instrs[ctx->instr_cnt].op = op;
133     return ctx->instr_cnt++;
134 }
135
136 static HRESULT push_instr_int(compile_ctx_t *ctx, vbsop_t op, LONG arg)
137 {
138     unsigned ret;
139
140     ret = push_instr(ctx, op);
141     if(ret == -1)
142         return E_OUTOFMEMORY;
143
144     instr_ptr(ctx, ret)->arg1.lng = arg;
145     return S_OK;
146 }
147
148 static HRESULT push_instr_addr(compile_ctx_t *ctx, vbsop_t op, unsigned arg)
149 {
150     unsigned ret;
151
152     ret = push_instr(ctx, op);
153     if(ret == -1)
154         return E_OUTOFMEMORY;
155
156     instr_ptr(ctx, ret)->arg1.uint = arg;
157     return S_OK;
158 }
159
160 static HRESULT push_instr_str(compile_ctx_t *ctx, vbsop_t op, const WCHAR *arg)
161 {
162     unsigned instr;
163     WCHAR *str;
164
165     str = compiler_alloc_string(ctx->code, arg);
166     if(!str)
167         return E_OUTOFMEMORY;
168
169     instr = push_instr(ctx, op);
170     if(instr == -1)
171         return E_OUTOFMEMORY;
172
173     instr_ptr(ctx, instr)->arg1.str = str;
174     return S_OK;
175 }
176
177 static HRESULT push_instr_double(compile_ctx_t *ctx, vbsop_t op, double arg)
178 {
179     unsigned instr;
180     double *d;
181
182     d = compiler_alloc(ctx->code, sizeof(double));
183     if(!d)
184         return E_OUTOFMEMORY;
185
186     instr = push_instr(ctx, op);
187     if(instr == -1)
188         return E_OUTOFMEMORY;
189
190     *d = arg;
191     instr_ptr(ctx, instr)->arg1.dbl = d;
192     return S_OK;
193 }
194
195 static BSTR alloc_bstr_arg(compile_ctx_t *ctx, const WCHAR *str)
196 {
197     if(!ctx->code->bstr_pool_size) {
198         ctx->code->bstr_pool = heap_alloc(8 * sizeof(BSTR));
199         if(!ctx->code->bstr_pool)
200             return NULL;
201         ctx->code->bstr_pool_size = 8;
202     }else if(ctx->code->bstr_pool_size == ctx->code->bstr_cnt) {
203        BSTR *new_pool;
204
205         new_pool = heap_realloc(ctx->code->bstr_pool, ctx->code->bstr_pool_size*2*sizeof(BSTR));
206         if(!new_pool)
207             return NULL;
208
209         ctx->code->bstr_pool = new_pool;
210         ctx->code->bstr_pool_size *= 2;
211     }
212
213     ctx->code->bstr_pool[ctx->code->bstr_cnt] = SysAllocString(str);
214     if(!ctx->code->bstr_pool[ctx->code->bstr_cnt])
215         return NULL;
216
217     return ctx->code->bstr_pool[ctx->code->bstr_cnt++];
218 }
219
220 static HRESULT push_instr_bstr(compile_ctx_t *ctx, vbsop_t op, const WCHAR *arg)
221 {
222     unsigned instr;
223     BSTR bstr;
224
225     bstr = alloc_bstr_arg(ctx, arg);
226     if(!bstr)
227         return E_OUTOFMEMORY;
228
229     instr = push_instr(ctx, op);
230     if(instr == -1)
231         return E_OUTOFMEMORY;
232
233     instr_ptr(ctx, instr)->arg1.bstr = bstr;
234     return S_OK;
235 }
236
237 static HRESULT push_instr_bstr_uint(compile_ctx_t *ctx, vbsop_t op, const WCHAR *arg1, unsigned arg2)
238 {
239     unsigned instr;
240     BSTR bstr;
241
242     bstr = alloc_bstr_arg(ctx, arg1);
243     if(!bstr)
244         return E_OUTOFMEMORY;
245
246     instr = push_instr(ctx, op);
247     if(instr == -1)
248         return E_OUTOFMEMORY;
249
250     instr_ptr(ctx, instr)->arg1.bstr = bstr;
251     instr_ptr(ctx, instr)->arg2.uint = arg2;
252     return S_OK;
253 }
254
255 #define LABEL_FLAG 0x80000000
256
257 static unsigned alloc_label(compile_ctx_t *ctx)
258 {
259     if(!ctx->labels_size) {
260         ctx->labels = heap_alloc(8 * sizeof(*ctx->labels));
261         if(!ctx->labels)
262             return -1;
263         ctx->labels_size = 8;
264     }else if(ctx->labels_size == ctx->labels_cnt) {
265         unsigned *new_labels;
266
267         new_labels = heap_realloc(ctx->labels, 2*ctx->labels_size*sizeof(*ctx->labels));
268         if(!new_labels)
269             return -1;
270
271         ctx->labels = new_labels;
272         ctx->labels_size *= 2;
273     }
274
275     return ctx->labels_cnt++ | LABEL_FLAG;
276 }
277
278 static inline void label_set_addr(compile_ctx_t *ctx, unsigned label)
279 {
280     assert(label & LABEL_FLAG);
281     ctx->labels[label & ~LABEL_FLAG] = ctx->instr_cnt;
282 }
283
284 static HRESULT compile_args(compile_ctx_t *ctx, expression_t *args, unsigned *ret)
285 {
286     unsigned arg_cnt = 0;
287     HRESULT hres;
288
289     while(args) {
290         hres = compile_expression(ctx, args);
291         if(FAILED(hres))
292             return hres;
293
294         arg_cnt++;
295         args = args->next;
296     }
297
298     *ret = arg_cnt;
299     return S_OK;
300 }
301
302 static HRESULT compile_member_expression(compile_ctx_t *ctx, member_expression_t *expr, BOOL ret_val)
303 {
304     unsigned arg_cnt = 0;
305     HRESULT hres;
306
307     hres = compile_args(ctx, expr->args, &arg_cnt);
308     if(FAILED(hres))
309         return hres;
310
311     if(expr->obj_expr) {
312         FIXME("obj_expr not implemented\n");
313         hres = E_NOTIMPL;
314     }else {
315         hres = push_instr_bstr_uint(ctx, ret_val ? OP_icall : OP_icallv, expr->identifier, arg_cnt);
316     }
317
318     return hres;
319 }
320
321 static HRESULT compile_unary_expression(compile_ctx_t *ctx, unary_expression_t *expr, vbsop_t op)
322 {
323     HRESULT hres;
324
325     hres = compile_expression(ctx, expr->subexpr);
326     if(FAILED(hres))
327         return hres;
328
329     return push_instr(ctx, op) == -1 ? E_OUTOFMEMORY : S_OK;
330 }
331
332 static HRESULT compile_binary_expression(compile_ctx_t *ctx, binary_expression_t *expr, vbsop_t op)
333 {
334     HRESULT hres;
335
336     hres = compile_expression(ctx, expr->left);
337     if(FAILED(hres))
338         return hres;
339
340     hres = compile_expression(ctx, expr->right);
341     if(FAILED(hres))
342         return hres;
343
344     return push_instr(ctx, op) == -1 ? E_OUTOFMEMORY : S_OK;
345 }
346
347 static HRESULT compile_expression(compile_ctx_t *ctx, expression_t *expr)
348 {
349     switch(expr->type) {
350     case EXPR_ADD:
351         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_add);
352     case EXPR_BOOL:
353         return push_instr_int(ctx, OP_bool, ((bool_expression_t*)expr)->value);
354     case EXPR_CONCAT:
355         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_concat);
356     case EXPR_DIV:
357         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_div);
358     case EXPR_DOUBLE:
359         return push_instr_double(ctx, OP_double, ((double_expression_t*)expr)->value);
360     case EXPR_EMPTY:
361         return push_instr(ctx, OP_empty) != -1 ? S_OK : E_OUTOFMEMORY;
362     case EXPR_EQUAL:
363         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_equal);
364     case EXPR_IDIV:
365         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_idiv);
366     case EXPR_MEMBER:
367         return compile_member_expression(ctx, (member_expression_t*)expr, TRUE);
368     case EXPR_MOD:
369         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_mod);
370     case EXPR_MUL:
371         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_mul);
372     case EXPR_NEG:
373         return compile_unary_expression(ctx, (unary_expression_t*)expr, OP_neg);
374     case EXPR_NEQUAL:
375         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_nequal);
376     case EXPR_NOT:
377         return compile_unary_expression(ctx, (unary_expression_t*)expr, OP_not);
378     case EXPR_NULL:
379         return push_instr(ctx, OP_null) != -1 ? S_OK : E_OUTOFMEMORY;
380     case EXPR_STRING:
381         return push_instr_str(ctx, OP_string, ((string_expression_t*)expr)->value);
382     case EXPR_SUB:
383         return compile_binary_expression(ctx, (binary_expression_t*)expr, OP_sub);
384     case EXPR_USHORT:
385         return push_instr_int(ctx, OP_short, ((int_expression_t*)expr)->value);
386     case EXPR_ULONG:
387         return push_instr_int(ctx, OP_long, ((int_expression_t*)expr)->value);
388     default:
389         FIXME("Unimplemented expression type %d\n", expr->type);
390         return E_NOTIMPL;
391     }
392
393     return S_OK;
394 }
395
396 static HRESULT compile_if_statement(compile_ctx_t *ctx, if_statement_t *stat)
397 {
398     unsigned cnd_jmp, endif_label = -1;
399     elseif_decl_t *elseif_decl;
400     HRESULT hres;
401
402     hres = compile_expression(ctx, stat->expr);
403     if(FAILED(hres))
404         return hres;
405
406     cnd_jmp = push_instr(ctx, OP_jmp_false);
407     if(cnd_jmp == -1)
408         return E_OUTOFMEMORY;
409
410     hres = compile_statement(ctx, stat->if_stat);
411     if(FAILED(hres))
412         return hres;
413
414     if(stat->else_stat || stat->elseifs) {
415         endif_label = alloc_label(ctx);
416         if(endif_label == -1)
417             return E_OUTOFMEMORY;
418
419         hres = push_instr_addr(ctx, OP_jmp, endif_label);
420         if(FAILED(hres))
421             return hres;
422     }
423
424     for(elseif_decl = stat->elseifs; elseif_decl; elseif_decl = elseif_decl->next) {
425         instr_ptr(ctx, cnd_jmp)->arg1.uint = ctx->instr_cnt;
426
427         hres = compile_expression(ctx, elseif_decl->expr);
428         if(FAILED(hres))
429             return hres;
430
431         cnd_jmp = push_instr(ctx, OP_jmp_false);
432         if(cnd_jmp == -1)
433             return E_OUTOFMEMORY;
434
435         hres = compile_statement(ctx, elseif_decl->stat);
436         if(FAILED(hres))
437             return hres;
438
439         hres = push_instr_addr(ctx, OP_jmp, endif_label);
440         if(FAILED(hres))
441             return hres;
442     }
443
444     instr_ptr(ctx, cnd_jmp)->arg1.uint = ctx->instr_cnt;
445
446     if(stat->else_stat) {
447         hres = compile_statement(ctx, stat->else_stat);
448         if(FAILED(hres))
449             return hres;
450     }
451
452     if(endif_label != -1)
453         label_set_addr(ctx, endif_label);
454     return S_OK;
455 }
456
457 static HRESULT compile_assign_statement(compile_ctx_t *ctx, assign_statement_t *stat)
458 {
459     HRESULT hres;
460
461     hres = compile_expression(ctx, stat->value_expr);
462     if(FAILED(hres))
463         return hres;
464
465     if(stat->member_expr->args) {
466         FIXME("arguments support not implemented\n");
467         return E_NOTIMPL;
468     }
469
470     if(stat->member_expr->obj_expr) {
471         hres = compile_expression(ctx, stat->member_expr->obj_expr);
472         if(FAILED(hres))
473             return hres;
474
475         hres = push_instr_bstr(ctx, OP_assign_member, stat->member_expr->identifier);
476     }else {
477         hres = push_instr_bstr(ctx, OP_assign_ident, stat->member_expr->identifier);
478     }
479
480     return hres;
481 }
482
483 static BOOL lookup_dim_decls(compile_ctx_t *ctx, const WCHAR *name)
484 {
485     dim_decl_t *dim_decl;
486
487     for(dim_decl = ctx->dim_decls; dim_decl; dim_decl = dim_decl->next) {
488         if(!strcmpiW(dim_decl->name, name))
489             return TRUE;
490     }
491
492     return FALSE;
493 }
494
495 static HRESULT compile_dim_statement(compile_ctx_t *ctx, dim_statement_t *stat)
496 {
497     dim_decl_t *dim_decl = stat->dim_decls;
498
499     while(1) {
500         if(lookup_dim_decls(ctx, dim_decl->name)) {
501             FIXME("dim %s name redefined\n", debugstr_w(dim_decl->name));
502             return E_FAIL;
503         }
504
505         if(!dim_decl->next)
506             break;
507         dim_decl = dim_decl->next;
508     }
509
510     dim_decl->next = ctx->dim_decls;
511     ctx->dim_decls = stat->dim_decls;
512     return S_OK;
513 }
514
515 static HRESULT compile_statement(compile_ctx_t *ctx, statement_t *stat)
516 {
517     HRESULT hres;
518
519     while(stat) {
520         switch(stat->type) {
521         case STAT_ASSIGN:
522             hres = compile_assign_statement(ctx, (assign_statement_t*)stat);
523             break;
524         case STAT_CALL:
525             hres = compile_member_expression(ctx, ((call_statement_t*)stat)->expr, FALSE);
526             break;
527         case STAT_DIM:
528             hres = compile_dim_statement(ctx, (dim_statement_t*)stat);
529             break;
530         case STAT_IF:
531             hres = compile_if_statement(ctx, (if_statement_t*)stat);
532             break;
533         default:
534             FIXME("Unimplemented statement type %d\n", stat->type);
535             hres = E_NOTIMPL;
536         }
537
538         if(FAILED(hres))
539             return hres;
540         stat = stat->next;
541     }
542
543     return S_OK;
544 }
545
546 static void resolve_labels(compile_ctx_t *ctx)
547 {
548     instr_t *instr;
549
550     for(instr = ctx->code->instrs; instr < ctx->code->instrs+ctx->instr_cnt; instr++) {
551         if(instr_info[instr->op].arg1_type == ARG_ADDR && (instr->arg1.uint & LABEL_FLAG)) {
552             assert((instr->arg1.uint & ~LABEL_FLAG) < ctx->labels_cnt);
553             instr->arg1.uint = ctx->labels[instr->arg1.uint & ~LABEL_FLAG];
554         }
555         assert(instr_info[instr->op].arg2_type != ARG_ADDR);
556     }
557
558     ctx->labels_cnt = 0;
559 }
560
561 static HRESULT compile_func(compile_ctx_t *ctx, statement_t *stat, function_t *func)
562 {
563     HRESULT hres;
564
565     func->code_off = ctx->instr_cnt;
566
567     hres = compile_statement(ctx, stat);
568     if(FAILED(hres))
569         return hres;
570
571     if(push_instr(ctx, OP_ret) == -1)
572         return E_OUTOFMEMORY;
573
574     resolve_labels(ctx);
575
576     if(ctx->dim_decls) {
577         dim_decl_t *dim_decl;
578         dynamic_var_t *new_var;
579
580         for(dim_decl = ctx->dim_decls; dim_decl; dim_decl = dim_decl->next) {
581             new_var = compiler_alloc(ctx->code, sizeof(*new_var));
582             if(!new_var)
583                 return E_OUTOFMEMORY;
584
585             new_var->name = compiler_alloc_string(ctx->code, dim_decl->name);
586             if(!new_var->name)
587                 return E_OUTOFMEMORY;
588
589             V_VT(&new_var->v) = VT_EMPTY;
590
591             new_var->next = ctx->global_vars;
592             ctx->global_vars = new_var;
593         }
594     }
595
596     return S_OK;
597 }
598
599 static BOOL lookup_script_identifier(script_ctx_t *script, const WCHAR *identifier)
600 {
601     dynamic_var_t *var;
602
603     for(var = script->global_vars; var; var = var->next) {
604         if(!strcmpiW(var->name, identifier))
605             return TRUE;
606     }
607
608     return FALSE;
609 }
610
611 static HRESULT check_script_collisions(compile_ctx_t *ctx, script_ctx_t *script)
612 {
613     dynamic_var_t *var;
614
615     for(var = ctx->global_vars; var; var = var->next) {
616         if(lookup_script_identifier(script, var->name)) {
617             FIXME("%s: redefined\n", debugstr_w(var->name));
618             return E_FAIL;
619         }
620     }
621
622     return S_OK;
623 }
624
625 void release_vbscode(vbscode_t *code)
626 {
627     unsigned i;
628
629     list_remove(&code->entry);
630
631     for(i=0; i < code->bstr_cnt; i++)
632         SysFreeString(code->bstr_pool[i]);
633
634     vbsheap_free(&code->heap);
635
636     heap_free(code->bstr_pool);
637     heap_free(code->source);
638     heap_free(code->instrs);
639     heap_free(code);
640 }
641
642 static vbscode_t *alloc_vbscode(compile_ctx_t *ctx, const WCHAR *source)
643 {
644     vbscode_t *ret;
645
646     ret = heap_alloc(sizeof(*ret));
647     if(!ret)
648         return NULL;
649
650     ret->source = heap_strdupW(source);
651     if(!ret->source) {
652         heap_free(ret);
653         return NULL;
654     }
655
656     ret->instrs = heap_alloc(32*sizeof(instr_t));
657     if(!ret->instrs) {
658         release_vbscode(ret);
659         return NULL;
660     }
661
662     ctx->instr_cnt = 0;
663     ctx->instr_size = 32;
664     vbsheap_init(&ret->heap);
665
666     ret->option_explicit = ctx->parser.option_explicit;
667
668     ret->bstr_pool = NULL;
669     ret->bstr_pool_size = 0;
670     ret->bstr_cnt = 0;
671
672     ret->global_code.code_ctx = ret;
673
674     list_init(&ret->entry);
675     return ret;
676 }
677
678 HRESULT compile_script(script_ctx_t *script, const WCHAR *src, vbscode_t **ret)
679 {
680     compile_ctx_t ctx;
681     HRESULT hres;
682
683     hres = parse_script(&ctx.parser, src);
684     if(FAILED(hres))
685         return hres;
686
687     ctx.code = alloc_vbscode(&ctx, src);
688     if(!ctx.code)
689         return E_OUTOFMEMORY;
690
691     ctx.global_vars = NULL;
692     ctx.dim_decls = NULL;
693     ctx.labels = NULL;
694     ctx.labels_cnt = ctx.labels_size = 0;
695
696     hres = compile_func(&ctx, ctx.parser.stats, &ctx.code->global_code);
697     if(FAILED(hres)) {
698         release_vbscode(ctx.code);
699         return hres;
700     }
701
702     hres = check_script_collisions(&ctx, script);
703     if(FAILED(hres)) {
704         release_vbscode(ctx.code);
705         return hres;
706     }
707
708     if(ctx.global_vars) {
709         dynamic_var_t *var;
710
711         for(var = ctx.global_vars; var->next; var = var->next);
712
713         var->next = script->global_vars;
714         script->global_vars = ctx.global_vars;
715     }
716
717     parser_release(&ctx.parser);
718
719     if(TRACE_ON(vbscript_disas))
720         dump_code(&ctx);
721
722     list_add_tail(&script->code_list, &ctx.code->entry);
723     *ret = ctx.code;
724     return S_OK;
725 }