OTWO-1213 Works around lost encoding in Ruby/C binding layer
[ohcount] / src / parsers / nsis.rl
1 // nsis.rl written by Chris Morgan.
2
3 /************************* Required for every parser *************************/
4 #ifndef OHCOUNT_NSIS_PARSER_H
5 #define OHCOUNT_NSIS_PARSER_H
6
7 #include "../parser_macros.h"
8
9 // the name of the language
10 const char *NSIS_LANG = LANG_NSIS;
11
12 // the languages entities
13 const char *nsis_entities[] = {
14   "space", "comment", "string", "any"
15 };
16
17 // constants associated with the entities
18 enum {
19   NSIS_SPACE = 0, NSIS_COMMENT, NSIS_STRING, NSIS_ANY
20 };
21
22 /*****************************************************************************/
23
24 %%{
25   machine nsis;
26   write data;
27   include common "common.rl";
28
29   # Line counting machine
30
31   action nsis_ccallback {
32     switch(entity) {
33     case NSIS_SPACE:
34       ls
35       break;
36     case NSIS_ANY:
37       code
38       break;
39     case INTERNAL_NL:
40       std_internal_newline(NSIS_LANG)
41       break;
42     case NEWLINE:
43       std_newline(NSIS_LANG)
44     }
45   }
46
47   nsis_line_comment = ('#' | ';') @comment nonnewline*;
48   nsis_block_comment =
49     '/*' @comment (
50       newline %{ entity = INTERNAL_NL; } %nsis_ccallback
51       |
52       ws
53       |
54       (nonnewline - ws) @comment
55     )* :>> '*/';
56   nsis_comment = nsis_line_comment | nsis_block_comment;
57
58   nsis_bt_str = '`' @code ([^\r\n\f`\\] | '\\' nonnewline)* '`';
59   nsis_sq_str = '\'' @code ([^\r\n\f'\\] | '\\' nonnewline)* '\'';
60   nsis_dq_str = '"' @code ([^\r\n\f"\\] | '\\' nonnewline)* '"';
61   nsis_string = nsis_bt_str | nsis_sq_str | nsis_dq_str;
62
63   nsis_line := |*
64     spaces        ${ entity = NSIS_SPACE; } => nsis_ccallback;
65     nsis_comment;
66     nsis_string;
67     newline       ${ entity = NEWLINE;    } => nsis_ccallback;
68     ^space        ${ entity = NSIS_ANY;   } => nsis_ccallback;
69   *|;
70
71   # Entity machine
72
73   action nsis_ecallback {
74     callback(NSIS_LANG, nsis_entities[entity], cint(ts), cint(te), userdata);
75   }
76
77   nsis_line_comment_entity = ('#' | '//') nonnewline*;
78   nsis_block_comment_entity = '/*' any* :>> '*/';
79   nsis_comment_entity = nsis_line_comment_entity | nsis_block_comment_entity;
80
81   nsis_entity := |*
82     space+              ${ entity = NSIS_SPACE;   } => nsis_ecallback;
83     nsis_comment_entity ${ entity = NSIS_COMMENT; } => nsis_ecallback;
84     # TODO:
85     ^space;
86   *|;
87 }%%
88
89 /************************* Required for every parser *************************/
90
91 /* Parses a string buffer with NSIS code.
92  *
93  * @param *buffer The string to parse.
94  * @param length The length of the string to parse.
95  * @param count Integer flag specifying whether or not to count lines. If yes,
96  *   uses the Ragel machine optimized for counting. Otherwise uses the Ragel
97  *   machine optimized for returning entity positions.
98  * @param *callback Callback function. If count is set, callback is called for
99  *   every line of code, comment, or blank with 'lcode', 'lcomment', and
100  *   'lblank' respectively. Otherwise callback is called for each entity found.
101  */
102 void parse_nsis(char *buffer, int length, int count,
103                 void (*callback) (const char *lang, const char *entity, int s,
104                                   int e, void *udata),
105                 void *userdata
106   ) {
107   init
108
109   %% write init;
110   cs = (count) ? nsis_en_nsis_line : nsis_en_nsis_entity;
111   %% write exec;
112
113   // if no newline at EOF; callback contents of last line
114   if (count) { process_last_line(NSIS_LANG) }
115 }
116
117 #endif
118
119 /*****************************************************************************/