OTWO-1213 Works around lost encoding in Ruby/C binding layer
[ohcount] / src / parsers / brainfuck.rl
1 // brainfuck.rl written by Boris 'billiob' Faure billiob<att>gmail<dott>com
2
3 /************************* Required for every parser *************************/
4 #ifndef OHCOUNT_BRAINFUCK_PARSER_H
5 #define OHCOUNT_BRAINFUCK_PARSER_H
6
7 #include "../parser_macros.h"
8
9 // the name of the language
10 const char *BRAINFUCK_LANG = LANG_BRAINFUCK;
11
12 // the languages entities
13 const char *brainfuck_entities[] = {
14   "space", "comment", "operator"
15 };
16
17 // constants associated with the entities
18 enum {
19   BRAINFUCK_SPACE = 0, BRAINFUCK_COMMENT, BRAINFUCK_OPERATOR
20 };
21
22 /*****************************************************************************/
23
24 %%{
25   machine brainfuck;
26   write data;
27   include common "common.rl";
28
29   # Line counting machine
30
31   action brainfuck_ccallback {
32     switch(entity) {
33     case BRAINFUCK_SPACE:
34       ls
35       break;
36     case BRAINFUCK_OPERATOR:
37       code
38       break;
39     case BRAINFUCK_COMMENT:
40       comment
41       break;
42     case INTERNAL_NL:
43       std_internal_newline(BRAINFUCK_LANG)
44       break;
45     case NEWLINE:
46       std_newline(BRAINFUCK_LANG)
47     }
48   }
49
50   brainfuck_operator = [+\-<>.,\[\]] @code;
51
52   brainfuck_line := |*
53     spaces             ${ entity = BRAINFUCK_SPACE;    } => brainfuck_ccallback;
54     newline            ${ entity = NEWLINE;            } => brainfuck_ccallback;
55     brainfuck_operator ${ entity = BRAINFUCK_OPERATOR; } => brainfuck_ccallback;
56     ^space             ${ entity = BRAINFUCK_COMMENT;  } => brainfuck_ccallback;
57   *|;
58
59   # Entity machine
60
61   action brainfuck_ecallback {
62     callback(BRAINFUCK_LANG, brainfuck_entities[entity], cint(ts), cint(te), userdata);
63   }
64
65   brainfuck_operator_entity = [+\-<>.,\[\]];
66
67   brainfuck_comment_entity = !(space | brainfuck_operator_entity);
68
69   brainfuck_entity := |*
70     space+                    ${ entity = BRAINFUCK_SPACE;    } => brainfuck_ecallback;
71     brainfuck_operator_entity ${ entity = BRAINFUCK_OPERATOR; } => brainfuck_ecallback;
72     brainfuck_comment_entity  ${ entity = BRAINFUCK_COMMENT;  } => brainfuck_ecallback;
73   *|;
74 }%%
75
76 /************************* Required for every parser *************************/
77
78 /* Parses a string buffer with Brainfuck code.
79  *
80  * @param *buffer The string to parse.
81  * @param length The length of the string to parse.
82  * @param count Integer flag specifying whether or not to count lines. If yes,
83  *   uses the Ragel machine optimized for counting. Otherwise uses the Ragel
84  *   machine optimized for returning entity positions.
85  * @param *callback Callback function. If count is set, callback is called for
86  *   every line of code, comment, or blank with 'lcode', 'lcomment', and
87  *   'lblank' respectively. Otherwise callback is called for each entity found.
88  */
89 void parse_brainfuck(char *buffer, int length, int count,
90              void (*callback) (const char *lang, const char *entity, int s,
91                                int e, void *udata),
92              void *userdata
93   ) {
94   init
95
96   %% write init;
97   cs = (count) ? brainfuck_en_brainfuck_line : brainfuck_en_brainfuck_entity;
98   %% write exec;
99
100   // if no newline at EOF; callback contents of last line
101   if (count) { process_last_line(BRAINFUCK_LANG) }
102 }
103
104 #endif
105
106 /*****************************************************************************/
107