Fixes recursion bug in disambiguate_in().
[ohcount] / src / parsers / awk.rl
1 // awk.rl written by Mitchell Foral. mitchell<att>caladbolg<dott>net
2
3 /************************* Required for every parser *************************/
4 #ifndef OHCOUNT_AWK_PARSER_H
5 #define OHCOUNT_AWK_PARSER_H
6
7 #include "../parser_macros.h"
8
9 // the name of the language
10 const char *AWK_LANG = LANG_AWK;
11
12 // the languages entities
13 const char *awk_entities[] = {
14   "space", "comment", "string", "any"
15 };
16
17 // constants associated with the entities
18 enum {
19   AWK_SPACE = 0, AWK_COMMENT, AWK_STRING, AWK_ANY
20 };
21
22 /*****************************************************************************/
23
24 %%{
25   machine awk;
26   write data;
27   include common "common.rl";
28
29   # Line counting machine
30
31   action awk_ccallback {
32     switch(entity) {
33     case AWK_SPACE:
34       ls
35       break;
36     case AWK_ANY:
37       code
38       break;
39     case INTERNAL_NL:
40       std_internal_newline(AWK_LANG)
41       break;
42     case NEWLINE:
43       std_newline(AWK_LANG)
44     }
45   }
46
47   awk_comment = '#' @comment nonnewline*;
48
49   awk_dq_str = '"' @code ([^\r\n\f"\\] | '\\' nonnewline)* '"';
50   awk_regex = '/' @code ([^\r\n\f/\\] | '\\' nonnewline)* '/';
51   awk_string = awk_dq_str | awk_regex;
52
53   awk_line := |*
54     spaces       ${ entity = AWK_SPACE; } => awk_ccallback;
55     awk_comment;
56     awk_string;
57     newline      ${ entity = NEWLINE;   } => awk_ccallback;
58     ^space       ${ entity = AWK_ANY;   } => awk_ccallback;
59   *|;
60
61   # Entity machine
62
63   action awk_ecallback {
64     callback(AWK_LANG, awk_entities[entity], cint(ts), cint(te), userdata);
65   }
66
67   awk_comment_entity = '#' nonnewline*;
68
69   awk_entity := |*
70     space+             ${ entity = AWK_SPACE;   } => awk_ecallback;
71     awk_comment_entity ${ entity = AWK_COMMENT; } => awk_ecallback;
72     # TODO:
73     ^space;
74   *|;
75 }%%
76
77 /************************* Required for every parser *************************/
78
79 /* Parses a string buffer with Awk code.
80  *
81  * @param *buffer The string to parse.
82  * @param length The length of the string to parse.
83  * @param count Integer flag specifying whether or not to count lines. If yes,
84  *   uses the Ragel machine optimized for counting. Otherwise uses the Ragel
85  *   machine optimized for returning entity positions.
86  * @param *callback Callback function. If count is set, callback is called for
87  *   every line of code, comment, or blank with 'lcode', 'lcomment', and
88  *   'lblank' respectively. Otherwise callback is called for each entity found.
89  */
90 void parse_awk(char *buffer, int length, int count,
91                void (*callback) (const char *lang, const char *entity, int s,
92                                  int e, void *udata),
93                void *userdata
94   ) {
95   init
96
97   %% write init;
98   cs = (count) ? awk_en_awk_line : awk_en_awk_entity;
99   %% write exec;
100
101   // if no newline at EOF; callback contents of last line
102   if (count) { process_last_line(AWK_LANG) }
103 }
104
105 #endif
106
107 /*****************************************************************************/