TokyoCabinet pseudo-environment
[rbot] / lib / rbot / messagemapper.rb
1 # First of all we add a method to the Regexp class
2 class Regexp
3
4   # a Regexp has captures when its source has open parenthesis which are
5   # preceded by an even number of slashes and not followed by a question mark
6   #
7   def has_captures?
8     self.source.match(/(?:^|[^\\])(?:\\\\)*\([^?]/)
9   end
10
11   # We may want to remove captures
12   def remove_captures
13     new = self.source.gsub(/(^|[^\\])((?:\\\\)*)\(([^?])/) {
14       "%s%s(?:%s" % [$1, $2, $3]
15     }
16     Regexp.new(new, self.options)
17   end
18
19   # We may want to remove head and tail anchors
20   def remove_head_tail
21     new = self.source.sub(/^\^/,'').sub(/\$$/,'')
22     Regexp.new(new, self.options)
23   end
24
25   # The MessageMapper cleanup method: does both remove_capture
26   # and remove_head_tail
27   def mm_cleanup
28     new = self.source.gsub(/(^|[^\\])((?:\\\\)*)\(([^?])/) {
29       "%s%s(?:%s" % [$1, $2, $3]
30     }.sub(/^\^/,'').sub(/\$$/,'')
31     Regexp.new(new, self.options)
32   end
33 end
34
35 module Irc
36 class Bot
37
38   # MessageMapper is a class designed to reduce the amount of regexps and
39   # string parsing plugins and bot modules need to do, in order to process
40   # and respond to messages.
41   #
42   # You add templates to the MessageMapper which are examined by the handle
43   # method when handling a message. The templates tell the mapper which
44   # method in its parent class (your class) to invoke for that message. The
45   # string is split, optionally defaulted and validated before being passed
46   # to the matched method.
47   #
48   # A template such as "foo :option :otheroption" will match the string "foo
49   # bar baz" and, by default, result in method +foo+ being called, if
50   # present, in the parent class. It will receive two parameters, the
51   # message (derived from BasicUserMessage) and a Hash containing
52   #   {:option => "bar", :otheroption => "baz"}
53   # See the #map method for more details.
54   class MessageMapper
55
56     class Failure
57       STRING   = "template %{template} failed to recognize message %{message}"
58       FRIENDLY = "I failed to understand the command"
59       attr_reader :template
60       attr_reader :message
61       def initialize(tmpl, msg)
62         @template = tmpl
63         @message = msg
64       end
65
66       def to_s
67         STRING % {
68           :template => template.template,
69           :regexp => template.regexp,
70           :message => message.message,
71           :action => template.options[:action]
72         }
73       end
74     end
75
76     # failures with a friendly message
77     class FriendlyFailure < Failure
78       def friendly
79         self.class::FRIENDLY rescue FRIENDLY
80       end
81     end
82
83     class NotPrivateFailure < FriendlyFailure
84       STRING   = "template %{template} is not configured for private messages"
85       FRIENDLY = "the command must not be given in private"
86     end
87
88     class NotPublicFailure < FriendlyFailure
89       STRING   = "template %{template} is not configured for public messages"
90       FRIENDLY = "the command must not be given in public"
91     end
92
93     class NoMatchFailure < Failure
94       STRING = "%{message} does not match %{template} (%{regex})"
95     end
96
97     class PartialMatchFailure < Failure
98       STRING = "%{message} only matches %{template} (%{regex}) partially"
99     end
100
101     class NoActionFailure < FriendlyFailure
102       STRING   = "%{template} calls undefined action %{action}"
103       FRIENDLY = "uh-ho, somebody forgot to tell me how to do that ..."
104     end
105
106     # used to set the method name used as a fallback for unmatched messages.
107     # The default fallback is a method called "usage".
108     attr_writer :fallback
109
110     # _parent_::   parent class which will receive mapped messages
111     #
112     # Create a new MessageMapper with parent class _parent_. This class will
113     # receive messages from the mapper via the handle() method.
114     def initialize(parent)
115       @parent = parent
116       @templates = Array.new
117       @fallback = :usage
118     end
119
120     # call-seq: map(botmodule, template, options)
121     #
122     # _botmodule_:: the BotModule which will handle this map
123     # _template_::  a String describing the messages to be matched
124     # _options_::   a Hash holding variouns options
125     #
126     # This method is used to register a new MessageTemplate that will map any
127     # BasicUserMessage matching the given _template_ to a corresponding action.
128     # A simple example:
129     #   plugin.map 'myplugin :parameter'
130     # (other examples follow).
131     #
132     # By default, the action to which the messages are mapped is a method named
133     # like the first word of the template. The
134     #   :action => 'method_name'
135     # option can be used to override this default behaviour. Example:
136     #   plugin.map 'myplugin :parameter', :action => 'mymethod'
137     #
138     # By default whether a handler is fired depends on an auth check. In rbot
139     # versions up to 0.9.10, the first component of the string was used for the
140     # auth check, unless overridden via the :auth => 'auth_name' option. Since
141     # version 0.9.11, a new auth method has been implemented. TODO document.
142     #
143     # Static parameters (not prefixed with ':' or '*') must match the
144     # respective component of the message exactly. Example:
145     #   plugin.map 'myplugin :foo is :bar'
146     # will only match messages of the form "myplugin something is
147     # somethingelse"
148     #
149     # Dynamic parameters can be specified by a colon ':' to match a single
150     # component (whitespace separated), or a * to suck up all following
151     # parameters into an array. Example:
152     #   plugin.map 'myplugin :parameter1 *rest'
153     #
154     # You can provide defaults for dynamic components using the :defaults
155     # parameter. If a component has a default, then it is optional. e.g:
156     #   plugin.map 'myplugin :foo :bar', :defaults => {:bar => 'qux'}
157     # would match 'myplugin param param2' and also 'myplugin param'. In the
158     # latter case, :bar would be provided from the default.
159     #
160     # Static and dynamic parameters can also be made optional by wrapping them
161     # in square brackets []. For example
162     #   plugin.map 'myplugin :foo [is] :bar'
163     # will match both 'myplugin something is somethingelse' and 'myplugin
164     # something somethingelse'.
165     #
166     # Components can be validated before being allowed to match, for
167     # example if you need a component to be a number:
168     #   plugin.map 'myplugin :param', :requirements => {:param => /^\d+$/}
169     # will only match strings of the form 'myplugin 1234' or some other
170     # number.
171     #
172     # Templates can be set not to match public or private messages using the
173     # :public or :private boolean options.
174     #
175     # Summary of recognized options:
176     #
177     # action::
178     #   method to call when the template is matched
179     # auth_path::
180     #   TODO document
181     # requirements::
182     #   a Hash whose keys are names of dynamic parameters and whose values are
183     #   regular expressions that the parameters must match
184     # defaults::
185     #   a Hash whose keys are names of dynamic parameters and whose values are
186     #   the values to be assigned to those parameters when they are missing from
187     #   the message. Any dynamic parameter appearing in the :defaults Hash is
188     #   therefore optional
189     # public::
190     #   a boolean (defaults to true) that determines whether the template should
191     #   match public (in channel) messages.
192     # private::
193     #   a boolean (defaults to true) that determines whether the template should
194     #   match private (not in channel) messages.
195     # threaded::
196     #   a boolean (defaults to false) that determines whether the action should be
197     #   called in a separate thread.
198     #
199     #
200     # Further examples:
201     #
202     #   # match 'karmastats' and call my stats() method
203     #   plugin.map 'karmastats', :action => 'stats'
204     #   # match 'karma' with an optional 'key' and call my karma() method
205     #   plugin.map 'karma :key', :defaults => {:key => false}
206     #   # match 'karma for something' and call my karma() method
207     #   plugin.map 'karma for :key'
208     #
209     #   # two matches, one for public messages in a channel, one for
210     #   # private messages which therefore require a channel argument
211     #   plugin.map 'urls search :channel :limit :string',
212     #             :action => 'search',
213     #             :defaults => {:limit => 4},
214     #             :requirements => {:limit => /^\d+$/},
215     #             :public => false
216     #   plugin.map 'urls search :limit :string',
217     #             :action => 'search',
218     #             :defaults => {:limit => 4},
219     #             :requirements => {:limit => /^\d+$/},
220     #             :private => false
221     #
222     def map(botmodule, *args)
223       @templates << MessageTemplate.new(botmodule, *args)
224     end
225
226     # Iterate over each MessageTemplate handled.
227     def each
228       @templates.each {|tmpl| yield tmpl}
229     end
230
231     # Return the last added MessageTemplate
232     def last
233       @templates.last
234     end
235
236     # _m_::  derived from BasicUserMessage
237     #
238     # Examine the message _m_, comparing it with each map()'d template to
239     # find and process a match. Templates are examined in the order they
240     # were map()'d - first match wins.
241     #
242     # Returns +true+ if a match is found including fallbacks, +false+
243     # otherwise.
244     def handle(m)
245       return false if @templates.empty?
246       failures = []
247       @templates.each do |tmpl|
248         options = tmpl.recognize(m)
249         if options.kind_of? Failure
250           failures << options
251         else
252           action = tmpl.options[:action]
253           unless @parent.respond_to?(action)
254             failures << NoActionFailure.new(tmpl, m)
255             next
256           end
257           auth = tmpl.options[:full_auth_path]
258           debug "checking auth for #{auth}"
259           if m.bot.auth.allow?(auth, m.source, m.replyto)
260             debug "template match found and auth'd: #{action.inspect} #{options.inspect}"
261             if !m.in_thread && (tmpl.options[:thread] || tmpl.options[:threaded])
262               Thread.new do
263                 begin
264                   @parent.send(action, m, options)
265                 rescue Exception => e
266                   error "In threaded action: #{e.message}"
267                   debug e.backtrace.join("\n")
268                 end
269               end
270             else
271               @parent.send(action, m, options)
272             end
273
274             return true
275           end
276           debug "auth failed for #{auth}"
277           # if it's just an auth failure but otherwise the match is good,
278           # don't try any more handlers
279           return false
280         end
281       end
282       failures.each {|r|
283         debug "#{r.template.inspect} => #{r}"
284       }
285       debug "no handler found, trying fallback"
286       if @fallback && @parent.respond_to?(@fallback)
287         if m.bot.auth.allow?(@fallback, m.source, m.replyto)
288           @parent.send(@fallback, m, {:failures => failures})
289           return true
290         end
291       end
292       return false
293     end
294
295   end
296
297   # MessageParameter is a class that collects all the necessary information
298   # about a message (dynamic) parameter (the :param or *param that can be found
299   # in a #map).
300   #
301   # It has a +name+ attribute, +multi+ and +optional+ booleans that tell if the
302   # parameter collects more than one word, and if it's optional (respectively).
303   # In the latter case, it can also have a default value.
304   #
305   # It is possible to assign a collector to a MessageParameter. This can be either
306   # a Regexp with captures or an Array or a Hash. The collector defines what the
307   # collect() method is supposed to return.
308   class MessageParameter
309     attr_reader :name
310     attr_writer :multi
311     attr_writer :optional
312     attr_accessor :default
313
314     def initialize(name)
315       self.name = name
316       @multi = false
317       @optional = false
318       @default = nil
319       @regexp = nil
320       @index = nil
321     end
322
323     def name=(val)
324       @name = val.to_sym
325     end
326
327     def multi?
328       @multi
329     end
330
331     def optional?
332       @optional
333     end
334
335     # This method is used to turn a matched item into the actual parameter value.
336     # It only does something when collector= set the @regexp to something. In
337     # this case, _val_ is matched against @regexp and then the match result
338     # specified in @index is selected. As a special case, when @index is nil
339     # the first non-nil captured group is returned.
340     def collect(val)
341       return val unless @regexp
342       mdata = @regexp.match(val)
343       if @index
344         return mdata[@index]
345       else
346         return mdata[1..-1].compact.first
347       end
348     end
349
350     # This method allow the plugin programmer to choose to only pick a subset of the
351     # string matched by a parameter. This is done by passing the collector=()
352     # method either a Regexp with captures or an Array or a Hash.
353     #
354     # When the method is passed a Regexp with captures, the collect() method will
355     # return the first non-nil captured group.
356     #
357     # When the method is passed an Array, it will grab a regexp from the first
358     # element, and possibly an index from the second element. The index can
359     # also be nil.
360     #
361     # When the method is passed a Hash, it will grab a regexp from the :regexp
362     # element, and possibly an index from the :index element. The index can
363     # also be nil.
364     def collector=(val)
365       return unless val
366       case val
367       when Regexp
368         return unless val.has_captures?
369         @regexp = val
370       when Array
371         warning "Collector #{val.inspect} is too long, ignoring extra entries" unless val.length <= 2
372         @regexp = val[0]
373         @index = val[1] rescue nil
374       when Hash
375         raise "Collector #{val.inspect} doesn't have a :regexp key" unless val.has_key?(:regexp)
376         @regexp = val[:regexp]
377         @index = val.fetch(:regexp, nil)
378       end
379       raise "The regexp of collector #{val.inspect} isn't a Regexp" unless @regexp.kind_of?(Regexp)
380       raise "The index of collector #{val.inspect} is present but not an integer " if @index and not @index.kind_of?(Fixnum)
381     end
382
383     def inspect
384       mul = multi? ? " multi" : " single"
385       opt = optional? ? " optional" : " needed"
386       if @regexp
387         reg = " regexp=%s index=%s" % [@regexp, @index]
388       else
389         reg = nil
390       end
391       "<%s %s%s%s%s>" % [self.class, name, mul, opt, reg]
392     end
393   end
394
395   # MessageTemplate is the class that holds the actual message template map()'d
396   # by a BotModule and handled by a MessageMapper
397   #
398   class MessageTemplate
399     attr_reader :defaults  # the defaults hash
400     attr_reader :options   # the options hash
401     attr_reader :template  # the actual template string
402     attr_reader :items     # the collection of dynamic and static items in the template
403     attr_reader :regexp    # the Regexp corresponding to the template
404     attr_reader :botmodule # the BotModule that map()'d this MessageTemplate
405
406     # call-seq: initialize(botmodule, template, opts={})
407     #
408     # Create a new MessageTemplate associated to BotModule _botmodule_, with
409     # template _template_ and options _opts_
410     #
411     def initialize(botmodule, template, hash={})
412       raise ArgumentError, "Third argument must be a hash!" unless hash.kind_of?(Hash)
413       @defaults = hash[:defaults].kind_of?(Hash) ? hash.delete(:defaults) : {}
414       @requirements = hash[:requirements].kind_of?(Hash) ? hash.delete(:requirements) : {}
415       @template = template
416       case botmodule
417       when String
418         @botmodule = botmodule
419       when Plugins::BotModule
420         @botmodule = botmodule.name
421       else
422         raise ArgumentError, "#{botmodule.inspect} is not a botmodule nor a botmodule name"
423       end
424
425       self.items = template
426       # @dyn_items is an array of MessageParameters, except for the first entry
427       # which is the template
428       @dyn_items = @items.collect { |it|
429         if it.kind_of?(Symbol)
430           i = it.to_s
431           opt = MessageParameter.new(i)
432           if i.sub!(/^\*/,"")
433             opt.name = i
434             opt.multi = true
435           end
436           opt.default = @defaults[opt.name]
437           opt.collector = @requirements[opt.name]
438           opt
439         else
440           nil
441         end
442       }
443       @dyn_items.unshift(template).compact!
444       debug "Items: #{@items.inspect}; dyn items: #{@dyn_items.inspect}"
445
446       self.regexp = template
447       debug "Command #{template.inspect} in #{@botmodule} will match using #{@regexp}"
448
449       set_auth_path(hash)
450
451       unless hash.has_key?(:action)
452         hash[:action] = items[0]
453       end
454
455       @options = hash
456
457       # debug "Create template #{self.inspect}"
458     end
459
460     def set_auth_path(hash)
461       if hash.has_key?(:auth)
462         warning "Command #{@template.inspect} in #{@botmodule} uses old :auth syntax, please upgrade"
463       end
464       if hash.has_key?(:full_auth_path)
465         warning "Command #{@template.inspect} in #{@botmodule} sets :full_auth_path, please don't do this"
466       else
467         pre = @botmodule
468         words = items.reject{ |x|
469           x == pre || x.kind_of?(Symbol) || x =~ /\[|\]/
470         }
471         if words.empty?
472           post = nil
473         else
474           post = words.first
475         end
476         if hash.has_key?(:auth_path)
477           extra = hash[:auth_path]
478           if extra.sub!(/^:/, "")
479             pre += "::" + post
480             post = nil
481           end
482           if extra.sub!(/:$/, "")
483             if words.length > 1
484               post = [post,words[1]].compact.join("::")
485             end
486           end
487           pre = nil if extra.sub!(/^!/, "")
488           post = nil if extra.sub!(/!$/, "")
489           extra = nil if extra.empty?
490         else
491           extra = nil
492         end
493         hash[:full_auth_path] = [pre,extra,post].compact.join("::")
494         debug "Command #{@template} in #{botmodule} will use authPath #{hash[:full_auth_path]}"
495         # TODO check if the full_auth_path is sane
496       end
497     end
498
499     def items=(str)
500       raise ArgumentError, "template #{str.inspect} should be a String" unless str.kind_of?(String)
501
502       # split and convert ':xyz' to symbols
503       items = str.strip.split(/\]?\s+\[?|\]?$/).collect { |c|
504         # there might be extra (non-alphanumeric) stuff (e.g. punctuation) after the symbol name
505         if /^(:|\*)(\w+)(.*)/ =~ c
506           sym = ($1 == ':' ) ? $2.intern : "*#{$2}".intern
507           if $3.empty?
508             sym
509           else
510             [sym, $3]
511           end
512         else
513           c
514         end
515       }.flatten
516       @items = items
517
518       raise ArgumentError, "Illegal template -- first component cannot be dynamic: #{str.inspect}" if @items.first.kind_of? Symbol
519
520       raise ArgumentError, "Illegal template -- first component cannot be optional: #{str.inspect}" if @items.first =~ /\[|\]/
521
522       # Verify uniqueness of each component.
523       @items.inject({}) do |seen, item|
524         if item.kind_of? Symbol
525           # We must remove the initial * when present,
526           # because the parameters hash will intern both :item and *item as :item
527           it = item.to_s.sub(/^\*/,"").intern
528           raise ArgumentError, "Illegal template -- duplicate item #{it} in #{str.inspect}" if seen.key? it
529           seen[it] = true
530         end
531         seen
532       end
533     end
534
535     def regexp=(str)
536       # debug "Original string: #{str.inspect}"
537       rx = Regexp.escape(str)
538       # debug "Escaped: #{rx.inspect}"
539       rx.gsub!(/((?:\\ )*)(:|\\\*)(\w+)/) { |m|
540         whites = $1
541         is_single = $2 == ":"
542         name = $3.intern
543
544         not_needed = @defaults.has_key?(name)
545
546         has_req = @requirements[name]
547         debug "Requirements for #{name}: #{has_req.inspect}"
548         case has_req
549         when nil
550           sub = is_single ? "\\S+" : ".*?"
551         when Regexp
552           # Remove captures and the ^ and $ that are sometimes placed in requirement regexps
553           sub = has_req.mm_cleanup
554         when String
555           sub = Regexp.escape(has_req)
556         when Array
557           sub = has_req[0].mm_cleanup
558         when Hash
559           sub = has_req[:regexp].mm_cleanup
560         else
561           warning "Odd requirement #{has_req.inspect} of class #{has_req.class} for parameter '#{name}'"
562           sub = Regexp.escape(has_req.to_s) rescue "\\S+"
563         end
564         debug "Regexp for #{name}: #{sub.inspect}"
565         s = "#{not_needed ? "(?:" : ""}#{whites}(#{sub})#{ not_needed ? ")?" : ""}"
566       }
567       # debug "Replaced dyns: #{rx.inspect}"
568       rx.gsub!(/((?:\\ )*)((?:\\\[)+)/, '\2\1')
569       # debug "Corrected optionals spacing: #{rx.inspect}"
570       rx.gsub!(/\\\[/, "(?:")
571       rx.gsub!(/\\\]/, ")?")
572       # debug "Delimited optionals: #{rx.inspect}"
573       rx.gsub!(/(?:\\ )+/, "\\s+")
574       # debug "Corrected spaces: #{rx.inspect}"
575       # Created message (such as by fake_message) can contain multiple lines
576       @regexp = /\A#{rx}\z/m
577     end
578
579     # Recognize the provided string components, returning a hash of
580     # recognized values, or [nil, reason] if the string isn't recognized.
581     def recognize(m)
582
583       debug "Testing #{m.message.inspect} against #{self.inspect}"
584
585       matching = @regexp.match(m.message)
586       return MessageMapper::NoMatchFailure.new(self, m) unless matching
587       return MessageMapper::PartialMatchFailure.new(self, m) unless matching[0] == m.message
588
589       return MessageMapper::NotPrivateFailure.new(self, m) if @options.has_key?(:private) && !@options[:private] && m.private?
590       return MessageMapper::NotPublicFailure.new(self, m) if @options.has_key?(:public) && !@options[:public] && !m.private?
591
592       debug_match = matching[1..-1].collect{ |d| d.inspect}.join(', ')
593       debug "#{m.message.inspect} matched #{@regexp} with #{debug_match}"
594       debug "Associating #{debug_match} with dyn items #{@dyn_items.join(', ')}"
595
596       options = @defaults.dup
597
598       @dyn_items.each_with_index { |it, i|
599         next if i == 0
600         item = it.name
601         debug "dyn item #{item} (multi-word: #{it.multi?.inspect})"
602         if it.multi?
603           if matching[i].nil?
604             default = it.default
605             case default
606             when Array
607               value = default.clone
608             when String
609               value = default.strip.split
610             when nil, false, []
611               value = []
612             else
613               warning "Unmanageable default #{default} detected for :*#{item.to_s}, using []"
614               value = []
615             end
616             case default
617             when String
618               value.instance_variable_set(:@string_value, default)
619             else
620               value.instance_variable_set(:@string_value, value.join(' '))
621             end
622           else
623             value = matching[i].split
624             value.instance_variable_set(:@string_value, matching[i])
625           end
626           def value.to_s
627             @string_value
628           end
629         else
630           if matching[i].nil?
631             warning "No default value for option #{item.inspect} specified" unless @defaults.has_key?(item)
632             value = it.default
633           else
634             value = it.collect(matching[i])
635           end
636         end
637         options[item] = value
638         debug "set #{item} to #{options[item].inspect}"
639       }
640
641       options.delete_if {|k, v| v.nil?} # Remove nil values.
642       return options
643     end
644
645     def inspect
646       when_str = @requirements.empty? ? "" : " when #{@requirements.inspect}"
647       default_str = @defaults.empty? ? "" : " || #{@defaults.inspect}"
648       "<#{self.class.to_s} #{@items.map { |c| c.inspect }.join(' ').inspect}#{default_str}#{when_str}>"
649     end
650
651     def requirements_for(name)
652       name = name.to_s.sub(/^\*/,"").intern if (/^\*/ =~ name.inspect)
653       presence = (@defaults.key?(name) && @defaults[name].nil?)
654       requirement = case @requirements[name]
655         when nil then nil
656         when Regexp then "match #{@requirements[name].inspect}"
657         else "be equal to #{@requirements[name].inspect}"
658       end
659       if presence && requirement then "#{name} must be present and #{requirement}"
660       elsif presence || requirement then "#{name} must #{requirement || 'be present'}"
661       else "#{name} has no requirements"
662       end
663     end
664   end
665 end
666 end