]> git.cworth.org Git - sup/blob - lib/sup/imap.rb
Merge branch 'string-split-fixes' into next
[sup] / lib / sup / imap.rb
1 require 'uri'
2 require 'net/imap'
3 require 'stringio'
4 require 'time'
5 require 'rmail'
6 require 'cgi'
7
8 ## TODO: remove synchronized method protector calls; use a Monitor instead
9 ## (ruby's reentrant mutex)
10
11 ## fucking imap fucking sucks. what the FUCK kind of committee of dunces
12 ## designed this shit.
13 ##
14 ## imap talks about 'unique ids' for messages, to be used for
15 ## cross-session identification. great---just what sup needs! except it
16 ## turns out the uids can be invalidated every time the 'uidvalidity'
17 ## value changes on the server, and 'uidvalidity' can change without
18 ## restriction. it can change any time you log in. it can change EVERY
19 ## time you log in. of course the imap spec "strongly recommends" that it
20 ## never change, but there's nothing to stop people from just setting it
21 ## to the current timestamp, and in fact that's EXACTLY what the one imap
22 ## server i have at my disposal does. thus the so-called uids are
23 ## absolutely useless and imap provides no cross-session way of uniquely
24 ## identifying a message. but thanks for the "strong recommendation",
25 ## guys!
26 ##
27 ## so right now i'm using the 'internal date' and the size of each
28 ## message to uniquely identify it, and i scan over the entire mailbox
29 ## each time i open it to map those things to message ids. that can be
30 ## slow for large mailboxes, and we'll just have to hope that there are
31 ## no collisions. ho ho! a perfectly reasonable solution!
32 ##
33 ## and here's another thing. check out RFC2060 2.2.2 paragraph 5:
34 ##
35 ##   A client MUST be prepared to accept any server response at all
36 ##   times.  This includes server data that was not requested.
37 ##
38 ## yeah. that totally makes a lot of sense. and once again, the idiocy of
39 ## the spec actually happens in practice. you'll request flags for one
40 ## message, and get it interspersed with a random bunch of flags for some
41 ## other messages, including a different set of flags for the same
42 ## message! totally ok by the imap spec. totally retarded by any other
43 ## metric.
44 ##
45 ## fuck you, imap committee. you managed to design something nearly as
46 ## shitty as mbox but goddamn THIRTY YEARS LATER.
47 module Redwood
48
49 class IMAP < Source
50   SCAN_INTERVAL = 60 # seconds
51
52   ## upon these errors we'll try to rereconnect a few times
53   RECOVERABLE_ERRORS = [ Errno::EPIPE, Errno::ETIMEDOUT, OpenSSL::SSL::SSLError ]
54
55   attr_accessor :username, :password
56   yaml_properties :uri, :username, :password, :cur_offset, :usual,
57                   :archived, :id, :labels
58
59   def initialize uri, username, password, last_idate=nil, usual=true, archived=false, id=nil, labels=[]
60     raise ArgumentError, "username and password must be specified" unless username && password
61     raise ArgumentError, "not an imap uri" unless uri =~ %r!imaps?://!
62
63     super uri, last_idate, usual, archived, id
64
65     @parsed_uri = URI(uri)
66     @username = username
67     @password = password
68     @imap = nil
69     @imap_state = {}
70     @ids = []
71     @last_scan = nil
72     @labels = ((labels || []) - LabelManager::RESERVED_LABELS).uniq.freeze
73     @say_id = nil
74     @mutex = Mutex.new
75   end
76
77   def self.suggest_labels_for path
78     path =~ /([^\/]*inbox[^\/]*)/i ? [$1.downcase.intern] : []
79   end
80
81   def host; @parsed_uri.host; end
82   def port; @parsed_uri.port || (ssl? ? 993 : 143); end
83   def mailbox
84     x = @parsed_uri.path[1..-1]
85     (x.nil? || x.empty?) ? 'INBOX' : CGI.unescape(x)
86   end
87   def ssl?; @parsed_uri.scheme == 'imaps' end
88
89   def check; end # do nothing because anything we do will be too slow,
90                  # and we'll catch the errors later.
91
92   ## is this necessary? TODO: remove maybe
93   def == o; o.is_a?(IMAP) && o.uri == self.uri && o.username == self.username; end
94
95   def load_header id
96     parse_raw_email_header StringIO.new(raw_header(id))
97   end
98
99   def load_message id
100     RMail::Parser.read raw_message(id)
101   end
102   
103   def each_raw_message_line id
104     StringIO.new(raw_message(id)).each { |l| yield l }
105   end
106
107   def raw_header id
108     unsynchronized_scan_mailbox
109     header, flags = get_imap_fields id, 'RFC822.HEADER'
110     header.gsub(/\r\n/, "\n")
111   end
112   synchronized :raw_header
113
114   def raw_message id
115     unsynchronized_scan_mailbox
116     get_imap_fields(id, 'RFC822').first.gsub(/\r\n/, "\n")
117   end
118   synchronized :raw_message
119
120   def mark_as_deleted ids
121     ids = [ids].flatten # accept single arguments
122     unsynchronized_scan_mailbox
123     imap_ids = ids.map { |i| @imap_state[i] && @imap_state[i][:id] }.compact
124     return if imap_ids.empty?
125     @imap.store imap_ids, "+FLAGS", [:Deleted]
126   end
127   synchronized :mark_as_deleted
128
129   def expunge
130     @imap.expunge
131     unsynchronized_scan_mailbox true
132     true
133   end
134   synchronized :expunge
135
136   def connect
137     return if @imap
138     safely { } # do nothing!
139   end
140   synchronized :connect
141
142   def scan_mailbox force=false
143     return if !force && @last_scan && (Time.now - @last_scan) < SCAN_INTERVAL
144     last_id = safely do
145       @imap.examine mailbox
146       @imap.responses["EXISTS"].last
147     end
148     @last_scan = Time.now
149
150     @ids = [] if force
151     return if last_id == @ids.length
152
153     range = (@ids.length + 1) .. last_id
154     Redwood::log "fetching IMAP headers #{range}"
155     fetch(range, ['RFC822.SIZE', 'INTERNALDATE', 'FLAGS']).each do |v|
156       id = make_id v
157       @ids << id
158       @imap_state[id] = { :id => v.seqno, :flags => v.attr["FLAGS"] }
159     end
160     Redwood::log "done fetching IMAP headers"
161   end
162   synchronized :scan_mailbox
163
164   def each
165     return unless start_offset
166
167     ids = 
168       @mutex.synchronize do
169         unsynchronized_scan_mailbox
170         @ids
171       end
172
173     start = ids.index(cur_offset || start_offset) or raise OutOfSyncSourceError, "Unknown message id #{cur_offset || start_offset}."
174
175     start.upto(ids.length - 1) do |i|
176       id = ids[i]
177       state = @mutex.synchronize { @imap_state[id] } or next
178       self.cur_offset = id 
179       labels = { :Flagged => :starred,
180                  :Deleted => :deleted
181                }.inject(@labels) do |cur, (imap, sup)|
182         cur + (state[:flags].include?(imap) ? [sup] : [])
183       end
184
185       labels += [:unread] unless state[:flags].include?(:Seen)
186
187       yield id, labels
188     end
189   end
190
191   def start_offset
192     unsynchronized_scan_mailbox
193     @ids.first
194   end
195   synchronized :start_offset
196
197   def end_offset
198     unsynchronized_scan_mailbox
199     @ids.last + 1
200   end
201   synchronized :end_offset
202
203   def pct_done; 100.0 * (@ids.index(cur_offset) || 0).to_f / (@ids.length - 1).to_f; end
204
205 private
206
207   def fetch ids, fields
208     results = safely { @imap.fetch ids, fields }
209     good_results = 
210       if ids.respond_to? :member?
211         results.find_all { |r| ids.member?(r.seqno) && fields.all? { |f| r.attr.member?(f) } }
212       else
213         results.find_all { |r| ids == r.seqno && fields.all? { |f| r.attr.member?(f) } }
214       end
215
216     if good_results.empty?
217       raise FatalSourceError, "no IMAP response for #{ids} containing all fields #{fields.join(', ')} (got #{results.size} results)"
218     elsif good_results.size < results.size
219       Redwood::log "Your IMAP server sucks. It sent #{results.size} results for a request for #{good_results.size} messages. What are you using, Binc?"
220     end
221
222     good_results
223   end
224
225   def unsafe_connect
226     say "Connecting to IMAP server #{host}:#{port}..."
227
228     ## apparently imap.rb does a lot of threaded stuff internally and if
229     ## an exception occurs, it will catch it and re-raise it on the
230     ## calling thread. but i can't seem to catch that exception, so i've
231     ## resorted to initializing it in its own thread. surely there's a
232     ## better way.
233     exception = nil
234     ::Thread.new do
235       begin
236         #raise Net::IMAP::ByeResponseError, "simulated imap failure"
237         @imap = Net::IMAP.new host, port, ssl?
238         say "Logging in..."
239
240         ## although RFC1730 claims that "If an AUTHENTICATE command fails
241         ## with a NO response, the client may try another", in practice
242         ## it seems like they can also send a BAD response.
243         begin
244           raise Net::IMAP::NoResponseError unless @imap.capability().member? "AUTH=CRAM-MD5"
245           @imap.authenticate 'CRAM-MD5', @username, @password
246         rescue Net::IMAP::BadResponseError, Net::IMAP::NoResponseError => e
247           Redwood::log "CRAM-MD5 authentication failed: #{e.class}. Trying LOGIN auth..."
248           begin
249             raise Net::IMAP::NoResponseError unless @imap.capability().member? "AUTH=LOGIN"
250             @imap.authenticate 'LOGIN', @username, @password
251           rescue Net::IMAP::BadResponseError, Net::IMAP::NoResponseError => e
252             Redwood::log "LOGIN authentication failed: #{e.class}. Trying plain-text LOGIN..."
253             @imap.login @username, @password
254           end
255         end
256         say "Successfully connected to #{@parsed_uri}."
257       rescue Exception => e
258         exception = e
259       ensure
260         shutup
261       end
262     end.join
263
264     raise exception if exception
265   end
266
267   def say s
268     @say_id = BufferManager.say s, @say_id if BufferManager.instantiated?
269     Redwood::log s
270   end
271
272   def shutup
273     BufferManager.clear @say_id if BufferManager.instantiated?
274     @say_id = nil
275   end
276
277   def make_id imap_stuff
278     # use 7 digits for the size. why 7? seems nice.
279     %w(RFC822.SIZE INTERNALDATE).each do |w|
280       raise FatalSourceError, "requested data not in IMAP response: #{w}" unless imap_stuff.attr[w]
281     end
282
283     msize, mdate = imap_stuff.attr['RFC822.SIZE'] % 10000000, Time.parse(imap_stuff.attr["INTERNALDATE"])
284     sprintf("%d%07d", mdate.to_i, msize).to_i
285   end
286
287   def get_imap_fields id, *fields
288     raise OutOfSyncSourceError, "Unknown message id #{id}" unless @imap_state[id]
289
290     imap_id = @imap_state[id][:id]
291     result = fetch(imap_id, (fields + ['RFC822.SIZE', 'INTERNALDATE']).uniq).first
292     got_id = make_id result
293
294     ## I've turned off the following sanity check because Microsoft
295     ## Exchange fails it.  Exchange actually reports two different
296     ## INTERNALDATEs for the exact same message when queried at different
297     ## points in time.
298     ##
299     ## RFC2060 defines the semantics of INTERNALDATE for messages that
300     ## arrive via SMTP for via various IMAP commands, but states that
301     ## "All other cases are implementation defined.". Great, thanks guys,
302     ## yet another useless field.
303     ## 
304     ## Of course no OTHER imap server I've encountered returns DIFFERENT
305     ## values for the SAME message. But it's Microsoft; what do you
306     ## expect? If their programmers were any good they'd be working at
307     ## Google.
308
309     # raise OutOfSyncSourceError, "IMAP message mismatch: requested #{id}, got #{got_id}." unless got_id == id
310
311     fields.map { |f| result.attr[f] or raise FatalSourceError, "empty response from IMAP server: #{f}" }
312   end
313
314   ## execute a block, connected if unconnected, re-connected up to 3
315   ## times if a recoverable error occurs, and properly dying if an
316   ## unrecoverable error occurs.
317   def safely
318     retries = 0
319     begin
320       begin
321         unsafe_connect unless @imap
322         yield
323       rescue *RECOVERABLE_ERRORS => e
324         if (retries += 1) <= 3
325           @imap = nil
326           Redwood::log "got #{e.class.name}: #{e.message.inspect}"
327           sleep 2
328           retry
329         end
330         raise
331       end
332     rescue SocketError, Net::IMAP::Error, SystemCallError, IOError, OpenSSL::SSL::SSLError => e
333       raise FatalSourceError, "While communicating with IMAP server (type #{e.class.name}): #{e.message.inspect}"
334     end
335   end
336
337 end
338
339 end