]> git.cworth.org Git - obsolete/notmuch-wiki/blob - corpus.mdwn
Update news & manpages to notmuch version 0.16
[obsolete/notmuch-wiki] / corpus.mdwn
1 ## Notmuch Email Corpus
2
3 A corpus of about 108k messages is available for performance testing of
4 notmuch (or other uses).
5
6 The contents are as follows
7
8 - `Mail/notmuch-archive`: archive of the notmuch mailing list.
9
10    - last updated 2012-11-17
11
12    - converted from mbox with mb2md 3.20.
13
14 - `Mail/enron`: selected data from the EDRM v2 enron data set
15
16    - CC Attribution: "ZL Technologies, Inc. (http://www.zlti.com)"
17
18    - Downloaded via bittorrent
19
20       http://www.searchdaimon.com/community/dataset/
21
22    - massaged with scripts/unpack-enron.sh (in the corpus tarball)
23
24 The corpus is gpg signed by David Bremner with  key fingerprint:
25
26      815B 6398 2A79 F8E7 C727  86C4 762B 57BB 7842 06AD
27
28 You can download the corpus from
29
30 - [notmuchmail.org](http:///notmuchmail.org/releases/notmuch-email-corpus-0.3.tar.xz) [signature](http:///notmuchmail.org/releases/notmuch-email-corpus-0.3.tar.xz.asc)
31 - [UNB](http://tesseract.cs.unb.ca/notmuch/notmuch-email-corpus-0.3.tar.xz) [signature](http://tesseract.cs.unb.ca/notmuch/notmuch-email-corpus-0.3.tar.xz.asc)