]> git.cworth.org Git - obsolete/notmuch-wiki/blobdiff - corpus.mdwn
update corpus links since 0.3 is now on both mirrors.
[obsolete/notmuch-wiki] / corpus.mdwn
index 5d262bc5235119ab0986e66071b9ee85e2beb50b..aa609b7e60d7bd9ca391650a3bebe3a417d4849c 100644 (file)
@@ -5,26 +5,29 @@ notmuch (or other uses).
 
 The contents are as follows
 
-Mail/notmuch-archive
+- `Mail/notmuch-archive`: archive of the notmuch mailing list.
 
-archive of the notmuch mailing list
-- last updated 2012-11-17
-- converted from mbox with mb2md 3.20.
+   - last updated 2012-11-17
 
-Mail/enron
+   - converted from mbox with mb2md 3.20.
 
-selected data from the EDRM v2 enron data set
-- CC Attribution: "ZL Technologies, Inc. (http://www.zlti.com)"
-- Downloaded via bittorrent
-  http://www.searchdaimon.com/community/dataset/
-- massaged with scripts/unpack-enron.sh
+- `Mail/enron`: selected data from the EDRM v2 enron data set
 
-Because of the size of the archive, it is not currently available from
-http://notmuchmail.org, but can be downloaded from:
+   - CC Attribution: "ZL Technologies, Inc. (http://www.zlti.com)"
+   
+   - Downloaded via bittorrent
 
-- http://tesseract.cs.unb.ca/notmuch/notmuch-email-corpus-0.1.tar.gz
+      http://www.searchdaimon.com/community/dataset/
+         
+   - massaged with scripts/unpack-enron.sh (in the corpus tarball)
+
+The corpus is gpg signed by David Bremner with  key fingerprint:
+
+     815B 6398 2A79 F8E7 C727  86C4 762B 57BB 7842 06AD
+
+You can download the corpus from
+
+- [notmuchmail.org](http:///notmuchmail.org/releases/notmuch-email-corpus-0.3.tar.xz) [signature](http:///notmuchmail.org/releases/notmuch-email-corpus-0.3.tar.xz.asc)
+- [UNB](http://tesseract.cs.unb.ca/notmuch/notmuch-email-corpus-0.3.tar.xz) [signature](http://tesseract.cs.unb.ca/notmuch/notmuch-email-corpus-0.3.tar.xz.asc)
 
-A signature from key "815B 6398 2A79 F8E7 C727  86C4 762B 57BB 7842 06AD"
-can be found in 
 
-- http://tesseract.cs.unb.ca/notmuch/notmuch-email-corpus-0.1.tar.gz.asc