]> git.cworth.org Git - wordgame/blob - COPYING-wordlists
Ensure that there's at least one full-length word that's not obscure
[wordgame] / COPYING-wordlists
1 Here is a description of the source and licensing for the three word
2 lists included in the wordgame package:
3
4 words.txt
5 =========
6   This file contains the OWL2+LWL lexicon as contained in Michael
7   Thelen's excellent zyzzyva program, available under the GPL from
8   http://www.zyzzyva.net/
9
10   Michael has the following to say about the lexicon:
11
12         Zyzzyva's OWL2+LWL lexicon is 100% accurate as verified by the
13         metrics available on the NSA Dictionary Committee's
14         website[*]. Zyzzyva has been used successfully as a Word Judge at
15         many North American SCRABBLE® tournaments, including BAT,
16         Oregon TILE, and the 2006 U.S. SCRABBLE® Open!
17
18         http://www.scrabble-assoc.com/boards/dictionary/octwl2.html
19
20   The relevant information from the dictionary committee website is as
21   follows:
22
23         If you're not sure you have the correct version of the digital
24         file, here are some statistics you can check. There are
25         currently 101 2-letter words, 1015 3, 4030 4, 8938 5, 15788 6,
26         24029 7, 29766 8, 29150 9, 22326 10, 16165 11, 11417 12, 7750
27         13, 5059 14 and 3157 15. The master file lists all words in
28         lower case in alphabetical order, one per line, with each line
29         terminated by a Unix line break. It is 1763167 bytes long and
30         has BSD checksum ('cksum -o 1') 12722, System V checkum
31         ('cksum -o 2') 24638, 32-bit CRC ('cksum -o 3') 2022312244,
32         ISO/IEC 8802-3:1989 checksum ('cksum') 427611949 and MD5
33         checksum dfd408f47cc1a324eb0ab5577910e4e3.
34
35    I (Carl Worth) have verified the contents of words.txt as included
36    in the wordgame package with resepct to the word counts listed
37    above as well as the MD5 checksum.
38
39 obscure.txt
40 ===========
41    I created this file from both words.txt and 2of12inf.txt (described
42    below). It consists of words which appear in OWL2+LWL but that do
43    not appear in 2of12inf.txt. Note that this list does not include
44    the 1083 2-15 letter words that appear in 2of12inf.txt but not in
45    OWL2+LWL nor does it contain the 832 words in 2of12inf.txt that
46    have more than 15 letters.
47
48    For the purposes of generating obscure.txt, the plurals of
49    uncountable nouns marked with % are considered as included in
50    2of12inf.txt, (that is, they are not considered obscure).
51
52 2of12inf.txt
53 ============
54    This word list is the result of an attempt to create a list of
55    common English words suitable for use in a word game. The list is
56    the result of efforts by Kevin Atkinson and Alan Beale. The list
57    was obtained as part of the 12dicts package from:
58
59         http://wordlist.sourceforge.net/12dicts-readme.html
60
61    The copyright and licensing for this word list is detailed below:
62
63 The final product is under the following copyright, as well as any
64 copyrights mentioned below.
65
66   Copyright 2000 by Kevin Atkinson
67
68   Permission to use, copy, modify, distribute and sell this database,
69   the associated scripts, the output created form the scripts and its
70   documentation for any purpose is hereby granted without fee,
71   provided that the above copyright notice appears in all copies and
72   that both that copyright notice and this permission notice appear in
73   supporting documentation. Kevin Atkinson makes no representations
74   about the suitability of this array for any purpose. It is provided
75   "as is" without express or implied warranty.
76
77 The part-of-speech database used is created form the Moby
78 part-of-speech database which is in the public domain:
79
80     The Moby lexicon project is complete and has
81     been place into the public domain. Use, sell,
82     rework, excerpt and use in any way on any platform.
83
84     Placing this material on internal or public servers is
85     also encouraged. The compiler is not aware of any
86     export restrictions so freely distribute world-wide.
87
88     You can verify the public domain status by contacting
89
90     Grady Ward
91     3449 Martha Ct.
92     Arcata, CA  95521-4884
93
94     grady@netcom.com
95     grady@northcoast.com
96
97 and the WordNet database which is under the following copyright:
98
99     This software and database is being provided to you, the LICENSEE, by
100     Princeton University under the following license.  By obtaining, using
101     and/or copying this software and database, you agree that you have
102     read, understood, and will comply with these terms and conditions.:
103
104     Permission to use, copy, modify and distribute this software and
105     database and its documentation for any purpose and without fee or
106     royalty is hereby granted, provided that you agree to comply with
107     the following copyright notice and statements, including the disclaimer,
108     and that the same appear on ALL copies of the software, database and
109     documentation, including modifications that you make for internal
110     use or for distribution.
111
112     WordNet 1.6 Copyright 1997 by Princeton University.  All rights reserved.
113
114     THIS SOFTWARE AND DATABASE IS PROVIDED "AS IS" AND PRINCETON
115     UNIVERSITY MAKES NO REPRESENTATIONS OR WARRANTIES, EXPRESS OR
116     IMPLIED.  BY WAY OF EXAMPLE, BUT NOT LIMITATION, PRINCETON
117     UNIVERSITY MAKES NO REPRESENTATIONS OR WARRANTIES OF MERCHANT-
118     ABILITY OR FITNESS FOR ANY PARTICULAR PURPOSE OR THAT THE USE
119     OF THE LICENSED SOFTWARE, DATABASE OR DOCUMENTATION WILL NOT
120     INFRINGE ANY THIRD PARTY PATENTS, COPYRIGHTS, TRADEMARKS OR
121     OTHER RIGHTS.
122
123     The name of Princeton University or Princeton may not be used in
124     advertising or publicity pertaining to distribution of the software
125     and/or database.  Title to copyright in this software, database and
126     any associated documentation shall at all times remain with
127     Princeton University and LICENSEE agrees to preserve same.
128
129 The word list used is a combination of several word list:
130
131 1) Most of the word lists from the Moby Words package:
132
133      10196pla.ces 113809of.fic 21986na.mes 256772co.mpo 354984si.ngl
134      3897male.nam 4160offi.cia 4946fema.len 6213acro.nym 74550com.mon
135
136    The Moby Word package, like the Part-Of-Speech database is in the
137    public domain.
138
139 2) The ENABLE2K word lists which is in the public domain:
140
141      The ENABLE master word list, WORD.LST, is herewith formally
142      released into the Public Domain. Anyone is free to use it or
143      distribute it in any manner they see fit. No fee or registration
144      is required for its use nor are "contributions" solicited (if you
145      feel you absolutely must contribute something for your own peace
146      of mind, the authors of the ENABLE list ask that you make a
147      donation on their behalf to your favorite charity). This word
148      list is our gift to the Scrabble community, as an alternate to
149      "official" word lists. Game designers may feel free to
150      incorporate the WORD.LST into their games. Please mention the
151      source and credit us as originators of the list. Note that if
152      you, as a game designer, use the WORD.LST in your product, you
153      may still copyright and protect your product, but you may *not*
154      legally copyright or in any way restrict redistribution of the
155      WORD.LST portion of your product. This *may* under law restrict
156      your rights to restrict your users' rights, but that is only
157      fair.
158
159 3) All of the word lists in the ENABLE2K Supplemnt which consists of:
160
161      2DICTS.LST  ALSO.LST   LETTERS.LST  OSPDADD.LST  UCACR.LST
162      ABLE.LST    LCACR.LST  NOPOS.LST    PLURALS.LST  UPPER.LST
163
164    All of these word lists are also in the public domain.
165
166 4) The list of signature words from the YAWL package which is in the
167    public domain.
168
169 5) The UK Advanced Cryptics Dictionary which in under the following
170    copyright:
171
172      Copyright (c) J Ross Beresford 1993-1999. All Rights Reserved.
173
174      The following restriction is placed on the use of this
175      publication: if The UK Advanced Cryptics Dictionary is used
176      in a software package or redistributed in any form, the
177      copyright notice must be prominently displayed and the text
178      of this document must be included verbatim.
179
180 6) Some extra words found in the Part-Of-Speech database that was not
181    found in any of the above word list.
182
183 7) Words found in the Jargon File Word List package, available at
184    http://aspell.sourceforge.net/wl/, which is in the Public Domain.
185
186 8) And finally some extra words that I added myself.  These words can be
187    found in the file "extra-words"
188
189 The "dontuse", "irregular", and "variant" file was created by me
190 (Kevin Atkinson) from numerous sources.