]> git.cworth.org Git - hgbook-git/blob - tour.mdwn
Port section 2.7 (recording changes) from mercurial to git
[hgbook-git] / tour.mdwn
1 ## Chapter 2  
2 A tour of git: the basics
3
4 ### 2.0 Copyright
5
6 This document is a modified version originally known as "Distributed
7 revision control with Mercurial" and originally authored by Bryan
8 O’Sullivan. The original document was obtained from
9 <http://hgbook.red-bean.com/>.
10
11 Copyright © 2006, 2007 Bryan O’Sullivan.
12
13 This material may be distributed only subject to the terms and
14 conditions set forth in version 1.0 of the Open Publication
15 License. Please refer to Appendix D for the license text.
16
17 As this is a modified version, the name of Bryan O'Sullivan is used
18 only to properly credit him with the original text. The appearance of
19 his name here explicitly does not assert or imply his endorsement of
20 this modified document.
21
22 Portions Copyright © 2007 Carl Worth.
23
24 Changes made by Carl include the following:
25
26   * 2007-09-27:
27     * Convert from HTML to markdown source syntax
28     * Eliminate all content except Chapter 2 and Appendix D
29     * Eliminate line numbers from examples
30     * Modified to describe git instead of mercurial
31
32 ### 2.1  Installing git on your system
33
34 Prebuilt binary packages of git are available for many popular
35 operating systems. These make it easy to start using git on your
36 computer immediately.
37
38 #### 2.1.1  Linux
39
40 Because each Linux distribution has its own packaging tools, policies,
41 and rate of development, it’s difficult to give a comprehensive set of
42 instructions on how to install git binaries. The version of
43 git that you will end up with can vary depending on how active
44 the person is who maintains the package for your distribution.
45
46 To keep things simple, I will focus on installing git from the
47 command line under the most popular Linux distributions. Most of these
48 distributions provide graphical package managers that will let you
49 install git with a single click. The package name to look for is
50 often git, but is sometimes git-core, (due to an unfortunate name
51 with git, meaning GNU Interactive Tools).
52
53   * Debian 
54
55         apt-get install git-core
56
57   * Fedora Core 
58
59         yum install git
60
61   * Gentoo 
62
63         emerge git
64
65   * OpenSUSE 
66
67         yum install git
68
69   * Ubuntu 
70
71         apt-get install git
72
73 #### 2.1.2  Mac OS X
74
75 A git-core package is available through
76 [macports](http://macports.org). Once macports is enabled, the command
77 to install git is:
78
79         port install git-core
80
81 #### 2.1.3  Windows
82
83 Git has long been available as part of cygwin, and works reasonably
84 well in that environment. Some people find cygwin a particularly
85 inelegant approach to running git and would prefer a "native"
86 solution. To this end, the [msysgit
87 project](http://code.google.com/p/msysgit/) is rapidly putting
88 together a solution including various packages with full
89 installers. These include GitMe, a package to install the entire
90 development environment necessary to work on improving the msysgit
91 port of git, and WinGit, a package for installing just git itself
92 without the development environment, (still in Alpha as of September
93 2008).
94
95 ### 2.2  Getting started
96
97 To begin, we’ll use the “git version” command to find out whether git
98 is actually installed properly. Versions 1.5 and newer of git are much
99 more friendly to new users than versions 1.4 and older. If you aren't
100 yet running version 1.5 or newer, it's highly recommended that you
101 upgrade.
102
103         $ git version   
104         git version 1.5.3.2
105
106 #### 2.2.1  Built-in help
107
108 Git provides a built-in help system. This is invaluable for those
109 times when you find yourself stuck trying to remember how to run a
110 command. If you are completely stuck, simply run “git help”; it will
111 print a brief list of commonly-used commands, along with a description
112 of what each does. If you ask for help on a specific command (such as
113 "git help init"), it prints more detailed information. [XXX: Does "git
114 help <foo>" work universally as a built-in or does it expect man to be
115 present and just call out to "man git-<foo>"?]
116
117         [XXX: The original hgbook includes the complete output of "hg
118         help init" at this point. I'm not including the corresponding
119         "git help init" output as it would be excessively long. The
120         description alone is quite reasonable, (other than a
121         not-too-helpful aside about the obsolete git-init-db command),
122         but it only comes after a full screen's worth of options
123         details. Might it make sense to have a more summarized help
124         output for "git help <foo>" than all of the documentation
125         available for git-<foo>? And perhaps alos provide a "git -v
126         help" similar to "hg -v help" for more?]
127
128 ### 2.3  Working with a repository
129
130 In git, everything happens inside a repository. The repository
131 for a project contains all of the files that “belong to” that project,
132 along with a historical record of the project’s files.
133
134 There’s nothing particularly magical about a repository; it is simply
135 a directory tree in your filesystem that git treats as
136 special. You can rename or delete a repository any time you like,
137 using either the command line or your file browser.
138
139 #### 2.3.1  Making a local copy of a repository
140
141 Copying a repository is just a little bit special. While you could use
142 a normal file copying command to make a copy of a repository, it’s
143 best to use a built-in command that git provides. This command
144 is called “git clone”, because it creates an identical copy of an
145 existing repository.
146
147         $ git clone git://cworth.org/git/hello
148         Initialized empty Git repository in /tmp/hello/.git/
149         remote: Generating pack...
150         remote: Done counting 15 objects.
151         remote: Deltifying 15 objects...
152         remote:  100% (15/15) done
153         remote: Total 15 (delta 2), reused 15 (delta remote: 2)
154         Indexing 15 objects...
155          100% (15/15) done
156         Resolving 2 deltas...
157          100% (2/2) done
158
159 If for some reason you are prevented from talking on the git: port,
160 then there is also the capability to clone a repository (less
161 efficiently) over http:
162
163         $ git clone http://cworth.org/git/hello
164         Initialized empty Git repository in /tmp/hello/.git/
165         Getting alternates list for http://cworth.org/git/hello
166         Getting pack list for http://cworth.org/git/hello
167         Getting index for pack 04ecb061314ecbd60fa0610ecf55a1cbf85ea294
168         Getting pack 04ecb061314ecbd60fa0610ecf55a1cbf85ea294
169          which contains a1a0e8b392b17caf50325498df54802fe3c03710
170         walk a1a0e8b392b17caf50325498df54802fe3c03710
171         walk 72d4f10e4a27dbb09ace1503c20dbac1912ee451
172         walk 13ed136b983a9c439eddeea8a1c2076cffbb685f
173         walk 0a633bf58b45fcf1a8299d3c82cd1fd26d3f48f2
174         walk db7117a9dd9a6e57e8632ea5848e1101eee0fbde
175
176 If our clone succeeded, we should now have a local directory called
177 hello. This directory will contain some files.
178
179         $ ls -l
180         total 4
181         drwxr-xr-x 3 cworth cworth 4096 2007-09-27 16:40 hello
182         $ ls hello
183         hello.c  Makefile
184
185 These files have the same contents and history in our repository as
186 they do in the repository we cloned.
187
188 Every git repository is complete, self-contained, and
189 independent. It contains its own private copy of a project’s files and
190 history. A cloned repository remembers the location of the repository
191 it was cloned from, but it does not communicate with that repository,
192 or any other, unless you tell it to.
193
194 What this means for now is that we’re free to experiment with our
195 repository, safe in the knowledge that it’s a private “sandbox” that
196 won’t affect anyone else.
197
198 #### 2.3.2  What’s in a repository?
199
200 When we take a more detailed look inside a repository, we can see that
201 it contains a directory named .git. This is where git keeps all
202 of its metadata for the repository.
203
204         $ cd hello
205         $ ls -a
206         .  ..  .git  hello.c  Makefile
207
208 The contents of the .git directory and its subdirectories are private
209 to git. Every other file and directory in the repository is
210 yours to do with as you please.
211
212 To introduce a little terminology, the .git directory is the “real”
213 repository, and all of the files and directories that coexist with it
214 are said to live in the working directory. An easy way to remember the
215 distinction is that the repository contains the history of your
216 project, while the working directory contains a snapshot of your
217 project at a particular point in history.
218
219 ### 2.4  A tour through history
220
221 One of the first things we might want to do with a new, unfamiliar
222 repository is understand its history. The “git log” command gives us a
223 view of history.
224
225         $ git log
226         commit a1a0e8b392b17caf50325498df54802fe3c03710
227         Author: Bryan O'Sullivan <bos@serpentine.com>
228         Date:   Tue Sep 6 15:43:07 2005 -0700
229         
230             Trim comments.
231         
232         commit 72d4f10e4a27dbb09ace1503c20dbac1912ee451
233         Author: Bryan O'Sullivan <bos@serpentine.com>
234         Date:   Tue Sep 6 13:15:58 2005 -0700
235         
236             Get make to generate the final binary from a .o file.
237         
238         commit 13ed136b983a9c439eddeea8a1c2076cffbb685f
239         Author: Bryan O'Sullivan <bos@serpentine.com>
240         Date:   Tue Sep 6 13:15:43 2005 -0700
241         
242             Introduce a typo into hello.c.
243         
244         commit 0a633bf58b45fcf1a8299d3c82cd1fd26d3f48f2
245         Author: Bryan O'Sullivan <mpm@selenic.com>
246         Date:   Fri Aug 26 01:21:28 2005 -0700
247         
248             Create a makefile
249         
250         commit db7117a9dd9a6e57e8632ea5848e1101eee0fbde
251         Author: Bryan O'Sullivan <mpm@selenic.com>
252         Date:   Fri Aug 26 01:20:50 2005 -0700
253         
254             Create a standard "hello, world" program
255
256 By default, this command prints a brief paragraph of output for each
257 change to the project that was recorded. In git terminology, we
258 call each of these recorded events a commit.
259
260 The fields in a record of output from “git log” are as follows. 
261
262   * commit This field consists of a string of 40 hexadecimal characters.
263     This is a unique identifier for referring to particular commits.
264   * Author The identity of the person who authored the commit. This
265     field consist of two sub-fields for the user's name and email
266     address, (or at least an email-like idenitifer). Note that git
267     stores a separate "Committer" field for the person who commited
268     the change, (since often an author will email a change to a
269     maintainer that commits it). The "git log" command doesn't display
270     the Committer, but other git tools do.
271   * Date The date and time on which the commit was authored, (again
272     stored separately from the date the change was committed).
273     timezone in which it was created. (The date and time are displayed
274     in the timezone of the person who created the commit.)
275   * commit message The text message that the creator of the commit
276     entered to describe the commit, (generally a one-line summary
277     followed by more supporting text).
278
279 The default output printed by “git log” is purely a summary; it is
280 missing a lot of detail.
281
282 Figure [2.1][8] provides a graphical representation of the history of
283 the hello repository, to make it a little easier to see which
284 direction history is “flowing” in. We’ll be returning to this figure
285 several times in this chapter and the chapter that follows.
286
287 * * *
288
289 ![PIC][9]   
290
291 Figure 2.1: 
292 Graphical history of the hello repository
293
294 * * *
295
296 #### 2.4.1  Commits, revisions, and talking to other people
297
298 As English is a notoriously sloppy language, and computer science has
299 a hallowed history of terminological confusion (why use one term when
300 four will do?), revision control has a variety of words and phrases
301 that mean the same thing. If you are talking about git history
302 with other people, you will find that what we have called a “commit”
303 is often called a "revision". In other systems, a similar notion
304 is referred to as a "changeset". You might even see abbreviations of
305 these terms such as "rev", "change", or even "cset".
306
307 While it may not matter much what word you use to refer to the concept
308 of “a commit”, it's important to know how to name “a specific
309 commit”. We have already seen one means of referring to a particular
310 commit, the 40-character hexadecimal string shown by "git log". These
311 commit identifiers are powerful because they are permanent, unique
312 identifiers that always identify the same commit in any copy of a
313 repository. If two users are examining a working directory associated
314 with the same commit identifier, then those two users have precisely
315 the same contents in all files, and exactly the same history leading
316 to that commit.
317
318 So there are places where it is often important to archive the
319 complete commit identifier, (perhaps in bug-tracking systems to
320 indicate a specific commit that fixes a bug, for example). But often,
321 in more casual settings, it's more convenient to use abbreviated
322 commit identifiers. Git accept any unique prefix of a commit
323 identifier, (and for reasonably-sized project the first 8 or 10
324 characters are almost always unique).
325
326 And unlike the permanent commit identifiers, git also provides
327 transient means of identifying commits. In fact, in day-to-day use of
328 git, you will probably use these names more than commit
329 identifiers. One example is branch names, (such as the default
330 "master" branch in any git repository), or any project-specific branch
331 names such as "stable", "experimental", or "crazy-insane-changes". Git
332 also provides a special name "HEAD" which always refers to the current
333 branch.
334
335 #### 2.4.2 Naming related commits
336
337 Git offers simple ways to name revisions that are related to
338 particular revisions in the history. One syntax is the ~ suffix which
339 refers to the parent of a commit, or if followed by a number, to the
340 Nth parent. For example, since "HEAD" refers to the most recent commit
341 in the current branch, "HEAD~", refers to the previous commit, and
342 "HEAD~2" refers to two commits back in the history.
343
344 Another useful syntax is .. which can be used to specify a range of
345 commits. So "origin..master" specifies everything that has been
346 committed to master since it derived from origin.
347
348 #### 2.4.3  Viewing specific revisions
349
350 You can use "git log" to explore the range syntax just introduced. For
351 example, to see a list of the most recent 3 revisions you can use
352 "HEAD~3..", (the destination of the range is implicitly HEAD in this
353 case):
354
355         $ git log HEAD~3..
356         commit a1a0e8b392b17caf50325498df54802fe3c03710
357         Author: Bryan O'Sullivan <bos@serpentine.com>
358         Date:   Tue Sep 6 15:43:07 2005 -0700
359         
360             Trim comments.
361         
362         commit 72d4f10e4a27dbb09ace1503c20dbac1912ee451
363         Author: Bryan O'Sullivan <bos@serpentine.com>
364         Date:   Tue Sep 6 13:15:58 2005 -0700
365         
366             Get make to generate the final binary from a .o file.
367         
368         commit 13ed136b983a9c439eddeea8a1c2076cffbb685f
369         Author: Bryan O'Sullivan <bos@serpentine.com>
370         Date:   Tue Sep 6 13:15:43 2005 -0700
371         
372             Introduce a typo into hello.c.
373
374 #### 2.4.4 Other log filters
375
376 Besides filtering by commit identifiers, git allows you to easily
377 filter the log output according to which files (or directories) are
378 modified by listing them after "--" wihch is necessary to distinguish
379 commit names from file names:
380
381         $ git log -- Makefile
382         commit 72d4f10e4a27dbb09ace1503c20dbac1912ee451
383         Author: Bryan O'Sullivan <bos@serpentine.com>
384         Date:   Tue Sep 6 13:15:58 2005 -0700
385         
386             Get make to generate the final binary from a .o file.
387         
388         commit 0a633bf58b45fcf1a8299d3c82cd1fd26d3f48f2
389         Author: Bryan O'Sullivan <mpm@selenic.com>
390         Date:   Fri Aug 26 01:21:28 2005 -0700
391         
392             Create a makefile
393
394 And "git log" can also filter based on the dates at which commits were
395 created:
396
397         $ git log --since="2 weeks ago" --until="yesterday"
398
399 Another useful option is -n or --max-count which, unsurprisingly,
400 limits the maximum number of commits to be displayed.
401
402 #### 2.4.3  More detailed information
403
404 While the default information printed by “git log” is useful if you
405 already know what you’re looking for, you may need to see more details
406 of the change, such as the "diffstat" information with --stat:
407
408         $ git log --stat --max-count=3
409         commit a1a0e8b392b17caf50325498df54802fe3c03710
410         Author: Bryan O'Sullivan <bos@serpentine.com>
411         Date:   Tue Sep 6 15:43:07 2005 -0700
412         
413             Trim comments.
414         
415          hello.c |    8 ++------
416          1 files changed, 2 insertions(+), 6 deletions(-)
417         
418         commit 72d4f10e4a27dbb09ace1503c20dbac1912ee451
419         Author: Bryan O'Sullivan <bos@serpentine.com>
420         Date:   Tue Sep 6 13:15:58 2005 -0700
421         
422             Get make to generate the final binary from a .o file.
423         
424          Makefile |    2 ++
425          1 files changed, 2 insertions(+), 0 deletions(-)
426         
427         commit 13ed136b983a9c439eddeea8a1c2076cffbb685f
428         Author: Bryan O'Sullivan <bos@serpentine.com>
429         Date:   Tue Sep 6 13:15:43 2005 -0700
430         
431             Introduce a typo into hello.c.
432         
433          hello.c |    2 +-
434          1 files changed, 1 insertions(+), 1 deletions(-)
435
436 Or perhaps you'd like to see the actual patch content of each change,
437 which you can get with -p. That commit with the word typo in its name
438 looks suspicous, so let's tak a closer look. Remember that we can name
439 it as master~3, HEAD~3, or any prefix of its commit identifier, (such
440 as 13ed136b):
441
442         $ git log -p -n 1 13ed136b
443         commit 13ed136b983a9c439eddeea8a1c2076cffbb685f
444         Author: Bryan O'Sullivan <bos@serpentine.com>
445         Date:   Tue Sep 6 13:15:43 2005 -0700
446         
447             Introduce a typo into hello.c.
448         
449         diff --git a/hello.c b/hello.c
450         index ed55ec0..80b260c 100644
451         --- a/hello.c
452         +++ b/hello.c
453         @@ -11,6 +11,6 @@
454          
455          int main(int argc, char **argv)
456          {
457         -       printf("hello, world!\n");
458         +       printf("hello, world!\");
459                 return 0;
460          }
461
462 Of course, wanting to see all this information for a single commit is
463 such a common operation that it's given its own name in git, "git
464 show". So "git show 13ed136b" is a much easier way to get exactly the
465 same output:
466
467         $ git show 13ed136b
468         commit 13ed136b983a9c439eddeea8a1c2076cffbb685f
469         Author: Bryan O'Sullivan <bos@serpentine.com>
470         Date:   Tue Sep 6 13:15:43 2005 -0700
471         
472             Introduce a typo into hello.c.
473         
474         diff --git a/hello.c b/hello.c
475         index ed55ec0..80b260c 100644
476         --- a/hello.c
477         +++ b/hello.c
478         @@ -11,6 +11,6 @@
479          
480          int main(int argc, char **argv)
481          {
482         -       printf("hello, world!\n");
483         +       printf("hello, world!\");
484                 return 0;
485          }
486
487 ### 2.5  All about command options
488
489 Let’s take a brief break from exploring git commands to discuss
490 a pattern in the way that they work; you may find this useful to keep
491 in mind as we continue our tour.
492
493 Git has a consistent and straightforward approach to dealing
494 with the options that you can pass to commands. It follows the
495 conventions for options that are common to modern Linux and Unix
496 systems.
497
498   * Most options have long names. For example, as we’ve already seen,
499     the “git log" command accepts a --max-count=<number> option.
500   * Some options have short, single-character names. Often these are
501     aliases for long commands, (such as "-n <number>" instead of
502     --max-count=<number>), but sometimes the option exists in
503     short-form with no long-form equivalent, (such as -p). [XXX: It
504     wouldn't hurt to fix this by adding --patch, etc. right?]
505   * Long options start with two dashes (e.g. --max-count), while short
506     options start with one (e.g. -n).
507
508   * Option naming and usage is consistent across commands. For
509     example, every command that lets you specify a commit identifier
510     or range will accept the same expressions, (HEAD~3,
511     origin..master, 72d4f10e, etc), while any command that can be
512     limited by paths will accept the same expressions ("-- doc/
513     some-file.c"), etc.
514
515 Many commands that print output of some kind can be made more quiet by
516 passing the -q or --quiet options.
517
518 ### 2.6  Making and reviewing changes
519
520 Now that we have a grasp of viewing history in git, let’s take a
521 look at making some changes and examining them.
522
523 The first thing we’ll do is isolate our experiment in a repository of
524 its own. We use the “git clone” command, but we don’t need to clone a
525 copy of the remote repository. Since we already have a copy of it
526 locally, we can just clone that instead. This is much faster than
527 cloning over the network, and cloning a local repository uses less
528 disk space in most cases, too.
529
530         $ cd ..
531         $ git clone hello my-hello
532         Initialized empty Git repository in /home/cworth/src/hgbook-git/my-hello/.git/
533         0 blocks
534
535         [XXX We say "empty" here, (presumably from the git-init part),
536         but shouldn't the command also report the succesful clone
537         which makes it non-empty? And what the heck does "0 blocks"
538         mean?]
539
540 As an aside, it’s often good practice to keep a “pristine” copy of a
541 remote repository around, which you can then make temporary clones of
542 to create sandboxes for each task you want to work on. This lets you
543 work on multiple tasks in parallel, each isolated from the others
544 until it’s complete and you’re ready to integrate it back. Because
545 local clones are so cheap, there’s almost no overhead to cloning and
546 destroying repositories whenever you want.
547
548 Alternatively, you can achieve much the same effect by creating
549 multiple branches in a single repository, (but we won't go into detail
550 on how to do that in this chapter). Some people greatly appreciate
551 having multiple branches in a single repository rather than having
552 many repositories cluttering up their filesystem. Other people prefer
553 the ability to have working-tree changes, and intermediate build
554 files, etc. each isolated in a separate repository per branch. Both
555 modes are very well-supported by git, so it's really a matter of which
556 you find most appropriate at any time given your tastes and project
557 workflows.
558
559 In our my-hello repository, we have a file hello.c that contains the
560 classic “hello, world” program. Let’s use the ancient and venerable
561 sed command to edit this file so that it prints a second line of
562 output. (I’m only using sed to do this because it’s easy to write a
563 scripted example this way. Since you’re not under the same constraint,
564 you probably won’t want to use sed; simply use your preferred text
565 editor to do the same thing.)
566
567         $ sed -i '/printf/a\\tprintf("hello again!\\n");' hello.c       
568
569 The “git status” command will tell us what git knows about the files
570 in the repository.
571
572         $ ls 
573         hello.c  Makefile
574         $ git status
575         # On branch master
576         # Changed but not updated:
577         #   (use "git add <file>..." to update what will be committed)
578         #
579         #       modified:   hello.c
580         #
581         no changes added to commit (use "git add" and/or "git commit -a")
582
583 We see that “git status” command prints a line with "modified" for
584 hello.c. The “git status” command will not print any output for files
585 that have not been modified.
586
587 Notice that we didn’t need to inform git that we were going to modify
588 the file before we started, or that we had modified the file after we
589 were done; it was able to figure this out itself.
590
591 It’s a little bit helpful to know that we’ve modified hello.c, but we
592 might prefer to know exactly what changes we’ve made to it. To do
593 this, we use the “git diff” command.
594
595         $ git diff
596         diff --git a/hello.c b/hello.c
597         index 9a3ff79..6d28887 100644
598         --- a/hello.c
599         +++ b/hello.c
600         @@ -8,5 +8,6 @@
601          int main(int argc, char **argv)
602          {
603                 printf("hello, world!\");
604         +       printf("hello again!\n");
605                 return 0;
606          }
607
608 ### 2.7  Recording changes in a new commit
609
610 We can modify files, build and test our changes, and use “git status”
611 and “git diff” to review our changes, until we’re satisfied with what
612 we’ve done and arrive at a natural stopping point where we want to
613 record our work in a new commit.
614
615 The “git commit” command lets us create a new changeset; we’ll usually
616 refer to this as “making a commit” or “committing”.
617
618 #### 2.7.1  Setting up a username
619
620 When you try to run “git commit” for the first time, it might not do
621 exactly what you want. Git records your name and address with each
622 change that you commit, (as both author and committer unless you tell
623 it otherwise), so that you and others will later be able to tell who
624 made each change. Git tries to automatically figure out a sensible
625 name and address to attribute to both author and committer. It will
626 attempt each of the following methods, in order, (stopping for each field as soon as a value is found):
627
628   1. If you specify a --author option to the “git commit” command on
629      the command line, followed by a "Real Name <email@example.com>"
630      string, then this name and addresss will be used for the author
631      fields. The committer fields will still be determined as
632      below. This option is very helpful for when applying a commit
633      originally authored by someone other than yourself.
634   2. If any of the GIT_AUTHOR_NAME, GIT_AUTHOR_EMAIL,
635      GIT_COMMITTER_NAME, or GIT_COMMITER_EMAIL environment variables
636      are set, then those values will be used for the corresponding
637      fields.
638   3. If you have a file in your home directory called .gitconfig, with
639      name or email settings in the [user] section, then these values
640      will be used to set any remaining author and committer
641      fields. For more details on the contents of this file, refer to
642      section 2.7.1 below.
643   4. If you have a file in the local repository called .git/config,
644      again with name or email settings in the [user] section, then
645      these values will be used to set any remaining author and
646      committer fields.
647   5. If you have set the EMAIL environment variable, this will be used
648      to set author and committer email addresses if still unset.
649   6. git will query your system to find out your real name from
650      available GECOS field and your username, hostname, and domain to
651      construct an email address, (or at least an identifier resembling
652      an email address).
653
654 If all of these mechanisms fail, "git commit" will fail, printing an
655 error message instructing you how to use "git config" to tell git your
656 name and email address.
657
658 You should think of the GIT_AUTHOR/COMMITER_NAME/EMAIL environment
659 variables and the --author option to the “git commit” command as ways
660 to override git’s default selection. For normal use, the simplest and
661 most robust way to set your information is by creating a .gitconfig
662 file, (either manually or with the "git config" command); see below
663 for details.
664
665 ##### Creating a git configuration file
666
667 To set your name and email address, just use the following commands:
668
669         git config --global user.name "Your Name"
670         git config --global user.email "you@example.com"
671
672 The --global option means that this command will set global
673 information, (affecting all repositories on this machine), in the
674 .gitconfig file in your home directory. Alternately, you could omit
675 the --global which would make the change take effect only in the local
676 repository. This is convenient if you want to have different email
677 addresses associated with different projects, for example.
678
679 Of course, git's configuration file is a simple-to-edit plain-text
680 file, so instead of using the above commands, you can also just edit
681 the files directly. Use your favorite editor to create a file called
682 .gitconfig in your home directory, (or if you ran the above commands
683 then it will be there already). The initial contents of your
684 .gitconfig should look like this.
685
686         # This is a git configuration file.   
687         [user]
688                 name = Your Name
689                 email = you@example.com
690
691 Similarly, you can make a repository-specific configuration by editing
692 .git/config in the local repository. It will already have some
693 sections present, (created by the "git clone"), just add a [user]
694 section as above.
695
696 The “[user]” line begins a section of the config file, so you can read
697 the “name = ...” line as meaning “set the value of the name item in
698 the user section”. This is the same notion expressed with the
699 "user.name" syntax on the git-config command line.  A section
700 continues until a new section begins, or the end of the file. Git
701 ignores empty lines and treats any text from “#” to the end of a line
702 as a comment.
703
704 ##### Choosing a user name
705
706 You can use any text you like as the value of the name and email
707 configuration items, since this information is for reading by other
708 people, not for interpreting by git. It is conventional to use a valid
709 email address, but some, (notably Linus Torvalds, the original author
710 of git), actually like the default user@hostname convention that git
711 falls back on without any additional information. There's no
712 requirement that the email address actually be valid, and perhaps it's
713 useful to be reminded which machine was used to create particular
714 commits.
715
716 #### 2.7.2  Writing a commit message
717
718 When we commit a change, git drops us into a text editor to
719 enter a message that will describe the modifications we’ve made in
720 this commit. This is called the commit message. It will be a record
721 for readers of what we did and why, and it will be printed by “git log”
722 after we’ve finished committing.
723
724         $ git commit -a
725
726 Note: The -a on the command-line instructs git to commit all changes
727 to tracked files. Without this, "git commit" will only commit changes
728 that have been previously staged for committing with "git add
729 file". The most common usage is to commit with "git commit -a" and
730 only use "git add file; git commit" when there is a need to commit
731 only some subset of changes that have been made.
732
733 The editor that the “git commit” command drops us into will contain an
734 empty line, followed by a number of lines starting with “#”.
735
736         empty line
737         # Please enter the commit message for your changes.
738         # (Comment lines starting with '#' will not be included)
739         # On branch master
740         # Changes to be committed:
741         #   (use "git reset HEAD <file>..." to unstage)
742         #
743         #       modified:   hello.c
744         #       
745
746 git ignores the lines that start with “#”; it uses them only
747 to tell us which files it’s recording changes to. Modifying or
748 deleting these lines has no effect.
749
750 #### 2.7.3  Writing a good commit message
751
752 A good commit message will generally have a single line that
753 summarizes the commit, a blank line, and then one or more pargraphs
754 with supporting detail. Since many tools only print the first line of
755 a commit message by default, it’s important that the first line stands
756 alone.
757
758 One example of a first-line-only viewer is "git log
759 --pretty=short". Other examples include graphical history viewers such
760 as gitk and gitview, and web-based viewers such as gitweb and cgit.
761
762 Here’s a real example of a commit message that doesn’t follow
763 this guideline, and hence has a summary that is not readable.
764
765         $ git log --pretty=short
766         commit 3ef5535144da88a854f7930503845cd44506c2e2
767         Author: Censored Person <censored.person@example.org>
768         
769             include buildmeister/commondefs.   Add an exports and install
770
771 As far as the remainder of the contents of the commit message are
772 concerned, there are no hard-and-fast rules. git itself doesn’t
773 interpret or care about the contents of the commit message, though
774 your project may have policies that dictate a certain kind of
775 formatting.
776
777 My personal preference is for short, but informative, commit messages
778 that tell me something that I can’t figure out with a quick glance at
779 the output of “git log -p".
780
781 #### 2.7.4  Aborting a commit
782
783 If you decide that you don’t want to commit while in the middle of
784 editing a commit message, simply exit from your editor without saving
785 the file that it’s editing. This will cause nothing to happen to
786 either the repository or the working directory.
787
788 #### 2.7.5  Admiring our new handiwork
789
790 Once we’ve finished the commit, we can use the “git show” command to
791 display the commit we just created. As discussed previously, this
792 command produces output that is identical to “git log -p”, but for
793 only a single revision, (and the most recent revision by default):
794
795         $ git show
796         commit 018cfb742be6176443ffddac454e593e802ddf3e
797         Author: Carl Worth <cworth@cworth.org>
798         Date:   Thu Sep 27 23:55:00 2007 -0700
799         
800             Added an extra line of output.
801             
802             If I would have been clever I would have fixed that old typo
803             while I was at it...
804         
805         diff --git a/hello.c b/hello.c
806         index 9a3ff79..6d28887 100644
807         --- a/hello.c
808         +++ b/hello.c
809         @@ -8,5 +8,6 @@
810          int main(int argc, char **argv)
811          {
812                 printf("hello, world!\");
813         +       printf("hello again!\n");
814                 return 0;
815          }
816
817 Note that you will not see the same commit identifier for your commit,
818 even if the change you made is identical to mine. The commit
819 identifier incorporates not only the contents of the files, but commit
820 message, the author and committer names and emails, and the author and
821 commit dates. (OK, so now you probably know enough to be able to guess
822 the right command to produce a commit with exactly the commit
823 identifier shown above. Can you do it?)
824
825 #### 2.7.6 Fixing up a broken commit (before anyone else sees it)
826
827 So now that we've cloned a local repository, made a change to the
828 code, setup our name and email address, and made a commit with a
829 careful message, we're just about ready to share our change with the
830 world. But wait, we forgot to try to compile it didn't we?
831
832         $ make
833         cc    -c -o hello.o hello.c
834         hello.c:10:9: warning: missing terminating " character
835         hello.c:10:9: warning: missing terminating " character
836         hello.c: In function ‘main’:
837         hello.c:10: error: missing terminating " character
838         hello.c:11: error: expected ‘)’ before ‘;’ token
839         hello.c:13: warning: passing argument 1 of ‘printf’ makes pointer from integer without a cast
840         hello.c:13: error: expected ‘;’ before ‘}’ token
841         make: *** [hello.o] Error 1
842
843 Oh look. The code's broken and doesn't compile. We don't want to share
844 code in this state. For situations where you notice one tiny detail
845 that got left out of the last commit, (a silly syntax error, a
846 misspelling in a comment or commit messsage), git provides a very
847 handy tool for just changing the last commit.
848
849 So fix that typo, (a missing 'n' between the '\' and the '"'), with
850 your editor or with something like this:
851
852         sed -i 's/\\"/\\n"/' hello.c
853
854 And then you can just amend the previous commit rather than creating a
855 new one with the --amend option to "git commit":
856
857         $ git commit -a --amend
858
859 Note that we use -a to include the code change here. And that helps
860 point out a situation where "git commit" is useful without the -a
861 option, "git commit --amend" is a useful command for amend just the
862 last commit message, without committing any new code changes, even if
863 some files have been modified in the working tree.
864
865 And here's the final result:
866
867         $ git show
868         commit 839b58d021c618bd0e1d336d4d5878a0082672e6
869         Author: Carl Worth <cworth@cworth.org>
870         Date:   Thu Sep 27 23:55:00 2007 -0700
871         
872             Added an extra line of output and fixed the typo bug.
873         
874         diff --git a/hello.c b/hello.c
875         index 9a3ff79..ca750e0 100644
876         --- a/hello.c
877         +++ b/hello.c
878         @@ -7,6 +7,7 @@
879          
880          int main(int argc, char **argv)
881          {
882         -       printf("hello, world!\");
883         +       printf("hello, world!\n");
884         +       printf("hello again!\n");
885                 return 0;
886          }
887
888 I can't help but point out that this really was a poor example for
889 --amend. The end result is a single commit that does two independent
890 things, (fixes one bug and adds one new feature). It's much better to
891 create a code history where each commit makes an independent change,
892 (and as small as possible). This is important for several reasons:
893
894   * Small changes are easier to review
895
896   * Independent changes are easier to split up if only part of the
897     series gets accepted "upstream" for one reason or another.
898
899   * The smaller the changes are the more useful the history will be
900     when actually using the history, not just viewing it. This is
901     particularly important when doing "git bisect"---that's a powerful
902     tool for isolating the single commit that introduces a bug. And
903     it's much more powerful if the commit it isolates is as small as
904     possible.
905
906 So it's a good thing this document is available under a license that
907 allows for distribution of modified versions. Someone should clean up
908 the --amend example to not teach bad habits like I did above. [Note:
909 All this bad-habit stuff was introduced by me, and was not present in
910 Bryan's original chapter. -Carl]
911
912 ### 2.8  Sharing changes
913
914 We mentioned earlier that repositories in Mercurial are
915 self-contained. This means that the changeset we just created exists
916 only in our my-hello repository. Let’s look at a few ways that we can
917 propagate this change into other repositories.
918
919 #### 2.8.1  Pulling changes from another repository
920
921 To get started, let’s clone our original hello repository, which does
922 not contain the change we just committed. We’ll call our temporary
923 repository hello-pull.
924
925         $ cd ..   
926         $ hg clone hello hello-pull   
927         2 files updated, 0 files merged, 0 files removed, 0 files unresolved
928
929 We’ll use the “hg pull” command to bring changes from my-hello into
930 hello-pull. However, blindly pulling unknown changes into a repository
931 is a somewhat scary prospect. Mercurial provides the “hg incoming”
932 command to tell us what changes the “hg pull” command would pull into
933 the repository, without actually pulling the changes in.
934
935         $ cd hello-pull   
936         $ hg incoming ../my-hello   
937         comparing with ../my-hello   
938         searching for changes   
939         changeset:   5:fa1321bf0c80   
940         tag:         tip   
941         user:        Bryan O'Sullivan <bos@serpentine.com>   
942         date:        Sun Jun 17 18:05:50 2007 +0000   
943         summary:     Added an extra line of output   
944         
945
946 (Of course, someone could cause more changesets to appear in the
947 repository that we ran “hg incoming” in, before we get a chance to “hg
948 pull” the changes, so that we could end up pulling changes that we
949 didn’t expect.)
950
951 Bringing changes into a repository is a simple matter of running the
952 “hg pull” command, and telling it which repository to pull from.
953
954         $ hg tip   
955         changeset:   4:b57f9a090b62   
956         tag:         tip   
957         user:        Bryan O'Sullivan <bos@serpentine.com>   
958         date:        Tue Sep 06 15:43:07 2005 -0700   
959         summary:     Trim comments.   
960         
961         $ hg pull ../my-hello   
962         pulling from ../my-hello   
963         searching for changes   
964         adding changesets   
965         adding manifests   
966         adding file changes   
967         added 1 changesets with 1 changes to 1 files   
968         (run 'hg update' to get a working copy)   
969         $ hg tip   
970         changeset:   5:fa1321bf0c80   
971         tag:         tip   
972         user:        Bryan O'Sullivan <bos@serpentine.com>   
973         date:        Sun Jun 17 18:05:50 2007 +0000   
974         summary:     Added an extra line of output   
975         
976
977 As you can see from the before-and-after output of “hg tip”, we have
978 successfully pulled changes into our repository. There remains one
979 step before we can see these changes in the working directory.
980
981 #### 2.8.2  Updating the working directory
982
983 We have so far glossed over the relationship between a repository and
984 its working directory. The “hg pull” command that we ran in
985 section [2.8.1][12] brought changes into the repository, but if we
986 check, there’s no sign of those changes in the working directory. This
987 is because “hg pull” does not (by default) touch the working
988 directory. Instead, we use the “hg update” command to do this.
989
990         $ grep printf hello.c   
991         printf("hello, world!∖");   
992         $ hg update tip   
993         1 files updated, 0 files merged, 0 files removed, 0 files unresolved   
994         $ grep printf hello.c   
995         printf("hello, world!∖");   
996         printf("hello again!∖n");
997
998 It might seem a bit strange that “hg pull” doesn’t update the working
999 directory automatically. There’s actually a good reason for this: you
1000 can use “hg update” to update the working directory to the state it
1001 was in at any revision in the history of the repository. If you had
1002 the working directory updated to an old revision—to hunt down the
1003 origin of a bug, say—and ran a “hg pull” which automatically updated
1004 the working directory to a new revision, you might not be terribly
1005 happy.
1006
1007 However, since pull-then-update is such a common thing to do,
1008 Mercurial lets you combine the two by passing the -u option to “hg
1009 pull”.
1010
1011         hg pull -u
1012
1013 If you look back at the output of “hg pull” in section [2.8.1][12]
1014 when we ran it without -u, you can see that it printed a helpful
1015 reminder that we’d have to take an explicit step to update the working
1016 directory:
1017
1018         (run 'hg update' to get a working copy)
1019
1020 To find out what revision the working directory is at, use the “hg
1021 parents” command.
1022
1023         $ hg parents   
1024         changeset:   5:fa1321bf0c80   
1025         tag:         tip   
1026         user:        Bryan O'Sullivan <bos@serpentine.com>   
1027         date:        Sun Jun 17 18:05:50 2007 +0000   
1028         summary:     Added an extra line of output   
1029         
1030
1031 If you look back at figure [2.1][8], you’ll see arrows connecting each
1032 changeset. The node that the arrow leads from in each case is a
1033 parent, and the node that the arrow leads to is its child. The working
1034 directory has a parent in just the same way; this is the changeset
1035 that the working directory currently contains.
1036
1037 To update the working directory to a particular revision, give a
1038 revision number or changeset ID to the “hg update” command.
1039
1040         $ hg update 2   
1041         2 files updated, 0 files merged, 0 files removed, 0 files unresolved   
1042         $ hg parents   
1043         changeset:   2:057d3c2d823c   
1044         user:        Bryan O'Sullivan <bos@serpentine.com>   
1045         date:        Tue Sep 06 13:15:43 2005 -0700   
1046         summary:     Introduce a typo into hello.c.   
1047         
1048         $ hg update   
1049         2 files updated, 0 files merged, 0 files removed, 0 files unresolved
1050
1051 If you omit an explicit revision, “hg update” will update to the tip
1052 revision, as shown by the second call to “hg update” in the example
1053 above.
1054
1055 #### 2.8.3  Pushing changes to another repository
1056
1057 Mercurial lets us push changes to another repository, from the
1058 repository we’re currently visiting. As with the example of “hg pull”
1059 above, we’ll create a temporary repository to push our changes into.
1060
1061         $ cd ..   
1062         $ hg clone hello hello-push   
1063         2 files updated, 0 files merged, 0 files removed, 0 files unresolved
1064
1065 The “hg outgoing” command tells us what changes would be pushed into
1066 another repository.
1067
1068         $ cd my-hello   
1069         $ hg outgoing ../hello-push   
1070         comparing with ../hello-push   
1071         searching for changes   
1072         changeset:   5:fa1321bf0c80   
1073         tag:         tip   
1074         user:        Bryan O'Sullivan <bos@serpentine.com>   
1075         date:        Sun Jun 17 18:05:50 2007 +0000   
1076         summary:     Added an extra line of output   
1077         
1078
1079 And the “hg push” command does the actual push. 
1080
1081         $ hg push ../hello-push   
1082         pushing to ../hello-push   
1083         searching for changes   
1084         adding changesets   
1085         adding manifests   
1086         adding file changes   
1087         added 1 changesets with 1 changes to 1 files
1088
1089 As with “hg pull”, the “hg push” command does not update the working
1090 directory in the repository that it’s pushing changes into. (Unlike
1091 “hg pull”, “hg push” does not provide a -u option that updates the
1092 other repository’s working directory.)
1093
1094 What happens if we try to pull or push changes and the receiving
1095 repository already has those changes? Nothing too exciting.
1096
1097         $ hg push ../hello-push   
1098         pushing to ../hello-push   
1099         searching for changes   
1100         no changes found
1101
1102 #### 2.8.4  Sharing changes over a network
1103
1104 The commands we have covered in the previous few sections are not
1105 limited to working with local repositories. Each works in exactly the
1106 same fashion over a network connection; simply pass in a URL instead
1107 of a local path.
1108
1109         $ hg outgoing http://hg.serpentine.com/tutorial/hello   
1110         comparing with http://hg.serpentine.com/tutorial/hello   
1111         searching for changes   
1112         changeset:   5:fa1321bf0c80   
1113         tag:         tip   
1114         user:        Bryan O'Sullivan <bos@serpentine.com>   
1115         date:        Sun Jun 17 18:05:50 2007 +0000   
1116         summary:     Added an extra line of output   
1117         
1118
1119 In this example, we can see what changes we could push to the remote
1120 repository, but the repository is understandably not set up to let
1121 anonymous users push to it.
1122
1123         $ hg push http://hg.serpentine.com/tutorial/hello   
1124         pushing to http://hg.serpentine.com/tutorial/hello   
1125         searching for changes   
1126         ssl required
1127
1128    [1]: http://hgbook.red-bean.com/hgbookch3.html
1129    [2]: http://hgbook.red-bean.com/hgbookch1.html
1130    [3]: http://hgbook.red-bean.com/hgbookch1.html#tailhgbookch1.html
1131    [4]: #tailhgbookch2.html
1132    [5]: http://hgbook.red-bean.com/hgbook.html#hgbookch2.html
1133    [6]: http://mercurial.berkwood.com/
1134    [7]: http://hgbook.red-bean.com/hgbookli4.html#Xweb:macpython
1135    [8]: #x6-340581
1136    [9]: hgbookch2_files/tour-history.png
1137    [10]: http://hgbook.red-bean.com/hgbookch12.html#x16-27100012.4
1138    [11]: #x6-420002.7.1
1139    [12]: #x6-490002.8.1
1140    [13]: http://hgbook.red-bean.com/hgbookch2.html
1141
1142 ## Appendix D  
1143 Open Publication License
1144
1145 Version 1.0, 8 June 1999 
1146
1147 ### D.1  Requirements on both unmodified and modified versions
1148
1149 The Open Publication works may be reproduced and distributed in whole
1150 or in part, in any medium physical or electronic, provided that the
1151 terms of this license are adhered to, and that this license or an
1152 incorporation of it by reference (with any options elected by the
1153 author(s) and/or publisher) is displayed in the reproduction.
1154
1155 Proper form for an incorporation by reference is as follows: 
1156
1157 Copyright (c) year by author’s name or designee. This material may be
1158 distributed only subject to the terms and conditions set forth in the
1159 Open Publication License, vx.y or later (the latest version is
1160 presently available at
1161 [http://www.opencontent.org/openpub/][http://www.opencontent.org/openpub/]).
1162
1163 The reference must be immediately followed with any options elected by
1164 the author(s) and/or publisher of the document (see section D.6).
1165
1166 Commercial redistribution of Open Publication-licensed material is
1167 permitted.
1168
1169 Any publication in standard (paper) book form shall require the
1170 citation of the original publisher and author. The publisher and
1171 author’s names shall appear on all outer surfaces of the book. On all
1172 outer surfaces of the book the original publisher’s name shall be as
1173 large as the title of the work and cited as possessive with respect to
1174 the title.
1175
1176 ### D.2  Copyright
1177
1178 The copyright to each Open Publication is owned by its author(s) or
1179 designee.
1180
1181 ### D.3  Scope of license
1182
1183 The following license terms apply to all Open Publication works,
1184 unless otherwise explicitly stated in the document.
1185
1186 Mere aggregation of Open Publication works or a portion of an Open
1187 Publication work with other works or programs on the same media shall
1188 not cause this license to apply to those other works. The aggregate
1189 work shall contain a notice specifying the inclusion of the Open
1190 Publication material and appropriate copyright notice.
1191
1192 Severability. If any part of this license is found to be unenforceable
1193 in any jurisdiction, the remaining portions of the license remain in
1194 force.
1195
1196 No warranty. Open Publication works are licensed and provided “as is”
1197 without warranty of any kind, express or implied, including, but not
1198 limited to, the implied warranties of merchantability and fitness for
1199 a particular purpose or a warranty of non-infringement.
1200
1201 ### D.4  Requirements on modified works
1202
1203 All modified versions of documents covered by this license, including
1204 translations, anthologies, compilations and partial documents, must
1205 meet the following requirements:
1206
1207   1. The modified version must be labeled as such. 
1208   2. The person making the modifications must be identified and the
1209      modifications dated.
1210   3. Acknowledgement of the original author and publisher if
1211      applicable must be retained according to normal academic citation
1212      practices.
1213   4. The location of the original unmodified document must be identified. 
1214   5. The original author’s (or authors’) name(s) may not be used to
1215      assert or imply endorsement of the resulting document without the
1216      original author’s (or authors’) permission.
1217
1218 ### D.5  Good-practice recommendations
1219
1220 In addition to the requirements of this license, it is requested from
1221 and strongly recommended of redistributors that:
1222
1223   1. If you are distributing Open Publication works on hardcopy or
1224      CD-ROM, you provide email notification to the authors of your
1225      intent to redistribute at least thirty days before your
1226      manuscript or media freeze, to give the authors time to provide
1227      updated documents. This notification should describe
1228      modifications, if any, made to the document.
1229   2. All substantive modifications (including deletions) be either
1230      clearly marked up in the document or else described in an
1231      attachment to the document.
1232   3. Finally, while it is not mandatory under this license, it is
1233      considered good form to offer a free copy of any hardcopy and
1234      CD-ROM expression of an Open Publication-licensed work to its
1235      author(s).
1236
1237 ### D.6  License options
1238
1239 The author(s) and/or publisher of an Open Publication-licensed
1240 document may elect certain options by appending language to the
1241 reference to or copy of the license. These options are considered part
1242 of the license instance and must be included with the license (or its
1243 incorporation by reference) in derived works.
1244
1245   1. To prohibit distribution of substantively modified versions
1246      without the explicit permission of the author(s). “Substantive
1247      modification” is defined as a change to the semantic content of
1248      the document, and excludes mere changes in format or
1249      typographical corrections.
1250
1251      To accomplish this, add the phrase “Distribution of substantively
1252      modified versions of this document is prohibited without the
1253      explicit permission of the copyright holder.” to the license
1254      reference or copy.
1255
1256   2. To prohibit any publication of this work or derivative works in
1257      whole or in part in standard (paper) book form for commercial
1258      purposes is prohibited unless prior permission is obtained from
1259      the copyright holder.
1260
1261      To accomplish this, add the phrase “Distribution of the work or
1262      derivative of the work in any standard (paper) book form is
1263      prohibited unless prior permission is obtained from the copyright
1264      holder.” to the license reference or copy.