gitweb: Add a feature for adding more branch refs
[git] / gitweb / gitweb.perl
1 #!/usr/bin/perl
2
3 # gitweb - simple web interface to track changes in git repositories
4 #
5 # (C) 2005-2006, Kay Sievers <kay.sievers@vrfy.org>
6 # (C) 2005, Christian Gierke
7 #
8 # This program is licensed under the GPLv2
9
10 use 5.008;
11 use strict;
12 use warnings;
13 use CGI qw(:standard :escapeHTML -nosticky);
14 use CGI::Util qw(unescape);
15 use CGI::Carp qw(fatalsToBrowser set_message);
16 use Encode;
17 use Fcntl ':mode';
18 use File::Find qw();
19 use File::Basename qw(basename);
20 use Time::HiRes qw(gettimeofday tv_interval);
21 binmode STDOUT, ':utf8';
22
23 our $t0 = [ gettimeofday() ];
24 our $number_of_git_cmds = 0;
25
26 BEGIN {
27         CGI->compile() if $ENV{'MOD_PERL'};
28 }
29
30 our $version = "++GIT_VERSION++";
31
32 our ($my_url, $my_uri, $base_url, $path_info, $home_link);
33 sub evaluate_uri {
34         our $cgi;
35
36         our $my_url = $cgi->url();
37         our $my_uri = $cgi->url(-absolute => 1);
38
39         # Base URL for relative URLs in gitweb ($logo, $favicon, ...),
40         # needed and used only for URLs with nonempty PATH_INFO
41         our $base_url = $my_url;
42
43         # When the script is used as DirectoryIndex, the URL does not contain the name
44         # of the script file itself, and $cgi->url() fails to strip PATH_INFO, so we
45         # have to do it ourselves. We make $path_info global because it's also used
46         # later on.
47         #
48         # Another issue with the script being the DirectoryIndex is that the resulting
49         # $my_url data is not the full script URL: this is good, because we want
50         # generated links to keep implying the script name if it wasn't explicitly
51         # indicated in the URL we're handling, but it means that $my_url cannot be used
52         # as base URL.
53         # Therefore, if we needed to strip PATH_INFO, then we know that we have
54         # to build the base URL ourselves:
55         our $path_info = decode_utf8($ENV{"PATH_INFO"});
56         if ($path_info) {
57                 # $path_info has already been URL-decoded by the web server, but
58                 # $my_url and $my_uri have not. URL-decode them so we can properly
59                 # strip $path_info.
60                 $my_url = unescape($my_url);
61                 $my_uri = unescape($my_uri);
62                 if ($my_url =~ s,\Q$path_info\E$,, &&
63                     $my_uri =~ s,\Q$path_info\E$,, &&
64                     defined $ENV{'SCRIPT_NAME'}) {
65                         $base_url = $cgi->url(-base => 1) . $ENV{'SCRIPT_NAME'};
66                 }
67         }
68
69         # target of the home link on top of all pages
70         our $home_link = $my_uri || "/";
71 }
72
73 # core git executable to use
74 # this can just be "git" if your webserver has a sensible PATH
75 our $GIT = "++GIT_BINDIR++/git";
76
77 # absolute fs-path which will be prepended to the project path
78 #our $projectroot = "/pub/scm";
79 our $projectroot = "++GITWEB_PROJECTROOT++";
80
81 # fs traversing limit for getting project list
82 # the number is relative to the projectroot
83 our $project_maxdepth = "++GITWEB_PROJECT_MAXDEPTH++";
84
85 # string of the home link on top of all pages
86 our $home_link_str = "++GITWEB_HOME_LINK_STR++";
87
88 # extra breadcrumbs preceding the home link
89 our @extra_breadcrumbs = ();
90
91 # name of your site or organization to appear in page titles
92 # replace this with something more descriptive for clearer bookmarks
93 our $site_name = "++GITWEB_SITENAME++"
94                  || ($ENV{'SERVER_NAME'} || "Untitled") . " Git";
95
96 # html snippet to include in the <head> section of each page
97 our $site_html_head_string = "++GITWEB_SITE_HTML_HEAD_STRING++";
98 # filename of html text to include at top of each page
99 our $site_header = "++GITWEB_SITE_HEADER++";
100 # html text to include at home page
101 our $home_text = "++GITWEB_HOMETEXT++";
102 # filename of html text to include at bottom of each page
103 our $site_footer = "++GITWEB_SITE_FOOTER++";
104
105 # URI of stylesheets
106 our @stylesheets = ("++GITWEB_CSS++");
107 # URI of a single stylesheet, which can be overridden in GITWEB_CONFIG.
108 our $stylesheet = undef;
109 # URI of GIT logo (72x27 size)
110 our $logo = "++GITWEB_LOGO++";
111 # URI of GIT favicon, assumed to be image/png type
112 our $favicon = "++GITWEB_FAVICON++";
113 # URI of gitweb.js (JavaScript code for gitweb)
114 our $javascript = "++GITWEB_JS++";
115
116 # URI and label (title) of GIT logo link
117 #our $logo_url = "http://www.kernel.org/pub/software/scm/git/docs/";
118 #our $logo_label = "git documentation";
119 our $logo_url = "http://git-scm.com/";
120 our $logo_label = "git homepage";
121
122 # source of projects list
123 our $projects_list = "++GITWEB_LIST++";
124
125 # the width (in characters) of the projects list "Description" column
126 our $projects_list_description_width = 25;
127
128 # group projects by category on the projects list
129 # (enabled if this variable evaluates to true)
130 our $projects_list_group_categories = 0;
131
132 # default category if none specified
133 # (leave the empty string for no category)
134 our $project_list_default_category = "";
135
136 # default order of projects list
137 # valid values are none, project, descr, owner, and age
138 our $default_projects_order = "project";
139
140 # show repository only if this file exists
141 # (only effective if this variable evaluates to true)
142 our $export_ok = "++GITWEB_EXPORT_OK++";
143
144 # don't generate age column on the projects list page
145 our $omit_age_column = 0;
146
147 # don't generate information about owners of repositories
148 our $omit_owner=0;
149
150 # show repository only if this subroutine returns true
151 # when given the path to the project, for example:
152 #    sub { return -e "$_[0]/git-daemon-export-ok"; }
153 our $export_auth_hook = undef;
154
155 # only allow viewing of repositories also shown on the overview page
156 our $strict_export = "++GITWEB_STRICT_EXPORT++";
157
158 # list of git base URLs used for URL to where fetch project from,
159 # i.e. full URL is "$git_base_url/$project"
160 our @git_base_url_list = grep { $_ ne '' } ("++GITWEB_BASE_URL++");
161
162 # default blob_plain mimetype and default charset for text/plain blob
163 our $default_blob_plain_mimetype = 'text/plain';
164 our $default_text_plain_charset  = undef;
165
166 # file to use for guessing MIME types before trying /etc/mime.types
167 # (relative to the current git repository)
168 our $mimetypes_file = undef;
169
170 # assume this charset if line contains non-UTF-8 characters;
171 # it should be valid encoding (see Encoding::Supported(3pm) for list),
172 # for which encoding all byte sequences are valid, for example
173 # 'iso-8859-1' aka 'latin1' (it is decoded without checking, so it
174 # could be even 'utf-8' for the old behavior)
175 our $fallback_encoding = 'latin1';
176
177 # rename detection options for git-diff and git-diff-tree
178 # - default is '-M', with the cost proportional to
179 #   (number of removed files) * (number of new files).
180 # - more costly is '-C' (which implies '-M'), with the cost proportional to
181 #   (number of changed files + number of removed files) * (number of new files)
182 # - even more costly is '-C', '--find-copies-harder' with cost
183 #   (number of files in the original tree) * (number of new files)
184 # - one might want to include '-B' option, e.g. '-B', '-M'
185 our @diff_opts = ('-M'); # taken from git_commit
186
187 # Disables features that would allow repository owners to inject script into
188 # the gitweb domain.
189 our $prevent_xss = 0;
190
191 # Path to the highlight executable to use (must be the one from
192 # http://www.andre-simon.de due to assumptions about parameters and output).
193 # Useful if highlight is not installed on your webserver's PATH.
194 # [Default: highlight]
195 our $highlight_bin = "++HIGHLIGHT_BIN++";
196
197 # information about snapshot formats that gitweb is capable of serving
198 our %known_snapshot_formats = (
199         # name => {
200         #       'display' => display name,
201         #       'type' => mime type,
202         #       'suffix' => filename suffix,
203         #       'format' => --format for git-archive,
204         #       'compressor' => [compressor command and arguments]
205         #                       (array reference, optional)
206         #       'disabled' => boolean (optional)}
207         #
208         'tgz' => {
209                 'display' => 'tar.gz',
210                 'type' => 'application/x-gzip',
211                 'suffix' => '.tar.gz',
212                 'format' => 'tar',
213                 'compressor' => ['gzip', '-n']},
214
215         'tbz2' => {
216                 'display' => 'tar.bz2',
217                 'type' => 'application/x-bzip2',
218                 'suffix' => '.tar.bz2',
219                 'format' => 'tar',
220                 'compressor' => ['bzip2']},
221
222         'txz' => {
223                 'display' => 'tar.xz',
224                 'type' => 'application/x-xz',
225                 'suffix' => '.tar.xz',
226                 'format' => 'tar',
227                 'compressor' => ['xz'],
228                 'disabled' => 1},
229
230         'zip' => {
231                 'display' => 'zip',
232                 'type' => 'application/x-zip',
233                 'suffix' => '.zip',
234                 'format' => 'zip'},
235 );
236
237 # Aliases so we understand old gitweb.snapshot values in repository
238 # configuration.
239 our %known_snapshot_format_aliases = (
240         'gzip'  => 'tgz',
241         'bzip2' => 'tbz2',
242         'xz'    => 'txz',
243
244         # backward compatibility: legacy gitweb config support
245         'x-gzip' => undef, 'gz' => undef,
246         'x-bzip2' => undef, 'bz2' => undef,
247         'x-zip' => undef, '' => undef,
248 );
249
250 # Pixel sizes for icons and avatars. If the default font sizes or lineheights
251 # are changed, it may be appropriate to change these values too via
252 # $GITWEB_CONFIG.
253 our %avatar_size = (
254         'default' => 16,
255         'double'  => 32
256 );
257
258 # Used to set the maximum load that we will still respond to gitweb queries.
259 # If server load exceed this value then return "503 server busy" error.
260 # If gitweb cannot determined server load, it is taken to be 0.
261 # Leave it undefined (or set to 'undef') to turn off load checking.
262 our $maxload = 300;
263
264 # configuration for 'highlight' (http://www.andre-simon.de/)
265 # match by basename
266 our %highlight_basename = (
267         #'Program' => 'py',
268         #'Library' => 'py',
269         'SConstruct' => 'py', # SCons equivalent of Makefile
270         'Makefile' => 'make',
271 );
272 # match by extension
273 our %highlight_ext = (
274         # main extensions, defining name of syntax;
275         # see files in /usr/share/highlight/langDefs/ directory
276         (map { $_ => $_ } qw(py rb java css js tex bib xml awk bat ini spec tcl sql)),
277         # alternate extensions, see /etc/highlight/filetypes.conf
278         (map { $_ => 'c'   } qw(c h)),
279         (map { $_ => 'sh'  } qw(sh bash zsh ksh)),
280         (map { $_ => 'cpp' } qw(cpp cxx c++ cc)),
281         (map { $_ => 'php' } qw(php php3 php4 php5 phps)),
282         (map { $_ => 'pl'  } qw(pl perl pm)), # perhaps also 'cgi'
283         (map { $_ => 'make'} qw(make mak mk)),
284         (map { $_ => 'xml' } qw(xml xhtml html htm)),
285 );
286
287 # You define site-wide feature defaults here; override them with
288 # $GITWEB_CONFIG as necessary.
289 our %feature = (
290         # feature => {
291         #       'sub' => feature-sub (subroutine),
292         #       'override' => allow-override (boolean),
293         #       'default' => [ default options...] (array reference)}
294         #
295         # if feature is overridable (it means that allow-override has true value),
296         # then feature-sub will be called with default options as parameters;
297         # return value of feature-sub indicates if to enable specified feature
298         #
299         # if there is no 'sub' key (no feature-sub), then feature cannot be
300         # overridden
301         #
302         # use gitweb_get_feature(<feature>) to retrieve the <feature> value
303         # (an array) or gitweb_check_feature(<feature>) to check if <feature>
304         # is enabled
305
306         # Enable the 'blame' blob view, showing the last commit that modified
307         # each line in the file. This can be very CPU-intensive.
308
309         # To enable system wide have in $GITWEB_CONFIG
310         # $feature{'blame'}{'default'} = [1];
311         # To have project specific config enable override in $GITWEB_CONFIG
312         # $feature{'blame'}{'override'} = 1;
313         # and in project config gitweb.blame = 0|1;
314         'blame' => {
315                 'sub' => sub { feature_bool('blame', @_) },
316                 'override' => 0,
317                 'default' => [0]},
318
319         # Enable the 'snapshot' link, providing a compressed archive of any
320         # tree. This can potentially generate high traffic if you have large
321         # project.
322
323         # Value is a list of formats defined in %known_snapshot_formats that
324         # you wish to offer.
325         # To disable system wide have in $GITWEB_CONFIG
326         # $feature{'snapshot'}{'default'} = [];
327         # To have project specific config enable override in $GITWEB_CONFIG
328         # $feature{'snapshot'}{'override'} = 1;
329         # and in project config, a comma-separated list of formats or "none"
330         # to disable.  Example: gitweb.snapshot = tbz2,zip;
331         'snapshot' => {
332                 'sub' => \&feature_snapshot,
333                 'override' => 0,
334                 'default' => ['tgz']},
335
336         # Enable text search, which will list the commits which match author,
337         # committer or commit text to a given string.  Enabled by default.
338         # Project specific override is not supported.
339         #
340         # Note that this controls all search features, which means that if
341         # it is disabled, then 'grep' and 'pickaxe' search would also be
342         # disabled.
343         'search' => {
344                 'override' => 0,
345                 'default' => [1]},
346
347         # Enable grep search, which will list the files in currently selected
348         # tree containing the given string. Enabled by default. This can be
349         # potentially CPU-intensive, of course.
350         # Note that you need to have 'search' feature enabled too.
351
352         # To enable system wide have in $GITWEB_CONFIG
353         # $feature{'grep'}{'default'} = [1];
354         # To have project specific config enable override in $GITWEB_CONFIG
355         # $feature{'grep'}{'override'} = 1;
356         # and in project config gitweb.grep = 0|1;
357         'grep' => {
358                 'sub' => sub { feature_bool('grep', @_) },
359                 'override' => 0,
360                 'default' => [1]},
361
362         # Enable the pickaxe search, which will list the commits that modified
363         # a given string in a file. This can be practical and quite faster
364         # alternative to 'blame', but still potentially CPU-intensive.
365         # Note that you need to have 'search' feature enabled too.
366
367         # To enable system wide have in $GITWEB_CONFIG
368         # $feature{'pickaxe'}{'default'} = [1];
369         # To have project specific config enable override in $GITWEB_CONFIG
370         # $feature{'pickaxe'}{'override'} = 1;
371         # and in project config gitweb.pickaxe = 0|1;
372         'pickaxe' => {
373                 'sub' => sub { feature_bool('pickaxe', @_) },
374                 'override' => 0,
375                 'default' => [1]},
376
377         # Enable showing size of blobs in a 'tree' view, in a separate
378         # column, similar to what 'ls -l' does.  This cost a bit of IO.
379
380         # To disable system wide have in $GITWEB_CONFIG
381         # $feature{'show-sizes'}{'default'} = [0];
382         # To have project specific config enable override in $GITWEB_CONFIG
383         # $feature{'show-sizes'}{'override'} = 1;
384         # and in project config gitweb.showsizes = 0|1;
385         'show-sizes' => {
386                 'sub' => sub { feature_bool('showsizes', @_) },
387                 'override' => 0,
388                 'default' => [1]},
389
390         # Make gitweb use an alternative format of the URLs which can be
391         # more readable and natural-looking: project name is embedded
392         # directly in the path and the query string contains other
393         # auxiliary information. All gitweb installations recognize
394         # URL in either format; this configures in which formats gitweb
395         # generates links.
396
397         # To enable system wide have in $GITWEB_CONFIG
398         # $feature{'pathinfo'}{'default'} = [1];
399         # Project specific override is not supported.
400
401         # Note that you will need to change the default location of CSS,
402         # favicon, logo and possibly other files to an absolute URL. Also,
403         # if gitweb.cgi serves as your indexfile, you will need to force
404         # $my_uri to contain the script name in your $GITWEB_CONFIG.
405         'pathinfo' => {
406                 'override' => 0,
407                 'default' => [0]},
408
409         # Make gitweb consider projects in project root subdirectories
410         # to be forks of existing projects. Given project $projname.git,
411         # projects matching $projname/*.git will not be shown in the main
412         # projects list, instead a '+' mark will be added to $projname
413         # there and a 'forks' view will be enabled for the project, listing
414         # all the forks. If project list is taken from a file, forks have
415         # to be listed after the main project.
416
417         # To enable system wide have in $GITWEB_CONFIG
418         # $feature{'forks'}{'default'} = [1];
419         # Project specific override is not supported.
420         'forks' => {
421                 'override' => 0,
422                 'default' => [0]},
423
424         # Insert custom links to the action bar of all project pages.
425         # This enables you mainly to link to third-party scripts integrating
426         # into gitweb; e.g. git-browser for graphical history representation
427         # or custom web-based repository administration interface.
428
429         # The 'default' value consists of a list of triplets in the form
430         # (label, link, position) where position is the label after which
431         # to insert the link and link is a format string where %n expands
432         # to the project name, %f to the project path within the filesystem,
433         # %h to the current hash (h gitweb parameter) and %b to the current
434         # hash base (hb gitweb parameter); %% expands to %.
435
436         # To enable system wide have in $GITWEB_CONFIG e.g.
437         # $feature{'actions'}{'default'} = [('graphiclog',
438         #       '/git-browser/by-commit.html?r=%n', 'summary')];
439         # Project specific override is not supported.
440         'actions' => {
441                 'override' => 0,
442                 'default' => []},
443
444         # Allow gitweb scan project content tags of project repository,
445         # and display the popular Web 2.0-ish "tag cloud" near the projects
446         # list.  Note that this is something COMPLETELY different from the
447         # normal Git tags.
448
449         # gitweb by itself can show existing tags, but it does not handle
450         # tagging itself; you need to do it externally, outside gitweb.
451         # The format is described in git_get_project_ctags() subroutine.
452         # You may want to install the HTML::TagCloud Perl module to get
453         # a pretty tag cloud instead of just a list of tags.
454
455         # To enable system wide have in $GITWEB_CONFIG
456         # $feature{'ctags'}{'default'} = [1];
457         # Project specific override is not supported.
458
459         # In the future whether ctags editing is enabled might depend
460         # on the value, but using 1 should always mean no editing of ctags.
461         'ctags' => {
462                 'override' => 0,
463                 'default' => [0]},
464
465         # The maximum number of patches in a patchset generated in patch
466         # view. Set this to 0 or undef to disable patch view, or to a
467         # negative number to remove any limit.
468
469         # To disable system wide have in $GITWEB_CONFIG
470         # $feature{'patches'}{'default'} = [0];
471         # To have project specific config enable override in $GITWEB_CONFIG
472         # $feature{'patches'}{'override'} = 1;
473         # and in project config gitweb.patches = 0|n;
474         # where n is the maximum number of patches allowed in a patchset.
475         'patches' => {
476                 'sub' => \&feature_patches,
477                 'override' => 0,
478                 'default' => [16]},
479
480         # Avatar support. When this feature is enabled, views such as
481         # shortlog or commit will display an avatar associated with
482         # the email of the committer(s) and/or author(s).
483
484         # Currently available providers are gravatar and picon.
485         # If an unknown provider is specified, the feature is disabled.
486
487         # Gravatar depends on Digest::MD5.
488         # Picon currently relies on the indiana.edu database.
489
490         # To enable system wide have in $GITWEB_CONFIG
491         # $feature{'avatar'}{'default'} = ['<provider>'];
492         # where <provider> is either gravatar or picon.
493         # To have project specific config enable override in $GITWEB_CONFIG
494         # $feature{'avatar'}{'override'} = 1;
495         # and in project config gitweb.avatar = <provider>;
496         'avatar' => {
497                 'sub' => \&feature_avatar,
498                 'override' => 0,
499                 'default' => ['']},
500
501         # Enable displaying how much time and how many git commands
502         # it took to generate and display page.  Disabled by default.
503         # Project specific override is not supported.
504         'timed' => {
505                 'override' => 0,
506                 'default' => [0]},
507
508         # Enable turning some links into links to actions which require
509         # JavaScript to run (like 'blame_incremental').  Not enabled by
510         # default.  Project specific override is currently not supported.
511         'javascript-actions' => {
512                 'override' => 0,
513                 'default' => [0]},
514
515         # Enable and configure ability to change common timezone for dates
516         # in gitweb output via JavaScript.  Enabled by default.
517         # Project specific override is not supported.
518         'javascript-timezone' => {
519                 'override' => 0,
520                 'default' => [
521                         'local',     # default timezone: 'utc', 'local', or '(-|+)HHMM' format,
522                                      # or undef to turn off this feature
523                         'gitweb_tz', # name of cookie where to store selected timezone
524                         'datetime',  # CSS class used to mark up dates for manipulation
525                 ]},
526
527         # Syntax highlighting support. This is based on Daniel Svensson's
528         # and Sham Chukoury's work in gitweb-xmms2.git.
529         # It requires the 'highlight' program present in $PATH,
530         # and therefore is disabled by default.
531
532         # To enable system wide have in $GITWEB_CONFIG
533         # $feature{'highlight'}{'default'} = [1];
534
535         'highlight' => {
536                 'sub' => sub { feature_bool('highlight', @_) },
537                 'override' => 0,
538                 'default' => [0]},
539
540         # Enable displaying of remote heads in the heads list
541
542         # To enable system wide have in $GITWEB_CONFIG
543         # $feature{'remote_heads'}{'default'} = [1];
544         # To have project specific config enable override in $GITWEB_CONFIG
545         # $feature{'remote_heads'}{'override'} = 1;
546         # and in project config gitweb.remoteheads = 0|1;
547         'remote_heads' => {
548                 'sub' => sub { feature_bool('remote_heads', @_) },
549                 'override' => 0,
550                 'default' => [0]},
551
552         # Enable showing branches under other refs in addition to heads
553
554         # To set system wide extra branch refs have in $GITWEB_CONFIG
555         # $feature{'extra-branch-refs'}{'default'} = ['dirs', 'of', 'choice'];
556         # To have project specific config enable override in $GITWEB_CONFIG
557         # $feature{'extra-branch-refs'}{'override'} = 1;
558         # and in project config gitweb.extrabranchrefs = dirs of choice
559         # Every directory is separated with whitespace.
560
561         'extra-branch-refs' => {
562                 'sub' => \&feature_extra_branch_refs,
563                 'override' => 0,
564                 'default' => []},
565 );
566
567 sub gitweb_get_feature {
568         my ($name) = @_;
569         return unless exists $feature{$name};
570         my ($sub, $override, @defaults) = (
571                 $feature{$name}{'sub'},
572                 $feature{$name}{'override'},
573                 @{$feature{$name}{'default'}});
574         # project specific override is possible only if we have project
575         our $git_dir; # global variable, declared later
576         if (!$override || !defined $git_dir) {
577                 return @defaults;
578         }
579         if (!defined $sub) {
580                 warn "feature $name is not overridable";
581                 return @defaults;
582         }
583         return $sub->(@defaults);
584 }
585
586 # A wrapper to check if a given feature is enabled.
587 # With this, you can say
588 #
589 #   my $bool_feat = gitweb_check_feature('bool_feat');
590 #   gitweb_check_feature('bool_feat') or somecode;
591 #
592 # instead of
593 #
594 #   my ($bool_feat) = gitweb_get_feature('bool_feat');
595 #   (gitweb_get_feature('bool_feat'))[0] or somecode;
596 #
597 sub gitweb_check_feature {
598         return (gitweb_get_feature(@_))[0];
599 }
600
601
602 sub feature_bool {
603         my $key = shift;
604         my ($val) = git_get_project_config($key, '--bool');
605
606         if (!defined $val) {
607                 return ($_[0]);
608         } elsif ($val eq 'true') {
609                 return (1);
610         } elsif ($val eq 'false') {
611                 return (0);
612         }
613 }
614
615 sub feature_snapshot {
616         my (@fmts) = @_;
617
618         my ($val) = git_get_project_config('snapshot');
619
620         if ($val) {
621                 @fmts = ($val eq 'none' ? () : split /\s*[,\s]\s*/, $val);
622         }
623
624         return @fmts;
625 }
626
627 sub feature_patches {
628         my @val = (git_get_project_config('patches', '--int'));
629
630         if (@val) {
631                 return @val;
632         }
633
634         return ($_[0]);
635 }
636
637 sub feature_avatar {
638         my @val = (git_get_project_config('avatar'));
639
640         return @val ? @val : @_;
641 }
642
643 sub feature_extra_branch_refs {
644         my (@branch_refs) = @_;
645         my $values = git_get_project_config('extrabranchrefs');
646
647         if ($values) {
648                 $values = config_to_multi ($values);
649                 @branch_refs = ();
650                 foreach my $value (@{$values}) {
651                         push @branch_refs, split /\s+/, $value;
652                 }
653         }
654
655         return @branch_refs;
656 }
657
658 # checking HEAD file with -e is fragile if the repository was
659 # initialized long time ago (i.e. symlink HEAD) and was pack-ref'ed
660 # and then pruned.
661 sub check_head_link {
662         my ($dir) = @_;
663         my $headfile = "$dir/HEAD";
664         return ((-e $headfile) ||
665                 (-l $headfile && readlink($headfile) =~ /^refs\/heads\//));
666 }
667
668 sub check_export_ok {
669         my ($dir) = @_;
670         return (check_head_link($dir) &&
671                 (!$export_ok || -e "$dir/$export_ok") &&
672                 (!$export_auth_hook || $export_auth_hook->($dir)));
673 }
674
675 # process alternate names for backward compatibility
676 # filter out unsupported (unknown) snapshot formats
677 sub filter_snapshot_fmts {
678         my @fmts = @_;
679
680         @fmts = map {
681                 exists $known_snapshot_format_aliases{$_} ?
682                        $known_snapshot_format_aliases{$_} : $_} @fmts;
683         @fmts = grep {
684                 exists $known_snapshot_formats{$_} &&
685                 !$known_snapshot_formats{$_}{'disabled'}} @fmts;
686 }
687
688 sub filter_and_validate_refs {
689         my @refs = @_;
690         my %unique_refs = ();
691
692         foreach my $ref (@refs) {
693                 die_error(500, "Invalid ref '$ref' in 'extra-branch-refs' feature") unless (is_valid_ref_format($ref));
694                 # 'heads' are added implicitly in get_branch_refs().
695                 $unique_refs{$ref} = 1 if ($ref ne 'heads');
696         }
697         return sort keys %unique_refs;
698 }
699
700 # If it is set to code reference, it is code that it is to be run once per
701 # request, allowing updating configurations that change with each request,
702 # while running other code in config file only once.
703 #
704 # Otherwise, if it is false then gitweb would process config file only once;
705 # if it is true then gitweb config would be run for each request.
706 our $per_request_config = 1;
707
708 # read and parse gitweb config file given by its parameter.
709 # returns true on success, false on recoverable error, allowing
710 # to chain this subroutine, using first file that exists.
711 # dies on errors during parsing config file, as it is unrecoverable.
712 sub read_config_file {
713         my $filename = shift;
714         return unless defined $filename;
715         # die if there are errors parsing config file
716         if (-e $filename) {
717                 do $filename;
718                 die $@ if $@;
719                 return 1;
720         }
721         return;
722 }
723
724 our ($GITWEB_CONFIG, $GITWEB_CONFIG_SYSTEM, $GITWEB_CONFIG_COMMON);
725 sub evaluate_gitweb_config {
726         our $GITWEB_CONFIG = $ENV{'GITWEB_CONFIG'} || "++GITWEB_CONFIG++";
727         our $GITWEB_CONFIG_SYSTEM = $ENV{'GITWEB_CONFIG_SYSTEM'} || "++GITWEB_CONFIG_SYSTEM++";
728         our $GITWEB_CONFIG_COMMON = $ENV{'GITWEB_CONFIG_COMMON'} || "++GITWEB_CONFIG_COMMON++";
729
730         # Protect against duplications of file names, to not read config twice.
731         # Only one of $GITWEB_CONFIG and $GITWEB_CONFIG_SYSTEM is used, so
732         # there possibility of duplication of filename there doesn't matter.
733         $GITWEB_CONFIG = ""        if ($GITWEB_CONFIG eq $GITWEB_CONFIG_COMMON);
734         $GITWEB_CONFIG_SYSTEM = "" if ($GITWEB_CONFIG_SYSTEM eq $GITWEB_CONFIG_COMMON);
735
736         # Common system-wide settings for convenience.
737         # Those settings can be ovverriden by GITWEB_CONFIG or GITWEB_CONFIG_SYSTEM.
738         read_config_file($GITWEB_CONFIG_COMMON);
739
740         # Use first config file that exists.  This means use the per-instance
741         # GITWEB_CONFIG if exists, otherwise use GITWEB_SYSTEM_CONFIG.
742         read_config_file($GITWEB_CONFIG) and return;
743         read_config_file($GITWEB_CONFIG_SYSTEM);
744 }
745
746 # Get loadavg of system, to compare against $maxload.
747 # Currently it requires '/proc/loadavg' present to get loadavg;
748 # if it is not present it returns 0, which means no load checking.
749 sub get_loadavg {
750         if( -e '/proc/loadavg' ){
751                 open my $fd, '<', '/proc/loadavg'
752                         or return 0;
753                 my @load = split(/\s+/, scalar <$fd>);
754                 close $fd;
755
756                 # The first three columns measure CPU and IO utilization of the last one,
757                 # five, and 10 minute periods.  The fourth column shows the number of
758                 # currently running processes and the total number of processes in the m/n
759                 # format.  The last column displays the last process ID used.
760                 return $load[0] || 0;
761         }
762         # additional checks for load average should go here for things that don't export
763         # /proc/loadavg
764
765         return 0;
766 }
767
768 # version of the core git binary
769 our $git_version;
770 sub evaluate_git_version {
771         our $git_version = qx("$GIT" --version) =~ m/git version (.*)$/ ? $1 : "unknown";
772         $number_of_git_cmds++;
773 }
774
775 sub check_loadavg {
776         if (defined $maxload && get_loadavg() > $maxload) {
777                 die_error(503, "The load average on the server is too high");
778         }
779 }
780
781 # ======================================================================
782 # input validation and dispatch
783
784 # input parameters can be collected from a variety of sources (presently, CGI
785 # and PATH_INFO), so we define an %input_params hash that collects them all
786 # together during validation: this allows subsequent uses (e.g. href()) to be
787 # agnostic of the parameter origin
788
789 our %input_params = ();
790
791 # input parameters are stored with the long parameter name as key. This will
792 # also be used in the href subroutine to convert parameters to their CGI
793 # equivalent, and since the href() usage is the most frequent one, we store
794 # the name -> CGI key mapping here, instead of the reverse.
795 #
796 # XXX: Warning: If you touch this, check the search form for updating,
797 # too.
798
799 our @cgi_param_mapping = (
800         project => "p",
801         action => "a",
802         file_name => "f",
803         file_parent => "fp",
804         hash => "h",
805         hash_parent => "hp",
806         hash_base => "hb",
807         hash_parent_base => "hpb",
808         page => "pg",
809         order => "o",
810         searchtext => "s",
811         searchtype => "st",
812         snapshot_format => "sf",
813         extra_options => "opt",
814         search_use_regexp => "sr",
815         ctag => "by_tag",
816         diff_style => "ds",
817         project_filter => "pf",
818         # this must be last entry (for manipulation from JavaScript)
819         javascript => "js"
820 );
821 our %cgi_param_mapping = @cgi_param_mapping;
822
823 # we will also need to know the possible actions, for validation
824 our %actions = (
825         "blame" => \&git_blame,
826         "blame_incremental" => \&git_blame_incremental,
827         "blame_data" => \&git_blame_data,
828         "blobdiff" => \&git_blobdiff,
829         "blobdiff_plain" => \&git_blobdiff_plain,
830         "blob" => \&git_blob,
831         "blob_plain" => \&git_blob_plain,
832         "commitdiff" => \&git_commitdiff,
833         "commitdiff_plain" => \&git_commitdiff_plain,
834         "commit" => \&git_commit,
835         "forks" => \&git_forks,
836         "heads" => \&git_heads,
837         "history" => \&git_history,
838         "log" => \&git_log,
839         "patch" => \&git_patch,
840         "patches" => \&git_patches,
841         "remotes" => \&git_remotes,
842         "rss" => \&git_rss,
843         "atom" => \&git_atom,
844         "search" => \&git_search,
845         "search_help" => \&git_search_help,
846         "shortlog" => \&git_shortlog,
847         "summary" => \&git_summary,
848         "tag" => \&git_tag,
849         "tags" => \&git_tags,
850         "tree" => \&git_tree,
851         "snapshot" => \&git_snapshot,
852         "object" => \&git_object,
853         # those below don't need $project
854         "opml" => \&git_opml,
855         "project_list" => \&git_project_list,
856         "project_index" => \&git_project_index,
857 );
858
859 # finally, we have the hash of allowed extra_options for the commands that
860 # allow them
861 our %allowed_options = (
862         "--no-merges" => [ qw(rss atom log shortlog history) ],
863 );
864
865 # fill %input_params with the CGI parameters. All values except for 'opt'
866 # should be single values, but opt can be an array. We should probably
867 # build an array of parameters that can be multi-valued, but since for the time
868 # being it's only this one, we just single it out
869 sub evaluate_query_params {
870         our $cgi;
871
872         while (my ($name, $symbol) = each %cgi_param_mapping) {
873                 if ($symbol eq 'opt') {
874                         $input_params{$name} = [ map { decode_utf8($_) } $cgi->param($symbol) ];
875                 } else {
876                         $input_params{$name} = decode_utf8($cgi->param($symbol));
877                 }
878         }
879 }
880
881 # now read PATH_INFO and update the parameter list for missing parameters
882 sub evaluate_path_info {
883         return if defined $input_params{'project'};
884         return if !$path_info;
885         $path_info =~ s,^/+,,;
886         return if !$path_info;
887
888         # find which part of PATH_INFO is project
889         my $project = $path_info;
890         $project =~ s,/+$,,;
891         while ($project && !check_head_link("$projectroot/$project")) {
892                 $project =~ s,/*[^/]*$,,;
893         }
894         return unless $project;
895         $input_params{'project'} = $project;
896
897         # do not change any parameters if an action is given using the query string
898         return if $input_params{'action'};
899         $path_info =~ s,^\Q$project\E/*,,;
900
901         # next, check if we have an action
902         my $action = $path_info;
903         $action =~ s,/.*$,,;
904         if (exists $actions{$action}) {
905                 $path_info =~ s,^$action/*,,;
906                 $input_params{'action'} = $action;
907         }
908
909         # list of actions that want hash_base instead of hash, but can have no
910         # pathname (f) parameter
911         my @wants_base = (
912                 'tree',
913                 'history',
914         );
915
916         # we want to catch, among others
917         # [$hash_parent_base[:$file_parent]..]$hash_parent[:$file_name]
918         my ($parentrefname, $parentpathname, $refname, $pathname) =
919                 ($path_info =~ /^(?:(.+?)(?::(.+))?\.\.)?([^:]+?)?(?::(.+))?$/);
920
921         # first, analyze the 'current' part
922         if (defined $pathname) {
923                 # we got "branch:filename" or "branch:dir/"
924                 # we could use git_get_type(branch:pathname), but:
925                 # - it needs $git_dir
926                 # - it does a git() call
927                 # - the convention of terminating directories with a slash
928                 #   makes it superfluous
929                 # - embedding the action in the PATH_INFO would make it even
930                 #   more superfluous
931                 $pathname =~ s,^/+,,;
932                 if (!$pathname || substr($pathname, -1) eq "/") {
933                         $input_params{'action'} ||= "tree";
934                         $pathname =~ s,/$,,;
935                 } else {
936                         # the default action depends on whether we had parent info
937                         # or not
938                         if ($parentrefname) {
939                                 $input_params{'action'} ||= "blobdiff_plain";
940                         } else {
941                                 $input_params{'action'} ||= "blob_plain";
942                         }
943                 }
944                 $input_params{'hash_base'} ||= $refname;
945                 $input_params{'file_name'} ||= $pathname;
946         } elsif (defined $refname) {
947                 # we got "branch". In this case we have to choose if we have to
948                 # set hash or hash_base.
949                 #
950                 # Most of the actions without a pathname only want hash to be
951                 # set, except for the ones specified in @wants_base that want
952                 # hash_base instead. It should also be noted that hand-crafted
953                 # links having 'history' as an action and no pathname or hash
954                 # set will fail, but that happens regardless of PATH_INFO.
955                 if (defined $parentrefname) {
956                         # if there is parent let the default be 'shortlog' action
957                         # (for http://git.example.com/repo.git/A..B links); if there
958                         # is no parent, dispatch will detect type of object and set
959                         # action appropriately if required (if action is not set)
960                         $input_params{'action'} ||= "shortlog";
961                 }
962                 if ($input_params{'action'} &&
963                     grep { $_ eq $input_params{'action'} } @wants_base) {
964                         $input_params{'hash_base'} ||= $refname;
965                 } else {
966                         $input_params{'hash'} ||= $refname;
967                 }
968         }
969
970         # next, handle the 'parent' part, if present
971         if (defined $parentrefname) {
972                 # a missing pathspec defaults to the 'current' filename, allowing e.g.
973                 # someproject/blobdiff/oldrev..newrev:/filename
974                 if ($parentpathname) {
975                         $parentpathname =~ s,^/+,,;
976                         $parentpathname =~ s,/$,,;
977                         $input_params{'file_parent'} ||= $parentpathname;
978                 } else {
979                         $input_params{'file_parent'} ||= $input_params{'file_name'};
980                 }
981                 # we assume that hash_parent_base is wanted if a path was specified,
982                 # or if the action wants hash_base instead of hash
983                 if (defined $input_params{'file_parent'} ||
984                         grep { $_ eq $input_params{'action'} } @wants_base) {
985                         $input_params{'hash_parent_base'} ||= $parentrefname;
986                 } else {
987                         $input_params{'hash_parent'} ||= $parentrefname;
988                 }
989         }
990
991         # for the snapshot action, we allow URLs in the form
992         # $project/snapshot/$hash.ext
993         # where .ext determines the snapshot and gets removed from the
994         # passed $refname to provide the $hash.
995         #
996         # To be able to tell that $refname includes the format extension, we
997         # require the following two conditions to be satisfied:
998         # - the hash input parameter MUST have been set from the $refname part
999         #   of the URL (i.e. they must be equal)
1000         # - the snapshot format MUST NOT have been defined already (e.g. from
1001         #   CGI parameter sf)
1002         # It's also useless to try any matching unless $refname has a dot,
1003         # so we check for that too
1004         if (defined $input_params{'action'} &&
1005                 $input_params{'action'} eq 'snapshot' &&
1006                 defined $refname && index($refname, '.') != -1 &&
1007                 $refname eq $input_params{'hash'} &&
1008                 !defined $input_params{'snapshot_format'}) {
1009                 # We loop over the known snapshot formats, checking for
1010                 # extensions. Allowed extensions are both the defined suffix
1011                 # (which includes the initial dot already) and the snapshot
1012                 # format key itself, with a prepended dot
1013                 while (my ($fmt, $opt) = each %known_snapshot_formats) {
1014                         my $hash = $refname;
1015                         unless ($hash =~ s/(\Q$opt->{'suffix'}\E|\Q.$fmt\E)$//) {
1016                                 next;
1017                         }
1018                         my $sfx = $1;
1019                         # a valid suffix was found, so set the snapshot format
1020                         # and reset the hash parameter
1021                         $input_params{'snapshot_format'} = $fmt;
1022                         $input_params{'hash'} = $hash;
1023                         # we also set the format suffix to the one requested
1024                         # in the URL: this way a request for e.g. .tgz returns
1025                         # a .tgz instead of a .tar.gz
1026                         $known_snapshot_formats{$fmt}{'suffix'} = $sfx;
1027                         last;
1028                 }
1029         }
1030 }
1031
1032 our ($action, $project, $file_name, $file_parent, $hash, $hash_parent, $hash_base,
1033      $hash_parent_base, @extra_options, $page, $searchtype, $search_use_regexp,
1034      $searchtext, $search_regexp, $project_filter);
1035 sub evaluate_and_validate_params {
1036         our $action = $input_params{'action'};
1037         if (defined $action) {
1038                 if (!is_valid_action($action)) {
1039                         die_error(400, "Invalid action parameter");
1040                 }
1041         }
1042
1043         # parameters which are pathnames
1044         our $project = $input_params{'project'};
1045         if (defined $project) {
1046                 if (!is_valid_project($project)) {
1047                         undef $project;
1048                         die_error(404, "No such project");
1049                 }
1050         }
1051
1052         our $project_filter = $input_params{'project_filter'};
1053         if (defined $project_filter) {
1054                 if (!is_valid_pathname($project_filter)) {
1055                         die_error(404, "Invalid project_filter parameter");
1056                 }
1057         }
1058
1059         our $file_name = $input_params{'file_name'};
1060         if (defined $file_name) {
1061                 if (!is_valid_pathname($file_name)) {
1062                         die_error(400, "Invalid file parameter");
1063                 }
1064         }
1065
1066         our $file_parent = $input_params{'file_parent'};
1067         if (defined $file_parent) {
1068                 if (!is_valid_pathname($file_parent)) {
1069                         die_error(400, "Invalid file parent parameter");
1070                 }
1071         }
1072
1073         # parameters which are refnames
1074         our $hash = $input_params{'hash'};
1075         if (defined $hash) {
1076                 if (!is_valid_refname($hash)) {
1077                         die_error(400, "Invalid hash parameter");
1078                 }
1079         }
1080
1081         our $hash_parent = $input_params{'hash_parent'};
1082         if (defined $hash_parent) {
1083                 if (!is_valid_refname($hash_parent)) {
1084                         die_error(400, "Invalid hash parent parameter");
1085                 }
1086         }
1087
1088         our $hash_base = $input_params{'hash_base'};
1089         if (defined $hash_base) {
1090                 if (!is_valid_refname($hash_base)) {
1091                         die_error(400, "Invalid hash base parameter");
1092                 }
1093         }
1094
1095         our @extra_options = @{$input_params{'extra_options'}};
1096         # @extra_options is always defined, since it can only be (currently) set from
1097         # CGI, and $cgi->param() returns the empty array in array context if the param
1098         # is not set
1099         foreach my $opt (@extra_options) {
1100                 if (not exists $allowed_options{$opt}) {
1101                         die_error(400, "Invalid option parameter");
1102                 }
1103                 if (not grep(/^$action$/, @{$allowed_options{$opt}})) {
1104                         die_error(400, "Invalid option parameter for this action");
1105                 }
1106         }
1107
1108         our $hash_parent_base = $input_params{'hash_parent_base'};
1109         if (defined $hash_parent_base) {
1110                 if (!is_valid_refname($hash_parent_base)) {
1111                         die_error(400, "Invalid hash parent base parameter");
1112                 }
1113         }
1114
1115         # other parameters
1116         our $page = $input_params{'page'};
1117         if (defined $page) {
1118                 if ($page =~ m/[^0-9]/) {
1119                         die_error(400, "Invalid page parameter");
1120                 }
1121         }
1122
1123         our $searchtype = $input_params{'searchtype'};
1124         if (defined $searchtype) {
1125                 if ($searchtype =~ m/[^a-z]/) {
1126                         die_error(400, "Invalid searchtype parameter");
1127                 }
1128         }
1129
1130         our $search_use_regexp = $input_params{'search_use_regexp'};
1131
1132         our $searchtext = $input_params{'searchtext'};
1133         our $search_regexp = undef;
1134         if (defined $searchtext) {
1135                 if (length($searchtext) < 2) {
1136                         die_error(403, "At least two characters are required for search parameter");
1137                 }
1138                 if ($search_use_regexp) {
1139                         $search_regexp = $searchtext;
1140                         if (!eval { qr/$search_regexp/; 1; }) {
1141                                 (my $error = $@) =~ s/ at \S+ line \d+.*\n?//;
1142                                 die_error(400, "Invalid search regexp '$search_regexp'",
1143                                           esc_html($error));
1144                         }
1145                 } else {
1146                         $search_regexp = quotemeta $searchtext;
1147                 }
1148         }
1149 }
1150
1151 # path to the current git repository
1152 our $git_dir;
1153 sub evaluate_git_dir {
1154         our $git_dir = "$projectroot/$project" if $project;
1155 }
1156
1157 our (@snapshot_fmts, $git_avatar, @extra_branch_refs);
1158 sub configure_gitweb_features {
1159         # list of supported snapshot formats
1160         our @snapshot_fmts = gitweb_get_feature('snapshot');
1161         @snapshot_fmts = filter_snapshot_fmts(@snapshot_fmts);
1162
1163         # check that the avatar feature is set to a known provider name,
1164         # and for each provider check if the dependencies are satisfied.
1165         # if the provider name is invalid or the dependencies are not met,
1166         # reset $git_avatar to the empty string.
1167         our ($git_avatar) = gitweb_get_feature('avatar');
1168         if ($git_avatar eq 'gravatar') {
1169                 $git_avatar = '' unless (eval { require Digest::MD5; 1; });
1170         } elsif ($git_avatar eq 'picon') {
1171                 # no dependencies
1172         } else {
1173                 $git_avatar = '';
1174         }
1175
1176         our @extra_branch_refs = gitweb_get_feature('extra-branch-refs');
1177         @extra_branch_refs = filter_and_validate_refs (@extra_branch_refs);
1178 }
1179
1180 sub get_branch_refs {
1181         return ('heads', @extra_branch_refs);
1182 }
1183
1184 # custom error handler: 'die <message>' is Internal Server Error
1185 sub handle_errors_html {
1186         my $msg = shift; # it is already HTML escaped
1187
1188         # to avoid infinite loop where error occurs in die_error,
1189         # change handler to default handler, disabling handle_errors_html
1190         set_message("Error occurred when inside die_error:\n$msg");
1191
1192         # you cannot jump out of die_error when called as error handler;
1193         # the subroutine set via CGI::Carp::set_message is called _after_
1194         # HTTP headers are already written, so it cannot write them itself
1195         die_error(undef, undef, $msg, -error_handler => 1, -no_http_header => 1);
1196 }
1197 set_message(\&handle_errors_html);
1198
1199 # dispatch
1200 sub dispatch {
1201         if (!defined $action) {
1202                 if (defined $hash) {
1203                         $action = git_get_type($hash);
1204                         $action or die_error(404, "Object does not exist");
1205                 } elsif (defined $hash_base && defined $file_name) {
1206                         $action = git_get_type("$hash_base:$file_name");
1207                         $action or die_error(404, "File or directory does not exist");
1208                 } elsif (defined $project) {
1209                         $action = 'summary';
1210                 } else {
1211                         $action = 'project_list';
1212                 }
1213         }
1214         if (!defined($actions{$action})) {
1215                 die_error(400, "Unknown action");
1216         }
1217         if ($action !~ m/^(?:opml|project_list|project_index)$/ &&
1218             !$project) {
1219                 die_error(400, "Project needed");
1220         }
1221         $actions{$action}->();
1222 }
1223
1224 sub reset_timer {
1225         our $t0 = [ gettimeofday() ]
1226                 if defined $t0;
1227         our $number_of_git_cmds = 0;
1228 }
1229
1230 our $first_request = 1;
1231 sub run_request {
1232         reset_timer();
1233
1234         evaluate_uri();
1235         if ($first_request) {
1236                 evaluate_gitweb_config();
1237                 evaluate_git_version();
1238         }
1239         if ($per_request_config) {
1240                 if (ref($per_request_config) eq 'CODE') {
1241                         $per_request_config->();
1242                 } elsif (!$first_request) {
1243                         evaluate_gitweb_config();
1244                 }
1245         }
1246         check_loadavg();
1247
1248         # $projectroot and $projects_list might be set in gitweb config file
1249         $projects_list ||= $projectroot;
1250
1251         evaluate_query_params();
1252         evaluate_path_info();
1253         evaluate_and_validate_params();
1254         evaluate_git_dir();
1255
1256         configure_gitweb_features();
1257
1258         dispatch();
1259 }
1260
1261 our $is_last_request = sub { 1 };
1262 our ($pre_dispatch_hook, $post_dispatch_hook, $pre_listen_hook);
1263 our $CGI = 'CGI';
1264 our $cgi;
1265 sub configure_as_fcgi {
1266         require CGI::Fast;
1267         our $CGI = 'CGI::Fast';
1268
1269         my $request_number = 0;
1270         # let each child service 100 requests
1271         our $is_last_request = sub { ++$request_number > 100 };
1272 }
1273 sub evaluate_argv {
1274         my $script_name = $ENV{'SCRIPT_NAME'} || $ENV{'SCRIPT_FILENAME'} || __FILE__;
1275         configure_as_fcgi()
1276                 if $script_name =~ /\.fcgi$/;
1277
1278         return unless (@ARGV);
1279
1280         require Getopt::Long;
1281         Getopt::Long::GetOptions(
1282                 'fastcgi|fcgi|f' => \&configure_as_fcgi,
1283                 'nproc|n=i' => sub {
1284                         my ($arg, $val) = @_;
1285                         return unless eval { require FCGI::ProcManager; 1; };
1286                         my $proc_manager = FCGI::ProcManager->new({
1287                                 n_processes => $val,
1288                         });
1289                         our $pre_listen_hook    = sub { $proc_manager->pm_manage()        };
1290                         our $pre_dispatch_hook  = sub { $proc_manager->pm_pre_dispatch()  };
1291                         our $post_dispatch_hook = sub { $proc_manager->pm_post_dispatch() };
1292                 },
1293         );
1294 }
1295
1296 sub run {
1297         evaluate_argv();
1298
1299         $first_request = 1;
1300         $pre_listen_hook->()
1301                 if $pre_listen_hook;
1302
1303  REQUEST:
1304         while ($cgi = $CGI->new()) {
1305                 $pre_dispatch_hook->()
1306                         if $pre_dispatch_hook;
1307
1308                 run_request();
1309
1310                 $post_dispatch_hook->()
1311                         if $post_dispatch_hook;
1312                 $first_request = 0;
1313
1314                 last REQUEST if ($is_last_request->());
1315         }
1316
1317  DONE_GITWEB:
1318         1;
1319 }
1320
1321 run();
1322
1323 if (defined caller) {
1324         # wrapped in a subroutine processing requests,
1325         # e.g. mod_perl with ModPerl::Registry, or PSGI with Plack::App::WrapCGI
1326         return;
1327 } else {
1328         # pure CGI script, serving single request
1329         exit;
1330 }
1331
1332 ## ======================================================================
1333 ## action links
1334
1335 # possible values of extra options
1336 # -full => 0|1      - use absolute/full URL ($my_uri/$my_url as base)
1337 # -replay => 1      - start from a current view (replay with modifications)
1338 # -path_info => 0|1 - don't use/use path_info URL (if possible)
1339 # -anchor => ANCHOR - add #ANCHOR to end of URL, implies -replay if used alone
1340 sub href {
1341         my %params = @_;
1342         # default is to use -absolute url() i.e. $my_uri
1343         my $href = $params{-full} ? $my_url : $my_uri;
1344
1345         # implicit -replay, must be first of implicit params
1346         $params{-replay} = 1 if (keys %params == 1 && $params{-anchor});
1347
1348         $params{'project'} = $project unless exists $params{'project'};
1349
1350         if ($params{-replay}) {
1351                 while (my ($name, $symbol) = each %cgi_param_mapping) {
1352                         if (!exists $params{$name}) {
1353                                 $params{$name} = $input_params{$name};
1354                         }
1355                 }
1356         }
1357
1358         my $use_pathinfo = gitweb_check_feature('pathinfo');
1359         if (defined $params{'project'} &&
1360             (exists $params{-path_info} ? $params{-path_info} : $use_pathinfo)) {
1361                 # try to put as many parameters as possible in PATH_INFO:
1362                 #   - project name
1363                 #   - action
1364                 #   - hash_parent or hash_parent_base:/file_parent
1365                 #   - hash or hash_base:/filename
1366                 #   - the snapshot_format as an appropriate suffix
1367
1368                 # When the script is the root DirectoryIndex for the domain,
1369                 # $href here would be something like http://gitweb.example.com/
1370                 # Thus, we strip any trailing / from $href, to spare us double
1371                 # slashes in the final URL
1372                 $href =~ s,/$,,;
1373
1374                 # Then add the project name, if present
1375                 $href .= "/".esc_path_info($params{'project'});
1376                 delete $params{'project'};
1377
1378                 # since we destructively absorb parameters, we keep this
1379                 # boolean that remembers if we're handling a snapshot
1380                 my $is_snapshot = $params{'action'} eq 'snapshot';
1381
1382                 # Summary just uses the project path URL, any other action is
1383                 # added to the URL
1384                 if (defined $params{'action'}) {
1385                         $href .= "/".esc_path_info($params{'action'})
1386                                 unless $params{'action'} eq 'summary';
1387                         delete $params{'action'};
1388                 }
1389
1390                 # Next, we put hash_parent_base:/file_parent..hash_base:/file_name,
1391                 # stripping nonexistent or useless pieces
1392                 $href .= "/" if ($params{'hash_base'} || $params{'hash_parent_base'}
1393                         || $params{'hash_parent'} || $params{'hash'});
1394                 if (defined $params{'hash_base'}) {
1395                         if (defined $params{'hash_parent_base'}) {
1396                                 $href .= esc_path_info($params{'hash_parent_base'});
1397                                 # skip the file_parent if it's the same as the file_name
1398                                 if (defined $params{'file_parent'}) {
1399                                         if (defined $params{'file_name'} && $params{'file_parent'} eq $params{'file_name'}) {
1400                                                 delete $params{'file_parent'};
1401                                         } elsif ($params{'file_parent'} !~ /\.\./) {
1402                                                 $href .= ":/".esc_path_info($params{'file_parent'});
1403                                                 delete $params{'file_parent'};
1404                                         }
1405                                 }
1406                                 $href .= "..";
1407                                 delete $params{'hash_parent'};
1408                                 delete $params{'hash_parent_base'};
1409                         } elsif (defined $params{'hash_parent'}) {
1410                                 $href .= esc_path_info($params{'hash_parent'}). "..";
1411                                 delete $params{'hash_parent'};
1412                         }
1413
1414                         $href .= esc_path_info($params{'hash_base'});
1415                         if (defined $params{'file_name'} && $params{'file_name'} !~ /\.\./) {
1416                                 $href .= ":/".esc_path_info($params{'file_name'});
1417                                 delete $params{'file_name'};
1418                         }
1419                         delete $params{'hash'};
1420                         delete $params{'hash_base'};
1421                 } elsif (defined $params{'hash'}) {
1422                         $href .= esc_path_info($params{'hash'});
1423                         delete $params{'hash'};
1424                 }
1425
1426                 # If the action was a snapshot, we can absorb the
1427                 # snapshot_format parameter too
1428                 if ($is_snapshot) {
1429                         my $fmt = $params{'snapshot_format'};
1430                         # snapshot_format should always be defined when href()
1431                         # is called, but just in case some code forgets, we
1432                         # fall back to the default
1433                         $fmt ||= $snapshot_fmts[0];
1434                         $href .= $known_snapshot_formats{$fmt}{'suffix'};
1435                         delete $params{'snapshot_format'};
1436                 }
1437         }
1438
1439         # now encode the parameters explicitly
1440         my @result = ();
1441         for (my $i = 0; $i < @cgi_param_mapping; $i += 2) {
1442                 my ($name, $symbol) = ($cgi_param_mapping[$i], $cgi_param_mapping[$i+1]);
1443                 if (defined $params{$name}) {
1444                         if (ref($params{$name}) eq "ARRAY") {
1445                                 foreach my $par (@{$params{$name}}) {
1446                                         push @result, $symbol . "=" . esc_param($par);
1447                                 }
1448                         } else {
1449                                 push @result, $symbol . "=" . esc_param($params{$name});
1450                         }
1451                 }
1452         }
1453         $href .= "?" . join(';', @result) if scalar @result;
1454
1455         # final transformation: trailing spaces must be escaped (URI-encoded)
1456         $href =~ s/(\s+)$/CGI::escape($1)/e;
1457
1458         if ($params{-anchor}) {
1459                 $href .= "#".esc_param($params{-anchor});
1460         }
1461
1462         return $href;
1463 }
1464
1465
1466 ## ======================================================================
1467 ## validation, quoting/unquoting and escaping
1468
1469 sub is_valid_action {
1470         my $input = shift;
1471         return undef unless exists $actions{$input};
1472         return 1;
1473 }
1474
1475 sub is_valid_project {
1476         my $input = shift;
1477
1478         return unless defined $input;
1479         if (!is_valid_pathname($input) ||
1480                 !(-d "$projectroot/$input") ||
1481                 !check_export_ok("$projectroot/$input") ||
1482                 ($strict_export && !project_in_list($input))) {
1483                 return undef;
1484         } else {
1485                 return 1;
1486         }
1487 }
1488
1489 sub is_valid_pathname {
1490         my $input = shift;
1491
1492         return undef unless defined $input;
1493         # no '.' or '..' as elements of path, i.e. no '.' nor '..'
1494         # at the beginning, at the end, and between slashes.
1495         # also this catches doubled slashes
1496         if ($input =~ m!(^|/)(|\.|\.\.)(/|$)!) {
1497                 return undef;
1498         }
1499         # no null characters
1500         if ($input =~ m!\0!) {
1501                 return undef;
1502         }
1503         return 1;
1504 }
1505
1506 sub is_valid_ref_format {
1507         my $input = shift;
1508
1509         return undef unless defined $input;
1510         # restrictions on ref name according to git-check-ref-format
1511         if ($input =~ m!(/\.|\.\.|[\000-\040\177 ~^:?*\[]|/$)!) {
1512                 return undef;
1513         }
1514         return 1;
1515 }
1516
1517 sub is_valid_refname {
1518         my $input = shift;
1519
1520         return undef unless defined $input;
1521         # textual hashes are O.K.
1522         if ($input =~ m/^[0-9a-fA-F]{40}$/) {
1523                 return 1;
1524         }
1525         # it must be correct pathname
1526         is_valid_pathname($input) or return undef;
1527         # check git-check-ref-format restrictions
1528         is_valid_ref_format($input) or return undef;
1529         return 1;
1530 }
1531
1532 # decode sequences of octets in utf8 into Perl's internal form,
1533 # which is utf-8 with utf8 flag set if needed.  gitweb writes out
1534 # in utf-8 thanks to "binmode STDOUT, ':utf8'" at beginning
1535 sub to_utf8 {
1536         my $str = shift;
1537         return undef unless defined $str;
1538
1539         if (utf8::is_utf8($str) || utf8::decode($str)) {
1540                 return $str;
1541         } else {
1542                 return decode($fallback_encoding, $str, Encode::FB_DEFAULT);
1543         }
1544 }
1545
1546 # quote unsafe chars, but keep the slash, even when it's not
1547 # correct, but quoted slashes look too horrible in bookmarks
1548 sub esc_param {
1549         my $str = shift;
1550         return undef unless defined $str;
1551         $str =~ s/([^A-Za-z0-9\-_.~()\/:@ ]+)/CGI::escape($1)/eg;
1552         $str =~ s/ /\+/g;
1553         return $str;
1554 }
1555
1556 # the quoting rules for path_info fragment are slightly different
1557 sub esc_path_info {
1558         my $str = shift;
1559         return undef unless defined $str;
1560
1561         # path_info doesn't treat '+' as space (specially), but '?' must be escaped
1562         $str =~ s/([^A-Za-z0-9\-_.~();\/;:@&= +]+)/CGI::escape($1)/eg;
1563
1564         return $str;
1565 }
1566
1567 # quote unsafe chars in whole URL, so some characters cannot be quoted
1568 sub esc_url {
1569         my $str = shift;
1570         return undef unless defined $str;
1571         $str =~ s/([^A-Za-z0-9\-_.~();\/;?:@&= ]+)/CGI::escape($1)/eg;
1572         $str =~ s/ /\+/g;
1573         return $str;
1574 }
1575
1576 # quote unsafe characters in HTML attributes
1577 sub esc_attr {
1578
1579         # for XHTML conformance escaping '"' to '&quot;' is not enough
1580         return esc_html(@_);
1581 }
1582
1583 # replace invalid utf8 character with SUBSTITUTION sequence
1584 sub esc_html {
1585         my $str = shift;
1586         my %opts = @_;
1587
1588         return undef unless defined $str;
1589
1590         $str = to_utf8($str);
1591         $str = $cgi->escapeHTML($str);
1592         if ($opts{'-nbsp'}) {
1593                 $str =~ s/ /&nbsp;/g;
1594         }
1595         $str =~ s|([[:cntrl:]])|(($1 ne "\t") ? quot_cec($1) : $1)|eg;
1596         return $str;
1597 }
1598
1599 # quote control characters and escape filename to HTML
1600 sub esc_path {
1601         my $str = shift;
1602         my %opts = @_;
1603
1604         return undef unless defined $str;
1605
1606         $str = to_utf8($str);
1607         $str = $cgi->escapeHTML($str);
1608         if ($opts{'-nbsp'}) {
1609                 $str =~ s/ /&nbsp;/g;
1610         }
1611         $str =~ s|([[:cntrl:]])|quot_cec($1)|eg;
1612         return $str;
1613 }
1614
1615 # Sanitize for use in XHTML + application/xml+xhtm (valid XML 1.0)
1616 sub sanitize {
1617         my $str = shift;
1618
1619         return undef unless defined $str;
1620
1621         $str = to_utf8($str);
1622         $str =~ s|([[:cntrl:]])|(index("\t\n\r", $1) != -1 ? $1 : quot_cec($1))|eg;
1623         return $str;
1624 }
1625
1626 # Make control characters "printable", using character escape codes (CEC)
1627 sub quot_cec {
1628         my $cntrl = shift;
1629         my %opts = @_;
1630         my %es = ( # character escape codes, aka escape sequences
1631                 "\t" => '\t',   # tab            (HT)
1632                 "\n" => '\n',   # line feed      (LF)
1633                 "\r" => '\r',   # carrige return (CR)
1634                 "\f" => '\f',   # form feed      (FF)
1635                 "\b" => '\b',   # backspace      (BS)
1636                 "\a" => '\a',   # alarm (bell)   (BEL)
1637                 "\e" => '\e',   # escape         (ESC)
1638                 "\013" => '\v', # vertical tab   (VT)
1639                 "\000" => '\0', # nul character  (NUL)
1640         );
1641         my $chr = ( (exists $es{$cntrl})
1642                     ? $es{$cntrl}
1643                     : sprintf('\%2x', ord($cntrl)) );
1644         if ($opts{-nohtml}) {
1645                 return $chr;
1646         } else {
1647                 return "<span class=\"cntrl\">$chr</span>";
1648         }
1649 }
1650
1651 # Alternatively use unicode control pictures codepoints,
1652 # Unicode "printable representation" (PR)
1653 sub quot_upr {
1654         my $cntrl = shift;
1655         my %opts = @_;
1656
1657         my $chr = sprintf('&#%04d;', 0x2400+ord($cntrl));
1658         if ($opts{-nohtml}) {
1659                 return $chr;
1660         } else {
1661                 return "<span class=\"cntrl\">$chr</span>";
1662         }
1663 }
1664
1665 # git may return quoted and escaped filenames
1666 sub unquote {
1667         my $str = shift;
1668
1669         sub unq {
1670                 my $seq = shift;
1671                 my %es = ( # character escape codes, aka escape sequences
1672                         't' => "\t",   # tab            (HT, TAB)
1673                         'n' => "\n",   # newline        (NL)
1674                         'r' => "\r",   # return         (CR)
1675                         'f' => "\f",   # form feed      (FF)
1676                         'b' => "\b",   # backspace      (BS)
1677                         'a' => "\a",   # alarm (bell)   (BEL)
1678                         'e' => "\e",   # escape         (ESC)
1679                         'v' => "\013", # vertical tab   (VT)
1680                 );
1681
1682                 if ($seq =~ m/^[0-7]{1,3}$/) {
1683                         # octal char sequence
1684                         return chr(oct($seq));
1685                 } elsif (exists $es{$seq}) {
1686                         # C escape sequence, aka character escape code
1687                         return $es{$seq};
1688                 }
1689                 # quoted ordinary character
1690                 return $seq;
1691         }
1692
1693         if ($str =~ m/^"(.*)"$/) {
1694                 # needs unquoting
1695                 $str = $1;
1696                 $str =~ s/\\([^0-7]|[0-7]{1,3})/unq($1)/eg;
1697         }
1698         return $str;
1699 }
1700
1701 # escape tabs (convert tabs to spaces)
1702 sub untabify {
1703         my $line = shift;
1704
1705         while ((my $pos = index($line, "\t")) != -1) {
1706                 if (my $count = (8 - ($pos % 8))) {
1707                         my $spaces = ' ' x $count;
1708                         $line =~ s/\t/$spaces/;
1709                 }
1710         }
1711
1712         return $line;
1713 }
1714
1715 sub project_in_list {
1716         my $project = shift;
1717         my @list = git_get_projects_list();
1718         return @list && scalar(grep { $_->{'path'} eq $project } @list);
1719 }
1720
1721 ## ----------------------------------------------------------------------
1722 ## HTML aware string manipulation
1723
1724 # Try to chop given string on a word boundary between position
1725 # $len and $len+$add_len. If there is no word boundary there,
1726 # chop at $len+$add_len. Do not chop if chopped part plus ellipsis
1727 # (marking chopped part) would be longer than given string.
1728 sub chop_str {
1729         my $str = shift;
1730         my $len = shift;
1731         my $add_len = shift || 10;
1732         my $where = shift || 'right'; # 'left' | 'center' | 'right'
1733
1734         # Make sure perl knows it is utf8 encoded so we don't
1735         # cut in the middle of a utf8 multibyte char.
1736         $str = to_utf8($str);
1737
1738         # allow only $len chars, but don't cut a word if it would fit in $add_len
1739         # if it doesn't fit, cut it if it's still longer than the dots we would add
1740         # remove chopped character entities entirely
1741
1742         # when chopping in the middle, distribute $len into left and right part
1743         # return early if chopping wouldn't make string shorter
1744         if ($where eq 'center') {
1745                 return $str if ($len + 5 >= length($str)); # filler is length 5
1746                 $len = int($len/2);
1747         } else {
1748                 return $str if ($len + 4 >= length($str)); # filler is length 4
1749         }
1750
1751         # regexps: ending and beginning with word part up to $add_len
1752         my $endre = qr/.{$len}\w{0,$add_len}/;
1753         my $begre = qr/\w{0,$add_len}.{$len}/;
1754
1755         if ($where eq 'left') {
1756                 $str =~ m/^(.*?)($begre)$/;
1757                 my ($lead, $body) = ($1, $2);
1758                 if (length($lead) > 4) {
1759                         $lead = " ...";
1760                 }
1761                 return "$lead$body";
1762
1763         } elsif ($where eq 'center') {
1764                 $str =~ m/^($endre)(.*)$/;
1765                 my ($left, $str)  = ($1, $2);
1766                 $str =~ m/^(.*?)($begre)$/;
1767                 my ($mid, $right) = ($1, $2);
1768                 if (length($mid) > 5) {
1769                         $mid = " ... ";
1770                 }
1771                 return "$left$mid$right";
1772
1773         } else {
1774                 $str =~ m/^($endre)(.*)$/;
1775                 my $body = $1;
1776                 my $tail = $2;
1777                 if (length($tail) > 4) {
1778                         $tail = "... ";
1779                 }
1780                 return "$body$tail";
1781         }
1782 }
1783
1784 # takes the same arguments as chop_str, but also wraps a <span> around the
1785 # result with a title attribute if it does get chopped. Additionally, the
1786 # string is HTML-escaped.
1787 sub chop_and_escape_str {
1788         my ($str) = @_;
1789
1790         my $chopped = chop_str(@_);
1791         $str = to_utf8($str);
1792         if ($chopped eq $str) {
1793                 return esc_html($chopped);
1794         } else {
1795                 $str =~ s/[[:cntrl:]]/?/g;
1796                 return $cgi->span({-title=>$str}, esc_html($chopped));
1797         }
1798 }
1799
1800 # Highlight selected fragments of string, using given CSS class,
1801 # and escape HTML.  It is assumed that fragments do not overlap.
1802 # Regions are passed as list of pairs (array references).
1803 #
1804 # Example: esc_html_hl_regions("foobar", "mark", [ 0, 3 ]) returns
1805 # '<span class="mark">foo</span>bar'
1806 sub esc_html_hl_regions {
1807         my ($str, $css_class, @sel) = @_;
1808         my %opts = grep { ref($_) ne 'ARRAY' } @sel;
1809         @sel     = grep { ref($_) eq 'ARRAY' } @sel;
1810         return esc_html($str, %opts) unless @sel;
1811
1812         my $out = '';
1813         my $pos = 0;
1814
1815         for my $s (@sel) {
1816                 my ($begin, $end) = @$s;
1817
1818                 # Don't create empty <span> elements.
1819                 next if $end <= $begin;
1820
1821                 my $escaped = esc_html(substr($str, $begin, $end - $begin),
1822                                        %opts);
1823
1824                 $out .= esc_html(substr($str, $pos, $begin - $pos), %opts)
1825                         if ($begin - $pos > 0);
1826                 $out .= $cgi->span({-class => $css_class}, $escaped);
1827
1828                 $pos = $end;
1829         }
1830         $out .= esc_html(substr($str, $pos), %opts)
1831                 if ($pos < length($str));
1832
1833         return $out;
1834 }
1835
1836 # return positions of beginning and end of each match
1837 sub matchpos_list {
1838         my ($str, $regexp) = @_;
1839         return unless (defined $str && defined $regexp);
1840
1841         my @matches;
1842         while ($str =~ /$regexp/g) {
1843                 push @matches, [$-[0], $+[0]];
1844         }
1845         return @matches;
1846 }
1847
1848 # highlight match (if any), and escape HTML
1849 sub esc_html_match_hl {
1850         my ($str, $regexp) = @_;
1851         return esc_html($str) unless defined $regexp;
1852
1853         my @matches = matchpos_list($str, $regexp);
1854         return esc_html($str) unless @matches;
1855
1856         return esc_html_hl_regions($str, 'match', @matches);
1857 }
1858
1859
1860 # highlight match (if any) of shortened string, and escape HTML
1861 sub esc_html_match_hl_chopped {
1862         my ($str, $chopped, $regexp) = @_;
1863         return esc_html_match_hl($str, $regexp) unless defined $chopped;
1864
1865         my @matches = matchpos_list($str, $regexp);
1866         return esc_html($chopped) unless @matches;
1867
1868         # filter matches so that we mark chopped string
1869         my $tail = "... "; # see chop_str
1870         unless ($chopped =~ s/\Q$tail\E$//) {
1871                 $tail = '';
1872         }
1873         my $chop_len = length($chopped);
1874         my $tail_len = length($tail);
1875         my @filtered;
1876
1877         for my $m (@matches) {
1878                 if ($m->[0] > $chop_len) {
1879                         push @filtered, [ $chop_len, $chop_len + $tail_len ] if ($tail_len > 0);
1880                         last;
1881                 } elsif ($m->[1] > $chop_len) {
1882                         push @filtered, [ $m->[0], $chop_len + $tail_len ];
1883                         last;
1884                 }
1885                 push @filtered, $m;
1886         }
1887
1888         return esc_html_hl_regions($chopped . $tail, 'match', @filtered);
1889 }
1890
1891 ## ----------------------------------------------------------------------
1892 ## functions returning short strings
1893
1894 # CSS class for given age value (in seconds)
1895 sub age_class {
1896         my $age = shift;
1897
1898         if (!defined $age) {
1899                 return "noage";
1900         } elsif ($age < 60*60*2) {
1901                 return "age0";
1902         } elsif ($age < 60*60*24*2) {
1903                 return "age1";
1904         } else {
1905                 return "age2";
1906         }
1907 }
1908
1909 # convert age in seconds to "nn units ago" string
1910 sub age_string {
1911         my $age = shift;
1912         my $age_str;
1913
1914         if ($age > 60*60*24*365*2) {
1915                 $age_str = (int $age/60/60/24/365);
1916                 $age_str .= " years ago";
1917         } elsif ($age > 60*60*24*(365/12)*2) {
1918                 $age_str = int $age/60/60/24/(365/12);
1919                 $age_str .= " months ago";
1920         } elsif ($age > 60*60*24*7*2) {
1921                 $age_str = int $age/60/60/24/7;
1922                 $age_str .= " weeks ago";
1923         } elsif ($age > 60*60*24*2) {
1924                 $age_str = int $age/60/60/24;
1925                 $age_str .= " days ago";
1926         } elsif ($age > 60*60*2) {
1927                 $age_str = int $age/60/60;
1928                 $age_str .= " hours ago";
1929         } elsif ($age > 60*2) {
1930                 $age_str = int $age/60;
1931                 $age_str .= " min ago";
1932         } elsif ($age > 2) {
1933                 $age_str = int $age;
1934                 $age_str .= " sec ago";
1935         } else {
1936                 $age_str .= " right now";
1937         }
1938         return $age_str;
1939 }
1940
1941 use constant {
1942         S_IFINVALID => 0030000,
1943         S_IFGITLINK => 0160000,
1944 };
1945
1946 # submodule/subproject, a commit object reference
1947 sub S_ISGITLINK {
1948         my $mode = shift;
1949
1950         return (($mode & S_IFMT) == S_IFGITLINK)
1951 }
1952
1953 # convert file mode in octal to symbolic file mode string
1954 sub mode_str {
1955         my $mode = oct shift;
1956
1957         if (S_ISGITLINK($mode)) {
1958                 return 'm---------';
1959         } elsif (S_ISDIR($mode & S_IFMT)) {
1960                 return 'drwxr-xr-x';
1961         } elsif (S_ISLNK($mode)) {
1962                 return 'lrwxrwxrwx';
1963         } elsif (S_ISREG($mode)) {
1964                 # git cares only about the executable bit
1965                 if ($mode & S_IXUSR) {
1966                         return '-rwxr-xr-x';
1967                 } else {
1968                         return '-rw-r--r--';
1969                 };
1970         } else {
1971                 return '----------';
1972         }
1973 }
1974
1975 # convert file mode in octal to file type string
1976 sub file_type {
1977         my $mode = shift;
1978
1979         if ($mode !~ m/^[0-7]+$/) {
1980                 return $mode;
1981         } else {
1982                 $mode = oct $mode;
1983         }
1984
1985         if (S_ISGITLINK($mode)) {
1986                 return "submodule";
1987         } elsif (S_ISDIR($mode & S_IFMT)) {
1988                 return "directory";
1989         } elsif (S_ISLNK($mode)) {
1990                 return "symlink";
1991         } elsif (S_ISREG($mode)) {
1992                 return "file";
1993         } else {
1994                 return "unknown";
1995         }
1996 }
1997
1998 # convert file mode in octal to file type description string
1999 sub file_type_long {
2000         my $mode = shift;
2001
2002         if ($mode !~ m/^[0-7]+$/) {
2003                 return $mode;
2004         } else {
2005                 $mode = oct $mode;
2006         }
2007
2008         if (S_ISGITLINK($mode)) {
2009                 return "submodule";
2010         } elsif (S_ISDIR($mode & S_IFMT)) {
2011                 return "directory";
2012         } elsif (S_ISLNK($mode)) {
2013                 return "symlink";
2014         } elsif (S_ISREG($mode)) {
2015                 if ($mode & S_IXUSR) {
2016                         return "executable";
2017                 } else {
2018                         return "file";
2019                 };
2020         } else {
2021                 return "unknown";
2022         }
2023 }
2024
2025
2026 ## ----------------------------------------------------------------------
2027 ## functions returning short HTML fragments, or transforming HTML fragments
2028 ## which don't belong to other sections
2029
2030 # format line of commit message.
2031 sub format_log_line_html {
2032         my $line = shift;
2033
2034         $line = esc_html($line, -nbsp=>1);
2035         $line =~ s{\b([0-9a-fA-F]{8,40})\b}{
2036                 $cgi->a({-href => href(action=>"object", hash=>$1),
2037                                         -class => "text"}, $1);
2038         }eg;
2039
2040         return $line;
2041 }
2042
2043 # format marker of refs pointing to given object
2044
2045 # the destination action is chosen based on object type and current context:
2046 # - for annotated tags, we choose the tag view unless it's the current view
2047 #   already, in which case we go to shortlog view
2048 # - for other refs, we keep the current view if we're in history, shortlog or
2049 #   log view, and select shortlog otherwise
2050 sub format_ref_marker {
2051         my ($refs, $id) = @_;
2052         my $markers = '';
2053
2054         if (defined $refs->{$id}) {
2055                 foreach my $ref (@{$refs->{$id}}) {
2056                         # this code exploits the fact that non-lightweight tags are the
2057                         # only indirect objects, and that they are the only objects for which
2058                         # we want to use tag instead of shortlog as action
2059                         my ($type, $name) = qw();
2060                         my $indirect = ($ref =~ s/\^\{\}$//);
2061                         # e.g. tags/v2.6.11 or heads/next
2062                         if ($ref =~ m!^(.*?)s?/(.*)$!) {
2063                                 $type = $1;
2064                                 $name = $2;
2065                         } else {
2066                                 $type = "ref";
2067                                 $name = $ref;
2068                         }
2069
2070                         my $class = $type;
2071                         $class .= " indirect" if $indirect;
2072
2073                         my $dest_action = "shortlog";
2074
2075                         if ($indirect) {
2076                                 $dest_action = "tag" unless $action eq "tag";
2077                         } elsif ($action =~ /^(history|(short)?log)$/) {
2078                                 $dest_action = $action;
2079                         }
2080
2081                         my $dest = "";
2082                         $dest .= "refs/" unless $ref =~ m!^refs/!;
2083                         $dest .= $ref;
2084
2085                         my $link = $cgi->a({
2086                                 -href => href(
2087                                         action=>$dest_action,
2088                                         hash=>$dest
2089                                 )}, $name);
2090
2091                         $markers .= " <span class=\"".esc_attr($class)."\" title=\"".esc_attr($ref)."\">" .
2092                                 $link . "</span>";
2093                 }
2094         }
2095
2096         if ($markers) {
2097                 return ' <span class="refs">'. $markers . '</span>';
2098         } else {
2099                 return "";
2100         }
2101 }
2102
2103 # format, perhaps shortened and with markers, title line
2104 sub format_subject_html {
2105         my ($long, $short, $href, $extra) = @_;
2106         $extra = '' unless defined($extra);
2107
2108         if (length($short) < length($long)) {
2109                 $long =~ s/[[:cntrl:]]/?/g;
2110                 return $cgi->a({-href => $href, -class => "list subject",
2111                                 -title => to_utf8($long)},
2112                        esc_html($short)) . $extra;
2113         } else {
2114                 return $cgi->a({-href => $href, -class => "list subject"},
2115                        esc_html($long)) . $extra;
2116         }
2117 }
2118
2119 # Rather than recomputing the url for an email multiple times, we cache it
2120 # after the first hit. This gives a visible benefit in views where the avatar
2121 # for the same email is used repeatedly (e.g. shortlog).
2122 # The cache is shared by all avatar engines (currently gravatar only), which
2123 # are free to use it as preferred. Since only one avatar engine is used for any
2124 # given page, there's no risk for cache conflicts.
2125 our %avatar_cache = ();
2126
2127 # Compute the picon url for a given email, by using the picon search service over at
2128 # http://www.cs.indiana.edu/picons/search.html
2129 sub picon_url {
2130         my $email = lc shift;
2131         if (!$avatar_cache{$email}) {
2132                 my ($user, $domain) = split('@', $email);
2133                 $avatar_cache{$email} =
2134                         "//www.cs.indiana.edu/cgi-pub/kinzler/piconsearch.cgi/" .
2135                         "$domain/$user/" .
2136                         "users+domains+unknown/up/single";
2137         }
2138         return $avatar_cache{$email};
2139 }
2140
2141 # Compute the gravatar url for a given email, if it's not in the cache already.
2142 # Gravatar stores only the part of the URL before the size, since that's the
2143 # one computationally more expensive. This also allows reuse of the cache for
2144 # different sizes (for this particular engine).
2145 sub gravatar_url {
2146         my $email = lc shift;
2147         my $size = shift;
2148         $avatar_cache{$email} ||=
2149                 "//www.gravatar.com/avatar/" .
2150                         Digest::MD5::md5_hex($email) . "?s=";
2151         return $avatar_cache{$email} . $size;
2152 }
2153
2154 # Insert an avatar for the given $email at the given $size if the feature
2155 # is enabled.
2156 sub git_get_avatar {
2157         my ($email, %opts) = @_;
2158         my $pre_white  = ($opts{-pad_before} ? "&nbsp;" : "");
2159         my $post_white = ($opts{-pad_after}  ? "&nbsp;" : "");
2160         $opts{-size} ||= 'default';
2161         my $size = $avatar_size{$opts{-size}} || $avatar_size{'default'};
2162         my $url = "";
2163         if ($git_avatar eq 'gravatar') {
2164                 $url = gravatar_url($email, $size);
2165         } elsif ($git_avatar eq 'picon') {
2166                 $url = picon_url($email);
2167         }
2168         # Other providers can be added by extending the if chain, defining $url
2169         # as needed. If no variant puts something in $url, we assume avatars
2170         # are completely disabled/unavailable.
2171         if ($url) {
2172                 return $pre_white .
2173                        "<img width=\"$size\" " .
2174                             "class=\"avatar\" " .
2175                             "src=\"".esc_url($url)."\" " .
2176                             "alt=\"\" " .
2177                        "/>" . $post_white;
2178         } else {
2179                 return "";
2180         }
2181 }
2182
2183 sub format_search_author {
2184         my ($author, $searchtype, $displaytext) = @_;
2185         my $have_search = gitweb_check_feature('search');
2186
2187         if ($have_search) {
2188                 my $performed = "";
2189                 if ($searchtype eq 'author') {
2190                         $performed = "authored";
2191                 } elsif ($searchtype eq 'committer') {
2192                         $performed = "committed";
2193                 }
2194
2195                 return $cgi->a({-href => href(action=>"search", hash=>$hash,
2196                                 searchtext=>$author,
2197                                 searchtype=>$searchtype), class=>"list",
2198                                 title=>"Search for commits $performed by $author"},
2199                                 $displaytext);
2200
2201         } else {
2202                 return $displaytext;
2203         }
2204 }
2205
2206 # format the author name of the given commit with the given tag
2207 # the author name is chopped and escaped according to the other
2208 # optional parameters (see chop_str).
2209 sub format_author_html {
2210         my $tag = shift;
2211         my $co = shift;
2212         my $author = chop_and_escape_str($co->{'author_name'}, @_);
2213         return "<$tag class=\"author\">" .
2214                format_search_author($co->{'author_name'}, "author",
2215                        git_get_avatar($co->{'author_email'}, -pad_after => 1) .
2216                        $author) .
2217                "</$tag>";
2218 }
2219
2220 # format git diff header line, i.e. "diff --(git|combined|cc) ..."
2221 sub format_git_diff_header_line {
2222         my $line = shift;
2223         my $diffinfo = shift;
2224         my ($from, $to) = @_;
2225
2226         if ($diffinfo->{'nparents'}) {
2227                 # combined diff
2228                 $line =~ s!^(diff (.*?) )"?.*$!$1!;
2229                 if ($to->{'href'}) {
2230                         $line .= $cgi->a({-href => $to->{'href'}, -class => "path"},
2231                                          esc_path($to->{'file'}));
2232                 } else { # file was deleted (no href)
2233                         $line .= esc_path($to->{'file'});
2234                 }
2235         } else {
2236                 # "ordinary" diff
2237                 $line =~ s!^(diff (.*?) )"?a/.*$!$1!;
2238                 if ($from->{'href'}) {
2239                         $line .= $cgi->a({-href => $from->{'href'}, -class => "path"},
2240                                          'a/' . esc_path($from->{'file'}));
2241                 } else { # file was added (no href)
2242                         $line .= 'a/' . esc_path($from->{'file'});
2243                 }
2244                 $line .= ' ';
2245                 if ($to->{'href'}) {
2246                         $line .= $cgi->a({-href => $to->{'href'}, -class => "path"},
2247                                          'b/' . esc_path($to->{'file'}));
2248                 } else { # file was deleted
2249                         $line .= 'b/' . esc_path($to->{'file'});
2250                 }
2251         }
2252
2253         return "<div class=\"diff header\">$line</div>\n";
2254 }
2255
2256 # format extended diff header line, before patch itself
2257 sub format_extended_diff_header_line {
2258         my $line = shift;
2259         my $diffinfo = shift;
2260         my ($from, $to) = @_;
2261
2262         # match <path>
2263         if ($line =~ s!^((copy|rename) from ).*$!$1! && $from->{'href'}) {
2264                 $line .= $cgi->a({-href=>$from->{'href'}, -class=>"path"},
2265                                        esc_path($from->{'file'}));
2266         }
2267         if ($line =~ s!^((copy|rename) to ).*$!$1! && $to->{'href'}) {
2268                 $line .= $cgi->a({-href=>$to->{'href'}, -class=>"path"},
2269                                  esc_path($to->{'file'}));
2270         }
2271         # match single <mode>
2272         if ($line =~ m/\s(\d{6})$/) {
2273                 $line .= '<span class="info"> (' .
2274                          file_type_long($1) .
2275                          ')</span>';
2276         }
2277         # match <hash>
2278         if ($line =~ m/^index [0-9a-fA-F]{40},[0-9a-fA-F]{40}/) {
2279                 # can match only for combined diff
2280                 $line = 'index ';
2281                 for (my $i = 0; $i < $diffinfo->{'nparents'}; $i++) {
2282                         if ($from->{'href'}[$i]) {
2283                                 $line .= $cgi->a({-href=>$from->{'href'}[$i],
2284                                                   -class=>"hash"},
2285                                                  substr($diffinfo->{'from_id'}[$i],0,7));
2286                         } else {
2287                                 $line .= '0' x 7;
2288                         }
2289                         # separator
2290                         $line .= ',' if ($i < $diffinfo->{'nparents'} - 1);
2291                 }
2292                 $line .= '..';
2293                 if ($to->{'href'}) {
2294                         $line .= $cgi->a({-href=>$to->{'href'}, -class=>"hash"},
2295                                          substr($diffinfo->{'to_id'},0,7));
2296                 } else {
2297                         $line .= '0' x 7;
2298                 }
2299
2300         } elsif ($line =~ m/^index [0-9a-fA-F]{40}..[0-9a-fA-F]{40}/) {
2301                 # can match only for ordinary diff
2302                 my ($from_link, $to_link);
2303                 if ($from->{'href'}) {
2304                         $from_link = $cgi->a({-href=>$from->{'href'}, -class=>"hash"},
2305                                              substr($diffinfo->{'from_id'},0,7));
2306                 } else {
2307                         $from_link = '0' x 7;
2308                 }
2309                 if ($to->{'href'}) {
2310                         $to_link = $cgi->a({-href=>$to->{'href'}, -class=>"hash"},
2311                                            substr($diffinfo->{'to_id'},0,7));
2312                 } else {
2313                         $to_link = '0' x 7;
2314                 }
2315                 my ($from_id, $to_id) = ($diffinfo->{'from_id'}, $diffinfo->{'to_id'});
2316                 $line =~ s!$from_id\.\.$to_id!$from_link..$to_link!;
2317         }
2318
2319         return $line . "<br/>\n";
2320 }
2321
2322 # format from-file/to-file diff header
2323 sub format_diff_from_to_header {
2324         my ($from_line, $to_line, $diffinfo, $from, $to, @parents) = @_;
2325         my $line;
2326         my $result = '';
2327
2328         $line = $from_line;
2329         #assert($line =~ m/^---/) if DEBUG;
2330         # no extra formatting for "^--- /dev/null"
2331         if (! $diffinfo->{'nparents'}) {
2332                 # ordinary (single parent) diff
2333                 if ($line =~ m!^--- "?a/!) {
2334                         if ($from->{'href'}) {
2335                                 $line = '--- a/' .
2336                                         $cgi->a({-href=>$from->{'href'}, -class=>"path"},
2337                                                 esc_path($from->{'file'}));
2338                         } else {
2339                                 $line = '--- a/' .
2340                                         esc_path($from->{'file'});
2341                         }
2342                 }
2343                 $result .= qq!<div class="diff from_file">$line</div>\n!;
2344
2345         } else {
2346                 # combined diff (merge commit)
2347                 for (my $i = 0; $i < $diffinfo->{'nparents'}; $i++) {
2348                         if ($from->{'href'}[$i]) {
2349                                 $line = '--- ' .
2350                                         $cgi->a({-href=>href(action=>"blobdiff",
2351                                                              hash_parent=>$diffinfo->{'from_id'}[$i],
2352                                                              hash_parent_base=>$parents[$i],
2353                                                              file_parent=>$from->{'file'}[$i],
2354                                                              hash=>$diffinfo->{'to_id'},
2355                                                              hash_base=>$hash,
2356                                                              file_name=>$to->{'file'}),
2357                                                  -class=>"path",
2358                                                  -title=>"diff" . ($i+1)},
2359                                                 $i+1) .
2360                                         '/' .
2361                                         $cgi->a({-href=>$from->{'href'}[$i], -class=>"path"},
2362                                                 esc_path($from->{'file'}[$i]));
2363                         } else {
2364                                 $line = '--- /dev/null';
2365                         }
2366                         $result .= qq!<div class="diff from_file">$line</div>\n!;
2367                 }
2368         }
2369
2370         $line = $to_line;
2371         #assert($line =~ m/^\+\+\+/) if DEBUG;
2372         # no extra formatting for "^+++ /dev/null"
2373         if ($line =~ m!^\+\+\+ "?b/!) {
2374                 if ($to->{'href'}) {
2375                         $line = '+++ b/' .
2376                                 $cgi->a({-href=>$to->{'href'}, -class=>"path"},
2377                                         esc_path($to->{'file'}));
2378                 } else {
2379                         $line = '+++ b/' .
2380                                 esc_path($to->{'file'});
2381                 }
2382         }
2383         $result .= qq!<div class="diff to_file">$line</div>\n!;
2384
2385         return $result;
2386 }
2387
2388 # create note for patch simplified by combined diff
2389 sub format_diff_cc_simplified {
2390         my ($diffinfo, @parents) = @_;
2391         my $result = '';
2392
2393         $result .= "<div class=\"diff header\">" .
2394                    "diff --cc ";
2395         if (!is_deleted($diffinfo)) {
2396                 $result .= $cgi->a({-href => href(action=>"blob",
2397                                                   hash_base=>$hash,
2398                                                   hash=>$diffinfo->{'to_id'},
2399                                                   file_name=>$diffinfo->{'to_file'}),
2400                                     -class => "path"},
2401                                    esc_path($diffinfo->{'to_file'}));
2402         } else {
2403                 $result .= esc_path($diffinfo->{'to_file'});
2404         }
2405         $result .= "</div>\n" . # class="diff header"
2406                    "<div class=\"diff nodifferences\">" .
2407                    "Simple merge" .
2408                    "</div>\n"; # class="diff nodifferences"
2409
2410         return $result;
2411 }
2412
2413 sub diff_line_class {
2414         my ($line, $from, $to) = @_;
2415
2416         # ordinary diff
2417         my $num_sign = 1;
2418         # combined diff
2419         if ($from && $to && ref($from->{'href'}) eq "ARRAY") {
2420                 $num_sign = scalar @{$from->{'href'}};
2421         }
2422
2423         my @diff_line_classifier = (
2424                 { regexp => qr/^\@\@{$num_sign} /, class => "chunk_header"},
2425                 { regexp => qr/^\\/,               class => "incomplete"  },
2426                 { regexp => qr/^ {$num_sign}/,     class => "ctx" },
2427                 # classifier for context must come before classifier add/rem,
2428                 # or we would have to use more complicated regexp, for example
2429                 # qr/(?= {0,$m}\+)[+ ]{$num_sign}/, where $m = $num_sign - 1;
2430                 { regexp => qr/^[+ ]{$num_sign}/,   class => "add" },
2431                 { regexp => qr/^[- ]{$num_sign}/,   class => "rem" },
2432         );
2433         for my $clsfy (@diff_line_classifier) {
2434                 return $clsfy->{'class'}
2435                         if ($line =~ $clsfy->{'regexp'});
2436         }
2437
2438         # fallback
2439         return "";
2440 }
2441
2442 # assumes that $from and $to are defined and correctly filled,
2443 # and that $line holds a line of chunk header for unified diff
2444 sub format_unidiff_chunk_header {
2445         my ($line, $from, $to) = @_;
2446
2447         my ($from_text, $from_start, $from_lines, $to_text, $to_start, $to_lines, $section) =
2448                 $line =~ m/^\@{2} (-(\d+)(?:,(\d+))?) (\+(\d+)(?:,(\d+))?) \@{2}(.*)$/;
2449
2450         $from_lines = 0 unless defined $from_lines;
2451         $to_lines   = 0 unless defined $to_lines;
2452
2453         if ($from->{'href'}) {
2454                 $from_text = $cgi->a({-href=>"$from->{'href'}#l$from_start",
2455                                      -class=>"list"}, $from_text);
2456         }
2457         if ($to->{'href'}) {
2458                 $to_text   = $cgi->a({-href=>"$to->{'href'}#l$to_start",
2459                                      -class=>"list"}, $to_text);
2460         }
2461         $line = "<span class=\"chunk_info\">@@ $from_text $to_text @@</span>" .
2462                 "<span class=\"section\">" . esc_html($section, -nbsp=>1) . "</span>";
2463         return $line;
2464 }
2465
2466 # assumes that $from and $to are defined and correctly filled,
2467 # and that $line holds a line of chunk header for combined diff
2468 sub format_cc_diff_chunk_header {
2469         my ($line, $from, $to) = @_;
2470
2471         my ($prefix, $ranges, $section) = $line =~ m/^(\@+) (.*?) \@+(.*)$/;
2472         my (@from_text, @from_start, @from_nlines, $to_text, $to_start, $to_nlines);
2473
2474         @from_text = split(' ', $ranges);
2475         for (my $i = 0; $i < @from_text; ++$i) {
2476                 ($from_start[$i], $from_nlines[$i]) =
2477                         (split(',', substr($from_text[$i], 1)), 0);
2478         }
2479
2480         $to_text   = pop @from_text;
2481         $to_start  = pop @from_start;
2482         $to_nlines = pop @from_nlines;
2483
2484         $line = "<span class=\"chunk_info\">$prefix ";
2485         for (my $i = 0; $i < @from_text; ++$i) {
2486                 if ($from->{'href'}[$i]) {
2487                         $line .= $cgi->a({-href=>"$from->{'href'}[$i]#l$from_start[$i]",
2488                                           -class=>"list"}, $from_text[$i]);
2489                 } else {
2490                         $line .= $from_text[$i];
2491                 }
2492                 $line .= " ";
2493         }
2494         if ($to->{'href'}) {
2495                 $line .= $cgi->a({-href=>"$to->{'href'}#l$to_start",
2496                                   -class=>"list"}, $to_text);
2497         } else {
2498                 $line .= $to_text;
2499         }
2500         $line .= " $prefix</span>" .
2501                  "<span class=\"section\">" . esc_html($section, -nbsp=>1) . "</span>";
2502         return $line;
2503 }
2504
2505 # process patch (diff) line (not to be used for diff headers),
2506 # returning HTML-formatted (but not wrapped) line.
2507 # If the line is passed as a reference, it is treated as HTML and not
2508 # esc_html()'ed.
2509 sub format_diff_line {
2510         my ($line, $diff_class, $from, $to) = @_;
2511
2512         if (ref($line)) {
2513                 $line = $$line;
2514         } else {
2515                 chomp $line;
2516                 $line = untabify($line);
2517
2518                 if ($from && $to && $line =~ m/^\@{2} /) {
2519                         $line = format_unidiff_chunk_header($line, $from, $to);
2520                 } elsif ($from && $to && $line =~ m/^\@{3}/) {
2521                         $line = format_cc_diff_chunk_header($line, $from, $to);
2522                 } else {
2523                         $line = esc_html($line, -nbsp=>1);
2524                 }
2525         }
2526
2527         my $diff_classes = "diff";
2528         $diff_classes .= " $diff_class" if ($diff_class);
2529         $line = "<div class=\"$diff_classes\">$line</div>\n";
2530
2531         return $line;
2532 }
2533
2534 # Generates undef or something like "_snapshot_" or "snapshot (_tbz2_ _zip_)",
2535 # linked.  Pass the hash of the tree/commit to snapshot.
2536 sub format_snapshot_links {
2537         my ($hash) = @_;
2538         my $num_fmts = @snapshot_fmts;
2539         if ($num_fmts > 1) {
2540                 # A parenthesized list of links bearing format names.
2541                 # e.g. "snapshot (_tar.gz_ _zip_)"
2542                 return "snapshot (" . join(' ', map
2543                         $cgi->a({
2544                                 -href => href(
2545                                         action=>"snapshot",
2546                                         hash=>$hash,
2547                                         snapshot_format=>$_
2548                                 )
2549                         }, $known_snapshot_formats{$_}{'display'})
2550                 , @snapshot_fmts) . ")";
2551         } elsif ($num_fmts == 1) {
2552                 # A single "snapshot" link whose tooltip bears the format name.
2553                 # i.e. "_snapshot_"
2554                 my ($fmt) = @snapshot_fmts;
2555                 return
2556                         $cgi->a({
2557                                 -href => href(
2558                                         action=>"snapshot",
2559                                         hash=>$hash,
2560                                         snapshot_format=>$fmt
2561                                 ),
2562                                 -title => "in format: $known_snapshot_formats{$fmt}{'display'}"
2563                         }, "snapshot");
2564         } else { # $num_fmts == 0
2565                 return undef;
2566         }
2567 }
2568
2569 ## ......................................................................
2570 ## functions returning values to be passed, perhaps after some
2571 ## transformation, to other functions; e.g. returning arguments to href()
2572
2573 # returns hash to be passed to href to generate gitweb URL
2574 # in -title key it returns description of link
2575 sub get_feed_info {
2576         my $format = shift || 'Atom';
2577         my %res = (action => lc($format));
2578         my $matched_ref = 0;
2579
2580         # feed links are possible only for project views
2581         return unless (defined $project);
2582         # some views should link to OPML, or to generic project feed,
2583         # or don't have specific feed yet (so they should use generic)
2584         return if (!$action || $action =~ /^(?:tags|heads|forks|tag|search)$/x);
2585
2586         my $branch = undef;
2587         # branches refs uses 'refs/' + $get_branch_refs()[x] + '/' prefix
2588         # (fullname) to differentiate from tag links; this also makes
2589         # possible to detect branch links
2590         for my $ref (get_branch_refs()) {
2591                 if ((defined $hash_base && $hash_base =~ m!^refs/\Q$ref\E/(.*)$!) ||
2592                     (defined $hash      && $hash      =~ m!^refs/\Q$ref\E/(.*)$!)) {
2593                         $branch = $1;
2594                         $matched_ref = $ref;
2595                         last;
2596                 }
2597         }
2598         # find log type for feed description (title)
2599         my $type = 'log';
2600         if (defined $file_name) {
2601                 $type  = "history of $file_name";
2602                 $type .= "/" if ($action eq 'tree');
2603                 $type .= " on '$branch'" if (defined $branch);
2604         } else {
2605                 $type = "log of $branch" if (defined $branch);
2606         }
2607
2608         $res{-title} = $type;
2609         $res{'hash'} = (defined $branch ? "refs/$matched_ref/$branch" : undef);
2610         $res{'file_name'} = $file_name;
2611
2612         return %res;
2613 }
2614
2615 ## ----------------------------------------------------------------------
2616 ## git utility subroutines, invoking git commands
2617
2618 # returns path to the core git executable and the --git-dir parameter as list
2619 sub git_cmd {
2620         $number_of_git_cmds++;
2621         return $GIT, '--git-dir='.$git_dir;
2622 }
2623
2624 # quote the given arguments for passing them to the shell
2625 # quote_command("command", "arg 1", "arg with ' and ! characters")
2626 # => "'command' 'arg 1' 'arg with '\'' and '\!' characters'"
2627 # Try to avoid using this function wherever possible.
2628 sub quote_command {
2629         return join(' ',
2630                 map { my $a = $_; $a =~ s/(['!])/'\\$1'/g; "'$a'" } @_ );
2631 }
2632
2633 # get HEAD ref of given project as hash
2634 sub git_get_head_hash {
2635         return git_get_full_hash(shift, 'HEAD');
2636 }
2637
2638 sub git_get_full_hash {
2639         return git_get_hash(@_);
2640 }
2641
2642 sub git_get_short_hash {
2643         return git_get_hash(@_, '--short=7');
2644 }
2645
2646 sub git_get_hash {
2647         my ($project, $hash, @options) = @_;
2648         my $o_git_dir = $git_dir;
2649         my $retval = undef;
2650         $git_dir = "$projectroot/$project";
2651         if (open my $fd, '-|', git_cmd(), 'rev-parse',
2652             '--verify', '-q', @options, $hash) {
2653                 $retval = <$fd>;
2654                 chomp $retval if defined $retval;
2655                 close $fd;
2656         }
2657         if (defined $o_git_dir) {
2658                 $git_dir = $o_git_dir;
2659         }
2660         return $retval;
2661 }
2662
2663 # get type of given object
2664 sub git_get_type {
2665         my $hash = shift;
2666
2667         open my $fd, "-|", git_cmd(), "cat-file", '-t', $hash or return;
2668         my $type = <$fd>;
2669         close $fd or return;
2670         chomp $type;
2671         return $type;
2672 }
2673
2674 # repository configuration
2675 our $config_file = '';
2676 our %config;
2677
2678 # store multiple values for single key as anonymous array reference
2679 # single values stored directly in the hash, not as [ <value> ]
2680 sub hash_set_multi {
2681         my ($hash, $key, $value) = @_;
2682
2683         if (!exists $hash->{$key}) {
2684                 $hash->{$key} = $value;
2685         } elsif (!ref $hash->{$key}) {
2686                 $hash->{$key} = [ $hash->{$key}, $value ];
2687         } else {
2688                 push @{$hash->{$key}}, $value;
2689         }
2690 }
2691
2692 # return hash of git project configuration
2693 # optionally limited to some section, e.g. 'gitweb'
2694 sub git_parse_project_config {
2695         my $section_regexp = shift;
2696         my %config;
2697
2698         local $/ = "\0";
2699
2700         open my $fh, "-|", git_cmd(), "config", '-z', '-l',
2701                 or return;
2702
2703         while (my $keyval = <$fh>) {
2704                 chomp $keyval;
2705                 my ($key, $value) = split(/\n/, $keyval, 2);
2706
2707                 hash_set_multi(\%config, $key, $value)
2708                         if (!defined $section_regexp || $key =~ /^(?:$section_regexp)\./o);
2709         }
2710         close $fh;
2711
2712         return %config;
2713 }
2714
2715 # convert config value to boolean: 'true' or 'false'
2716 # no value, number > 0, 'true' and 'yes' values are true
2717 # rest of values are treated as false (never as error)
2718 sub config_to_bool {
2719         my $val = shift;
2720
2721         return 1 if !defined $val;             # section.key
2722
2723         # strip leading and trailing whitespace
2724         $val =~ s/^\s+//;
2725         $val =~ s/\s+$//;
2726
2727         return (($val =~ /^\d+$/ && $val) ||   # section.key = 1
2728                 ($val =~ /^(?:true|yes)$/i));  # section.key = true
2729 }
2730
2731 # convert config value to simple decimal number
2732 # an optional value suffix of 'k', 'm', or 'g' will cause the value
2733 # to be multiplied by 1024, 1048576, or 1073741824
2734 sub config_to_int {
2735         my $val = shift;
2736
2737         # strip leading and trailing whitespace
2738         $val =~ s/^\s+//;
2739         $val =~ s/\s+$//;
2740
2741         if (my ($num, $unit) = ($val =~ /^([0-9]*)([kmg])$/i)) {
2742                 $unit = lc($unit);
2743                 # unknown unit is treated as 1
2744                 return $num * ($unit eq 'g' ? 1073741824 :
2745                                $unit eq 'm' ?    1048576 :
2746                                $unit eq 'k' ?       1024 : 1);
2747         }
2748         return $val;
2749 }
2750
2751 # convert config value to array reference, if needed
2752 sub config_to_multi {
2753         my $val = shift;
2754
2755         return ref($val) ? $val : (defined($val) ? [ $val ] : []);
2756 }
2757
2758 sub git_get_project_config {
2759         my ($key, $type) = @_;
2760
2761         return unless defined $git_dir;
2762
2763         # key sanity check
2764         return unless ($key);
2765         # only subsection, if exists, is case sensitive,
2766         # and not lowercased by 'git config -z -l'
2767         if (my ($hi, $mi, $lo) = ($key =~ /^([^.]*)\.(.*)\.([^.]*)$/)) {
2768                 $lo =~ s/_//g;
2769                 $key = join(".", lc($hi), $mi, lc($lo));
2770                 return if ($lo =~ /\W/ || $hi =~ /\W/);
2771         } else {
2772                 $key = lc($key);
2773                 $key =~ s/_//g;
2774                 return if ($key =~ /\W/);
2775         }
2776         $key =~ s/^gitweb\.//;
2777
2778         # type sanity check
2779         if (defined $type) {
2780                 $type =~ s/^--//;
2781                 $type = undef
2782                         unless ($type eq 'bool' || $type eq 'int');
2783         }
2784
2785         # get config
2786         if (!defined $config_file ||
2787             $config_file ne "$git_dir/config") {
2788                 %config = git_parse_project_config('gitweb');
2789                 $config_file = "$git_dir/config";
2790         }
2791
2792         # check if config variable (key) exists
2793         return unless exists $config{"gitweb.$key"};
2794
2795         # ensure given type
2796         if (!defined $type) {
2797                 return $config{"gitweb.$key"};
2798         } elsif ($type eq 'bool') {
2799                 # backward compatibility: 'git config --bool' returns true/false
2800                 return config_to_bool($config{"gitweb.$key"}) ? 'true' : 'false';
2801         } elsif ($type eq 'int') {
2802                 return config_to_int($config{"gitweb.$key"});
2803         }
2804         return $config{"gitweb.$key"};
2805 }
2806
2807 # get hash of given path at given ref
2808 sub git_get_hash_by_path {
2809         my $base = shift;
2810         my $path = shift || return undef;
2811         my $type = shift;
2812
2813         $path =~ s,/+$,,;
2814
2815         open my $fd, "-|", git_cmd(), "ls-tree", $base, "--", $path
2816                 or die_error(500, "Open git-ls-tree failed");
2817         my $line = <$fd>;
2818         close $fd or return undef;
2819
2820         if (!defined $line) {
2821                 # there is no tree or hash given by $path at $base
2822                 return undef;
2823         }
2824
2825         #'100644 blob 0fa3f3a66fb6a137f6ec2c19351ed4d807070ffa  panic.c'
2826         $line =~ m/^([0-9]+) (.+) ([0-9a-fA-F]{40})\t/;
2827         if (defined $type && $type ne $2) {
2828                 # type doesn't match
2829                 return undef;
2830         }
2831         return $3;
2832 }
2833
2834 # get path of entry with given hash at given tree-ish (ref)
2835 # used to get 'from' filename for combined diff (merge commit) for renames
2836 sub git_get_path_by_hash {
2837         my $base = shift || return;
2838         my $hash = shift || return;
2839
2840         local $/ = "\0";
2841
2842         open my $fd, "-|", git_cmd(), "ls-tree", '-r', '-t', '-z', $base
2843                 or return undef;
2844         while (my $line = <$fd>) {
2845                 chomp $line;
2846
2847                 #'040000 tree 595596a6a9117ddba9fe379b6b012b558bac8423  gitweb'
2848                 #'100644 blob e02e90f0429be0d2a69b76571101f20b8f75530f  gitweb/README'
2849                 if ($line =~ m/(?:[0-9]+) (?:.+) $hash\t(.+)$/) {
2850                         close $fd;
2851                         return $1;
2852                 }
2853         }
2854         close $fd;
2855         return undef;
2856 }
2857
2858 ## ......................................................................
2859 ## git utility functions, directly accessing git repository
2860
2861 # get the value of config variable either from file named as the variable
2862 # itself in the repository ($GIT_DIR/$name file), or from gitweb.$name
2863 # configuration variable in the repository config file.
2864 sub git_get_file_or_project_config {
2865         my ($path, $name) = @_;
2866
2867         $git_dir = "$projectroot/$path";
2868         open my $fd, '<', "$git_dir/$name"
2869                 or return git_get_project_config($name);
2870         my $conf = <$fd>;
2871         close $fd;
2872         if (defined $conf) {
2873                 chomp $conf;
2874         }
2875         return $conf;
2876 }
2877
2878 sub git_get_project_description {
2879         my $path = shift;
2880         return git_get_file_or_project_config($path, 'description');
2881 }
2882
2883 sub git_get_project_category {
2884         my $path = shift;
2885         return git_get_file_or_project_config($path, 'category');
2886 }
2887
2888
2889 # supported formats:
2890 # * $GIT_DIR/ctags/<tagname> file (in 'ctags' subdirectory)
2891 #   - if its contents is a number, use it as tag weight,
2892 #   - otherwise add a tag with weight 1
2893 # * $GIT_DIR/ctags file, each line is a tag (with weight 1)
2894 #   the same value multiple times increases tag weight
2895 # * `gitweb.ctag' multi-valued repo config variable
2896 sub git_get_project_ctags {
2897         my $project = shift;
2898         my $ctags = {};
2899
2900         $git_dir = "$projectroot/$project";
2901         if (opendir my $dh, "$git_dir/ctags") {
2902                 my @files = grep { -f $_ } map { "$git_dir/ctags/$_" } readdir($dh);
2903                 foreach my $tagfile (@files) {
2904                         open my $ct, '<', $tagfile
2905                                 or next;
2906                         my $val = <$ct>;
2907                         chomp $val if $val;
2908                         close $ct;
2909
2910                         (my $ctag = $tagfile) =~ s#.*/##;
2911                         if ($val =~ /^\d+$/) {
2912                                 $ctags->{$ctag} = $val;
2913                         } else {
2914                                 $ctags->{$ctag} = 1;
2915                         }
2916                 }
2917                 closedir $dh;
2918
2919         } elsif (open my $fh, '<', "$git_dir/ctags") {
2920                 while (my $line = <$fh>) {
2921                         chomp $line;
2922                         $ctags->{$line}++ if $line;
2923                 }
2924                 close $fh;
2925
2926         } else {
2927                 my $taglist = config_to_multi(git_get_project_config('ctag'));
2928                 foreach my $tag (@$taglist) {
2929                         $ctags->{$tag}++;
2930                 }
2931         }
2932
2933         return $ctags;
2934 }
2935
2936 # return hash, where keys are content tags ('ctags'),
2937 # and values are sum of weights of given tag in every project
2938 sub git_gather_all_ctags {
2939         my $projects = shift;
2940         my $ctags = {};
2941
2942         foreach my $p (@$projects) {
2943                 foreach my $ct (keys %{$p->{'ctags'}}) {
2944                         $ctags->{$ct} += $p->{'ctags'}->{$ct};
2945                 }
2946         }
2947
2948         return $ctags;
2949 }
2950
2951 sub git_populate_project_tagcloud {
2952         my $ctags = shift;
2953
2954         # First, merge different-cased tags; tags vote on casing
2955         my %ctags_lc;
2956         foreach (keys %$ctags) {
2957                 $ctags_lc{lc $_}->{count} += $ctags->{$_};
2958                 if (not $ctags_lc{lc $_}->{topcount}
2959                     or $ctags_lc{lc $_}->{topcount} < $ctags->{$_}) {
2960                         $ctags_lc{lc $_}->{topcount} = $ctags->{$_};
2961                         $ctags_lc{lc $_}->{topname} = $_;
2962                 }
2963         }
2964
2965         my $cloud;
2966         my $matched = $input_params{'ctag'};
2967         if (eval { require HTML::TagCloud; 1; }) {
2968                 $cloud = HTML::TagCloud->new;
2969                 foreach my $ctag (sort keys %ctags_lc) {
2970                         # Pad the title with spaces so that the cloud looks
2971                         # less crammed.
2972                         my $title = esc_html($ctags_lc{$ctag}->{topname});
2973                         $title =~ s/ /&nbsp;/g;
2974                         $title =~ s/^/&nbsp;/g;
2975                         $title =~ s/$/&nbsp;/g;
2976                         if (defined $matched && $matched eq $ctag) {
2977                                 $title = qq(<span class="match">$title</span>);
2978                         }
2979                         $cloud->add($title, href(project=>undef, ctag=>$ctag),
2980                                     $ctags_lc{$ctag}->{count});
2981                 }
2982         } else {
2983                 $cloud = {};
2984                 foreach my $ctag (keys %ctags_lc) {
2985                         my $title = esc_html($ctags_lc{$ctag}->{topname}, -nbsp=>1);
2986                         if (defined $matched && $matched eq $ctag) {
2987                                 $title = qq(<span class="match">$title</span>);
2988                         }
2989                         $cloud->{$ctag}{count} = $ctags_lc{$ctag}->{count};
2990                         $cloud->{$ctag}{ctag} =
2991                                 $cgi->a({-href=>href(project=>undef, ctag=>$ctag)}, $title);
2992                 }
2993         }
2994         return $cloud;
2995 }
2996
2997 sub git_show_project_tagcloud {
2998         my ($cloud, $count) = @_;
2999         if (ref $cloud eq 'HTML::TagCloud') {
3000                 return $cloud->html_and_css($count);
3001         } else {
3002                 my @tags = sort { $cloud->{$a}->{'count'} <=> $cloud->{$b}->{'count'} } keys %$cloud;
3003                 return
3004                         '<div id="htmltagcloud"'.($project ? '' : ' align="center"').'>' .
3005                         join (', ', map {
3006                                 $cloud->{$_}->{'ctag'}
3007                         } splice(@tags, 0, $count)) .
3008                         '</div>';
3009         }
3010 }
3011
3012 sub git_get_project_url_list {
3013         my $path = shift;
3014
3015         $git_dir = "$projectroot/$path";
3016         open my $fd, '<', "$git_dir/cloneurl"
3017                 or return wantarray ?
3018                 @{ config_to_multi(git_get_project_config('url')) } :
3019                    config_to_multi(git_get_project_config('url'));
3020         my @git_project_url_list = map { chomp; $_ } <$fd>;
3021         close $fd;
3022
3023         return wantarray ? @git_project_url_list : \@git_project_url_list;
3024 }
3025
3026 sub git_get_projects_list {
3027         my $filter = shift || '';
3028         my $paranoid = shift;
3029         my @list;
3030
3031         if (-d $projects_list) {
3032                 # search in directory
3033                 my $dir = $projects_list;
3034                 # remove the trailing "/"
3035                 $dir =~ s!/+$!!;
3036                 my $pfxlen = length("$dir");
3037                 my $pfxdepth = ($dir =~ tr!/!!);
3038                 # when filtering, search only given subdirectory
3039                 if ($filter && !$paranoid) {
3040                         $dir .= "/$filter";
3041                         $dir =~ s!/+$!!;
3042                 }
3043
3044                 File::Find::find({
3045                         follow_fast => 1, # follow symbolic links
3046                         follow_skip => 2, # ignore duplicates
3047                         dangling_symlinks => 0, # ignore dangling symlinks, silently
3048                         wanted => sub {
3049                                 # global variables
3050                                 our $project_maxdepth;
3051                                 our $projectroot;
3052                                 # skip project-list toplevel, if we get it.
3053                                 return if (m!^[/.]$!);
3054                                 # only directories can be git repositories
3055                                 return unless (-d $_);
3056                                 # don't traverse too deep (Find is super slow on os x)
3057                                 # $project_maxdepth excludes depth of $projectroot
3058                                 if (($File::Find::name =~ tr!/!!) - $pfxdepth > $project_maxdepth) {
3059                                         $File::Find::prune = 1;
3060                                         return;
3061                                 }
3062
3063                                 my $path = substr($File::Find::name, $pfxlen + 1);
3064                                 # paranoidly only filter here
3065                                 if ($paranoid && $filter && $path !~ m!^\Q$filter\E/!) {
3066                                         next;
3067                                 }
3068                                 # we check related file in $projectroot
3069                                 if (check_export_ok("$projectroot/$path")) {
3070                                         push @list, { path => $path };
3071                                         $File::Find::prune = 1;
3072                                 }
3073                         },
3074                 }, "$dir");
3075
3076         } elsif (-f $projects_list) {
3077                 # read from file(url-encoded):
3078                 # 'git%2Fgit.git Linus+Torvalds'
3079                 # 'libs%2Fklibc%2Fklibc.git H.+Peter+Anvin'
3080                 # 'linux%2Fhotplug%2Fudev.git Greg+Kroah-Hartman'
3081                 open my $fd, '<', $projects_list or return;
3082         PROJECT:
3083                 while (my $line = <$fd>) {
3084                         chomp $line;
3085                         my ($path, $owner) = split ' ', $line;
3086                         $path = unescape($path);
3087                         $owner = unescape($owner);
3088                         if (!defined $path) {
3089                                 next;
3090                         }
3091                         # if $filter is rpovided, check if $path begins with $filter
3092                         if ($filter && $path !~ m!^\Q$filter\E/!) {
3093                                 next;
3094                         }
3095                         if (check_export_ok("$projectroot/$path")) {
3096                                 my $pr = {
3097                                         path => $path
3098                                 };
3099                                 if ($owner) {
3100                                         $pr->{'owner'} = to_utf8($owner);
3101                                 }
3102                                 push @list, $pr;
3103                         }
3104                 }
3105                 close $fd;
3106         }
3107         return @list;
3108 }
3109
3110 # written with help of Tree::Trie module (Perl Artistic License, GPL compatibile)
3111 # as side effects it sets 'forks' field to list of forks for forked projects
3112 sub filter_forks_from_projects_list {
3113         my $projects = shift;
3114
3115         my %trie; # prefix tree of directories (path components)
3116         # generate trie out of those directories that might contain forks
3117         foreach my $pr (@$projects) {
3118                 my $path = $pr->{'path'};
3119                 $path =~ s/\.git$//;      # forks of 'repo.git' are in 'repo/' directory
3120                 next if ($path =~ m!/$!); # skip non-bare repositories, e.g. 'repo/.git'
3121                 next unless ($path);      # skip '.git' repository: tests, git-instaweb
3122                 next unless (-d "$projectroot/$path"); # containing directory exists
3123                 $pr->{'forks'} = [];      # there can be 0 or more forks of project
3124
3125                 # add to trie
3126                 my @dirs = split('/', $path);
3127                 # walk the trie, until either runs out of components or out of trie
3128                 my $ref = \%trie;
3129                 while (scalar @dirs &&
3130                        exists($ref->{$dirs[0]})) {
3131                         $ref = $ref->{shift @dirs};
3132                 }
3133                 # create rest of trie structure from rest of components
3134                 foreach my $dir (@dirs) {
3135                         $ref = $ref->{$dir} = {};
3136                 }
3137                 # create end marker, store $pr as a data
3138                 $ref->{''} = $pr if (!exists $ref->{''});
3139         }
3140
3141         # filter out forks, by finding shortest prefix match for paths
3142         my @filtered;
3143  PROJECT:
3144         foreach my $pr (@$projects) {
3145                 # trie lookup
3146                 my $ref = \%trie;
3147         DIR:
3148                 foreach my $dir (split('/', $pr->{'path'})) {
3149                         if (exists $ref->{''}) {
3150                                 # found [shortest] prefix, is a fork - skip it
3151                                 push @{$ref->{''}{'forks'}}, $pr;
3152                                 next PROJECT;
3153                         }
3154                         if (!exists $ref->{$dir}) {
3155                                 # not in trie, cannot have prefix, not a fork
3156                                 push @filtered, $pr;
3157                                 next PROJECT;
3158                         }
3159                         # If the dir is there, we just walk one step down the trie.
3160                         $ref = $ref->{$dir};
3161                 }
3162                 # we ran out of trie
3163                 # (shouldn't happen: it's either no match, or end marker)
3164                 push @filtered, $pr;
3165         }
3166
3167         return @filtered;
3168 }
3169
3170 # note: fill_project_list_info must be run first,
3171 # for 'descr_long' and 'ctags' to be filled
3172 sub search_projects_list {
3173         my ($projlist, %opts) = @_;
3174         my $tagfilter  = $opts{'tagfilter'};
3175         my $search_re = $opts{'search_regexp'};
3176
3177         return @$projlist
3178                 unless ($tagfilter || $search_re);
3179
3180         # searching projects require filling to be run before it;
3181         fill_project_list_info($projlist,
3182                                $tagfilter  ? 'ctags' : (),
3183                                $search_re ? ('path', 'descr') : ());
3184         my @projects;
3185  PROJECT:
3186         foreach my $pr (@$projlist) {
3187
3188                 if ($tagfilter) {
3189                         next unless ref($pr->{'ctags'}) eq 'HASH';
3190                         next unless
3191                                 grep { lc($_) eq lc($tagfilter) } keys %{$pr->{'ctags'}};
3192                 }
3193
3194                 if ($search_re) {
3195                         next unless
3196                                 $pr->{'path'} =~ /$search_re/ ||
3197                                 $pr->{'descr_long'} =~ /$search_re/;
3198                 }
3199
3200                 push @projects, $pr;
3201         }
3202
3203         return @projects;
3204 }
3205
3206 our $gitweb_project_owner = undef;
3207 sub git_get_project_list_from_file {
3208
3209         return if (defined $gitweb_project_owner);
3210
3211         $gitweb_project_owner = {};
3212         # read from file (url-encoded):
3213         # 'git%2Fgit.git Linus+Torvalds'
3214         # 'libs%2Fklibc%2Fklibc.git H.+Peter+Anvin'
3215         # 'linux%2Fhotplug%2Fudev.git Greg+Kroah-Hartman'
3216         if (-f $projects_list) {
3217                 open(my $fd, '<', $projects_list);
3218                 while (my $line = <$fd>) {
3219                         chomp $line;
3220                         my ($pr, $ow) = split ' ', $line;
3221                         $pr = unescape($pr);
3222                         $ow = unescape($ow);
3223                         $gitweb_project_owner->{$pr} = to_utf8($ow);
3224                 }
3225                 close $fd;
3226         }
3227 }
3228
3229 sub git_get_project_owner {
3230         my $project = shift;
3231         my $owner;
3232
3233         return undef unless $project;
3234         $git_dir = "$projectroot/$project";
3235
3236         if (!defined $gitweb_project_owner) {
3237                 git_get_project_list_from_file();
3238         }
3239
3240         if (exists $gitweb_project_owner->{$project}) {
3241                 $owner = $gitweb_project_owner->{$project};
3242         }
3243         if (!defined $owner){
3244                 $owner = git_get_project_config('owner');
3245         }
3246         if (!defined $owner) {
3247                 $owner = get_file_owner("$git_dir");
3248         }
3249
3250         return $owner;
3251 }
3252
3253 sub git_get_last_activity {
3254         my ($path) = @_;
3255         my $fd;
3256
3257         $git_dir = "$projectroot/$path";
3258         open($fd, "-|", git_cmd(), 'for-each-ref',
3259              '--format=%(committer)',
3260              '--sort=-committerdate',
3261              '--count=1',
3262              map { "refs/$_" } get_branch_refs ()) or return;
3263         my $most_recent = <$fd>;
3264         close $fd or return;
3265         if (defined $most_recent &&
3266             $most_recent =~ / (\d+) [-+][01]\d\d\d$/) {
3267                 my $timestamp = $1;
3268                 my $age = time - $timestamp;
3269                 return ($age, age_string($age));
3270         }
3271         return (undef, undef);
3272 }
3273
3274 # Implementation note: when a single remote is wanted, we cannot use 'git
3275 # remote show -n' because that command always work (assuming it's a remote URL
3276 # if it's not defined), and we cannot use 'git remote show' because that would
3277 # try to make a network roundtrip. So the only way to find if that particular
3278 # remote is defined is to walk the list provided by 'git remote -v' and stop if
3279 # and when we find what we want.
3280 sub git_get_remotes_list {
3281         my $wanted = shift;
3282         my %remotes = ();
3283
3284         open my $fd, '-|' , git_cmd(), 'remote', '-v';
3285         return unless $fd;
3286         while (my $remote = <$fd>) {
3287                 chomp $remote;
3288                 $remote =~ s!\t(.*?)\s+\((\w+)\)$!!;
3289                 next if $wanted and not $remote eq $wanted;
3290                 my ($url, $key) = ($1, $2);
3291
3292                 $remotes{$remote} ||= { 'heads' => () };
3293                 $remotes{$remote}{$key} = $url;
3294         }
3295         close $fd or return;
3296         return wantarray ? %remotes : \%remotes;
3297 }
3298
3299 # Takes a hash of remotes as first parameter and fills it by adding the
3300 # available remote heads for each of the indicated remotes.
3301 sub fill_remote_heads {
3302         my $remotes = shift;
3303         my @heads = map { "remotes/$_" } keys %$remotes;
3304         my @remoteheads = git_get_heads_list(undef, @heads);
3305         foreach my $remote (keys %$remotes) {
3306                 $remotes->{$remote}{'heads'} = [ grep {
3307                         $_->{'name'} =~ s!^$remote/!!
3308                         } @remoteheads ];
3309         }
3310 }
3311
3312 sub git_get_references {
3313         my $type = shift || "";
3314         my %refs;
3315         # 5dc01c595e6c6ec9ccda4f6f69c131c0dd945f8c refs/tags/v2.6.11
3316         # c39ae07f393806ccf406ef966e9a15afc43cc36a refs/tags/v2.6.11^{}
3317         open my $fd, "-|", git_cmd(), "show-ref", "--dereference",
3318                 ($type ? ("--", "refs/$type") : ()) # use -- <pattern> if $type
3319                 or return;
3320
3321         while (my $line = <$fd>) {
3322                 chomp $line;
3323                 if ($line =~ m!^([0-9a-fA-F]{40})\srefs/($type.*)$!) {
3324                         if (defined $refs{$1}) {
3325                                 push @{$refs{$1}}, $2;
3326                         } else {
3327                                 $refs{$1} = [ $2 ];
3328                         }
3329                 }
3330         }
3331         close $fd or return;
3332         return \%refs;
3333 }
3334
3335 sub git_get_rev_name_tags {
3336         my $hash = shift || return undef;
3337
3338         open my $fd, "-|", git_cmd(), "name-rev", "--tags", $hash
3339                 or return;
3340         my $name_rev = <$fd>;
3341         close $fd;
3342
3343         if ($name_rev =~ m|^$hash tags/(.*)$|) {
3344                 return $1;
3345         } else {
3346                 # catches also '$hash undefined' output
3347                 return undef;
3348         }
3349 }
3350
3351 ## ----------------------------------------------------------------------
3352 ## parse to hash functions
3353
3354 sub parse_date {
3355         my $epoch = shift;
3356         my $tz = shift || "-0000";
3357
3358         my %date;
3359         my @months = ("Jan", "Feb", "Mar", "Apr", "May", "Jun", "Jul", "Aug", "Sep", "Oct", "Nov", "Dec");
3360         my @days = ("Sun", "Mon", "Tue", "Wed", "Thu", "Fri", "Sat");
3361         my ($sec, $min, $hour, $mday, $mon, $year, $wday, $yday) = gmtime($epoch);
3362         $date{'hour'} = $hour;
3363         $date{'minute'} = $min;
3364         $date{'mday'} = $mday;
3365         $date{'day'} = $days[$wday];
3366         $date{'month'} = $months[$mon];
3367         $date{'rfc2822'}   = sprintf "%s, %d %s %4d %02d:%02d:%02d +0000",
3368                              $days[$wday], $mday, $months[$mon], 1900+$year, $hour ,$min, $sec;
3369         $date{'mday-time'} = sprintf "%d %s %02d:%02d",
3370                              $mday, $months[$mon], $hour ,$min;
3371         $date{'iso-8601'}  = sprintf "%04d-%02d-%02dT%02d:%02d:%02dZ",
3372                              1900+$year, 1+$mon, $mday, $hour ,$min, $sec;
3373
3374         my ($tz_sign, $tz_hour, $tz_min) =
3375                 ($tz =~ m/^([-+])(\d\d)(\d\d)$/);
3376         $tz_sign = ($tz_sign eq '-' ? -1 : +1);
3377         my $local = $epoch + $tz_sign*((($tz_hour*60) + $tz_min)*60);
3378         ($sec, $min, $hour, $mday, $mon, $year, $wday, $yday) = gmtime($local);
3379         $date{'hour_local'} = $hour;
3380         $date{'minute_local'} = $min;
3381         $date{'tz_local'} = $tz;
3382         $date{'iso-tz'} = sprintf("%04d-%02d-%02d %02d:%02d:%02d %s",
3383                                   1900+$year, $mon+1, $mday,
3384                                   $hour, $min, $sec, $tz);
3385         return %date;
3386 }
3387
3388 sub parse_tag {
3389         my $tag_id = shift;
3390         my %tag;
3391         my @comment;
3392
3393         open my $fd, "-|", git_cmd(), "cat-file", "tag", $tag_id or return;
3394         $tag{'id'} = $tag_id;
3395         while (my $line = <$fd>) {
3396                 chomp $line;
3397                 if ($line =~ m/^object ([0-9a-fA-F]{40})$/) {
3398                         $tag{'object'} = $1;
3399                 } elsif ($line =~ m/^type (.+)$/) {
3400                         $tag{'type'} = $1;
3401                 } elsif ($line =~ m/^tag (.+)$/) {
3402                         $tag{'name'} = $1;
3403                 } elsif ($line =~ m/^tagger (.*) ([0-9]+) (.*)$/) {
3404                         $tag{'author'} = $1;
3405                         $tag{'author_epoch'} = $2;
3406                         $tag{'author_tz'} = $3;
3407                         if ($tag{'author'} =~ m/^([^<]+) <([^>]*)>/) {
3408                                 $tag{'author_name'}  = $1;
3409                                 $tag{'author_email'} = $2;
3410                         } else {
3411                                 $tag{'author_name'} = $tag{'author'};
3412                         }
3413                 } elsif ($line =~ m/--BEGIN/) {
3414                         push @comment, $line;
3415                         last;
3416                 } elsif ($line eq "") {
3417                         last;
3418                 }
3419         }
3420         push @comment, <$fd>;
3421         $tag{'comment'} = \@comment;
3422         close $fd or return;
3423         if (!defined $tag{'name'}) {
3424                 return
3425         };
3426         return %tag
3427 }
3428
3429 sub parse_commit_text {
3430         my ($commit_text, $withparents) = @_;
3431         my @commit_lines = split '\n', $commit_text;
3432         my %co;
3433
3434         pop @commit_lines; # Remove '\0'
3435
3436         if (! @commit_lines) {
3437                 return;
3438         }
3439
3440         my $header = shift @commit_lines;
3441         if ($header !~ m/^[0-9a-fA-F]{40}/) {
3442                 return;
3443         }
3444         ($co{'id'}, my @parents) = split ' ', $header;
3445         while (my $line = shift @commit_lines) {
3446                 last if $line eq "\n";
3447                 if ($line =~ m/^tree ([0-9a-fA-F]{40})$/) {
3448                         $co{'tree'} = $1;
3449                 } elsif ((!defined $withparents) && ($line =~ m/^parent ([0-9a-fA-F]{40})$/)) {
3450                         push @parents, $1;
3451                 } elsif ($line =~ m/^author (.*) ([0-9]+) (.*)$/) {
3452                         $co{'author'} = to_utf8($1);
3453                         $co{'author_epoch'} = $2;
3454                         $co{'author_tz'} = $3;
3455                         if ($co{'author'} =~ m/^([^<]+) <([^>]*)>/) {
3456                                 $co{'author_name'}  = $1;
3457                                 $co{'author_email'} = $2;
3458                         } else {
3459                                 $co{'author_name'} = $co{'author'};
3460                         }
3461                 } elsif ($line =~ m/^committer (.*) ([0-9]+) (.*)$/) {
3462                         $co{'committer'} = to_utf8($1);
3463                         $co{'committer_epoch'} = $2;
3464                         $co{'committer_tz'} = $3;
3465                         if ($co{'committer'} =~ m/^([^<]+) <([^>]*)>/) {
3466                                 $co{'committer_name'}  = $1;
3467                                 $co{'committer_email'} = $2;
3468                         } else {
3469                                 $co{'committer_name'} = $co{'committer'};
3470                         }
3471                 }
3472         }
3473         if (!defined $co{'tree'}) {
3474                 return;
3475         };
3476         $co{'parents'} = \@parents;
3477         $co{'parent'} = $parents[0];
3478
3479         foreach my $title (@commit_lines) {
3480                 $title =~ s/^    //;
3481                 if ($title ne "") {
3482                         $co{'title'} = chop_str($title, 80, 5);
3483                         # remove leading stuff of merges to make the interesting part visible
3484                         if (length($title) > 50) {
3485                                 $title =~ s/^Automatic //;
3486                                 $title =~ s/^merge (of|with) /Merge ... /i;
3487                                 if (length($title) > 50) {
3488                                         $title =~ s/(http|rsync):\/\///;
3489                                 }
3490                                 if (length($title) > 50) {
3491                                         $title =~ s/(master|www|rsync)\.//;
3492                                 }
3493                                 if (length($title) > 50) {
3494                                         $title =~ s/kernel.org:?//;
3495                                 }
3496                                 if (length($title) > 50) {
3497                                         $title =~ s/\/pub\/scm//;
3498                                 }
3499                         }
3500                         $co{'title_short'} = chop_str($title, 50, 5);
3501                         last;
3502                 }
3503         }
3504         if (! defined $co{'title'} || $co{'title'} eq "") {
3505                 $co{'title'} = $co{'title_short'} = '(no commit message)';
3506         }
3507         # remove added spaces
3508         foreach my $line (@commit_lines) {
3509                 $line =~ s/^    //;
3510         }
3511         $co{'comment'} = \@commit_lines;
3512
3513         my $age = time - $co{'committer_epoch'};
3514         $co{'age'} = $age;
3515         $co{'age_string'} = age_string($age);
3516         my ($sec, $min, $hour, $mday, $mon, $year, $wday, $yday) = gmtime($co{'committer_epoch'});
3517         if ($age > 60*60*24*7*2) {
3518                 $co{'age_string_date'} = sprintf "%4i-%02u-%02i", 1900 + $year, $mon+1, $mday;
3519                 $co{'age_string_age'} = $co{'age_string'};
3520         } else {
3521                 $co{'age_string_date'} = $co{'age_string'};
3522                 $co{'age_string_age'} = sprintf "%4i-%02u-%02i", 1900 + $year, $mon+1, $mday;
3523         }
3524         return %co;
3525 }
3526
3527 sub parse_commit {
3528         my ($commit_id) = @_;
3529         my %co;
3530
3531         local $/ = "\0";
3532
3533         open my $fd, "-|", git_cmd(), "rev-list",
3534                 "--parents",
3535                 "--header",
3536                 "--max-count=1",
3537                 $commit_id,
3538                 "--",
3539                 or die_error(500, "Open git-rev-list failed");
3540         %co = parse_commit_text(<$fd>, 1);
3541         close $fd;
3542
3543         return %co;
3544 }
3545
3546 sub parse_commits {
3547         my ($commit_id, $maxcount, $skip, $filename, @args) = @_;
3548         my @cos;
3549
3550         $maxcount ||= 1;
3551         $skip ||= 0;
3552
3553         local $/ = "\0";
3554
3555         open my $fd, "-|", git_cmd(), "rev-list",
3556                 "--header",
3557                 @args,
3558                 ("--max-count=" . $maxcount),
3559                 ("--skip=" . $skip),
3560                 @extra_options,
3561                 $commit_id,
3562                 "--",
3563                 ($filename ? ($filename) : ())
3564                 or die_error(500, "Open git-rev-list failed");
3565         while (my $line = <$fd>) {
3566                 my %co = parse_commit_text($line);
3567                 push @cos, \%co;
3568         }
3569         close $fd;
3570
3571         return wantarray ? @cos : \@cos;
3572 }
3573
3574 # parse line of git-diff-tree "raw" output
3575 sub parse_difftree_raw_line {
3576         my $line = shift;
3577         my %res;
3578
3579         # ':100644 100644 03b218260e99b78c6df0ed378e59ed9205ccc96d 3b93d5e7cc7f7dd4ebed13a5cc1a4ad976fc94d8 M   ls-files.c'
3580         # ':100644 100644 7f9281985086971d3877aca27704f2aaf9c448ce bc190ebc71bbd923f2b728e505408f5e54bd073a M   rev-tree.c'
3581         if ($line =~ m/^:([0-7]{6}) ([0-7]{6}) ([0-9a-fA-F]{40}) ([0-9a-fA-F]{40}) (.)([0-9]{0,3})\t(.*)$/) {
3582                 $res{'from_mode'} = $1;
3583                 $res{'to_mode'} = $2;
3584                 $res{'from_id'} = $3;
3585                 $res{'to_id'} = $4;
3586                 $res{'status'} = $5;
3587                 $res{'similarity'} = $6;
3588                 if ($res{'status'} eq 'R' || $res{'status'} eq 'C') { # renamed or copied
3589                         ($res{'from_file'}, $res{'to_file'}) = map { unquote($_) } split("\t", $7);
3590                 } else {
3591                         $res{'from_file'} = $res{'to_file'} = $res{'file'} = unquote($7);
3592                 }
3593         }
3594         # '::100755 100755 100755 60e79ca1b01bc8b057abe17ddab484699a7f5fdb 94067cc5f73388f33722d52ae02f44692bc07490 94067cc5f73388f33722d52ae02f44692bc07490 MR git-gui/git-gui.sh'
3595         # combined diff (for merge commit)
3596         elsif ($line =~ s/^(::+)((?:[0-7]{6} )+)((?:[0-9a-fA-F]{40} )+)([a-zA-Z]+)\t(.*)$//) {
3597                 $res{'nparents'}  = length($1);
3598                 $res{'from_mode'} = [ split(' ', $2) ];
3599                 $res{'to_mode'} = pop @{$res{'from_mode'}};
3600                 $res{'from_id'} = [ split(' ', $3) ];
3601                 $res{'to_id'} = pop @{$res{'from_id'}};
3602                 $res{'status'} = [ split('', $4) ];
3603                 $res{'to_file'} = unquote($5);
3604         }
3605         # 'c512b523472485aef4fff9e57b229d9d243c967f'
3606         elsif ($line =~ m/^([0-9a-fA-F]{40})$/) {
3607                 $res{'commit'} = $1;
3608         }
3609
3610         return wantarray ? %res : \%res;
3611 }
3612
3613 # wrapper: return parsed line of git-diff-tree "raw" output
3614 # (the argument might be raw line, or parsed info)
3615 sub parsed_difftree_line {
3616         my $line_or_ref = shift;
3617
3618         if (ref($line_or_ref) eq "HASH") {
3619                 # pre-parsed (or generated by hand)
3620                 return $line_or_ref;
3621         } else {
3622                 return parse_difftree_raw_line($line_or_ref);
3623         }
3624 }
3625
3626 # parse line of git-ls-tree output
3627 sub parse_ls_tree_line {
3628         my $line = shift;
3629         my %opts = @_;
3630         my %res;
3631
3632         if ($opts{'-l'}) {
3633                 #'100644 blob 0fa3f3a66fb6a137f6ec2c19351ed4d807070ffa   16717  panic.c'
3634                 $line =~ m/^([0-9]+) (.+) ([0-9a-fA-F]{40}) +(-|[0-9]+)\t(.+)$/s;
3635
3636                 $res{'mode'} = $1;
3637                 $res{'type'} = $2;
3638                 $res{'hash'} = $3;
3639                 $res{'size'} = $4;
3640                 if ($opts{'-z'}) {
3641                         $res{'name'} = $5;
3642                 } else {
3643                         $res{'name'} = unquote($5);
3644                 }
3645         } else {
3646                 #'100644 blob 0fa3f3a66fb6a137f6ec2c19351ed4d807070ffa  panic.c'
3647                 $line =~ m/^([0-9]+) (.+) ([0-9a-fA-F]{40})\t(.+)$/s;
3648
3649                 $res{'mode'} = $1;
3650                 $res{'type'} = $2;
3651                 $res{'hash'} = $3;
3652                 if ($opts{'-z'}) {
3653                         $res{'name'} = $4;
3654                 } else {
3655                         $res{'name'} = unquote($4);
3656                 }
3657         }
3658
3659         return wantarray ? %res : \%res;
3660 }
3661
3662 # generates _two_ hashes, references to which are passed as 2 and 3 argument
3663 sub parse_from_to_diffinfo {
3664         my ($diffinfo, $from, $to, @parents) = @_;
3665
3666         if ($diffinfo->{'nparents'}) {
3667                 # combined diff
3668                 $from->{'file'} = [];
3669                 $from->{'href'} = [];
3670                 fill_from_file_info($diffinfo, @parents)
3671                         unless exists $diffinfo->{'from_file'};
3672                 for (my $i = 0; $i < $diffinfo->{'nparents'}; $i++) {
3673                         $from->{'file'}[$i] =
3674                                 defined $diffinfo->{'from_file'}[$i] ?
3675                                         $diffinfo->{'from_file'}[$i] :
3676                                         $diffinfo->{'to_file'};
3677                         if ($diffinfo->{'status'}[$i] ne "A") { # not new (added) file
3678                                 $from->{'href'}[$i] = href(action=>"blob",
3679                                                            hash_base=>$parents[$i],
3680                                                            hash=>$diffinfo->{'from_id'}[$i],
3681                                                            file_name=>$from->{'file'}[$i]);
3682                         } else {
3683                                 $from->{'href'}[$i] = undef;
3684                         }
3685                 }
3686         } else {
3687                 # ordinary (not combined) diff
3688                 $from->{'file'} = $diffinfo->{'from_file'};
3689                 if ($diffinfo->{'status'} ne "A") { # not new (added) file
3690                         $from->{'href'} = href(action=>"blob", hash_base=>$hash_parent,
3691                                                hash=>$diffinfo->{'from_id'},
3692                                                file_name=>$from->{'file'});
3693                 } else {
3694                         delete $from->{'href'};
3695                 }
3696         }
3697
3698         $to->{'file'} = $diffinfo->{'to_file'};
3699         if (!is_deleted($diffinfo)) { # file exists in result
3700                 $to->{'href'} = href(action=>"blob", hash_base=>$hash,
3701                                      hash=>$diffinfo->{'to_id'},
3702                                      file_name=>$to->{'file'});
3703         } else {
3704                 delete $to->{'href'};
3705         }
3706 }
3707
3708 ## ......................................................................
3709 ## parse to array of hashes functions
3710
3711 sub git_get_heads_list {
3712         my ($limit, @classes) = @_;
3713         @classes = get_branch_refs() unless @classes;
3714         my @patterns = map { "refs/$_" } @classes;
3715         my @headslist;
3716
3717         open my $fd, '-|', git_cmd(), 'for-each-ref',
3718                 ($limit ? '--count='.($limit+1) : ()), '--sort=-committerdate',
3719                 '--format=%(objectname) %(refname) %(subject)%00%(committer)',
3720                 @patterns
3721                 or return;
3722         while (my $line = <$fd>) {
3723                 my %ref_item;
3724
3725                 chomp $line;
3726                 my ($refinfo, $committerinfo) = split(/\0/, $line);
3727                 my ($hash, $name, $title) = split(' ', $refinfo, 3);
3728                 my ($committer, $epoch, $tz) =
3729                         ($committerinfo =~ /^(.*) ([0-9]+) (.*)$/);
3730                 $ref_item{'fullname'}  = $name;
3731                 my $strip_refs = join '|', map { quotemeta } get_branch_refs();
3732                 $name =~ s!^refs/($strip_refs|remotes)/!!;
3733
3734                 $ref_item{'name'}  = $name;
3735                 $ref_item{'id'}    = $hash;
3736                 $ref_item{'title'} = $title || '(no commit message)';
3737                 $ref_item{'epoch'} = $epoch;
3738                 if ($epoch) {
3739                         $ref_item{'age'} = age_string(time - $ref_item{'epoch'});
3740                 } else {
3741                         $ref_item{'age'} = "unknown";
3742                 }
3743
3744                 push @headslist, \%ref_item;
3745         }
3746         close $fd;
3747
3748         return wantarray ? @headslist : \@headslist;
3749 }
3750
3751 sub git_get_tags_list {
3752         my $limit = shift;
3753         my @tagslist;
3754
3755         open my $fd, '-|', git_cmd(), 'for-each-ref',
3756                 ($limit ? '--count='.($limit+1) : ()), '--sort=-creatordate',
3757                 '--format=%(objectname) %(objecttype) %(refname) '.
3758                 '%(*objectname) %(*objecttype) %(subject)%00%(creator)',
3759                 'refs/tags'
3760                 or return;
3761         while (my $line = <$fd>) {
3762                 my %ref_item;
3763
3764                 chomp $line;
3765                 my ($refinfo, $creatorinfo) = split(/\0/, $line);
3766                 my ($id, $type, $name, $refid, $reftype, $title) = split(' ', $refinfo, 6);
3767                 my ($creator, $epoch, $tz) =
3768                         ($creatorinfo =~ /^(.*) ([0-9]+) (.*)$/);
3769                 $ref_item{'fullname'} = $name;
3770                 $name =~ s!^refs/tags/!!;
3771
3772                 $ref_item{'type'} = $type;
3773                 $ref_item{'id'} = $id;
3774                 $ref_item{'name'} = $name;
3775                 if ($type eq "tag") {
3776                         $ref_item{'subject'} = $title;
3777                         $ref_item{'reftype'} = $reftype;
3778                         $ref_item{'refid'}   = $refid;
3779                 } else {
3780                         $ref_item{'reftype'} = $type;
3781                         $ref_item{'refid'}   = $id;
3782                 }
3783
3784                 if ($type eq "tag" || $type eq "commit") {
3785                         $ref_item{'epoch'} = $epoch;
3786                         if ($epoch) {
3787                                 $ref_item{'age'} = age_string(time - $ref_item{'epoch'});
3788                         } else {
3789                                 $ref_item{'age'} = "unknown";
3790                         }
3791                 }
3792
3793                 push @tagslist, \%ref_item;
3794         }
3795         close $fd;
3796
3797         return wantarray ? @tagslist : \@tagslist;
3798 }
3799
3800 ## ----------------------------------------------------------------------
3801 ## filesystem-related functions
3802
3803 sub get_file_owner {
3804         my $path = shift;
3805
3806         my ($dev, $ino, $mode, $nlink, $st_uid, $st_gid, $rdev, $size) = stat($path);
3807         my ($name, $passwd, $uid, $gid, $quota, $comment, $gcos, $dir, $shell) = getpwuid($st_uid);
3808         if (!defined $gcos) {
3809                 return undef;
3810         }
3811         my $owner = $gcos;
3812         $owner =~ s/[,;].*$//;
3813         return to_utf8($owner);
3814 }
3815
3816 # assume that file exists
3817 sub insert_file {
3818         my $filename = shift;
3819
3820         open my $fd, '<', $filename;
3821         print map { to_utf8($_) } <$fd>;
3822         close $fd;
3823 }
3824
3825 ## ......................................................................
3826 ## mimetype related functions
3827
3828 sub mimetype_guess_file {
3829         my $filename = shift;
3830         my $mimemap = shift;
3831         -r $mimemap or return undef;
3832
3833         my %mimemap;
3834         open(my $mh, '<', $mimemap) or return undef;
3835         while (<$mh>) {
3836                 next if m/^#/; # skip comments
3837                 my ($mimetype, @exts) = split(/\s+/);
3838                 foreach my $ext (@exts) {
3839                         $mimemap{$ext} = $mimetype;
3840                 }
3841         }
3842         close($mh);
3843
3844         $filename =~ /\.([^.]*)$/;
3845         return $mimemap{$1};
3846 }
3847
3848 sub mimetype_guess {
3849         my $filename = shift;
3850         my $mime;
3851         $filename =~ /\./ or return undef;
3852
3853         if ($mimetypes_file) {
3854                 my $file = $mimetypes_file;
3855                 if ($file !~ m!^/!) { # if it is relative path
3856                         # it is relative to project
3857                         $file = "$projectroot/$project/$file";
3858                 }
3859                 $mime = mimetype_guess_file($filename, $file);
3860         }
3861         $mime ||= mimetype_guess_file($filename, '/etc/mime.types');
3862         return $mime;
3863 }
3864
3865 sub blob_mimetype {
3866         my $fd = shift;
3867         my $filename = shift;
3868
3869         if ($filename) {
3870                 my $mime = mimetype_guess($filename);
3871                 $mime and return $mime;
3872         }
3873
3874         # just in case
3875         return $default_blob_plain_mimetype unless $fd;
3876
3877         if (-T $fd) {
3878                 return 'text/plain';
3879         } elsif (! $filename) {
3880                 return 'application/octet-stream';
3881         } elsif ($filename =~ m/\.png$/i) {
3882                 return 'image/png';
3883         } elsif ($filename =~ m/\.gif$/i) {
3884                 return 'image/gif';
3885         } elsif ($filename =~ m/\.jpe?g$/i) {
3886                 return 'image/jpeg';
3887         } else {
3888                 return 'application/octet-stream';
3889         }
3890 }
3891
3892 sub blob_contenttype {
3893         my ($fd, $file_name, $type) = @_;
3894
3895         $type ||= blob_mimetype($fd, $file_name);
3896         if ($type eq 'text/plain' && defined $default_text_plain_charset) {
3897                 $type .= "; charset=$default_text_plain_charset";
3898         }
3899
3900         return $type;
3901 }
3902
3903 # guess file syntax for syntax highlighting; return undef if no highlighting
3904 # the name of syntax can (in the future) depend on syntax highlighter used
3905 sub guess_file_syntax {
3906         my ($highlight, $mimetype, $file_name) = @_;
3907         return undef unless ($highlight && defined $file_name);
3908         my $basename = basename($file_name, '.in');
3909         return $highlight_basename{$basename}
3910                 if exists $highlight_basename{$basename};
3911
3912         $basename =~ /\.([^.]*)$/;
3913         my $ext = $1 or return undef;
3914         return $highlight_ext{$ext}
3915                 if exists $highlight_ext{$ext};
3916
3917         return undef;
3918 }
3919
3920 # run highlighter and return FD of its output,
3921 # or return original FD if no highlighting
3922 sub run_highlighter {
3923         my ($fd, $highlight, $syntax) = @_;
3924         return $fd unless ($highlight && defined $syntax);
3925
3926         close $fd;
3927         open $fd, quote_command(git_cmd(), "cat-file", "blob", $hash)." | ".
3928                   quote_command($highlight_bin).
3929                   " --replace-tabs=8 --fragment --syntax $syntax |"
3930                 or die_error(500, "Couldn't open file or run syntax highlighter");
3931         return $fd;
3932 }
3933
3934 ## ======================================================================
3935 ## functions printing HTML: header, footer, error page
3936
3937 sub get_page_title {
3938         my $title = to_utf8($site_name);
3939
3940         unless (defined $project) {
3941                 if (defined $project_filter) {
3942                         $title .= " - projects in '" . esc_path($project_filter) . "'";
3943                 }
3944                 return $title;
3945         }
3946         $title .= " - " . to_utf8($project);
3947
3948         return $title unless (defined $action);
3949         $title .= "/$action"; # $action is US-ASCII (7bit ASCII)
3950
3951         return $title unless (defined $file_name);
3952         $title .= " - " . esc_path($file_name);
3953         if ($action eq "tree" && $file_name !~ m|/$|) {
3954                 $title .= "/";
3955         }
3956
3957         return $title;
3958 }
3959
3960 sub get_content_type_html {
3961         # require explicit support from the UA if we are to send the page as
3962         # 'application/xhtml+xml', otherwise send it as plain old 'text/html'.
3963         # we have to do this because MSIE sometimes globs '*/*', pretending to
3964         # support xhtml+xml but choking when it gets what it asked for.
3965         if (defined $cgi->http('HTTP_ACCEPT') &&
3966             $cgi->http('HTTP_ACCEPT') =~ m/(,|;|\s|^)application\/xhtml\+xml(,|;|\s|$)/ &&
3967             $cgi->Accept('application/xhtml+xml') != 0) {
3968                 return 'application/xhtml+xml';
3969         } else {
3970                 return 'text/html';
3971         }
3972 }
3973
3974 sub print_feed_meta {
3975         if (defined $project) {
3976                 my %href_params = get_feed_info();
3977                 if (!exists $href_params{'-title'}) {
3978                         $href_params{'-title'} = 'log';
3979                 }
3980
3981                 foreach my $format (qw(RSS Atom)) {
3982                         my $type = lc($format);
3983                         my %link_attr = (
3984                                 '-rel' => 'alternate',
3985                                 '-title' => esc_attr("$project - $href_params{'-title'} - $format feed"),
3986                                 '-type' => "application/$type+xml"
3987                         );
3988
3989                         $href_params{'extra_options'} = undef;
3990                         $href_params{'action'} = $type;
3991                         $link_attr{'-href'} = href(%href_params);
3992                         print "<link ".
3993                               "rel=\"$link_attr{'-rel'}\" ".
3994                               "title=\"$link_attr{'-title'}\" ".
3995                               "href=\"$link_attr{'-href'}\" ".
3996                               "type=\"$link_attr{'-type'}\" ".
3997                               "/>\n";
3998
3999                         $href_params{'extra_options'} = '--no-merges';
4000                         $link_attr{'-href'} = href(%href_params);
4001                         $link_attr{'-title'} .= ' (no merges)';
4002                         print "<link ".
4003                               "rel=\"$link_attr{'-rel'}\" ".
4004                               "title=\"$link_attr{'-title'}\" ".
4005                               "href=\"$link_attr{'-href'}\" ".
4006                               "type=\"$link_attr{'-type'}\" ".
4007                               "/>\n";
4008                 }
4009
4010         } else {
4011                 printf('<link rel="alternate" title="%s projects list" '.
4012                        'href="%s" type="text/plain; charset=utf-8" />'."\n",
4013                        esc_attr($site_name), href(project=>undef, action=>"project_index"));
4014                 printf('<link rel="alternate" title="%s projects feeds" '.
4015                        'href="%s" type="text/x-opml" />'."\n",
4016                        esc_attr($site_name), href(project=>undef, action=>"opml"));
4017         }
4018 }
4019
4020 sub print_header_links {
4021         my $status = shift;
4022
4023         # print out each stylesheet that exist, providing backwards capability
4024         # for those people who defined $stylesheet in a config file
4025         if (defined $stylesheet) {
4026                 print '<link rel="stylesheet" type="text/css" href="'.esc_url($stylesheet).'"/>'."\n";
4027         } else {
4028                 foreach my $stylesheet (@stylesheets) {
4029                         next unless $stylesheet;
4030                         print '<link rel="stylesheet" type="text/css" href="'.esc_url($stylesheet).'"/>'."\n";
4031                 }
4032         }
4033         print_feed_meta()
4034                 if ($status eq '200 OK');
4035         if (defined $favicon) {
4036                 print qq(<link rel="shortcut icon" href=").esc_url($favicon).qq(" type="image/png" />\n);
4037         }
4038 }
4039
4040 sub print_nav_breadcrumbs_path {
4041         my $dirprefix = undef;
4042         while (my $part = shift) {
4043                 $dirprefix .= "/" if defined $dirprefix;
4044                 $dirprefix .= $part;
4045                 print $cgi->a({-href => href(project => undef,
4046                                              project_filter => $dirprefix,
4047                                              action => "project_list")},
4048                               esc_html($part)) . " / ";
4049         }
4050 }
4051
4052 sub print_nav_breadcrumbs {
4053         my %opts = @_;
4054
4055         for my $crumb (@extra_breadcrumbs, [ $home_link_str => $home_link ]) {
4056                 print $cgi->a({-href => esc_url($crumb->[1])}, $crumb->[0]) . " / ";
4057         }
4058         if (defined $project) {
4059                 my @dirname = split '/', $project;
4060                 my $projectbasename = pop @dirname;
4061                 print_nav_breadcrumbs_path(@dirname);
4062                 print $cgi->a({-href => href(action=>"summary")}, esc_html($projectbasename));
4063                 if (defined $action) {
4064                         my $action_print = $action ;
4065                         if (defined $opts{-action_extra}) {
4066                                 $action_print = $cgi->a({-href => href(action=>$action)},
4067                                         $action);
4068                         }
4069                         print " / $action_print";
4070                 }
4071                 if (defined $opts{-action_extra}) {
4072                         print " / $opts{-action_extra}";
4073                 }
4074                 print "\n";
4075         } elsif (defined $project_filter) {
4076                 print_nav_breadcrumbs_path(split '/', $project_filter);
4077         }
4078 }
4079
4080 sub print_search_form {
4081         if (!defined $searchtext) {
4082                 $searchtext = "";
4083         }
4084         my $search_hash;
4085         if (defined $hash_base) {
4086                 $search_hash = $hash_base;
4087         } elsif (defined $hash) {
4088                 $search_hash = $hash;
4089         } else {
4090                 $search_hash = "HEAD";
4091         }
4092         my $action = $my_uri;
4093         my $use_pathinfo = gitweb_check_feature('pathinfo');
4094         if ($use_pathinfo) {
4095                 $action .= "/".esc_url($project);
4096         }
4097         print $cgi->startform(-method => "get", -action => $action) .
4098               "<div class=\"search\">\n" .
4099               (!$use_pathinfo &&
4100               $cgi->input({-name=>"p", -value=>$project, -type=>"hidden"}) . "\n") .
4101               $cgi->input({-name=>"a", -value=>"search", -type=>"hidden"}) . "\n" .
4102               $cgi->input({-name=>"h", -value=>$search_hash, -type=>"hidden"}) . "\n" .
4103               $cgi->popup_menu(-name => 'st', -default => 'commit',
4104                                -values => ['commit', 'grep', 'author', 'committer', 'pickaxe']) .
4105               " " . $cgi->a({-href => href(action=>"search_help"),
4106                              -title => "search help" }, "?") . " search:\n",
4107               $cgi->textfield(-name => "s", -value => $searchtext, -override => 1) . "\n" .
4108               "<span title=\"Extended regular expression\">" .
4109               $cgi->checkbox(-name => 'sr', -value => 1, -label => 're',
4110                              -checked => $search_use_regexp) .
4111               "</span>" .
4112               "</div>" .
4113               $cgi->end_form() . "\n";
4114 }
4115
4116 sub git_header_html {
4117         my $status = shift || "200 OK";
4118         my $expires = shift;
4119         my %opts = @_;
4120
4121         my $title = get_page_title();
4122         my $content_type = get_content_type_html();
4123         print $cgi->header(-type=>$content_type, -charset => 'utf-8',
4124                            -status=> $status, -expires => $expires)
4125                 unless ($opts{'-no_http_header'});
4126         my $mod_perl_version = $ENV{'MOD_PERL'} ? " $ENV{'MOD_PERL'}" : '';
4127         print <<EOF;
4128 <?xml version="1.0" encoding="utf-8"?>
4129 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
4130 <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en-US" lang="en-US">
4131 <!-- git web interface version $version, (C) 2005-2006, Kay Sievers <kay.sievers\@vrfy.org>, Christian Gierke -->
4132 <!-- git core binaries version $git_version -->
4133 <head>
4134 <meta http-equiv="content-type" content="$content_type; charset=utf-8"/>
4135 <meta name="generator" content="gitweb/$version git/$git_version$mod_perl_version"/>
4136 <meta name="robots" content="index, nofollow"/>
4137 <title>$title</title>
4138 EOF
4139         # the stylesheet, favicon etc urls won't work correctly with path_info
4140         # unless we set the appropriate base URL
4141         if ($ENV{'PATH_INFO'}) {
4142                 print "<base href=\"".esc_url($base_url)."\" />\n";
4143         }
4144         print_header_links($status);
4145
4146         if (defined $site_html_head_string) {
4147                 print to_utf8($site_html_head_string);
4148         }
4149
4150         print "</head>\n" .
4151               "<body>\n";
4152
4153         if (defined $site_header && -f $site_header) {
4154                 insert_file($site_header);
4155         }
4156
4157         print "<div class=\"page_header\">\n";
4158         if (defined $logo) {
4159                 print $cgi->a({-href => esc_url($logo_url),
4160                                -title => $logo_label},
4161                               $cgi->img({-src => esc_url($logo),
4162                                          -width => 72, -height => 27,
4163                                          -alt => "git",
4164                                          -class => "logo"}));
4165         }
4166         print_nav_breadcrumbs(%opts);
4167         print "</div>\n";
4168
4169         my $have_search = gitweb_check_feature('search');
4170         if (defined $project && $have_search) {
4171                 print_search_form();
4172         }
4173 }
4174
4175 sub git_footer_html {
4176         my $feed_class = 'rss_logo';
4177
4178         print "<div class=\"page_footer\">\n";
4179         if (defined $project) {
4180                 my $descr = git_get_project_description($project);
4181                 if (defined $descr) {
4182                         print "<div class=\"page_footer_text\">" . esc_html($descr) . "</div>\n";
4183                 }
4184
4185                 my %href_params = get_feed_info();
4186                 if (!%href_params) {
4187                         $feed_class .= ' generic';
4188                 }
4189                 $href_params{'-title'} ||= 'log';
4190
4191                 foreach my $format (qw(RSS Atom)) {
4192                         $href_params{'action'} = lc($format);
4193                         print $cgi->a({-href => href(%href_params),
4194                                       -title => "$href_params{'-title'} $format feed",
4195                                       -class => $feed_class}, $format)."\n";
4196                 }
4197
4198         } else {
4199                 print $cgi->a({-href => href(project=>undef, action=>"opml",
4200                                              project_filter => $project_filter),
4201                               -class => $feed_class}, "OPML") . " ";
4202                 print $cgi->a({-href => href(project=>undef, action=>"project_index",
4203                                              project_filter => $project_filter),
4204                               -class => $feed_class}, "TXT") . "\n";
4205         }
4206         print "</div>\n"; # class="page_footer"
4207
4208         if (defined $t0 && gitweb_check_feature('timed')) {
4209                 print "<div id=\"generating_info\">\n";
4210                 print 'This page took '.
4211                       '<span id="generating_time" class="time_span">'.
4212                       tv_interval($t0, [ gettimeofday() ]).
4213                       ' seconds </span>'.
4214                       ' and '.
4215                       '<span id="generating_cmd">'.
4216                       $number_of_git_cmds.
4217                       '</span> git commands '.
4218                       " to generate.\n";
4219                 print "</div>\n"; # class="page_footer"
4220         }
4221
4222         if (defined $site_footer && -f $site_footer) {
4223                 insert_file($site_footer);
4224         }
4225
4226         print qq!<script type="text/javascript" src="!.esc_url($javascript).qq!"></script>\n!;
4227         if (defined $action &&
4228             $action eq 'blame_incremental') {
4229                 print qq!<script type="text/javascript">\n!.
4230                       qq!startBlame("!. href(action=>"blame_data", -replay=>1) .qq!",\n!.
4231                       qq!           "!. href() .qq!");\n!.
4232                       qq!</script>\n!;
4233         } else {
4234                 my ($jstimezone, $tz_cookie, $datetime_class) =
4235                         gitweb_get_feature('javascript-timezone');
4236
4237                 print qq!<script type="text/javascript">\n!.
4238                       qq!window.onload = function () {\n!;
4239                 if (gitweb_check_feature('javascript-actions')) {
4240                         print qq!       fixLinks();\n!;
4241                 }
4242                 if ($jstimezone && $tz_cookie && $datetime_class) {
4243                         print qq!       var tz_cookie = { name: '$tz_cookie', expires: 14, path: '/' };\n!. # in days
4244                               qq!       onloadTZSetup('$jstimezone', tz_cookie, '$datetime_class');\n!;
4245                 }
4246                 print qq!};\n!.
4247                       qq!</script>\n!;
4248         }
4249
4250         print "</body>\n" .
4251               "</html>";
4252 }
4253
4254 # die_error(<http_status_code>, <error_message>[, <detailed_html_description>])
4255 # Example: die_error(404, 'Hash not found')
4256 # By convention, use the following status codes (as defined in RFC 2616):
4257 # 400: Invalid or missing CGI parameters, or
4258 #      requested object exists but has wrong type.
4259 # 403: Requested feature (like "pickaxe" or "snapshot") not enabled on
4260 #      this server or project.
4261 # 404: Requested object/revision/project doesn't exist.
4262 # 500: The server isn't configured properly, or
4263 #      an internal error occurred (e.g. failed assertions caused by bugs), or
4264 #      an unknown error occurred (e.g. the git binary died unexpectedly).
4265 # 503: The server is currently unavailable (because it is overloaded,
4266 #      or down for maintenance).  Generally, this is a temporary state.
4267 sub die_error {
4268         my $status = shift || 500;
4269         my $error = esc_html(shift) || "Internal Server Error";
4270         my $extra = shift;
4271         my %opts = @_;
4272
4273         my %http_responses = (
4274                 400 => '400 Bad Request',
4275                 403 => '403 Forbidden',
4276                 404 => '404 Not Found',
4277                 500 => '500 Internal Server Error',
4278                 503 => '503 Service Unavailable',
4279         );
4280         git_header_html($http_responses{$status}, undef, %opts);
4281         print <<EOF;
4282 <div class="page_body">
4283 <br /><br />
4284 $status - $error
4285 <br />
4286 EOF
4287         if (defined $extra) {
4288                 print "<hr />\n" .
4289                       "$extra\n";
4290         }
4291         print "</div>\n";
4292
4293         git_footer_html();
4294         goto DONE_GITWEB
4295                 unless ($opts{'-error_handler'});
4296 }
4297
4298 ## ----------------------------------------------------------------------
4299 ## functions printing or outputting HTML: navigation
4300
4301 sub git_print_page_nav {
4302         my ($current, $suppress, $head, $treehead, $treebase, $extra) = @_;
4303         $extra = '' if !defined $extra; # pager or formats
4304
4305         my @navs = qw(summary shortlog log commit commitdiff tree);
4306         if ($suppress) {
4307                 @navs = grep { $_ ne $suppress } @navs;
4308         }
4309
4310         my %arg = map { $_ => {action=>$_} } @navs;
4311         if (defined $head) {
4312                 for (qw(commit commitdiff)) {
4313                         $arg{$_}{'hash'} = $head;
4314                 }
4315                 if ($current =~ m/^(tree | log | shortlog | commit | commitdiff | search)$/x) {
4316                         for (qw(shortlog log)) {
4317                                 $arg{$_}{'hash'} = $head;
4318                         }
4319                 }
4320         }
4321
4322         $arg{'tree'}{'hash'} = $treehead if defined $treehead;
4323         $arg{'tree'}{'hash_base'} = $treebase if defined $treebase;
4324
4325         my @actions = gitweb_get_feature('actions');
4326         my %repl = (
4327                 '%' => '%',
4328                 'n' => $project,         # project name
4329                 'f' => $git_dir,         # project path within filesystem
4330                 'h' => $treehead || '',  # current hash ('h' parameter)
4331                 'b' => $treebase || '',  # hash base ('hb' parameter)
4332         );
4333         while (@actions) {
4334                 my ($label, $link, $pos) = splice(@actions,0,3);
4335                 # insert
4336                 @navs = map { $_ eq $pos ? ($_, $label) : $_ } @navs;
4337                 # munch munch
4338                 $link =~ s/%([%nfhb])/$repl{$1}/g;
4339                 $arg{$label}{'_href'} = $link;
4340         }
4341
4342         print "<div class=\"page_nav\">\n" .
4343                 (join " | ",
4344                  map { $_ eq $current ?
4345                        $_ : $cgi->a({-href => ($arg{$_}{_href} ? $arg{$_}{_href} : href(%{$arg{$_}}))}, "$_")
4346                  } @navs);
4347         print "<br/>\n$extra<br/>\n" .
4348               "</div>\n";
4349 }
4350
4351 # returns a submenu for the nagivation of the refs views (tags, heads,
4352 # remotes) with the current view disabled and the remotes view only
4353 # available if the feature is enabled
4354 sub format_ref_views {
4355         my ($current) = @_;
4356         my @ref_views = qw{tags heads};
4357         push @ref_views, 'remotes' if gitweb_check_feature('remote_heads');
4358         return join " | ", map {
4359                 $_ eq $current ? $_ :
4360                 $cgi->a({-href => href(action=>$_)}, $_)
4361         } @ref_views
4362 }
4363
4364 sub format_paging_nav {
4365         my ($action, $page, $has_next_link) = @_;
4366         my $paging_nav;
4367
4368
4369         if ($page > 0) {
4370                 $paging_nav .=
4371                         $cgi->a({-href => href(-replay=>1, page=>undef)}, "first") .
4372                         " &sdot; " .
4373                         $cgi->a({-href => href(-replay=>1, page=>$page-1),
4374                                  -accesskey => "p", -title => "Alt-p"}, "prev");
4375         } else {
4376                 $paging_nav .= "first &sdot; prev";
4377         }
4378
4379         if ($has_next_link) {
4380                 $paging_nav .= " &sdot; " .
4381                         $cgi->a({-href => href(-replay=>1, page=>$page+1),
4382                                  -accesskey => "n", -title => "Alt-n"}, "next");
4383         } else {
4384                 $paging_nav .= " &sdot; next";
4385         }
4386
4387         return $paging_nav;
4388 }
4389
4390 ## ......................................................................
4391 ## functions printing or outputting HTML: div
4392
4393 sub git_print_header_div {
4394         my ($action, $title, $hash, $hash_base) = @_;
4395         my %args = ();
4396
4397         $args{'action'} = $action;
4398         $args{'hash'} = $hash if $hash;
4399         $args{'hash_base'} = $hash_base if $hash_base;
4400
4401         print "<div class=\"header\">\n" .
4402               $cgi->a({-href => href(%args), -class => "title"},
4403               $title ? $title : $action) .
4404               "\n</div>\n";
4405 }
4406
4407 sub format_repo_url {
4408         my ($name, $url) = @_;
4409         return "<tr class=\"metadata_url\"><td>$name</td><td>$url</td></tr>\n";
4410 }
4411
4412 # Group output by placing it in a DIV element and adding a header.
4413 # Options for start_div() can be provided by passing a hash reference as the
4414 # first parameter to the function.
4415 # Options to git_print_header_div() can be provided by passing an array
4416 # reference. This must follow the options to start_div if they are present.
4417 # The content can be a scalar, which is output as-is, a scalar reference, which
4418 # is output after html escaping, an IO handle passed either as *handle or
4419 # *handle{IO}, or a function reference. In the latter case all following
4420 # parameters will be taken as argument to the content function call.
4421 sub git_print_section {
4422         my ($div_args, $header_args, $content);
4423         my $arg = shift;
4424         if (ref($arg) eq 'HASH') {
4425                 $div_args = $arg;
4426                 $arg = shift;
4427         }
4428         if (ref($arg) eq 'ARRAY') {
4429                 $header_args = $arg;
4430                 $arg = shift;
4431         }
4432         $content = $arg;
4433
4434         print $cgi->start_div($div_args);
4435         git_print_header_div(@$header_args);
4436
4437         if (ref($content) eq 'CODE') {
4438                 $content->(@_);
4439         } elsif (ref($content) eq 'SCALAR') {
4440                 print esc_html($$content);
4441         } elsif (ref($content) eq 'GLOB' or ref($content) eq 'IO::Handle') {
4442                 print <$content>;
4443         } elsif (!ref($content) && defined($content)) {
4444                 print $content;
4445         }
4446
4447         print $cgi->end_div;
4448 }
4449
4450 sub format_timestamp_html {
4451         my $date = shift;
4452         my $strtime = $date->{'rfc2822'};
4453
4454         my (undef, undef, $datetime_class) =
4455                 gitweb_get_feature('javascript-timezone');
4456         if ($datetime_class) {
4457                 $strtime = qq!<span class="$datetime_class">$strtime</span>!;
4458         }
4459
4460         my $localtime_format = '(%02d:%02d %s)';
4461         if ($date->{'hour_local'} < 6) {
4462                 $localtime_format = '(<span class="atnight">%02d:%02d</span> %s)';
4463         }
4464         $strtime .= ' ' .
4465                     sprintf($localtime_format,
4466                             $date->{'hour_local'}, $date->{'minute_local'}, $date->{'tz_local'});
4467
4468         return $strtime;
4469 }
4470
4471 # Outputs the author name and date in long form
4472 sub git_print_authorship {
4473         my $co = shift;
4474         my %opts = @_;
4475         my $tag = $opts{-tag} || 'div';
4476         my $author = $co->{'author_name'};
4477
4478         my %ad = parse_date($co->{'author_epoch'}, $co->{'author_tz'});
4479         print "<$tag class=\"author_date\">" .
4480               format_search_author($author, "author", esc_html($author)) .
4481               " [".format_timestamp_html(\%ad)."]".
4482               git_get_avatar($co->{'author_email'}, -pad_before => 1) .
4483               "</$tag>\n";
4484 }
4485
4486 # Outputs table rows containing the full author or committer information,
4487 # in the format expected for 'commit' view (& similar).
4488 # Parameters are a commit hash reference, followed by the list of people
4489 # to output information for. If the list is empty it defaults to both
4490 # author and committer.
4491 sub git_print_authorship_rows {
4492         my $co = shift;
4493         # too bad we can't use @people = @_ || ('author', 'committer')
4494         my @people = @_;
4495         @people = ('author', 'committer') unless @people;
4496         foreach my $who (@people) {
4497                 my %wd = parse_date($co->{"${who}_epoch"}, $co->{"${who}_tz"});
4498                 print "<tr><td>$who</td><td>" .
4499                       format_search_author($co->{"${who}_name"}, $who,
4500                                            esc_html($co->{"${who}_name"})) . " " .
4501                       format_search_author($co->{"${who}_email"}, $who,
4502                                            esc_html("<" . $co->{"${who}_email"} . ">")) .
4503                       "</td><td rowspan=\"2\">" .
4504                       git_get_avatar($co->{"${who}_email"}, -size => 'double') .
4505                       "</td></tr>\n" .
4506                       "<tr>" .
4507                       "<td></td><td>" .
4508                       format_timestamp_html(\%wd) .
4509                       "</td>" .
4510                       "</tr>\n";
4511         }
4512 }
4513
4514 sub git_print_page_path {
4515         my $name = shift;
4516         my $type = shift;
4517         my $hb = shift;
4518
4519
4520         print "<div class=\"page_path\">";
4521         print $cgi->a({-href => href(action=>"tree", hash_base=>$hb),
4522                       -title => 'tree root'}, to_utf8("[$project]"));
4523         print " / ";
4524         if (defined $name) {
4525                 my @dirname = split '/', $name;
4526                 my $basename = pop @dirname;
4527                 my $fullname = '';
4528
4529                 foreach my $dir (@dirname) {
4530                         $fullname .= ($fullname ? '/' : '') . $dir;
4531                         print $cgi->a({-href => href(action=>"tree", file_name=>$fullname,
4532                                                      hash_base=>$hb),
4533                                       -title => $fullname}, esc_path($dir));
4534                         print " / ";
4535                 }
4536                 if (defined $type && $type eq 'blob') {
4537                         print $cgi->a({-href => href(action=>"blob_plain", file_name=>$file_name,
4538                                                      hash_base=>$hb),
4539                                       -title => $name}, esc_path($basename));
4540                 } elsif (defined $type && $type eq 'tree') {
4541                         print $cgi->a({-href => href(action=>"tree", file_name=>$file_name,
4542                                                      hash_base=>$hb),
4543                                       -title => $name}, esc_path($basename));
4544                         print " / ";
4545                 } else {
4546                         print esc_path($basename);
4547                 }
4548         }
4549         print "<br/></div>\n";
4550 }
4551
4552 sub git_print_log {
4553         my $log = shift;
4554         my %opts = @_;
4555
4556         if ($opts{'-remove_title'}) {
4557                 # remove title, i.e. first line of log
4558                 shift @$log;
4559         }
4560         # remove leading empty lines
4561         while (defined $log->[0] && $log->[0] eq "") {
4562                 shift @$log;
4563         }
4564
4565         # print log
4566         my $skip_blank_line = 0;
4567         foreach my $line (@$log) {
4568                 if ($line =~ m/^\s*([A-Z][-A-Za-z]*-[Bb]y|C[Cc]): /) {
4569                         if (! $opts{'-remove_signoff'}) {
4570                                 print "<span class=\"signoff\">" . esc_html($line) . "</span><br/>\n";
4571                                 $skip_blank_line = 1;
4572                         }
4573                         next;
4574                 }
4575
4576                 if ($line =~ m,\s*([a-z]*link): (https?://\S+),i) {
4577                         if (! $opts{'-remove_signoff'}) {
4578                                 print "<span class=\"signoff\">" . esc_html($1) . ": " .
4579                                         "<a href=\"" . esc_html($2) . "\">" . esc_html($2) . "</a>" .
4580                                         "</span><br/>\n";
4581                                 $skip_blank_line = 1;
4582                         }
4583                         next;
4584                 }
4585
4586                 # print only one empty line
4587                 # do not print empty line after signoff
4588                 if ($line eq "") {
4589                         next if ($skip_blank_line);
4590                         $skip_blank_line = 1;
4591                 } else {
4592                         $skip_blank_line = 0;
4593                 }
4594
4595                 print format_log_line_html($line) . "<br/>\n";
4596         }
4597
4598         if ($opts{'-final_empty_line'}) {
4599                 # end with single empty line
4600                 print "<br/>\n" unless $skip_blank_line;
4601         }
4602 }
4603
4604 # return link target (what link points to)
4605 sub git_get_link_target {
4606         my $hash = shift;
4607         my $link_target;
4608
4609         # read link
4610         open my $fd, "-|", git_cmd(), "cat-file", "blob", $hash
4611                 or return;
4612         {
4613                 local $/ = undef;
4614                 $link_target = <$fd>;
4615         }
4616         close $fd
4617                 or return;
4618
4619         return $link_target;
4620 }
4621
4622 # given link target, and the directory (basedir) the link is in,
4623 # return target of link relative to top directory (top tree);
4624 # return undef if it is not possible (including absolute links).
4625 sub normalize_link_target {
4626         my ($link_target, $basedir) = @_;
4627
4628         # absolute symlinks (beginning with '/') cannot be normalized
4629         return if (substr($link_target, 0, 1) eq '/');
4630
4631         # normalize link target to path from top (root) tree (dir)
4632         my $path;
4633         if ($basedir) {
4634                 $path = $basedir . '/' . $link_target;
4635         } else {
4636                 # we are in top (root) tree (dir)
4637                 $path = $link_target;
4638         }
4639
4640         # remove //, /./, and /../
4641         my @path_parts;
4642         foreach my $part (split('/', $path)) {
4643                 # discard '.' and ''
4644                 next if (!$part || $part eq '.');
4645                 # handle '..'
4646                 if ($part eq '..') {
4647                         if (@path_parts) {
4648                                 pop @path_parts;
4649                         } else {
4650                                 # link leads outside repository (outside top dir)
4651                                 return;
4652                         }
4653                 } else {
4654                         push @path_parts, $part;
4655                 }
4656         }
4657         $path = join('/', @path_parts);
4658
4659         return $path;
4660 }
4661
4662 # print tree entry (row of git_tree), but without encompassing <tr> element
4663 sub git_print_tree_entry {
4664         my ($t, $basedir, $hash_base, $have_blame) = @_;
4665
4666         my %base_key = ();
4667         $base_key{'hash_base'} = $hash_base if defined $hash_base;
4668
4669         # The format of a table row is: mode list link.  Where mode is
4670         # the mode of the entry, list is the name of the entry, an href,
4671         # and link is the action links of the entry.
4672
4673         print "<td class=\"mode\">" . mode_str($t->{'mode'}) . "</td>\n";
4674         if (exists $t->{'size'}) {
4675                 print "<td class=\"size\">$t->{'size'}</td>\n";
4676         }
4677         if ($t->{'type'} eq "blob") {
4678                 print "<td class=\"list\">" .
4679                         $cgi->a({-href => href(action=>"blob", hash=>$t->{'hash'},
4680                                                file_name=>"$basedir$t->{'name'}", %base_key),
4681                                 -class => "list"}, esc_path($t->{'name'}));
4682                 if (S_ISLNK(oct $t->{'mode'})) {
4683                         my $link_target = git_get_link_target($t->{'hash'});
4684                         if ($link_target) {
4685                                 my $norm_target = normalize_link_target($link_target, $basedir);
4686                                 if (defined $norm_target) {
4687                                         print " -> " .
4688                                               $cgi->a({-href => href(action=>"object", hash_base=>$hash_base,
4689                                                                      file_name=>$norm_target),
4690                                                        -title => $norm_target}, esc_path($link_target));
4691                                 } else {
4692                                         print " -> " . esc_path($link_target);
4693                                 }
4694                         }
4695                 }
4696                 print "</td>\n";
4697                 print "<td class=\"link\">";
4698                 print $cgi->a({-href => href(action=>"blob", hash=>$t->{'hash'},
4699                                              file_name=>"$basedir$t->{'name'}", %base_key)},
4700                               "blob");
4701                 if ($have_blame) {
4702                         print " | " .
4703                               $cgi->a({-href => href(action=>"blame", hash=>$t->{'hash'},
4704                                                      file_name=>"$basedir$t->{'name'}", %base_key)},
4705                                       "blame");
4706                 }
4707                 if (defined $hash_base) {
4708                         print " | " .
4709                               $cgi->a({-href => href(action=>"history", hash_base=>$hash_base,
4710                                                      hash=>$t->{'hash'}, file_name=>"$basedir$t->{'name'}")},
4711                                       "history");
4712                 }
4713                 print " | " .
4714                         $cgi->a({-href => href(action=>"blob_plain", hash_base=>$hash_base,
4715                                                file_name=>"$basedir$t->{'name'}")},
4716                                 "raw");
4717                 print "</td>\n";
4718
4719         } elsif ($t->{'type'} eq "tree") {
4720                 print "<td class=\"list\">";
4721                 print $cgi->a({-href => href(action=>"tree", hash=>$t->{'hash'},
4722                                              file_name=>"$basedir$t->{'name'}",
4723                                              %base_key)},
4724                               esc_path($t->{'name'}));
4725                 print "</td>\n";
4726                 print "<td class=\"link\">";
4727                 print $cgi->a({-href => href(action=>"tree", hash=>$t->{'hash'},
4728                                              file_name=>"$basedir$t->{'name'}",
4729                                              %base_key)},
4730                               "tree");
4731                 if (defined $hash_base) {
4732                         print " | " .
4733                               $cgi->a({-href => href(action=>"history", hash_base=>$hash_base,
4734                                                      file_name=>"$basedir$t->{'name'}")},
4735                                       "history");
4736                 }
4737                 print "</td>\n";
4738         } else {
4739                 # unknown object: we can only present history for it
4740                 # (this includes 'commit' object, i.e. submodule support)
4741                 print "<td class=\"list\">" .
4742                       esc_path($t->{'name'}) .
4743                       "</td>\n";
4744                 print "<td class=\"link\">";
4745                 if (defined $hash_base) {
4746                         print $cgi->a({-href => href(action=>"history",
4747                                                      hash_base=>$hash_base,
4748                                                      file_name=>"$basedir$t->{'name'}")},
4749                                       "history");
4750                 }
4751                 print "</td>\n";
4752         }
4753 }
4754
4755 ## ......................................................................
4756 ## functions printing large fragments of HTML
4757
4758 # get pre-image filenames for merge (combined) diff
4759 sub fill_from_file_info {
4760         my ($diff, @parents) = @_;
4761
4762         $diff->{'from_file'} = [ ];
4763         $diff->{'from_file'}[$diff->{'nparents'} - 1] = undef;
4764         for (my $i = 0; $i < $diff->{'nparents'}; $i++) {
4765                 if ($diff->{'status'}[$i] eq 'R' ||
4766                     $diff->{'status'}[$i] eq 'C') {
4767                         $diff->{'from_file'}[$i] =
4768                                 git_get_path_by_hash($parents[$i], $diff->{'from_id'}[$i]);
4769                 }
4770         }
4771
4772         return $diff;
4773 }
4774
4775 # is current raw difftree line of file deletion
4776 sub is_deleted {
4777         my $diffinfo = shift;
4778
4779         return $diffinfo->{'to_id'} eq ('0' x 40);
4780 }
4781
4782 # does patch correspond to [previous] difftree raw line
4783 # $diffinfo  - hashref of parsed raw diff format
4784 # $patchinfo - hashref of parsed patch diff format
4785 #              (the same keys as in $diffinfo)
4786 sub is_patch_split {
4787         my ($diffinfo, $patchinfo) = @_;
4788
4789         return defined $diffinfo && defined $patchinfo
4790                 && $diffinfo->{'to_file'} eq $patchinfo->{'to_file'};
4791 }
4792
4793
4794 sub git_difftree_body {
4795         my ($difftree, $hash, @parents) = @_;
4796         my ($parent) = $parents[0];
4797         my $have_blame = gitweb_check_feature('blame');
4798         print "<div class=\"list_head\">\n";
4799         if ($#{$difftree} > 10) {
4800                 print(($#{$difftree} + 1) . " files changed:\n");
4801         }
4802         print "</div>\n";
4803
4804         print "<table class=\"" .
4805               (@parents > 1 ? "combined " : "") .
4806               "diff_tree\">\n";
4807
4808         # header only for combined diff in 'commitdiff' view
4809         my $has_header = @$difftree && @parents > 1 && $action eq 'commitdiff';
4810         if ($has_header) {
4811                 # table header
4812                 print "<thead><tr>\n" .
4813                        "<th></th><th></th>\n"; # filename, patchN link
4814                 for (my $i = 0; $i < @parents; $i++) {
4815                         my $par = $parents[$i];
4816                         print "<th>" .
4817                               $cgi->a({-href => href(action=>"commitdiff",
4818                                                      hash=>$hash, hash_parent=>$par),
4819                                        -title => 'commitdiff to parent number ' .
4820                                                   ($i+1) . ': ' . substr($par,0,7)},
4821                                       $i+1) .
4822                               "&nbsp;</th>\n";
4823                 }
4824                 print "</tr></thead>\n<tbody>\n";
4825         }
4826
4827         my $alternate = 1;
4828         my $patchno = 0;
4829         foreach my $line (@{$difftree}) {
4830                 my $diff = parsed_difftree_line($line);
4831
4832                 if ($alternate) {
4833                         print "<tr class=\"dark\">\n";
4834                 } else {
4835                         print "<tr class=\"light\">\n";
4836                 }
4837                 $alternate ^= 1;
4838
4839                 if (exists $diff->{'nparents'}) { # combined diff
4840
4841                         fill_from_file_info($diff, @parents)
4842                                 unless exists $diff->{'from_file'};
4843
4844                         if (!is_deleted($diff)) {
4845                                 # file exists in the result (child) commit
4846                                 print "<td>" .
4847                                       $cgi->a({-href => href(action=>"blob", hash=>$diff->{'to_id'},
4848                                                              file_name=>$diff->{'to_file'},
4849                                                              hash_base=>$hash),
4850                                               -class => "list"}, esc_path($diff->{'to_file'})) .
4851                                       "</td>\n";
4852                         } else {
4853                                 print "<td>" .
4854                                       esc_path($diff->{'to_file'}) .
4855                                       "</td>\n";
4856                         }
4857
4858                         if ($action eq 'commitdiff') {
4859                                 # link to patch
4860                                 $patchno++;
4861                                 print "<td class=\"link\">" .
4862                                       $cgi->a({-href => href(-anchor=>"patch$patchno")},
4863                                               "patch") .
4864                                       " | " .
4865                                       "</td>\n";
4866                         }
4867
4868                         my $has_history = 0;
4869                         my $not_deleted = 0;
4870                         for (my $i = 0; $i < $diff->{'nparents'}; $i++) {
4871                                 my $hash_parent = $parents[$i];
4872                                 my $from_hash = $diff->{'from_id'}[$i];
4873                                 my $from_path = $diff->{'from_file'}[$i];
4874                                 my $status = $diff->{'status'}[$i];
4875
4876                                 $has_history ||= ($status ne 'A');
4877                                 $not_deleted ||= ($status ne 'D');
4878
4879                                 if ($status eq 'A') {
4880                                         print "<td  class=\"link\" align=\"right\"> | </td>\n";
4881                                 } elsif ($status eq 'D') {
4882                                         print "<td class=\"link\">" .
4883                                               $cgi->a({-href => href(action=>"blob",
4884                                                                      hash_base=>$hash,
4885                                                                      hash=>$from_hash,
4886                                                                      file_name=>$from_path)},
4887                                                       "blob" . ($i+1)) .
4888                                               " | </td>\n";
4889                                 } else {
4890                                         if ($diff->{'to_id'} eq $from_hash) {
4891                                                 print "<td class=\"link nochange\">";
4892                                         } else {
4893                                                 print "<td class=\"link\">";
4894                                         }
4895                                         print $cgi->a({-href => href(action=>"blobdiff",
4896                                                                      hash=>$diff->{'to_id'},
4897                                                                      hash_parent=>$from_hash,
4898                                                                      hash_base=>$hash,
4899                                                                      hash_parent_base=>$hash_parent,
4900                                                                      file_name=>$diff->{'to_file'},
4901                                                                      file_parent=>$from_path)},
4902                                                       "diff" . ($i+1)) .
4903                                               " | </td>\n";
4904                                 }
4905                         }
4906
4907                         print "<td class=\"link\">";
4908                         if ($not_deleted) {
4909                                 print $cgi->a({-href => href(action=>"blob",
4910                                                              hash=>$diff->{'to_id'},
4911                                                              file_name=>$diff->{'to_file'},
4912                                                              hash_base=>$hash)},
4913                                               "blob");
4914                                 print " | " if ($has_history);
4915                         }
4916                         if ($has_history) {
4917                                 print $cgi->a({-href => href(action=>"history",
4918                                                              file_name=>$diff->{'to_file'},
4919                                                              hash_base=>$hash)},
4920                                               "history");
4921                         }
4922                         print "</td>\n";
4923
4924                         print "</tr>\n";
4925                         next; # instead of 'else' clause, to avoid extra indent
4926                 }
4927                 # else ordinary diff
4928
4929                 my ($to_mode_oct, $to_mode_str, $to_file_type);
4930                 my ($from_mode_oct, $from_mode_str, $from_file_type);
4931                 if ($diff->{'to_mode'} ne ('0' x 6)) {
4932                         $to_mode_oct = oct $diff->{'to_mode'};
4933                         if (S_ISREG($to_mode_oct)) { # only for regular file
4934                                 $to_mode_str = sprintf("%04o", $to_mode_oct & 0777); # permission bits
4935                         }
4936                         $to_file_type = file_type($diff->{'to_mode'});
4937                 }
4938                 if ($diff->{'from_mode'} ne ('0' x 6)) {
4939                         $from_mode_oct = oct $diff->{'from_mode'};
4940                         if (S_ISREG($from_mode_oct)) { # only for regular file
4941                                 $from_mode_str = sprintf("%04o", $from_mode_oct & 0777); # permission bits
4942                         }
4943                         $from_file_type = file_type($diff->{'from_mode'});
4944                 }
4945
4946                 if ($diff->{'status'} eq "A") { # created
4947                         my $mode_chng = "<span class=\"file_status new\">[new $to_file_type";
4948                         $mode_chng   .= " with mode: $to_mode_str" if $to_mode_str;
4949                         $mode_chng   .= "]</span>";
4950                         print "<td>";
4951                         print $cgi->a({-href => href(action=>"blob", hash=>$diff->{'to_id'},
4952                                                      hash_base=>$hash, file_name=>$diff->{'file'}),
4953                                       -class => "list"}, esc_path($diff->{'file'}));
4954                         print "</td>\n";
4955                         print "<td>$mode_chng</td>\n";
4956                         print "<td class=\"link\">";
4957                         if ($action eq 'commitdiff') {
4958                                 # link to patch
4959                                 $patchno++;
4960                                 print $cgi->a({-href => href(-anchor=>"patch$patchno")},
4961                                               "patch") .
4962                                       " | ";
4963                         }
4964                         print $cgi->a({-href => href(action=>"blob", hash=>$diff->{'to_id'},
4965                                                      hash_base=>$hash, file_name=>$diff->{'file'})},
4966                                       "blob");
4967                         print "</td>\n";
4968
4969                 } elsif ($diff->{'status'} eq "D") { # deleted
4970                         my $mode_chng = "<span class=\"file_status deleted\">[deleted $from_file_type]</span>";
4971                         print "<td>";
4972                         print $cgi->a({-href => href(action=>"blob", hash=>$diff->{'from_id'},
4973                                                      hash_base=>$parent, file_name=>$diff->{'file'}),
4974                                        -class => "list"}, esc_path($diff->{'file'}));
4975                         print "</td>\n";
4976                         print "<td>$mode_chng</td>\n";
4977                         print "<td class=\"link\">";
4978                         if ($action eq 'commitdiff') {
4979                                 # link to patch
4980                                 $patchno++;
4981                                 print $cgi->a({-href => href(-anchor=>"patch$patchno")},
4982                                               "patch") .
4983                                       " | ";
4984                         }
4985                         print $cgi->a({-href => href(action=>"blob", hash=>$diff->{'from_id'},
4986                                                      hash_base=>$parent, file_name=>$diff->{'file'})},
4987                                       "blob") . " | ";
4988                         if ($have_blame) {
4989                                 print $cgi->a({-href => href(action=>"blame", hash_base=>$parent,
4990                                                              file_name=>$diff->{'file'})},
4991                                               "blame") . " | ";
4992                         }
4993                         print $cgi->a({-href => href(action=>"history", hash_base=>$parent,
4994                                                      file_name=>$diff->{'file'})},
4995                                       "history");
4996                         print "</td>\n";
4997
4998                 } elsif ($diff->{'status'} eq "M" || $diff->{'status'} eq "T") { # modified, or type changed
4999                         my $mode_chnge = "";
5000                         if ($diff->{'from_mode'} != $diff->{'to_mode'}) {
5001                                 $mode_chnge = "<span class=\"file_status mode_chnge\">[changed";
5002                                 if ($from_file_type ne $to_file_type) {
5003                                         $mode_chnge .= " from $from_file_type to $to_file_type";
5004                                 }
5005                                 if (($from_mode_oct & 0777) != ($to_mode_oct & 0777)) {
5006                                         if ($from_mode_str && $to_mode_str) {
5007                                                 $mode_chnge .= " mode: $from_mode_str->$to_mode_str";
5008                                         } elsif ($to_mode_str) {
5009                                                 $mode_chnge .= " mode: $to_mode_str";
5010                                         }
5011                                 }
5012                                 $mode_chnge .= "]</span>\n";
5013                         }
5014                         print "<td>";
5015                         print $cgi->a({-href => href(action=>"blob", hash=>$diff->{'to_id'},
5016                                                      hash_base=>$hash, file_name=>$diff->{'file'}),
5017                                       -class => "list"}, esc_path($diff->{'file'}));
5018                         print "</td>\n";
5019                         print "<td>$mode_chnge</td>\n";
5020                         print "<td class=\"link\">";
5021                         if ($action eq 'commitdiff') {
5022                                 # link to patch
5023                                 $patchno++;
5024                                 print $cgi->a({-href => href(-anchor=>"patch$patchno")},
5025                                               "patch") .
5026                                       " | ";
5027                         } elsif ($diff->{'to_id'} ne $diff->{'from_id'}) {
5028                                 # "commit" view and modified file (not onlu mode changed)
5029                                 print $cgi->a({-href => href(action=>"blobdiff",
5030                                                              hash=>$diff->{'to_id'}, hash_parent=>$diff->{'from_id'},
5031                                                              hash_base=>$hash, hash_parent_base=>$parent,
5032                                                              file_name=>$diff->{'file'})},
5033                                               "diff") .
5034                                       " | ";
5035                         }
5036                         print $cgi->a({-href => href(action=>"blob", hash=>$diff->{'to_id'},
5037                                                      hash_base=>$hash, file_name=>$diff->{'file'})},
5038                                        "blob") . " | ";
5039                         if ($have_blame) {
5040                                 print $cgi->a({-href => href(action=>"blame", hash_base=>$hash,
5041                                                              file_name=>$diff->{'file'})},
5042                                               "blame") . " | ";
5043                         }
5044                         print $cgi->a({-href => href(action=>"history", hash_base=>$hash,
5045                                                      file_name=>$diff->{'file'})},
5046                                       "history");
5047                         print "</td>\n";
5048
5049                 } elsif ($diff->{'status'} eq "R" || $diff->{'status'} eq "C") { # renamed or copied
5050                         my %status_name = ('R' => 'moved', 'C' => 'copied');
5051                         my $nstatus = $status_name{$diff->{'status'}};
5052                         my $mode_chng = "";
5053                         if ($diff->{'from_mode'} != $diff->{'to_mode'}) {
5054                                 # mode also for directories, so we cannot use $to_mode_str
5055                                 $mode_chng = sprintf(", mode: %04o", $to_mode_oct & 0777);
5056                         }
5057                         print "<td>" .
5058                               $cgi->a({-href => href(action=>"blob", hash_base=>$hash,
5059                                                      hash=>$diff->{'to_id'}, file_name=>$diff->{'to_file'}),
5060                                       -class => "list"}, esc_path($diff->{'to_file'})) . "</td>\n" .
5061                               "<td><span class=\"file_status $nstatus\">[$nstatus from " .
5062                               $cgi->a({-href => href(action=>"blob", hash_base=>$parent,
5063                                                      hash=>$diff->{'from_id'}, file_name=>$diff->{'from_file'}),
5064                                       -class => "list"}, esc_path($diff->{'from_file'})) .
5065                               " with " . (int $diff->{'similarity'}) . "% similarity$mode_chng]</span></td>\n" .
5066                               "<td class=\"link\">";
5067                         if ($action eq 'commitdiff') {
5068                                 # link to patch
5069                                 $patchno++;
5070                                 print $cgi->a({-href => href(-anchor=>"patch$patchno")},
5071                                               "patch") .
5072                                       " | ";
5073                         } elsif ($diff->{'to_id'} ne $diff->{'from_id'}) {
5074                                 # "commit" view and modified file (not only pure rename or copy)
5075                                 print $cgi->a({-href => href(action=>"blobdiff",
5076                                                              hash=>$diff->{'to_id'}, hash_parent=>$diff->{'from_id'},
5077                                                              hash_base=>$hash, hash_parent_base=>$parent,
5078                                                              file_name=>$diff->{'to_file'}, file_parent=>$diff->{'from_file'})},
5079                                               "diff") .
5080                                       " | ";
5081                         }
5082                         print $cgi->a({-href => href(action=>"blob", hash=>$diff->{'to_id'},
5083                                                      hash_base=>$parent, file_name=>$diff->{'to_file'})},
5084                                       "blob") . " | ";
5085                         if ($have_blame) {
5086                                 print $cgi->a({-href => href(action=>"blame", hash_base=>$hash,
5087                                                              file_name=>$diff->{'to_file'})},
5088                                               "blame") . " | ";
5089                         }
5090                         print $cgi->a({-href => href(action=>"history", hash_base=>$hash,
5091                                                     file_name=>$diff->{'to_file'})},
5092                                       "history");
5093                         print "</td>\n";
5094
5095                 } # we should not encounter Unmerged (U) or Unknown (X) status
5096                 print "</tr>\n";
5097         }
5098         print "</tbody>" if $has_header;
5099         print "</table>\n";
5100 }
5101
5102 # Print context lines and then rem/add lines in a side-by-side manner.
5103 sub print_sidebyside_diff_lines {
5104         my ($ctx, $rem, $add) = @_;
5105
5106         # print context block before add/rem block
5107         if (@$ctx) {
5108                 print join '',
5109                         '<div class="chunk_block ctx">',
5110                                 '<div class="old">',
5111                                 @$ctx,
5112                                 '</div>',
5113                                 '<div class="new">',
5114                                 @$ctx,
5115                                 '</div>',
5116                         '</div>';
5117         }
5118
5119         if (!@$add) {
5120                 # pure removal
5121                 print join '',
5122                         '<div class="chunk_block rem">',
5123                                 '<div class="old">',
5124                                 @$rem,
5125                                 '</div>',
5126                         '</div>';
5127         } elsif (!@$rem) {
5128                 # pure addition
5129                 print join '',
5130                         '<div class="chunk_block add">',
5131                                 '<div class="new">',
5132                                 @$add,
5133                                 '</div>',
5134                         '</div>';
5135         } else {
5136                 print join '',
5137                         '<div class="chunk_block chg">',
5138                                 '<div class="old">',
5139                                 @$rem,
5140                                 '</div>',
5141                                 '<div class="new">',
5142                                 @$add,
5143                                 '</div>',
5144                         '</div>';
5145         }
5146 }
5147
5148 # Print context lines and then rem/add lines in inline manner.
5149 sub print_inline_diff_lines {
5150         my ($ctx, $rem, $add) = @_;
5151
5152         print @$ctx, @$rem, @$add;
5153 }
5154
5155 # Format removed and added line, mark changed part and HTML-format them.
5156 # Implementation is based on contrib/diff-highlight
5157 sub format_rem_add_lines_pair {
5158         my ($rem, $add, $num_parents) = @_;
5159
5160         # We need to untabify lines before split()'ing them;
5161         # otherwise offsets would be invalid.
5162         chomp $rem;
5163         chomp $add;
5164         $rem = untabify($rem);
5165         $add = untabify($add);
5166
5167         my @rem = split(//, $rem);
5168         my @add = split(//, $add);
5169         my ($esc_rem, $esc_add);
5170         # Ignore leading +/- characters for each parent.
5171         my ($prefix_len, $suffix_len) = ($num_parents, 0);
5172         my ($prefix_has_nonspace, $suffix_has_nonspace);
5173
5174         my $shorter = (@rem < @add) ? @rem : @add;
5175         while ($prefix_len < $shorter) {
5176                 last if ($rem[$prefix_len] ne $add[$prefix_len]);
5177
5178                 $prefix_has_nonspace = 1 if ($rem[$prefix_len] !~ /\s/);
5179                 $prefix_len++;
5180         }
5181
5182         while ($prefix_len + $suffix_len < $shorter) {
5183                 last if ($rem[-1 - $suffix_len] ne $add[-1 - $suffix_len]);
5184
5185                 $suffix_has_nonspace = 1 if ($rem[-1 - $suffix_len] !~ /\s/);
5186                 $suffix_len++;
5187         }
5188
5189         # Mark lines that are different from each other, but have some common
5190         # part that isn't whitespace.  If lines are completely different, don't
5191         # mark them because that would make output unreadable, especially if
5192         # diff consists of multiple lines.
5193         if ($prefix_has_nonspace || $suffix_has_nonspace) {
5194                 $esc_rem = esc_html_hl_regions($rem, 'marked',
5195                         [$prefix_len, @rem - $suffix_len], -nbsp=>1);
5196                 $esc_add = esc_html_hl_regions($add, 'marked',
5197                         [$prefix_len, @add - $suffix_len], -nbsp=>1);
5198         } else {
5199                 $esc_rem = esc_html($rem, -nbsp=>1);
5200                 $esc_add = esc_html($add, -nbsp=>1);
5201         }
5202
5203         return format_diff_line(\$esc_rem, 'rem'),
5204                format_diff_line(\$esc_add, 'add');
5205 }
5206
5207 # HTML-format diff context, removed and added lines.
5208 sub format_ctx_rem_add_lines {
5209         my ($ctx, $rem, $add, $num_parents) = @_;
5210         my (@new_ctx, @new_rem, @new_add);
5211         my $can_highlight = 0;
5212         my $is_combined = ($num_parents > 1);
5213
5214         # Highlight if every removed line has a corresponding added line.
5215         if (@$add > 0 && @$add == @$rem) {
5216                 $can_highlight = 1;
5217
5218                 # Highlight lines in combined diff only if the chunk contains
5219                 # diff between the same version, e.g.
5220                 #
5221                 #    - a
5222                 #   -  b
5223                 #    + c
5224                 #   +  d
5225                 #
5226                 # Otherwise the highlightling would be confusing.
5227                 if ($is_combined) {
5228                         for (my $i = 0; $i < @$add; $i++) {
5229                                 my $prefix_rem = substr($rem->[$i], 0, $num_parents);
5230                                 my $prefix_add = substr($add->[$i], 0, $num_parents);
5231
5232                                 $prefix_rem =~ s/-/+/g;
5233
5234                                 if ($prefix_rem ne $prefix_add) {
5235                                         $can_highlight = 0;
5236                                         last;
5237                                 }
5238                         }
5239                 }
5240         }
5241
5242         if ($can_highlight) {
5243                 for (my $i = 0; $i < @$add; $i++) {
5244                         my ($line_rem, $line_add) = format_rem_add_lines_pair(
5245                                 $rem->[$i], $add->[$i], $num_parents);
5246                         push @new_rem, $line_rem;
5247                         push @new_add, $line_add;
5248                 }
5249         } else {
5250                 @new_rem = map { format_diff_line($_, 'rem') } @$rem;
5251                 @new_add = map { format_diff_line($_, 'add') } @$add;
5252         }
5253
5254         @new_ctx = map { format_diff_line($_, 'ctx') } @$ctx;
5255
5256         return (\@new_ctx, \@new_rem, \@new_add);
5257 }
5258
5259 # Print context lines and then rem/add lines.
5260 sub print_diff_lines {
5261         my ($ctx, $rem, $add, $diff_style, $num_parents) = @_;
5262         my $is_combined = $num_parents > 1;
5263
5264         ($ctx, $rem, $add) = format_ctx_rem_add_lines($ctx, $rem, $add,
5265                 $num_parents);
5266
5267         if ($diff_style eq 'sidebyside' && !$is_combined) {
5268                 print_sidebyside_diff_lines($ctx, $rem, $add);
5269         } else {
5270                 # default 'inline' style and unknown styles
5271                 print_inline_diff_lines($ctx, $rem, $add);
5272         }
5273 }
5274
5275 sub print_diff_chunk {
5276         my ($diff_style, $num_parents, $from, $to, @chunk) = @_;
5277         my (@ctx, @rem, @add);
5278
5279         # The class of the previous line.
5280         my $prev_class = '';
5281
5282         return unless @chunk;
5283
5284         # incomplete last line might be among removed or added lines,
5285         # or both, or among context lines: find which
5286         for (my $i = 1; $i < @chunk; $i++) {
5287                 if ($chunk[$i][0] eq 'incomplete') {
5288                         $chunk[$i][0] = $chunk[$i-1][0];
5289                 }
5290         }
5291
5292         # guardian
5293         push @chunk, ["", ""];
5294
5295         foreach my $line_info (@chunk) {
5296                 my ($class, $line) = @$line_info;
5297
5298                 # print chunk headers
5299                 if ($class && $class eq 'chunk_header') {
5300                         print format_diff_line($line, $class, $from, $to);
5301                         next;
5302                 }
5303
5304                 ## print from accumulator when have some add/rem lines or end
5305                 # of chunk (flush context lines), or when have add and rem
5306                 # lines and new block is reached (otherwise add/rem lines could
5307                 # be reordered)
5308                 if (!$class || ((@rem || @add) && $class eq 'ctx') ||
5309                     (@rem && @add && $class ne $prev_class)) {
5310                         print_diff_lines(\@ctx, \@rem, \@add,
5311                                          $diff_style, $num_parents);
5312                         @ctx = @rem = @add = ();
5313                 }
5314
5315                 ## adding lines to accumulator
5316                 # guardian value
5317                 last unless $line;
5318                 # rem, add or change
5319                 if ($class eq 'rem') {
5320                         push @rem, $line;
5321                 } elsif ($class eq 'add') {
5322                         push @add, $line;
5323                 }
5324                 # context line
5325                 if ($class eq 'ctx') {
5326                         push @ctx, $line;
5327                 }
5328
5329                 $prev_class = $class;
5330         }
5331 }
5332
5333 sub git_patchset_body {
5334         my ($fd, $diff_style, $difftree, $hash, @hash_parents) = @_;
5335         my ($hash_parent) = $hash_parents[0];
5336
5337         my $is_combined = (@hash_parents > 1);
5338         my $patch_idx = 0;
5339         my $patch_number = 0;
5340         my $patch_line;
5341         my $diffinfo;
5342         my $to_name;
5343         my (%from, %to);
5344         my @chunk; # for side-by-side diff
5345
5346         print "<div class=\"patchset\">\n";
5347
5348         # skip to first patch
5349         while ($patch_line = <$fd>) {
5350                 chomp $patch_line;
5351
5352                 last if ($patch_line =~ m/^diff /);
5353         }
5354
5355  PATCH:
5356         while ($patch_line) {
5357
5358                 # parse "git diff" header line
5359                 if ($patch_line =~ m/^diff --git (\"(?:[^\\\"]*(?:\\.[^\\\"]*)*)\"|[^ "]*) (.*)$/) {
5360                         # $1 is from_name, which we do not use
5361                         $to_name = unquote($2);
5362                         $to_name =~ s!^b/!!;
5363                 } elsif ($patch_line =~ m/^diff --(cc|combined) ("?.*"?)$/) {
5364                         # $1 is 'cc' or 'combined', which we do not use
5365                         $to_name = unquote($2);
5366                 } else {
5367                         $to_name = undef;
5368                 }
5369
5370                 # check if current patch belong to current raw line
5371                 # and parse raw git-diff line if needed
5372                 if (is_patch_split($diffinfo, { 'to_file' => $to_name })) {
5373                         # this is continuation of a split patch
5374                         print "<div class=\"patch cont\">\n";
5375                 } else {
5376                         # advance raw git-diff output if needed
5377                         $patch_idx++ if defined $diffinfo;
5378
5379                         # read and prepare patch information
5380                         $diffinfo = parsed_difftree_line($difftree->[$patch_idx]);
5381
5382                         # compact combined diff output can have some patches skipped
5383                         # find which patch (using pathname of result) we are at now;
5384                         if ($is_combined) {
5385                                 while ($to_name ne $diffinfo->{'to_file'}) {
5386                                         print "<div class=\"patch\" id=\"patch". ($patch_idx+1) ."\">\n" .
5387                                               format_diff_cc_simplified($diffinfo, @hash_parents) .
5388                                               "</div>\n";  # class="patch"
5389
5390                                         $patch_idx++;
5391                                         $patch_number++;
5392
5393                                         last if $patch_idx > $#$difftree;
5394                                         $diffinfo = parsed_difftree_line($difftree->[$patch_idx]);
5395                                 }
5396                         }
5397
5398                         # modifies %from, %to hashes
5399                         parse_from_to_diffinfo($diffinfo, \%from, \%to, @hash_parents);
5400
5401                         # this is first patch for raw difftree line with $patch_idx index
5402                         # we index @$difftree array from 0, but number patches from 1
5403                         print "<div class=\"patch\" id=\"patch". ($patch_idx+1) ."\">\n";
5404                 }
5405
5406                 # git diff header
5407                 #assert($patch_line =~ m/^diff /) if DEBUG;
5408                 #assert($patch_line !~ m!$/$!) if DEBUG; # is chomp-ed
5409                 $patch_number++;
5410                 # print "git diff" header
5411                 print format_git_diff_header_line($patch_line, $diffinfo,
5412                                                   \%from, \%to);
5413
5414                 # print extended diff header
5415                 print "<div class=\"diff extended_header\">\n";
5416         EXTENDED_HEADER:
5417                 while ($patch_line = <$fd>) {
5418                         chomp $patch_line;
5419
5420                         last EXTENDED_HEADER if ($patch_line =~ m/^--- |^diff /);
5421
5422                         print format_extended_diff_header_line($patch_line, $diffinfo,
5423                                                                \%from, \%to);
5424                 }
5425                 print "</div>\n"; # class="diff extended_header"
5426
5427                 # from-file/to-file diff header
5428                 if (! $patch_line) {
5429                         print "</div>\n"; # class="patch"
5430                         last PATCH;
5431                 }
5432                 next PATCH if ($patch_line =~ m/^diff /);
5433                 #assert($patch_line =~ m/^---/) if DEBUG;
5434
5435                 my $last_patch_line = $patch_line;
5436                 $patch_line = <$fd>;
5437                 chomp $patch_line;
5438                 #assert($patch_line =~ m/^\+\+\+/) if DEBUG;
5439
5440                 print format_diff_from_to_header($last_patch_line, $patch_line,
5441                                                  $diffinfo, \%from, \%to,
5442                                                  @hash_parents);
5443
5444                 # the patch itself
5445         LINE:
5446                 while ($patch_line = <$fd>) {
5447                         chomp $patch_line;
5448
5449                         next PATCH if ($patch_line =~ m/^diff /);
5450
5451                         my $class = diff_line_class($patch_line, \%from, \%to);
5452
5453                         if ($class eq 'chunk_header') {
5454                                 print_diff_chunk($diff_style, scalar @hash_parents, \%from, \%to, @chunk);
5455                                 @chunk = ();
5456                         }
5457
5458                         push @chunk, [ $class, $patch_line ];
5459                 }
5460
5461         } continue {
5462                 if (@chunk) {
5463                         print_diff_chunk($diff_style, scalar @hash_parents, \%from, \%to, @chunk);
5464                         @chunk = ();
5465                 }
5466                 print "</div>\n"; # class="patch"
5467         }
5468
5469         # for compact combined (--cc) format, with chunk and patch simplification
5470         # the patchset might be empty, but there might be unprocessed raw lines
5471         for (++$patch_idx if $patch_number > 0;
5472              $patch_idx < @$difftree;
5473              ++$patch_idx) {
5474                 # read and prepare patch information
5475                 $diffinfo = parsed_difftree_line($difftree->[$patch_idx]);
5476
5477                 # generate anchor for "patch" links in difftree / whatchanged part
5478                 print "<div class=\"patch\" id=\"patch". ($patch_idx+1) ."\">\n" .
5479                       format_diff_cc_simplified($diffinfo, @hash_parents) .
5480                       "</div>\n";  # class="patch"
5481
5482                 $patch_number++;
5483         }
5484
5485         if ($patch_number == 0) {
5486                 if (@hash_parents > 1) {
5487                         print "<div class=\"diff nodifferences\">Trivial merge</div>\n";
5488                 } else {
5489                         print "<div class=\"diff nodifferences\">No differences found</div>\n";
5490                 }
5491         }
5492
5493         print "</div>\n"; # class="patchset"
5494 }
5495
5496 # . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5497
5498 sub git_project_search_form {
5499         my ($searchtext, $search_use_regexp) = @_;
5500
5501         my $limit = '';
5502         if ($project_filter) {
5503                 $limit = " in '$project_filter/'";
5504         }
5505
5506         print "<div class=\"projsearch\">\n";
5507         print $cgi->startform(-method => 'get', -action => $my_uri) .
5508               $cgi->hidden(-name => 'a', -value => 'project_list')  . "\n";
5509         print $cgi->hidden(-name => 'pf', -value => $project_filter). "\n"
5510                 if (defined $project_filter);
5511         print $cgi->textfield(-name => 's', -value => $searchtext,
5512                               -title => "Search project by name and description$limit",
5513                               -size => 60) . "\n" .
5514               "<span title=\"Extended regular expression\">" .
5515               $cgi->checkbox(-name => 'sr', -value => 1, -label => 're',
5516                              -checked => $search_use_regexp) .
5517               "</span>\n" .
5518               $cgi->submit(-name => 'btnS', -value => 'Search') .
5519               $cgi->end_form() . "\n" .
5520               $cgi->a({-href => href(project => undef, searchtext => undef,
5521                                      project_filter => $project_filter)},
5522                       esc_html("List all projects$limit")) . "<br />\n";
5523         print "</div>\n";
5524 }
5525
5526 # entry for given @keys needs filling if at least one of keys in list
5527 # is not present in %$project_info
5528 sub project_info_needs_filling {
5529         my ($project_info, @keys) = @_;
5530
5531         # return List::MoreUtils::any { !exists $project_info->{$_} } @keys;
5532         foreach my $key (@keys) {
5533                 if (!exists $project_info->{$key}) {
5534                         return 1;
5535                 }
5536         }
5537         return;
5538 }
5539
5540 # fills project list info (age, description, owner, category, forks, etc.)
5541 # for each project in the list, removing invalid projects from
5542 # returned list, or fill only specified info.
5543 #
5544 # Invalid projects are removed from the returned list if and only if you
5545 # ask 'age' or 'age_string' to be filled, because they are the only fields
5546 # that run unconditionally git command that requires repository, and
5547 # therefore do always check if project repository is invalid.
5548 #
5549 # USAGE:
5550 # * fill_project_list_info(\@project_list, 'descr_long', 'ctags')
5551 #   ensures that 'descr_long' and 'ctags' fields are filled
5552 # * @project_list = fill_project_list_info(\@project_list)
5553 #   ensures that all fields are filled (and invalid projects removed)
5554 #
5555 # NOTE: modifies $projlist, but does not remove entries from it
5556 sub fill_project_list_info {
5557         my ($projlist, @wanted_keys) = @_;
5558         my @projects;
5559         my $filter_set = sub { return @_; };
5560         if (@wanted_keys) {
5561                 my %wanted_keys = map { $_ => 1 } @wanted_keys;
5562                 $filter_set = sub { return grep { $wanted_keys{$_} } @_; };
5563         }
5564
5565         my $show_ctags = gitweb_check_feature('ctags');
5566  PROJECT:
5567         foreach my $pr (@$projlist) {
5568                 if (project_info_needs_filling($pr, $filter_set->('age', 'age_string'))) {
5569                         my (@activity) = git_get_last_activity($pr->{'path'});
5570                         unless (@activity) {
5571                                 next PROJECT;
5572                         }
5573                         ($pr->{'age'}, $pr->{'age_string'}) = @activity;
5574                 }
5575                 if (project_info_needs_filling($pr, $filter_set->('descr', 'descr_long'))) {
5576                         my $descr = git_get_project_description($pr->{'path'}) || "";
5577                         $descr = to_utf8($descr);
5578                         $pr->{'descr_long'} = $descr;
5579                         $pr->{'descr'} = chop_str($descr, $projects_list_description_width, 5);
5580                 }
5581                 if (project_info_needs_filling($pr, $filter_set->('owner'))) {
5582                         $pr->{'owner'} = git_get_project_owner("$pr->{'path'}") || "";
5583                 }
5584                 if ($show_ctags &&
5585                     project_info_needs_filling($pr, $filter_set->('ctags'))) {
5586                         $pr->{'ctags'} = git_get_project_ctags($pr->{'path'});
5587                 }
5588                 if ($projects_list_group_categories &&
5589                     project_info_needs_filling($pr, $filter_set->('category'))) {
5590                         my $cat = git_get_project_category($pr->{'path'}) ||
5591                                                            $project_list_default_category;
5592                         $pr->{'category'} = to_utf8($cat);
5593                 }
5594
5595                 push @projects, $pr;
5596         }
5597
5598         return @projects;
5599 }
5600
5601 sub sort_projects_list {
5602         my ($projlist, $order) = @_;
5603
5604         sub order_str {
5605                 my $key = shift;
5606                 return sub { $a->{$key} cmp $b->{$key} };
5607         }
5608
5609         sub order_num_then_undef {
5610                 my $key = shift;
5611                 return sub {
5612                         defined $a->{$key} ?
5613                                 (defined $b->{$key} ? $a->{$key} <=> $b->{$key} : -1) :
5614                                 (defined $b->{$key} ? 1 : 0)
5615                 };
5616         }
5617
5618         my %orderings = (
5619                 project => order_str('path'),
5620                 descr => order_str('descr_long'),
5621                 owner => order_str('owner'),
5622                 age => order_num_then_undef('age'),
5623         );
5624
5625         my $ordering = $orderings{$order};
5626         return defined $ordering ? sort $ordering @$projlist : @$projlist;
5627 }
5628
5629 # returns a hash of categories, containing the list of project
5630 # belonging to each category
5631 sub build_projlist_by_category {
5632         my ($projlist, $from, $to) = @_;
5633         my %categories;
5634
5635         $from = 0 unless defined $from;
5636         $to = $#$projlist if (!defined $to || $#$projlist < $to);
5637
5638         for (my $i = $from; $i <= $to; $i++) {
5639                 my $pr = $projlist->[$i];
5640                 push @{$categories{ $pr->{'category'} }}, $pr;
5641         }
5642
5643         return wantarray ? %categories : \%categories;
5644 }
5645
5646 # print 'sort by' <th> element, generating 'sort by $name' replay link
5647 # if that order is not selected
5648 sub print_sort_th {
5649         print format_sort_th(@_);
5650 }
5651
5652 sub format_sort_th {
5653         my ($name, $order, $header) = @_;
5654         my $sort_th = "";
5655         $header ||= ucfirst($name);
5656
5657         if ($order eq $name) {
5658                 $sort_th .= "<th>$header</th>\n";
5659         } else {
5660                 $sort_th .= "<th>" .
5661                             $cgi->a({-href => href(-replay=>1, order=>$name),
5662                                      -class => "header"}, $header) .
5663                             "</th>\n";
5664         }
5665
5666         return $sort_th;
5667 }
5668
5669 sub git_project_list_rows {
5670         my ($projlist, $from, $to, $check_forks) = @_;
5671
5672         $from = 0 unless defined $from;
5673         $to = $#$projlist if (!defined $to || $#$projlist < $to);
5674
5675         my $alternate = 1;
5676         for (my $i = $from; $i <= $to; $i++) {
5677                 my $pr = $projlist->[$i];
5678
5679                 if ($alternate) {
5680                         print "<tr class=\"dark\">\n";
5681                 } else {
5682                         print "<tr class=\"light\">\n";
5683                 }
5684                 $alternate ^= 1;
5685
5686                 if ($check_forks) {
5687                         print "<td>";
5688                         if ($pr->{'forks'}) {
5689                                 my $nforks = scalar @{$pr->{'forks'}};
5690                                 if ($nforks > 0) {
5691                                         print $cgi->a({-href => href(project=>$pr->{'path'}, action=>"forks"),
5692                                                        -title => "$nforks forks"}, "+");
5693                                 } else {
5694                                         print $cgi->span({-title => "$nforks forks"}, "+");
5695                                 }
5696                         }
5697                         print "</td>\n";
5698                 }
5699                 print "<td>" . $cgi->a({-href => href(project=>$pr->{'path'}, action=>"summary"),
5700                                         -class => "list"},
5701                                        esc_html_match_hl($pr->{'path'}, $search_regexp)) .
5702                       "</td>\n" .
5703                       "<td>" . $cgi->a({-href => href(project=>$pr->{'path'}, action=>"summary"),
5704                                         -class => "list",
5705                                         -title => $pr->{'descr_long'}},
5706                                         $search_regexp
5707                                         ? esc_html_match_hl_chopped($pr->{'descr_long'},
5708                                                                     $pr->{'descr'}, $search_regexp)
5709                                         : esc_html($pr->{'descr'})) .
5710                       "</td>\n";
5711                 unless ($omit_owner) {
5712                         print "<td><i>" . chop_and_escape_str($pr->{'owner'}, 15) . "</i></td>\n";
5713                 }
5714                 unless ($omit_age_column) {
5715                         print "<td class=\"". age_class($pr->{'age'}) . "\">" .
5716                             (defined $pr->{'age_string'} ? $pr->{'age_string'} : "No commits") . "</td>\n";
5717                 }
5718                 print"<td class=\"link\">" .
5719                       $cgi->a({-href => href(project=>$pr->{'path'}, action=>"summary")}, "summary")   . " | " .
5720                       $cgi->a({-href => href(project=>$pr->{'path'}, action=>"shortlog")}, "shortlog") . " | " .
5721                       $cgi->a({-href => href(project=>$pr->{'path'}, action=>"log")}, "log") . " | " .
5722                       $cgi->a({-href => href(project=>$pr->{'path'}, action=>"tree")}, "tree") .
5723                       ($pr->{'forks'} ? " | " . $cgi->a({-href => href(project=>$pr->{'path'}, action=>"forks")}, "forks") : '') .
5724                       "</td>\n" .
5725                       "</tr>\n";
5726         }
5727 }
5728
5729 sub git_project_list_body {
5730         # actually uses global variable $project
5731         my ($projlist, $order, $from, $to, $extra, $no_header) = @_;
5732         my @projects = @$projlist;
5733
5734         my $check_forks = gitweb_check_feature('forks');
5735         my $show_ctags  = gitweb_check_feature('ctags');
5736         my $tagfilter = $show_ctags ? $input_params{'ctag'} : undef;
5737         $check_forks = undef
5738                 if ($tagfilter || $search_regexp);
5739
5740         # filtering out forks before filling info allows to do less work
5741         @projects = filter_forks_from_projects_list(\@projects)
5742                 if ($check_forks);
5743         # search_projects_list pre-fills required info
5744         @projects = search_projects_list(\@projects,
5745                                          'search_regexp' => $search_regexp,
5746                                          'tagfilter'  => $tagfilter)
5747                 if ($tagfilter || $search_regexp);
5748         # fill the rest
5749         my @all_fields = ('descr', 'descr_long', 'ctags', 'category');
5750         push @all_fields, ('age', 'age_string') unless($omit_age_column);
5751         push @all_fields, 'owner' unless($omit_owner);
5752         @projects = fill_project_list_info(\@projects, @all_fields);
5753
5754         $order ||= $default_projects_order;
5755         $from = 0 unless defined $from;
5756         $to = $#projects if (!defined $to || $#projects < $to);
5757
5758         # short circuit
5759         if ($from > $to) {
5760                 print "<center>\n".
5761                       "<b>No such projects found</b><br />\n".
5762                       "Click ".$cgi->a({-href=>href(project=>undef)},"here")." to view all projects<br />\n".
5763                       "</center>\n<br />\n";
5764                 return;
5765         }
5766
5767         @projects = sort_projects_list(\@projects, $order);
5768
5769         if ($show_ctags) {
5770                 my $ctags = git_gather_all_ctags(\@projects);
5771                 my $cloud = git_populate_project_tagcloud($ctags);
5772                 print git_show_project_tagcloud($cloud, 64);
5773         }
5774
5775         print "<table class=\"project_list\">\n";
5776         unless ($no_header) {
5777                 print "<tr>\n";
5778                 if ($check_forks) {
5779                         print "<th></th>\n";
5780                 }
5781                 print_sort_th('project', $order, 'Project');
5782                 print_sort_th('descr', $order, 'Description');
5783                 print_sort_th('owner', $order, 'Owner') unless $omit_owner;
5784                 print_sort_th('age', $order, 'Last Change') unless $omit_age_column;
5785                 print "<th></th>\n" . # for links
5786                       "</tr>\n";
5787         }
5788
5789         if ($projects_list_group_categories) {
5790                 # only display categories with projects in the $from-$to window
5791                 @projects = sort {$a->{'category'} cmp $b->{'category'}} @projects[$from..$to];
5792                 my %categories = build_projlist_by_category(\@projects, $from, $to);
5793                 foreach my $cat (sort keys %categories) {
5794                         unless ($cat eq "") {
5795                                 print "<tr>\n";
5796                                 if ($check_forks) {
5797                                         print "<td></td>\n";
5798                                 }
5799                                 print "<td class=\"category\" colspan=\"5\">".esc_html($cat)."</td>\n";
5800                                 print "</tr>\n";
5801                         }
5802
5803                         git_project_list_rows($categories{$cat}, undef, undef, $check_forks);
5804                 }
5805         } else {
5806                 git_project_list_rows(\@projects, $from, $to, $check_forks);
5807         }
5808
5809         if (defined $extra) {
5810                 print "<tr>\n";
5811                 if ($check_forks) {
5812                         print "<td></td>\n";
5813                 }
5814                 print "<td colspan=\"5\">$extra</td>\n" .
5815                       "</tr>\n";
5816         }
5817         print "</table>\n";
5818 }
5819
5820 sub git_log_body {
5821         # uses global variable $project
5822         my ($commitlist, $from, $to, $refs, $extra) = @_;
5823
5824         $from = 0 unless defined $from;
5825         $to = $#{$commitlist} if (!defined $to || $#{$commitlist} < $to);
5826
5827         for (my $i = 0; $i <= $to; $i++) {
5828                 my %co = %{$commitlist->[$i]};
5829                 next if !%co;
5830                 my $commit = $co{'id'};
5831                 my $ref = format_ref_marker($refs, $commit);
5832                 git_print_header_div('commit',
5833                                "<span class=\"age\">$co{'age_string'}</span>" .
5834                                esc_html($co{'title'}) . $ref,
5835                                $commit);
5836                 print "<div class=\"title_text\">\n" .
5837                       "<div class=\"log_link\">\n" .
5838                       $cgi->a({-href => href(action=>"commit", hash=>$commit)}, "commit") .
5839                       " | " .
5840                       $cgi->a({-href => href(action=>"commitdiff", hash=>$commit)}, "commitdiff") .
5841                       " | " .
5842                       $cgi->a({-href => href(action=>"tree", hash=>$commit, hash_base=>$commit)}, "tree") .
5843                       "<br/>\n" .
5844                       "</div>\n";
5845                       git_print_authorship(\%co, -tag => 'span');
5846                       print "<br/>\n</div>\n";
5847
5848                 print "<div class=\"log_body\">\n";
5849                 git_print_log($co{'comment'}, -final_empty_line=> 1);
5850                 print "</div>\n";
5851         }
5852         if ($extra) {
5853                 print "<div class=\"page_nav\">\n";
5854                 print "$extra\n";
5855                 print "</div>\n";
5856         }
5857 }
5858
5859 sub git_shortlog_body {
5860         # uses global variable $project
5861         my ($commitlist, $from, $to, $refs, $extra) = @_;
5862
5863         $from = 0 unless defined $from;
5864         $to = $#{$commitlist} if (!defined $to || $#{$commitlist} < $to);
5865
5866         print "<table class=\"shortlog\">\n";
5867         my $alternate = 1;
5868         for (my $i = $from; $i <= $to; $i++) {
5869                 my %co = %{$commitlist->[$i]};
5870                 my $commit = $co{'id'};
5871                 my $ref = format_ref_marker($refs, $commit);
5872                 if ($alternate) {
5873                         print "<tr class=\"dark\">\n";
5874                 } else {
5875                         print "<tr class=\"light\">\n";
5876                 }
5877                 $alternate ^= 1;
5878                 # git_summary() used print "<td><i>$co{'age_string'}</i></td>\n" .
5879                 print "<td title=\"$co{'age_string_age'}\"><i>$co{'age_string_date'}</i></td>\n" .
5880                       format_author_html('td', \%co, 10) . "<td>";
5881                 print format_subject_html($co{'title'}, $co{'title_short'},
5882                                           href(action=>"commit", hash=>$commit), $ref);
5883                 print "</td>\n" .
5884                       "<td class=\"link\">" .
5885                       $cgi->a({-href => href(action=>"commit", hash=>$commit)}, "commit") . " | " .
5886                       $cgi->a({-href => href(action=>"commitdiff", hash=>$commit)}, "commitdiff") . " | " .
5887                       $cgi->a({-href => href(action=>"tree", hash=>$commit, hash_base=>$commit)}, "tree");
5888                 my $snapshot_links = format_snapshot_links($commit);
5889                 if (defined $snapshot_links) {
5890                         print " | " . $snapshot_links;
5891                 }
5892                 print "</td>\n" .
5893                       "</tr>\n";
5894         }
5895         if (defined $extra) {
5896                 print "<tr>\n" .
5897                       "<td colspan=\"4\">$extra</td>\n" .
5898                       "</tr>\n";
5899         }
5900         print "</table>\n";
5901 }
5902
5903 sub git_history_body {
5904         # Warning: assumes constant type (blob or tree) during history
5905         my ($commitlist, $from, $to, $refs, $extra,
5906             $file_name, $file_hash, $ftype) = @_;
5907
5908         $from = 0 unless defined $from;
5909         $to = $#{$commitlist} unless (defined $to && $to <= $#{$commitlist});
5910
5911         print "<table class=\"history\">\n";
5912         my $alternate = 1;
5913         for (my $i = $from; $i <= $to; $i++) {
5914                 my %co = %{$commitlist->[$i]};
5915                 if (!%co) {
5916                         next;
5917                 }
5918                 my $commit = $co{'id'};
5919
5920                 my $ref = format_ref_marker($refs, $commit);
5921
5922                 if ($alternate) {
5923                         print "<tr class=\"dark\">\n";
5924                 } else {
5925                         print "<tr class=\"light\">\n";
5926                 }
5927                 $alternate ^= 1;
5928                 print "<td title=\"$co{'age_string_age'}\"><i>$co{'age_string_date'}</i></td>\n" .
5929         # shortlog:   format_author_html('td', \%co, 10)
5930                       format_author_html('td', \%co, 15, 3) . "<td>";
5931                 # originally git_history used chop_str($co{'title'}, 50)
5932                 print format_subject_html($co{'title'}, $co{'title_short'},
5933                                           href(action=>"commit", hash=>$commit), $ref);
5934                 print "</td>\n" .
5935                       "<td class=\"link\">" .
5936                       $cgi->a({-href => href(action=>$ftype, hash_base=>$commit, file_name=>$file_name)}, $ftype) . " | " .
5937                       $cgi->a({-href => href(action=>"commitdiff", hash=>$commit)}, "commitdiff");
5938
5939                 if ($ftype eq 'blob') {
5940                         my $blob_current = $file_hash;
5941                         my $blob_parent  = git_get_hash_by_path($commit, $file_name);
5942                         if (defined $blob_current && defined $blob_parent &&
5943                                         $blob_current ne $blob_parent) {
5944                                 print " | " .
5945                                         $cgi->a({-href => href(action=>"blobdiff",
5946                                                                hash=>$blob_current, hash_parent=>$blob_parent,
5947                                                                hash_base=>$hash_base, hash_parent_base=>$commit,
5948                                                                file_name=>$file_name)},
5949                                                 "diff to current");
5950                         }
5951                 }
5952                 print "</td>\n" .
5953                       "</tr>\n";
5954         }
5955         if (defined $extra) {
5956                 print "<tr>\n" .
5957                       "<td colspan=\"4\">$extra</td>\n" .
5958                       "</tr>\n";
5959         }
5960         print "</table>\n";
5961 }
5962
5963 sub git_tags_body {
5964         # uses global variable $project
5965         my ($taglist, $from, $to, $extra) = @_;
5966         $from = 0 unless defined $from;
5967         $to = $#{$taglist} if (!defined $to || $#{$taglist} < $to);
5968
5969         print "<table class=\"tags\">\n";
5970         my $alternate = 1;
5971         for (my $i = $from; $i <= $to; $i++) {
5972                 my $entry = $taglist->[$i];
5973                 my %tag = %$entry;
5974                 my $comment = $tag{'subject'};
5975                 my $comment_short;
5976                 if (defined $comment) {
5977                         $comment_short = chop_str($comment, 30, 5);
5978                 }
5979                 if ($alternate) {
5980                         print "<tr class=\"dark\">\n";
5981                 } else {
5982                         print "<tr class=\"light\">\n";
5983                 }
5984                 $alternate ^= 1;
5985                 if (defined $tag{'age'}) {
5986                         print "<td><i>$tag{'age'}</i></td>\n";
5987                 } else {
5988                         print "<td></td>\n";
5989                 }
5990                 print "<td>" .
5991                       $cgi->a({-href => href(action=>$tag{'reftype'}, hash=>$tag{'refid'}),
5992                                -class => "list name"}, esc_html($tag{'name'})) .
5993                       "</td>\n" .
5994                       "<td>";
5995                 if (defined $comment) {
5996                         print format_subject_html($comment, $comment_short,
5997                                                   href(action=>"tag", hash=>$tag{'id'}));
5998                 }
5999                 print "</td>\n" .
6000                       "<td class=\"selflink\">";
6001                 if ($tag{'type'} eq "tag") {
6002                         print $cgi->a({-href => href(action=>"tag", hash=>$tag{'id'})}, "tag");
6003                 } else {
6004                         print "&nbsp;";
6005                 }
6006                 print "</td>\n" .
6007                       "<td class=\"link\">" . " | " .
6008                       $cgi->a({-href => href(action=>$tag{'reftype'}, hash=>$tag{'refid'})}, $tag{'reftype'});
6009                 if ($tag{'reftype'} eq "commit") {
6010                         print " | " . $cgi->a({-href => href(action=>"shortlog", hash=>$tag{'fullname'})}, "shortlog") .
6011                               " | " . $cgi->a({-href => href(action=>"log", hash=>$tag{'fullname'})}, "log");
6012                 } elsif ($tag{'reftype'} eq "blob") {
6013                         print " | " . $cgi->a({-href => href(action=>"blob_plain", hash=>$tag{'refid'})}, "raw");
6014                 }
6015                 print "</td>\n" .
6016                       "</tr>";
6017         }
6018         if (defined $extra) {
6019                 print "<tr>\n" .
6020                       "<td colspan=\"5\">$extra</td>\n" .
6021                       "</tr>\n";
6022         }
6023         print "</table>\n";
6024 }
6025
6026 sub git_heads_body {
6027         # uses global variable $project
6028         my ($headlist, $head_at, $from, $to, $extra) = @_;
6029         $from = 0 unless defined $from;
6030         $to = $#{$headlist} if (!defined $to || $#{$headlist} < $to);
6031
6032         print "<table class=\"heads\">\n";
6033         my $alternate = 1;
6034         for (my $i = $from; $i <= $to; $i++) {
6035                 my $entry = $headlist->[$i];
6036                 my %ref = %$entry;
6037                 my $curr = defined $head_at && $ref{'id'} eq $head_at;
6038                 if ($alternate) {
6039                         print "<tr class=\"dark\">\n";
6040                 } else {
6041                         print "<tr class=\"light\">\n";
6042                 }
6043                 $alternate ^= 1;
6044                 print "<td><i>$ref{'age'}</i></td>\n" .
6045                       ($curr ? "<td class=\"current_head\">" : "<td>") .
6046                       $cgi->a({-href => href(action=>"shortlog", hash=>$ref{'fullname'}),
6047                                -class => "list name"},esc_html($ref{'name'})) .
6048                       "</td>\n" .
6049                       "<td class=\"link\">" .
6050                       $cgi->a({-href => href(action=>"shortlog", hash=>$ref{'fullname'})}, "shortlog") . " | " .
6051                       $cgi->a({-href => href(action=>"log", hash=>$ref{'fullname'})}, "log") . " | " .
6052                       $cgi->a({-href => href(action=>"tree", hash=>$ref{'fullname'}, hash_base=>$ref{'fullname'})}, "tree") .
6053                       "</td>\n" .
6054                       "</tr>";
6055         }
6056         if (defined $extra) {
6057                 print "<tr>\n" .
6058                       "<td colspan=\"3\">$extra</td>\n" .
6059                       "</tr>\n";
6060         }
6061         print "</table>\n";
6062 }
6063
6064 # Display a single remote block
6065 sub git_remote_block {
6066         my ($remote, $rdata, $limit, $head) = @_;
6067
6068         my $heads = $rdata->{'heads'};
6069         my $fetch = $rdata->{'fetch'};
6070         my $push = $rdata->{'push'};
6071
6072         my $urls_table = "<table class=\"projects_list\">\n" ;
6073
6074         if (defined $fetch) {
6075                 if ($fetch eq $push) {
6076                         $urls_table .= format_repo_url("URL", $fetch);
6077                 } else {
6078                         $urls_table .= format_repo_url("Fetch URL", $fetch);
6079                         $urls_table .= format_repo_url("Push URL", $push) if defined $push;
6080                 }
6081         } elsif (defined $push) {
6082                 $urls_table .= format_repo_url("Push URL", $push);
6083         } else {
6084                 $urls_table .= format_repo_url("", "No remote URL");
6085         }
6086
6087         $urls_table .= "</table>\n";
6088
6089         my $dots;
6090         if (defined $limit && $limit < @$heads) {
6091                 $dots = $cgi->a({-href => href(action=>"remotes", hash=>$remote)}, "...");
6092         }
6093
6094         print $urls_table;
6095         git_heads_body($heads, $head, 0, $limit, $dots);
6096 }
6097
6098 # Display a list of remote names with the respective fetch and push URLs
6099 sub git_remotes_list {
6100         my ($remotedata, $limit) = @_;
6101         print "<table class=\"heads\">\n";
6102         my $alternate = 1;
6103         my @remotes = sort keys %$remotedata;
6104
6105         my $limited = $limit && $limit < @remotes;
6106
6107         $#remotes = $limit - 1 if $limited;
6108
6109         while (my $remote = shift @remotes) {
6110                 my $rdata = $remotedata->{$remote};
6111                 my $fetch = $rdata->{'fetch'};
6112                 my $push = $rdata->{'push'};
6113                 if ($alternate) {
6114                         print "<tr class=\"dark\">\n";
6115                 } else {
6116                         print "<tr class=\"light\">\n";
6117                 }
6118                 $alternate ^= 1;
6119                 print "<td>" .
6120                       $cgi->a({-href=> href(action=>'remotes', hash=>$remote),
6121                                -class=> "list name"},esc_html($remote)) .
6122                       "</td>";
6123                 print "<td class=\"link\">" .
6124                       (defined $fetch ? $cgi->a({-href=> $fetch}, "fetch") : "fetch") .
6125                       " | " .
6126                       (defined $push ? $cgi->a({-href=> $push}, "push") : "push") .
6127                       "</td>";
6128
6129                 print "</tr>\n";
6130         }
6131
6132         if ($limited) {
6133                 print "<tr>\n" .
6134                       "<td colspan=\"3\">" .
6135                       $cgi->a({-href => href(action=>"remotes")}, "...") .
6136                       "</td>\n" . "</tr>\n";
6137         }
6138
6139         print "</table>";
6140 }
6141
6142 # Display remote heads grouped by remote, unless there are too many
6143 # remotes, in which case we only display the remote names
6144 sub git_remotes_body {
6145         my ($remotedata, $limit, $head) = @_;
6146         if ($limit and $limit < keys %$remotedata) {
6147                 git_remotes_list($remotedata, $limit);
6148         } else {
6149                 fill_remote_heads($remotedata);
6150                 while (my ($remote, $rdata) = each %$remotedata) {
6151                         git_print_section({-class=>"remote", -id=>$remote},
6152                                 ["remotes", $remote, $remote], sub {
6153                                         git_remote_block($remote, $rdata, $limit, $head);
6154                                 });
6155                 }
6156         }
6157 }
6158
6159 sub git_search_message {
6160         my %co = @_;
6161
6162         my $greptype;
6163         if ($searchtype eq 'commit') {
6164                 $greptype = "--grep=";
6165         } elsif ($searchtype eq 'author') {
6166                 $greptype = "--author=";
6167         } elsif ($searchtype eq 'committer') {
6168                 $greptype = "--committer=";
6169         }
6170         $greptype .= $searchtext;
6171         my @commitlist = parse_commits($hash, 101, (100 * $page), undef,
6172                                        $greptype, '--regexp-ignore-case',
6173                                        $search_use_regexp ? '--extended-regexp' : '--fixed-strings');
6174
6175         my $paging_nav = '';
6176         if ($page > 0) {
6177                 $paging_nav .=
6178                         $cgi->a({-href => href(-replay=>1, page=>undef)},
6179                                 "first") .
6180                         " &sdot; " .
6181                         $cgi->a({-href => href(-replay=>1, page=>$page-1),
6182                                  -accesskey => "p", -title => "Alt-p"}, "prev");
6183         } else {
6184                 $paging_nav .= "first &sdot; prev";
6185         }
6186         my $next_link = '';
6187         if ($#commitlist >= 100) {
6188                 $next_link =
6189                         $cgi->a({-href => href(-replay=>1, page=>$page+1),
6190                                  -accesskey => "n", -title => "Alt-n"}, "next");
6191                 $paging_nav .= " &sdot; $next_link";
6192         } else {
6193                 $paging_nav .= " &sdot; next";
6194         }
6195
6196         git_header_html();
6197
6198         git_print_page_nav('','', $hash,$co{'tree'},$hash, $paging_nav);
6199         git_print_header_div('commit', esc_html($co{'title'}), $hash);
6200         if ($page == 0 && !@commitlist) {
6201                 print "<p>No match.</p>\n";
6202         } else {
6203                 git_search_grep_body(\@commitlist, 0, 99, $next_link);
6204         }
6205
6206         git_footer_html();
6207 }
6208
6209 sub git_search_changes {
6210         my %co = @_;
6211
6212         local $/ = "\n";
6213         open my $fd, '-|', git_cmd(), '--no-pager', 'log', @diff_opts,
6214                 '--pretty=format:%H', '--no-abbrev', '--raw', "-S$searchtext",
6215                 ($search_use_regexp ? '--pickaxe-regex' : ())
6216                         or die_error(500, "Open git-log failed");
6217
6218         git_header_html();
6219
6220         git_print_page_nav('','', $hash,$co{'tree'},$hash);
6221         git_print_header_div('commit', esc_html($co{'title'}), $hash);
6222
6223         print "<table class=\"pickaxe search\">\n";
6224         my $alternate = 1;
6225         undef %co;
6226         my @files;
6227         while (my $line = <$fd>) {
6228                 chomp $line;
6229                 next unless $line;
6230
6231                 my %set = parse_difftree_raw_line($line);
6232                 if (defined $set{'commit'}) {
6233                         # finish previous commit
6234                         if (%co) {
6235                                 print "</td>\n" .
6236                                       "<td class=\"link\">" .
6237                                       $cgi->a({-href => href(action=>"commit", hash=>$co{'id'})},
6238                                               "commit") .
6239                                       " | " .
6240                                       $cgi->a({-href => href(action=>"tree", hash=>$co{'tree'},
6241                                                              hash_base=>$co{'id'})},
6242                                               "tree") .
6243                                       "</td>\n" .
6244                                       "</tr>\n";
6245                         }
6246
6247                         if ($alternate) {
6248                                 print "<tr class=\"dark\">\n";
6249                         } else {
6250                                 print "<tr class=\"light\">\n";
6251                         }
6252                         $alternate ^= 1;
6253                         %co = parse_commit($set{'commit'});
6254                         my $author = chop_and_escape_str($co{'author_name'}, 15, 5);
6255                         print "<td title=\"$co{'age_string_age'}\"><i>$co{'age_string_date'}</i></td>\n" .
6256                               "<td><i>$author</i></td>\n" .
6257                               "<td>" .
6258                               $cgi->a({-href => href(action=>"commit", hash=>$co{'id'}),
6259                                       -class => "list subject"},
6260                                       chop_and_escape_str($co{'title'}, 50) . "<br/>");
6261                 } elsif (defined $set{'to_id'}) {
6262                         next if ($set{'to_id'} =~ m/^0{40}$/);
6263
6264                         print $cgi->a({-href => href(action=>"blob", hash_base=>$co{'id'},
6265                                                      hash=>$set{'to_id'}, file_name=>$set{'to_file'}),
6266                                       -class => "list"},
6267                                       "<span class=\"match\">" . esc_path($set{'file'}) . "</span>") .
6268                               "<br/>\n";
6269                 }
6270         }
6271         close $fd;
6272
6273         # finish last commit (warning: repetition!)
6274         if (%co) {
6275                 print "</td>\n" .
6276                       "<td class=\"link\">" .
6277                       $cgi->a({-href => href(action=>"commit", hash=>$co{'id'})},
6278                               "commit") .
6279                       " | " .
6280                       $cgi->a({-href => href(action=>"tree", hash=>$co{'tree'},
6281                                              hash_base=>$co{'id'})},
6282                               "tree") .
6283                       "</td>\n" .
6284                       "</tr>\n";
6285         }
6286
6287         print "</table>\n";
6288
6289         git_footer_html();
6290 }
6291
6292 sub git_search_files {
6293         my %co = @_;
6294
6295         local $/ = "\n";
6296         open my $fd, "-|", git_cmd(), 'grep', '-n', '-z',
6297                 $search_use_regexp ? ('-E', '-i') : '-F',
6298                 $searchtext, $co{'tree'}
6299                         or die_error(500, "Open git-grep failed");
6300
6301         git_header_html();
6302
6303         git_print_page_nav('','', $hash,$co{'tree'},$hash);
6304         git_print_header_div('commit', esc_html($co{'title'}), $hash);
6305
6306         print "<table class=\"grep_search\">\n";
6307         my $alternate = 1;
6308         my $matches = 0;
6309         my $lastfile = '';
6310         my $file_href;
6311         while (my $line = <$fd>) {
6312                 chomp $line;
6313                 my ($file, $lno, $ltext, $binary);
6314                 last if ($matches++ > 1000);
6315                 if ($line =~ /^Binary file (.+) matches$/) {
6316                         $file = $1;
6317                         $binary = 1;
6318                 } else {
6319                         ($file, $lno, $ltext) = split(/\0/, $line, 3);
6320                         $file =~ s/^$co{'tree'}://;
6321                 }
6322                 if ($file ne $lastfile) {
6323                         $lastfile and print "</td></tr>\n";
6324                         if ($alternate++) {
6325                                 print "<tr class=\"dark\">\n";
6326                         } else {
6327                                 print "<tr class=\"light\">\n";
6328                         }
6329                         $file_href = href(action=>"blob", hash_base=>$co{'id'},
6330                                           file_name=>$file);
6331                         print "<td class=\"list\">".
6332                                 $cgi->a({-href => $file_href, -class => "list"}, esc_path($file));
6333                         print "</td><td>\n";
6334                         $lastfile = $file;
6335                 }
6336                 if ($binary) {
6337                         print "<div class=\"binary\">Binary file</div>\n";
6338                 } else {
6339                         $ltext = untabify($ltext);
6340                         if ($ltext =~ m/^(.*)($search_regexp)(.*)$/i) {
6341                                 $ltext = esc_html($1, -nbsp=>1);
6342                                 $ltext .= '<span class="match">';
6343                                 $ltext .= esc_html($2, -nbsp=>1);
6344                                 $ltext .= '</span>';
6345                                 $ltext .= esc_html($3, -nbsp=>1);
6346                         } else {
6347                                 $ltext = esc_html($ltext, -nbsp=>1);
6348                         }
6349                         print "<div class=\"pre\">" .
6350                                 $cgi->a({-href => $file_href.'#l'.$lno,
6351                                         -class => "linenr"}, sprintf('%4i', $lno)) .
6352                                 ' ' .  $ltext . "</div>\n";
6353                 }
6354         }
6355         if ($lastfile) {
6356                 print "</td></tr>\n";
6357                 if ($matches > 1000) {
6358                         print "<div class=\"diff nodifferences\">Too many matches, listing trimmed</div>\n";
6359                 }
6360         } else {
6361                 print "<div class=\"diff nodifferences\">No matches found</div>\n";
6362         }
6363         close $fd;
6364
6365         print "</table>\n";
6366
6367         git_footer_html();
6368 }
6369
6370 sub git_search_grep_body {
6371         my ($commitlist, $from, $to, $extra) = @_;
6372         $from = 0 unless defined $from;
6373         $to = $#{$commitlist} if (!defined $to || $#{$commitlist} < $to);
6374
6375         print "<table class=\"commit_search\">\n";
6376         my $alternate = 1;
6377         for (my $i = $from; $i <= $to; $i++) {
6378                 my %co = %{$commitlist->[$i]};
6379                 if (!%co) {
6380                         next;
6381                 }
6382                 my $commit = $co{'id'};
6383                 if ($alternate) {
6384                         print "<tr class=\"dark\">\n";
6385                 } else {
6386                         print "<tr class=\"light\">\n";
6387                 }
6388                 $alternate ^= 1;
6389                 print "<td title=\"$co{'age_string_age'}\"><i>$co{'age_string_date'}</i></td>\n" .
6390                       format_author_html('td', \%co, 15, 5) .
6391                       "<td>" .
6392                       $cgi->a({-href => href(action=>"commit", hash=>$co{'id'}),
6393                                -class => "list subject"},
6394                               chop_and_escape_str($co{'title'}, 50) . "<br/>");
6395                 my $comment = $co{'comment'};
6396                 foreach my $line (@$comment) {
6397                         if ($line =~ m/^(.*?)($search_regexp)(.*)$/i) {
6398                                 my ($lead, $match, $trail) = ($1, $2, $3);
6399                                 $match = chop_str($match, 70, 5, 'center');
6400                                 my $contextlen = int((80 - length($match))/2);
6401                                 $contextlen = 30 if ($contextlen > 30);
6402                                 $lead  = chop_str($lead,  $contextlen, 10, 'left');
6403                                 $trail = chop_str($trail, $contextlen, 10, 'right');
6404
6405                                 $lead  = esc_html($lead);
6406                                 $match = esc_html($match);
6407                                 $trail = esc_html($trail);
6408
6409                                 print "$lead<span class=\"match\">$match</span>$trail<br />";
6410                         }
6411                 }
6412                 print "</td>\n" .
6413                       "<td class=\"link\">" .
6414                       $cgi->a({-href => href(action=>"commit", hash=>$co{'id'})}, "commit") .
6415                       " | " .
6416                       $cgi->a({-href => href(action=>"commitdiff", hash=>$co{'id'})}, "commitdiff") .
6417                       " | " .
6418                       $cgi->a({-href => href(action=>"tree", hash=>$co{'tree'}, hash_base=>$co{'id'})}, "tree");
6419                 print "</td>\n" .
6420                       "</tr>\n";
6421         }
6422         if (defined $extra) {
6423                 print "<tr>\n" .
6424                       "<td colspan=\"3\">$extra</td>\n" .
6425                       "</tr>\n";
6426         }
6427         print "</table>\n";
6428 }
6429
6430 ## ======================================================================
6431 ## ======================================================================
6432 ## actions
6433
6434 sub git_project_list {
6435         my $order = $input_params{'order'};
6436         if (defined $order && $order !~ m/none|project|descr|owner|age/) {
6437                 die_error(400, "Unknown order parameter");
6438         }
6439
6440         my @list = git_get_projects_list($project_filter, $strict_export);
6441         if (!@list) {
6442                 die_error(404, "No projects found");
6443         }
6444
6445         git_header_html();
6446         if (defined $home_text && -f $home_text) {
6447                 print "<div class=\"index_include\">\n";
6448                 insert_file($home_text);
6449                 print "</div>\n";
6450         }
6451
6452         git_project_search_form($searchtext, $search_use_regexp);
6453         git_project_list_body(\@list, $order);
6454         git_footer_html();
6455 }
6456
6457 sub git_forks {
6458         my $order = $input_params{'order'};
6459         if (defined $order && $order !~ m/none|project|descr|owner|age/) {
6460                 die_error(400, "Unknown order parameter");
6461         }
6462
6463         my $filter = $project;
6464         $filter =~ s/\.git$//;
6465         my @list = git_get_projects_list($filter);
6466         if (!@list) {
6467                 die_error(404, "No forks found");
6468         }
6469
6470         git_header_html();
6471         git_print_page_nav('','');
6472         git_print_header_div('summary', "$project forks");
6473         git_project_list_body(\@list, $order);
6474         git_footer_html();
6475 }
6476
6477 sub git_project_index {
6478         my @projects = git_get_projects_list($project_filter, $strict_export);
6479         if (!@projects) {
6480                 die_error(404, "No projects found");
6481         }
6482
6483         print $cgi->header(
6484                 -type => 'text/plain',
6485                 -charset => 'utf-8',
6486                 -content_disposition => 'inline; filename="index.aux"');
6487
6488         foreach my $pr (@projects) {
6489                 if (!exists $pr->{'owner'}) {
6490                         $pr->{'owner'} = git_get_project_owner("$pr->{'path'}");
6491                 }
6492
6493                 my ($path, $owner) = ($pr->{'path'}, $pr->{'owner'});
6494                 # quote as in CGI::Util::encode, but keep the slash, and use '+' for ' '
6495                 $path  =~ s/([^a-zA-Z0-9_.\-\/ ])/sprintf("%%%02X", ord($1))/eg;
6496                 $owner =~ s/([^a-zA-Z0-9_.\-\/ ])/sprintf("%%%02X", ord($1))/eg;
6497                 $path  =~ s/ /\+/g;
6498                 $owner =~ s/ /\+/g;
6499
6500                 print "$path $owner\n";
6501         }
6502 }
6503
6504 sub git_summary {
6505         my $descr = git_get_project_description($project) || "none";
6506         my %co = parse_commit("HEAD");
6507         my %cd = %co ? parse_date($co{'committer_epoch'}, $co{'committer_tz'}) : ();
6508         my $head = $co{'id'};
6509         my $remote_heads = gitweb_check_feature('remote_heads');
6510
6511         my $owner = git_get_project_owner($project);
6512
6513         my $refs = git_get_references();
6514         # These get_*_list functions return one more to allow us to see if
6515         # there are more ...
6516         my @taglist  = git_get_tags_list(16);
6517         my @headlist = git_get_heads_list(16);
6518         my %remotedata = $remote_heads ? git_get_remotes_list() : ();
6519         my @forklist;
6520         my $check_forks = gitweb_check_feature('forks');
6521
6522         if ($check_forks) {
6523                 # find forks of a project
6524                 my $filter = $project;
6525                 $filter =~ s/\.git$//;
6526                 @forklist = git_get_projects_list($filter);
6527                 # filter out forks of forks
6528                 @forklist = filter_forks_from_projects_list(\@forklist)
6529                         if (@forklist);
6530         }
6531
6532         git_header_html();
6533         git_print_page_nav('summary','', $head);
6534
6535         print "<div class=\"title\">&nbsp;</div>\n";
6536         print "<table class=\"projects_list\">\n" .
6537               "<tr id=\"metadata_desc\"><td>description</td><td>" . esc_html($descr) . "</td></tr>\n";
6538         if ($owner and not $omit_owner) {
6539                 print  "<tr id=\"metadata_owner\"><td>owner</td><td>" . esc_html($owner) . "</td></tr>\n";
6540         }
6541         if (defined $cd{'rfc2822'}) {
6542                 print "<tr id=\"metadata_lchange\"><td>last change</td>" .
6543                       "<td>".format_timestamp_html(\%cd)."</td></tr>\n";
6544         }
6545
6546         # use per project git URL list in $projectroot/$project/cloneurl
6547         # or make project git URL from git base URL and project name
6548         my $url_tag = "URL";
6549         my @url_list = git_get_project_url_list($project);
6550         @url_list = map { "$_/$project" } @git_base_url_list unless @url_list;
6551         foreach my $git_url (@url_list) {
6552                 next unless $git_url;
6553                 print format_repo_url($url_tag, $git_url);
6554                 $url_tag = "";
6555         }
6556
6557         # Tag cloud
6558         my $show_ctags = gitweb_check_feature('ctags');
6559         if ($show_ctags) {
6560                 my $ctags = git_get_project_ctags($project);
6561                 if (%$ctags) {
6562                         # without ability to add tags, don't show if there are none
6563                         my $cloud = git_populate_project_tagcloud($ctags);
6564                         print "<tr id=\"metadata_ctags\">" .
6565                               "<td>content tags</td>" .
6566                               "<td>".git_show_project_tagcloud($cloud, 48)."</td>" .
6567                               "</tr>\n";
6568                 }
6569         }
6570
6571         print "</table>\n";
6572
6573         # If XSS prevention is on, we don't include README.html.
6574         # TODO: Allow a readme in some safe format.
6575         if (!$prevent_xss && -s "$projectroot/$project/README.html") {
6576                 print "<div class=\"title\">readme</div>\n" .
6577                       "<div class=\"readme\">\n";
6578                 insert_file("$projectroot/$project/README.html");
6579                 print "\n</div>\n"; # class="readme"
6580         }
6581
6582         # we need to request one more than 16 (0..15) to check if
6583         # those 16 are all
6584         my @commitlist = $head ? parse_commits($head, 17) : ();
6585         if (@commitlist) {
6586                 git_print_header_div('shortlog');
6587                 git_shortlog_body(\@commitlist, 0, 15, $refs,
6588                                   $#commitlist <=  15 ? undef :
6589                                   $cgi->a({-href => href(action=>"shortlog")}, "..."));
6590         }
6591
6592         if (@taglist) {
6593                 git_print_header_div('tags');
6594                 git_tags_body(\@taglist, 0, 15,
6595                               $#taglist <=  15 ? undef :
6596                               $cgi->a({-href => href(action=>"tags")}, "..."));
6597         }
6598
6599         if (@headlist) {
6600                 git_print_header_div('heads');
6601                 git_heads_body(\@headlist, $head, 0, 15,
6602                                $#headlist <= 15 ? undef :
6603                                $cgi->a({-href => href(action=>"heads")}, "..."));
6604         }
6605
6606         if (%remotedata) {
6607                 git_print_header_div('remotes');
6608                 git_remotes_body(\%remotedata, 15, $head);
6609         }
6610
6611         if (@forklist) {
6612                 git_print_header_div('forks');
6613                 git_project_list_body(\@forklist, 'age', 0, 15,
6614                                       $#forklist <= 15 ? undef :
6615                                       $cgi->a({-href => href(action=>"forks")}, "..."),
6616                                       'no_header');
6617         }
6618
6619         git_footer_html();
6620 }
6621
6622 sub git_tag {
6623         my %tag = parse_tag($hash);
6624
6625         if (! %tag) {
6626                 die_error(404, "Unknown tag object");
6627         }
6628
6629         my $head = git_get_head_hash($project);
6630         git_header_html();
6631         git_print_page_nav('','', $head,undef,$head);
6632         git_print_header_div('commit', esc_html($tag{'name'}), $hash);
6633         print "<div class=\"title_text\">\n" .
6634               "<table class=\"object_header\">\n" .
6635               "<tr>\n" .
6636               "<td>object</td>\n" .
6637               "<td>" . $cgi->a({-class => "list", -href => href(action=>$tag{'type'}, hash=>$tag{'object'})},
6638                                $tag{'object'}) . "</td>\n" .
6639               "<td class=\"link\">" . $cgi->a({-href => href(action=>$tag{'type'}, hash=>$tag{'object'})},
6640                                               $tag{'type'}) . "</td>\n" .
6641               "</tr>\n";
6642         if (defined($tag{'author'})) {
6643                 git_print_authorship_rows(\%tag, 'author');
6644         }
6645         print "</table>\n\n" .
6646               "</div>\n";
6647         print "<div class=\"page_body\">";
6648         my $comment = $tag{'comment'};
6649         foreach my $line (@$comment) {
6650                 chomp $line;
6651                 print esc_html($line, -nbsp=>1) . "<br/>\n";
6652         }
6653         print "</div>\n";
6654         git_footer_html();
6655 }
6656
6657 sub git_blame_common {
6658         my $format = shift || 'porcelain';
6659         if ($format eq 'porcelain' && $input_params{'javascript'}) {
6660                 $format = 'incremental';
6661                 $action = 'blame_incremental'; # for page title etc
6662         }
6663
6664         # permissions
6665         gitweb_check_feature('blame')
6666                 or die_error(403, "Blame view not allowed");
6667
6668         # error checking
6669         die_error(400, "No file name given") unless $file_name;
6670         $hash_base ||= git_get_head_hash($project);
6671         die_error(404, "Couldn't find base commit") unless $hash_base;
6672         my %co = parse_commit($hash_base)
6673                 or die_error(404, "Commit not found");
6674         my $ftype = "blob";
6675         if (!defined $hash) {
6676                 $hash = git_get_hash_by_path($hash_base, $file_name, "blob")
6677                         or die_error(404, "Error looking up file");
6678         } else {
6679                 $ftype = git_get_type($hash);
6680                 if ($ftype !~ "blob") {
6681                         die_error(400, "Object is not a blob");
6682                 }
6683         }
6684
6685         my $fd;
6686         if ($format eq 'incremental') {
6687                 # get file contents (as base)
6688                 open $fd, "-|", git_cmd(), 'cat-file', 'blob', $hash
6689                         or die_error(500, "Open git-cat-file failed");
6690         } elsif ($format eq 'data') {
6691                 # run git-blame --incremental
6692                 open $fd, "-|", git_cmd(), "blame", "--incremental",
6693                         $hash_base, "--", $file_name
6694                         or die_error(500, "Open git-blame --incremental failed");
6695         } else {
6696                 # run git-blame --porcelain
6697                 open $fd, "-|", git_cmd(), "blame", '-p',
6698                         $hash_base, '--', $file_name
6699                         or die_error(500, "Open git-blame --porcelain failed");
6700         }
6701         binmode $fd, ':utf8';
6702
6703         # incremental blame data returns early
6704         if ($format eq 'data') {
6705                 print $cgi->header(
6706                         -type=>"text/plain", -charset => "utf-8",
6707                         -status=> "200 OK");
6708                 local $| = 1; # output autoflush
6709                 while (my $line = <$fd>) {
6710                         print to_utf8($line);
6711                 }
6712                 close $fd
6713                         or print "ERROR $!\n";
6714
6715                 print 'END';
6716                 if (defined $t0 && gitweb_check_feature('timed')) {
6717                         print ' '.
6718                               tv_interval($t0, [ gettimeofday() ]).
6719                               ' '.$number_of_git_cmds;
6720                 }
6721                 print "\n";
6722
6723                 return;
6724         }
6725
6726         # page header
6727         git_header_html();
6728         my $formats_nav =
6729                 $cgi->a({-href => href(action=>"blob", -replay=>1)},
6730                         "blob") .
6731                 " | ";
6732         if ($format eq 'incremental') {
6733                 $formats_nav .=
6734                         $cgi->a({-href => href(action=>"blame", javascript=>0, -replay=>1)},
6735                                 "blame") . " (non-incremental)";
6736         } else {
6737                 $formats_nav .=
6738                         $cgi->a({-href => href(action=>"blame_incremental", -replay=>1)},
6739                                 "blame") . " (incremental)";
6740         }
6741         $formats_nav .=
6742                 " | " .
6743                 $cgi->a({-href => href(action=>"history", -replay=>1)},
6744                         "history") .
6745                 " | " .
6746                 $cgi->a({-href => href(action=>$action, file_name=>$file_name)},
6747                         "HEAD");
6748         git_print_page_nav('','', $hash_base,$co{'tree'},$hash_base, $formats_nav);
6749         git_print_header_div('commit', esc_html($co{'title'}), $hash_base);
6750         git_print_page_path($file_name, $ftype, $hash_base);
6751
6752         # page body
6753         if ($format eq 'incremental') {
6754                 print "<noscript>\n<div class=\"error\"><center><b>\n".
6755                       "This page requires JavaScript to run.\n Use ".
6756                       $cgi->a({-href => href(action=>'blame',javascript=>0,-replay=>1)},
6757                               'this page').
6758                       " instead.\n".
6759                       "</b></center></div>\n</noscript>\n";
6760
6761                 print qq!<div id="progress_bar" style="width: 100%; background-color: yellow"></div>\n!;
6762         }
6763
6764         print qq!<div class="page_body">\n!;
6765         print qq!<div id="progress_info">... / ...</div>\n!
6766                 if ($format eq 'incremental');
6767         print qq!<table id="blame_table" class="blame" width="100%">\n!.
6768               #qq!<col width="5.5em" /><col width="2.5em" /><col width="*" />\n!.
6769               qq!<thead>\n!.
6770               qq!<tr><th>Commit</th><th>Line</th><th>Data</th></tr>\n!.
6771               qq!</thead>\n!.
6772               qq!<tbody>\n!;
6773
6774         my @rev_color = qw(light dark);
6775         my $num_colors = scalar(@rev_color);
6776         my $current_color = 0;
6777
6778         if ($format eq 'incremental') {
6779                 my $color_class = $rev_color[$current_color];
6780
6781                 #contents of a file
6782                 my $linenr = 0;
6783         LINE:
6784                 while (my $line = <$fd>) {
6785                         chomp $line;
6786                         $linenr++;
6787
6788                         print qq!<tr id="l$linenr" class="$color_class">!.
6789                               qq!<td class="sha1"><a href=""> </a></td>!.
6790                               qq!<td class="linenr">!.
6791                               qq!<a class="linenr" href="">$linenr</a></td>!;
6792                         print qq!<td class="pre">! . esc_html($line) . "</td>\n";
6793                         print qq!</tr>\n!;
6794                 }
6795
6796         } else { # porcelain, i.e. ordinary blame
6797                 my %metainfo = (); # saves information about commits
6798
6799                 # blame data
6800         LINE:
6801                 while (my $line = <$fd>) {
6802                         chomp $line;
6803                         # the header: <SHA-1> <src lineno> <dst lineno> [<lines in group>]
6804                         # no <lines in group> for subsequent lines in group of lines
6805                         my ($full_rev, $orig_lineno, $lineno, $group_size) =
6806                            ($line =~ /^([0-9a-f]{40}) (\d+) (\d+)(?: (\d+))?$/);
6807                         if (!exists $metainfo{$full_rev}) {
6808                                 $metainfo{$full_rev} = { 'nprevious' => 0 };
6809                         }
6810                         my $meta = $metainfo{$full_rev};
6811                         my $data;
6812                         while ($data = <$fd>) {
6813                                 chomp $data;
6814                                 last if ($data =~ s/^\t//); # contents of line
6815                                 if ($data =~ /^(\S+)(?: (.*))?$/) {
6816                                         $meta->{$1} = $2 unless exists $meta->{$1};
6817                                 }
6818                                 if ($data =~ /^previous /) {
6819                                         $meta->{'nprevious'}++;
6820                                 }
6821                         }
6822                         my $short_rev = substr($full_rev, 0, 8);
6823                         my $author = $meta->{'author'};
6824                         my %date =
6825                                 parse_date($meta->{'author-time'}, $meta->{'author-tz'});
6826                         my $date = $date{'iso-tz'};
6827                         if ($group_size) {
6828                                 $current_color = ($current_color + 1) % $num_colors;
6829                         }
6830                         my $tr_class = $rev_color[$current_color];
6831                         $tr_class .= ' boundary' if (exists $meta->{'boundary'});
6832                         $tr_class .= ' no-previous' if ($meta->{'nprevious'} == 0);
6833                         $tr_class .= ' multiple-previous' if ($meta->{'nprevious'} > 1);
6834                         print "<tr id=\"l$lineno\" class=\"$tr_class\">\n";
6835                         if ($group_size) {
6836                                 print "<td class=\"sha1\"";
6837                                 print " title=\"". esc_html($author) . ", $date\"";
6838                                 print " rowspan=\"$group_size\"" if ($group_size > 1);
6839                                 print ">";
6840                                 print $cgi->a({-href => href(action=>"commit",
6841                                                              hash=>$full_rev,
6842                                                              file_name=>$file_name)},
6843                                               esc_html($short_rev));
6844                                 if ($group_size >= 2) {
6845                                         my @author_initials = ($author =~ /\b([[:upper:]])\B/g);
6846                                         if (@author_initials) {
6847                                                 print "<br />" .
6848                                                       esc_html(join('', @author_initials));
6849                                                 #           or join('.', ...)
6850                                         }
6851                                 }
6852                                 print "</td>\n";
6853                         }
6854                         # 'previous' <sha1 of parent commit> <filename at commit>
6855                         if (exists $meta->{'previous'} &&
6856                             $meta->{'previous'} =~ /^([a-fA-F0-9]{40}) (.*)$/) {
6857                                 $meta->{'parent'} = $1;
6858                                 $meta->{'file_parent'} = unquote($2);
6859                         }
6860                         my $linenr_commit =
6861                                 exists($meta->{'parent'}) ?
6862                                 $meta->{'parent'} : $full_rev;
6863                         my $linenr_filename =
6864                                 exists($meta->{'file_parent'}) ?
6865                                 $meta->{'file_parent'} : unquote($meta->{'filename'});
6866                         my $blamed = href(action => 'blame',
6867                                           file_name => $linenr_filename,
6868                                           hash_base => $linenr_commit);
6869                         print "<td class=\"linenr\">";
6870                         print $cgi->a({ -href => "$blamed#l$orig_lineno",
6871                                         -class => "linenr" },
6872                                       esc_html($lineno));
6873                         print "</td>";
6874                         print "<td class=\"pre\">" . esc_html($data) . "</td>\n";
6875                         print "</tr>\n";
6876                 } # end while
6877
6878         }
6879
6880         # footer
6881         print "</tbody>\n".
6882               "</table>\n"; # class="blame"
6883         print "</div>\n";   # class="blame_body"
6884         close $fd
6885                 or print "Reading blob failed\n";
6886
6887         git_footer_html();
6888 }
6889
6890 sub git_blame {
6891         git_blame_common();
6892 }
6893
6894 sub git_blame_incremental {
6895         git_blame_common('incremental');
6896 }
6897
6898 sub git_blame_data {
6899         git_blame_common('data');
6900 }
6901
6902 sub git_tags {
6903         my $head = git_get_head_hash($project);
6904         git_header_html();
6905         git_print_page_nav('','', $head,undef,$head,format_ref_views('tags'));
6906         git_print_header_div('summary', $project);
6907
6908         my @tagslist = git_get_tags_list();
6909         if (@tagslist) {
6910                 git_tags_body(\@tagslist);
6911         }
6912         git_footer_html();
6913 }
6914
6915 sub git_heads {
6916         my $head = git_get_head_hash($project);
6917         git_header_html();
6918         git_print_page_nav('','', $head,undef,$head,format_ref_views('heads'));
6919         git_print_header_div('summary', $project);
6920
6921         my @headslist = git_get_heads_list();
6922         if (@headslist) {
6923                 git_heads_body(\@headslist, $head);
6924         }
6925         git_footer_html();
6926 }
6927
6928 # used both for single remote view and for list of all the remotes
6929 sub git_remotes {
6930         gitweb_check_feature('remote_heads')
6931                 or die_error(403, "Remote heads view is disabled");
6932
6933         my $head = git_get_head_hash($project);
6934         my $remote = $input_params{'hash'};
6935
6936         my $remotedata = git_get_remotes_list($remote);
6937         die_error(500, "Unable to get remote information") unless defined $remotedata;
6938
6939         unless (%$remotedata) {
6940                 die_error(404, defined $remote ?
6941                         "Remote $remote not found" :
6942                         "No remotes found");
6943         }
6944
6945         git_header_html(undef, undef, -action_extra => $remote);
6946         git_print_page_nav('', '',  $head, undef, $head,
6947                 format_ref_views($remote ? '' : 'remotes'));
6948
6949         fill_remote_heads($remotedata);
6950         if (defined $remote) {
6951                 git_print_header_div('remotes', "$remote remote for $project");
6952                 git_remote_block($remote, $remotedata->{$remote}, undef, $head);
6953         } else {
6954                 git_print_header_div('summary', "$project remotes");
6955                 git_remotes_body($remotedata, undef, $head);
6956         }
6957
6958         git_footer_html();
6959 }
6960
6961 sub git_blob_plain {
6962         my $type = shift;
6963         my $expires;
6964
6965         if (!defined $hash) {
6966                 if (defined $file_name) {
6967                         my $base = $hash_base || git_get_head_hash($project);
6968                         $hash = git_get_hash_by_path($base, $file_name, "blob")
6969                                 or die_error(404, "Cannot find file");
6970                 } else {
6971                         die_error(400, "No file name defined");
6972                 }
6973         } elsif ($hash =~ m/^[0-9a-fA-F]{40}$/) {
6974                 # blobs defined by non-textual hash id's can be cached
6975                 $expires = "+1d";
6976         }
6977
6978         open my $fd, "-|", git_cmd(), "cat-file", "blob", $hash
6979                 or die_error(500, "Open git-cat-file blob '$hash' failed");
6980
6981         # content-type (can include charset)
6982         $type = blob_contenttype($fd, $file_name, $type);
6983
6984         # "save as" filename, even when no $file_name is given
6985         my $save_as = "$hash";
6986         if (defined $file_name) {
6987                 $save_as = $file_name;
6988         } elsif ($type =~ m/^text\//) {
6989                 $save_as .= '.txt';
6990         }
6991
6992         # With XSS prevention on, blobs of all types except a few known safe
6993         # ones are served with "Content-Disposition: attachment" to make sure
6994         # they don't run in our security domain.  For certain image types,
6995         # blob view writes an <img> tag referring to blob_plain view, and we
6996         # want to be sure not to break that by serving the image as an
6997         # attachment (though Firefox 3 doesn't seem to care).
6998         my $sandbox = $prevent_xss &&
6999                 $type !~ m!^(?:text/[a-z]+|image/(?:gif|png|jpeg))(?:[ ;]|$)!;
7000
7001         # serve text/* as text/plain
7002         if ($prevent_xss &&
7003             ($type =~ m!^text/[a-z]+\b(.*)$! ||
7004              ($type =~ m!^[a-z]+/[a-z]\+xml\b(.*)$! && -T $fd))) {
7005                 my $rest = $1;
7006                 $rest = defined $rest ? $rest : '';
7007                 $type = "text/plain$rest";
7008         }
7009
7010         print $cgi->header(
7011                 -type => $type,
7012                 -expires => $expires,
7013                 -content_disposition =>
7014                         ($sandbox ? 'attachment' : 'inline')
7015                         . '; filename="' . $save_as . '"');
7016         local $/ = undef;
7017         binmode STDOUT, ':raw';
7018         print <$fd>;
7019         binmode STDOUT, ':utf8'; # as set at the beginning of gitweb.cgi
7020         close $fd;
7021 }
7022
7023 sub git_blob {
7024         my $expires;
7025
7026         if (!defined $hash) {
7027                 if (defined $file_name) {
7028                         my $base = $hash_base || git_get_head_hash($project);
7029                         $hash = git_get_hash_by_path($base, $file_name, "blob")
7030                                 or die_error(404, "Cannot find file");
7031                 } else {
7032                         die_error(400, "No file name defined");
7033                 }
7034         } elsif ($hash =~ m/^[0-9a-fA-F]{40}$/) {
7035                 # blobs defined by non-textual hash id's can be cached
7036                 $expires = "+1d";
7037         }
7038
7039         my $have_blame = gitweb_check_feature('blame');
7040         open my $fd, "-|", git_cmd(), "cat-file", "blob", $hash
7041                 or die_error(500, "Couldn't cat $file_name, $hash");
7042         my $mimetype = blob_mimetype($fd, $file_name);
7043         # use 'blob_plain' (aka 'raw') view for files that cannot be displayed
7044         if ($mimetype !~ m!^(?:text/|image/(?:gif|png|jpeg)$)! && -B $fd) {
7045                 close $fd;
7046                 return git_blob_plain($mimetype);
7047         }
7048         # we can have blame only for text/* mimetype
7049         $have_blame &&= ($mimetype =~ m!^text/!);
7050
7051         my $highlight = gitweb_check_feature('highlight');
7052         my $syntax = guess_file_syntax($highlight, $mimetype, $file_name);
7053         $fd = run_highlighter($fd, $highlight, $syntax)
7054                 if $syntax;
7055
7056         git_header_html(undef, $expires);
7057         my $formats_nav = '';
7058         if (defined $hash_base && (my %co = parse_commit($hash_base))) {
7059                 if (defined $file_name) {
7060                         if ($have_blame) {
7061                                 $formats_nav .=
7062                                         $cgi->a({-href => href(action=>"blame", -replay=>1)},
7063                                                 "blame") .
7064                                         " | ";
7065                         }
7066                         $formats_nav .=
7067                                 $cgi->a({-href => href(action=>"history", -replay=>1)},
7068                                         "history") .
7069                                 " | " .
7070                                 $cgi->a({-href => href(action=>"blob_plain", -replay=>1)},
7071                                         "raw") .
7072                                 " | " .
7073                                 $cgi->a({-href => href(action=>"blob",
7074                                                        hash_base=>"HEAD", file_name=>$file_name)},
7075                                         "HEAD");
7076                 } else {
7077                         $formats_nav .=
7078                                 $cgi->a({-href => href(action=>"blob_plain", -replay=>1)},
7079                                         "raw");
7080                 }
7081                 git_print_page_nav('','', $hash_base,$co{'tree'},$hash_base, $formats_nav);
7082                 git_print_header_div('commit', esc_html($co{'title'}), $hash_base);
7083         } else {
7084                 print "<div class=\"page_nav\">\n" .
7085                       "<br/><br/></div>\n" .
7086                       "<div class=\"title\">".esc_html($hash)."</div>\n";
7087         }
7088         git_print_page_path($file_name, "blob", $hash_base);
7089         print "<div class=\"page_body\">\n";
7090         if ($mimetype =~ m!^image/!) {
7091                 print qq!<img type="!.esc_attr($mimetype).qq!"!;
7092                 if ($file_name) {
7093                         print qq! alt="!.esc_attr($file_name).qq!" title="!.esc_attr($file_name).qq!"!;
7094                 }
7095                 print qq! src="! .
7096                       href(action=>"blob_plain", hash=>$hash,
7097                            hash_base=>$hash_base, file_name=>$file_name) .
7098                       qq!" />\n!;
7099         } else {
7100                 my $nr;
7101                 while (my $line = <$fd>) {
7102                         chomp $line;
7103                         $nr++;
7104                         $line = untabify($line);
7105                         printf qq!<div class="pre"><a id="l%i" href="%s#l%i" class="linenr">%4i</a> %s</div>\n!,
7106                                $nr, esc_attr(href(-replay => 1)), $nr, $nr,
7107                                $syntax ? sanitize($line) : esc_html($line, -nbsp=>1);
7108                 }
7109         }
7110         close $fd
7111                 or print "Reading blob failed.\n";
7112         print "</div>";
7113         git_footer_html();
7114 }
7115
7116 sub git_tree {
7117         if (!defined $hash_base) {
7118                 $hash_base = "HEAD";
7119         }
7120         if (!defined $hash) {
7121                 if (defined $file_name) {
7122                         $hash = git_get_hash_by_path($hash_base, $file_name, "tree");
7123                 } else {
7124                         $hash = $hash_base;
7125                 }
7126         }
7127         die_error(404, "No such tree") unless defined($hash);
7128
7129         my $show_sizes = gitweb_check_feature('show-sizes');
7130         my $have_blame = gitweb_check_feature('blame');
7131
7132         my @entries = ();
7133         {
7134                 local $/ = "\0";
7135                 open my $fd, "-|", git_cmd(), "ls-tree", '-z',
7136                         ($show_sizes ? '-l' : ()), @extra_options, $hash
7137                         or die_error(500, "Open git-ls-tree failed");
7138                 @entries = map { chomp; $_ } <$fd>;
7139                 close $fd
7140                         or die_error(404, "Reading tree failed");
7141         }
7142
7143         my $refs = git_get_references();
7144         my $ref = format_ref_marker($refs, $hash_base);
7145         git_header_html();
7146         my $basedir = '';
7147         if (defined $hash_base && (my %co = parse_commit($hash_base))) {
7148                 my @views_nav = ();
7149                 if (defined $file_name) {
7150                         push @views_nav,
7151                                 $cgi->a({-href => href(action=>"history", -replay=>1)},
7152                                         "history"),
7153                                 $cgi->a({-href => href(action=>"tree",
7154                                                        hash_base=>"HEAD", file_name=>$file_name)},
7155                                         "HEAD"),
7156                 }
7157                 my $snapshot_links = format_snapshot_links($hash);
7158                 if (defined $snapshot_links) {
7159                         # FIXME: Should be available when we have no hash base as well.
7160                         push @views_nav, $snapshot_links;
7161                 }
7162                 git_print_page_nav('tree','', $hash_base, undef, undef,
7163                                    join(' | ', @views_nav));
7164                 git_print_header_div('commit', esc_html($co{'title'}) . $ref, $hash_base);
7165         } else {
7166                 undef $hash_base;
7167                 print "<div class=\"page_nav\">\n";
7168                 print "<br/><br/></div>\n";
7169                 print "<div class=\"title\">".esc_html($hash)."</div>\n";
7170         }
7171         if (defined $file_name) {
7172                 $basedir = $file_name;
7173                 if ($basedir ne '' && substr($basedir, -1) ne '/') {
7174                         $basedir .= '/';
7175                 }
7176                 git_print_page_path($file_name, 'tree', $hash_base);
7177         }
7178         print "<div class=\"page_body\">\n";
7179         print "<table class=\"tree\">\n";
7180         my $alternate = 1;
7181         # '..' (top directory) link if possible
7182         if (defined $hash_base &&
7183             defined $file_name && $file_name =~ m![^/]+$!) {
7184                 if ($alternate) {
7185                         print "<tr class=\"dark\">\n";
7186                 } else {
7187                         print "<tr class=\"light\">\n";
7188                 }
7189                 $alternate ^= 1;
7190
7191                 my $up = $file_name;
7192                 $up =~ s!/?[^/]+$!!;
7193                 undef $up unless $up;
7194                 # based on git_print_tree_entry
7195                 print '<td class="mode">' . mode_str('040000') . "</td>\n";
7196                 print '<td class="size">&nbsp;</td>'."\n" if $show_sizes;
7197                 print '<td class="list">';
7198                 print $cgi->a({-href => href(action=>"tree",
7199                                              hash_base=>$hash_base,
7200                                              file_name=>$up)},
7201                               "..");
7202                 print "</td>\n";
7203                 print "<td class=\"link\"></td>\n";
7204
7205                 print "</tr>\n";
7206         }
7207         foreach my $line (@entries) {
7208                 my %t = parse_ls_tree_line($line, -z => 1, -l => $show_sizes);
7209
7210                 if ($alternate) {
7211                         print "<tr class=\"dark\">\n";
7212                 } else {
7213                         print "<tr class=\"light\">\n";
7214                 }
7215                 $alternate ^= 1;
7216
7217                 git_print_tree_entry(\%t, $basedir, $hash_base, $have_blame);
7218
7219                 print "</tr>\n";
7220         }
7221         print "</table>\n" .
7222               "</div>";
7223         git_footer_html();
7224 }
7225
7226 sub snapshot_name {
7227         my ($project, $hash) = @_;
7228
7229         # path/to/project.git  -> project
7230         # path/to/project/.git -> project
7231         my $name = to_utf8($project);
7232         $name =~ s,([^/])/*\.git$,$1,;
7233         $name = basename($name);
7234         # sanitize name
7235         $name =~ s/[[:cntrl:]]/?/g;
7236
7237         my $ver = $hash;
7238         if ($hash =~ /^[0-9a-fA-F]+$/) {
7239                 # shorten SHA-1 hash
7240                 my $full_hash = git_get_full_hash($project, $hash);
7241                 if ($full_hash =~ /^$hash/ && length($hash) > 7) {
7242                         $ver = git_get_short_hash($project, $hash);
7243                 }
7244         } elsif ($hash =~ m!^refs/tags/(.*)$!) {
7245                 # tags don't need shortened SHA-1 hash
7246                 $ver = $1;
7247         } else {
7248                 # branches and other need shortened SHA-1 hash
7249                 my $strip_refs = join '|', map { quotemeta } get_branch_refs();
7250                 if ($hash =~ m!^refs/($strip_refs|remotes)/(.*)$!) {
7251                         $ver = $1;
7252                 }
7253                 $ver .= '-' . git_get_short_hash($project, $hash);
7254         }
7255         # in case of hierarchical branch names
7256         $ver =~ s!/!.!g;
7257
7258         # name = project-version_string
7259         $name = "$name-$ver";
7260
7261         return wantarray ? ($name, $name) : $name;
7262 }
7263
7264 sub exit_if_unmodified_since {
7265         my ($latest_epoch) = @_;
7266         our $cgi;
7267
7268         my $if_modified = $cgi->http('IF_MODIFIED_SINCE');
7269         if (defined $if_modified) {
7270                 my $since;
7271                 if (eval { require HTTP::Date; 1; }) {
7272                         $since = HTTP::Date::str2time($if_modified);
7273                 } elsif (eval { require Time::ParseDate; 1; }) {
7274                         $since = Time::ParseDate::parsedate($if_modified, GMT => 1);
7275                 }
7276                 if (defined $since && $latest_epoch <= $since) {
7277                         my %latest_date = parse_date($latest_epoch);
7278                         print $cgi->header(
7279                                 -last_modified => $latest_date{'rfc2822'},
7280                                 -status => '304 Not Modified');
7281                         goto DONE_GITWEB;
7282                 }
7283         }
7284 }
7285
7286 sub git_snapshot {
7287         my $format = $input_params{'snapshot_format'};
7288         if (!@snapshot_fmts) {
7289                 die_error(403, "Snapshots not allowed");
7290         }
7291         # default to first supported snapshot format
7292         $format ||= $snapshot_fmts[0];
7293         if ($format !~ m/^[a-z0-9]+$/) {
7294                 die_error(400, "Invalid snapshot format parameter");
7295         } elsif (!exists($known_snapshot_formats{$format})) {
7296                 die_error(400, "Unknown snapshot format");
7297         } elsif ($known_snapshot_formats{$format}{'disabled'}) {
7298                 die_error(403, "Snapshot format not allowed");
7299         } elsif (!grep($_ eq $format, @snapshot_fmts)) {
7300                 die_error(403, "Unsupported snapshot format");
7301         }
7302
7303         my $type = git_get_type("$hash^{}");
7304         if (!$type) {
7305                 die_error(404, 'Object does not exist');
7306         }  elsif ($type eq 'blob') {
7307                 die_error(400, 'Object is not a tree-ish');
7308         }
7309
7310         my ($name, $prefix) = snapshot_name($project, $hash);
7311         my $filename = "$name$known_snapshot_formats{$format}{'suffix'}";
7312
7313         my %co = parse_commit($hash);
7314         exit_if_unmodified_since($co{'committer_epoch'}) if %co;
7315
7316         my $cmd = quote_command(
7317                 git_cmd(), 'archive',
7318                 "--format=$known_snapshot_formats{$format}{'format'}",
7319                 "--prefix=$prefix/", $hash);
7320         if (exists $known_snapshot_formats{$format}{'compressor'}) {
7321                 $cmd .= ' | ' . quote_command(@{$known_snapshot_formats{$format}{'compressor'}});
7322         }
7323
7324         $filename =~ s/(["\\])/\\$1/g;
7325         my %latest_date;
7326         if (%co) {
7327                 %latest_date = parse_date($co{'committer_epoch'}, $co{'committer_tz'});
7328         }
7329
7330         print $cgi->header(
7331                 -type => $known_snapshot_formats{$format}{'type'},
7332                 -content_disposition => 'inline; filename="' . $filename . '"',
7333                 %co ? (-last_modified => $latest_date{'rfc2822'}) : (),
7334                 -status => '200 OK');
7335
7336         open my $fd, "-|", $cmd
7337                 or die_error(500, "Execute git-archive failed");
7338         binmode STDOUT, ':raw';
7339         print <$fd>;
7340         binmode STDOUT, ':utf8'; # as set at the beginning of gitweb.cgi
7341         close $fd;
7342 }
7343
7344 sub git_log_generic {
7345         my ($fmt_name, $body_subr, $base, $parent, $file_name, $file_hash) = @_;
7346
7347         my $head = git_get_head_hash($project);
7348         if (!defined $base) {
7349                 $base = $head;
7350         }
7351         if (!defined $page) {
7352                 $page = 0;
7353         }
7354         my $refs = git_get_references();
7355
7356         my $commit_hash = $base;
7357         if (defined $parent) {
7358                 $commit_hash = "$parent..$base";
7359         }
7360         my @commitlist =
7361                 parse_commits($commit_hash, 101, (100 * $page),
7362                               defined $file_name ? ($file_name, "--full-history") : ());
7363
7364         my $ftype;
7365         if (!defined $file_hash && defined $file_name) {
7366                 # some commits could have deleted file in question,
7367                 # and not have it in tree, but one of them has to have it
7368                 for (my $i = 0; $i < @commitlist; $i++) {
7369                         $file_hash = git_get_hash_by_path($commitlist[$i]{'id'}, $file_name);
7370                         last if defined $file_hash;
7371                 }
7372         }
7373         if (defined $file_hash) {
7374                 $ftype = git_get_type($file_hash);
7375         }
7376         if (defined $file_name && !defined $ftype) {
7377                 die_error(500, "Unknown type of object");
7378         }
7379         my %co;
7380         if (defined $file_name) {
7381                 %co = parse_commit($base)
7382                         or die_error(404, "Unknown commit object");
7383         }
7384
7385
7386         my $paging_nav = format_paging_nav($fmt_name, $page, $#commitlist >= 100);
7387         my $next_link = '';
7388         if ($#commitlist >= 100) {
7389                 $next_link =
7390                         $cgi->a({-href => href(-replay=>1, page=>$page+1),
7391                                  -accesskey => "n", -title => "Alt-n"}, "next");
7392         }
7393         my $patch_max = gitweb_get_feature('patches');
7394         if ($patch_max && !defined $file_name) {
7395                 if ($patch_max < 0 || @commitlist <= $patch_max) {
7396                         $paging_nav .= " &sdot; " .
7397                                 $cgi->a({-href => href(action=>"patches", -replay=>1)},
7398                                         "patches");
7399                 }
7400         }
7401
7402         git_header_html();
7403         git_print_page_nav($fmt_name,'', $hash,$hash,$hash, $paging_nav);
7404         if (defined $file_name) {
7405                 git_print_header_div('commit', esc_html($co{'title'}), $base);
7406         } else {
7407                 git_print_header_div('summary', $project)
7408         }
7409         git_print_page_path($file_name, $ftype, $hash_base)
7410                 if (defined $file_name);
7411
7412         $body_subr->(\@commitlist, 0, 99, $refs, $next_link,
7413                      $file_name, $file_hash, $ftype);
7414
7415         git_footer_html();
7416 }
7417
7418 sub git_log {
7419         git_log_generic('log', \&git_log_body,
7420                         $hash, $hash_parent);
7421 }
7422
7423 sub git_commit {
7424         $hash ||= $hash_base || "HEAD";
7425         my %co = parse_commit($hash)
7426             or die_error(404, "Unknown commit object");
7427
7428         my $parent  = $co{'parent'};
7429         my $parents = $co{'parents'}; # listref
7430
7431         # we need to prepare $formats_nav before any parameter munging
7432         my $formats_nav;
7433         if (!defined $parent) {
7434                 # --root commitdiff
7435                 $formats_nav .= '(initial)';
7436         } elsif (@$parents == 1) {
7437                 # single parent commit
7438                 $formats_nav .=
7439                         '(parent: ' .
7440                         $cgi->a({-href => href(action=>"commit",
7441                                                hash=>$parent)},
7442                                 esc_html(substr($parent, 0, 7))) .
7443                         ')';
7444         } else {
7445                 # merge commit
7446                 $formats_nav .=
7447                         '(merge: ' .
7448                         join(' ', map {
7449                                 $cgi->a({-href => href(action=>"commit",
7450                                                        hash=>$_)},
7451                                         esc_html(substr($_, 0, 7)));
7452                         } @$parents ) .
7453                         ')';
7454         }
7455         if (gitweb_check_feature('patches') && @$parents <= 1) {
7456                 $formats_nav .= " | " .
7457                         $cgi->a({-href => href(action=>"patch", -replay=>1)},
7458                                 "patch");
7459         }
7460
7461         if (!defined $parent) {
7462                 $parent = "--root";
7463         }
7464         my @difftree;
7465         open my $fd, "-|", git_cmd(), "diff-tree", '-r', "--no-commit-id",
7466                 @diff_opts,
7467                 (@$parents <= 1 ? $parent : '-c'),
7468                 $hash, "--"
7469                 or die_error(500, "Open git-diff-tree failed");
7470         @difftree = map { chomp; $_ } <$fd>;
7471         close $fd or die_error(404, "Reading git-diff-tree failed");
7472
7473         # non-textual hash id's can be cached
7474         my $expires;
7475         if ($hash =~ m/^[0-9a-fA-F]{40}$/) {
7476                 $expires = "+1d";
7477         }
7478         my $refs = git_get_references();
7479         my $ref = format_ref_marker($refs, $co{'id'});
7480
7481         git_header_html(undef, $expires);
7482         git_print_page_nav('commit', '',
7483                            $hash, $co{'tree'}, $hash,
7484                            $formats_nav);
7485
7486         if (defined $co{'parent'}) {
7487                 git_print_header_div('commitdiff', esc_html($co{'title'}) . $ref, $hash);
7488         } else {
7489                 git_print_header_div('tree', esc_html($co{'title'}) . $ref, $co{'tree'}, $hash);
7490         }
7491         print "<div class=\"title_text\">\n" .
7492               "<table class=\"object_header\">\n";
7493         git_print_authorship_rows(\%co);
7494         print "<tr><td>commit</td><td class=\"sha1\">$co{'id'}</td></tr>\n";
7495         print "<tr>" .
7496               "<td>tree</td>" .
7497               "<td class=\"sha1\">" .
7498               $cgi->a({-href => href(action=>"tree", hash=>$co{'tree'}, hash_base=>$hash),
7499                        class => "list"}, $co{'tree'}) .
7500               "</td>" .
7501               "<td class=\"link\">" .
7502               $cgi->a({-href => href(action=>"tree", hash=>$co{'tree'}, hash_base=>$hash)},
7503                       "tree");
7504         my $snapshot_links = format_snapshot_links($hash);
7505         if (defined $snapshot_links) {
7506                 print " | " . $snapshot_links;
7507         }
7508         print "</td>" .
7509               "</tr>\n";
7510
7511         foreach my $par (@$parents) {
7512                 print "<tr>" .
7513                       "<td>parent</td>" .
7514                       "<td class=\"sha1\">" .
7515                       $cgi->a({-href => href(action=>"commit", hash=>$par),
7516                                class => "list"}, $par) .
7517                       "</td>" .
7518                       "<td class=\"link\">" .
7519                       $cgi->a({-href => href(action=>"commit", hash=>$par)}, "commit") .
7520                       " | " .
7521                       $cgi->a({-href => href(action=>"commitdiff", hash=>$hash, hash_parent=>$par)}, "diff") .
7522                       "</td>" .
7523                       "</tr>\n";
7524         }
7525         print "</table>".
7526               "</div>\n";
7527
7528         print "<div class=\"page_body\">\n";
7529         git_print_log($co{'comment'});
7530         print "</div>\n";
7531
7532         git_difftree_body(\@difftree, $hash, @$parents);
7533
7534         git_footer_html();
7535 }
7536
7537 sub git_object {
7538         # object is defined by:
7539         # - hash or hash_base alone
7540         # - hash_base and file_name
7541         my $type;
7542
7543         # - hash or hash_base alone
7544         if ($hash || ($hash_base && !defined $file_name)) {
7545                 my $object_id = $hash || $hash_base;
7546
7547                 open my $fd, "-|", quote_command(
7548                         git_cmd(), 'cat-file', '-t', $object_id) . ' 2> /dev/null'
7549                         or die_error(404, "Object does not exist");
7550                 $type = <$fd>;
7551                 chomp $type;
7552                 close $fd
7553                         or die_error(404, "Object does not exist");
7554
7555         # - hash_base and file_name
7556         } elsif ($hash_base && defined $file_name) {
7557                 $file_name =~ s,/+$,,;
7558
7559                 system(git_cmd(), "cat-file", '-e', $hash_base) == 0
7560                         or die_error(404, "Base object does not exist");
7561
7562                 # here errors should not happen
7563                 open my $fd, "-|", git_cmd(), "ls-tree", $hash_base, "--", $file_name
7564                         or die_error(500, "Open git-ls-tree failed");
7565                 my $line = <$fd>;
7566                 close $fd;
7567
7568                 #'100644 blob 0fa3f3a66fb6a137f6ec2c19351ed4d807070ffa  panic.c'
7569                 unless ($line && $line =~ m/^([0-9]+) (.+) ([0-9a-fA-F]{40})\t/) {
7570                         die_error(404, "File or directory for given base does not exist");
7571                 }
7572                 $type = $2;
7573                 $hash = $3;
7574         } else {
7575                 die_error(400, "Not enough information to find object");
7576         }
7577
7578         print $cgi->redirect(-uri => href(action=>$type, -full=>1,
7579                                           hash=>$hash, hash_base=>$hash_base,
7580                                           file_name=>$file_name),
7581                              -status => '302 Found');
7582 }
7583
7584 sub git_blobdiff {
7585         my $format = shift || 'html';
7586         my $diff_style = $input_params{'diff_style'} || 'inline';
7587
7588         my $fd;
7589         my @difftree;
7590         my %diffinfo;
7591         my $expires;
7592
7593         # preparing $fd and %diffinfo for git_patchset_body
7594         # new style URI
7595         if (defined $hash_base && defined $hash_parent_base) {
7596                 if (defined $file_name) {
7597                         # read raw output
7598                         open $fd, "-|", git_cmd(), "diff-tree", '-r', @diff_opts,
7599                                 $hash_parent_base, $hash_base,
7600                                 "--", (defined $file_parent ? $file_parent : ()), $file_name
7601                                 or die_error(500, "Open git-diff-tree failed");
7602                         @difftree = map { chomp; $_ } <$fd>;
7603                         close $fd
7604                                 or die_error(404, "Reading git-diff-tree failed");
7605                         @difftree
7606                                 or die_error(404, "Blob diff not found");
7607
7608                 } elsif (defined $hash &&
7609                          $hash =~ /[0-9a-fA-F]{40}/) {
7610                         # try to find filename from $hash
7611
7612                         # read filtered raw output
7613                         open $fd, "-|", git_cmd(), "diff-tree", '-r', @diff_opts,
7614                                 $hash_parent_base, $hash_base, "--"
7615                                 or die_error(500, "Open git-diff-tree failed");
7616                         @difftree =
7617                                 # ':100644 100644 03b21826... 3b93d5e7... M     ls-files.c'
7618                                 # $hash == to_id
7619                                 grep { /^:[0-7]{6} [0-7]{6} [0-9a-fA-F]{40} $hash/ }
7620                                 map { chomp; $_ } <$fd>;
7621                         close $fd
7622                                 or die_error(404, "Reading git-diff-tree failed");
7623                         @difftree
7624                                 or die_error(404, "Blob diff not found");
7625
7626                 } else {
7627                         die_error(400, "Missing one of the blob diff parameters");
7628                 }
7629
7630                 if (@difftree > 1) {
7631                         die_error(400, "Ambiguous blob diff specification");
7632                 }
7633
7634                 %diffinfo = parse_difftree_raw_line($difftree[0]);
7635                 $file_parent ||= $diffinfo{'from_file'} || $file_name;
7636                 $file_name   ||= $diffinfo{'to_file'};
7637
7638                 $hash_parent ||= $diffinfo{'from_id'};
7639                 $hash        ||= $diffinfo{'to_id'};
7640
7641                 # non-textual hash id's can be cached
7642                 if ($hash_base =~ m/^[0-9a-fA-F]{40}$/ &&
7643                     $hash_parent_base =~ m/^[0-9a-fA-F]{40}$/) {
7644                         $expires = '+1d';
7645                 }
7646
7647                 # open patch output
7648                 open $fd, "-|", git_cmd(), "diff-tree", '-r', @diff_opts,
7649                         '-p', ($format eq 'html' ? "--full-index" : ()),
7650                         $hash_parent_base, $hash_base,
7651                         "--", (defined $file_parent ? $file_parent : ()), $file_name
7652                         or die_error(500, "Open git-diff-tree failed");
7653         }
7654
7655         # old/legacy style URI -- not generated anymore since 1.4.3.
7656         if (!%diffinfo) {
7657                 die_error('404 Not Found', "Missing one of the blob diff parameters")
7658         }
7659
7660         # header
7661         if ($format eq 'html') {
7662                 my $formats_nav =
7663                         $cgi->a({-href => href(action=>"blobdiff_plain", -replay=>1)},
7664                                 "raw");
7665                 $formats_nav .= diff_style_nav($diff_style);
7666                 git_header_html(undef, $expires);
7667                 if (defined $hash_base && (my %co = parse_commit($hash_base))) {
7668                         git_print_page_nav('','', $hash_base,$co{'tree'},$hash_base, $formats_nav);
7669                         git_print_header_div('commit', esc_html($co{'title'}), $hash_base);
7670                 } else {
7671                         print "<div class=\"page_nav\"><br/>$formats_nav<br/></div>\n";
7672                         print "<div class=\"title\">".esc_html("$hash vs $hash_parent")."</div>\n";
7673                 }
7674                 if (defined $file_name) {
7675                         git_print_page_path($file_name, "blob", $hash_base);
7676                 } else {
7677                         print "<div class=\"page_path\"></div>\n";
7678                 }
7679
7680         } elsif ($format eq 'plain') {
7681                 print $cgi->header(
7682                         -type => 'text/plain',
7683                         -charset => 'utf-8',
7684                         -expires => $expires,
7685                         -content_disposition => 'inline; filename="' . "$file_name" . '.patch"');
7686
7687                 print "X-Git-Url: " . $cgi->self_url() . "\n\n";
7688
7689         } else {
7690                 die_error(400, "Unknown blobdiff format");
7691         }
7692
7693         # patch
7694         if ($format eq 'html') {
7695                 print "<div class=\"page_body\">\n";
7696
7697                 git_patchset_body($fd, $diff_style,
7698                                   [ \%diffinfo ], $hash_base, $hash_parent_base);
7699                 close $fd;
7700
7701                 print "</div>\n"; # class="page_body"
7702                 git_footer_html();
7703
7704         } else {
7705                 while (my $line = <$fd>) {
7706                         $line =~ s!a/($hash|$hash_parent)!'a/'.esc_path($diffinfo{'from_file'})!eg;
7707                         $line =~ s!b/($hash|$hash_parent)!'b/'.esc_path($diffinfo{'to_file'})!eg;
7708
7709                         print $line;
7710
7711                         last if $line =~ m!^\+\+\+!;
7712                 }
7713                 local $/ = undef;
7714                 print <$fd>;
7715                 close $fd;
7716         }
7717 }
7718
7719 sub git_blobdiff_plain {
7720         git_blobdiff('plain');
7721 }
7722
7723 # assumes that it is added as later part of already existing navigation,
7724 # so it returns "| foo | bar" rather than just "foo | bar"
7725 sub diff_style_nav {
7726         my ($diff_style, $is_combined) = @_;
7727         $diff_style ||= 'inline';
7728
7729         return "" if ($is_combined);
7730
7731         my @styles = (inline => 'inline', 'sidebyside' => 'side by side');
7732         my %styles = @styles;
7733         @styles =
7734                 @styles[ map { $_ * 2 } 0..$#styles/2 ];
7735
7736         return join '',
7737                 map { " | ".$_ }
7738                 map {
7739                         $_ eq $diff_style ? $styles{$_} :
7740                         $cgi->a({-href => href(-replay=>1, diff_style => $_)}, $styles{$_})
7741                 } @styles;
7742 }
7743
7744 sub git_commitdiff {
7745         my %params = @_;
7746         my $format = $params{-format} || 'html';
7747         my $diff_style = $input_params{'diff_style'} || 'inline';
7748
7749         my ($patch_max) = gitweb_get_feature('patches');
7750         if ($format eq 'patch') {
7751                 die_error(403, "Patch view not allowed") unless $patch_max;
7752         }
7753
7754         $hash ||= $hash_base || "HEAD";
7755         my %co = parse_commit($hash)
7756             or die_error(404, "Unknown commit object");
7757
7758         # choose format for commitdiff for merge
7759         if (! defined $hash_parent && @{$co{'parents'}} > 1) {
7760                 $hash_parent = '--cc';
7761         }
7762         # we need to prepare $formats_nav before almost any parameter munging
7763         my $formats_nav;
7764         if ($format eq 'html') {
7765                 $formats_nav =
7766                         $cgi->a({-href => href(action=>"commitdiff_plain", -replay=>1)},
7767                                 "raw");
7768                 if ($patch_max && @{$co{'parents'}} <= 1) {
7769                         $formats_nav .= " | " .
7770                                 $cgi->a({-href => href(action=>"patch", -replay=>1)},
7771                                         "patch");
7772                 }
7773                 $formats_nav .= diff_style_nav($diff_style, @{$co{'parents'}} > 1);
7774
7775                 if (defined $hash_parent &&
7776                     $hash_parent ne '-c' && $hash_parent ne '--cc') {
7777                         # commitdiff with two commits given
7778                         my $hash_parent_short = $hash_parent;
7779                         if ($hash_parent =~ m/^[0-9a-fA-F]{40}$/) {
7780                                 $hash_parent_short = substr($hash_parent, 0, 7);
7781                         }
7782                         $formats_nav .=
7783                                 ' (from';
7784                         for (my $i = 0; $i < @{$co{'parents'}}; $i++) {
7785                                 if ($co{'parents'}[$i] eq $hash_parent) {
7786                                         $formats_nav .= ' parent ' . ($i+1);
7787                                         last;
7788                                 }
7789                         }
7790                         $formats_nav .= ': ' .
7791                                 $cgi->a({-href => href(-replay=>1,
7792                                                        hash=>$hash_parent, hash_base=>undef)},
7793                                         esc_html($hash_parent_short)) .
7794                                 ')';
7795                 } elsif (!$co{'parent'}) {
7796                         # --root commitdiff
7797                         $formats_nav .= ' (initial)';
7798                 } elsif (scalar @{$co{'parents'}} == 1) {
7799                         # single parent commit
7800                         $formats_nav .=
7801                                 ' (parent: ' .
7802                                 $cgi->a({-href => href(-replay=>1,
7803                                                        hash=>$co{'parent'}, hash_base=>undef)},
7804                                         esc_html(substr($co{'parent'}, 0, 7))) .
7805                                 ')';
7806                 } else {
7807                         # merge commit
7808                         if ($hash_parent eq '--cc') {
7809                                 $formats_nav .= ' | ' .
7810                                         $cgi->a({-href => href(-replay=>1,
7811                                                                hash=>$hash, hash_parent=>'-c')},
7812                                                 'combined');
7813                         } else { # $hash_parent eq '-c'
7814                                 $formats_nav .= ' | ' .
7815                                         $cgi->a({-href => href(-replay=>1,
7816                                                                hash=>$hash, hash_parent=>'--cc')},
7817                                                 'compact');
7818                         }
7819                         $formats_nav .=
7820                                 ' (merge: ' .
7821                                 join(' ', map {
7822                                         $cgi->a({-href => href(-replay=>1,
7823                                                                hash=>$_, hash_base=>undef)},
7824                                                 esc_html(substr($_, 0, 7)));
7825                                 } @{$co{'parents'}} ) .
7826                                 ')';
7827                 }
7828         }
7829
7830         my $hash_parent_param = $hash_parent;
7831         if (!defined $hash_parent_param) {
7832                 # --cc for multiple parents, --root for parentless
7833                 $hash_parent_param =
7834                         @{$co{'parents'}} > 1 ? '--cc' : $co{'parent'} || '--root';
7835         }
7836
7837         # read commitdiff
7838         my $fd;
7839         my @difftree;
7840         if ($format eq 'html') {
7841                 open $fd, "-|", git_cmd(), "diff-tree", '-r', @diff_opts,
7842                         "--no-commit-id", "--patch-with-raw", "--full-index",
7843                         $hash_parent_param, $hash, "--"
7844                         or die_error(500, "Open git-diff-tree failed");
7845
7846                 while (my $line = <$fd>) {
7847                         chomp $line;
7848                         # empty line ends raw part of diff-tree output
7849                         last unless $line;
7850                         push @difftree, scalar parse_difftree_raw_line($line);
7851                 }
7852
7853         } elsif ($format eq 'plain') {
7854                 open $fd, "-|", git_cmd(), "diff-tree", '-r', @diff_opts,
7855                         '-p', $hash_parent_param, $hash, "--"
7856                         or die_error(500, "Open git-diff-tree failed");
7857         } elsif ($format eq 'patch') {
7858                 # For commit ranges, we limit the output to the number of
7859                 # patches specified in the 'patches' feature.
7860                 # For single commits, we limit the output to a single patch,
7861                 # diverging from the git-format-patch default.
7862                 my @commit_spec = ();
7863                 if ($hash_parent) {
7864                         if ($patch_max > 0) {
7865                                 push @commit_spec, "-$patch_max";
7866                         }
7867                         push @commit_spec, '-n', "$hash_parent..$hash";
7868                 } else {
7869                         if ($params{-single}) {
7870                                 push @commit_spec, '-1';
7871                         } else {
7872                                 if ($patch_max > 0) {
7873                                         push @commit_spec, "-$patch_max";
7874                                 }
7875                                 push @commit_spec, "-n";
7876                         }
7877                         push @commit_spec, '--root', $hash;
7878                 }
7879                 open $fd, "-|", git_cmd(), "format-patch", @diff_opts,
7880                         '--encoding=utf8', '--stdout', @commit_spec
7881                         or die_error(500, "Open git-format-patch failed");
7882         } else {
7883                 die_error(400, "Unknown commitdiff format");
7884         }
7885
7886         # non-textual hash id's can be cached
7887         my $expires;
7888         if ($hash =~ m/^[0-9a-fA-F]{40}$/) {
7889                 $expires = "+1d";
7890         }
7891
7892         # write commit message
7893         if ($format eq 'html') {
7894                 my $refs = git_get_references();
7895                 my $ref = format_ref_marker($refs, $co{'id'});
7896
7897                 git_header_html(undef, $expires);
7898                 git_print_page_nav('commitdiff','', $hash,$co{'tree'},$hash, $formats_nav);
7899                 git_print_header_div('commit', esc_html($co{'title'}) . $ref, $hash);
7900                 print "<div class=\"title_text\">\n" .
7901                       "<table class=\"object_header\">\n";
7902                 git_print_authorship_rows(\%co);
7903                 print "</table>".
7904                       "</div>\n";
7905                 print "<div class=\"page_body\">\n";
7906                 if (@{$co{'comment'}} > 1) {
7907                         print "<div class=\"log\">\n";
7908                         git_print_log($co{'comment'}, -final_empty_line=> 1, -remove_title => 1);
7909                         print "</div>\n"; # class="log"
7910                 }
7911
7912         } elsif ($format eq 'plain') {
7913                 my $refs = git_get_references("tags");
7914                 my $tagname = git_get_rev_name_tags($hash);
7915                 my $filename = basename($project) . "-$hash.patch";
7916
7917                 print $cgi->header(
7918                         -type => 'text/plain',
7919                         -charset => 'utf-8',
7920                         -expires => $expires,
7921                         -content_disposition => 'inline; filename="' . "$filename" . '"');
7922                 my %ad = parse_date($co{'author_epoch'}, $co{'author_tz'});
7923                 print "From: " . to_utf8($co{'author'}) . "\n";
7924                 print "Date: $ad{'rfc2822'} ($ad{'tz_local'})\n";
7925                 print "Subject: " . to_utf8($co{'title'}) . "\n";
7926
7927                 print "X-Git-Tag: $tagname\n" if $tagname;
7928                 print "X-Git-Url: " . $cgi->self_url() . "\n\n";
7929
7930                 foreach my $line (@{$co{'comment'}}) {
7931                         print to_utf8($line) . "\n";
7932                 }
7933                 print "---\n\n";
7934         } elsif ($format eq 'patch') {
7935                 my $filename = basename($project) . "-$hash.patch";
7936
7937                 print $cgi->header(
7938                         -type => 'text/plain',
7939                         -charset => 'utf-8',
7940                         -expires => $expires,
7941                         -content_disposition => 'inline; filename="' . "$filename" . '"');
7942         }
7943
7944         # write patch
7945         if ($format eq 'html') {
7946                 my $use_parents = !defined $hash_parent ||
7947                         $hash_parent eq '-c' || $hash_parent eq '--cc';
7948                 git_difftree_body(\@difftree, $hash,
7949                                   $use_parents ? @{$co{'parents'}} : $hash_parent);
7950                 print "<br/>\n";
7951
7952                 git_patchset_body($fd, $diff_style,
7953                                   \@difftree, $hash,
7954                                   $use_parents ? @{$co{'parents'}} : $hash_parent);
7955                 close $fd;
7956                 print "</div>\n"; # class="page_body"
7957                 git_footer_html();
7958
7959         } elsif ($format eq 'plain') {
7960                 local $/ = undef;
7961                 print <$fd>;
7962                 close $fd
7963                         or print "Reading git-diff-tree failed\n";
7964         } elsif ($format eq 'patch') {
7965                 local $/ = undef;
7966                 print <$fd>;
7967                 close $fd
7968                         or print "Reading git-format-patch failed\n";
7969         }
7970 }
7971
7972 sub git_commitdiff_plain {
7973         git_commitdiff(-format => 'plain');
7974 }
7975
7976 # format-patch-style patches
7977 sub git_patch {
7978         git_commitdiff(-format => 'patch', -single => 1);
7979 }
7980
7981 sub git_patches {
7982         git_commitdiff(-format => 'patch');
7983 }
7984
7985 sub git_history {
7986         git_log_generic('history', \&git_history_body,
7987                         $hash_base, $hash_parent_base,
7988                         $file_name, $hash);
7989 }
7990
7991 sub git_search {
7992         $searchtype ||= 'commit';
7993
7994         # check if appropriate features are enabled
7995         gitweb_check_feature('search')
7996                 or die_error(403, "Search is disabled");
7997         if ($searchtype eq 'pickaxe') {
7998                 # pickaxe may take all resources of your box and run for several minutes
7999                 # with every query - so decide by yourself how public you make this feature
8000                 gitweb_check_feature('pickaxe')
8001                         or die_error(403, "Pickaxe search is disabled");
8002         }
8003         if ($searchtype eq 'grep') {
8004                 # grep search might be potentially CPU-intensive, too
8005                 gitweb_check_feature('grep')
8006                         or die_error(403, "Grep search is disabled");
8007         }
8008
8009         if (!defined $searchtext) {
8010                 die_error(400, "Text field is empty");
8011         }
8012         if (!defined $hash) {
8013                 $hash = git_get_head_hash($project);
8014         }
8015         my %co = parse_commit($hash);
8016         if (!%co) {
8017                 die_error(404, "Unknown commit object");
8018         }
8019         if (!defined $page) {
8020                 $page = 0;
8021         }
8022
8023         if ($searchtype eq 'commit' ||
8024             $searchtype eq 'author' ||
8025             $searchtype eq 'committer') {
8026                 git_search_message(%co);
8027         } elsif ($searchtype eq 'pickaxe') {
8028                 git_search_changes(%co);
8029         } elsif ($searchtype eq 'grep') {
8030                 git_search_files(%co);
8031         } else {
8032                 die_error(400, "Unknown search type");
8033         }
8034 }
8035
8036 sub git_search_help {
8037         git_header_html();
8038         git_print_page_nav('','', $hash,$hash,$hash);
8039         print <<EOT;
8040 <p><strong>Pattern</strong> is by default a normal string that is matched precisely (but without
8041 regard to case, except in the case of pickaxe). However, when you check the <em>re</em> checkbox,
8042 the pattern entered is recognized as the POSIX extended
8043 <a href="http://en.wikipedia.org/wiki/Regular_expression">regular expression</a> (also case
8044 insensitive).</p>
8045 <dl>
8046 <dt><b>commit</b></dt>
8047 <dd>The commit messages and authorship information will be scanned for the given pattern.</dd>
8048 EOT
8049         my $have_grep = gitweb_check_feature('grep');
8050         if ($have_grep) {
8051                 print <<EOT;
8052 <dt><b>grep</b></dt>
8053 <dd>All files in the currently selected tree (HEAD unless you are explicitly browsing
8054     a different one) are searched for the given pattern. On large trees, this search can take
8055 a while and put some strain on the server, so please use it with some consideration. Note that
8056 due to git-grep peculiarity, currently if regexp mode is turned off, the matches are
8057 case-sensitive.</dd>
8058 EOT
8059         }
8060         print <<EOT;
8061 <dt><b>author</b></dt>
8062 <dd>Name and e-mail of the change author and date of birth of the patch will be scanned for the given pattern.</dd>
8063 <dt><b>committer</b></dt>
8064 <dd>Name and e-mail of the committer and date of commit will be scanned for the given pattern.</dd>
8065 EOT
8066         my $have_pickaxe = gitweb_check_feature('pickaxe');
8067         if ($have_pickaxe) {
8068                 print <<EOT;
8069 <dt><b>pickaxe</b></dt>
8070 <dd>All commits that caused the string to appear or disappear from any file (changes that
8071 added, removed or "modified" the string) will be listed. This search can take a while and
8072 takes a lot of strain on the server, so please use it wisely. Note that since you may be
8073 interested even in changes just changing the case as well, this search is case sensitive.</dd>
8074 EOT
8075         }
8076         print "</dl>\n";
8077         git_footer_html();
8078 }
8079
8080 sub git_shortlog {
8081         git_log_generic('shortlog', \&git_shortlog_body,
8082                         $hash, $hash_parent);
8083 }
8084
8085 ## ......................................................................
8086 ## feeds (RSS, Atom; OPML)
8087
8088 sub git_feed {
8089         my $format = shift || 'atom';
8090         my $have_blame = gitweb_check_feature('blame');
8091
8092         # Atom: http://www.atomenabled.org/developers/syndication/
8093         # RSS:  http://www.notestips.com/80256B3A007F2692/1/NAMO5P9UPQ
8094         if ($format ne 'rss' && $format ne 'atom') {
8095                 die_error(400, "Unknown web feed format");
8096         }
8097
8098         # log/feed of current (HEAD) branch, log of given branch, history of file/directory
8099         my $head = $hash || 'HEAD';
8100         my @commitlist = parse_commits($head, 150, 0, $file_name);
8101
8102         my %latest_commit;
8103         my %latest_date;
8104         my $content_type = "application/$format+xml";
8105         if (defined $cgi->http('HTTP_ACCEPT') &&
8106                  $cgi->Accept('text/xml') > $cgi->Accept($content_type)) {
8107                 # browser (feed reader) prefers text/xml
8108                 $content_type = 'text/xml';
8109         }
8110         if (defined($commitlist[0])) {
8111                 %latest_commit = %{$commitlist[0]};
8112                 my $latest_epoch = $latest_commit{'committer_epoch'};
8113                 exit_if_unmodified_since($latest_epoch);
8114                 %latest_date = parse_date($latest_epoch, $latest_commit{'committer_tz'});
8115         }
8116         print $cgi->header(
8117                 -type => $content_type,
8118                 -charset => 'utf-8',
8119                 %latest_date ? (-last_modified => $latest_date{'rfc2822'}) : (),
8120                 -status => '200 OK');
8121
8122         # Optimization: skip generating the body if client asks only
8123         # for Last-Modified date.
8124         return if ($cgi->request_method() eq 'HEAD');
8125
8126         # header variables
8127         my $title = "$site_name - $project/$action";
8128         my $feed_type = 'log';
8129         if (defined $hash) {
8130                 $title .= " - '$hash'";
8131                 $feed_type = 'branch log';
8132                 if (defined $file_name) {
8133                         $title .= " :: $file_name";
8134                         $feed_type = 'history';
8135                 }
8136         } elsif (defined $file_name) {
8137                 $title .= " - $file_name";
8138                 $feed_type = 'history';
8139         }
8140         $title .= " $feed_type";
8141         $title = esc_html($title);
8142         my $descr = git_get_project_description($project);
8143         if (defined $descr) {
8144                 $descr = esc_html($descr);
8145         } else {
8146                 $descr = "$project " .
8147                          ($format eq 'rss' ? 'RSS' : 'Atom') .
8148                          " feed";
8149         }
8150         my $owner = git_get_project_owner($project);
8151         $owner = esc_html($owner);
8152
8153         #header
8154         my $alt_url;
8155         if (defined $file_name) {
8156                 $alt_url = href(-full=>1, action=>"history", hash=>$hash, file_name=>$file_name);
8157         } elsif (defined $hash) {
8158                 $alt_url = href(-full=>1, action=>"log", hash=>$hash);
8159         } else {
8160                 $alt_url = href(-full=>1, action=>"summary");
8161         }
8162         print qq!<?xml version="1.0" encoding="utf-8"?>\n!;
8163         if ($format eq 'rss') {
8164                 print <<XML;
8165 <rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/">
8166 <channel>
8167 XML
8168                 print "<title>$title</title>\n" .
8169                       "<link>$alt_url</link>\n" .
8170                       "<description>$descr</description>\n" .
8171                       "<language>en</language>\n" .
8172                       # project owner is responsible for 'editorial' content
8173                       "<managingEditor>$owner</managingEditor>\n";
8174                 if (defined $logo || defined $favicon) {
8175                         # prefer the logo to the favicon, since RSS
8176                         # doesn't allow both
8177                         my $img = esc_url($logo || $favicon);
8178                         print "<image>\n" .
8179                               "<url>$img</url>\n" .
8180                               "<title>$title</title>\n" .
8181                               "<link>$alt_url</link>\n" .
8182                               "</image>\n";
8183                 }
8184                 if (%latest_date) {
8185                         print "<pubDate>$latest_date{'rfc2822'}</pubDate>\n";
8186                         print "<lastBuildDate>$latest_date{'rfc2822'}</lastBuildDate>\n";
8187                 }
8188                 print "<generator>gitweb v.$version/$git_version</generator>\n";
8189         } elsif ($format eq 'atom') {
8190                 print <<XML;
8191 <feed xmlns="http://www.w3.org/2005/Atom">
8192 XML
8193                 print "<title>$title</title>\n" .
8194                       "<subtitle>$descr</subtitle>\n" .
8195                       '<link rel="alternate" type="text/html" href="' .
8196                       $alt_url . '" />' . "\n" .
8197                       '<link rel="self" type="' . $content_type . '" href="' .
8198                       $cgi->self_url() . '" />' . "\n" .
8199                       "<id>" . href(-full=>1) . "</id>\n" .
8200                       # use project owner for feed author
8201                       "<author><name>$owner</name></author>\n";
8202                 if (defined $favicon) {
8203                         print "<icon>" . esc_url($favicon) . "</icon>\n";
8204                 }
8205                 if (defined $logo) {
8206                         # not twice as wide as tall: 72 x 27 pixels
8207                         print "<logo>" . esc_url($logo) . "</logo>\n";
8208                 }
8209                 if (! %latest_date) {
8210                         # dummy date to keep the feed valid until commits trickle in:
8211                         print "<updated>1970-01-01T00:00:00Z</updated>\n";
8212                 } else {
8213                         print "<updated>$latest_date{'iso-8601'}</updated>\n";
8214                 }
8215                 print "<generator version='$version/$git_version'>gitweb</generator>\n";
8216         }
8217
8218         # contents
8219         for (my $i = 0; $i <= $#commitlist; $i++) {
8220                 my %co = %{$commitlist[$i]};
8221                 my $commit = $co{'id'};
8222                 # we read 150, we always show 30 and the ones more recent than 48 hours
8223                 if (($i >= 20) && ((time - $co{'author_epoch'}) > 48*60*60)) {
8224                         last;
8225                 }
8226                 my %cd = parse_date($co{'author_epoch'}, $co{'author_tz'});
8227
8228                 # get list of changed files
8229                 open my $fd, "-|", git_cmd(), "diff-tree", '-r', @diff_opts,
8230                         $co{'parent'} || "--root",
8231                         $co{'id'}, "--", (defined $file_name ? $file_name : ())
8232                         or next;
8233                 my @difftree = map { chomp; $_ } <$fd>;
8234                 close $fd
8235                         or next;
8236
8237                 # print element (entry, item)
8238                 my $co_url = href(-full=>1, action=>"commitdiff", hash=>$commit);
8239                 if ($format eq 'rss') {
8240                         print "<item>\n" .
8241                               "<title>" . esc_html($co{'title'}) . "</title>\n" .
8242                               "<author>" . esc_html($co{'author'}) . "</author>\n" .
8243                               "<pubDate>$cd{'rfc2822'}</pubDate>\n" .
8244                               "<guid isPermaLink=\"true\">$co_url</guid>\n" .
8245                               "<link>$co_url</link>\n" .
8246                               "<description>" . esc_html($co{'title'}) . "</description>\n" .
8247                               "<content:encoded>" .
8248                               "<![CDATA[\n";
8249                 } elsif ($format eq 'atom') {
8250                         print "<entry>\n" .
8251                               "<title type=\"html\">" . esc_html($co{'title'}) . "</title>\n" .
8252                               "<updated>$cd{'iso-8601'}</updated>\n" .
8253                               "<author>\n" .
8254                               "  <name>" . esc_html($co{'author_name'}) . "</name>\n";
8255                         if ($co{'author_email'}) {
8256                                 print "  <email>" . esc_html($co{'author_email'}) . "</email>\n";
8257                         }
8258                         print "</author>\n" .
8259                               # use committer for contributor
8260                               "<contributor>\n" .
8261                               "  <name>" . esc_html($co{'committer_name'}) . "</name>\n";
8262                         if ($co{'committer_email'}) {
8263                                 print "  <email>" . esc_html($co{'committer_email'}) . "</email>\n";
8264                         }
8265                         print "</contributor>\n" .
8266                               "<published>$cd{'iso-8601'}</published>\n" .
8267                               "<link rel=\"alternate\" type=\"text/html\" href=\"$co_url\" />\n" .
8268                               "<id>$co_url</id>\n" .
8269                               "<content type=\"xhtml\" xml:base=\"" . esc_url($my_url) . "\">\n" .
8270                               "<div xmlns=\"http://www.w3.org/1999/xhtml\">\n";
8271                 }
8272                 my $comment = $co{'comment'};
8273                 print "<pre>\n";
8274                 foreach my $line (@$comment) {
8275                         $line = esc_html($line);
8276                         print "$line\n";
8277                 }
8278                 print "</pre><ul>\n";
8279                 foreach my $difftree_line (@difftree) {
8280                         my %difftree = parse_difftree_raw_line($difftree_line);
8281                         next if !$difftree{'from_id'};
8282
8283                         my $file = $difftree{'file'} || $difftree{'to_file'};
8284
8285                         print "<li>" .
8286                               "[" .
8287                               $cgi->a({-href => href(-full=>1, action=>"blobdiff",
8288                                                      hash=>$difftree{'to_id'}, hash_parent=>$difftree{'from_id'},
8289                                                      hash_base=>$co{'id'}, hash_parent_base=>$co{'parent'},
8290                                                      file_name=>$file, file_parent=>$difftree{'from_file'}),
8291                                       -title => "diff"}, 'D');
8292                         if ($have_blame) {
8293                                 print $cgi->a({-href => href(-full=>1, action=>"blame",
8294                                                              file_name=>$file, hash_base=>$commit),
8295                                               -title => "blame"}, 'B');
8296                         }
8297                         # if this is not a feed of a file history
8298                         if (!defined $file_name || $file_name ne $file) {
8299                                 print $cgi->a({-href => href(-full=>1, action=>"history",
8300                                                              file_name=>$file, hash=>$commit),
8301                                               -title => "history"}, 'H');
8302                         }
8303                         $file = esc_path($file);
8304                         print "] ".
8305                               "$file</li>\n";
8306                 }
8307                 if ($format eq 'rss') {
8308                         print "</ul>]]>\n" .
8309                               "</content:encoded>\n" .
8310                               "</item>\n";
8311                 } elsif ($format eq 'atom') {
8312                         print "</ul>\n</div>\n" .
8313                               "</content>\n" .
8314                               "</entry>\n";
8315                 }
8316         }
8317
8318         # end of feed
8319         if ($format eq 'rss') {
8320                 print "</channel>\n</rss>\n";
8321         } elsif ($format eq 'atom') {
8322                 print "</feed>\n";
8323         }
8324 }
8325
8326 sub git_rss {
8327         git_feed('rss');
8328 }
8329
8330 sub git_atom {
8331         git_feed('atom');
8332 }
8333
8334 sub git_opml {
8335         my @list = git_get_projects_list($project_filter, $strict_export);
8336         if (!@list) {
8337                 die_error(404, "No projects found");
8338         }
8339
8340         print $cgi->header(
8341                 -type => 'text/xml',
8342                 -charset => 'utf-8',
8343                 -content_disposition => 'inline; filename="opml.xml"');
8344
8345         my $title = esc_html($site_name);
8346         my $filter = " within subdirectory ";
8347         if (defined $project_filter) {
8348                 $filter .= esc_html($project_filter);
8349         } else {
8350                 $filter = "";
8351         }
8352         print <<XML;
8353 <?xml version="1.0" encoding="utf-8"?>
8354 <opml version="1.0">
8355 <head>
8356   <title>$title OPML Export$filter</title>
8357 </head>
8358 <body>
8359 <outline text="git RSS feeds">
8360 XML
8361
8362         foreach my $pr (@list) {
8363                 my %proj = %$pr;
8364                 my $head = git_get_head_hash($proj{'path'});
8365                 if (!defined $head) {
8366                         next;
8367                 }
8368                 $git_dir = "$projectroot/$proj{'path'}";
8369                 my %co = parse_commit($head);
8370                 if (!%co) {
8371                         next;
8372                 }
8373
8374                 my $path = esc_html(chop_str($proj{'path'}, 25, 5));
8375                 my $rss  = href('project' => $proj{'path'}, 'action' => 'rss', -full => 1);
8376                 my $html = href('project' => $proj{'path'}, 'action' => 'summary', -full => 1);
8377                 print "<outline type=\"rss\" text=\"$path\" title=\"$path\" xmlUrl=\"$rss\" htmlUrl=\"$html\"/>\n";
8378         }
8379         print <<XML;
8380 </outline>
8381 </body>
8382 </opml>
8383 XML
8384 }