add open_nofollow() helper
[git] / t / t5550-http-fetch-dumb.sh
1 #!/bin/sh
2
3 test_description='test dumb fetching over http via static file'
4 GIT_TEST_DEFAULT_INITIAL_BRANCH_NAME=main
5 export GIT_TEST_DEFAULT_INITIAL_BRANCH_NAME
6
7 . ./test-lib.sh
8 . "$TEST_DIRECTORY"/lib-httpd.sh
9 start_httpd
10
11 test_expect_success 'setup repository' '
12         git config push.default matching &&
13         echo content1 >file &&
14         git add file &&
15         git commit -m one &&
16         echo content2 >file &&
17         git add file &&
18         git commit -m two
19 '
20
21 test_expect_success 'create http-accessible bare repository with loose objects' '
22         cp -R .git "$HTTPD_DOCUMENT_ROOT_PATH/repo.git" &&
23         (cd "$HTTPD_DOCUMENT_ROOT_PATH/repo.git" &&
24          git config core.bare true &&
25          mkdir -p hooks &&
26          write_script "hooks/post-update" <<-\EOF &&
27          exec git update-server-info
28         EOF
29          hooks/post-update
30         ) &&
31         git remote add public "$HTTPD_DOCUMENT_ROOT_PATH/repo.git" &&
32         git push public main:main
33 '
34
35 test_expect_success 'clone http repository' '
36         git clone $HTTPD_URL/dumb/repo.git clone-tmpl &&
37         cp -R clone-tmpl clone &&
38         test_cmp file clone/file
39 '
40
41 test_expect_success 'list refs from outside any repository' '
42         cat >expect <<-EOF &&
43         $(git rev-parse main)   HEAD
44         $(git rev-parse main)   refs/heads/main
45         EOF
46         nongit git ls-remote "$HTTPD_URL/dumb/repo.git" >actual &&
47         test_cmp expect actual
48 '
49
50 test_expect_success 'create password-protected repository' '
51         mkdir -p "$HTTPD_DOCUMENT_ROOT_PATH/auth/dumb/" &&
52         cp -Rf "$HTTPD_DOCUMENT_ROOT_PATH/repo.git" \
53                "$HTTPD_DOCUMENT_ROOT_PATH/auth/dumb/repo.git"
54 '
55
56 test_expect_success 'create empty remote repository' '
57         git init --bare "$HTTPD_DOCUMENT_ROOT_PATH/empty.git" &&
58         (cd "$HTTPD_DOCUMENT_ROOT_PATH/empty.git" &&
59          mkdir -p hooks &&
60          write_script "hooks/post-update" <<-\EOF &&
61          exec git update-server-info
62         EOF
63          hooks/post-update
64         )
65 '
66
67 test_expect_success 'empty dumb HTTP repository has default hash algorithm' '
68         test_when_finished "rm -fr clone-empty" &&
69         git clone $HTTPD_URL/dumb/empty.git clone-empty &&
70         git -C clone-empty rev-parse --show-object-format >empty-format &&
71         test "$(cat empty-format)" = "$(test_oid algo)"
72 '
73
74 setup_askpass_helper
75
76 test_expect_success 'cloning password-protected repository can fail' '
77         set_askpass wrong &&
78         test_must_fail git clone "$HTTPD_URL/auth/dumb/repo.git" clone-auth-fail &&
79         expect_askpass both wrong
80 '
81
82 test_expect_success 'http auth can use user/pass in URL' '
83         set_askpass wrong &&
84         git clone "$HTTPD_URL_USER_PASS/auth/dumb/repo.git" clone-auth-none &&
85         expect_askpass none
86 '
87
88 test_expect_success 'http auth can use just user in URL' '
89         set_askpass wrong pass@host &&
90         git clone "$HTTPD_URL_USER/auth/dumb/repo.git" clone-auth-pass &&
91         expect_askpass pass user@host
92 '
93
94 test_expect_success 'http auth can request both user and pass' '
95         set_askpass user@host pass@host &&
96         git clone "$HTTPD_URL/auth/dumb/repo.git" clone-auth-both &&
97         expect_askpass both user@host
98 '
99
100 test_expect_success 'http auth respects credential helper config' '
101         test_config_global credential.helper "!f() {
102                 cat >/dev/null
103                 echo username=user@host
104                 echo password=pass@host
105         }; f" &&
106         set_askpass wrong &&
107         git clone "$HTTPD_URL/auth/dumb/repo.git" clone-auth-helper &&
108         expect_askpass none
109 '
110
111 test_expect_success 'http auth can get username from config' '
112         test_config_global "credential.$HTTPD_URL.username" user@host &&
113         set_askpass wrong pass@host &&
114         git clone "$HTTPD_URL/auth/dumb/repo.git" clone-auth-user &&
115         expect_askpass pass user@host
116 '
117
118 test_expect_success 'configured username does not override URL' '
119         test_config_global "credential.$HTTPD_URL.username" wrong &&
120         set_askpass wrong pass@host &&
121         git clone "$HTTPD_URL_USER/auth/dumb/repo.git" clone-auth-user2 &&
122         expect_askpass pass user@host
123 '
124
125 test_expect_success 'set up repo with http submodules' '
126         git init super &&
127         set_askpass user@host pass@host &&
128         (
129                 cd super &&
130                 git submodule add "$HTTPD_URL/auth/dumb/repo.git" sub &&
131                 git commit -m "add submodule"
132         )
133 '
134
135 test_expect_success 'cmdline credential config passes to submodule via clone' '
136         set_askpass wrong pass@host &&
137         test_must_fail git clone --recursive super super-clone &&
138         rm -rf super-clone &&
139
140         set_askpass wrong pass@host &&
141         git -c "credential.$HTTPD_URL.username=user@host" \
142                 clone --recursive super super-clone &&
143         expect_askpass pass user@host
144 '
145
146 test_expect_success 'cmdline credential config passes submodule via fetch' '
147         set_askpass wrong pass@host &&
148         test_must_fail git -C super-clone fetch --recurse-submodules &&
149
150         set_askpass wrong pass@host &&
151         git -C super-clone \
152             -c "credential.$HTTPD_URL.username=user@host" \
153             fetch --recurse-submodules &&
154         expect_askpass pass user@host
155 '
156
157 test_expect_success 'cmdline credential config passes submodule update' '
158         # advance the submodule HEAD so that a fetch is required
159         git commit --allow-empty -m foo &&
160         git push "$HTTPD_DOCUMENT_ROOT_PATH/auth/dumb/repo.git" HEAD &&
161         sha1=$(git rev-parse HEAD) &&
162         git -C super-clone update-index --cacheinfo 160000,$sha1,sub &&
163
164         set_askpass wrong pass@host &&
165         test_must_fail git -C super-clone submodule update &&
166
167         set_askpass wrong pass@host &&
168         git -C super-clone \
169             -c "credential.$HTTPD_URL.username=user@host" \
170             submodule update &&
171         expect_askpass pass user@host
172 '
173
174 test_expect_success 'fetch changes via http' '
175         echo content >>file &&
176         git commit -a -m two &&
177         git push public &&
178         (cd clone && git pull) &&
179         test_cmp file clone/file
180 '
181
182 test_expect_success 'fetch changes via manual http-fetch' '
183         cp -R clone-tmpl clone2 &&
184
185         HEAD=$(git rev-parse --verify HEAD) &&
186         (cd clone2 &&
187          git http-fetch -a -w heads/main-new $HEAD $(git config remote.origin.url) &&
188          git checkout main-new &&
189          test $HEAD = $(git rev-parse --verify HEAD)) &&
190         test_cmp file clone2/file
191 '
192
193 test_expect_success 'manual http-fetch without -a works just as well' '
194         cp -R clone-tmpl clone3 &&
195
196         HEAD=$(git rev-parse --verify HEAD) &&
197         (cd clone3 &&
198          git http-fetch -w heads/main-new $HEAD $(git config remote.origin.url) &&
199          git checkout main-new &&
200          test $HEAD = $(git rev-parse --verify HEAD)) &&
201         test_cmp file clone3/file
202 '
203
204 test_expect_success 'http remote detects correct HEAD' '
205         git push public main:other &&
206         (cd clone &&
207          git remote set-head origin -d &&
208          git remote set-head origin -a &&
209          git symbolic-ref refs/remotes/origin/HEAD > output &&
210          echo refs/remotes/origin/main > expect &&
211          test_cmp expect output
212         )
213 '
214
215 test_expect_success 'fetch packed objects' '
216         cp -R "$HTTPD_DOCUMENT_ROOT_PATH"/repo.git "$HTTPD_DOCUMENT_ROOT_PATH"/repo_pack.git &&
217         (cd "$HTTPD_DOCUMENT_ROOT_PATH"/repo_pack.git &&
218          git --bare repack -a -d
219         ) &&
220         git clone $HTTPD_URL/dumb/repo_pack.git
221 '
222
223 test_expect_success 'http-fetch --packfile' '
224         # Arbitrary hash. Use rev-parse so that we get one of the correct
225         # length.
226         ARBITRARY=$(git -C "$HTTPD_DOCUMENT_ROOT_PATH"/repo_pack.git rev-parse HEAD) &&
227
228         git init packfileclient &&
229         p=$(cd "$HTTPD_DOCUMENT_ROOT_PATH"/repo_pack.git && ls objects/pack/pack-*.pack) &&
230         git -C packfileclient http-fetch --packfile=$ARBITRARY "$HTTPD_URL"/dumb/repo_pack.git/$p >out &&
231
232         grep "^keep.[0-9a-f]\{16,\}$" out &&
233         cut -c6- out >packhash &&
234
235         # Ensure that the expected files are generated
236         test -e "packfileclient/.git/objects/pack/pack-$(cat packhash).pack" &&
237         test -e "packfileclient/.git/objects/pack/pack-$(cat packhash).idx" &&
238         test -e "packfileclient/.git/objects/pack/pack-$(cat packhash).keep" &&
239
240         # Ensure that it has the HEAD of repo_pack, at least
241         HASH=$(git -C "$HTTPD_DOCUMENT_ROOT_PATH"/repo_pack.git rev-parse HEAD) &&
242         git -C packfileclient cat-file -e "$HASH"
243 '
244
245 test_expect_success 'fetch notices corrupt pack' '
246         cp -R "$HTTPD_DOCUMENT_ROOT_PATH"/repo_pack.git "$HTTPD_DOCUMENT_ROOT_PATH"/repo_bad1.git &&
247         (cd "$HTTPD_DOCUMENT_ROOT_PATH"/repo_bad1.git &&
248          p=$(ls objects/pack/pack-*.pack) &&
249          chmod u+w $p &&
250          printf %0256d 0 | dd of=$p bs=256 count=1 seek=1 conv=notrunc
251         ) &&
252         mkdir repo_bad1.git &&
253         (cd repo_bad1.git &&
254          git --bare init &&
255          test_must_fail git --bare fetch $HTTPD_URL/dumb/repo_bad1.git &&
256          test 0 = $(ls objects/pack/pack-*.pack | wc -l)
257         )
258 '
259
260 test_expect_success 'http-fetch --packfile with corrupt pack' '
261         rm -rf packfileclient &&
262         git init packfileclient &&
263         p=$(cd "$HTTPD_DOCUMENT_ROOT_PATH"/repo_bad1.git && ls objects/pack/pack-*.pack) &&
264         test_must_fail git -C packfileclient http-fetch --packfile \
265                 "$HTTPD_URL"/dumb/repo_bad1.git/$p
266 '
267
268 test_expect_success 'fetch notices corrupt idx' '
269         cp -R "$HTTPD_DOCUMENT_ROOT_PATH"/repo_pack.git "$HTTPD_DOCUMENT_ROOT_PATH"/repo_bad2.git &&
270         (cd "$HTTPD_DOCUMENT_ROOT_PATH"/repo_bad2.git &&
271          p=$(ls objects/pack/pack-*.idx) &&
272          chmod u+w $p &&
273          printf %0256d 0 | dd of=$p bs=256 count=1 seek=1 conv=notrunc
274         ) &&
275         mkdir repo_bad2.git &&
276         (cd repo_bad2.git &&
277          git --bare init &&
278          test_must_fail git --bare fetch $HTTPD_URL/dumb/repo_bad2.git &&
279          test 0 = $(ls objects/pack | wc -l)
280         )
281 '
282
283 test_expect_success 'fetch can handle previously-fetched .idx files' '
284         git checkout --orphan branch1 &&
285         echo base >file &&
286         git add file &&
287         git commit -m base &&
288         git --bare init "$HTTPD_DOCUMENT_ROOT_PATH"/repo_packed_branches.git &&
289         git push "$HTTPD_DOCUMENT_ROOT_PATH"/repo_packed_branches.git branch1 &&
290         git --git-dir="$HTTPD_DOCUMENT_ROOT_PATH"/repo_packed_branches.git repack -d &&
291         git checkout -b branch2 branch1 &&
292         echo b2 >>file &&
293         git commit -a -m b2 &&
294         git push "$HTTPD_DOCUMENT_ROOT_PATH"/repo_packed_branches.git branch2 &&
295         git --git-dir="$HTTPD_DOCUMENT_ROOT_PATH"/repo_packed_branches.git repack -d &&
296         git --bare init clone_packed_branches.git &&
297         git --git-dir=clone_packed_branches.git fetch "$HTTPD_URL"/dumb/repo_packed_branches.git branch1:branch1 &&
298         git --git-dir=clone_packed_branches.git fetch "$HTTPD_URL"/dumb/repo_packed_branches.git branch2:branch2
299 '
300
301 test_expect_success 'did not use upload-pack service' '
302         ! grep "/git-upload-pack" "$HTTPD_ROOT_PATH/access.log"
303 '
304
305 test_expect_success 'git client shows text/plain errors' '
306         test_must_fail git clone "$HTTPD_URL/error/text" 2>stderr &&
307         grep "this is the error message" stderr
308 '
309
310 test_expect_success 'git client does not show html errors' '
311         test_must_fail git clone "$HTTPD_URL/error/html" 2>stderr &&
312         ! grep "this is the error message" stderr
313 '
314
315 test_expect_success 'git client shows text/plain with a charset' '
316         test_must_fail git clone "$HTTPD_URL/error/charset" 2>stderr &&
317         grep "this is the error message" stderr
318 '
319
320 test_expect_success 'http error messages are reencoded' '
321         test_must_fail git clone "$HTTPD_URL/error/utf16" 2>stderr &&
322         grep "this is the error message" stderr
323 '
324
325 test_expect_success 'reencoding is robust to whitespace oddities' '
326         test_must_fail git clone "$HTTPD_URL/error/odd-spacing" 2>stderr &&
327         grep "this is the error message" stderr
328 '
329
330 check_language () {
331         case "$2" in
332         '')
333                 >expect
334                 ;;
335         ?*)
336                 echo "=> Send header: Accept-Language: $1" >expect
337                 ;;
338         esac &&
339         GIT_TRACE_CURL=true \
340         LANGUAGE=$2 \
341         git ls-remote "$HTTPD_URL/dumb/repo.git" >output 2>&1 &&
342         tr -d '\015' <output |
343         sort -u |
344         sed -ne '/^=> Send header: Accept-Language:/ p' >actual &&
345         test_cmp expect actual
346 }
347
348 test_expect_success 'git client sends Accept-Language based on LANGUAGE' '
349         check_language "ko-KR, *;q=0.9" ko_KR.UTF-8'
350
351 test_expect_success 'git client sends Accept-Language correctly with unordinary LANGUAGE' '
352         check_language "ko-KR, *;q=0.9" "ko_KR:" &&
353         check_language "ko-KR, en-US;q=0.9, *;q=0.8" "ko_KR::en_US" &&
354         check_language "ko-KR, *;q=0.9" ":::ko_KR" &&
355         check_language "ko-KR, en-US;q=0.9, *;q=0.8" "ko_KR!!:en_US" &&
356         check_language "ko-KR, ja-JP;q=0.9, *;q=0.8" "ko_KR en_US:ja_JP"'
357
358 test_expect_success 'git client sends Accept-Language with many preferred languages' '
359         check_language "ko-KR, en-US;q=0.9, fr-CA;q=0.8, de;q=0.7, sr;q=0.6, \
360 ja;q=0.5, zh;q=0.4, sv;q=0.3, pt;q=0.2, *;q=0.1" \
361                 ko_KR.EUC-KR:en_US.UTF-8:fr_CA:de.UTF-8@euro:sr@latin:ja:zh:sv:pt &&
362         check_language "ko-KR, en-US;q=0.99, fr-CA;q=0.98, de;q=0.97, sr;q=0.96, \
363 ja;q=0.95, zh;q=0.94, sv;q=0.93, pt;q=0.92, nb;q=0.91, *;q=0.90" \
364                 ko_KR.EUC-KR:en_US.UTF-8:fr_CA:de.UTF-8@euro:sr@latin:ja:zh:sv:pt:nb
365 '
366
367 test_expect_success 'git client does not send an empty Accept-Language' '
368         GIT_TRACE_CURL=true LANGUAGE= git ls-remote "$HTTPD_URL/dumb/repo.git" 2>stderr &&
369         ! grep "^=> Send header: Accept-Language:" stderr
370 '
371
372 test_expect_success 'remote-http complains cleanly about malformed urls' '
373         test_must_fail git remote-http http::/example.com/repo.git 2>stderr &&
374         test_i18ngrep "url has no scheme" stderr
375 '
376
377 # NEEDSWORK: Writing commands to git-remote-curl can race against the latter
378 # erroring out, producing SIGPIPE. Remove "ok=sigpipe" once transport-helper has
379 # learned to handle early remote helper failures more cleanly.
380 test_expect_success 'remote-http complains cleanly about empty scheme' '
381         test_must_fail ok=sigpipe git ls-remote \
382                 http::${HTTPD_URL#http}/dumb/repo.git 2>stderr &&
383         test_i18ngrep "url has no scheme" stderr
384 '
385
386 test_expect_success 'redirects can be forbidden/allowed' '
387         test_must_fail git -c http.followRedirects=false \
388                 clone $HTTPD_URL/dumb-redir/repo.git dumb-redir &&
389         git -c http.followRedirects=true \
390                 clone $HTTPD_URL/dumb-redir/repo.git dumb-redir 2>stderr
391 '
392
393 test_expect_success 'redirects are reported to stderr' '
394         # just look for a snippet of the redirected-to URL
395         test_i18ngrep /dumb/ stderr
396 '
397
398 test_expect_success 'non-initial redirects can be forbidden' '
399         test_must_fail git -c http.followRedirects=initial \
400                 clone $HTTPD_URL/redir-objects/repo.git redir-objects &&
401         git -c http.followRedirects=true \
402                 clone $HTTPD_URL/redir-objects/repo.git redir-objects
403 '
404
405 test_expect_success 'http.followRedirects defaults to "initial"' '
406         test_must_fail git clone $HTTPD_URL/redir-objects/repo.git default
407 '
408
409 # The goal is for a clone of the "evil" repository, which has no objects
410 # itself, to cause the client to fetch objects from the "victim" repository.
411 test_expect_success 'set up evil alternates scheme' '
412         victim=$HTTPD_DOCUMENT_ROOT_PATH/victim.git &&
413         git init --bare "$victim" &&
414         git -C "$victim" --work-tree=. commit --allow-empty -m secret &&
415         git -C "$victim" repack -ad &&
416         git -C "$victim" update-server-info &&
417         sha1=$(git -C "$victim" rev-parse HEAD) &&
418
419         evil=$HTTPD_DOCUMENT_ROOT_PATH/evil.git &&
420         git init --bare "$evil" &&
421         # do this by hand to avoid object existence check
422         printf "%s\\t%s\\n" $sha1 refs/heads/main >"$evil/info/refs"
423 '
424
425 # Here we'll just redirect via HTTP. In a real-world attack these would be on
426 # different servers, but we should reject it either way.
427 test_expect_success 'http-alternates is a non-initial redirect' '
428         echo "$HTTPD_URL/dumb/victim.git/objects" \
429                 >"$evil/objects/info/http-alternates" &&
430         test_must_fail git -c http.followRedirects=initial \
431                 clone $HTTPD_URL/dumb/evil.git evil-initial &&
432         git -c http.followRedirects=true \
433                 clone $HTTPD_URL/dumb/evil.git evil-initial
434 '
435
436 # Curl supports a lot of protocols that we'd prefer not to allow
437 # http-alternates to use, but it's hard to test whether curl has
438 # accessed, say, the SMTP protocol, because we are not running an SMTP server.
439 # But we can check that it does not allow access to file://, which would
440 # otherwise allow this clone to complete.
441 test_expect_success 'http-alternates cannot point at funny protocols' '
442         echo "file://$victim/objects" >"$evil/objects/info/http-alternates" &&
443         test_must_fail git -c http.followRedirects=true \
444                 clone "$HTTPD_URL/dumb/evil.git" evil-file
445 '
446
447 test_expect_success 'http-alternates triggers not-from-user protocol check' '
448         echo "$HTTPD_URL/dumb/victim.git/objects" \
449                 >"$evil/objects/info/http-alternates" &&
450         test_config_global http.followRedirects true &&
451         test_must_fail git -c protocol.http.allow=user \
452                 clone $HTTPD_URL/dumb/evil.git evil-user &&
453         git -c protocol.http.allow=always \
454                 clone $HTTPD_URL/dumb/evil.git evil-user
455 '
456
457 test_expect_success 'can redirect through non-"info/refs?service=git-upload-pack" URL' '
458         git clone "$HTTPD_URL/redir-to/dumb/repo.git"
459 '
460
461 test_expect_success 'print HTTP error when any intermediate redirect throws error' '
462         test_must_fail git clone "$HTTPD_URL/redir-to/502" 2> stderr &&
463         test_i18ngrep "unable to access.*/redir-to/502" stderr
464 '
465
466 test_expect_success 'fetching via http alternates works' '
467         parent=$HTTPD_DOCUMENT_ROOT_PATH/alt-parent.git &&
468         git init --bare "$parent" &&
469         git -C "$parent" --work-tree=. commit --allow-empty -m foo &&
470         git -C "$parent" update-server-info &&
471         commit=$(git -C "$parent" rev-parse HEAD) &&
472
473         child=$HTTPD_DOCUMENT_ROOT_PATH/alt-child.git &&
474         git init --bare "$child" &&
475         echo "../../alt-parent.git/objects" >"$child/objects/info/alternates" &&
476         git -C "$child" update-ref HEAD $commit &&
477         git -C "$child" update-server-info &&
478
479         git -c http.followredirects=true clone "$HTTPD_URL/dumb/alt-child.git"
480 '
481
482 test_done