]> matita.cs.unibo.it Git - helm.git/blob - helm/ocaml/getter/http_getter_common.ml
b1f96d8bddc13b682b37ae88813a6b8e0131cce5
[helm.git] / helm / ocaml / getter / http_getter_common.ml
1 (*
2  * Copyright (C) 2003-2004:
3  *    Stefano Zacchiroli <zack@cs.unibo.it>
4  *    for the HELM Team http://helm.cs.unibo.it/
5  *
6  *  This file is part of HELM, an Hypertextual, Electronic
7  *  Library of Mathematics, developed at the Computer Science
8  *  Department, University of Bologna, Italy.
9  *
10  *  HELM is free software; you can redistribute it and/or
11  *  modify it under the terms of the GNU General Public License
12  *  as published by the Free Software Foundation; either version 2
13  *  of the License, or (at your option) any later version.
14  *
15  *  HELM is distributed in the hope that it will be useful,
16  *  but WITHOUT ANY WARRANTY; without even the implied warranty of
17  *  MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
18  *  GNU General Public License for more details.
19  *
20  *  You should have received a copy of the GNU General Public License
21  *  along with HELM; if not, write to the Free Software
22  *  Foundation, Inc., 59 Temple Place - Suite 330, Boston,
23  *  MA  02111-1307, USA.
24  *
25  *  For details, see the HELM World-Wide-Web page,
26  *  http://helm.cs.unibo.it/
27  *)
28
29 open Http_getter_types;;
30 open Printf;;
31
32 let string_of_ls_flag = function No -> "NO" | Yes -> "YES" | Ann -> "ANN"
33 let string_of_encoding = function
34   | `Normal -> "Normal"
35   | `Gzipped -> "GZipped"
36
37 let is_cic_obj_uri uri = Pcre.pmatch ~pat:"^cic:" uri
38 let is_theory_uri uri = Pcre.pmatch ~pat:"^theory:" uri
39 let is_cic_uri uri = is_cic_obj_uri uri || is_theory_uri uri
40 let is_nuprl_uri uri = Pcre.pmatch ~pat:"^nuprl:" uri
41 let is_rdf_uri uri = Pcre.pmatch ~pat:"^helm:rdf(.*):(.*)//(.*)" uri
42 let is_xsl_uri uri = Pcre.pmatch ~pat:"^\\w+\\.xsl" uri
43
44 let rec uri_of_string = function
45   | uri when is_rdf_uri uri ->
46       (match Pcre.split ~pat:"//" uri with
47       | [ prefix; uri ] ->
48           let rest =
49             match uri_of_string uri with
50             | Cic_uri xmluri -> xmluri
51             | _ -> raise (Invalid_URI uri)
52           in
53           Rdf_uri (prefix, rest)
54       | _ -> raise (Invalid_URI uri))
55   | uri when is_cic_uri uri -> Cic_uri (Cic (Pcre.replace ~pat:"^cic:" uri))
56   | uri when is_nuprl_uri uri -> Nuprl_uri (Pcre.replace ~pat:"^nuprl:" uri)
57   | uri when is_theory_uri uri ->
58       Cic_uri (Theory (Pcre.replace ~pat:"^theory:" uri))
59   | uri -> raise (Invalid_URI uri)
60
61 let patch_xsl ?(via_http = true) () =
62   fun line ->
63     let mk_patch_fun tag line =
64       Pcre.replace
65         ~pat:(sprintf "%s\\s+href=\"" tag)
66         ~templ:(sprintf "%s href=\"%s/getxslt?uri="
67           tag (Lazy.force Http_getter_env.my_own_url))
68         line
69     in
70     let (patch_import, patch_include) =
71       (mk_patch_fun "xsl:import", mk_patch_fun "xsl:include")
72     in
73     patch_include (patch_import line)
74
75 let patch_entity ?(via_http = true) () =
76   if via_http then
77     fun line ->
78       List.fold_left
79         (fun url s ->
80           Pcre.replace
81             ~pat:(sprintf "ENTITY (.*) SYSTEM\\s+\"(%s/)?" url)
82             ~templ:(sprintf "ENTITY $1 SYSTEM \"%s/getdtd?uri="
83               (Lazy.force Http_getter_env.my_own_url))
84             s)
85         line
86         (Lazy.force Http_getter_env.dtd_base_urls)
87   else
88     fun line ->
89       List.fold_left
90         (fun url s ->
91           Pcre.replace
92             ~pat:(sprintf "ENTITY (.*) SYSTEM\\s+\"(%s/)?" url)
93             ~templ:(sprintf "ENTITY $1 SYSTEM \"file://%s/"
94               (Lazy.force Http_getter_env.dtd_dir))
95             s)
96         line
97         (Lazy.force Http_getter_env.dtd_base_urls)
98
99 let patch_doctype ?(via_http = true) () =
100   if via_http then
101     fun line ->
102       List.fold_left
103         (fun url s ->
104           Pcre.replace
105             ~pat:(sprintf "DOCTYPE (.*) SYSTEM\\s+\"%s/" url)
106             ~templ:(sprintf "DOCTYPE $1 SYSTEM \"%s/getdtd?uri="
107               (Lazy.force Http_getter_env.my_own_url))
108             s)
109         line
110         (Lazy.force Http_getter_env.dtd_base_urls)
111   else
112     fun line ->
113       List.fold_left
114         (fun url s ->
115           Pcre.replace
116             ~pat:(sprintf "DOCTYPE (.*) SYSTEM\\s+\"%s/" url)
117             ~templ:(sprintf "DOCTYPE $1 SYSTEM \"file://%s/"
118               (Lazy.force Http_getter_env.my_own_url))
119             s)
120         line
121         (Lazy.force Http_getter_env.dtd_base_urls)
122
123 let patch_dtd = patch_entity
124
125 let patch_xml ?via_http () line =
126   patch_doctype ?via_http () (patch_entity ?via_http () line)
127
128 let return_file
129   ~fname ?contype ?contenc
130   ?(patch_fun = fun x -> x) ?(gunzip = false) ?(via_http = true) outchan
131   =
132   let headers =
133     match (contype, contenc) with
134     | (Some t, Some e) -> ["Content-Encoding", e; "Content-Type", t]
135     | (Some t, None) -> ["Content-Type" , t]
136     | (None, Some e) -> ["Content-Encoding", e]
137     | (None, None) -> []
138   in
139   if via_http then begin
140     Http_daemon.send_basic_headers ~code:200 outchan;
141     Http_daemon.send_headers headers outchan;
142     Http_daemon.send_CRLF outchan
143   end;
144   if gunzip then begin  (* gunzip needed, uncompress file, apply patch_fun to
145                         it, compress the result and sent it to client *)
146     let (tmp1, tmp2) =
147       (Http_getter_misc.tempfile (), Http_getter_misc.tempfile ())
148     in
149     try
150       Http_getter_misc.gunzip ~keep:true ~output:tmp1 fname;(* gunzip to tmp1 *)
151       let new_file = open_out tmp2 in
152       Http_getter_misc.iter_file  (* tmp2 = patch(tmp1) *)
153         (fun line ->
154           output_string new_file (patch_fun line ^ "\n");
155           flush outchan)
156         tmp1;
157       close_out new_file;
158       Http_getter_misc.gzip ~output:tmp1 tmp2;  (* tmp1 = gzip(tmp2); rm tmp2 *)
159       Http_getter_misc.iter_file  (* send tmp1 to client as is*)
160         (fun line -> output_string outchan (line ^ "\n"); flush outchan)
161         tmp1;
162       Sys.remove tmp1       (* rm tmp1 *)
163     with e ->
164       Sys.remove tmp1;
165       raise e
166   end else begin (* no need to gunzip, apply patch_fun directly to file *)
167     Http_getter_misc.iter_file
168       (fun line -> output_string outchan (patch_fun line ^ "\n"); flush outchan)
169       fname;
170   end
171 ;;
172