]> matita.cs.unibo.it Git - helm.git/blob - helm/ocaml/cic/cicPxpParser.ml
- implemented CicPushParser which parser CIC objects using Expat
[helm.git] / helm / ocaml / cic / cicPxpParser.ml
1 (* Copyright (C) 2000, HELM Team.
2  * 
3  * This file is part of HELM, an Hypertextual, Electronic
4  * Library of Mathematics, developed at the Computer Science
5  * Department, University of Bologna, Italy.
6  * 
7  * HELM is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License
9  * as published by the Free Software Foundation; either version 2
10  * of the License, or (at your option) any later version.
11  * 
12  * HELM is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with HELM; if not, write to the Free Software
19  * Foundation, Inc., 59 Temple Place - Suite 330, Boston,
20  * MA  02111-1307, USA.
21  * 
22  * For details, see the HELM World-Wide-Web page,
23  * http://cs.unibo.it/helm/.
24  *)
25
26 (******************************************************************************)
27 (*                                                                            *)
28 (*                               PROJECT HELM                                 *)
29 (*                                                                            *)
30 (*                Claudio Sacerdoti Coen <sacerdot@cs.unibo.it>               *)
31 (*                                 24/01/2000                                 *)
32 (*                                                                            *)
33 (* This is the main (top level) module of a parser for cic objects from xml   *)
34 (* files to the internal representation. It uses the modules cicParser2       *)
35 (* (objects level) and cicParser3 (terms level)                               *)
36 (*                                                                            *)
37 (******************************************************************************)
38
39 module CicParser =
40 struct
41
42 exception Getter_failure of string * string
43 exception Parser_failure of string
44
45   (** tries to recover from a parse error caused by the parsing of a getter
46   * error message (e.g. Key_not_found exception). Unfortunately we have to
47   * re-parse xml document to extract exception data *)
48 let try_recover exn filename =
49   let rc = ref None in
50   (try
51     let entity_manager =
52       Pxp_ev_parser.create_entity_manager ~is_document:true
53         PxpHelmConf.pxp_config (Pxp_types.from_file filename)
54     in
55     let pull_parser =
56       Pxp_ev_parser.create_pull_parser PxpHelmConf.pxp_config
57         (`Entry_document []) entity_manager
58     in
59     let rec find_exn p =
60       match p () with
61       | None -> ()
62       | Some (Pxp_types.E_start_tag ("html", attrs, _, _)) ->
63           let exn = List.assoc "helm:exception" attrs in
64           let arg =
65             try List.assoc "helm:exception_arg" attrs with Not_found -> ""
66           in
67           rc := Some (Getter_failure (exn, arg))
68       | _ -> find_exn p
69     in
70     find_exn pull_parser
71   with _ -> raise (Parser_failure (Printexc.to_string exn)));
72   match !rc with
73   | None -> raise (Parser_failure (Printexc.to_string exn))
74   | Some exn -> raise exn
75
76 let parse_document filename =
77   try
78     Pxp_tree_parser.parse_document_entity PxpHelmConf.pxp_config
79       (Pxp_types.from_file ~alt:[PxpUrlResolver.url_resolver] filename)
80       CicParser3.domspec
81   with exn ->
82     raise (try_recover exn filename)
83
84 (* given the filename of an xml file of a cic object it returns its internal *)
85 (* representation.                                                           *)
86 let annobj_of_xml uri filename filenamebody =
87   CicParser3.set_uri uri;
88   let root, rootbody =
89     let doc = parse_document filename in
90     let docroot = doc#root in
91      match filenamebody with
92         None -> docroot,None
93       | Some filename ->
94          let docbody = parse_document filename in
95          docroot,Some docbody#root
96   in
97    CicParser2.get_term root rootbody
98
99 let obj_of_xml uri filename filenamebody =
100  Deannotate.deannotate_obj (annobj_of_xml uri filename filenamebody)
101
102 end
103