]> matita.cs.unibo.it Git - helm.git/blob - helm/ocaml/tex_cic_textual_parser/texCicTextualLexer.mll
The two lexers now raise CicTextualParser0.LexerFailure instead of
[helm.git] / helm / ocaml / tex_cic_textual_parser / texCicTextualLexer.mll
1 (* Copyright (C) 2000, HELM Team.
2  * 
3  * This file is part of HELM, an Hypertextual, Electronic
4  * Library of Mathematics, developed at the Computer Science
5  * Department, University of Bologna, Italy.
6  * 
7  * HELM is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License
9  * as published by the Free Software Foundation; either version 2
10  * of the License, or (at your option) any later version.
11  * 
12  * HELM is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with HELM; if not, write to the Free Software
19  * Foundation, Inc., 59 Temple Place - Suite 330, Boston,
20  * MA  02111-1307, USA.
21  * 
22  * For details, see the HELM World-Wide-Web page,
23  * http://cs.unibo.it/helm/.
24  *)
25
26 {
27  open TexCicTextualParser;;
28  module L = Lexing;;
29  module U = UriManager;;
30
31  let indtyuri_of_uri uri =
32   let index_sharp =  String.index uri '#' in
33   let index_num = index_sharp + 3 in
34    try
35     (UriManager.uri_of_string (String.sub uri 0 index_sharp),
36      int_of_string(String.sub uri index_num (String.length uri - index_num)) - 1
37     )
38    with
39     Failure msg ->
40      raise (CicTextualParser0.LexerFailure "Not an inductive URI")
41  ;;
42
43  let indconuri_of_uri uri =
44   let index_sharp =  String.index uri '#' in
45   let index_div = String.rindex uri '/' in
46   let index_con = index_div + 1 in
47    try
48     (UriManager.uri_of_string (String.sub uri 0 index_sharp),
49      int_of_string
50       (String.sub uri (index_sharp + 3) (index_div - index_sharp - 3)) - 1,
51      int_of_string
52       (String.sub uri index_con (String.length uri - index_con))
53     )
54    with
55     Failure msg ->
56      raise (CicTextualParser0.LexerFailure "Not a constructor URI")
57  ;;
58
59  (* TeX unquoting for "_" *)
60  let unquote str =
61   Str.global_replace (Str.regexp "\\\\_") "_" str
62  ;;
63 }
64 let dollar = '$'
65 let num = ['1'-'9']['0'-'9']* | '0'
66 let alfa = ['A'-'Z' 'a'-'z' '_' ''' '-'] | "\\_"
67 let ident = alfa (alfa | num)*
68 let baseuri = '/'(ident '/')* ident '.'
69 let conuri = baseuri "con"
70 let varuri = baseuri "var"
71 let indtyuri = baseuri "ind#1/" num
72 let indconuri = baseuri "ind#1/" num "/" num
73 let blanks = [' ' '\t' '\n' '~' '{' '}'] | "\\;"
74 rule token =
75  parse
76     blanks      { token lexbuf } (* skip blanks *)
77   | "\\Case"    { CASE }
78   | "\\Fix"     { FIX }
79   | "\\CoFix"   { COFIX }
80   | "\\Set"     { SET }
81   | "\\Prop"    { PROP }
82   | "\\Type"    { TYPE }
83   | ident       { ID (unquote (L.lexeme lexbuf)) }
84   | conuri      { CONURI
85                    (U.uri_of_string ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
86   | varuri      { VARURI
87                    (U.uri_of_string ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
88   | indtyuri    { INDTYURI
89                    (indtyuri_of_uri ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
90   | indconuri   { INDCONURI
91                    (indconuri_of_uri("cic:" ^ (unquote (L.lexeme lexbuf)))) }
92   | num         { NUM (int_of_string (L.lexeme lexbuf)) }
93   | '?' num     { let lexeme = L.lexeme lexbuf in
94                    META
95                     (int_of_string
96                      (String.sub lexeme 1 (String.length lexeme - 1))) }
97   | ":>"        { CAST }
98   | ":="        { LETIN }
99   | '?'         { IMPLICIT }
100   | '('         { LPAREN }
101   | ')'         { RPAREN }
102   | "\\["         { LBRACKET }
103   | "\\]"         { RBRACKET }
104   | "\\{"       { LCURLY }
105   | "\\}"       { RCURLY }
106   | ';'         { SEMICOLON }
107   | "\\lambda"  { LAMBDA }
108   | "\\pi"      { PROD }
109   | "\\forall"  { PROD }
110   | ':'         { COLON }
111   | '.'         { DOT }
112   | "\\to"      { ARROW }
113   | '_'         { NONE }
114   | dollar      { DOLLAR }
115   | eof         { EOF }
116   (* Arithmetical operators *)
117   | '+'         { PLUS }
118   | '*'         { TIMES }
119   | '='         { EQ }
120 {}