]> matita.cs.unibo.it Git - helm.git/blob - helm/ocaml/tex_cic_textual_parser/texCicTextualLexer.mll
- the mathql interpreter is not helm-dependent any more
[helm.git] / helm / ocaml / tex_cic_textual_parser / texCicTextualLexer.mll
1 (* Copyright (C) 2000, HELM Team.
2  * 
3  * This file is part of HELM, an Hypertextual, Electronic
4  * Library of Mathematics, developed at the Computer Science
5  * Department, University of Bologna, Italy.
6  * 
7  * HELM is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License
9  * as published by the Free Software Foundation; either version 2
10  * of the License, or (at your option) any later version.
11  * 
12  * HELM is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with HELM; if not, write to the Free Software
19  * Foundation, Inc., 59 Temple Place - Suite 330, Boston,
20  * MA  02111-1307, USA.
21  * 
22  * For details, see the HELM World-Wide-Web page,
23  * http://cs.unibo.it/helm/.
24  *)
25
26 {
27  open TexCicTextualParser;;
28  module L = Lexing;;
29  module U = UriManager;;
30
31  let indtyuri_of_uri uri =
32   let index_sharp =  String.index uri '#' in
33   let index_num = index_sharp + 3 in
34    try
35     (UriManager.uri_of_string (String.sub uri 0 index_sharp),
36      int_of_string(String.sub uri index_num (String.length uri - index_num)) - 1
37     )
38    with
39     Failure msg ->
40      raise (CicTextualParser0.LexerFailure "Not an inductive URI")
41  ;;
42
43  let indconuri_of_uri uri =
44   let index_sharp =  String.index uri '#' in
45   let index_div = String.rindex uri '/' in
46   let index_con = index_div + 1 in
47    try
48     (UriManager.uri_of_string (String.sub uri 0 index_sharp),
49      int_of_string
50       (String.sub uri (index_sharp + 3) (index_div - index_sharp - 3)) - 1,
51      int_of_string
52       (String.sub uri index_con (String.length uri - index_con))
53     )
54    with
55     Failure msg ->
56      raise (CicTextualParser0.LexerFailure "Not a constructor URI")
57  ;;
58
59  (* TeX unquoting for "_" *)
60  let unquote str =
61   Str.global_replace (Str.regexp "\\\\_") "_" str
62  ;;
63 }
64 let dollar = '$'
65 let num = ['1'-'9']['0'-'9']* | '0'
66 let letter = ['A'-'Z' 'a'-'z']
67 let alfa = letter | ['_' ''' '-'] | "\\_"
68 let ident = letter (alfa | num)*
69 let baseuri = '/'(ident '/')* ident '.'
70 let conuri = baseuri "con"
71 let varuri = baseuri "var"
72 let indtyuri = baseuri "ind#1/" num
73 let indconuri = baseuri "ind#1/" num "/" num
74 let blanks = [' ' '\t' '\n' '~' '{' '}'] | "\\;" | "\\rm"
75 rule token =
76  parse
77     blanks      { token lexbuf } (* skip blanks *)
78   | "\\Case"    { CASE }
79   | "\\Fix"     { FIX }
80   | "\\CoFix"   { COFIX }
81   | "\\Set"     { SET }
82   | "\\Prop"    { PROP }
83   | "\\Type"    { TYPE }
84   | ident       { ID (unquote (L.lexeme lexbuf)) }
85   | conuri      { CONURI
86                    (U.uri_of_string ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
87   | varuri      { VARURI
88                    (U.uri_of_string ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
89   | indtyuri    { INDTYURI
90                    (indtyuri_of_uri ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
91   | indconuri   { INDCONURI
92                    (indconuri_of_uri("cic:" ^ (unquote (L.lexeme lexbuf)))) }
93   | num         { NUM (int_of_string (L.lexeme lexbuf)) }
94   | '?' num     { let lexeme = L.lexeme lexbuf in
95                    META
96                     (int_of_string
97                      (String.sub lexeme 1 (String.length lexeme - 1))) }
98   | ":>"        { CAST }
99   | ":="        { LETIN }
100   | '?'         { IMPLICIT }
101   | '('         { LPAREN }
102   | ')'         { RPAREN }
103   | "\\["         { LBRACKET }
104   | "\\]"         { RBRACKET }
105   | "\\{"       { LCURLY }
106   | "\\}"       { RCURLY }
107   | ';'         { SEMICOLON }
108   | "\\lambda"  { LAMBDA }
109   | "\\pi"      { PROD }
110   | "\\forall"  { PROD }
111   | ':'         { COLON }
112   | '.'         { DOT }
113   | "\\to"      { ARROW }
114   | '_'         { NONE }
115   | dollar      { DOLLAR }
116   | eof         { EOF }
117   (* Arithmetical operators *)
118   | '+'         { PLUS }
119   | '-'         { MINUS }
120   | '*'         { TIMES }
121   | '='         { EQ }
122 {}