]> matita.cs.unibo.it Git - helm.git/blob - helm/ocaml/tex_cic_textual_parser/texCicTextualLexer.mll
Underscore must be quted in TeX. Fixed.
[helm.git] / helm / ocaml / tex_cic_textual_parser / texCicTextualLexer.mll
1 (* Copyright (C) 2000, HELM Team.
2  * 
3  * This file is part of HELM, an Hypertextual, Electronic
4  * Library of Mathematics, developed at the Computer Science
5  * Department, University of Bologna, Italy.
6  * 
7  * HELM is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License
9  * as published by the Free Software Foundation; either version 2
10  * of the License, or (at your option) any later version.
11  * 
12  * HELM is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with HELM; if not, write to the Free Software
19  * Foundation, Inc., 59 Temple Place - Suite 330, Boston,
20  * MA  02111-1307, USA.
21  * 
22  * For details, see the HELM World-Wide-Web page,
23  * http://cs.unibo.it/helm/.
24  *)
25
26 {
27  open TexCicTextualParser;;
28  module L = Lexing;;
29  module U = UriManager;;
30
31  let indtyuri_of_uri uri =
32   let index_sharp =  String.index uri '#' in
33   let index_num = index_sharp + 3 in
34    (UriManager.uri_of_string (String.sub uri 0 index_sharp),
35     int_of_string (String.sub uri index_num (String.length uri - index_num)) - 1
36    )
37  ;;
38
39  let indconuri_of_uri uri =
40   let index_sharp =  String.index uri '#' in
41   let index_div = String.rindex uri '/' in
42   let index_con = index_div + 1 in
43    (UriManager.uri_of_string (String.sub uri 0 index_sharp),
44     int_of_string
45      (String.sub uri (index_sharp + 3) (index_div - index_sharp - 3)) - 1,
46     int_of_string
47      (String.sub uri index_con (String.length uri - index_con))
48    )
49  ;;
50
51  (* TeX unquoting for "_" *)
52  let unquote str =
53   Str.global_replace (Str.regexp "\\\\_") "_" str
54  ;;
55 }
56 let dollar = '$'
57 let num = ['1'-'9']['0'-'9']* | '0'
58 let alfa = ['A'-'Z' 'a'-'z' '_' ''' '-'] | "\\_"
59 let ident = alfa (alfa | num)*
60 let baseuri = '/'(ident '/')* ident '.'
61 let conuri = baseuri "con"
62 let varuri = baseuri "var"
63 let indtyuri = baseuri "ind#1/" num
64 let indconuri = baseuri "ind#1/" num "/" num
65 let blanks = [' ' '\t' '\n' '~' '{' '}'] | "\\;"
66 rule token =
67  parse
68     blanks      { token lexbuf } (* skip blanks *)
69   | "\\Case"    { CASE }
70   | "\\Fix"     { FIX }
71   | "\\CoFix"   { COFIX }
72   | "\\Set"     { SET }
73   | "\\Prop"    { PROP }
74   | "\\Type"    { TYPE }
75   | ident       { ID (unquote (L.lexeme lexbuf)) }
76   | conuri      { CONURI
77                    (U.uri_of_string ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
78   | varuri      { VARURI
79                    (U.uri_of_string ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
80   | indtyuri    { INDTYURI
81                    (indtyuri_of_uri ("cic:" ^ (unquote (L.lexeme lexbuf)))) }
82   | indconuri   { INDCONURI
83                    (indconuri_of_uri("cic:" ^ (unquote (L.lexeme lexbuf)))) }
84   | num         { NUM (int_of_string (L.lexeme lexbuf)) }
85   | '?' num     { let lexeme = L.lexeme lexbuf in
86                    META
87                     (int_of_string
88                      (String.sub lexeme 1 (String.length lexeme - 1))) }
89   | ":>"        { CAST }
90   | ":="        { LETIN }
91   | '?'         { IMPLICIT }
92   | '('         { LPAREN }
93   | ')'         { RPAREN }
94   | "\\["         { LBRACKET }
95   | "\\]"         { RBRACKET }
96   | "\\{"       { LCURLY }
97   | "\\}"       { RCURLY }
98   | ';'         { SEMICOLON }
99   | "\\lambda"  { LAMBDA }
100   | "\\pi"      { PROD }
101   | "\\forall"  { PROD }
102   | ':'         { COLON }
103   | '.'         { DOT }
104   | "\\to"      { ARROW }
105   | '_'         { NONE }
106   | dollar      { DOLLAR }
107   | eof         { EOF }
108   (* Arithmetical operators *)
109   | '+'         { PLUS }
110   | '*'         { TIMES }
111   | '='         { EQ }
112 {}