]> matita.cs.unibo.it Git - helm.git/blob - helm/ocaml/tex_cic_textual_parser/texCicTextualLexer.mll
First committed version of the textual parser able to parse TeX syntax.
[helm.git] / helm / ocaml / tex_cic_textual_parser / texCicTextualLexer.mll
1 (* Copyright (C) 2000, HELM Team.
2  * 
3  * This file is part of HELM, an Hypertextual, Electronic
4  * Library of Mathematics, developed at the Computer Science
5  * Department, University of Bologna, Italy.
6  * 
7  * HELM is free software; you can redistribute it and/or
8  * modify it under the terms of the GNU General Public License
9  * as published by the Free Software Foundation; either version 2
10  * of the License, or (at your option) any later version.
11  * 
12  * HELM is distributed in the hope that it will be useful,
13  * but WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with HELM; if not, write to the Free Software
19  * Foundation, Inc., 59 Temple Place - Suite 330, Boston,
20  * MA  02111-1307, USA.
21  * 
22  * For details, see the HELM World-Wide-Web page,
23  * http://cs.unibo.it/helm/.
24  *)
25
26 {
27  open TexCicTextualParser;;
28  module L = Lexing;;
29  module U = UriManager;;
30
31  let indtyuri_of_uri uri =
32   let index_sharp =  String.index uri '#' in
33   let index_num = index_sharp + 3 in
34    (UriManager.uri_of_string (String.sub uri 0 index_sharp),
35     int_of_string (String.sub uri index_num (String.length uri - index_num)) - 1
36    )
37  ;;
38
39  let indconuri_of_uri uri =
40   let index_sharp =  String.index uri '#' in
41   let index_div = String.rindex uri '/' in
42   let index_con = index_div + 1 in
43    (UriManager.uri_of_string (String.sub uri 0 index_sharp),
44     int_of_string
45      (String.sub uri (index_sharp + 3) (index_div - index_sharp - 3)) - 1,
46     int_of_string
47      (String.sub uri index_con (String.length uri - index_con))
48    )
49  ;;
50 }
51 let dollar = '$'
52 let num = ['1'-'9']['0'-'9']* | '0'
53 let alfa = ['A'-'Z' 'a'-'z' '_' ''' '-'] | "\\_"
54 let ident = alfa (alfa | num)*
55 let baseuri = '/'(ident '/')* ident '.'
56 let conuri = baseuri "con"
57 let varuri = baseuri "var"
58 let indtyuri = baseuri "ind#1/" num
59 let indconuri = baseuri "ind#1/" num "/" num
60 let blanks = [' ' '\t' '\n' '~'] | "\\;"
61 rule token =
62  parse
63     blanks      { token lexbuf } (* skip blanks *)
64   | "\\Case"    { CASE }
65   | "\\Fix"     { FIX }
66   | "\\CoFix"   { COFIX }
67   | "\\Set"     { SET }
68   | "\\Prop"    { PROP }
69   | "\\Type"    { TYPE }
70   | ident       { ID (L.lexeme lexbuf) }
71   | conuri      { CONURI (U.uri_of_string ("cic:" ^ L.lexeme lexbuf)) }
72   | varuri      { VARURI (U.uri_of_string ("cic:" ^ L.lexeme lexbuf)) }
73   | indtyuri    { INDTYURI (indtyuri_of_uri ("cic:" ^ L.lexeme lexbuf)) }
74   | indconuri   { INDCONURI (indconuri_of_uri("cic:" ^ L.lexeme lexbuf)) }
75   | num         { NUM (int_of_string (L.lexeme lexbuf)) }
76   | '?' num     { let lexeme = L.lexeme lexbuf in
77                    META
78                     (int_of_string
79                      (String.sub lexeme 1 (String.length lexeme - 1))) }
80   | ":>"        { CAST }
81   | ":="        { LETIN }
82   | '?'         { IMPLICIT }
83   | '('         { LPAREN }
84   | ')'         { RPAREN }
85   | "\\["         { LBRACKET }
86   | "\\]"         { RBRACKET }
87   | "\\{"       { LCURLY }
88   | "\\}"       { RCURLY }
89   | ';'         { SEMICOLON }
90   | "\\lambda"  { LAMBDA }
91   | "\\pi"      { PROD }
92   | "\\forall"  { PROD }
93   | ':'         { COLON }
94   | '.'         { DOT }
95   | "\\to"      { ARROW }
96   | '_'         { NONE }
97   | dollar      { DOLLAR }
98   | eof         { EOF }
99   (* Arithmetical operators *)
100   | '+'         { PLUS }
101   | '*'         { TIMES }
102   | '='         { EQ }
103 {}