File: server.md

package info (click to toggle)
collatinus 12.2-2
  • links: PTS, VCS
  • area: main
  • in suites: forky, sid, trixie
  • size: 18,348 kB
  • sloc: cpp: 8,004; sh: 89; makefile: 38
file content (142 lines) | stat: -rw-r--r-- 7,631 bytes parent folder | download | duplicates (2)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
*Collatinus 12 -- guide*

[index](index.html) précédent : [Tagueur](tagger.html) suivant : [Utilisation avancée](avancee.html) 

Serveur
=======

         Cette fonctionnalité est nouvelle et
         s’adresse plutôt aux utilisateurs expérimentés.


Le serveur de Collatinus permet à d’autres programmes
d’interroger Collatinus et de récupérer ses réponses.
On l’active et le désactive dans le menu _Extra/Serveur_.
Il faut ensuite laisser Collatinus tourner (éventuellement
en arrière plan) pour qu’il puisse répondre aux requêtes.

Pour les amateurs de commandes en ligne, Collatinus est
fourni avec un petit utilitaire Client\_C11 qui peut servir
d’intermédiaire. Sous Windows, Client\_C11.exe est placé 
à côté de l’exécutable Collatinus\_11.exe. Sous MacOS, 
il est enfoui au cœur de Collatinus\_11.app à côté de 
l’exécutable (Collatinus\_11.app/Contents/MacOS/Client\_C11).
La syntaxe ressemble à celle d'Unix. Par exemple :

         ./Client_C11 -lfr arma
         
donnera les lemmatisations possibles de “arma” avec les 
traductions en français. Le résultat de l’interrogation
est également placé dans le presse-papier pour en permettre
l’utilisation dans un traitement de texte.

Dans LibreOffice, j’ai écrit des macros qui permettent 
d’interroger Collatinus sans quitter le tratement de texte.
Ça doit être possible aussi sous msOffice.

## Syntaxe de la requête

La syntaxe est '[cmd] [texte]' ou '[cmd] -f nom\_de\_fichier'. 
Éventuellement complétée par '-o nom\_de\_fichier\_de\_sortie'.

Contrairement à l'usage Unix, on ne peut pas combiner plusieurs commandes.
Si on veut obtenir, par exemple, la scansion et la lemmatisation d'un texte,
il faudra envoyer deux requêtes distinctes.

Par défaut (sans cmd), on obtient la scansion du texte.

Les commandes possibles sont : 
- -s : Scansion du texte (-s1 : avec recherche des mètres).
- -a : Accentuation du texte (avec options -a0..-a15).
- -l : Lemmatisation du texte (avec options -l0..-l16).
- -h : Lemmatisation du texte en HTML (mêmes options que -l)
- -S, -A, -L, -H : Les mêmes avec Majuscules pertinentes.
- -t : Langue cible pour les traductions (par exemple -tfr, -tde).
- -C : Majuscules pertinentes.
- -c : Majuscules non-pertinentes.
- -? : Affichage de l'aide.

Avec l'option '-f nom\_de\_fichier', c'est le contenu du fichier qui est traité.
Comme le fichier est ouvert dans Collatinus, il vaut probablement mieux
donner le chemin complet du fichier. Par exemple :

          /Users/Philippe/Documents/Virgile/Eneide1.txt

Avec l'option '-o nom\_de\_fichier\_de\_sortie', le résultat de l'opération est stocké
dans le fichier. Comme pour -f, il vaut mieux donner le chemin complet.

## Détails des commandes

Attention, les commandes sans texte (-c, -C et -t) modifient les paramètres
correspondants de l'application. L'affichage de l'aide n'affecte en rien l'application.
Si un texte suit ces commandes, il est ignoré.
- La langue cible : on peut changer la langue dans laquelle sont données les traductions
  en spécifiant l'intitulé de la langue en deux caractères.
 * Par exemple -tfr permet d'obtenir les traductions en français.
 Dans l'application, la langue-cible est également modifiée.
 * La commande nue, -t, ou avec un complément inconnu, -txx, donne la liste
 des langues disponibles (et ne modifie pas la langue dans l'application).
- Majuscules pertinentes : on peut décider si Aeneas est équivalent à aeneas ou pas.
 En début de phrase ou de vers, la majuscule initiale n'est pas considérée
 comme pertinente.
 * -C ou -c1 : les majuscules sont respectées.
 * -c : les majuscules sont ignorées.

Les commandes avec texte modifient temporairement les paramètres de l'application,
mais les rétablissent à la fin du traitement.
Les commandes -s, -a, -l et -h ont leur contrepartie en majuscule (-S, -A, -L et -H) 
qui considèreront que les majuscules sont pertinentes.
- Scansion du texte : avec les commandes -s et -S, le texte est seulement scandé ; 
alors que les commandes -s1 et -S1 cherchent également les schémas métriques 
et font des statistiques. 
Attention, avec l'option 1, la réponse est en HTML avec des balises de mise en forme.
- Accentuation du texte : les commandes -a et -A peuvent être suivies d'un ou deux 
 chiffres qui définissent les options d'accentuation. 
 Les options de groupes différents s'ajoutent (OU binaire).
   * Le premier groupe d'option détermine le comportement à adopter si la pénultième
     voyelle est commune. Ces options occupent les deux bits de poids faibles :
     * -a0 est équivalent à -s et retourne donc le texte scandé. 
       Par exemple : ./Client_C11 -a0 tenebrae ==> tĕnē̆brāe
     * -a1 considère qu'une voyelle commune en pénultième position est accentuée.
       Par exemple : ./Client_C11 -a1 tenebrae ==> tenébræ (paroxyton)
     * -a2 considère qu'une voyelle commune en pénultième position n'est pas accentuée
       Par exemple : ./Client_C11 -a2 tenebrae ==> ténebræ (proparoxyton)
     * -a3 n'accentue pas les mots dont la pénultième est commune.
  * Le troisième bit (de valeur 4) permet la syllabisation des mots. 
  Il est inactif si les deux premiers bits sont nuls.
     * -a5 ==> teˌnéˌbræ
     * -a6 ==> téˌneˌbræ
     * -a7 ==> teˌneˌbræ
  * Le quatrième bit (de valeur 8) introduit "l'exception illius" :
  Le latin ecclésiastique considère en effet les voyelles communes comme brèves, 
  sauf dans le cas des génitifs en -ī̆ŭs, dont le plus fréquent est illius. 
  La "bonne option" pour le latin ecclésiastique serait donc -a10 qui donnera :
  ténebræ (proparoxyton) mais illíus (paroxyton).
- Lemmatisation du texte : les commandes -l, -L, -h et -H retournent l'ensemble des 
 lemmes du texte. -L et -H considèrent les majuscules pertinentes. 
 Les commandes -l et -L retournent l'ensemble des lemmes en texte simple,
 alors que -h et -H donne une réponse en HTML avec des balises de mise en forme.
 Ces commandes peuvent être suivies d'une option numérique de 0 à 16 et 
 de la langue dans laquelle seront données les traductions sur deux lettres.
 Attention, l'ordre est imposé : la langue, si elle est donnée, vient en dernier.
 L'option numérique peut être omise (0 est alors la valeur par défaut).
 Tout comme la langue, auquel cas c'est la langue choisie dans l'appli qui
 est prise par défaut. Pour connaître la liste des langues disponibles,
 on utilisera la commande -t (voir ci-dessus).
 Comme pour les options de l'accentuation, les options de la lemmatisation s'ajoutent.
  * Bit de poids faible (de valeur 1) : détermine l'ordre des lemmes
     * -l0 : les lemmes sont donnés dans l'ordre du texte.
     * -l1 : les lemmes sont donnés dans l'ordre alphabétique.
  * Deuxième bit (de valeur 2) : les formes du texte
     * -l2 : affiche les formes du texte, avant d'en donner la lemmatisation.
     * -l3 : les formes du texte sont rangées en ordre alphabétique et lemmatisées.
  * Troisième bit (de valeur 4) : l'analyse morphologique
     * -l4 : associe à chaque lemmatisation les différentes analyses possibles.
     * -l5..7 : combinaison avec les options précédentes.
  * Quatrième bit (de valeur 8) : regroupe les formes non-reconnues à la fin
     * -l8..15 : combinaison avec les options précédentes.
  * -l16 est la dernière option numérique possible et n'est pas combinable : 
  elle évalue la fréquence des lemmes dans le texte.


[index](index.html) précédent : [Tagueur](tagger.html) suivant : [Utilisation avancée](avancee.html)