File: user.html

package info (click to toggle)
transcriber 1.5.1-2
  • links: PTS
  • area: main
  • in suites: etch, etch-m68k, sarge
  • size: 2,980 kB
  • ctags: 1,259
  • sloc: tcl: 13,131; ansic: 1,891; sh: 1,206; makefile: 106; xml: 66
file content (1608 lines) | stat: -rw-r--r-- 65,029 bytes parent folder | download | duplicates (5)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
1001
1002
1003
1004
1005
1006
1007
1008
1009
1010
1011
1012
1013
1014
1015
1016
1017
1018
1019
1020
1021
1022
1023
1024
1025
1026
1027
1028
1029
1030
1031
1032
1033
1034
1035
1036
1037
1038
1039
1040
1041
1042
1043
1044
1045
1046
1047
1048
1049
1050
1051
1052
1053
1054
1055
1056
1057
1058
1059
1060
1061
1062
1063
1064
1065
1066
1067
1068
1069
1070
1071
1072
1073
1074
1075
1076
1077
1078
1079
1080
1081
1082
1083
1084
1085
1086
1087
1088
1089
1090
1091
1092
1093
1094
1095
1096
1097
1098
1099
1100
1101
1102
1103
1104
1105
1106
1107
1108
1109
1110
1111
1112
1113
1114
1115
1116
1117
1118
1119
1120
1121
1122
1123
1124
1125
1126
1127
1128
1129
1130
1131
1132
1133
1134
1135
1136
1137
1138
1139
1140
1141
1142
1143
1144
1145
1146
1147
1148
1149
1150
1151
1152
1153
1154
1155
1156
1157
1158
1159
1160
1161
1162
1163
1164
1165
1166
1167
1168
1169
1170
1171
1172
1173
1174
1175
1176
1177
1178
1179
1180
1181
1182
1183
1184
1185
1186
1187
1188
1189
1190
1191
1192
1193
1194
1195
1196
1197
1198
1199
1200
1201
1202
1203
1204
1205
1206
1207
1208
1209
1210
1211
1212
1213
1214
1215
1216
1217
1218
1219
1220
1221
1222
1223
1224
1225
1226
1227
1228
1229
1230
1231
1232
1233
1234
1235
1236
1237
1238
1239
1240
1241
1242
1243
1244
1245
1246
1247
1248
1249
1250
1251
1252
1253
1254
1255
1256
1257
1258
1259
1260
1261
1262
1263
1264
1265
1266
1267
1268
1269
1270
1271
1272
1273
1274
1275
1276
1277
1278
1279
1280
1281
1282
1283
1284
1285
1286
1287
1288
1289
1290
1291
1292
1293
1294
1295
1296
1297
1298
1299
1300
1301
1302
1303
1304
1305
1306
1307
1308
1309
1310
1311
1312
1313
1314
1315
1316
1317
1318
1319
1320
1321
1322
1323
1324
1325
1326
1327
1328
1329
1330
1331
1332
1333
1334
1335
1336
1337
1338
1339
1340
1341
1342
1343
1344
1345
1346
1347
1348
1349
1350
1351
1352
1353
1354
1355
1356
1357
1358
1359
1360
1361
1362
1363
1364
1365
1366
1367
1368
1369
1370
1371
1372
1373
1374
1375
1376
1377
1378
1379
1380
1381
1382
1383
1384
1385
1386
1387
1388
1389
1390
1391
1392
1393
1394
1395
1396
1397
1398
1399
1400
1401
1402
1403
1404
1405
1406
1407
1408
1409
1410
1411
1412
1413
1414
1415
1416
1417
1418
1419
1420
1421
1422
1423
1424
1425
1426
1427
1428
1429
1430
1431
1432
1433
1434
1435
1436
1437
1438
1439
1440
1441
1442
1443
1444
1445
1446
1447
1448
1449
1450
1451
1452
1453
1454
1455
1456
1457
1458
1459
1460
1461
1462
1463
1464
1465
1466
1467
1468
1469
1470
1471
1472
1473
1474
1475
1476
1477
1478
1479
1480
1481
1482
1483
1484
1485
1486
1487
1488
1489
1490
1491
1492
1493
1494
1495
1496
1497
1498
1499
1500
1501
1502
1503
1504
1505
1506
1507
1508
1509
1510
1511
1512
1513
1514
1515
1516
1517
1518
1519
1520
1521
1522
1523
1524
1525
1526
1527
1528
1529
1530
1531
1532
1533
1534
1535
1536
1537
1538
1539
1540
1541
1542
1543
1544
1545
1546
1547
1548
1549
1550
1551
1552
1553
1554
1555
1556
1557
1558
1559
1560
1561
1562
1563
1564
1565
1566
1567
1568
1569
1570
1571
1572
1573
1574
1575
1576
1577
1578
1579
1580
1581
1582
1583
1584
1585
1586
1587
1588
1589
1590
1591
1592
1593
1594
1595
1596
1597
1598
1599
1600
1601
1602
1603
1604
1605
1606
1607
1608
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
   <TITLE>Manuel de l'utilisateur</TITLE>
   <META NAME="GENERATOR" CONTENT="Mozilla/3.01Gold (X11; I; Linux 2.0.33 i686) [Netscape]">
</HEAD>
<BODY TEXT="#000000" BGCOLOR="#FFFFFF" LINK="#0000EF" VLINK="#51188E" ALINK="#FF0000">

<H1 ALIGN=CENTER>Manuel du transcripteur</H1>

<CENTER><P>Conventions de transcription pour<BR>
les enregistrements radio-t&eacute;l&eacute;diffus&eacute;s</P></CENTER>

<CENTER><P>mise &agrave; jour pour Transcriber 1.4.1</P></CENTER>

<CENTER><P><I>DGA/Limsi, juin 1999</I></P></CENTER>

<H2>
<HR WIDTH="100%"><A HREF="#r1">1. Introduction</A></H2>

<UL>
<LI><A HREF="#r11">1.1. Documents concern&eacute;s</A></LI>

<LI><A HREF="#r12">1.2. Objectifs du manuel</A></LI>
</UL>

<H2><A HREF="#r2">2. Structuration de la transcription</A></H2>

<P><B><A HREF="#r21">2.1. Enregistrement</A></B></P>

<UL>
<LI><A HREF="#r211">2.1.1. Comment transcrire un nouvel enregistrement?</A></LI>

<LI><A HREF="#r212">2.1.2. Caract&eacute;ristiques de l'enregistrement</A></LI>
</UL>

<P><B><A HREF="#r22">2.2. Segmentation du signal</A></B></P>

<UL>
<LI><A HREF="#r221">2.2.1. O&ugrave; segmenter?</A></LI>

<LI><A HREF="#r222">2.2.2. Comment segmenter?</A></LI>
</UL>

<P><B><A HREF="#r23">2.3. Tours et locuteurs</A></B></P>

<UL>
<LI><A HREF="#r231">2.3.1. Comment cr&eacute;er les tours de parole?</A></LI>

<LI><A HREF="#r232">2.3.2. Caract&eacute;ristiques des tours</A></LI>

<LI><A HREF="#r233">2.3.3. Caract&eacute;ristiques des locuteurs</A></LI>

<LI><A HREF="#r234">2.3.4. Parole simultan&eacute;e</A></LI>
</UL>

<P><B><A HREF="#r24">2.4. Sections et th&egrave;mes</A></B></P>

<UL>
<LI><A HREF="#r241">2.4.1. Que faut-il transcrire?</A></LI>

<LI><A HREF="#r242">2.4.2. Type et th&egrave;me des sections</A></LI>

<LI><A HREF="#r243">2.4.3. Comment indiquer les sections?</A></LI>
</UL>

<P><B><A HREF="#r25">2.5. Transcription orthographique</A></B></P>

<UL>
<LI><A HREF="#r251">2.5.1. Comment transcrire?</A></LI>

<LI><A HREF="#r252">2.5.2. Conventions de transcription</A></LI>

<LI><A HREF="#r253">2.5.3. Transcription ou prononciation ambigu&euml;</A></LI>
</UL>

<P><B><A HREF="#r26">2.6. Bruits et conditions acoustiques</A></B></P>

<UL>
<LI><A HREF="#r261">2.6.1. Comment noter les bruits ?</A></LI>

<LI><A HREF="#r262">2.6.2. Bruits de l'appareil phonatoire (non-parole)</A></LI>

<UL>
<LI>Respiration</LI>

<LI>Autres bruits de bouche et de gorge</LI>
</UL>

<LI><A HREF="#r263">2.6.3. Bruits ext&eacute;rieurs &agrave; l'acte de
parole</A></LI>

<LI><A HREF="#r264">2.6.4. Changement de conditions acoustiques</A></LI>
</UL>

<P><B><A HREF="#r27">2.7. Commentaires</A></B></P>

<H2><A HREF="#r3">3. Conventions de transcription</A></H2>

<P><B><A HREF="#r31">3.1. Conventions d'&eacute;criture</A></B></P>

<UL>
<LI><A HREF="#r311">3.1.1. Majuscules/minuscules</A></LI>

<LI><A HREF="#r312">3.1.2. Ponctuations</A></LI>

<LI><A HREF="#r313">3.1.3. Apostrophe</A></LI>

<LI><A HREF="#r314">3.1.4. Trait d'union</A></LI>

<LI><A HREF="#r315">3.1.5. Sigles</A></LI>

<LI><A HREF="#r316">3.1.6. Abr&eacute;viations</A></LI>

<LI><A HREF="#r317">3.1.7. Nombres</A></LI>

<LI><A HREF="#r318">3.1.8. Dates</A></LI>

<LI><A HREF="#r319">3.1.9. Chiffres romains</A></LI>

<LI><A HREF="#r3110">3.1.10. Adresses internet</A></LI>
</UL>

<P><B><A HREF="#r32">3.2. Mots hors-lexique</A></B></P>

<UL>
<LI><A HREF="#r321">3.2.1. Mots d'origine &eacute;trang&egrave;re, changement
de langue</A></LI>

<LI><A HREF="#r322">3.2.2. Noms propres &eacute;trangers</A></LI>

<LI><A HREF="#r323">3.2.3. Mots techniques, nouveaux mots, noms propres
inconnus</A></LI>
</UL>

<P><B><A HREF="#r33">3.3. Sp&eacute;cificit&eacute;s du langage parl&eacute;</A></B></P>

<UL>
<LI><A HREF="#r331">3.3.1. Onomatop&eacute;es</A></LI>

<LI><A HREF="#r332">3.3.2. R&eacute;p&eacute;titions</A></LI>

<LI><A HREF="#r333">3.3.3. Elisions &amp; formes r&eacute;duites</A></LI>

<LI><A HREF="#r334">3.3.4. Troncatures</A></LI>

<LI><A HREF="#r335">3.3.5. Lapsus</A></LI>

<LI><A HREF="#r336">3.3.6. Prononciation erron&eacute;e</A></LI>

<LI><A HREF="#r337">3.3.7. Liaisons</A></LI>

<LI><A HREF="#r338">3.3.8. &Eacute;pellations</A></LI>

<LI><A HREF="#r339">3.3.9. Ponctuation verbalis&eacute;e</A></LI>
</UL>

<H2><A HREF="#r4">4. V&eacute;rification</A></H2>

<UL>
<LI><A HREF="#r41">4.1. Comment v&eacute;rifier la transcription ?</A></LI>
</UL>

<P>
<HR WIDTH="100%"></P>

<H2><A NAME="r1"></A>1. Introduction</H2>

<P>La cr&eacute;ation manuelle de transcriptions d'enregistrements de journaux
radio- ou t&eacute;l&eacute;diffus&eacute;s, permet de faire avancer les
recherches en transcription automatique, en indexation et en archivage
de ce type de documents sonores.</P>

<H4><A NAME="r11"></A>1.1. Documents concern&eacute;s</H4>

<P>Les enregistrements de journaux radio- ou t&eacute;l&eacute;diffus&eacute;s
pr&eacute;sentent un contenu vari&eacute; : le signal acoustique peut correspondre
&agrave; de la parole, de la musique ou du bruit, mais &eacute;galement
&agrave; des m&eacute;langes de parole, de musique et de bruit. Ensuite
il y a, pour la parole proprement dite, une grande diversit&eacute; de
locuteurs et de th&egrave;mes abord&eacute;s. Plusieurs personnes peuvent
intervenir sur un sujet donn&eacute; successivement, voire simultan&eacute;ment.
La qualit&eacute; acoustique de l'enregistrement (fid&eacute;lit&eacute;)
peut varier de mani&egrave;re consid&eacute;rable au cours du temps. La
dur&eacute;e de tels enregistrements peut varier de quelques dizaines de
minutes &agrave; plusieurs heures. </P>

<P>Pour l'instant nous nous int&eacute;ressons plus particuli&egrave;rement
aux nouvelles (journal, flash, revue de presse, incluant m&eacute;t&eacute;o
et bourse, &eacute;conomie, faits de soci&eacute;t&eacute; ...) dans le
document sonore. Toute autre forme d'enregistrement (publicit&eacute;s,
jeux, fictions....) ne sera pas transcrite. </P>

<H4><A NAME="r12"></A>1.2. Objectifs du manuel</H4>

<P>Nous d&eacute;crivons dans ce qui suit un ensemble de conventions pour
<B>structurer</B>, <B>annoter</B> et <B>transcrire</B> des enregistrements
de journaux radio- ou t&eacute;l&eacute;diffus&eacute;s. Ces conventions
doivent permettre de structurer les enregistrements au niveau du contenu
th&eacute;matique, des locuteurs et de la qualit&eacute; acoustique. Les
informations produites &agrave; ce sujet sont nomm&eacute;es <B>annotations</B>.
La parole de chaque locuteur doit aussi &ecirc;tre transcrite orthographiquement.
C'est la <B>transcription</B> proprement dite. La transcription est ici
la partie la plus importante et donc sur laquelle le maximum d'attention
doit &ecirc;tre port&eacute;. </P>

<P>Les diff&eacute;rentes &eacute;tapes du travail de transcription sont
: la segmentation de la bande son, l'identification des tours de paroles
et des locuteurs, l'identification des sections th&eacute;matiques, la
transcription orthographique, et la v&eacute;rification. Ces &eacute;tapes
peuvent &ecirc;tre men&eacute;es en parall&egrave;le ou au contraire appliqu&eacute;es
s&eacute;quentiellement sur de longues portion du signal, suivant le choix
du transcripteur. </P>

<P>
<HR WIDTH="100%"></P>

<H2><A NAME="r2"></A>2. Structuration de la transcription</H2>

<P>L'&eacute;tape d'annotation vise &agrave; structurer les enregistrements,
c'est-&agrave;-dire &agrave; segmenter et &agrave; d&eacute;crire le signal
acoustique &agrave; diff&eacute;rents niveaux jug&eacute;s pertinents pour
le traitement ult&eacute;rieur. Il s'agit ici principalement de l'identit&eacute;
du locuteur, de l'identification du contenu th&eacute;matique, ou de la
qualit&eacute; du canal de transmission (acoustique).</P>

<P>Actuellement, un document de transcription est structur&eacute; de la
mani&egrave;re la suivante :</P>

<UL>
<LI>L'<I><U>enregistrement</U></I> correspond &agrave; la totalit&eacute;
de l'enregistrement &agrave; transcrire. </LI>

<LI>L'enregistrement est d&eacute;coup&eacute; en <I><U>sections</U></I>,
d&eacute;limitant les parties des &eacute;missions &agrave; transcrire,
les encha&icirc;nements journalistiques, ou les parties non-transcrites.</LI>

<LI>&Agrave; l'int&eacute;rieur d'une section on va distinguer les <I>tours
de parole</I> (<I><U>turn</U></I>) qui correspondent &agrave; des changements
de locuteur.</LI>

<LI>Les tours de paroles sont eux-m&ecirc;mes d&eacute;coup&eacute;s en
segments plus courts au moyen de points de synchronisation. La transcription
proprement dite n'intervient qu'&agrave; ce niveau de structuration.</LI>

<LI>A certains points de synchronisation, des changements durables de bruit
de fond sont indiqu&eacute;s ; cette segmentation en conditions acoustiques
est ind&eacute;pendante de la structuration en tours et sections.</LI>
</UL>

<H3><A NAME="r21"></A>2.1. Enregistrement</H3>

<H4><A NAME="r211"></A>2.1.1. Comment transcrire un nouvel enregistrement?</H4>

<UL>
<LI>D&eacute;marrez Transcriber (cf. manuel de r&eacute;f&eacute;rence
!)</LI>

<LI>Cr&eacute;ez une nouvelle transcription avec le menu [<TT>Fichier</TT>]/[<TT>Nouvelle
transcription</TT>]. Une fen&ecirc;tre de dialogue propose de choisir le
fichier son &agrave; transcrire. </LI>

<LI>Indiquez les informations g&eacute;n&eacute;rales associ&eacute;es
&agrave; l'enregistrement dans la fen&ecirc;tre [<TT>Fichiers</TT>]/[<TT>Param&egrave;tres
de l'&eacute;pisode</TT>].</LI>

<LI>Si vous voulez r&eacute;utiliser certains locuteurs ou sujets d'une
transcription pr&eacute;c&eacute;dente, vous pouvez le faire d&egrave;s
&agrave; pr&eacute;sent avec [<TT>Edition</TT>]/[<TT>Locuteurs</TT>]/[<TT>Importer
&agrave; partir du fichier...</TT>] et [<TT>Edition</TT>]/[<TT>Sujets</TT>]/[<TT>Importer
&agrave; partir du fichier...</TT>].</LI>

<LI>Enregistrez la nouvelle transcription vide avec [<TT>Fichier</TT>]/[<TT>Enregistrer</TT>].
Un nom par d&eacute;faut d&eacute;riv&eacute; du nom du signal sera propos&eacute;.</LI>

<LI>Enregistrez la configuration avec [<TT>Options</TT>]/[<TT>Enregistrer
la configuration</TT>], afin de r&eacute;ouvrir automatiquement ces fichiers
au prochain d&eacute;marrage</LI>
</UL>

<P>Par la suite, pensez &agrave; enregistrer fr&eacute;quemment votre travail
avec [<TT>Fichier</TT>]/[<TT>Enregistrer</TT>] ou le raccourci <TT>Control-s</TT>,
surtout si vous n'avez pas activ&eacute; la sauvegarde automatique. Par
ailleurs, un double affichage du signal (un avec une r&eacute;solution
de 10 secondes, l'autre de une minute environ) peut &ecirc;tre pratique.</P>

<H4><A NAME="r212"></A>2.1.2. Caract&eacute;ristiques de l'enregistrement</H4>

<P>Les informations associ&eacute;es &agrave; un enregistrement, &eacute;dit&eacute;es
avec [<TT>Fichiers</TT>]/[<TT>Param&egrave;tres de l'&eacute;pisode</TT>],
sont les suivantes :</P>

<UL>
<LI><B>l'identit&eacute; du transcripteur </B>(par exemple <TT>Claire Montaigne</TT>)
est automatiquement remplie ;</LI>

<LI><B>le nom du fichier</B> son &agrave; transcrire (par exemple <TT>france-inter980428-0700:0820</TT>)
est automatiquement renseign&eacute; ;</LI>

<LI><B>la date et le num&eacute;ro de version</B> de la transcription sont
automatiquement renseign&eacute;s par le logiciel et ne peuvent pas &ecirc;tre
modifi&eacute;s ;</LI>

<LI><B>le programme: la provenance</B> du document sonore (c'est-&agrave;-dire
qui a enregistr&eacute;), <B>la cha&icirc;ne</B> qui a diffus&eacute; le
document (par exemple <TT>France-Inter</TT>) et <B>le nom de l'&eacute;mission</B>
(par exemple <TT>tranche matinale 7-9</TT>) ;</LI>

<LI><B>la date de diffusion</B> ;</LI>

<LI><B>la langue principale</B> de diffusion.</LI>
</UL>

<P>Pour des enregistrements de m&ecirc;me nature (par exemple sur plusieurs
jours) il convient de respecter la m&ecirc;me nomenclature pour des programmes
identiques.</P>

<H3><A NAME="r22"></A>2.2. Segmentation du signal</H3>

<P>Pour fournir des rep&egrave;res temporels par rapport au signal, et
pour faciliter le travail de transcription, on segmente le signal en ins&eacute;rant
des balises temporelles <I>instantan&eacute;es</I> de synchronisation (ou
fronti&egrave;res).</P>

<H4><A NAME="r221"></A>2.2.1. O&ugrave; segmenter?</H4>

<P>Nous recommandons de faire correspondre ces balises &agrave; des groupes
de souffle dans le signal ou &agrave; des marques de ponctuation dans le
langage &eacute;crit. Pour des raisons techniques du traitement ult&eacute;rieur
il est &eacute;galement souhaitable de fournir une balise de synchronisation
apr&egrave;s diff&eacute;rents types de probl&egrave;mes au niveau acoustique
(mots mal prononc&eacute;s, bruit court superpos&eacute; &agrave; un mot...).</P>

<P>En r&eacute;sum&eacute;, l'insertion d'une fronti&egrave;re de synchronisation
est recommand&eacute; dans les situations suivantes :</P>

<UL>
<LI><B>d&eacute;but et fin d'&eacute;locution,</B></LI>

<LI><B>respiration,</B></LI>

<LI><B>ponctuation</B>,</LI>

<LI><B>mauvaise prononciation,</B></LI>

<LI><B>bruit instantan&eacute;,</B></LI>

<LI><B>d&eacute;but et fin de musique...</B></LI>
</UL>

<H4><A NAME="r222"></A>2.2.2. Comment segmenter?</H4>

<UL>
<LI>Choisissez une r&eacute;solution d'environ 30 secondes pour l'affichage
du signal.</LI>

<LI>Lancez la restitution &agrave; partir du d&eacute;but du signal ou
du d&eacute;but de la section non encore transcrite.</LI>

<LI>Pendant la restitution, &agrave; chaque instant correspondant &agrave;
un changement de locuteur ou une zone de silence, une pause, une respiration,
un changement de conditions acoustiques... ins&eacute;rez une fronti&egrave;re
en pressant la touche <TT>Return</TT>. Une nouvelle ligne pr&eacute;c&eacute;d&eacute;e
d'un petit cercle appara&icirc;t dans la fen&ecirc;tre de texte, et la
segmentation sous le signal est scind&eacute;e au niveau du curseur.</LI>
</UL>

<P>Vous obtenez une segmentation grossi&egrave;re d'une partie du signal
en intervalles de 5 &agrave; 20 secondes en moyenne. Il est possible de
positionner les fronti&egrave;res plus pr&eacute;cis&eacute;ment par la
suite. </P>

<H3><A NAME="r23"></A>2.3. Tours et locuteurs</H3>

<P>&Agrave; ce niveau on d&eacute;crit la succession de tours de parole
avec les diff&eacute;rents locuteurs qui interviennent. </P>

<H4><A NAME="r231"></A>2.3.1. Comment cr&eacute;er les tours de parole?</H4>

<UL>
<LI>Affichez le signal &agrave; une r&eacute;solution d'environ 30 secondes
ou plus et &eacute;coutez le signal.</LI>

<LI>Si un nouveau locuteur prend la parole au d&eacute;but du segment courant,
indiquez le d&eacute;but d'un nouveau tour de parole avec [<TT>Segmentation</TT>]/[<TT>Cr&eacute;er
un tour...</TT>] ou le raccourci <TT>Control-t</TT>.</LI>

<LI>Le locuteur du tour doit &ecirc;tre identifi&eacute; :</LI>

<UL>
<LI>Si le locuteur est connu et existe d&eacute;j&agrave; dans la liste,
il suffit de cliquer sur son nom. </LI>

<LI>Pour un nouveau locuteur, le nom peut &ecirc;tre tap&eacute; directement
au clavier. Si l'identit&eacute; est inconnue cliquez simplement sur <TT>Cr&eacute;er
un locuteur</TT>. Les caract&eacute;ristiques du locuteur (l'orthographe
pr&eacute;cise de son nom, le genre, l'accent...) peuvent &ecirc;tre modifi&eacute;es
plus tard.</LI>
</UL>

<LI>S'il s'agit de parole superpos&eacute;e, validez l'option correspondante
et identifiez le deuxi&egrave;me locuteur de la m&ecirc;me fa&ccedil;on.</LI>

<LI>D'autres caract&eacute;ristiques du tour (type de parole, canal, qualit&eacute;)
peuvent &eacute;ventuellement &ecirc;tre renseign&eacute;s.</LI>
</UL>

<P>A la cr&eacute;ation d'un tour, le locuteur propos&eacute; par d&eacute;faut
est l'avant-dernier utilis&eacute;, ce qui est pratique dans le cas d'un
dialogue. </P>

<H4><A NAME="r232"></A>2.3.2. Caract&eacute;ristiques des tours</H4>

<P>Pour chaque <B>tour de parole</B> le transcripteur indique :</P>

<UL>
<LI><B>un identificateur du locuteur</B>,</LI>
</UL>

<P>et &eacute;ventuellement si cela est demand&eacute; :</P>

<UL>
<LI><B>le type de parole :</B> pr&eacute;par&eacute;, spontan&eacute;</LI>

<LI><B>la qualit&eacute; du son</B> : bon, moyen, faible</LI>

<LI><B>le canal de transmission</B> : intervention t&eacute;l&eacute;phonique
ou prise en studio</LI>
</UL>

<H4><A NAME="r233"></A>2.3.3. Caract&eacute;ristiques des locuteurs</H4>

<P>Pour chaque nouveau <B>locuteur</B> le transcripteur indique :</P>

<UL>
<LI><B>le nom du locuteur</B> s'il est identifi&eacute;, sinon un num&eacute;ro
de locuteur avec un qualificatif (au titre duquel l'inconnu est intervenu
dans l'&eacute;mission).</LI>

<LI><B>le statut :</B> orthographe connue ou incertaine.</LI>

<LI><B>le sexe du locuteur :</B> <TT>homme, femme, inconnu</TT></LI>

<LI><B>langue maternelle :</B> oui/non. </LI>

<LI><B>l'accent :</B> on peut sp&eacute;cifier ici les diff&eacute;rents
accents : r&eacute;gionaux, francophones, &eacute;trangers.</LI>

<LI><B>le statut global/local</B> : un nom est global s'il est identifiable
en dehors du contexte de la transcription (par exemple, un journaliste,
un homme politique connu, etc.)</LI>
</UL>

<P>Il est important de respecter l'orthographe des noms. On peut trouver
les noms des journalistes et des diff&eacute;rentes &eacute;missions radio
et t&eacute;l&eacute; fran&ccedil;ais dans le guide <I>M&eacute;diaSid</I>.</P>

<P>On consid&egrave;re tout francophone (fran&ccedil;ais, belge, suisse,
qu&eacute;b&eacute;cois) de langue maternelle fran&ccedil;aise.</P>

<H4><A NAME="r234"></A>2.3.4. Parole simultan&eacute;e</H4>

<P>Il faut distinguer diff&eacute;rentes situations de parole superpos&eacute;e
:</P>

<OL>
<LI>Un locuteur parle, et un autre intervient ponctuellement par des interjections
(<TT>hum oui </TT>...) ; il convient de noter ces derni&egrave;res comme
de simples bruits se superposant &agrave; la parole.</LI>

<LI>Un locuteur parle en premier plan, et une ou plusieurs voix sont audibles
&agrave; un niveau moindre (par exemple la voix d'un traducteur est superpos&eacute;e
&agrave; la voix d'origine) ; seule la voix au premier plan est transcrite
et un marqueur de bruit de fond (de type parole ou conversation) doit &ecirc;tre
utilis&eacute;.</LI>

<LI>Deux locuteurs dialoguent, se coupent mutuellement la parole et parlent
simultan&eacute;ment sur plusieurs mots. Le m&eacute;canisme de gestion
de parole simultan&eacute;e d&eacute;crit ci-apr&egrave;s peut &ecirc;tre
appliqu&eacute;. En cas de difficult&eacute;, les segments pourront &ecirc;tre
annot&eacute;s comme parole &quot;non-transcrite&quot; .</LI>

<LI>Si plus de deux locuteurs interviennent &agrave; un fort niveau sonore,
il faut annoter la portion de signal comme &quot;non-transcrite&quot;.</LI>
</OL>

<P>Dans le cas de parole <B>simultan&eacute;e</B> avec deux locuteurs (cas
num&eacute;ro 3), le deuxi&egrave;me locuteur est identifi&eacute; dans
la fen&ecirc;tre des param&egrave;tres du tour apr&egrave;s avoir valid&eacute;
<TT>Parole superpos&eacute;e</TT>. L'affichage dans le logiciel est par
exemple :</P>

<UL>
<P><B><TT>Patricia Martin + Invite1&nbsp;</TT></B></P>
</UL>

<UL>
<UL>
<P><B>1: </B><TT>&eacute;videmment d&eacute;couvert que<BR>
</TT><B>2: </B><TT>enfin n'oubliez pas</TT></P>
</UL>
</UL>

<P>Dans la transcription, <B>1:</B> va identifier les paroles (<I>&eacute;videmment
d&eacute;couvert que</I>) du <B>premier</B> locuteur (<TT>Patricia Martin</TT>)
et <B>2:</B> les paroles (<I>enfin n'oubliez pas</I>) du deuxi&egrave;me
locuteur <TT>Invite1</TT>. Les fronti&egrave;res au niveau du signal seront
pos&eacute;es au niveau des fronti&egrave;res de mot, de sorte &agrave;
inclure dans le segment ainsi d&eacute;coup&eacute;, toute la parole superpos&eacute;e
(par exemple si le mot <I>enfin</I> du locuteur 2 ne d&eacute;marre qu'&agrave;
la fin du mot <I>&eacute;videmment</I> du locuteur 1, ce dernier est quand
m&ecirc;me inclus dans le segment).</P>

<P>Cependant la transcription de ce type de signal est tr&egrave;s co&ucirc;teuse.
&Agrave; l'heure actuelle on ne sait pas traiter de mani&egrave;re satisfaisante
la parole superpos&eacute;e et les transcriptions, m&ecirc;mes si elles
sont produites, ne sont pas encore exploit&eacute;es. Le transcripteur
peut donc choisir de marquer simplement le signal comme parole superpos&eacute;e
sans transcription, avec &eacute;ventuellement un commentaire d&eacute;crivant
la situation ou le contenu du dialogue.</P>

<H3><A NAME="r24"></A>2.4. Sections et th&egrave;mes</H3>

<P>La structuration compl&egrave;te d'un enregistrement peut &ecirc;tre
complexe : une succession d'&eacute;missions, compos&eacute;es de sections
journalistiques, subdivis&eacute;es elles-m&ecirc;mes en rubriques th&eacute;matiques...
En l'&eacute;tat actuel du logiciel, il faut choisir un seul niveau de
d&eacute;coupage (en sections journalistiques ou en rubriques th&eacute;matiques)
et les fronti&egrave;res des segments ne sont pas toujours &eacute;videntes
; une structuration plus fine est envisag&eacute;e pour l'avenir.</P>

<H4><A NAME="r241"></A>2.4.1. Que faut-il transcrire?</H4>

<P>Un enregistrement peut contenir des segments sans int&eacute;r&ecirc;t
pour le traitement automatique ult&eacute;rieur. Les transcriptions sont
limit&eacute;es aux &eacute;missions d'information avec les messages d'introduction
et de conclusion. Le reste sera annot&eacute; <I>non-transcribed</I>, c'est-&agrave;-dire
inexploitable et ne sera pas transcrit.</P>

<H4><A NAME="r242"></A>2.4.2. Type et th&egrave;me des sections</H4>

<P>Un enregistrement est d&eacute;coup&eacute; en <I><U>sections</U></I>
de 3 types :</P>

<UL>
<LI>Les segments de type <I><U>report</U></I> r&eacute;f&egrave;rent &agrave;
des parties d'&eacute;mission &agrave; transcrire (journal, chronique...).
Pour chaque section journalistique, le transcripteur peut indiquer un th&egrave;me
g&eacute;n&eacute;ral (<TT>journal, revue de presse, chronique, politique,
faits de soci&eacute;t&eacute;, &eacute;conomie, bourse, culture, sports,
m&eacute;t&eacute;o</TT>) choisi dans une liste pr&eacute;d&eacute;finie,
suivi &eacute;ventuellement d'un titre r&eacute;sum&eacute;.</LI>

<LI>Les segments de type <I><U>filler</U></I> ne concernent pas directement
le th&egrave;me journalistique abord&eacute;, mais r&eacute;f&egrave;rent
plut&ocirc;t &agrave; l'organisation r&eacute;dactionnelle, &agrave; l'encha&icirc;nement
des journalistes ou des invit&eacute;s etc.</LI>

<LI>Les segments de type <I><U>non-trans</U></I> sont les parties de l'enregistrement
dont la transcription n'est pas souhait&eacute;e ; il convient d'indiquer
au moins la nature de ces segments suivi &eacute;ventuellement d'un titre
r&eacute;sum&eacute; (par exemple : <TT>publicit&eacute; - les pr&ecirc;ts
malins du CA</TT>). </LI>
</UL>

<H4><A NAME="r243"></A>2.4.3. Comment indiquer les sections?</H4>

<UL>
<LI>Affichez le signal &agrave; une r&eacute;solution d'environ 30 secondes
ou plus et &eacute;coutez le signal.</LI>

<LI>A chaque changement d'&eacute;mission ou de sujet (et en fonction des
consignes donn&eacute;es), indiquez le d&eacute;but d'une nouvelle section
avec [<TT>Segmentation</TT>]/[<TT>Cr&eacute;er une section...</TT>] ou
le raccourci <TT>Control-e</TT>.</LI>

<LI>Indiquez pour chaque section :</LI>

<UL>
<LI>le <B>type</B> de la section :&nbsp;<I>report</I>, <I>filler</I>, <I>non-transcribed</I></LI>

<LI>un <B>th&egrave;me</B> g&eacute;n&eacute;ral (<TT>journal, politique
int&eacute;rieure, international</TT>, <BR>
<TT>bourse, &eacute;conomie, culture, sports, m&eacute;t&eacute;o, faits
de soci&eacute;t&eacute;, revue, chronique, ...) </TT>suivi &eacute;ventuellement
d'une courte description du sujet.</LI>
</UL>
</UL>

<H3><A NAME="r25"></A>2.5. Transcription orthographique</H3>

<P>Nous abordons ici les probl&egrave;mes de transcriptions des segments
de parole. Ces conventions concernent d'abord la parole pour laquelle la
transcription graph&eacute;mique peut &ecirc;tre ambigu&euml;. Elles sont
n&eacute;cessaires ensuite pour coder les bruits, cat&eacute;gorie dans
laquelle on regroupe tous les &eacute;v&eacute;nements acoustiques non
assimilables &agrave; des mots (ou entr&eacute;es lexicales) de la langue.</P>

<H4><A NAME="r251"></A>2.5.1. Comment transcrire?</H4>

<UL>
<LI>Choisissez une r&eacute;solution d'environ 10 secondes ou moins pour
l'affichage du signal.</LI>

<LI>Allez au premier segment non transcrit en cliquant sur la ligne correspondante
dans le texte ou &agrave; la position dans le signal.</LI>

<LI>Ecoutez ce segment avec [<TT>Signal</TT>]/[<TT>Joue le segment</TT>]
ou un des raccourcis <TT>Shift-Tab</TT> ou <TT>Alt-Tab</TT>; vous pouvez
faire une pause ou red&eacute;marrer &agrave; tout moment avec [<TT>Signal</TT>]/[<TT>Joue/Pause</TT>]
ou le raccourci <TT>Tab</TT>.</LI>

<LI>Si n&eacute;cessaire, ajustez la fronti&egrave;re entre le segment
et son voisin en cliquant sur cette fronti&egrave;re avec la touche <TT>Control
</TT>enfonc&eacute;e (ou avec le bouton du milieu) puis en d&eacute;pla&ccedil;ant
la souris.</LI>

<LI>Tapez la transcription au clavier ; elle appara&icirc;t simultan&eacute;ment
dans l'&eacute;diteur de texte et dans la segmentation sous le signal.</LI>

<LI>Certains &eacute;v&eacute;nements (bruits divers, respirations...)&nbsp;peuvent
&ecirc;tre indiqu&eacute;s avec des balises sp&eacute;ciales par [<TT>Edition</TT>]/[<TT>Ins&eacute;rer
une balise</TT>]/[...] ou <TT>Control-d</TT>.</LI>

<LI>Les changements durables de condition acoustique (bruits de fond persistants)&nbsp;sont
&agrave; indiquer avec [<TT>Segmentation</TT>]/[<TT>Ins&eacute;rer un bruit
de fond</TT>].</LI>
</UL>

<H4><A NAME="r252"></A>2.5.2. Conventions de transcription</H4>

<P>La transcription graph&eacute;mique doit permettre de pr&eacute;dire
au mieux la prononciation du locuteur. Si une m&ecirc;me s&eacute;quence
graph&eacute;mique permet de g&eacute;n&eacute;rer diff&eacute;rentes prononciations
(typiquement les dates qu'on peut &eacute;noncer en utilisant <TT>mille</TT>
et <TT>cent</TT>), on adoptera des conventions capables de lever l'ambigu&iuml;t&eacute;.
Les conventions concernent aussi les &eacute;l&eacute;ments de la langue
pour lesquels la transcription n'est pas unique (typiquement les sigles
et les &eacute;pellations, ou encore les nombres qu'on peut &eacute;crire
sous forme de s&eacute;quence de chiffres ou comme s&eacute;quence de mots).
Dans tous les cas, les conventions adopt&eacute;es visent &agrave; standardiser
la forme graph&eacute;mique attendue pour minimiser l'ambigu&iuml;t&eacute;,
&eacute;ventuellement en utilisant des balises de prononciation. Les conventions
n'&eacute;tant pas exhaustives le transcripteur peut adopter par d&eacute;faut
une &eacute;criture telle qu'on peut la trouver dans des textes de journaux.</P>

<P>Les conventions de transcription sont d&eacute;taill&eacute;es dans
la 3&egrave;me partie.</P>

<H4><A NAME="r253"></A>2.5.3. Transcription ou prononciation ambigu&euml;</H4>

<P>La balise de prononciation permet de rajouter par dessus une graphie
&agrave; prononciation multiple (typiquement les nombres, les sigles/acronymes,
noms propres) une <B>description levant l'ambigu&iuml;t&eacute; de la prononciation</B>.</P>

<P>Il est difficile d'&eacute;noncer une r&egrave;gle stricte ici. <B>La
balise de prononciation permet de sp&eacute;cifier si un mot a &eacute;t&eacute;
prononc&eacute; de mani&egrave;re peu standard</B>, l'interpr&eacute;tation
du <I>standard</I> d&eacute;pendant &eacute;videmment du transcripteur.
On peut utiliser la balise de prononciation aussi pour n'importe quel autre
commentaire relatif &agrave; la prononciation d'un mot (par exemple le
marquage du -euh typique en fin de mot de l'accent parisien).</P>

<H3><A NAME="r26"></A>2.6. Bruits et conditions acoustiques</H3>

<P>Parmi les bruits on peut trouver de la parole ne correspondant pas &agrave;
des mots proprement dits de la langue (mots tronqu&eacute;s, erron&eacute;s,
... dont le cas est trait&eacute; dans les conventions de transcription),
des bruits &eacute;mis par le locuteur (par son appareil phonatoire, mais
qui ne sont pas de la parole, et donc dans la plupart des cas non-superpos&eacute;s
&agrave; la parole : bruits de bouche, de gorge, toux, respirations) ou
bien des bruits produits par des sources diff&eacute;rentes de l'appareil
phonatoire du locuteur. Ces derniers bruits sont plus g&ecirc;nants parce
qu'ils se superposent en g&eacute;n&eacute;ral &agrave; la parole, d&eacute;gradant
ainsi la qualit&eacute; du signal enregistr&eacute;. Les sources de bruit
peuvent &ecirc;tre, sur le lieu d'enregistrement, le locuteur lui-m&ecirc;me
ou son environnement : bruits d'&eacute;couteur ou froissements de papiers
en g&eacute;n&eacute;ral produits par le locuteur pendant qu'il parle,
conversations annexes, radio, t&eacute;l&eacute;, claquements de porte,
horloge, bruits de voiture, ... Le syst&egrave;me d'enregistrement radio-t&eacute;l&eacute;diffus&eacute;
peut &eacute;galement g&eacute;n&eacute;rer des bruits : bruits de micro,
craquements de ligne t&eacute;l&eacute;phonique, bips, effet Larsen, raccrochement
t&eacute;l&eacute;phone, ... Enfin certains bruits peuvent provenir du
syst&egrave;me de diffusion (parasites) ou d'enregistrement (souffle &eacute;lectrique).
</P>

<H4><A NAME="r261"></A>2.6.1. Comment noter les bruits ?</H4>

<P>Pour les bruits instantan&eacute;s ou de courte dur&eacute;e, le transcripteur
cr&eacute;e une balise de bruit par [<TT>Edition</TT>]/[<TT>Ins&eacute;rer
une balise</TT>]/[<TT>Bruit instantan&eacute;</TT>] ou <TT>Control-d,</TT>
et indique :</P>

<UL>
<LI>la <B>cat&eacute;gorie </B>de la balise - un bruit, une balise de prononciation,
d'annotation lexicale, de changement de langue, ou un commentaire.</LI>

<LI>la <B>description </B>du bruit ou de l'&eacute;v&eacute;nement par
une cha&icirc;ne de caract&egrave;res ; des valeurs pr&eacute;d&eacute;finies
sont propos&eacute;es dans un menu.</LI>

<LI>l'<B>&eacute;tendue </B>de la balise - balise instantan&eacute;e, de
d&eacute;but ou de fin, ou encore appliqu&eacute;e au mot pr&eacute;c&eacute;dent
ou suivant.</LI>
</UL>

<P>Par d&eacute;faut, les balises de bruit sont affich&eacute;es entre
<B>crochets</B>. Si le <B>bruit s'&eacute;tend sur plusieurs mots </B>on
peut s&eacute;lectionner les mots et ins&eacute;rer une balise ; les marqueurs
de d&eacute;but et de fin seront automatiquement ins&eacute;r&eacute;s
autour. </P>

<UL>
<LI>Si le bruit advient entre deux mots le code est affich&eacute; comme
un mot, c'est-&agrave;-dire s&eacute;par&eacute; des mots voisins par des
blancs : <I>parole1</I><B> [b]</B> <I>parole2</I></LI>

<LI>Si le bruit se superpose au mot pr&eacute;c&eacute;dent ou suivant,
&agrave; l'affichage le code correspondant est <U>accol&eacute; au mot
avec le caract&egrave;re +</U> (mais le transcripteur n'a pas &agrave;
taper ce caract&egrave;re)<BR>
Affichage : <I>parole</I><B>+[b]</B></LI>

<LI>Si le bruit se superpose &agrave; plusieurs mots, des marqueurs de
d&eacute;but et de fin seront utilis&eacute;s.<BR>
Affichage : <I>parole1</I> <B>[b-]</B> <I>parole2</I> <B>[-b]</B> <I>parole3<BR>
</I>le bruit de type <B>[b]</B> commence avant <I>parole2</I> et se termine
avant <I>parole3</I>.</LI>
</UL>

<P>Pour les bruits de longue dur&eacute;e, une autre proc&eacute;dure est
d&eacute;taill&eacute;e plus loin (paragraphe 2.6.4).</P>

<H4><A NAME="r262"></A>2.6.2. Bruits de l'appareil phonatoire (non-parole)</H4>

<P>Ici nous consid&eacute;rons des bruits produits par l'appareil phonatoire
du locuteur enregistr&eacute; : en g&eacute;n&eacute;ral ces bruits ne
se superposent pas &agrave; la parole, sauf quand la personne parle en
chuchotant ou en rigolant : <I>je</I><B>+[rire]</B> <I>voudrais</I><B>+[rire]
</B>(on peut utiliser aussi des marqueurs de d&eacute;but et de fin : <B>[rire-]</B>
<I>je voudrais</I> <B>[-rire]</B>).</P>

<P>Pour ne pas trop compliquer la t&acirc;che du transcripteur (&agrave;
identifier la nature exacte du bruit) <B>les codes de bruit marqu&eacute;s
en gras sont &agrave; utiliser par d&eacute;faut</B> pour un type de bruit
donn&eacute;. Si le transcripteur a envie de marquer plus particuli&egrave;rement
un bruit donn&eacute;, il peut choisir un des codes propos&eacute;s en
retrait de la marge ; cependant, ces diff&eacute;rences ne sont actuellement
pas exploit&eacute;es.</P>

<P><B>Suggestion :</B> le transcripteur peut accompagner les codes de bruit
de balises temporelles de synchronisation (afin de poser un rep&egrave;re
pour la segmentation automatique). </P>

<H5>Respiration</H5>

<UL>
<LI><B>[r] : respiration</B></LI>
</UL>

<OL>
<LI>acte physiologique :</LI>

<UL>
<LI>[i] : inspiration</LI>

<LI>[e] : expiration</LI>

<LI>[n] : reniflement</LI>
</UL>

<LI>acte volontaire :</LI>

<UL>
<LI>[pf] : souffle (on entend par souffle un acte de respiration volontairement
bruyant pour marquer son d&eacute;saccord ou sa mauvaise humeur, pour retenir
un rire, ...) </LI>
</UL>
</OL>

<H5>Autres bruits de bouche et de gorge</H5>

<UL>
<LI><B>[bb] : bruit de bouche</B> (ce code regroupe les bruits de l&egrave;vres,
de langue ou autre combinaison, ...)</LI>
</UL>

<UL>
<UL>
<LI>[tx] : toux, r&acirc;clement de gorge, &eacute;ternuement</LI>

<LI>[bg] : bruit de gorge (par exemple coup de glotte, bruit de larynx
)</LI>

<LI>[rire] : rires du locuteur </LI>

<LI>[sif] : sifflement du locuteur</LI>

<LI>[ch] : le locuteur se parle en voix chuchot&eacute;e pour faire un
commentaire<BR>
[ch-]<TT> voix chuchot&eacute;e </TT>[-ch]</LI>
</UL>
</UL>

<H4><A NAME="r263"></A>2.6.3. Bruits ext&eacute;rieurs &agrave; l'acte
de parole</H4>

<P>Nous regroupons dans cette section tous les bruits produits en dehors
de l'appareil phonatoire du locuteur. La plupart de ces bruits peuvent
se produire &agrave; n'importe quel instant de l'enregistrement, et <B>peuvent
donc se superposer au signal de parole</B>, d&eacute;gradant ainsi sa qualit&eacute;.
</P>

<P><B>Tout bruit de nature ind&eacute;termin&eacute;e ou non-r&eacute;pertori&eacute;
dans ce document peut &ecirc;tre not&eacute; comme suit :</B></P>

<UL>
<LI><B>[b]</B> : bruit ind&eacute;termin&eacute;</LI>
</UL>

<P>Bruits dus &agrave; l'environnement et au mat&eacute;riel d'enregistrement</P>

<UL>
<LI><B>[conv]</B> : conversations dans le fond : il peut s'agir de personnes
pr&eacute;sentes, de public, de voitures, ...</LI>

<LI><B>[pap]</B> : froissement de papiers. </LI>

<LI><B>[mic]</B> : bruits micros.</LI>
</UL>

<H4><A NAME="r264"></A>2.6.4. Changement de conditions acoustiques</H4>

<P>Lorsqu'un bruit s'&eacute;tend sur une longue dur&eacute;e (bruit de
fond persistant), un syst&egrave;me de marquage sp&eacute;cifique doit
&ecirc;tre utilis&eacute;. La balise de bruit de fond est une balise instantan&eacute;e
d&eacute;crivant un changement durable ans les conditions acoustiques.
L'information apport&eacute;e par cette balise reste valable &agrave; l'int&eacute;rieur
d'un m&ecirc;me enregistrement jusqu'&agrave; l'apparition d'une nouvelle
balise de bruit de fond, ou bien jusqu'&agrave; la fin de l'enregistrement.</P>

<P>Le transcripteur positionne le curseur temporel &agrave; l'instant du
changement de conditions acoustiques, choisit [<TT>Segmentation</TT>]/[<TT>Ins&eacute;rer
un bruit de fond</TT>] et indique :</P>

<UL>
<LI><B>la nature</B> : musique, parole ou conversations, bruit &eacute;lectrique,
autre...</LI>
</UL>

<P>Une ic&ocirc;ne de note de musique appara&icirc;t dans le texte &agrave;
la position courante.</P>

<P>Si le changement de conditions acoustiques est associ&eacute; aux conditions
d'enregistrement et li&eacute; au tour de parole (par exemple, une intervention
t&eacute;l&eacute;phonique de tr&egrave;s mauvaise qualit&eacute;), il
sera plus pratique d'utiliser le champ <TT>Fidelit&eacute;=low</TT> dans
les param&egrave;tres du tour de parole [<TT>Segmentation</TT>]/[<TT>Param&egrave;tres
du tour...</TT>] , plut&ocirc;t que la balise de bruit de fond.</P>

<H3><A NAME="r27"></A>2.7. Commentaires</H3>

<P>Cette balise permet au transcripteur de commenter l'enregistrement (la
parole ou les conditions acoustiques ) &agrave; transcrire. Le transcripteur
peut &eacute;galement faire ici des remarques sur ce qui lui para&icirc;t
utile pour faciliter la transcription.</P>

<P>
<HR WIDTH="100%"></P>

<H2><A NAME="r3"></A>3. Conventions de transcription</H2>

<P>Concernant la transcription l'id&eacute;e de base consiste &agrave;
focaliser l'attention sur ce qui appara&icirc;t en <B>premier plan</B>.
Si de multiples sources sonores sont pr&eacute;sentes il convient de focaliser
la transcription sur la source la plus &eacute;mergente. Par exemple on
entend en arri&egrave;re-plan une personnalit&eacute; parler une langue
&eacute;trang&egrave;re, un traducteur donnant la version fran&ccedil;aise
en premier plan. Il suffit de transcrire le traducteur en signalant de
la parole en bruit de fond. On entend de la musique en premier plan avec
des commentaires en arri&egrave;re-plan. On peut annoter un tel segment
comme <I>musique</I> avec comme bruit de fond de la parole (non transcrite).
Si deux locuteurs se 'disputent' le premier plan, on transcrit les deux
gr&acirc;ce au m&eacute;canisme de <I>parole superpos&eacute;e</I>. Cependant
de mani&egrave;re g&eacute;n&eacute;rale on fait l'hypoth&egrave;se qu'il
n'y a qu'une source sonore unique au premier plan.</P>

<P>De mani&egrave;re g&eacute;n&eacute;rale, dans tous les segments de
parole qui ont &eacute;t&eacute; annot&eacute;s <I>transcribed</I> (sections
<I>report </I>ou <I>filler</I>), <B>tout ce qui est entendu doit &ecirc;tre
transcrit</B> : la transcription doit fournir la s&eacute;quence orthographique
exacte correspondant &agrave; ce que le locuteur a prononc&eacute;, &agrave;
laquelle il faut rajouter dans la mesure du possible tous les &eacute;v&eacute;nements
extra-lexicaux pr&eacute;sents dans le signal acoustique (les r&eacute;p&eacute;titions,
h&eacute;sitations, troncatures, bruits). </P>

<H3><A NAME="r31"></A>3.1. Conventions d'&eacute;criture</H3>

<P>Le produit de la transcription est essentiellement une <B>s&eacute;quence
de mots s&eacute;par&eacute;s par des espaces</B>, entre lesquels s'intercalent
des <B>balises </B>identifiant les bruits, les conditions acoustiques et
diverses informations permettant de lever l'ambigu&iuml;t&eacute; de prononciation.
Autant que possible, il convient de r<B>especter l'orthographe standard
des mots</B>. La <B>ponctuation</B> sert &agrave; marquer les fronti&egrave;res
syntaxiques et prosodiques claires.</P>

<P>Dans la suite les ic&ocirc;nes repr&eacute;sentent :</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29>= <I>le locuteur dit</I>
</P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> = <TT>le transcripteur &eacute;crit</TT>
</P>
</UL>

<H4><A NAME="r311"></A>3.1.1. Majuscules/minuscules</H4>

<P>Tout est transcrit en <B>minuscules</B> (pas de majuscule syst&eacute;matique
en d&eacute;but de phrase). L'emploi des <B>majuscules</B> est r&eacute;serv&eacute;
&agrave; la transcription des <B>&eacute;pellations</B> et des <B>sigles</B>,
au d&eacute;but des <B>noms propres</B> et dans des <B>formules de politesse</B>.
</P>

<P>Pour les noms propres d'organisation <B>assimilables &agrave; des marques</B>
(tels que les journaux, les banques...) et utilisant des noms communs,
les noms communs en question sont &eacute;crits avec des initiales majuscules.</P>

<UL>
<PRE>as-tu lu Le Monde, L'Humanit&eacute; et Le Dimanche ...
les journalistes du Monde, de L'Humanit&eacute; et du Dimanche ...
au Cr&eacute;dit Lyonnais</PRE>
</UL>

<P>Dans le doute, on peut suivre la pratique des journeaux qui peuvent
ne mettre en majuscules que le premier mot d'un sigle :</P>

<UL>
<PRE>le Front national est au bord de l'implosion</PRE>
</UL>

<P>Pour les noms de lieux on adopte la convention d'&eacute;crire en minuscule
le nom commun. S'il est suivi d'un nom propre, celui-ci a &eacute;videmment
son initiale en majuscule.</P>

<UL>
<PRE>le lyc&eacute;e Anatole France
l'op&eacute;ra Garnier</PRE>
</UL>

<P>Des mots communs ayant fonction de nom propre (par exemple : <B>titres
</B>d'&eacute;missions, de films, de livre, d'institutions ) s'&eacute;crivent
<B>entre guillemets</B>. &Agrave; l'int&eacute;rieur des guillemets les
noms communs sont &eacute;crits en minuscules.</P>

<P>Par exemple :</P>

<UL>
<PRE>&quot;<U>le t&eacute;l&eacute;phone sonne</U>&quot; de ce soir sera consacr&eacute; &agrave; &quot;<U>la cha&icirc;ne de l'espoir</U>&quot;
&quot;<U>le monde d'est en ouest et du nord au sud</U>&quot; sur France-Inter
&quot;<U>regards sur le monde</U>&quot; , Dominique Bromberger bonjour !
bienvenue &agrave; &quot;<U>radio com , c'est vous</U>&quot;
aux Etats-Unis , le &quot;<U>Monica gate</U>&quot; continue
euh , je pr&eacute;f&egrave;re &quot;<U>Tomb raider</U>&quot;
le chanteur de &quot;<U>divine com&eacute;die</U>&quot;
des associations comme &quot;<U>m&eacute;decins du monde</U>&quot;
le prix Louis-Delluc pour C&eacute;dric Kahn et son film &quot;<U>l'ennui</U>&quot;
sortie aujourd'hui de &quot;<U>&agrave; la place du coeur</U>&quot; de Robert Gu&eacute;diguian 
un bel exemple de Le Cl&eacute;zio dans &quot;<U>la fi&egrave;vre</U>&quot;
&quot;<U>neuf mois marathon</U>&quot; , Marie-C&eacute;cile Picquet , aux &eacute;ditions &quot;<U>hors commerce</U>&quot;
une grande op&eacute;ration &quot;<U>mains propres</U>&quot; a &eacute;t&eacute; lanc&eacute;e
le &quot;<U>conseil &eacute;conomique et social</U>&quot;
ils ont gagn&eacute; la &quot;<U>terre promise</U>&quot;</PRE>
</UL>

<P>Pour les sigles &eacute;tendus (c'est-&agrave;-dire prononc&eacute;s
en toutes lettres) la suite de mots composant le sigle est entour&eacute;e
de guillemets. Les noms communs y sont &eacute;crits en minuscules.</P>

<UL>
<PRE>le &quot;<U>fond mon&eacute;taire international</U>&quot; a fonctionn&eacute;
le &quot;<U>commissariat &agrave; l'&eacute;nergie atomique</U>&quot;
l'&quot;<U>agence France presse</U>&quot;</PRE>
</UL>

<P>Enfin, on met une majuscule &agrave; <I>monsieur</I> (ainsi qu'&agrave;
<I>madame</I>, <I>mademoiselle</I> ...) dans les formules de politesse
comme indiqu&eacute; dans l'exemple :</P>

<UL>
<PRE>est-il vrai <U>Monsieur</U> le pr&eacute;fet que, ...</PRE>
</UL>

<P>mais</P>

<UL>
<PRE>le <U>monsieur</U> qui ...</PRE>
</UL>

<H4><A NAME="r312"></A>3.1.2. Ponctuations</H4>

<P>Il est recommand&eacute; de mettre des marques de ponctuation l&agrave;
o&ugrave; il y a des pauses dans le signal qui correspondent &agrave; des
fronti&egrave;res syntaxiques, ou bien dans le cas o&ugrave; l'absence
de ponctuation engendre une ambigu&iuml;t&eacute; dans le texte. </P>

<P><B>Attention :</B> il faut pr&eacute;c&eacute;der les signes de ponctuations
d'un blanc.</P>

<UL>
<P><TT>les fleurs sont fan&eacute;es , le pain est devenu sec </TT>. </P>
</UL>

<P>Les marqueurs de ponctuations sont indicateurs du mode de l'&eacute;nonc&eacute;
:<BR>
conclusif ''.'', interrogatif ``?'', exclamatif ``!'', h&eacute;sitation
``...'', etc.<BR>
Ces informations sont fortement li&eacute;es &agrave; la prosodie et &agrave;
la compr&eacute;hension. Il est recommand&eacute; d'accompagner les marques
de ponctuation forte (. ? !) d'une marque temporelle dans le signal (balise
de synchronisation , permettant de segmenter). </P>

<H4><A NAME="r313"></A>3.1.3. Apostrophe</H4>

<P>Il n'y a pas de s&eacute;parateur entre l'apostrophe et le mot suivant.</P>

<UL>
<PRE>l<U>'h</U>oraire
l<U>'a</U>rriv&eacute;e
jusq<U>u'&agrave;</U></PRE>
</UL>

<H4><A NAME="r314"></A>3.1.4. Trait d'union</H4>

<P>Les mots li&eacute;s par un trait d'union sont &eacute;crits normalement
sans s&eacute;paration par un blanc.</P>

<UL>
<PRE>apr&egrave;s-midi
voulez-vous
anglo-saxons</PRE>
</UL>

<P><B>Attention :</B> on ne relie pas par trait d'union les suites de noms
propres. On peut marquer graphiquement le lien par un slash entour&eacute;
de blancs.</P>

<UL>
<P><TT>dans le Nord </TT>/<TT> Pas-de-Calais<BR>
le trajet Paris </TT>/<TT> Toulouse</TT> </P>
</UL>

<H4><A NAME="r315"></A>3.1.5. Sigles</H4>

<P><B>Par d&eacute;faut :</B> les sigles sont not&eacute;s par des majuscules
non s&eacute;par&eacute;s par des blancs. </P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>s n c f </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>SNCF </TT></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>otan </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>OTAN </TT></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>ina p g </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>INA PG </TT></P>
</UL>

<P>La distinction entre un sigle prononc&eacute; comme un mot et un sigle
prononc&eacute; comme une suite de lettres se fera par la balise de prononciation,
uniquement dans les cas d'ambigu&iuml;t&eacute; (dans l'exemple qui suit,
les caract&egrave;res gras correspondent &agrave; l'affichage de la balise
; le transcripteur la produit avec [<TT>Edition</TT>] / [<TT>Ins&eacute;rer
une balise</TT>]/ [<TT>Prononciation</TT>] ou <TT>Alt-=</TT> puis en s&eacute;lectionnant
les options appropri&eacute;es).</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>l' ami ou l'a m
i , c'est selon</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>l'AMI </TT><B><FONT SIZE=-1>+[prononciation=lu]</FONT>
</B><TT>ou l'AMI </TT><B><FONT SIZE=-1>+[prononciation=&eacute;pel&eacute;]
</FONT></B><TT>, c'est selon</TT></P>
</UL>

<P>On peut observer des expressions complexes compos&eacute;es de sigles
et de mots ou de fragments de mots (acronymes,...), par exemple :</P>

<UL>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>JCSat </TT><FONT SIZE=-1><B>+[prononciation=J
S sat]</B><TT> , </TT></FONT><TT>RMIste , SMICard , PACSer </TT></P>
</UL>

<H4><A NAME="r316"></A>3.1.6. Abr&eacute;viations</H4>

<P>Il existe dans la langue des <B>abr&eacute;viations</B> standards comme
etc pour <I>et caetera</I>. Les transcripteurs utilisent <TT>etc</TT>&nbsp;sans
point accol&eacute;. </P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29><I>et caetera</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> etc</P>
</UL>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29><I>okay</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> OK</P>
</UL>

<H4><A NAME="r317"></A>3.1.7. Nombres</H4>

<P>Les nombres sont transcrits sous forme de suite de chiffres si la prononciation
correspond &agrave; la syntaxe standard de prononciation des nombres (&eacute;crire
la suite de mots est toujours autoris&eacute;, mais cela demande plus de
travail et peut g&eacute;n&eacute;rer plus d'erreur de la part du transcripteur).</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>soixante mille</I>
</P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>60000</TT> ou bien <TT>60
mille</TT></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>soixante millions
</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>60000000 </TT>ou bien
<TT>60 millions </TT></P>
</UL>

<P><B>Attention:</B> il ne faut pas introduire d'espace entre les chiffres!
</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>vingt virgule cinquante-sept
</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>20,57 </TT>ou bien <TT>20
,virgule 57 </TT></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>un franc cinquante</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>1 franc 50</TT></P>
</UL>

<P><B>Attention:</B> il ne faut pas &eacute;crire: 1,50 francs ! </P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>cent cinquante-huit
litres virgule neuf</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>158 litres ,virgule 9</TT></P>
</UL>

<H4><A NAME="r318"></A>3.1.8. Dates</H4>

<P>Pour les dates dont la prononciation peut &ecirc;tre ambigu&euml; (<I>dix-neuf
cent</I> ou <I>mille neuf cent</I>), on utilisera une balise de prononciation
dans le cas non-standard.</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>mille neuf cent
quatre-vingts </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>1980</TT></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>dix-neuf cent quatre-vingts
</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>1980 </TT><B><FONT SIZE=-1>+[prononciation=19
cent...]</FONT></B></P>
</UL>

<H4><A NAME="r319"></A>3.1.9. Chiffres romains</H4>

<P>Ils peuvent &ecirc;tre utilis&eacute;s dans les noms de roi ou de pape
(qui servent souvent &agrave; d&eacute;signer des lieux publics ). La transcription
se fait avec les chiffres romains, en ajoutant une balise de prononciation.</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>l'h&ocirc;tel Charles
cinq </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>l'h&ocirc;tel Charles
V </TT><B><FONT SIZE=-1>+[prononciation=5]</FONT></B></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>le stade Louis deux
</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>le stade Louis II </TT><B><FONT SIZE=-1>+[prononciation=2]</FONT></B></P>
</UL>

<H4><A NAME="r3110"></A>3.1.10. Adresses internet</H4>

<P>Pour les adresses internet (URL ou e-mail), la transcription se fait
en notant l'adresse telle qu'elle s'&eacute;crit (habituellement tout en
minuscules), et en ajoutant une balise de prononciation.</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>telsonne at radio
tiret france point f r</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> t<TT>elsonne@radio-france.fr</TT><B><FONT SIZE=-1>+[prononciation=telsonne
at radio tiret France point FR]</FONT></B></P>
</UL>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29><I>w w w point radio
tiret france point f r</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35><TT> www</TT>.<TT>radio-france.fr</TT><B><FONT SIZE=-1>+[prononciation=WWW
point radio tiret France point FR]</FONT></B></P>
</UL>

<H3><A NAME="r32"></A>3.2. Mots hors-lexique</H3>

<H4><A NAME="r321"></A>3.2.1. Mots d'origine &eacute;trang&egrave;re, changement
de langue</H4>

<P>Une balise de changement de langue permet d'identifier un mot ou une
suite de mots qui ne font pas partie du parler fran&ccedil;ais.</P>

<P>Les mots d'origine &eacute;trang&egrave;re (et absorb&eacute;s dans
la langue avec une prononciation donn&eacute;e) ne sont pas marqu&eacute;s
(par exemple <TT>week-end</TT>, <TT>playstation,</TT> <TT>business </TT>prononc&eacute;s
&agrave; l'anglaise). On consid&egrave;re ces prononciations comme ``standard''.</P>

<P>En revanche des prononciations peu communes devront &ecirc;tre signal&eacute;es
(par exemple les correspondants &agrave; l'&eacute;tranger d&eacute;marrant
leur intervention par <TT>buon giorno di Roma</TT>, <TT>good morning from
London</TT>... ).</P>

<UL>
<P><TT>&eacute;changeant des potins </TT><B><FONT SIZE=-1>[langue=anglais-]</FONT><I>
</I></B><TT>cashing up with gossip </TT><B><FONT SIZE=-1>[-langue=anglais]</FONT></B></P>

<P><TT>&ccedil;a s'appelle l'</TT><B><FONT SIZE=-1>[langue=anglais-] </FONT></B><TT>easy
listening </TT><B><FONT SIZE=-1>[-langue=anglais]</FONT></B></P>

<P><TT>cela reviendra &agrave; l&eacute;galiser le sabouba </TT><B><FONT SIZE=-1>+[langue=arabe]</FONT></B></P>
</UL>

<P>Il est inutile d'ajouter un marqueur d'orthographe incertaine aux mots
&eacute;trangers, m&ecirc;me si la transcription est simplement acoustique.
Un segment de longue dur&eacute;e en langue &eacute;trang&egrave;re doit
&ecirc;tre annot&eacute; <I>non-trans.</I></P>

<H4><A NAME="r322"></A>3.2.2. Noms propres &eacute;trangers</H4>

<P>Les noms propres <TT>Beatles</TT>, <TT>Clinton</TT>, les sigles <TT>CNN</TT>,
<TT>CBS</TT> prononc&eacute;s &agrave; l'anglaise correspondent au standard
; &agrave; l'inverse une prononciation &agrave; la fran&ccedil;aise inhabituelle
doit &ecirc;tre sp&eacute;cifi&eacute;e par une balise de prononciation
:</P>

<UL>
<P><TT>Bill Clinton , en fran&ccedil;ais Guillaume Clinton </TT><B><FONT SIZE=-1>+[prononciation=fran&ccedil;ais]</FONT></B></P>
</UL>

<P>Pour des noms propres comme <TT>Morgan</TT> le standard d&eacute;pend
&eacute;videmment du contexte (<TT>Mich&egrave;le Morgan</TT> ou <TT>Nelson
Morgan</TT> par exemple). Mais pour des noms propres comme <TT>Benjamin</TT>,
le contexte peut ne pas &ecirc;tre suffisant : <TT>Benjamin Netanyahou</TT>
peut admettre diff&eacute;rentes prononciations. </P>

<H4><A NAME="r323"></A>3.2.3. Mots techniques, nouveaux mots, noms propres
inconnus</H4>

<P>Cette section concerne les probl&egrave;mes d'&eacute;criture qui se
posent pour des n&eacute;ologismes, entit&eacute;s idiosyncrasiques, des
mots techniques . </P>

<P>Dans un contexte particulier des mots nouveaux peuvent appara&icirc;tre.
Ces mots ne font pas partie du vocabulaire de la langue courante, et sont
souvent ignor&eacute;s des gens ext&eacute;rieurs &agrave; ce domaine particulier.
Ceci est vrai pour des domaines techniques sp&eacute;cialis&eacute;s, mais
se rencontrent fr&eacute;quemment aussi dans le milieu journalistique (par
exemple le terme de <TT>pu-putch</TT> a &eacute;t&eacute; employ&eacute;
plusieurs fois d&eacute;but d&eacute;cembre 98). Ces mots sont &agrave;
consid&eacute;rer comme des entit&eacute;s lexicales &agrave; part enti&egrave;re.
</P>

<P>Lorsque l'orthographe se d&eacute;duit sans ambigu&iuml;t&eacute;, il
suffit de l'&eacute;crire sans balise suppl&eacute;mentaire :</P>

<UL>
<P><TT>un <U>t&eacute;l&eacute;virenquethon</U> ? &ccedil;a ne sonne pas
tr&egrave;s bien</TT></P>

<P><TT>le <U>greige</U> , quelque part entre gris et beige</TT></P>

<P><TT>la <U>primature</U> du chef est publiquement mise en cause</TT></P>
</UL>

<P>Des noms propres inconnus (souvent d'origine &eacute;trang&egrave;re)
peuvent admettre plusieurs graphies en fran&ccedil;ais. Afin de pouvoir
normaliser ces graphies lors d'un traitement ult&eacute;rieur, il est important
de marquer les mots qui posent probl&egrave;mes. </P>

<P><B>R&egrave;gle :</B> tous, mots techniques, mots idiosyncrasiques,
noms propres dont la graphie est incertaine (non fig&eacute;e), seront
pr&eacute;c&eacute;d&eacute;s par deux accents circonflexes :</P>

<UL>
<P><TT>^^mot_inconnu</TT></P>
</UL>

<P>Exemples :</P>

<UL>
<P><TT>^^Annam ^^Lefebvre ^^Baranov ^^Tourner ^^R&eacute;resse ^^Micoine
^^Ita&iuml; ^^Arad ^^Mougins ^^Mossey ^Klipffel ^^Jaillard ^^Elina ^^Castella
^^Zweta&iuml;eva ...</TT></P>
</UL>

<P>De mani&egrave;re &eacute;quivalente, une balise de commentaire lexical
peut &ecirc;tre utilis&eacute;e :</P>

<UL>
<P><TT>^^Gu&eacute;det</TT> ou <B><FONT SIZE=-1>[lexical=orthographe incertaine]+</FONT></B><TT>Gu&eacute;det</TT></P>
</UL>

<H3><A NAME="r33"></A>3.3. Sp&eacute;cificit&eacute;s du langage parl&eacute;</H3>

<P>Lorsqu'on &eacute;coute attentivement le signal, on se rend compte que
des parties de mots, voire des mots entiers peuvent avoir disparus.</P>

<P>On peut &ecirc;tre tent&eacute; de marquer graph&eacute;miquement les
r&eacute;ductions produites par le locuteur. <B>La consigne &agrave; suivre
ici est de <U>respecter l'orthographe standard</U></B>: ne pas marquer,
dans l'&eacute;criture, l'&eacute;lision ou la r&eacute;duction pr&eacute;sente
dans la parole. On peut utiliser la balise de prononciation ou la balise
de commentaire, si on veut d&eacute;crire les ph&eacute;nom&egrave;nes
observ&eacute;s. </P>

<H4><A NAME="r331"></A>3.3.1. Onomatop&eacute;es</H4>

<P>Les onomatop&eacute;es font partie de la langue et sont &agrave; transcrire
au m&ecirc;me titre que les autres mots. Les plus fr&eacute;quentes existent
en g&eacute;n&eacute;ral en tant que mots graph&eacute;miques, pour toutes
les autres on devra cr&eacute;er des mots correspondants et maintenir cette
liste &agrave; jour.</P>

<UL>
<PRE>euh , ben, eh, hein, ah, hum, oh, h&eacute;, 
ouahou, huhum, hou, hop, a&iuml;e ...</PRE>
</UL>

<P>Exemples :</P>

<UL>
<PRE>euh on voit que les ... , ah , comment dire 
et en fait euh bon ben
l'indice Nikkei et non pas Mickey hein ! 
eh bien , 
h&eacute; oh comme vous dites !
hou l&agrave; l&agrave; 
une &eacute;tude sur le le hum ()
ouahou , chic alors !
on en parle plus , hop .</PRE>
</UL>

<H4><A NAME="r332"></A>3.3.2. R&eacute;p&eacute;titions</H4>

<P>Les r&eacute;p&eacute;titions ne portent pas d'information et on tenterait
naturellement de les &eacute;liminer dans un processus de transcription
d'une dict&eacute;e. Elles doivent &ecirc;tre transcrites comme tout autre
mot.</P>

<UL>
<PRE>le le le d&eacute;put&eacute; ...</PRE>
</UL>

<H4><A NAME="r333"></A>3.3.3. Elisions &amp; formes r&eacute;duites</H4>

<P>La r&eacute;duction peut porter sur un seul mot ou une suite de mots,
par exemple: </P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>orches' de chambre</I>
| <I>s'i 'ous pla&icirc;t</I> | <I>qu'i soit </I>| <I>dans c' domaine</I>
</P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>orchestre de chambre</TT>
| <TT>s'il vous pla&icirc;t</TT> | <TT>qu'il soit</TT> | <TT>dans ce domaine</TT>
</P>
</UL>

<P><B>Remarque:</B> La r&eacute;duction de <TT>qu'il</TT> en <TT>qu'i'</TT>
est transcrite <TT>qu'il</TT> et non pas <TT>qui</TT>. </P>

<P>Autres exemples: </P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>i' y a</I> ou bien
<I>y a</I> </P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>il y a</TT> ou bien <TT>(il)
y a</TT> </P>
</UL>

<P>On peut &eacute;crire <TT>(il) y a</TT> si le <TT>il</TT> est absent
<B>de mani&egrave;re &eacute;vidente</B>. Mais nous tenons &agrave; souligner
qu'il est inutile de faire des &eacute;coutes r&eacute;p&eacute;t&eacute;es
pour d&eacute;cider si le <TT>il</TT> est pr&eacute;sent ou non.</P>

<P>Dans le langage parl&eacute; le <TT>ne</TT> de la n&eacute;gation est
tr&egrave;s souvent omis. Dans ce cas on ne l'&eacute;crit pas. </P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>j'en sais rien</I>
</P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>j'en sais rien </TT></P>
</UL>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>chais pas</I> ou
bien <I>chsais pas</I> ou bien ... </P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>je sais pas</TT> ou bien
<TT>je (ne) sais pas </TT></P>
</UL>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>mais y a pas d'
raison qu'i' soit pas l&agrave; </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>mais il y a pas de raison
qu'il soit pas l&agrave;</TT> <BR>
ou bien <TT>mais (il n') y a pas de raison qu'il (ne) soit pas l&agrave;</TT></P>
</UL>

<H4><A NAME="r334"></A>3.3.4. Troncatures</H4>

<P>Les mots tronqu&eacute;s peuvent provenir de deux origines diff&eacute;rentes
: soit le locuteur s'arr&ecirc;te avant la fin du mot, soit le locuteur
est coup&eacute; par le syst&egrave;me d'enregistrement. Dans ce dernier
cas le mot peut &ecirc;tre tronqu&eacute; au d&eacute;but : le locuteur
a commenc&eacute; &agrave; parler avant le d&eacute;but de l'enregistrement.
La troncature est marqu&eacute;e par des <B>parenth&egrave;ses</B>. Si
le mot tronqu&eacute; est connu (gr&acirc;ce au contexte) on note la partie
manquante du mot entre parenth&egrave;ses.</P>

<P>notation : ()</P>

<UL>
<P><TT>vou()</TT> : troncature finale de <TT>voudrais, voulais</TT>,...</P>

<P><TT>()embre</TT> : troncature initiale de <TT>septembre, novembre, d&eacute;cembre</TT>,...</P>

<P><TT>apr&egrave;s-de(main)</TT> : le mot complet peut &ecirc;tre d&eacute;duit
du contexte</P>
</UL>

<H4><A NAME="r335"></A>3.3.5. Lapsus</H4>

<P>Il arrive que la prononciation erron&eacute;e soit un mot correct de
la langue. Dans ce cas, on transcrit les mots tel qu'ils ont &eacute;t&eacute;
prononc&eacute;s.</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>une augmentation
cons&eacute;quence euh cons&eacute;quente </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>une augmentation <U>cons&eacute;quence</U>
euh cons&eacute;quente</TT></P>
</UL>

<H4><A NAME="r336"></A>3.3.6. Prononciation erron&eacute;e</H4>

<P>Si on arrive &agrave; identifier le mot mal prononc&eacute;, on &eacute;crit
le mot correct pr&eacute;c&eacute;d&eacute; d'une &eacute;toile.</P>

<P>notation : <B>*mot-correct</B></P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>pestacle </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>*spectacle</TT></P>
</UL>

<P>La prononciation effective peut &ecirc;tre signal&eacute;e par une balise
:</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>r&eacute;num&eacute;ration
</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>r&eacute;mun&eacute;ration
</TT><B><FONT SIZE=-1>+[pronounce=r&eacute;num&eacute;ration]</FONT></B></P>
</UL>

<P>S'il s'agit de <B>parole inintelligible</B>, on utilise la notation
suivante :<BR>
notation : <B>[pi]</B></P>

<P>Si la parole est inintelligible parce qu'il s'agit de <B>parole inaudible
et faible</B>, on peut noter ce type d'&eacute;v&eacute;nement, si on veut
la diff&eacute;rencier du cas ci-dessus, par :<BR>
notation : <B>[pif]</B></P>

<P>Le transcripteur est invit&eacute; &agrave; ins&eacute;rer une balise
de synchronisation pr&egrave;s du mot (juste apr&egrave;s le mot) mal prononc&eacute;
(afin de poser un rep&egrave;re pour la segmentation automatique dans cette
zone erron&eacute;e).</P>

<H4><A NAME="r337"></A>3.3.7. Liaisons</H4>

<P>On ne marque pas les liaisons dans la transcription orthographique.
Les liaisons erron&eacute;es sont relev&eacute;es par la balise de prononciation.
</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>vingt-z-animaux</I>
</P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>vingt</TT><B><FONT SIZE=-1>+[prononciation=vingt-z]</FONT></B><TT>
animaux </TT></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>trop-z ennuyeux
il voudrait-z y aller</I> </P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>trop</TT><B><FONT SIZE=-1>+[prononciation=trop-z]</FONT></B><TT>
ennuyeux il voudrait y aller</TT> </P>
</UL>

<H4><A NAME="r338"></A>3.3.8. &Eacute;pellations</H4>

<P>Toutes les lettres sont not&eacute;es en majuscules s&eacute;par&eacute;es
par des blancs, p. ex :<BR>
P A R I S<BR>
L'&eacute;pellation des lettres accentu&eacute;es peut conduire &agrave;
diff&eacute;rentes transcriptions, suivant l'&eacute;nonc&eacute; du locuteur,
par exemple :</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>&eacute; accent
aigu </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>&Eacute; accent aigu </TT></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>e accent aigu </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>E accent aigu </TT></P>
</UL>

<P><B>Remarque :</B> l'&eacute;pellation des <U>lettres redoubl&eacute;es</U>
peut donner lieu &agrave; diff&eacute;rentes transcriptions. Par exemple
le locuteur doit &eacute;peler <I>Vannes</I> :</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>v a n n e s </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>V A N N E S </TT></P>

<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>v a deux n e s </I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>V A 2 N E S </TT></P>
</UL>

<H4><A NAME="r339"></A>3.3.9. Ponctuation verbalis&eacute;e</H4>

<P>Si un locuteur &eacute;nonce la ponctuation (comme s'il faisait une
dict&eacute;e, <I>verbalized punctuation</I>) on &eacute;crit le mot correspondant
pr&eacute;fix&eacute; avec le symbole de ponctuation.</P>

<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>cent-cinq point
cinq</I></P>

<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>105 .point 5</TT></P>
</UL>

<P>
<HR WIDTH="100%"></P>

<H2><A NAME="r4"></A>4. V&eacute;rification</H2>

<H4><A NAME="r41"></A>4.1. Comment v&eacute;rifier la transcription ?</H4>

<UL>
<LI>Ecoutez le signal tout en lisant la transcription. Stoppez et red&eacute;marrez
aussi souvent que n&eacute;cessaire. Utilisez de pr&eacute;f&eacute;rence
la commande [<TT>Signal</TT>]/[<TT>Joue le segment</TT>] ou <TT>Shift-Tab</TT>.</LI>

<LI>La transcription est &agrave; modifier dans l'&eacute;diteur de texte.
Dans une future version du logiciel, un correcteur orthographique devrait
&ecirc;tre disponible pour la correction des fautes d'orthographe (et plus
g&eacute;n&eacute;ralement des fautes de frappe).</LI>

<LI>Les fronti&egrave;res des segments peuvent &ecirc;tre d&eacute;plac&eacute;es
ou supprim&eacute;es</LI>

<LI>Les tours de paroles et les sections sont &eacute;ditables en cliquant
sur le bouton correspondant.</LI>

<LI>La correction orthographique est disponible par [<TT>Edition</TT>]/[<TT>Correction
orthographique</TT>]</LI>
</UL>

</BODY>
</HTML>