1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662 663 664 665 666 667 668 669 670 671 672 673 674 675 676 677 678 679 680 681 682 683 684 685 686 687 688 689 690 691 692 693 694 695 696 697 698 699 700 701 702 703 704 705 706 707 708 709 710 711 712 713 714 715 716 717 718 719 720 721 722 723 724 725 726 727 728 729 730 731 732 733 734 735 736 737 738 739 740 741 742 743 744 745 746 747 748 749 750 751 752 753 754 755 756 757 758 759 760 761 762 763 764 765 766 767 768 769 770 771 772 773 774 775 776 777 778 779 780 781 782 783 784 785 786 787 788 789 790 791 792 793 794 795 796 797 798 799 800 801 802 803 804 805 806 807 808 809 810 811 812 813 814 815 816 817 818 819 820 821 822 823 824 825 826 827 828 829 830 831 832 833 834 835 836 837 838 839 840 841 842 843 844 845 846 847 848 849 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 870 871 872 873 874 875 876 877 878 879 880 881 882 883 884 885 886 887 888 889 890 891 892 893 894 895 896 897 898 899 900 901 902 903 904 905 906 907 908 909 910 911 912 913 914 915 916 917 918 919 920 921 922 923 924 925 926 927 928 929 930 931 932 933 934 935 936 937 938 939 940 941 942 943 944 945 946 947 948 949 950 951 952 953 954 955 956 957 958 959 960 961 962 963 964 965 966 967 968 969 970 971 972 973 974 975 976 977 978 979 980 981 982 983 984 985 986 987 988 989 990 991 992 993 994 995 996 997 998 999 1000 1001 1002 1003 1004 1005 1006 1007 1008 1009 1010 1011 1012 1013 1014 1015 1016 1017 1018 1019 1020 1021 1022 1023 1024 1025 1026 1027 1028 1029 1030 1031 1032 1033 1034 1035 1036 1037 1038 1039 1040 1041 1042 1043 1044 1045 1046 1047 1048 1049 1050 1051 1052 1053 1054 1055 1056 1057 1058 1059 1060 1061 1062 1063 1064 1065 1066 1067 1068 1069 1070 1071 1072 1073 1074 1075 1076 1077 1078 1079 1080 1081 1082 1083 1084 1085 1086 1087 1088 1089 1090 1091 1092 1093 1094 1095 1096 1097 1098 1099 1100 1101 1102 1103 1104 1105 1106 1107 1108 1109 1110 1111 1112 1113 1114 1115 1116 1117 1118 1119 1120 1121 1122 1123 1124 1125 1126 1127 1128 1129 1130 1131 1132 1133 1134 1135 1136 1137 1138 1139 1140 1141 1142 1143 1144 1145 1146 1147 1148 1149 1150 1151 1152 1153 1154 1155 1156 1157 1158 1159 1160 1161 1162 1163 1164 1165 1166 1167 1168 1169 1170 1171 1172 1173 1174 1175 1176 1177 1178 1179 1180 1181 1182 1183 1184 1185 1186 1187 1188 1189 1190 1191 1192 1193 1194 1195 1196 1197 1198 1199 1200 1201 1202 1203 1204 1205 1206 1207 1208 1209 1210 1211 1212 1213 1214 1215 1216 1217 1218 1219 1220 1221 1222 1223 1224 1225 1226 1227 1228 1229 1230 1231 1232 1233 1234 1235 1236 1237 1238 1239 1240 1241 1242 1243 1244 1245 1246 1247 1248 1249 1250 1251 1252 1253 1254 1255 1256 1257 1258 1259 1260 1261 1262 1263 1264 1265 1266 1267 1268 1269 1270 1271 1272 1273 1274 1275 1276 1277 1278 1279 1280 1281 1282 1283 1284 1285 1286 1287 1288 1289 1290 1291 1292 1293 1294 1295 1296 1297 1298 1299 1300 1301 1302 1303 1304 1305 1306 1307 1308 1309 1310 1311 1312 1313 1314 1315 1316 1317 1318 1319 1320 1321 1322 1323 1324 1325 1326 1327 1328 1329 1330 1331 1332 1333 1334 1335 1336 1337 1338 1339 1340 1341 1342 1343 1344 1345 1346 1347 1348 1349 1350 1351 1352 1353 1354 1355 1356 1357 1358 1359 1360 1361 1362 1363 1364 1365 1366 1367 1368 1369 1370 1371 1372 1373 1374 1375 1376 1377 1378 1379 1380 1381 1382 1383 1384 1385 1386 1387 1388 1389 1390 1391 1392 1393 1394 1395 1396 1397 1398 1399 1400 1401 1402 1403 1404 1405 1406 1407 1408 1409 1410 1411 1412 1413 1414 1415 1416 1417 1418 1419 1420 1421 1422 1423 1424 1425 1426 1427 1428 1429 1430 1431 1432 1433 1434 1435 1436 1437 1438 1439 1440 1441 1442 1443 1444 1445 1446 1447 1448 1449 1450 1451 1452 1453 1454 1455 1456 1457 1458 1459 1460 1461 1462 1463 1464 1465 1466 1467 1468 1469 1470 1471 1472 1473 1474 1475 1476 1477 1478 1479 1480 1481 1482 1483 1484 1485 1486 1487 1488 1489 1490 1491 1492 1493 1494 1495 1496 1497 1498 1499 1500 1501 1502 1503 1504 1505 1506 1507 1508 1509 1510 1511 1512 1513 1514 1515 1516 1517 1518 1519 1520 1521 1522 1523 1524 1525 1526 1527 1528 1529 1530 1531 1532 1533 1534 1535 1536 1537 1538 1539 1540 1541 1542 1543 1544 1545 1546 1547 1548 1549 1550 1551 1552 1553 1554 1555 1556 1557 1558 1559 1560 1561 1562 1563 1564 1565 1566 1567 1568 1569 1570 1571 1572 1573 1574 1575 1576 1577 1578 1579 1580 1581 1582 1583 1584 1585 1586 1587 1588 1589 1590 1591 1592 1593 1594 1595 1596 1597 1598 1599 1600 1601 1602 1603 1604 1605 1606 1607 1608
|
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<TITLE>Manuel de l'utilisateur</TITLE>
<META NAME="GENERATOR" CONTENT="Mozilla/3.01Gold (X11; I; Linux 2.0.33 i686) [Netscape]">
</HEAD>
<BODY TEXT="#000000" BGCOLOR="#FFFFFF" LINK="#0000EF" VLINK="#51188E" ALINK="#FF0000">
<H1 ALIGN=CENTER>Manuel du transcripteur</H1>
<CENTER><P>Conventions de transcription pour<BR>
les enregistrements radio-télédiffusés</P></CENTER>
<CENTER><P>mise à jour pour Transcriber 1.4.1</P></CENTER>
<CENTER><P><I>DGA/Limsi, juin 1999</I></P></CENTER>
<H2>
<HR WIDTH="100%"><A HREF="#r1">1. Introduction</A></H2>
<UL>
<LI><A HREF="#r11">1.1. Documents concernés</A></LI>
<LI><A HREF="#r12">1.2. Objectifs du manuel</A></LI>
</UL>
<H2><A HREF="#r2">2. Structuration de la transcription</A></H2>
<P><B><A HREF="#r21">2.1. Enregistrement</A></B></P>
<UL>
<LI><A HREF="#r211">2.1.1. Comment transcrire un nouvel enregistrement?</A></LI>
<LI><A HREF="#r212">2.1.2. Caractéristiques de l'enregistrement</A></LI>
</UL>
<P><B><A HREF="#r22">2.2. Segmentation du signal</A></B></P>
<UL>
<LI><A HREF="#r221">2.2.1. Où segmenter?</A></LI>
<LI><A HREF="#r222">2.2.2. Comment segmenter?</A></LI>
</UL>
<P><B><A HREF="#r23">2.3. Tours et locuteurs</A></B></P>
<UL>
<LI><A HREF="#r231">2.3.1. Comment créer les tours de parole?</A></LI>
<LI><A HREF="#r232">2.3.2. Caractéristiques des tours</A></LI>
<LI><A HREF="#r233">2.3.3. Caractéristiques des locuteurs</A></LI>
<LI><A HREF="#r234">2.3.4. Parole simultanée</A></LI>
</UL>
<P><B><A HREF="#r24">2.4. Sections et thèmes</A></B></P>
<UL>
<LI><A HREF="#r241">2.4.1. Que faut-il transcrire?</A></LI>
<LI><A HREF="#r242">2.4.2. Type et thème des sections</A></LI>
<LI><A HREF="#r243">2.4.3. Comment indiquer les sections?</A></LI>
</UL>
<P><B><A HREF="#r25">2.5. Transcription orthographique</A></B></P>
<UL>
<LI><A HREF="#r251">2.5.1. Comment transcrire?</A></LI>
<LI><A HREF="#r252">2.5.2. Conventions de transcription</A></LI>
<LI><A HREF="#r253">2.5.3. Transcription ou prononciation ambiguë</A></LI>
</UL>
<P><B><A HREF="#r26">2.6. Bruits et conditions acoustiques</A></B></P>
<UL>
<LI><A HREF="#r261">2.6.1. Comment noter les bruits ?</A></LI>
<LI><A HREF="#r262">2.6.2. Bruits de l'appareil phonatoire (non-parole)</A></LI>
<UL>
<LI>Respiration</LI>
<LI>Autres bruits de bouche et de gorge</LI>
</UL>
<LI><A HREF="#r263">2.6.3. Bruits extérieurs à l'acte de
parole</A></LI>
<LI><A HREF="#r264">2.6.4. Changement de conditions acoustiques</A></LI>
</UL>
<P><B><A HREF="#r27">2.7. Commentaires</A></B></P>
<H2><A HREF="#r3">3. Conventions de transcription</A></H2>
<P><B><A HREF="#r31">3.1. Conventions d'écriture</A></B></P>
<UL>
<LI><A HREF="#r311">3.1.1. Majuscules/minuscules</A></LI>
<LI><A HREF="#r312">3.1.2. Ponctuations</A></LI>
<LI><A HREF="#r313">3.1.3. Apostrophe</A></LI>
<LI><A HREF="#r314">3.1.4. Trait d'union</A></LI>
<LI><A HREF="#r315">3.1.5. Sigles</A></LI>
<LI><A HREF="#r316">3.1.6. Abréviations</A></LI>
<LI><A HREF="#r317">3.1.7. Nombres</A></LI>
<LI><A HREF="#r318">3.1.8. Dates</A></LI>
<LI><A HREF="#r319">3.1.9. Chiffres romains</A></LI>
<LI><A HREF="#r3110">3.1.10. Adresses internet</A></LI>
</UL>
<P><B><A HREF="#r32">3.2. Mots hors-lexique</A></B></P>
<UL>
<LI><A HREF="#r321">3.2.1. Mots d'origine étrangère, changement
de langue</A></LI>
<LI><A HREF="#r322">3.2.2. Noms propres étrangers</A></LI>
<LI><A HREF="#r323">3.2.3. Mots techniques, nouveaux mots, noms propres
inconnus</A></LI>
</UL>
<P><B><A HREF="#r33">3.3. Spécificités du langage parlé</A></B></P>
<UL>
<LI><A HREF="#r331">3.3.1. Onomatopées</A></LI>
<LI><A HREF="#r332">3.3.2. Répétitions</A></LI>
<LI><A HREF="#r333">3.3.3. Elisions & formes réduites</A></LI>
<LI><A HREF="#r334">3.3.4. Troncatures</A></LI>
<LI><A HREF="#r335">3.3.5. Lapsus</A></LI>
<LI><A HREF="#r336">3.3.6. Prononciation erronée</A></LI>
<LI><A HREF="#r337">3.3.7. Liaisons</A></LI>
<LI><A HREF="#r338">3.3.8. Épellations</A></LI>
<LI><A HREF="#r339">3.3.9. Ponctuation verbalisée</A></LI>
</UL>
<H2><A HREF="#r4">4. Vérification</A></H2>
<UL>
<LI><A HREF="#r41">4.1. Comment vérifier la transcription ?</A></LI>
</UL>
<P>
<HR WIDTH="100%"></P>
<H2><A NAME="r1"></A>1. Introduction</H2>
<P>La création manuelle de transcriptions d'enregistrements de journaux
radio- ou télédiffusés, permet de faire avancer les
recherches en transcription automatique, en indexation et en archivage
de ce type de documents sonores.</P>
<H4><A NAME="r11"></A>1.1. Documents concernés</H4>
<P>Les enregistrements de journaux radio- ou télédiffusés
présentent un contenu varié : le signal acoustique peut correspondre
à de la parole, de la musique ou du bruit, mais également
à des mélanges de parole, de musique et de bruit. Ensuite
il y a, pour la parole proprement dite, une grande diversité de
locuteurs et de thèmes abordés. Plusieurs personnes peuvent
intervenir sur un sujet donné successivement, voire simultanément.
La qualité acoustique de l'enregistrement (fidélité)
peut varier de manière considérable au cours du temps. La
durée de tels enregistrements peut varier de quelques dizaines de
minutes à plusieurs heures. </P>
<P>Pour l'instant nous nous intéressons plus particulièrement
aux nouvelles (journal, flash, revue de presse, incluant météo
et bourse, économie, faits de société ...) dans le
document sonore. Toute autre forme d'enregistrement (publicités,
jeux, fictions....) ne sera pas transcrite. </P>
<H4><A NAME="r12"></A>1.2. Objectifs du manuel</H4>
<P>Nous décrivons dans ce qui suit un ensemble de conventions pour
<B>structurer</B>, <B>annoter</B> et <B>transcrire</B> des enregistrements
de journaux radio- ou télédiffusés. Ces conventions
doivent permettre de structurer les enregistrements au niveau du contenu
thématique, des locuteurs et de la qualité acoustique. Les
informations produites à ce sujet sont nommées <B>annotations</B>.
La parole de chaque locuteur doit aussi être transcrite orthographiquement.
C'est la <B>transcription</B> proprement dite. La transcription est ici
la partie la plus importante et donc sur laquelle le maximum d'attention
doit être porté. </P>
<P>Les différentes étapes du travail de transcription sont
: la segmentation de la bande son, l'identification des tours de paroles
et des locuteurs, l'identification des sections thématiques, la
transcription orthographique, et la vérification. Ces étapes
peuvent être menées en parallèle ou au contraire appliquées
séquentiellement sur de longues portion du signal, suivant le choix
du transcripteur. </P>
<P>
<HR WIDTH="100%"></P>
<H2><A NAME="r2"></A>2. Structuration de la transcription</H2>
<P>L'étape d'annotation vise à structurer les enregistrements,
c'est-à-dire à segmenter et à décrire le signal
acoustique à différents niveaux jugés pertinents pour
le traitement ultérieur. Il s'agit ici principalement de l'identité
du locuteur, de l'identification du contenu thématique, ou de la
qualité du canal de transmission (acoustique).</P>
<P>Actuellement, un document de transcription est structuré de la
manière la suivante :</P>
<UL>
<LI>L'<I><U>enregistrement</U></I> correspond à la totalité
de l'enregistrement à transcrire. </LI>
<LI>L'enregistrement est découpé en <I><U>sections</U></I>,
délimitant les parties des émissions à transcrire,
les enchaînements journalistiques, ou les parties non-transcrites.</LI>
<LI>À l'intérieur d'une section on va distinguer les <I>tours
de parole</I> (<I><U>turn</U></I>) qui correspondent à des changements
de locuteur.</LI>
<LI>Les tours de paroles sont eux-mêmes découpés en
segments plus courts au moyen de points de synchronisation. La transcription
proprement dite n'intervient qu'à ce niveau de structuration.</LI>
<LI>A certains points de synchronisation, des changements durables de bruit
de fond sont indiqués ; cette segmentation en conditions acoustiques
est indépendante de la structuration en tours et sections.</LI>
</UL>
<H3><A NAME="r21"></A>2.1. Enregistrement</H3>
<H4><A NAME="r211"></A>2.1.1. Comment transcrire un nouvel enregistrement?</H4>
<UL>
<LI>Démarrez Transcriber (cf. manuel de référence
!)</LI>
<LI>Créez une nouvelle transcription avec le menu [<TT>Fichier</TT>]/[<TT>Nouvelle
transcription</TT>]. Une fenêtre de dialogue propose de choisir le
fichier son à transcrire. </LI>
<LI>Indiquez les informations générales associées
à l'enregistrement dans la fenêtre [<TT>Fichiers</TT>]/[<TT>Paramètres
de l'épisode</TT>].</LI>
<LI>Si vous voulez réutiliser certains locuteurs ou sujets d'une
transcription précédente, vous pouvez le faire dès
à présent avec [<TT>Edition</TT>]/[<TT>Locuteurs</TT>]/[<TT>Importer
à partir du fichier...</TT>] et [<TT>Edition</TT>]/[<TT>Sujets</TT>]/[<TT>Importer
à partir du fichier...</TT>].</LI>
<LI>Enregistrez la nouvelle transcription vide avec [<TT>Fichier</TT>]/[<TT>Enregistrer</TT>].
Un nom par défaut dérivé du nom du signal sera proposé.</LI>
<LI>Enregistrez la configuration avec [<TT>Options</TT>]/[<TT>Enregistrer
la configuration</TT>], afin de réouvrir automatiquement ces fichiers
au prochain démarrage</LI>
</UL>
<P>Par la suite, pensez à enregistrer fréquemment votre travail
avec [<TT>Fichier</TT>]/[<TT>Enregistrer</TT>] ou le raccourci <TT>Control-s</TT>,
surtout si vous n'avez pas activé la sauvegarde automatique. Par
ailleurs, un double affichage du signal (un avec une résolution
de 10 secondes, l'autre de une minute environ) peut être pratique.</P>
<H4><A NAME="r212"></A>2.1.2. Caractéristiques de l'enregistrement</H4>
<P>Les informations associées à un enregistrement, éditées
avec [<TT>Fichiers</TT>]/[<TT>Paramètres de l'épisode</TT>],
sont les suivantes :</P>
<UL>
<LI><B>l'identité du transcripteur </B>(par exemple <TT>Claire Montaigne</TT>)
est automatiquement remplie ;</LI>
<LI><B>le nom du fichier</B> son à transcrire (par exemple <TT>france-inter980428-0700:0820</TT>)
est automatiquement renseigné ;</LI>
<LI><B>la date et le numéro de version</B> de la transcription sont
automatiquement renseignés par le logiciel et ne peuvent pas être
modifiés ;</LI>
<LI><B>le programme: la provenance</B> du document sonore (c'est-à-dire
qui a enregistré), <B>la chaîne</B> qui a diffusé le
document (par exemple <TT>France-Inter</TT>) et <B>le nom de l'émission</B>
(par exemple <TT>tranche matinale 7-9</TT>) ;</LI>
<LI><B>la date de diffusion</B> ;</LI>
<LI><B>la langue principale</B> de diffusion.</LI>
</UL>
<P>Pour des enregistrements de même nature (par exemple sur plusieurs
jours) il convient de respecter la même nomenclature pour des programmes
identiques.</P>
<H3><A NAME="r22"></A>2.2. Segmentation du signal</H3>
<P>Pour fournir des repères temporels par rapport au signal, et
pour faciliter le travail de transcription, on segmente le signal en insérant
des balises temporelles <I>instantanées</I> de synchronisation (ou
frontières).</P>
<H4><A NAME="r221"></A>2.2.1. Où segmenter?</H4>
<P>Nous recommandons de faire correspondre ces balises à des groupes
de souffle dans le signal ou à des marques de ponctuation dans le
langage écrit. Pour des raisons techniques du traitement ultérieur
il est également souhaitable de fournir une balise de synchronisation
après différents types de problèmes au niveau acoustique
(mots mal prononcés, bruit court superposé à un mot...).</P>
<P>En résumé, l'insertion d'une frontière de synchronisation
est recommandé dans les situations suivantes :</P>
<UL>
<LI><B>début et fin d'élocution,</B></LI>
<LI><B>respiration,</B></LI>
<LI><B>ponctuation</B>,</LI>
<LI><B>mauvaise prononciation,</B></LI>
<LI><B>bruit instantané,</B></LI>
<LI><B>début et fin de musique...</B></LI>
</UL>
<H4><A NAME="r222"></A>2.2.2. Comment segmenter?</H4>
<UL>
<LI>Choisissez une résolution d'environ 30 secondes pour l'affichage
du signal.</LI>
<LI>Lancez la restitution à partir du début du signal ou
du début de la section non encore transcrite.</LI>
<LI>Pendant la restitution, à chaque instant correspondant à
un changement de locuteur ou une zone de silence, une pause, une respiration,
un changement de conditions acoustiques... insérez une frontière
en pressant la touche <TT>Return</TT>. Une nouvelle ligne précédée
d'un petit cercle apparaît dans la fenêtre de texte, et la
segmentation sous le signal est scindée au niveau du curseur.</LI>
</UL>
<P>Vous obtenez une segmentation grossière d'une partie du signal
en intervalles de 5 à 20 secondes en moyenne. Il est possible de
positionner les frontières plus précisément par la
suite. </P>
<H3><A NAME="r23"></A>2.3. Tours et locuteurs</H3>
<P>À ce niveau on décrit la succession de tours de parole
avec les différents locuteurs qui interviennent. </P>
<H4><A NAME="r231"></A>2.3.1. Comment créer les tours de parole?</H4>
<UL>
<LI>Affichez le signal à une résolution d'environ 30 secondes
ou plus et écoutez le signal.</LI>
<LI>Si un nouveau locuteur prend la parole au début du segment courant,
indiquez le début d'un nouveau tour de parole avec [<TT>Segmentation</TT>]/[<TT>Créer
un tour...</TT>] ou le raccourci <TT>Control-t</TT>.</LI>
<LI>Le locuteur du tour doit être identifié :</LI>
<UL>
<LI>Si le locuteur est connu et existe déjà dans la liste,
il suffit de cliquer sur son nom. </LI>
<LI>Pour un nouveau locuteur, le nom peut être tapé directement
au clavier. Si l'identité est inconnue cliquez simplement sur <TT>Créer
un locuteur</TT>. Les caractéristiques du locuteur (l'orthographe
précise de son nom, le genre, l'accent...) peuvent être modifiées
plus tard.</LI>
</UL>
<LI>S'il s'agit de parole superposée, validez l'option correspondante
et identifiez le deuxième locuteur de la même façon.</LI>
<LI>D'autres caractéristiques du tour (type de parole, canal, qualité)
peuvent éventuellement être renseignés.</LI>
</UL>
<P>A la création d'un tour, le locuteur proposé par défaut
est l'avant-dernier utilisé, ce qui est pratique dans le cas d'un
dialogue. </P>
<H4><A NAME="r232"></A>2.3.2. Caractéristiques des tours</H4>
<P>Pour chaque <B>tour de parole</B> le transcripteur indique :</P>
<UL>
<LI><B>un identificateur du locuteur</B>,</LI>
</UL>
<P>et éventuellement si cela est demandé :</P>
<UL>
<LI><B>le type de parole :</B> préparé, spontané</LI>
<LI><B>la qualité du son</B> : bon, moyen, faible</LI>
<LI><B>le canal de transmission</B> : intervention téléphonique
ou prise en studio</LI>
</UL>
<H4><A NAME="r233"></A>2.3.3. Caractéristiques des locuteurs</H4>
<P>Pour chaque nouveau <B>locuteur</B> le transcripteur indique :</P>
<UL>
<LI><B>le nom du locuteur</B> s'il est identifié, sinon un numéro
de locuteur avec un qualificatif (au titre duquel l'inconnu est intervenu
dans l'émission).</LI>
<LI><B>le statut :</B> orthographe connue ou incertaine.</LI>
<LI><B>le sexe du locuteur :</B> <TT>homme, femme, inconnu</TT></LI>
<LI><B>langue maternelle :</B> oui/non. </LI>
<LI><B>l'accent :</B> on peut spécifier ici les différents
accents : régionaux, francophones, étrangers.</LI>
<LI><B>le statut global/local</B> : un nom est global s'il est identifiable
en dehors du contexte de la transcription (par exemple, un journaliste,
un homme politique connu, etc.)</LI>
</UL>
<P>Il est important de respecter l'orthographe des noms. On peut trouver
les noms des journalistes et des différentes émissions radio
et télé français dans le guide <I>MédiaSid</I>.</P>
<P>On considère tout francophone (français, belge, suisse,
québécois) de langue maternelle française.</P>
<H4><A NAME="r234"></A>2.3.4. Parole simultanée</H4>
<P>Il faut distinguer différentes situations de parole superposée
:</P>
<OL>
<LI>Un locuteur parle, et un autre intervient ponctuellement par des interjections
(<TT>hum oui </TT>...) ; il convient de noter ces dernières comme
de simples bruits se superposant à la parole.</LI>
<LI>Un locuteur parle en premier plan, et une ou plusieurs voix sont audibles
à un niveau moindre (par exemple la voix d'un traducteur est superposée
à la voix d'origine) ; seule la voix au premier plan est transcrite
et un marqueur de bruit de fond (de type parole ou conversation) doit être
utilisé.</LI>
<LI>Deux locuteurs dialoguent, se coupent mutuellement la parole et parlent
simultanément sur plusieurs mots. Le mécanisme de gestion
de parole simultanée décrit ci-après peut être
appliqué. En cas de difficulté, les segments pourront être
annotés comme parole "non-transcrite" .</LI>
<LI>Si plus de deux locuteurs interviennent à un fort niveau sonore,
il faut annoter la portion de signal comme "non-transcrite".</LI>
</OL>
<P>Dans le cas de parole <B>simultanée</B> avec deux locuteurs (cas
numéro 3), le deuxième locuteur est identifié dans
la fenêtre des paramètres du tour après avoir validé
<TT>Parole superposée</TT>. L'affichage dans le logiciel est par
exemple :</P>
<UL>
<P><B><TT>Patricia Martin + Invite1 </TT></B></P>
</UL>
<UL>
<UL>
<P><B>1: </B><TT>évidemment découvert que<BR>
</TT><B>2: </B><TT>enfin n'oubliez pas</TT></P>
</UL>
</UL>
<P>Dans la transcription, <B>1:</B> va identifier les paroles (<I>évidemment
découvert que</I>) du <B>premier</B> locuteur (<TT>Patricia Martin</TT>)
et <B>2:</B> les paroles (<I>enfin n'oubliez pas</I>) du deuxième
locuteur <TT>Invite1</TT>. Les frontières au niveau du signal seront
posées au niveau des frontières de mot, de sorte à
inclure dans le segment ainsi découpé, toute la parole superposée
(par exemple si le mot <I>enfin</I> du locuteur 2 ne démarre qu'à
la fin du mot <I>évidemment</I> du locuteur 1, ce dernier est quand
même inclus dans le segment).</P>
<P>Cependant la transcription de ce type de signal est très coûteuse.
À l'heure actuelle on ne sait pas traiter de manière satisfaisante
la parole superposée et les transcriptions, mêmes si elles
sont produites, ne sont pas encore exploitées. Le transcripteur
peut donc choisir de marquer simplement le signal comme parole superposée
sans transcription, avec éventuellement un commentaire décrivant
la situation ou le contenu du dialogue.</P>
<H3><A NAME="r24"></A>2.4. Sections et thèmes</H3>
<P>La structuration complète d'un enregistrement peut être
complexe : une succession d'émissions, composées de sections
journalistiques, subdivisées elles-mêmes en rubriques thématiques...
En l'état actuel du logiciel, il faut choisir un seul niveau de
découpage (en sections journalistiques ou en rubriques thématiques)
et les frontières des segments ne sont pas toujours évidentes
; une structuration plus fine est envisagée pour l'avenir.</P>
<H4><A NAME="r241"></A>2.4.1. Que faut-il transcrire?</H4>
<P>Un enregistrement peut contenir des segments sans intérêt
pour le traitement automatique ultérieur. Les transcriptions sont
limitées aux émissions d'information avec les messages d'introduction
et de conclusion. Le reste sera annoté <I>non-transcribed</I>, c'est-à-dire
inexploitable et ne sera pas transcrit.</P>
<H4><A NAME="r242"></A>2.4.2. Type et thème des sections</H4>
<P>Un enregistrement est découpé en <I><U>sections</U></I>
de 3 types :</P>
<UL>
<LI>Les segments de type <I><U>report</U></I> réfèrent à
des parties d'émission à transcrire (journal, chronique...).
Pour chaque section journalistique, le transcripteur peut indiquer un thème
général (<TT>journal, revue de presse, chronique, politique,
faits de société, économie, bourse, culture, sports,
météo</TT>) choisi dans une liste prédéfinie,
suivi éventuellement d'un titre résumé.</LI>
<LI>Les segments de type <I><U>filler</U></I> ne concernent pas directement
le thème journalistique abordé, mais réfèrent
plutôt à l'organisation rédactionnelle, à l'enchaînement
des journalistes ou des invités etc.</LI>
<LI>Les segments de type <I><U>non-trans</U></I> sont les parties de l'enregistrement
dont la transcription n'est pas souhaitée ; il convient d'indiquer
au moins la nature de ces segments suivi éventuellement d'un titre
résumé (par exemple : <TT>publicité - les prêts
malins du CA</TT>). </LI>
</UL>
<H4><A NAME="r243"></A>2.4.3. Comment indiquer les sections?</H4>
<UL>
<LI>Affichez le signal à une résolution d'environ 30 secondes
ou plus et écoutez le signal.</LI>
<LI>A chaque changement d'émission ou de sujet (et en fonction des
consignes données), indiquez le début d'une nouvelle section
avec [<TT>Segmentation</TT>]/[<TT>Créer une section...</TT>] ou
le raccourci <TT>Control-e</TT>.</LI>
<LI>Indiquez pour chaque section :</LI>
<UL>
<LI>le <B>type</B> de la section : <I>report</I>, <I>filler</I>, <I>non-transcribed</I></LI>
<LI>un <B>thème</B> général (<TT>journal, politique
intérieure, international</TT>, <BR>
<TT>bourse, économie, culture, sports, météo, faits
de société, revue, chronique, ...) </TT>suivi éventuellement
d'une courte description du sujet.</LI>
</UL>
</UL>
<H3><A NAME="r25"></A>2.5. Transcription orthographique</H3>
<P>Nous abordons ici les problèmes de transcriptions des segments
de parole. Ces conventions concernent d'abord la parole pour laquelle la
transcription graphémique peut être ambiguë. Elles sont
nécessaires ensuite pour coder les bruits, catégorie dans
laquelle on regroupe tous les événements acoustiques non
assimilables à des mots (ou entrées lexicales) de la langue.</P>
<H4><A NAME="r251"></A>2.5.1. Comment transcrire?</H4>
<UL>
<LI>Choisissez une résolution d'environ 10 secondes ou moins pour
l'affichage du signal.</LI>
<LI>Allez au premier segment non transcrit en cliquant sur la ligne correspondante
dans le texte ou à la position dans le signal.</LI>
<LI>Ecoutez ce segment avec [<TT>Signal</TT>]/[<TT>Joue le segment</TT>]
ou un des raccourcis <TT>Shift-Tab</TT> ou <TT>Alt-Tab</TT>; vous pouvez
faire une pause ou redémarrer à tout moment avec [<TT>Signal</TT>]/[<TT>Joue/Pause</TT>]
ou le raccourci <TT>Tab</TT>.</LI>
<LI>Si nécessaire, ajustez la frontière entre le segment
et son voisin en cliquant sur cette frontière avec la touche <TT>Control
</TT>enfoncée (ou avec le bouton du milieu) puis en déplaçant
la souris.</LI>
<LI>Tapez la transcription au clavier ; elle apparaît simultanément
dans l'éditeur de texte et dans la segmentation sous le signal.</LI>
<LI>Certains événements (bruits divers, respirations...) peuvent
être indiqués avec des balises spéciales par [<TT>Edition</TT>]/[<TT>Insérer
une balise</TT>]/[...] ou <TT>Control-d</TT>.</LI>
<LI>Les changements durables de condition acoustique (bruits de fond persistants) sont
à indiquer avec [<TT>Segmentation</TT>]/[<TT>Insérer un bruit
de fond</TT>].</LI>
</UL>
<H4><A NAME="r252"></A>2.5.2. Conventions de transcription</H4>
<P>La transcription graphémique doit permettre de prédire
au mieux la prononciation du locuteur. Si une même séquence
graphémique permet de générer différentes prononciations
(typiquement les dates qu'on peut énoncer en utilisant <TT>mille</TT>
et <TT>cent</TT>), on adoptera des conventions capables de lever l'ambiguïté.
Les conventions concernent aussi les éléments de la langue
pour lesquels la transcription n'est pas unique (typiquement les sigles
et les épellations, ou encore les nombres qu'on peut écrire
sous forme de séquence de chiffres ou comme séquence de mots).
Dans tous les cas, les conventions adoptées visent à standardiser
la forme graphémique attendue pour minimiser l'ambiguïté,
éventuellement en utilisant des balises de prononciation. Les conventions
n'étant pas exhaustives le transcripteur peut adopter par défaut
une écriture telle qu'on peut la trouver dans des textes de journaux.</P>
<P>Les conventions de transcription sont détaillées dans
la 3ème partie.</P>
<H4><A NAME="r253"></A>2.5.3. Transcription ou prononciation ambiguë</H4>
<P>La balise de prononciation permet de rajouter par dessus une graphie
à prononciation multiple (typiquement les nombres, les sigles/acronymes,
noms propres) une <B>description levant l'ambiguïté de la prononciation</B>.</P>
<P>Il est difficile d'énoncer une règle stricte ici. <B>La
balise de prononciation permet de spécifier si un mot a été
prononcé de manière peu standard</B>, l'interprétation
du <I>standard</I> dépendant évidemment du transcripteur.
On peut utiliser la balise de prononciation aussi pour n'importe quel autre
commentaire relatif à la prononciation d'un mot (par exemple le
marquage du -euh typique en fin de mot de l'accent parisien).</P>
<H3><A NAME="r26"></A>2.6. Bruits et conditions acoustiques</H3>
<P>Parmi les bruits on peut trouver de la parole ne correspondant pas à
des mots proprement dits de la langue (mots tronqués, erronés,
... dont le cas est traité dans les conventions de transcription),
des bruits émis par le locuteur (par son appareil phonatoire, mais
qui ne sont pas de la parole, et donc dans la plupart des cas non-superposés
à la parole : bruits de bouche, de gorge, toux, respirations) ou
bien des bruits produits par des sources différentes de l'appareil
phonatoire du locuteur. Ces derniers bruits sont plus gênants parce
qu'ils se superposent en général à la parole, dégradant
ainsi la qualité du signal enregistré. Les sources de bruit
peuvent être, sur le lieu d'enregistrement, le locuteur lui-même
ou son environnement : bruits d'écouteur ou froissements de papiers
en général produits par le locuteur pendant qu'il parle,
conversations annexes, radio, télé, claquements de porte,
horloge, bruits de voiture, ... Le système d'enregistrement radio-télédiffusé
peut également générer des bruits : bruits de micro,
craquements de ligne téléphonique, bips, effet Larsen, raccrochement
téléphone, ... Enfin certains bruits peuvent provenir du
système de diffusion (parasites) ou d'enregistrement (souffle électrique).
</P>
<H4><A NAME="r261"></A>2.6.1. Comment noter les bruits ?</H4>
<P>Pour les bruits instantanés ou de courte durée, le transcripteur
crée une balise de bruit par [<TT>Edition</TT>]/[<TT>Insérer
une balise</TT>]/[<TT>Bruit instantané</TT>] ou <TT>Control-d,</TT>
et indique :</P>
<UL>
<LI>la <B>catégorie </B>de la balise - un bruit, une balise de prononciation,
d'annotation lexicale, de changement de langue, ou un commentaire.</LI>
<LI>la <B>description </B>du bruit ou de l'événement par
une chaîne de caractères ; des valeurs prédéfinies
sont proposées dans un menu.</LI>
<LI>l'<B>étendue </B>de la balise - balise instantanée, de
début ou de fin, ou encore appliquée au mot précédent
ou suivant.</LI>
</UL>
<P>Par défaut, les balises de bruit sont affichées entre
<B>crochets</B>. Si le <B>bruit s'étend sur plusieurs mots </B>on
peut sélectionner les mots et insérer une balise ; les marqueurs
de début et de fin seront automatiquement insérés
autour. </P>
<UL>
<LI>Si le bruit advient entre deux mots le code est affiché comme
un mot, c'est-à-dire séparé des mots voisins par des
blancs : <I>parole1</I><B> [b]</B> <I>parole2</I></LI>
<LI>Si le bruit se superpose au mot précédent ou suivant,
à l'affichage le code correspondant est <U>accolé au mot
avec le caractère +</U> (mais le transcripteur n'a pas à
taper ce caractère)<BR>
Affichage : <I>parole</I><B>+[b]</B></LI>
<LI>Si le bruit se superpose à plusieurs mots, des marqueurs de
début et de fin seront utilisés.<BR>
Affichage : <I>parole1</I> <B>[b-]</B> <I>parole2</I> <B>[-b]</B> <I>parole3<BR>
</I>le bruit de type <B>[b]</B> commence avant <I>parole2</I> et se termine
avant <I>parole3</I>.</LI>
</UL>
<P>Pour les bruits de longue durée, une autre procédure est
détaillée plus loin (paragraphe 2.6.4).</P>
<H4><A NAME="r262"></A>2.6.2. Bruits de l'appareil phonatoire (non-parole)</H4>
<P>Ici nous considérons des bruits produits par l'appareil phonatoire
du locuteur enregistré : en général ces bruits ne
se superposent pas à la parole, sauf quand la personne parle en
chuchotant ou en rigolant : <I>je</I><B>+[rire]</B> <I>voudrais</I><B>+[rire]
</B>(on peut utiliser aussi des marqueurs de début et de fin : <B>[rire-]</B>
<I>je voudrais</I> <B>[-rire]</B>).</P>
<P>Pour ne pas trop compliquer la tâche du transcripteur (à
identifier la nature exacte du bruit) <B>les codes de bruit marqués
en gras sont à utiliser par défaut</B> pour un type de bruit
donné. Si le transcripteur a envie de marquer plus particulièrement
un bruit donné, il peut choisir un des codes proposés en
retrait de la marge ; cependant, ces différences ne sont actuellement
pas exploitées.</P>
<P><B>Suggestion :</B> le transcripteur peut accompagner les codes de bruit
de balises temporelles de synchronisation (afin de poser un repère
pour la segmentation automatique). </P>
<H5>Respiration</H5>
<UL>
<LI><B>[r] : respiration</B></LI>
</UL>
<OL>
<LI>acte physiologique :</LI>
<UL>
<LI>[i] : inspiration</LI>
<LI>[e] : expiration</LI>
<LI>[n] : reniflement</LI>
</UL>
<LI>acte volontaire :</LI>
<UL>
<LI>[pf] : souffle (on entend par souffle un acte de respiration volontairement
bruyant pour marquer son désaccord ou sa mauvaise humeur, pour retenir
un rire, ...) </LI>
</UL>
</OL>
<H5>Autres bruits de bouche et de gorge</H5>
<UL>
<LI><B>[bb] : bruit de bouche</B> (ce code regroupe les bruits de lèvres,
de langue ou autre combinaison, ...)</LI>
</UL>
<UL>
<UL>
<LI>[tx] : toux, râclement de gorge, éternuement</LI>
<LI>[bg] : bruit de gorge (par exemple coup de glotte, bruit de larynx
)</LI>
<LI>[rire] : rires du locuteur </LI>
<LI>[sif] : sifflement du locuteur</LI>
<LI>[ch] : le locuteur se parle en voix chuchotée pour faire un
commentaire<BR>
[ch-]<TT> voix chuchotée </TT>[-ch]</LI>
</UL>
</UL>
<H4><A NAME="r263"></A>2.6.3. Bruits extérieurs à l'acte
de parole</H4>
<P>Nous regroupons dans cette section tous les bruits produits en dehors
de l'appareil phonatoire du locuteur. La plupart de ces bruits peuvent
se produire à n'importe quel instant de l'enregistrement, et <B>peuvent
donc se superposer au signal de parole</B>, dégradant ainsi sa qualité.
</P>
<P><B>Tout bruit de nature indéterminée ou non-répertorié
dans ce document peut être noté comme suit :</B></P>
<UL>
<LI><B>[b]</B> : bruit indéterminé</LI>
</UL>
<P>Bruits dus à l'environnement et au matériel d'enregistrement</P>
<UL>
<LI><B>[conv]</B> : conversations dans le fond : il peut s'agir de personnes
présentes, de public, de voitures, ...</LI>
<LI><B>[pap]</B> : froissement de papiers. </LI>
<LI><B>[mic]</B> : bruits micros.</LI>
</UL>
<H4><A NAME="r264"></A>2.6.4. Changement de conditions acoustiques</H4>
<P>Lorsqu'un bruit s'étend sur une longue durée (bruit de
fond persistant), un système de marquage spécifique doit
être utilisé. La balise de bruit de fond est une balise instantanée
décrivant un changement durable ans les conditions acoustiques.
L'information apportée par cette balise reste valable à l'intérieur
d'un même enregistrement jusqu'à l'apparition d'une nouvelle
balise de bruit de fond, ou bien jusqu'à la fin de l'enregistrement.</P>
<P>Le transcripteur positionne le curseur temporel à l'instant du
changement de conditions acoustiques, choisit [<TT>Segmentation</TT>]/[<TT>Insérer
un bruit de fond</TT>] et indique :</P>
<UL>
<LI><B>la nature</B> : musique, parole ou conversations, bruit électrique,
autre...</LI>
</UL>
<P>Une icône de note de musique apparaît dans le texte à
la position courante.</P>
<P>Si le changement de conditions acoustiques est associé aux conditions
d'enregistrement et lié au tour de parole (par exemple, une intervention
téléphonique de très mauvaise qualité), il
sera plus pratique d'utiliser le champ <TT>Fidelité=low</TT> dans
les paramètres du tour de parole [<TT>Segmentation</TT>]/[<TT>Paramètres
du tour...</TT>] , plutôt que la balise de bruit de fond.</P>
<H3><A NAME="r27"></A>2.7. Commentaires</H3>
<P>Cette balise permet au transcripteur de commenter l'enregistrement (la
parole ou les conditions acoustiques ) à transcrire. Le transcripteur
peut également faire ici des remarques sur ce qui lui paraît
utile pour faciliter la transcription.</P>
<P>
<HR WIDTH="100%"></P>
<H2><A NAME="r3"></A>3. Conventions de transcription</H2>
<P>Concernant la transcription l'idée de base consiste à
focaliser l'attention sur ce qui apparaît en <B>premier plan</B>.
Si de multiples sources sonores sont présentes il convient de focaliser
la transcription sur la source la plus émergente. Par exemple on
entend en arrière-plan une personnalité parler une langue
étrangère, un traducteur donnant la version française
en premier plan. Il suffit de transcrire le traducteur en signalant de
la parole en bruit de fond. On entend de la musique en premier plan avec
des commentaires en arrière-plan. On peut annoter un tel segment
comme <I>musique</I> avec comme bruit de fond de la parole (non transcrite).
Si deux locuteurs se 'disputent' le premier plan, on transcrit les deux
grâce au mécanisme de <I>parole superposée</I>. Cependant
de manière générale on fait l'hypothèse qu'il
n'y a qu'une source sonore unique au premier plan.</P>
<P>De manière générale, dans tous les segments de
parole qui ont été annotés <I>transcribed</I> (sections
<I>report </I>ou <I>filler</I>), <B>tout ce qui est entendu doit être
transcrit</B> : la transcription doit fournir la séquence orthographique
exacte correspondant à ce que le locuteur a prononcé, à
laquelle il faut rajouter dans la mesure du possible tous les événements
extra-lexicaux présents dans le signal acoustique (les répétitions,
hésitations, troncatures, bruits). </P>
<H3><A NAME="r31"></A>3.1. Conventions d'écriture</H3>
<P>Le produit de la transcription est essentiellement une <B>séquence
de mots séparés par des espaces</B>, entre lesquels s'intercalent
des <B>balises </B>identifiant les bruits, les conditions acoustiques et
diverses informations permettant de lever l'ambiguïté de prononciation.
Autant que possible, il convient de r<B>especter l'orthographe standard
des mots</B>. La <B>ponctuation</B> sert à marquer les frontières
syntaxiques et prosodiques claires.</P>
<P>Dans la suite les icônes représentent :</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29>= <I>le locuteur dit</I>
</P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> = <TT>le transcripteur écrit</TT>
</P>
</UL>
<H4><A NAME="r311"></A>3.1.1. Majuscules/minuscules</H4>
<P>Tout est transcrit en <B>minuscules</B> (pas de majuscule systématique
en début de phrase). L'emploi des <B>majuscules</B> est réservé
à la transcription des <B>épellations</B> et des <B>sigles</B>,
au début des <B>noms propres</B> et dans des <B>formules de politesse</B>.
</P>
<P>Pour les noms propres d'organisation <B>assimilables à des marques</B>
(tels que les journaux, les banques...) et utilisant des noms communs,
les noms communs en question sont écrits avec des initiales majuscules.</P>
<UL>
<PRE>as-tu lu Le Monde, L'Humanité et Le Dimanche ...
les journalistes du Monde, de L'Humanité et du Dimanche ...
au Crédit Lyonnais</PRE>
</UL>
<P>Dans le doute, on peut suivre la pratique des journeaux qui peuvent
ne mettre en majuscules que le premier mot d'un sigle :</P>
<UL>
<PRE>le Front national est au bord de l'implosion</PRE>
</UL>
<P>Pour les noms de lieux on adopte la convention d'écrire en minuscule
le nom commun. S'il est suivi d'un nom propre, celui-ci a évidemment
son initiale en majuscule.</P>
<UL>
<PRE>le lycée Anatole France
l'opéra Garnier</PRE>
</UL>
<P>Des mots communs ayant fonction de nom propre (par exemple : <B>titres
</B>d'émissions, de films, de livre, d'institutions ) s'écrivent
<B>entre guillemets</B>. À l'intérieur des guillemets les
noms communs sont écrits en minuscules.</P>
<P>Par exemple :</P>
<UL>
<PRE>"<U>le téléphone sonne</U>" de ce soir sera consacré à "<U>la chaîne de l'espoir</U>"
"<U>le monde d'est en ouest et du nord au sud</U>" sur France-Inter
"<U>regards sur le monde</U>" , Dominique Bromberger bonjour !
bienvenue à "<U>radio com , c'est vous</U>"
aux Etats-Unis , le "<U>Monica gate</U>" continue
euh , je préfère "<U>Tomb raider</U>"
le chanteur de "<U>divine comédie</U>"
des associations comme "<U>médecins du monde</U>"
le prix Louis-Delluc pour Cédric Kahn et son film "<U>l'ennui</U>"
sortie aujourd'hui de "<U>à la place du coeur</U>" de Robert Guédiguian
un bel exemple de Le Clézio dans "<U>la fièvre</U>"
"<U>neuf mois marathon</U>" , Marie-Cécile Picquet , aux éditions "<U>hors commerce</U>"
une grande opération "<U>mains propres</U>" a été lancée
le "<U>conseil économique et social</U>"
ils ont gagné la "<U>terre promise</U>"</PRE>
</UL>
<P>Pour les sigles étendus (c'est-à-dire prononcés
en toutes lettres) la suite de mots composant le sigle est entourée
de guillemets. Les noms communs y sont écrits en minuscules.</P>
<UL>
<PRE>le "<U>fond monétaire international</U>" a fonctionné
le "<U>commissariat à l'énergie atomique</U>"
l'"<U>agence France presse</U>"</PRE>
</UL>
<P>Enfin, on met une majuscule à <I>monsieur</I> (ainsi qu'à
<I>madame</I>, <I>mademoiselle</I> ...) dans les formules de politesse
comme indiqué dans l'exemple :</P>
<UL>
<PRE>est-il vrai <U>Monsieur</U> le préfet que, ...</PRE>
</UL>
<P>mais</P>
<UL>
<PRE>le <U>monsieur</U> qui ...</PRE>
</UL>
<H4><A NAME="r312"></A>3.1.2. Ponctuations</H4>
<P>Il est recommandé de mettre des marques de ponctuation là
où il y a des pauses dans le signal qui correspondent à des
frontières syntaxiques, ou bien dans le cas où l'absence
de ponctuation engendre une ambiguïté dans le texte. </P>
<P><B>Attention :</B> il faut précéder les signes de ponctuations
d'un blanc.</P>
<UL>
<P><TT>les fleurs sont fanées , le pain est devenu sec </TT>. </P>
</UL>
<P>Les marqueurs de ponctuations sont indicateurs du mode de l'énoncé
:<BR>
conclusif ''.'', interrogatif ``?'', exclamatif ``!'', hésitation
``...'', etc.<BR>
Ces informations sont fortement liées à la prosodie et à
la compréhension. Il est recommandé d'accompagner les marques
de ponctuation forte (. ? !) d'une marque temporelle dans le signal (balise
de synchronisation , permettant de segmenter). </P>
<H4><A NAME="r313"></A>3.1.3. Apostrophe</H4>
<P>Il n'y a pas de séparateur entre l'apostrophe et le mot suivant.</P>
<UL>
<PRE>l<U>'h</U>oraire
l<U>'a</U>rrivée
jusq<U>u'à</U></PRE>
</UL>
<H4><A NAME="r314"></A>3.1.4. Trait d'union</H4>
<P>Les mots liés par un trait d'union sont écrits normalement
sans séparation par un blanc.</P>
<UL>
<PRE>après-midi
voulez-vous
anglo-saxons</PRE>
</UL>
<P><B>Attention :</B> on ne relie pas par trait d'union les suites de noms
propres. On peut marquer graphiquement le lien par un slash entouré
de blancs.</P>
<UL>
<P><TT>dans le Nord </TT>/<TT> Pas-de-Calais<BR>
le trajet Paris </TT>/<TT> Toulouse</TT> </P>
</UL>
<H4><A NAME="r315"></A>3.1.5. Sigles</H4>
<P><B>Par défaut :</B> les sigles sont notés par des majuscules
non séparés par des blancs. </P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>s n c f </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>SNCF </TT></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>otan </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>OTAN </TT></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>ina p g </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>INA PG </TT></P>
</UL>
<P>La distinction entre un sigle prononcé comme un mot et un sigle
prononcé comme une suite de lettres se fera par la balise de prononciation,
uniquement dans les cas d'ambiguïté (dans l'exemple qui suit,
les caractères gras correspondent à l'affichage de la balise
; le transcripteur la produit avec [<TT>Edition</TT>] / [<TT>Insérer
une balise</TT>]/ [<TT>Prononciation</TT>] ou <TT>Alt-=</TT> puis en sélectionnant
les options appropriées).</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>l' ami ou l'a m
i , c'est selon</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>l'AMI </TT><B><FONT SIZE=-1>+[prononciation=lu]</FONT>
</B><TT>ou l'AMI </TT><B><FONT SIZE=-1>+[prononciation=épelé]
</FONT></B><TT>, c'est selon</TT></P>
</UL>
<P>On peut observer des expressions complexes composées de sigles
et de mots ou de fragments de mots (acronymes,...), par exemple :</P>
<UL>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>JCSat </TT><FONT SIZE=-1><B>+[prononciation=J
S sat]</B><TT> , </TT></FONT><TT>RMIste , SMICard , PACSer </TT></P>
</UL>
<H4><A NAME="r316"></A>3.1.6. Abréviations</H4>
<P>Il existe dans la langue des <B>abréviations</B> standards comme
etc pour <I>et caetera</I>. Les transcripteurs utilisent <TT>etc</TT> sans
point accolé. </P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29><I>et caetera</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> etc</P>
</UL>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29><I>okay</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> OK</P>
</UL>
<H4><A NAME="r317"></A>3.1.7. Nombres</H4>
<P>Les nombres sont transcrits sous forme de suite de chiffres si la prononciation
correspond à la syntaxe standard de prononciation des nombres (écrire
la suite de mots est toujours autorisé, mais cela demande plus de
travail et peut générer plus d'erreur de la part du transcripteur).</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>soixante mille</I>
</P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>60000</TT> ou bien <TT>60
mille</TT></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>soixante millions
</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>60000000 </TT>ou bien
<TT>60 millions </TT></P>
</UL>
<P><B>Attention:</B> il ne faut pas introduire d'espace entre les chiffres!
</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>vingt virgule cinquante-sept
</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>20,57 </TT>ou bien <TT>20
,virgule 57 </TT></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>un franc cinquante</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>1 franc 50</TT></P>
</UL>
<P><B>Attention:</B> il ne faut pas écrire: 1,50 francs ! </P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>cent cinquante-huit
litres virgule neuf</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>158 litres ,virgule 9</TT></P>
</UL>
<H4><A NAME="r318"></A>3.1.8. Dates</H4>
<P>Pour les dates dont la prononciation peut être ambiguë (<I>dix-neuf
cent</I> ou <I>mille neuf cent</I>), on utilisera une balise de prononciation
dans le cas non-standard.</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>mille neuf cent
quatre-vingts </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>1980</TT></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>dix-neuf cent quatre-vingts
</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>1980 </TT><B><FONT SIZE=-1>+[prononciation=19
cent...]</FONT></B></P>
</UL>
<H4><A NAME="r319"></A>3.1.9. Chiffres romains</H4>
<P>Ils peuvent être utilisés dans les noms de roi ou de pape
(qui servent souvent à désigner des lieux publics ). La transcription
se fait avec les chiffres romains, en ajoutant une balise de prononciation.</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>l'hôtel Charles
cinq </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>l'hôtel Charles
V </TT><B><FONT SIZE=-1>+[prononciation=5]</FONT></B></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>le stade Louis deux
</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>le stade Louis II </TT><B><FONT SIZE=-1>+[prononciation=2]</FONT></B></P>
</UL>
<H4><A NAME="r3110"></A>3.1.10. Adresses internet</H4>
<P>Pour les adresses internet (URL ou e-mail), la transcription se fait
en notant l'adresse telle qu'elle s'écrit (habituellement tout en
minuscules), et en ajoutant une balise de prononciation.</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>telsonne at radio
tiret france point f r</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> t<TT>elsonne@radio-france.fr</TT><B><FONT SIZE=-1>+[prononciation=telsonne
at radio tiret France point FR]</FONT></B></P>
</UL>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29><I>w w w point radio
tiret france point f r</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35><TT> www</TT>.<TT>radio-france.fr</TT><B><FONT SIZE=-1>+[prononciation=WWW
point radio tiret France point FR]</FONT></B></P>
</UL>
<H3><A NAME="r32"></A>3.2. Mots hors-lexique</H3>
<H4><A NAME="r321"></A>3.2.1. Mots d'origine étrangère, changement
de langue</H4>
<P>Une balise de changement de langue permet d'identifier un mot ou une
suite de mots qui ne font pas partie du parler français.</P>
<P>Les mots d'origine étrangère (et absorbés dans
la langue avec une prononciation donnée) ne sont pas marqués
(par exemple <TT>week-end</TT>, <TT>playstation,</TT> <TT>business </TT>prononcés
à l'anglaise). On considère ces prononciations comme ``standard''.</P>
<P>En revanche des prononciations peu communes devront être signalées
(par exemple les correspondants à l'étranger démarrant
leur intervention par <TT>buon giorno di Roma</TT>, <TT>good morning from
London</TT>... ).</P>
<UL>
<P><TT>échangeant des potins </TT><B><FONT SIZE=-1>[langue=anglais-]</FONT><I>
</I></B><TT>cashing up with gossip </TT><B><FONT SIZE=-1>[-langue=anglais]</FONT></B></P>
<P><TT>ça s'appelle l'</TT><B><FONT SIZE=-1>[langue=anglais-] </FONT></B><TT>easy
listening </TT><B><FONT SIZE=-1>[-langue=anglais]</FONT></B></P>
<P><TT>cela reviendra à légaliser le sabouba </TT><B><FONT SIZE=-1>+[langue=arabe]</FONT></B></P>
</UL>
<P>Il est inutile d'ajouter un marqueur d'orthographe incertaine aux mots
étrangers, même si la transcription est simplement acoustique.
Un segment de longue durée en langue étrangère doit
être annoté <I>non-trans.</I></P>
<H4><A NAME="r322"></A>3.2.2. Noms propres étrangers</H4>
<P>Les noms propres <TT>Beatles</TT>, <TT>Clinton</TT>, les sigles <TT>CNN</TT>,
<TT>CBS</TT> prononcés à l'anglaise correspondent au standard
; à l'inverse une prononciation à la française inhabituelle
doit être spécifiée par une balise de prononciation
:</P>
<UL>
<P><TT>Bill Clinton , en français Guillaume Clinton </TT><B><FONT SIZE=-1>+[prononciation=français]</FONT></B></P>
</UL>
<P>Pour des noms propres comme <TT>Morgan</TT> le standard dépend
évidemment du contexte (<TT>Michèle Morgan</TT> ou <TT>Nelson
Morgan</TT> par exemple). Mais pour des noms propres comme <TT>Benjamin</TT>,
le contexte peut ne pas être suffisant : <TT>Benjamin Netanyahou</TT>
peut admettre différentes prononciations. </P>
<H4><A NAME="r323"></A>3.2.3. Mots techniques, nouveaux mots, noms propres
inconnus</H4>
<P>Cette section concerne les problèmes d'écriture qui se
posent pour des néologismes, entités idiosyncrasiques, des
mots techniques . </P>
<P>Dans un contexte particulier des mots nouveaux peuvent apparaître.
Ces mots ne font pas partie du vocabulaire de la langue courante, et sont
souvent ignorés des gens extérieurs à ce domaine particulier.
Ceci est vrai pour des domaines techniques spécialisés, mais
se rencontrent fréquemment aussi dans le milieu journalistique (par
exemple le terme de <TT>pu-putch</TT> a été employé
plusieurs fois début décembre 98). Ces mots sont à
considérer comme des entités lexicales à part entière.
</P>
<P>Lorsque l'orthographe se déduit sans ambiguïté, il
suffit de l'écrire sans balise supplémentaire :</P>
<UL>
<P><TT>un <U>télévirenquethon</U> ? ça ne sonne pas
très bien</TT></P>
<P><TT>le <U>greige</U> , quelque part entre gris et beige</TT></P>
<P><TT>la <U>primature</U> du chef est publiquement mise en cause</TT></P>
</UL>
<P>Des noms propres inconnus (souvent d'origine étrangère)
peuvent admettre plusieurs graphies en français. Afin de pouvoir
normaliser ces graphies lors d'un traitement ultérieur, il est important
de marquer les mots qui posent problèmes. </P>
<P><B>Règle :</B> tous, mots techniques, mots idiosyncrasiques,
noms propres dont la graphie est incertaine (non figée), seront
précédés par deux accents circonflexes :</P>
<UL>
<P><TT>^^mot_inconnu</TT></P>
</UL>
<P>Exemples :</P>
<UL>
<P><TT>^^Annam ^^Lefebvre ^^Baranov ^^Tourner ^^Réresse ^^Micoine
^^Itaï ^^Arad ^^Mougins ^^Mossey ^Klipffel ^^Jaillard ^^Elina ^^Castella
^^Zwetaïeva ...</TT></P>
</UL>
<P>De manière équivalente, une balise de commentaire lexical
peut être utilisée :</P>
<UL>
<P><TT>^^Guédet</TT> ou <B><FONT SIZE=-1>[lexical=orthographe incertaine]+</FONT></B><TT>Guédet</TT></P>
</UL>
<H3><A NAME="r33"></A>3.3. Spécificités du langage parlé</H3>
<P>Lorsqu'on écoute attentivement le signal, on se rend compte que
des parties de mots, voire des mots entiers peuvent avoir disparus.</P>
<P>On peut être tenté de marquer graphémiquement les
réductions produites par le locuteur. <B>La consigne à suivre
ici est de <U>respecter l'orthographe standard</U></B>: ne pas marquer,
dans l'écriture, l'élision ou la réduction présente
dans la parole. On peut utiliser la balise de prononciation ou la balise
de commentaire, si on veut décrire les phénomènes
observés. </P>
<H4><A NAME="r331"></A>3.3.1. Onomatopées</H4>
<P>Les onomatopées font partie de la langue et sont à transcrire
au même titre que les autres mots. Les plus fréquentes existent
en général en tant que mots graphémiques, pour toutes
les autres on devra créer des mots correspondants et maintenir cette
liste à jour.</P>
<UL>
<PRE>euh , ben, eh, hein, ah, hum, oh, hé,
ouahou, huhum, hou, hop, aïe ...</PRE>
</UL>
<P>Exemples :</P>
<UL>
<PRE>euh on voit que les ... , ah , comment dire
et en fait euh bon ben
l'indice Nikkei et non pas Mickey hein !
eh bien ,
hé oh comme vous dites !
hou là là
une étude sur le le hum ()
ouahou , chic alors !
on en parle plus , hop .</PRE>
</UL>
<H4><A NAME="r332"></A>3.3.2. Répétitions</H4>
<P>Les répétitions ne portent pas d'information et on tenterait
naturellement de les éliminer dans un processus de transcription
d'une dictée. Elles doivent être transcrites comme tout autre
mot.</P>
<UL>
<PRE>le le le député ...</PRE>
</UL>
<H4><A NAME="r333"></A>3.3.3. Elisions & formes réduites</H4>
<P>La réduction peut porter sur un seul mot ou une suite de mots,
par exemple: </P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>orches' de chambre</I>
| <I>s'i 'ous plaît</I> | <I>qu'i soit </I>| <I>dans c' domaine</I>
</P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>orchestre de chambre</TT>
| <TT>s'il vous plaît</TT> | <TT>qu'il soit</TT> | <TT>dans ce domaine</TT>
</P>
</UL>
<P><B>Remarque:</B> La réduction de <TT>qu'il</TT> en <TT>qu'i'</TT>
est transcrite <TT>qu'il</TT> et non pas <TT>qui</TT>. </P>
<P>Autres exemples: </P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>i' y a</I> ou bien
<I>y a</I> </P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>il y a</TT> ou bien <TT>(il)
y a</TT> </P>
</UL>
<P>On peut écrire <TT>(il) y a</TT> si le <TT>il</TT> est absent
<B>de manière évidente</B>. Mais nous tenons à souligner
qu'il est inutile de faire des écoutes répétées
pour décider si le <TT>il</TT> est présent ou non.</P>
<P>Dans le langage parlé le <TT>ne</TT> de la négation est
très souvent omis. Dans ce cas on ne l'écrit pas. </P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>j'en sais rien</I>
</P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>j'en sais rien </TT></P>
</UL>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>chais pas</I> ou
bien <I>chsais pas</I> ou bien ... </P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>je sais pas</TT> ou bien
<TT>je (ne) sais pas </TT></P>
</UL>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>mais y a pas d'
raison qu'i' soit pas là </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>mais il y a pas de raison
qu'il soit pas là</TT> <BR>
ou bien <TT>mais (il n') y a pas de raison qu'il (ne) soit pas là</TT></P>
</UL>
<H4><A NAME="r334"></A>3.3.4. Troncatures</H4>
<P>Les mots tronqués peuvent provenir de deux origines différentes
: soit le locuteur s'arrête avant la fin du mot, soit le locuteur
est coupé par le système d'enregistrement. Dans ce dernier
cas le mot peut être tronqué au début : le locuteur
a commencé à parler avant le début de l'enregistrement.
La troncature est marquée par des <B>parenthèses</B>. Si
le mot tronqué est connu (grâce au contexte) on note la partie
manquante du mot entre parenthèses.</P>
<P>notation : ()</P>
<UL>
<P><TT>vou()</TT> : troncature finale de <TT>voudrais, voulais</TT>,...</P>
<P><TT>()embre</TT> : troncature initiale de <TT>septembre, novembre, décembre</TT>,...</P>
<P><TT>après-de(main)</TT> : le mot complet peut être déduit
du contexte</P>
</UL>
<H4><A NAME="r335"></A>3.3.5. Lapsus</H4>
<P>Il arrive que la prononciation erronée soit un mot correct de
la langue. Dans ce cas, on transcrit les mots tel qu'ils ont été
prononcés.</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>une augmentation
conséquence euh conséquente </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>une augmentation <U>conséquence</U>
euh conséquente</TT></P>
</UL>
<H4><A NAME="r336"></A>3.3.6. Prononciation erronée</H4>
<P>Si on arrive à identifier le mot mal prononcé, on écrit
le mot correct précédé d'une étoile.</P>
<P>notation : <B>*mot-correct</B></P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>pestacle </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>*spectacle</TT></P>
</UL>
<P>La prononciation effective peut être signalée par une balise
:</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>rénumération
</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>rémunération
</TT><B><FONT SIZE=-1>+[pronounce=rénumération]</FONT></B></P>
</UL>
<P>S'il s'agit de <B>parole inintelligible</B>, on utilise la notation
suivante :<BR>
notation : <B>[pi]</B></P>
<P>Si la parole est inintelligible parce qu'il s'agit de <B>parole inaudible
et faible</B>, on peut noter ce type d'événement, si on veut
la différencier du cas ci-dessus, par :<BR>
notation : <B>[pif]</B></P>
<P>Le transcripteur est invité à insérer une balise
de synchronisation près du mot (juste après le mot) mal prononcé
(afin de poser un repère pour la segmentation automatique dans cette
zone erronée).</P>
<H4><A NAME="r337"></A>3.3.7. Liaisons</H4>
<P>On ne marque pas les liaisons dans la transcription orthographique.
Les liaisons erronées sont relevées par la balise de prononciation.
</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>vingt-z-animaux</I>
</P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>vingt</TT><B><FONT SIZE=-1>+[prononciation=vingt-z]</FONT></B><TT>
animaux </TT></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>trop-z ennuyeux
il voudrait-z y aller</I> </P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>trop</TT><B><FONT SIZE=-1>+[prononciation=trop-z]</FONT></B><TT>
ennuyeux il voudrait y aller</TT> </P>
</UL>
<H4><A NAME="r338"></A>3.3.8. Épellations</H4>
<P>Toutes les lettres sont notées en majuscules séparées
par des blancs, p. ex :<BR>
P A R I S<BR>
L'épellation des lettres accentuées peut conduire à
différentes transcriptions, suivant l'énoncé du locuteur,
par exemple :</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>é accent
aigu </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>É accent aigu </TT></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>e accent aigu </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>E accent aigu </TT></P>
</UL>
<P><B>Remarque :</B> l'épellation des <U>lettres redoublées</U>
peut donner lieu à différentes transcriptions. Par exemple
le locuteur doit épeler <I>Vannes</I> :</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>v a n n e s </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>V A N N E S </TT></P>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>v a deux n e s </I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>V A 2 N E S </TT></P>
</UL>
<H4><A NAME="r339"></A>3.3.9. Ponctuation verbalisée</H4>
<P>Si un locuteur énonce la ponctuation (comme s'il faisait une
dictée, <I>verbalized punctuation</I>) on écrit le mot correspondant
préfixé avec le symbole de ponctuation.</P>
<UL>
<P><IMG SRC="../img/tete.gif" HSPACE=5 HEIGHT=26 WIDTH=29> <I>cent-cinq point
cinq</I></P>
<P><IMG SRC="../img/pencil.gif" HEIGHT=22 WIDTH=35> <TT>105 .point 5</TT></P>
</UL>
<P>
<HR WIDTH="100%"></P>
<H2><A NAME="r4"></A>4. Vérification</H2>
<H4><A NAME="r41"></A>4.1. Comment vérifier la transcription ?</H4>
<UL>
<LI>Ecoutez le signal tout en lisant la transcription. Stoppez et redémarrez
aussi souvent que nécessaire. Utilisez de préférence
la commande [<TT>Signal</TT>]/[<TT>Joue le segment</TT>] ou <TT>Shift-Tab</TT>.</LI>
<LI>La transcription est à modifier dans l'éditeur de texte.
Dans une future version du logiciel, un correcteur orthographique devrait
être disponible pour la correction des fautes d'orthographe (et plus
généralement des fautes de frappe).</LI>
<LI>Les frontières des segments peuvent être déplacées
ou supprimées</LI>
<LI>Les tours de paroles et les sections sont éditables en cliquant
sur le bouton correspondant.</LI>
<LI>La correction orthographique est disponible par [<TT>Edition</TT>]/[<TT>Correction
orthographique</TT>]</LI>
</UL>
</BODY>
</HTML>
|