1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191 192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207 208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223 224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239 240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255 256 257 258 259 260 261 262 263 264 265 266 267 268 269 270 271 272 273 274 275 276 277 278 279 280 281 282 283 284 285 286 287 288 289 290 291 292 293 294 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 311 312 313 314 315 316 317 318 319 320 321 322 323 324 325 326 327 328 329 330 331 332 333 334 335 336 337 338 339 340 341 342 343 344 345 346 347 348 349 350 351 352 353 354 355 356 357 358 359 360 361 362 363 364 365 366 367 368 369 370 371 372 373 374 375 376 377 378 379 380 381 382 383 384 385 386 387 388 389 390 391 392 393 394 395 396 397 398 399 400 401 402 403 404 405 406 407 408 409 410 411 412 413 414 415 416 417 418 419 420 421 422 423 424 425 426 427 428 429 430 431 432 433 434 435 436 437 438 439 440 441 442 443 444 445 446 447 448 449 450 451 452 453 454 455 456 457 458 459 460 461 462 463 464 465 466 467 468 469 470 471 472 473 474 475 476 477 478 479 480 481 482 483 484 485 486 487 488 489 490 491 492 493 494 495 496 497 498 499 500 501 502 503 504 505 506 507 508 509 510 511 512 513 514 515 516 517 518 519 520 521 522 523 524 525 526 527 528 529 530 531 532 533 534 535 536 537 538 539 540 541 542 543 544 545 546 547 548 549 550 551 552 553 554 555 556 557 558 559 560 561 562 563 564 565 566 567 568 569 570 571 572 573 574 575 576 577 578 579 580 581 582 583 584 585 586 587 588 589 590 591 592 593 594 595 596 597 598 599 600 601 602 603 604 605 606 607 608 609 610 611 612 613 614 615 616 617 618 619 620 621 622 623 624 625 626 627 628 629 630 631 632 633 634 635 636 637 638 639 640 641 642 643 644 645 646 647 648 649 650 651 652 653 654 655 656 657 658 659 660 661 662
|
.\" -*- nroff -*-
.\" (C) Copyright 1999 David A. Wheeler (dwheeler@ida.org)
.\"
.\" Permission is granted to make and distribute verbatim copies of this
.\" manual provided the copyright notice and this permission notice are
.\" preserved on all copies.
.\"
.\" Permission is granted to copy and distribute modified versions of this
.\" manual under the conditions for verbatim copying, provided that the
.\" entire resulting derived work is distributed under the terms of a
.\" permission notice identical to this one.
.\"
.\" Since the Linux kernel and libraries are constantly changing, this
.\" manual page may be incorrect or out-of-date. The author(s) assume no
.\" responsibility for errors or omissions, or for damages resulting from
.\" the use of the information contained herein. The author(s) may not
.\" have taken the same level of care in the production of this manual,
.\" which is licensed free of charge, as they might when working
.\" professionally.
.\"
.\" Formatted or processed versions of this manual, if unaccompanied by
.\" the source, must acknowledge the copyright and authors of this work.
.\"
.\" Fragments of this document are directly derived from IETF standards.
.\" For those fragments which are directly derived from such standards,
.\" the following notice applies, which is the standard copyright and
.\" rights announcement of The Internet Society:
.\"
.\" Copyright (C) The Internet Society (1998). All Rights Reserved.
.\" This document and translations of it may be copied and furnished to
.\" others, and derivative works that comment on or otherwise explain it
.\" or assist in its implementation may be prepared, copied, published
.\" and distributed, in whole or in part, without restriction of any
.\" kind, provided that the above copyright notice and this paragraph are
.\" included on all such copies and derivative works. However, this
.\" document itself may not be modified in any way, such as by removing
.\" the copyright notice or references to the Internet Society or other
.\" Internet organizations, except as needed for the purpose of
.\" developing Internet standards in which case the procedures for
.\" copyrights defined in the Internet Standards process must be
.\" followed, or as required to translate it into languages other than English.
.\"
.\" Modified Fri Jul 25 23:00:00 1999 by David A. Wheeler (dwheeler@ida.org)
.\" Modified Fri Aug 21 23:00:00 1999 by David A. Wheeler (dwheeler@ida.org)
.\"
.TH URI 7 "21/08/1999" "Linux" "Manual do Programador Linux"
.SH NOME
uri, url, urn \- identificador uniforme de recursos (URI), incluindo uma URL ou URN
.SH SINOPSE
.nf
.HP 0.2i
URI = [ absoluteURI | relativeURI ] [ "#" fragment ]
.HP
absoluteURI = scheme ":" ( hierarchical_part | opaque_part )
.HP
relativeURI = ( net_path | absolute_path | relative_path ) [ "?" query ]
.sp
.HP
scheme = "http" | "ftp" | "gopher" | "mailto" | "news" | "telnet" | "file" | "man" | "info" | "whatis" | "ldap" | "wais" | \&...
.HP
hierarchical_part = ( net_path | absolute_path ) [ "?" query ]
.sp
.HP
net_path = "//" authority [ absolute_path ]
.HP
absolute_path = "/" path_segments
.HP
relative_path = relative_segment [ absolute_path ]
.fi
.SH DESCRIO
.PP
Um Identificador Uniforme de Recursos (Uniform Resource Identifier - URI) uma string de caracteres curta
que identifica um recurso abstrato ou fsico (por exemplo, uma pgina da Web).
Um Localizador Uniforme de Recursos (Uniform Resource Locator - URL) uma URI
que identifica um recurso atravs do seu mecanismo de acesso
primrio (por exemplo, sua "localizao" de rede), em vez do
nome ou algum outro atributo daquele recurso.
Um Nome Uniforme de Recurso (Uniform Resource Name - URN) uma URI
que precisa manter-se nica e persistente globalmente, mesmo quando o
recurso deixa de existir ou se torna indisponvel.
.PP
As URIs so o meio padro de nomear destinos de links de hipertexto para
ferramentas como os web browsers.
A string "http://www.kernelnotes.org" uma URL (e portanto uma URI).
Muitas pessoas usam o termo URL largamente como um sinnimo de URI
(apesar de que, tecnicamente, as URLs formam um subconjunto das URIs).
.PP
As URIs podem ser absolutas ou relativas.
Um identificador absoluto refere-se a um recurso independente de
contexto, enquanto um identificador relativo
refere-se a um recurso atravs da descrio de
diferenas de um contexto corrente.
Dentro de uma referncia de caminho relativo, os segmentos completos de caminhos "." e
".." tm significados especiais: "o nvel de hierarquia corrente" e "o
nvel acima deste nvel de hierarquia", respectivamente, exatamente como so nos
sistemas do tipo Unix.
Um segmento de caminho que contm um caractere de dois-pontos
no pode ser usado como o primeiro segmento de um caminho relativo de uma URI
(por exemplo, "isto:aquilo"), porque ele poderia ser enganado por um nome
de esquema; preceda tal segmento com ./ (por exemplo, "./isto:aquilo").
Note que os descendentes do MS-DOS (por exemplo, o Microsoft Windows) substituem os dois-pontos
do nome do dispositivo por uma barra vertical("|") em URIs, de forma que "C:" se torna "C|".
.PP
Um identificador de fragmento, se includo, refere-se a uma poro particular nomeada
(fragmento) de um recurso; textos depois de um '#' identificam o fragmento.
Uma URI comeando com '#' refere-se a aquele fragmento no recurso corrente.
.SH USO
H muitos esquemas de URIs diferentes, cada um com regras
e significados adicionais especficos, mas eles so feitos intencionalmente para serem
to similares quanto possvel.
Por exemplo, muitos esquemas de URL
permitem que a autoridade tenha o seguinte formato, chamada aqui de
.I ip_server
(colchetes mostram o que opcional):
.HP
.IR "ip_server = " [ user " [ : " password " ] @ ] " host " [ : " port ]
.PP
Este formato permite que voc insira opcionalmente um nome de usurio, um
usurio mais senha, e/ou um nmero de porta.
O
.I host
o nome de um computador-host, ou seu nome, como determinado pelo DNS ou
um endereo IP (nmeros separados por pontos).
Portanto, a URI
<http://fred:fredpassword@xyz.com:8080/>
loga em um servidor Web no host xyz.com
como fred (usando a senha fredpassword) usando a porta 8080.
Evite incluir uma senha em uma URI se possvel, por causa dos
muitos riscos de segurana por ter-se uma senha escrita.
Se a URL fornece um nome de usurio mas nenhuma senha, e o servidor remoto
pede uma senha, o programa interpretador da URL
deve requerer uma do usurio.
.PP
Aqui esto alguns dos esquemas mais comuns em uso em sistemas tipo Unix,
que so entendidos por muitas ferramentas.
Note que muitas ferramentas usando URIs tambm tm esquemas internos ou especializados;
veja a documentao dessas ferramentas para informaes sobre esses esquemas.
.SS "http - servidor Web (HTTP)"
.RI http:// ip_server / path
.br
.RI http:// ip_server / path ? query
.PP
Esta uma URL acessando um servidor web (HTTP).
A porta padro 80.
Se o caminho se refere a um diretrio, o servidor Web escolher qual
retorna; geralmente, se h um arquivo denominado "index.html" ou "index.htm",
seu contedo retornado, caso contrrio, uma lista de arquivos no
diretrio corrente (com links apropriados) gerada e retornada.
Um exemplo <http://lwn.net>.
.PP
Uma pesquisa pode ser dada no formato "isindex" arcaico, consistindo em
uma palavra ou frase, e no incluindo um sinal de igual.
Uma pesquisa tambm pode ser no formato "GET", mais longo, que tem uma ou mais
entradas de pesquisa no formato
.IR chave = valor
, separadas pelo caractere "&".
Note que
.I chave
pode ser repetida mais de uma vez, porm cabe ao servidor web e seus
programas aplicativos determinar se h algum significado para aquilo.
H uma infeliz interao com HTML/XML/SGML e
o formato de pesquisa GET; quando tais URIs com mais de uma chave
so embutidas em documentos SGML/XML (incluindo HTML), o "&" tem que ser
reescrito como "&".
Note que nem todas as pesquisas usam este formato; formas maiores
podem ser muito longas para se armazenar como uma URI, de forma que eles usam um mecanismo de
interao diferente (chamado POST) que no inclui os dados na URI.
Veja a especificao do CGI (Common Gateway Interface) em
<http://www.w3.org/CGI> para maiores informaes.
.SS "ftp - File Transfer Protocol (FTP)"
.RI ftp:// ip_server / path
.PP
Esta uma URL acessando um arquivo atravs de um protocolo de transferncia de arquivo (FTP).
A porta padro (para controle) 21.
Se nenhum nome de usurio includo, fornecido o nome de usurio "anonymous" (annimo), e
neste caso muitos clientes fornecem como a senha o correio eletrnico do
requerente.
Um exemplo
<ftp://ftp.is.co.za/rfc/rfc1808.txt>.
.SS "gopher - servidor Gopher"
.RI gopher:// ip_server / "gophertype selector"
.br
.RI gopher:// ip_server / "gophertype selector" %09 search
.br
.RI gopher:// ip_server / "gophertype selector" %09 search %09 gopher+_string
.br
.PP
A porta padro do gopher 70.
.I gophertype
um campo de caractere nico que denota o
tipo Gopher do recurso ao qual
a URL se refere.
O caminho inteiro tambm pode ser vazio, caso
em que o delimitador "/" tambm opcional e o padro de gophertype
"1".
.PP
.I selector
a string do seletor do Gopher. No protocolo Gopher,
as strings do seletor do Gopher so uma sequncia de octetos que podem conter
quaisquer octetos, exceto o hexadecimal 09 (HT do US-ASCII, ou tabulao), hexadecimal 0A
(caractere LF do US-ASCII), e 0D (caractere CR do US-ASCII).
.SS "mailto - endereo de email"
.RI mailto: email-address
.PP
Este um endereo de e-mail, geralmente no formato
.IR name @ hostname .
Veja
.BR mailaddr (7)
para mais informaes sobre o formato correto de um endereo de e-mail.
Note que qualquer caractere % deve ser reescrito como %25. Um
exemplo <mailto:dwheeler@ida.org>.
.SS "news - Newsgroup ou mensagem de notcias"
.RI news: newsgroup-name
.br
.RI news: message-id
.PP
A
.I newsgroup-name
um nome delimitado por pontos, tal como
"comp.infosystems.www.misc".
Se <newsgroup-name> "*" (como em <news:*>), ele usado para se referir
a "todos os grupos de notcias disponveis".
Um exemplo <news:comp.lang.ada>.
.PP
Um
.I message-id
corresponde ao ID de mensagem do
.UR http://www.ietf.org/rfc/rfc1036.txt
IETF RFC 1036,
.UE
sem os contornantes "<"
e ">"; ele toma a forma
.IR unique @ full_domain_name .
Um identificador de mensagem pode ser distinguido de um nome de grupo de notcias
pela presena do caractere "@".
.SS "telnet - Telnet login"
.RI telnet:// ip_server /
.PP
O esquema de URL Telnet usado para designar servios de texto interativos
que podem ser acessados pelo protocolo Telnet. O caractere final "/" pode ser omitido.
A porta padro 23.
Um exemplo <telnet://melvyl.ucop.edu/>.
.SS "file - arquivo normal"
.RI file:// ip_server / path_segments
.br
.RI file: path_segments
.PP
Este representa um arquivo ou diretrio acessvel localmente.
Como um caso especial,
.I host
pode ser a string "localhost" ou uma string
vazia; isto interpretado como 'a mquina da qual a URL est
sendo interpretada'.
Se o caminho para um diretrio, o visualizador deve mostrar
o contedo do diretrio com links para cada item;
nem todos os visualizadores fazem isso.
O KDE suporta arquivos gerados atravs da URL <file:/cgi-bin>.
Se o arquivo dado no encontrado, os escritores do browser podem querer tentar expandir
o nome do arquivo atravs de um englobamento
(veja
.BR glob (7)
e
.BR glob (3)).
.PP
O segundo formato (por exemplo, <file:/etc/passwd>)
um formato correto para se referir
ao arquivo local. Porm, padres mais antigos no permitiam este formato,
e alguns programas no reconhecem isto como uma URI.
Uma sintaxe mais portvel o uso de uma string vazia como o nome do servidor, por exemplo,
<file:///etc/passwd>; este formato faz a mesma coisa
e facilmente reconhecido como uma URI por buscadores de padres e programas mais antigos.
Note que se voc realmente quer dizer "comece do local corrente", no
especifique o esquema de jeito nenhum; use um endereo relativo, como <../test.txt>,
que tem o efeito colateral de ser independente de esquema.
Um exemplo deste esquema <file:///etc/passwd>.
.SS "man - Documentao de pginas de manual"
.RI man: command-name
.br
.RI man: command-name ( section )
.PP
Isto se refere s pginas de referncia do manual (man) online local.
O nome do comando pode opcionalmente ser seguido por parnteses e pelo nmero da seo;
veja
.BR man (7)
para mais informaes sobre o significado dos nmeros de seo.
Este esquema de URI nico para sistemas do tipo Unix (tais como o Linux)
e no registrado correntemente pelo IETF.
Um exemplo <man:ls(1)>.
.SS "info - Documentao de pginas info"
.RI info: virtual-filename
.br
.RI info: virtual-filename # nodename
.br
.RI info:( virtual-filename )
.br
.RI info:( virtual-filename ) nodename
.PP
Este esquema se refere s pginas de referncia info online (geradas dos
arquivos texinfo), um formato de documentao usado por programas como as ferramentas GNU.
Este esquema de URI exclusivo para sistemas do tipo Unix (tais como o Linux)
e no registrado correntemente pelo IETF.
No momento em que este escrito, o GNOME e o KDE diferem em suas sintaxes
de URI, e no aceitam a sintaxe do outro.
O primeiro dos dois formatos so o formato GNOME; um nomes de ns todos os espaos
so escritos como sublinhados.
O segundo dos dois formatos o formato KDE;
os espaos nos nomes de ns devem ser escritos como espaos, mesmo isso sendo
proibido pelos padres da URI.
Espera-se que no futuro muitas ferramentas entendero todos estes
formatos e sempre aceitaro sublinhados para espaos nos nomes dos ns.
Tanto no GNOME quanto no KDE, se o formato sem o nome do n usado,
o nome do n assumido como sendo "Top".
Exemplos de formato GNOME so <info:gcc> e <info:gcc#G++_e_GCC>.
Exemplos de formato KDE so <info:(gcc)> e <info:(gcc)G++ e GCC>.
.SS "whatis - Busca de documentao"
.RI whatis: string
.PP
Este esquema busca no banco de dados de descries curtas (de uma linha) de comandos
e retorna uma lista de descries contendo aquela string.
Somente encontros de palavras completas so retornados.
Veja
.BR whatis (1).
Este esquema de URI nico para sistemas do tipo Unix (tais como o Linux)
e no registrado correntemente pelo IETF.
.SS "ghelp - documentao de ajuda do GNOME"
.RI ghelp: nome-da-aplicao
.PP
Isto carrega a ajuda do GNOME para a aplicao dada.
Note que no existe muita documentao correntemente neste formato.
.SS "ldap - Lightweight Directory Access Protocol (Protocolo Leve de Acesso a Diretrios)"
.RI ldap:// hostport
.br
.RI ldap:// hostport /
.br
.RI ldap:// hostport / dn
.br
.RI ldap:// hostport / dn ? attributos
.br
.RI ldap:// hostport / dn ? attributos ? escopo
.br
.RI ldap:// hostport / dn ? atributos ? escopo ? filtro
.br
.RI ldap:// hostport / dn ? atributos ? escopo ? filtro ? extenses
.PP
Este esquema suporta pesquisas no
Protocolo Leve de Acesso a Diretrios (LDAP), um protocolo para pesquisa
de um conjunto de servidores para informaes organizadas hierarquicamente
(tal como recursos pessoais e computacionais).
Mais informaes sobre o esquema de URL do LDAP esto disponveis em
.UR http://www.ietf.org/rfc/rfc2255.txt
RFC 2255.
.UE
Os componentes desta URL so:
.IP hostport 12
o servidor LDAP a se pesquisar, escrito como um nome de host, seguido opcionalmente por
dois-pontos e a nmero de porta.
O padro de porta LDAP a porta TCP 389.
Se vazio, o cliente determina qual o servidor usar.
.IP dn
o Nome Distinto do LDAP, que identifica
o objeto-base da busca LDAP (veja
.UR http://www.ietf.org/rfc/rfc2253.txt
RFC 2253
.UE
seo 3).
.IP atributos
uma lista de atributos, separados por vrgulas, a serem retornados;
veja a RFC 2251, seo 4.1.5. Se omitido, todos os atributos devem ser retornados.
.IP scope
especifica o escopo da busca, que pode ser uma da
"base" (para uma busca de objeto-base), "um" (para uma busca de um nvel),
ou "sub" (para uma busca em sub-rvores). Se o escopo omitido, "base" assumido.
.IP filtro
especifica o filtro de busca (subconjunto de entradas a serem
retornadas). Se omitido, todas as entradas devem ser retornadas.
Veja
.UR http://www.ietf.org/rfc/rfc2254.txt
RFC 2254
.UE
seo 4.
.IP extenses
uma lista, separada por vrgulas, de pares tipo=valor,
onde a poro =valor pode ser omitida para opes
que no a requerem. Uma extenso prefixada com um '!' crtica
(deve ser suportada para ser vlida), caso contrrio no-crtica (opcional).
.PP
Pesquisas LDAP so as mais fceis de explicar com exemplos.
Aqui est uma pesquisa que pede ao ldap.itd.umich.edu informaes sobre
a Universidade de Michigan, nos E.U.A.:
.RS
ldap://ldap.itd.umich.edu/o=University%20of%20Michigan,c=US
.RE
.PP
Para obter apenas seu atributo de endereo postal, pea:
.RS
ldap://ldap.itd.umich.edu/o=University%20of%20Michigan,c=US?postalAddress
.RE
.PP
Para pedir a um host.com porta 6666 por informaes sobre a pessoa
com nome comum (cn) "Babs Jensen" na Universidade de Michigan, pea:
.RS
ldap://host.com:6666/o=University%20of%20Michigan,c=US??sub?(cn=Babs%20Jensen)
.RE
.SS "wais - Servidores de Informao de Grande rea (Wide Area Information Server)"
.RI wais:// hostport / database
.br
.RI wais:// hostport / database ? search
.br
.RI wais:// hostport / database / wtype / wpath
.PP
Este esquema designa um banco de dados WAIS, uma busca, ou um documento
(veja
.UR http://www.ietf.org/rfc/rfc1625.txt
IETF RFC 1625
.UE
para mais informaes sobre WAIS).
Hostport o nome do host, opcionalmente seguido por dois-pontos e um nmero de porta
(o nmero de porta padro 210).
.PP
O primeiro formato designa um banco de dados WAIS para busca.
O segundo formato desgina uma busca particular do banco de dados WAIS
.IR database .
O terceiro formato desgina um documento particular dentro de um banco de
dados WAIS a ser recuperado.
.I wtype
a desginao WAIS do tipo de objeto e
.I wpath
o identificador de documento WAIS.
.SS "outros esquemas"
H muitos outros esquemas URI.
Muitas ferramentas que aceitam URIs suportam um conjunto de URIs internos
(por exemplo, o Mozilla tem o esquema "about:" para informao interna,
e o browser de ajuda do GNOME tem o esquema "toc:" para vrios locais
de incio).
H muitos esquemas que foram definidos mas no so
usados largamente na atualidade
(por exemplo, prospero).
O esquema "nntp:" se tornou obsoleto em favor do esquema "news:".
As URNs devem ser suportadas pelo esquema "urn:", com um espao de nomes hierrquico
(por exemplo, urn:ietf:... identificaria documentos IETF); atualmente
as URNs no so implementadas largamente.
Nem todas as ferramentas suportam todos os esquemas.
.SH CODIFICAO DOS CARACTERES
.PP
As URIs tm um nmero limitado de caracteres, de forma que elas podem ser
digitadas e usadas em uma variedade de situaes.
.PP
Os seguintes caracteres so reservados, isto , eles podem aparecer em uma
URI mas seu uso se limita ao seu propsito reservado
(dados conflitantes precisam usar o caractere de escape antes de formar a URI):
.IP
; / ? : @ & = + $ ,
.PP
Caracteres no-reservados podem ser includos em uma URI.
Caracteres no-reservados
incluem letras latinas maisculas e minsculas,
dgitos decimais, e o seguinte conjunto
limitado de caracteres de pontuao e smbolos:
.IP
- _ . ! ~ * ' ( )
.PP
Todos os outros caracteres devem ter o caractere de escape.
Um octeto com escape codificado como um trio de caracteres, consistindo de um
caractere de porcentagem "%" seguido por dois dgitos hexadecimais
representando o cdigo do octeto (voc pode usar letras maisculas e minsculas
para dgitos hexadecimais). Por exemplo, um espao em branco precisa ter o escape
"%20", um caractere de tabulao "%09", e o "&" "%26".
Como o caractere de porcentagem "%" sempre tem o propsito reservado
de ser o indicador de escape, ele deve ter o escape "%25".
prtica comum usar como escape para o espao em branco um sinal de mais (+)
em textos de pesquisa; esta prtica no definida uniformemente
nas RFCs relevantes (que recomendam %20 em seu lugar), mas qualquer ferramenta
que aceita URIs com textos de pesquisa devem estar preparadas para isto.
Uma URI sempre mostrada na sua forma "escapada".
.PP
Caracteres no-reservados podem ser escapados sem mudana da semntica
da URI, mas isto no deve ser feito a menos que o URI esteja sendo usada
em um contexto que no permita que apaream caracteres sem escape.
Por exemplo, "%7e" usado s vezes em lugar de "~" em um caminho de diretrio
de URL do http, mas os dois so equivalentes.
.PP
No momento em que este escrito, no h nenhum padro sobre como manipular
caracteres no-ASCII em URIs arbitrrias.
A especificao HTML 4.0, seo B.2, recomenda o seguinte, que deve ser
considerado a melhor opo atualmente disponvel:
.IP 1. 4
Representa cada caractere no-ASCII em UTF-8.
.IP 2.
O escape daqueles bytes com o mecanismo de escape de URIs, isto ,
a converso de cada byte para %HH, onde HH a notao hexadecimal
do valor do byte.
.SH ESCREVENDO UMA URI
Quando escritas, as URIs devem ser colocadas dentro de aspas
(por exemplo, "http://www.kernelnotes.org"),
englobadas por sinais de "maior que" e "menor que" (por exemplo, <http://lwn.net>),
ou colocadas em uma linha separada.
Um alerta para aqueles que usam aspas:
.B nunca
mova a pontuao externa (tais como um ponto final terminando a sentena
ou uma vrgula em uma lista)
dentro de uma URI, pois isto mudar o valor da URI.
Em vez disso, use sinais de "maior que" e "menor que", ou
acione um sistema de aspas que nunca inclua caracteres externos
dentro das aspas.
Este sistema antigo, chamado de sistema de aspas 'novo' ou 'lgico'
pelas "Regras de Hart" e pelo "Dicionrio Oxford para Escritores e Editores",
a prtica preferida na Gr-Bretanha e por hackers em todo o mundo
(veja a seo do arquivo de jarges
.UR http://www.fwi.uva.nl/~mes/jargon/h/HackerWritingStyle.html
sobre Estilo de Escrita Hacker
.UE
para mais informaes).
Outros documentos sugerem a insero do prefixo "URL:"
no incio da URI, mas esta forma nunca foi abraada.
.PP
A sintaxe de URI foi projetada para no ser ambgua.
Porm, como as URIs se tornaram comuns, a mdia tradicional
(televiso, rdio, jornais, revistas, etc.) tem usado cada vez mais
referncias de URIs abreviadas, consistindo
somente nas pores da autoridade e do caminho do recurso identificado
(por exemplo, <www.w3.org/Addressing>).
Tais referncias pretendem primariamente
facilitar a interpretao humana em lugar da mquina,
assumindo que a heurstica baseada em contexto suficiente para completar
a URI (por exemplo, nomes de hosts que comeam com "www" deveriam ter
um prefixo de URI igual a "http://", e nomes de hosts comeando com "ftp"
deveriam ter o prefixo "ftp://").
Muitas implementaes de clientes resolvem heuristicamente estas referncias.
Tais heursticas podem
mudar com o tempo, particularmente quando novos esquemas forem introduzidos.
Como URIs abreviadas tm a mesma sintaxe que um caminho de URL relativo,
referncias a URIs abreviadas no podem ser usadas onde URIs relativas so
permitidas, e s podem ser usadas quando no h base definida
(como em caixas de dilogo).
No use URIs abreviadas como links de hipertexto dentro de um documento;
use o formato padro descrito acima.
.SH NOTAS
Qualquer ferramenta que aceite URIs (por exemplo, um browser) em um sistema Linux deve
ser capaz de manipular (diretamente ou indiretamente) todos os esquemas descritos aqui,
incluindo os esquemas "man:" e "info:".
A manipulao deles pela invocao de algum outro programa bom e de fato encorajado.
.PP
Tecnicamente, o fragmento no parte da URI.
.PP
Para informaes sobre como embutir URIs (incluindo URLs) em um formato de
dados, veja a documentao naquele formato.
O HTML usa o formato <AHREF="\fIuri\fP">
.I texto
</A>.
Arquivos do texinfo usam o formato @uref{\fIuri\fP}.
Man e mdoc tm a macro UR recm-adicionada, ou apenas incluem a URI
no texto (visualizadores devem ser capazes de detectar :// como parte de uma URI).
.PP
Os ambientes de desktop GNOME e KDE variam atualmente sobre as URIs que eles aceitam,
em particular nos seus respectivos browsers de ajuda.
Para listar pginas de manual, o GNOME usa <toc:man> enquanto o KDE usa <man:(ndice)>, e
para listar pginas "info", o GNOME usa <toc:info> enquanto o KDE usa <info:(dir)>
(o autor desta pgina de manual prefere a aproximao do KDE aqui, mas um formato mais
regular seria realmente melhor).
Em geral, o KDE usa <file:/cgi-bin/> como um prefixo para um conjunto de arquivos
gerados.
O KDE prefere documentao em HTML, acessada via
<file:/cgi-bin/helpindex>.
O GNOME prefere o esquema ghelp para armazenar e procurar documentao.
Nenhum browser manipula referncias "file:" a diretrios no momento em que este texto
foi escrito, tornando-se difcil referir-se a um diretrio completo com um URI compatvel com um
browser.
Como se nota acima, esses ambientes diferem na forma como manipulam o esquema "info:",
provavelmente a variao mais importante.
Espera-se que o GNOME e o KDE
iro convergir para formatos URI comuns, e uma futura
verso desta pgina de manual descrever o resultado convergido.
Esforos para ajudar nessa convergncia so encorajados.
.SH SEGURANA
.PP
Uma URI no posa, por si mesma, com uma ameaa segurana.
No h uma garantia geral de que uma URL, localizada em certo momento em
um recurso dado, continuar ali. Nem h qualquer
garantia de que uma URL no localizar um recurso diferente em algum lugar do
passado; tal garantia s pode ser
obtida da(s) pessoa(s) que controlam aquele espao de
nomes e o recurso em questo.
.PP
Algumas vezes possvel construir uma URL de forma que uma tentativa de
realizar uma operao aparentemente inofensiva, como a
recuperao de uma entidade associada ao recurso, provoque a ocorrncia
de uma operao remota possivelmente danosa. A URL insegura
construda tipicamente atravs da especificao de um nmero de porta diferente daquela
reservada para o protocolo de rede em questo. O cliente
inconscientemente contacta um site que est, na verdade, rodando um protocolo
diferente. O contedo da URL contm instrues que, quando
interpretada de acordo com este outro protocolo, causa uma operao
inesperada. Um exemplo foi o uso de uma URL gopher para produzir uma mensagem
no pretendida ou sem identificao, que fosse enviada atravs de um servidor SMTP.
.PP
Deve-se tomar cuidado no uso de qualquer URL que especifique um nmero de
porta diferente do padro para o protocolo, especialmente quando um
nmero do espao reservado.
.PP
Deve-se tomar cuidado para que, quando uma URI contenha delimitadores com
caracteres de escape para um dado protocolo (por exemplo, caracteres CR e LF para protocolos
telnet), esses no percam os escapes antes da transmisso. Isto
pode violar o protocolo, mas evita o possibilidade de que esses
caracteres sejam usados para simular uma operao extra ou parmetros naquele
protocolo, o que pode fazer uma operao inesperada e
possivelmente perigosa ser realizada.
.PP
claramente uma tolice usar uma URI que contm uma senha, que
pretende-se que seja secreta. Em particular, o uso de uma senha dentro do
componente 'userinfo' de uma URI fortemente no recomendada, exceto
naqueles casos raros em que o parmetro 'senha' pretende ser pblica.
.SH "DE ACORDO COM"
.PP
.UR http://www.ietf.org/rfc/rfc2396.txt
IETF RFC 2396,
.UE
.UR http://www.w3.org/TR/REC-html40
HTML 4.0.
.UE
.SH PROBLEMAS
.PP
A documentao pode ser colocada em uma variedade de locais, tal que
no h atualmente um bom esquema URI para documentao online geral em
formatos arbitrrios.
Referncias no formato
<file:///usr/doc/ZZZ> no funcionam porque distribuies diferentes e
requisitos de instalao local podem colocar os arquivos em diretrios
diferentes
(pode ser em /usr/doc, /usr/local/doc, /usr/share, ou em qualquer outro lugar).
Tambm, o diretrio ZZZ geralmente muda quando uma verso muda
(apesar de que o englobamento do nome do arquivo poderia cobrir isso).
Finalmente, o uso do esquema "file:" no d suporte facilmente s pessoas que carregam
documentao dinamicamente da Internet (em vez de carregar os arquivos
para um sistema de arquivos local).
Um esquema URI futuro pode ser acrescentado (por exemplo, "userdoc:") para permitir
que programas incluam referncias cruzadas a uma documentao mais detalhada, sem
ter que saber o local exato daquela documentao.
Alternativamene, uma verso futura da especificao de sistema de arquivo pode
especificar locais de arquivos suficientemente, de forma que o esquema "file:" ser
capaz de localizar documentao.
.PP
Muitos programas e formatos de arquivos no incluem um meio de incorporar
ou implementar links usando URIs.
.PP
Muitos programas no conseguem manipular todos esses diferentes formatos de URIs; deveria
haver um mecanismo padro para carregar uma URI arbitrria que detectasse
automaticamente o ambiente do usurio (por exemplo, texto ou grfico, ambiente de desktop,
preferncias do usurio local, e ferramentas em execuo atualmente) e invocasse a
ferramenta correta para qualquer URI.
.SH AUTOR
David A. Wheeler (dwheeler@ida.org) escreveu esta pgina de manual.
.SH "VEJA TAMBM"
.BR lynx (1),
.BR mailaddr (7),
.BR utf-8 (7),
.BR man2html (1),
.UR http://www.ietf.org/rfc/rfc2255.txt
IETF RFC 2255.
.UE
.SH TRADUZIDO POR LDP-BR em 21/08/2000.
\&\fR\&\f(CWRubens de Jesus Nogueira <darkseid99@usa.net> (traduo)\fR
\&\fR\&\f(CWAndr L. Fassone Canova <lonelywolf@blv.com.br> (reviso)\fR
|