HTML URL编码

  • HTML URL

    URL(Uniform Resource Locator)统一资源定位器。可以由域名(cainiaoya.com)组成,也可以由ip(192.168.0.28)组成。大多数人在上网时输入的是域名,因为名字比数字更容易记住。Web浏览器使用URL从Web服务器请求页面。统一资源定位符(URL)用于寻址Web上的HTML文档(或其他数据)。像 https://www.cainiaoya.com/index.php这样的网址遵循以下语法规则:

    协议://前缀.域:端口/路径/文件名

    说明

    • 协议 - 定义Internet服务的类型(最常见的是http或https,ftp,ssh)
    • 前缀 - 定义域前缀(http的默认值为www)
    • 域 - 定义Internet域名(如cainiaoya.com)
    • 端口 - 定义主机上的端口号(http的默认值为80)
    • 路径 - 在服务器上定义路径(如果省略:站点的根目录)
    • 文件名 - 定义文档或资源的名称
  • 常见的URL方案

    下表列出了一些常见方案:

    协议 全称 用处
    http HyperText Transfer Protocol 未加密的web页面
    https Secure HyperText Transfer Protocol 加密过的,安全的Web页面
    ftp File Transfer Protocol 上传或下载文件
    file 位于服务器上的文件
  • 网址编码

    只能使用ASCII字符集通过Internet发送URL 。如果URL包含ASCII集之外的字符,则必须转换URL。
    URL编码将非ASCII字符转换为可以通过Internet传输的格式。
    URL编码使用“%”后跟十六进制数字替换非ASCII字符。
    网址不能包含空格。URL编码通常用加号(+)或%20替换空格。

    如果单击“提交”,浏览器将在输入发送到服务器之前对输入进行URL编码。
    服务器上的页面将显示收到的输入。
    尝试其他输入,然后再次单击“提交”。

  • ASCII编码示例

    您的浏览器将根据页面中使用的字符集对输入进行编码。HTML5中的默认字符集是UTF-8。

    这里列举一下字符的例子:

    字符 来自 Windows-1252 来自 UTF-8
    %80 %E2%82%AC
    £ %A3 %C2%A3
    © %A9 %C2%A9
    ® %AE %C2%AE
    À %C0 %C3%80
    Á %C1 %C3%81
    Â %C2 %C3%82
    Ã %C3 %C3%83
    Ä %C4 %C3%84
    Å %C5 %C3%85