Python - HTTP 响应

  • 简述

    http 或超文本传输协议适用于客户端服务器模型。通常,Web 浏览器是客户端,而托管网站的计算机是服务器。在收到来自客户端的请求后,服务器会生成响应并以特定格式将其发送回客户端。
    在接收并解释请求消息后,服务器以 HTTP 响应消息进行响应:
    
       A Status-line
       Zero or more header (General|Response|Entity) fields followed by CRLF
       An empty line (i.e., a line with nothing preceding the CRLF) indicating the end of the header fields
       Optionally a message-body
    
    以下部分解释了 HTTP 响应消息中使用的每个实体。
  • 消息状态行

    状态行由协议版本和数字状态代码及其相关的文本短语组成。元素由空格 SP 字符分隔。
    
    Status-Line = HTTP-Version SP Status-Code SP Reason-Phrase CRLF
    
  • HTTP 版本

    支持 HTTP 版本 1.1 的服务器将返回以下版本信息:
    
    HTTP-Version = HTTP/1.1
    
  • 状态码

    Status-Code 元素是一个 3 位整数,其中 Status-Code 的第一个数字定义响应的类别,最后两个数字没有任何分类作用。第一个数字有 5 个值:
    序列号 代码和说明
    1 1xx: Informational
    这意味着已收到请求并且该过程正在继续。
    2 2xx: Success
    这意味着该操作已成功接收、理解和接受。
    3 3xx: Redirection
    这意味着必须采取进一步行动才能完成请求。
    4 4xx: Client Error
    这意味着请求包含不正确的语法或无法完成。
    5 5xx: Server Error
    这意味着服务器未能满足明显有效的请求。
    HTTP 状态码是可扩展的,并且 HTTP 应用程序不需要理解所有注册状态码的含义。
  • 使用 Python 请求

    在下面的 python 程序中,我们使用 urllib3 模块发出一个 http GET 请求并接收包含数据的响应。它还提供响应代码,该代码也由模块中的函数管理。PoolManager 对象处理连接池的所有细节并处理线程安全。
    
    import urllib3
    http = urllib3.PoolManager()
    resp = http.request('GET', 'http://cainiaoya.com/robots.txt')
    print resp.data
    # get the status of the response
    print resp.status
    
    当我们运行上述程序时,我们得到以下输出 -
    
    User-agent: *
    Disallow: /tmp
    Disallow: /logs
    Disallow: /rate/*
    Disallow: /cgi-bin/*
    Disallow: /videotutorials/video_course_view.php?*
    Disallow: /videotutorials/course_view.php?*
    Disallow: /videos/*
    Disallow: /*/*_question_bank/*
    Disallow: //*/*/*/*/src/*
    200