如何正确认识 HTTP(如何正确认识伟大建党精神的时代价值与实践要求?)
haoteby 2025-03-25 13:22 9 浏览
HTTP(HyperText Transfer Protocol)是超文本传输协议。它是应用层协议,同其他应用层协议一样,是为了实现某一类具体应用的协议,并由某一运行在用户空间的应用程序来实现其功能。 HTTP 是一种协议规范,这种规范记录在文档上,为真正通过 HTTP 进行通信的 HTTP 的实现程序。
HTTP 包含命令和传输信息,不仅可用于Web 访问,也可用于其他因特网,内联网应用系统之间的通信,从而实现各类应用资源超媒体访问的集成。
HTTP 也是一个客户端、服务器端请求和应答的标准(TCP)。客户端是终端用户,服务器端 是网站。通过使用 Web 浏览器、网络爬虫或其他工具,客户端发起一个到服务器上指定端口(默 认端口为 80)的 HTTP 请求。当在浏览器的地址框中输入一个 URL 或是单击一个超级链接时, URL 就确定了要浏览的地址。浏览器通过超文本传输协议(HTTP),将 Web 服务器上站点的网页 代码提取出来,并翻译成漂亮的网页。
HTTP 是基于客户 / 服务器模式,且面向连接的。HTTP 定义了 Web 客户端如何从 Web 服务器 请求 Web 页面,以及服务器如何把 Web 页面传送给客户端。HTTP 采用了请求 / 响应模型。客户 端向服务器发送一个请求,请求中包含请求的方法、URL、协议版本、请求头部和请求数据。服 务器以一个状态行作为响应,响应的内容包括协议的版本、成功或错误代码、服务器信息、响应 头部和响应数据。
典型的 HTTP 请求 / 响应的处理步骤如下:
(1)客户端与 Web 服务器建立连接:一个 HTTP 客户端,通常是浏览器,与 Web 服务器的 HTTP 端口(默认为 80)建立一个 TCP 连接。例如,https://www.baidu.com。
(2)客户端向 Web 服务器发送 HTTP 请求:通过 TCP 连接,客户端向 Web 服务器发送一个 文本的请求,该请求头由请求行、请求头部、空行和请求数据四部分组成。
(3)Web 服务器接收请求并返回相应的文件作为应答:Web 服务器解析请求,定位请求资源。 服务器将资源复本写到 TCP,由客户端读取。一个响应头由状态行、响应头部、空行和响应数据 四部分组成。
(4)客户端与 Web 服务器关闭连接:如果 connection 模式为 close,则服务器主动关闭 TCP 连 接,客户端被动关闭连接,释放 TCP 连接;如果 connection 模式为 keep-alive,则该连接会保持一 段时间,在该时间内可以继续接收请求。 (5)客户端浏览器解析 HTML 内容:客户端浏览器首先解析状态行,查看请求是否成功的状 态代码。然后解析每一个响应头,客户端浏览器读取响应数据 HTML,根据 HTML 的语法对其进 行格式化,并在浏览器窗口中显示。
HTTP/1.1 中共定义了 8 种方法来以不同方式操作指定的资源。GET 和 POST 是最常见的 HTTP 方法。此外,还包括 DELETE、HEAD、OPTIONS、PUT、TRACE 和 CONNECT 方法。 这里介绍一下常用的 HTTP 方法,其对爬取网页有很大的作用。
(1)GET 请求方式:使用 GET 方法时,请求参数和对应的值附加在 URL 后面,利用一个“?” 11 Scrapy 网络爬虫知识介绍 第 2 章 代表 URL 的结尾及附带参数的开始,参数用 key=value 键值对的方式书写,参数和参数之间用“&” 符号隔开。一般 GET 请求参数的大小受限,最大不超过 1024。由于参数明文地显示在了 URL 上面, 因此不太适合传递私密的数据。
(2)POST请求方式:POST方法将请求参数封装在HTTP请求的请求体中,以名称/值的形式出现, 可以传输大量的数据,在 URL 中看不到具体的请求数据,比较安全,适合数据量大的数据发送。 POST 请求一般用于表单数据的提交或上传文件。
HTTP 状态码由 3 个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个十进制 数字没有分类的作用。HTTP 状态码表示请求是否被理解或被满足。HTTP 状态码共分为 5 种类型:
(1)1xx :信息性状态码,表示接收的请求正在处理。
(2)2xx :成功状态码,表示请求已被成功地接收并处理。
(3)3xx :重定向状态码,表示需要进行附加操作才能完成请求。
(4)4xx :客户端错误状态码,表示请求有语法错误或请求无法实现
(5)5xx :服务器错误状态码,表示服务器在处理请求的过程中发生了错误。
下面是常见的 HTTP 状态码:
(1)200 :客户端请求成功。
(2)301 :永久性重定向。该状态码表示请求的资源已被分配了新的 URL,以后应使用资源 现在所指的 URL。
(3)303 :该状态码表示由于请求对应的资源存在着另一个 URL,应使用 GET 方法定向获取 请求的资源。
(4)400 :服务器未能理解请求。
(5)403 :对被请求页面的访问被禁止。
(6)404 :服务器无法找到被请求的页面。
(7)500 :服务器发生不可预期的错误,即内部服务器错误。
(8)503 :请求未完成。服务器临时过载或宕机,不能处理客户端的请求。一段时间后可能会 恢复正常。
相关推荐
- Python爬虫进阶教程(二):线程、协程
-
简介线程线程也叫轻量级进程,它是一个基本的CPU执行单元,也是程序执行过程中的最小单元,由线程ID、程序计数器、寄存器集合和堆栈共同组成。线程的引入减小了程序并发执行时的开销,提高了操作系统的并发性能...
- A320-V2500发动机系统FADEC介绍(2)
-
目的全权数字发动机控制(FADEC)系统在所有飞行和运行阶段提供全范围发动机控制。...
- 三国志战棋版:玩家“二叔”用这套群DOT在比武中拿下31胜5负
-
声明:本文首发于今日头条,而后发布于“鼎叔闯三棋”的微信公众号、抖音、哔哩哔哩和小红书平台,如果在其他平台就是抄袭。...
- 真正的独一无二:Dot One 推出 DNA 定制系列 139英镑起
-
相信很多人在挑选衣物时有着这样的困扰,综合了性价比、面料等因素后好不容易找到了心仪的款式,还要担心是否会撞衫,不管是擦肩而过的陌生人还是身边的熟人,都令人尴尬。小部分人为此热衷于购买少量的古着或者限量...
- 崩铁:周年庆福利再升级,老角色加强时间确定,3.xdot体系反转
-
#埃安UT大一圈高级很多#...
- Dotgo推出RBMHub,扩大了CPaaS提供商的覆盖范围和功能
-
据telecompaper网7月15日报道,用于商业消息传递的RichCommunicationServices(RCS)解决方案的领先提供商Dotgo宣布推出RBMHub。RBMHub的推出扩大了C...
- 深度解析:快照取消Dot职业的将何去何从
-
写在前面曾几何时,术士的出现便被冠以dot大师的名头,从远古时期的献祭腐蚀虹吸不如暗牧一个痛,到TBC上满dot=荣誉击杀+1,到wlk接近全暴击的冰晶腐蚀,再到CTM就算了吧MOP的各种变态吸x放...
- 星穹铁道:抽卡芙卡之前,你必须了解什么是dot!
-
卡妈终于上线了,可还是有很多人不明白什么是dot伤害,抽了卡妈直接玩起了直伤流,把一个持续伤害的引爆器玩成了打手,卡妈打dot伤害是远高于直伤的,有了卡妈的玩家一直了解dot,不然这卡妈就真被玩成四不...
- 游戏界的闪耀星辰陨落:悼念知名游戏博主″dotα牛娃″
-
无尽哀思!在数字时代浪潮中,游戏不仅是消遣娱乐的代名词,更是连接心灵的桥梁,构筑了无数人的青春回忆。在这片浩瀚无垠的游戏宇宙中,有这样一位博主,他以独特的风采、深邃的洞察力和无尽的热情,成为了玩家心中...
- 直击2017新加坡同性恋聚会Pink Dot,自由爱!
-
今年的“粉红点”又来啦~这个支持LGBT群体(男女同志、双性恋、跨性别等)群体的活动,从2009年起,已经在新加坡举办8年了!”这个非营利的同性恋权益活动,主要是希望大家了解到,不管一个人的性倾向或...
- python-dotenv,一款超级实用处理环境变量python库
-
python-dotenv,一款超级实用处理环境变量python库python-dotenv概述:...
- 亚马逊语音助手毫无征兆发笑 诡异至极吓坏用户
-
来源:新华网美国电商亚马逊7日承诺,将更改名下“亚历克萨”语音系统设置,令它不会莫名发笑,免得吓坏用户。“亚历克萨”是亚马逊开发的语音助手软件,可服从用户语音指令完成对话、播放音乐等任务。依照原来设计...
- 2022最火英文网名男女生
-
精选好听英文昵称带翻译1.moveon(离开)2.Monster(怪物)3.Solo吉他手4.Finish.(散场)...
- 智能家具 RecycleDot 的出现给传统家具厂商带来新的挑战
-
从可穿戴手环、手表到智能衣服,智能硬件逐步渗透到每一个领域。最近有一对父子MikeSandru和JohnSandru在自家的车库中设计了一款智能家具RecycleDot,给日渐萧条的家具行...
- 欧洲通信卫星公司 OneWeb 敦促印度DoT尽早批准提供卫星宽带服务
-
据telecomtalk2月17日报道,欧洲通信卫星公司EutelsatOneWeb近日敦促印度电信部(DoT)尽快批准其在印度部署双地球站网关的计划,以便连接其近地轨道(LEO)全球卫星星座,并...