一、入门
1、引导
(1)Django是什么?
简单来说:是一个web框架(也便是web项目:前端访问后端代码,使后端代码返回一个页面,浏览器渲染出),也就是已写好的基础框架,方便在其进行扩充再深入说:所有的web应用本质上是一个socket服务器,而用户的浏览器就是一个socket客户端,基于请求做出响应,客户先做出请求,服务端做出对应的响应,按照http协议或https协议发送请求,服务端按照相对应的协议响应请求,这样的网络通信,可以实现web框架学习框架之前还是先引入HTTP协议~
(2)HTTP协议
*介绍:超文本传输协议(HyperText Transfer Peotocol,缩写:HTTP)是一种用于分布式、协作式和超媒体信息系统的应用层协议。HTTP是万维网的数据通信的基础。*概述:HTTP是一个客户端终端(用户)和服务器端(网站)请求和应答的标准(TCP) 。通过使用网页浏览器、网络爬虫或者其它的工具,客户端发起一个HTTP请求到服务器上指定端口(默认端口为80) 。我们称这个客户端为用户代理程序(user agent)。应答的服务器上存储着一些资源, 比如HTML文件和图像。我们称这个应答服务器为源服务器(origin server)。在用户代理和源服务器中间可能存在多个“中间层”,比如代理服务器、网关或者隧道(tunnel) 。尽管TCP/IP协议是互联网上最流行的应用,HTTP协议中,并没有规定必须使用它或它支持的层。事实上,HTTP可以在任何互联网!协议上,或其他网络上实现。HTTP假定其下层协议提供可靠的传输。因此,任何能够提供这种保证的协议都可以被其使用。因此也就是其在TCP/IP协议族使用TCP作为其传输层。通常,由HTTP客户端发起-个请求,创建一个到服务器指定端口(默认是80端口) 的TCP连接。HTTP服务 器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如\"HTTP/1.1 200 OK\",以及返回的内容,如请求的文件、错误消息、或者其它信息。*工作原理:HTTP协议定义Web客户端如何从Web服务器请求Web页面,以及服务器如何把Web页面传送给客户端。HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求报文, 请求报文包含请求的方法、URL、 协议版本、请求头部和请求数据。服务器以一个状态行作为响应,响应的内容包括协议的版本、成功或者错误代码、服务器信息、响应头部和响应数据。*以下是HTTP请求/响应的步骤:1.客户端连接到Web服务器-个HTTP客户端,通常是浏览器,与Web服务器的HTTP端口(默认为80) 建立-一个TCP套接字连接。例如,http://www.3xnb.com2.发送HTTP请求通过TCP套接字,客户端向Web服务器发送一个文本的请求报文, -个请求报文由请求行、请求头部、空行和请求数据4部分组成。3.服务器接受请求并返回HTTP响应Web服务器解析请求,定位请求资源。服务器将资源复本写到TCP套接字,由客户端读取。一个响应由状态行、响应头部、空行和响应数据4部分组成。4.释放连接TCP连接若connection模式为close,则服务器主动关闭TCP连接,客户端被动关闭连接,释放TCP连接若connection模式为keepalive,则该连接会保持一段时间, 在该时间内可以继续接收请求;5.客户端浏览器解析HTML内容客户端浏览器首先解析状态行,查看表明请求是否成功的状态代码。然后解析每个响应头,响应头告知以下为若干字节的HTML文档和文档的字符集。客户端浏览器读取响应数据HTML,根据HTML的语法对其进行格式化,并在浏览器窗口中显示。
HTTP请求方法
HTTP/1.1协议中共定义了八种方法(也叫“动作\")来以不同方式操作指定的资源:GET:向指定的资源发出“显示请求。使用GET方法应该只用在读取数据,而不应当被用于产生副作用”的操作中,例如在Web Application中。其中一个原因是GET可能会被网络蜘蛛等随意访问。HEAD:与GET方法一-样,都是向服务器发出指定资源的请求。只不过服务器将不传回资源的本文部分。它的好处在于,使用这个方法可以在不必传输全部内容的情况下,就可以获取其中“关于该资源的信息”(元信息或称元数据)。POST:向指定资源提交数据,请求服务器进行处理(例如提交表单或者上传文件)。数据被包含在请求本文中。这个请求可能会创建新的资源或修改现有资源,或二者皆有。PUT:向指定资源位置上传其最新内容。DELETE:请求服务器删除Request-URI所标识的资源。TRACE:回显服务器收到的请求,主要用于测试或诊断。OPTIONS:这个方法可使服务器传回该资源所支持的所有HTTP请求方法。用\'*\'来代替资源名称,向Web服务器发送OPTIONS请求,可以测试服务器功能是否正常运作。CONNECT:HTTP/1.1协议中预留给能够将连接改为管道方式的代理服务器。通常用于SSL加密服务器的链接(经由非加密的HTTP代理服务器)。
上下文附带请求和响应报文图片:
HTTP状态码
所有HTTP响应的第一行都是状态行,依次是当前HTTP版本号,3位数字组成的状态代码,以及描述状态的短语,彼此由空格分隔。状态代码的第一个数字代表当前响应的类型:●1xx消息-- 请求已被服务器接收,继续处理●2xx成功-- 请求已成功被服务器接收、 理解、并接受●3x重定向-- 需要后续操作才能完成这一请求●4xx请求错误-- 请求含有词法错误或者无法被执行●5xx服务器错误-- 服务器在处理某个正确请求时发生错误
URL
超文本传输协议(HTTP)的统一资源定位符将从因特网获取信息的五个基本元素包括在一个简单的地址中:传送协议。层级URL标记符号(为[//],固定不变)访问资源需要的凭证信息(可省略)服务器。(通常为域名,有时为IP地址)端口号。(以数字方式表示,若为HTTP的默认值“:80”可省略)路径。(以“/”字符区别路径中的每一个目录名称)查询。(GET模式的窗体参数,以“?”字符为起点,每个参数以“&”隔开,再以“=”分开参数名称与数据,通常以UTF8的URL编码,避开字符冲突的问题)片段。以“#”字符为起点以http://www.luffycity.com:80/news/index.html?id=250&page=1 为例, 其中:http,是协议;www.luffycity.com,是服务器;80,是服务器上的默认网络端口号,默认不显示;/news/index.html,是路径(URI:直接定位到对应的资源);?id=250&page=1,是查询。大多数网页浏览器不要求用户输入网页中“http://”的部分,因为绝大多数网页内容是超文本传输协议文件。同样,“80”是超文本传输协议文件的常用端口号,因此一般也不必写明。一般来说用户只要键入统一资源定位符的一部分(www.luffycity.com:80/news/index.html?id=250&page=1)就可以了。由于超文本传输协议允许服务器将浏览器重定向到另一个网页地址,因此许多服务器允许用户省略网页地址中的部分,比如 www。从技术上来说这样省略后的网页地址实际上是一个不同的网页地址,浏览器本身无法决定这个新地址是否通,服务器必须完成重定向的任务。
get、post 例子
前端请求<!DOCTYPE html><html><head><meta charset=\"utf8\" version=\'1\'/></head><body><form action=\"http://127.0.0.2:8000\" method=\"post\">用户名:<input type=\"text\" name=\"username\">密码:<input type=\"text\" name=\"password\"><input type=\"submit\"></form></body>
服务器import socketserver=socket.socket()ip_port=(\'127.0.0.2\',8000)server.bind(ip_port)server.listen()while 1:conn,addr=server.accept()str=conn.recv(1024)print(str.decode(\'utf-8\'))with open(\'jd_post.html\',\'rb\') as f:data=f.read()conn.send(data)conn.close()后端数据<!DOCTYPE html><html><head><meta charset=\"utf8\" version=\'1\'/></head><body><p>你好世界!</p></body>
爬京东页面import requestsset=requests.post(\"https://www.jd.com/\")with open(\"jd_post.html\",\'w\',encoding=\'utf-8\') as f:f.write(set.text)