摘要：Web框架本质什么是Web框架, 如何自己搭建一个简易的Web框架?其实, 只要了解了HTTP协议, 这些问题将引刃而解. 简单的理解: 所有的Web应用本质上就

Web框架本质

什么是Web框架, 如何自己搭建一个简易的Web框架?其实, 只要了解了HTTP协议, 这些问题将引刃而解.

简单的理解: 所有的Web应用本质上就是一个socket服务端, 而用户的浏览器就是一个socket客户端.

用户在浏览器的地址栏输入网址, 敲下回车键便会给服务端发送数据, 这个数据是要遵守统一的规则(格式)的, 这个规则便是HTTP协议. HTTP协议主要规定了客户端和服务器之间的通信格式

浏览器收到的服务器响应的相关信息可以在浏览器调试窗口(F12键开启)的Network标签页中查看, 点击view source即可以查看原始响应数据(有些网页可能并没有该项)

访问码云网站的原始响应数据(节选)

HTTP/1.1 200 OK

Date: Thu, 16 May 2019 13:30:59 GMT

Content-Type: text/html; charset=utf-8

Transfer-Encoding: chunked

Connection: keep-alive

每个HTTP请求和响应都遵循相同的格式, 一个HTTP包含Header和Body两部分, 其中Body是可选的. HTTP响应的Header中有一个响应的内容格式. 如text/html表示HTML网页

HTTP GET请求的格式

HTTP 响应的格式

以上内容总结为一句话便是: 要使自己写的Web server端正常运行起来, 必须要使我们自己的Web server端在给客户端回复消息时按照HTTP协议的规则加上响应状态行

自定义Web框架

一响应指定内容的Web框架

浏览器访问127.0.0.1:9001将返回Hello World标题字样

import socket # 导入socket模块

def main():

# 实例化socket对象

sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# 绑定IP地址与端口

sock.bind(('127.0.0.1', 9001))

# 监听

sock.listen()

while True:

conn, addr = sock.accept()

data = conn.recv(1024)

str = data.decode("UTF-8").strip(" ")

print("浏览器请求信息>>>", str)

# 如果浏览器请求信息非空则进行回复

if str:

# 给回复的消息加上响应状态行

conn.send(b"HTTP/1.1 200 OK\r\n\r\n")

conn.send(b"

Hello World

conn.close()

# 否则跳过本次循环, 开始下一次循环

else:

continue

if __name__ == "__main__":

main()

二响应HTML文件的Web框架

(1) 首先创建一个html文件

一个展示标题与当前时间的网页, 命名为index.html

index

欢迎访问简易版Web框架主页

在该html文件中可添加img标签, 其src属性值如果是网络地址也是可以直接在浏览器上现实的

在该html文件中的css样式与js操作同样可以直接在浏览器上显示出来

(2) 准备服务端程序, 文件命名为server.py

import socket # 导入socket模块

import os # 导入os模块

def main():

# 利用os模块拼接路径

html_path = os.path.join(os.path.dirname(__file__), "index.html")

# 实例化socket对象

sk = socket.socket()

# 绑定IP地址与端口

sk.bind(('127.0.0.1',9001))

# 监听

sk.listen()

# 计数

i = 1

while True:

# 等待浏览器连接获取连接

conn, _ = sk.accept()

# 接收浏览器请求

data = conn.recv(1024)

# 将浏览器请求转换为字符串并格式化

str = data.decode('utf-8').strip(" ")

# 打印浏览器响应

print('浏览器请求信息>>>：', str, i)

# 计数自加

i += 1

# 如果浏览器请求内容并不为空, 响应浏览器请求

if str:

# 为响应的数据加上相应状态行

conn.send(b'HTTP/1.1 200 ok \r\n\r\n')

# 以bytes数据类型打开html文件

with open(html_path,'rb') as f:

# 读取数据

data = f.read()

# 发送html文件数据

conn.send(data)

# 关闭与浏览器的连接

conn.close()

# 若浏览器请求信息为空则关闭连接并跳过本次循环, 开始下一次循环

else:

conn.close()

continue

if __name__ == "__main__":

main()

注意: 该例子使用相对路径, index.html与server.py需在同一目录下

三根据浏览器请求响应数据的Web框架

以上简易的框架基本上都是指定了要给浏览器返回什么数据, 这样肯定满足不了我们的需求, 那么如何才能根据浏览器的请求, 响应相对应的数据呢?

CSS, JS, 图片等文件都叫做网站的静态文件

(1) 为了测试, 首先创建一个html文件, 命名为index.html

index

欢迎访问Web框架首页

把鼠标移到上面

(2) 接着创建一个CSS文件, 命名为css.css

div

{

/* 初始化元素背景色为绿色 */

background-color:green;

/* 初始化元素宽200px */

width:200px;

/* 初始化元素高200px */

height:200px;

/* 初始化元素内填充40px */

padding:40px;

/* 初始化字体颜色为白色 */

color:#ffffff;

}

(3) 再创建一个JS文件, 命名为js.js

// 定义鼠标覆盖事件触发函数

function mOver(obj)

{

// 文字替换为"谢谢"

obj.innerHTML="谢谢"

// 背景颜色更改为红

obj.style.backgroundColor= "red";

}

// 定义鼠标非覆盖状态事件触发函数

function mOut(obj)

{

// 文字替换为"把鼠标以到上面"

obj.innerHTML="把鼠标移到上面"

// 背景颜色更改为绿

obj.style.backgroundColor= "green";

}

(4) 准备服务端程序, 文件命名为server.py

import os # 导入os模块

import socket # 导入socket模块

# 导入线程模块

from threading import Thread

# 实例化socket对象

server = socket.socket()

# 绑定IP及端口

server.bind(("127.0.0.1", 9001))

server.listen()

# 路径拼接

html_path = os.path.join(os.path.dirname(__file__), "index.html")

css_path = os.path.join(os.path.dirname(__file__), "css.css")

js_path = os.path.join(os.path.dirname(__file__), "js.js")

def html(conn):

"""

响应"/"请求

"""

conn.send(b'HTTP/1.1 200 ok \r\n\r\n')

with open(html_path, mode="rb") as f:

content = f.read()

conn.send(content)

conn.close()

def css(conn):

"""

响应"/css.css"请求

"""

conn.send(b"HTTP/1.1 200 ok \r\n\r\n")

with open(css_path, mode="rb") as f:

content = f.read()

conn.send(content)

conn.close()

def js(conn):

"""

响应"/js.js"请求

"""

conn.send(b"HTTP/1.1 200 ok \r\n\r\n")

with open(js_path, mode="rb") as f:

content = f.read()

conn.send(content)

conn.close()

def NotFound(conn):

conn.send(b"HTTP/1.1 200 ok \r\n\r\n")

conn.send(b"

404NotFound!

# 请求列表

request_list = [

("/", html),

("/css.css", css),

("/js.js", js)

]

def get(conn):

"""

处理响应函数

"""

try: # 异常处理

req = conn.recv(1024).decode("UTF-8")

req = req.split("\r\n")[0].split()[1]

# 打印浏览器请求

print(req)

except IndexError:

pass

# 遍历请求列表进行响应

for request in request_list:

# 若浏览器请求信息等于请求列表中的项,则进行响应

# 判断服务端是否能够进行响应

if req == request[0]:

# 获取线程对象, 实现并发

t = Thread(target=request[1], args=(conn, ))

# 启动线程

t.start()

# 响应后结束遍历

break

else: # 若本次循环未匹配则跳过本次循环开始下一次

continue

else: # 若所有请求皆不匹配则调用NotFound函数, 表示无法响应

NotFound(conn)

def main():

while True:

# 利用线程实现并发

# 获取TCP连接

conn, _ = server.accept()

t = Thread(target=get, args=(conn,))

t.start()

if __name__ == "__main__":

main()

注意: 该例子使用相对路径, index.html, css.css, js.js与server.py需在同一目录下

四进阶版Web框架

以上的几版Web框架比较基础, 一些定义的函数使用起来也比较繁琐, 可定制性很差, 修改起来也比较困难.

利用Python提供的一些模块可以简化一些步骤, 并且使框架的可定制性更好, 可以方便其他人进行定制使用

结构示意图

文件结构

构建Web框架

(1) 构建目录

新建文件夹frame

1) 文件夹内创建__init__.py文件(内容为空)

2) 文件夹内新建文件夹file

(2) 准备html文件

index.html文件

index

欢迎访问简易版Web框架主页

@

success.html文件

success

登陆成功

将以上两个html文件保存到file文件夹内

(3) models.py文件

首先需要创建一个数据库, 这里使用MySQL

-- 登录MySQL

mysql -u用户名 -p密码

-- 查看数据库

SHOW DATABASES;

-- 创建数据库

CREATE DATABASE 库名;

这里创建一个名为dbf的数据库

CREATE DATABASE dbf;

利用pymysql模块操作数据库, 建表插入数据

models.py文件

import pymysql # 导入pymysql模块, 需要下载

# pip install pymysql

def main():

conn = pymysql.connect(

host = "127.0.0.1", # mysql主机地址

port = 3306, # mysql端口

user = "root", # mysql远程连接用户名

password = "123", # mysql远程连接密码

database = "dbf", # mysql使用的数据库名

charset = "UTF8" # mysql使用的字符编码,默认为utf8

)

# 实例化游标对象

cursor = conn.cursor(pymysql.cursors.DictCursor)

# 创建表格

sql1 = """CREATE TABLE userinfo(

id int PRIMARY KEY auto_increment,

username char(12) NOT NULL UNIQUE,

password char(20) NOT NULL

);

"""

# 向创建的表格中插入数据

sql2 = """INSERT INTO userinfo(username, password) VALUES

("a", "1"),

("b", "2");

"""

# 将sql指令提交到缓存

cursor.execute(sql1)

cursor.execute(sql2)

# 提交并执行sql指令

conn.commit()

# 关闭游标

cursor.close()

# 关闭与数据库的连接

conn.close()

if __name__ == "__main__":

main()

(4) auth.py文件

用于验证用户登录信息

auth.py文件

import pymysql # 导入pymysql模块

def auth(username, password):

conn = pymysql.connect(

host = "127.0.0.1", # mysql主机地址

port = 3306, # mysql端口

user = "root", # mysql远程连接用户名

password = "123", # mysql远程连接密码

database = "dbf", # mysql使用的数据库名

charset = "UTF8" # mysql使用的字符编码,默认为utf8

)

# 打印用户信息: 用户名, 密码

print("userinfo", username, password)

# 实例化游标对象

cursor = conn.cursor(pymysql.cursors.DictCursor)

# sql查询指令

sql = "SELECT * FROM userinfo WHERE username=%s AND password=%s"

# res获取影响行数

res = cursor.execute(sql, [username, password])

if res: # 数据库中存在该数据, 返回True

return True

else: # 数据库中不存在该数据, 返回False

return False

(5) views.py文件

用于处理数据

views.py文件

"""

该模块存放浏览器请求对应的网页与urls模块中url_list列表中的项存在映射关系

若要添加新的内容, 只需要定义相应的函数, 并将函数名以字符串的形式加入到__all__列表中

"""

import os # 导入os模块

import time # 导入time模块

import auth # 导入auth.py

from urllib.parse import parse_qs # 导入parse_qs用于解析数据

# 展示所有可用方法

__all__ = [

"index",

"authed"

# "css"

]

# 路径拼接(针对windows"/", linu需要把"/"改为"\")

index_path = os.path.join( os.path.dirname(__file__), "file/index.html")

success_path = os.path.join( os.path.dirname(__file__), "file/success.html")

def index(environ):

with open(index_path, mode="rb") as f:

data = f.read().decode("UTF-8")

# 将特殊符号@替换为当前时间, 实现动态网站

data = data.replace("@", time.strftime(("%Y-%m-%d %H:%M:%S")))

return data.encode("UTF-8")

def authed(environ):

if environ.get("REQUEST_METHOD") == "POST":

try:

request_body_size = int(environ.get("CONTENT_LENGTH", 0))

except (ValueError):

request_body_size = 0

request_data = environ["wsgi.input"].read(request_body_size)

print(">>>", request_data) # bytes数据类型

print("????", environ["QUERY_STRING"]) # "空的" - post请求只能按照以上方式获取数据

# parse_qs负责解析数据

# 不管是POST还是GET请求都不能直接拿到数据, 拿到的数据仍需要进行分解提取

# 所以引入urllib模块中的parse_qs方法

request_data = parse_qs(request_data.decode("UTF-8"))

print("拆解后的数据", request_data) # {"username": ["a"], "password": ["1"]}

username = request_data["username"][0]

password = request_data["password"][0]

status = auth.auth(username, password)

if status:

with open(success_path, mode="rb") as f:

data = f.read()

else:

# 如果直接返回中文, 没有给浏览器指定编码格式, 默认是gbk, 需要进行gbk编码, 使浏览器能够识别

# 这里已经指定了编码

# start_response("200 OK", [("Content-Type", "text/html;charset=UTF8")])

data = "

用户名或密码错误, 登陆失败

".encode("UTF-8")

return data

if environ.get("REQUEST_METHOD") == "GET":

print("????", environ["QUERY_STRING"]) # "username='a'&password='1'"字符出数据类型

request_data = environ["QUERY_STRING"]

# parse_qs负责解析数据

# 不管是POST还是GET请求都不能直接拿到数据, 拿到的数据仍需要进行分解提取

# 所以引入urllib模块中的parse_qs方法

request_data = parse_qs(request_data)

print("拆解后的数据", request_data) # {"username": ["a"], "password": ["1"]}

username = request_data["username"][0]

password = request_data["password"][0]

print(username, password)

status = auth.auth(username, password)

if status:

with open(success_path, mode="rb") as f:

data = f.read()

else:

# 如果直接返回中文, 没有给浏览器指定编码格式, 默认使gbk, 需要进行gbk编码, 是浏览器能够识别

# 这里已经指定了编码

# start_response("200 OK", [("Content-Type", "text/html;charset=UTF8")])

data = "

用户名或密码错误, 登陆失败

".encode("UTF-8")

return data

# def css(environ):

# with open("css.css", mode="rb") as f:

# data = f.read()

# return data

(6) urls.py文件

映射表

urls.py文件

from views import index, authed

"""

可在此处按照类似格式添加任意内容

例如再向url_list列表中添加一项, 按照如下格式

("/css.css", css), 只需要再在views.py文件中创建一个对应的函数即可

"""

url_list = [

("/", index),

("/auth/", authed)

# ("/css.css", css)

]

(7) manage.py文件

主逻辑

manage.py文件

from urls import url_list

from wsgiref.simple_server import make_server

def application(environ, start_response):

"""

:param environ: 包含所有请求信息的字典

:param start_response: 封装响应信息(相应行与响应头)

:return: [响应主体]

"""

# 封装响应信息

start_response("200 OK", [("Content-Type", "text/html;charset=UTF8")])

# 打印包含所有请求信息的字典

print(environ)

# 打印请求路径信息

print(environ["PATH_INFO"])

path = environ["PATH_INFO"]

for p in url_list:

if path == p[0]:

data = p[1](environ)

break

else:

continue

else:

data = b"

Sorry 404!, NOT Found The Page

# 返回响应主体

# 必须遵守此格式[内容]

return [data]

if __name__ == "__main__":

# 绑定服务器IP地址与端口号, 调用函数

frame = make_server("127.0.0.1", 9001, application)

# 开始监听HTTP请求

frame.serve_forever()

至此一个简易的Web框架就搭建好了, 我再来简单介绍一下启动步骤

启动步骤

(1) 首先按照步骤, 执行(3) models.py文件

1) 创建数据库

2) 执行models.py

(2) 执行manage.py启动服务器

(3) 根据指定IP及端口, 使用浏览器访问

这里指定127.0.0.1:9001

效果演示

index页面

登录成功

登录失败

错误请求

包/模块解析

以上的框架中用到了两个比较重要的包/模块: wsgiref模块与urllib包, 下面介绍一下

wsgiref模块

WSGI简介引用

WSGI（Web Server Gateway Interface）是一种规范, 它定义了使用Python编写的web应用程序与web服务器程序之间的接口格式, 实现web应用程序与web服务器程序间的解耦

常用的WSGI服务器有uwsgi、Gunicorn. 而Python标准库提供的独立WSGI服务器叫做wsgiref, Django开发环境用的就是这个模块来做服务器

wsgire模块简介引用

wsgiref模块其实就是将整个请求信息给封装了起来, 比如它将所有请求信息封装成了一个叫做request的对象, 那么直接利用request.path就能获取到本次请求的路径. request.method就能获取到本次请求的请求方式(GET/POST)等

urllib包

urllib简介《Python参考手册(第4版)》

urllib包提供了一个高级接口, 用于编写需要与HTTP服务器、FTP服务器和本地文件交互的客户端. 典型的应用程序包括从网页抓取数据、自动化、代理、Web爬虫等. 这是可配置程度最高的库模块之一

由于urllib包中功能模块众多且功能强大, 在此不做过多介绍, 仅介绍本框架所用模块

在views.py中我们通过 from urllib.parse import parse_qs 导入了urllib包下的parser模块中的parse_qs方法

parse模块《Python参考手册(第4版)》

urllib.parser模块用于操作URL字符串, 如"http://www.python.org"

其中parse_qs方法:

parse_qs(qs [, keep_blank_values [, strict_parsing]])解析URL编码的（MIME类型为application/x-www-form-urlencoded）查询字符串qs, 并返回字典, 其中键是查询变量名称, 值是为每个名称定义的值列表. keep_blank_values是一个布尔值标志，控制如何处理空白值. 如果为True, 则它们包含在字典中, 值设置为空字符串; 如果为False（默认值）, 则将其丢弃。strict_parsing是一个布尔值标志, 如果为True, 则将解析错误转换为ValueError异常. 默认情况下会忽略错误

以上就是本人在学习Django框架前的学习总结, 可供学习参考