JsonSchema

使用fastjsonschema来校验数据



# 导入验证器

import json

import fastjsonschema

# 读取schema

with open('../schema/oneof-schema.json', encoding='utf8') as f:

    my_schema = json.load(f)

# json数据：

with open('../data/test.json', encoding='utf8') as f:

    json_data = json.load(f)

# 验证：

fastjsonschema.validate(my_schema, json_data)

使用jsonschema来校验数据



import json

# 导入验证器

from jsonschema import validate, draft7_format_checker, SchemaError, ValidationError

if __name__ == '__main__':

    with open('../schema/MySchema.json', encoding='utf8') as f:

        my_schema = json.load(f)

    # json数据：

    with open('../data/cece.json', encoding='utf8') as f:

        json_data = json.load(f)

    # error_list = check_type(my_schema, json_data)

    # print(error_list)

    # 验证：

    try:

        validate(instance=json_data, schema=my_schema, format_checker=draft7_format_checker)

        # Draft7Validator.format_checker

    except SchemaError as serr:

        print("schema 错误 【%s】 \nschema错误" % str(serr))

    except ValidationError as verr:

        print("数据 错误 【%s】 \n数据错误" % str(verr))

MySchema

JSONSchema缺点

错误提示英文

校验数据为一步步校验，遇到错误停止

自定义JSONSchema

schema遵循 http://json-schema.org/，

"$schema": "http://json-schema.org/draft-07/schema#",

使用方法 >>>> 点击这里

代码

个人编写的校验的代码，自定义成分较多

目前仅仅扩展了 string类型的数据 format 的选型判断

CheckDataUti.py



import re

import time

# email 正则表达式

EMAIL_REGEX = "^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$"

# URL 正则表达式

URL_REGEX = "^[a-zA-z]+://[^\s]*$"

# PHONE 正则表达式

PHONE_REGEX = "^([1][3,4,5,6,7,8,9])\d{9}$"

# 身份证 正则表达式

ID_CARD_REGEX = "^((\d{18})|([0-9x]{18})|([0-9X]{18}))$"

# 邮政编码 正则表达式

ZIP_CODE_REGEX = "^[1-9]\d{5}(?!\d)$"

# IP 地址 正则表达式

IP_REGEX = "^\d+\.\d+\.\d+\.\d+$"

# 正整数

INTEGER_REGEX = "^[1-9]\d*$"

ERR_LIST = []

COMMON_ERR_LIST = []

def log_error(msg, data, schema, is_common=False):

    """

    打印错误日志

    """

    err_log = "%s,数据:【%s】,校验规则: %s" % (str(msg), str(data) + " type of " + str(type(data).__name__), str(schema))

    if not is_common:

        ERR_LIST.append(err_log)

        print("=================================================")

        print(err_log)

        print("=================================================")

    else:

        COMMON_ERR_LIST.append(err_log)

def check_object(data, schema, is_common):

    """

    校验对象格式

    【 properties、required、minProperties、maxProperties、patternProperties、additionalProperties 】

    """

    if type(data) != dict:

        log_error("当前校验的json不是一个对象格式", data, schema, is_common)

    else:

        # 获取当前校验数据的所有key

        keys = dict.keys(data)

        # 处理必需值

        if "required" in schema:

            required_schema = schema['required']

            for schema_key in required_schema:

                if schema_key not in keys:

                    log_error("字段【%s】必填" % schema_key, data, schema, is_common)

        # 处理最小key和最大key

        if "minProperties" in schema:

            min_properties = schema['minProperties']

            if len(keys) < min_properties:

                log_error("校验数据的key个数小于【%s】" % str(min_properties), data, schema, is_common)

        if "maxProperties" in schema:

            max_properties = schema['maxProperties']

            if len(keys) > max_properties:

                log_error("校验数据的key个数大于【%s】" % str(max_properties), data, schema, is_common)

        # 处理具体的key

        if "properties" in schema:

            # 处理 properties

            properties_schema = schema['properties']

            schema_keys = dict.keys(properties_schema)

            for data_key in schema_keys:

                if data_key in data:

                    check_data(properties_schema[data_key], data[data_key])

        # 处理满足正则表达式的key

        if "patternProperties" in schema:

            # 处理 properties

            pattern_properties = schema['patternProperties']

            schema_keys = dict.keys(pattern_properties)

            # 循环所有正则表达式的key

            for schema_key in schema_keys:

                # 循环当前待校验的数据key

                for data_key in keys:

                    # 仅仅处理满足正则表达式的key数据

                    if re.match(schema_key, data_key):

                        check_data(pattern_properties[schema_key], data[data_key])

def check_array(data, schema, is_common):

    """

    校验数组格式

    【 items、additionalItems、minItems、maxItems、uniqueItems 】

    """

    if type(data) != list:

        log_error("当前校验的json不是数组格式", data, schema, is_common)

    else:

        # minItems、maxItems

        # 判断最小值

        if "minItems" in schema:

            min_items = schema['minItems']

            if len(data) < min_items:

                log_error("当前校验的数据数组长度小于【%s】" % str(min_items), data, schema, is_common)

        # 判断最大值

        if "maxItems" in schema:

            max_properties = schema['maxItems']

            if len(data) > max_properties:

                log_error("当前校验的数据数组长度大于【%s】" % str(max_properties), data, schema, is_common)

        # uniqueItems true 数组元素不能重复

        if "uniqueItems" in schema:

            unique_items_schema = schema['uniqueItems']

            if unique_items_schema:

                # 数组元素不能重复

                try:

                    if len(set(data)) != len(data):

                        log_error("当前校验的数据数组元素不能重复", data, schema, is_common)

                except TypeError:

                    # 存在数组内部元素是dict格式

                    pass

        # 判断每一个items

        if "items" in schema:

            items_schema = schema["items"]

            # 判断items_schema 是数组还是对象

            if type(items_schema) is list:

                # 如果是数组 每一个item都是一个jsonSchema 索引对应的数组内索引的格式

                index = 0

                for item_sc in items_schema:

                    check_data(item_sc, data[index])

                    index += 1

                # additionalItems该关键字只有在items是数组的时候才会有效

                # additionalItems 除了上述规定之外的数据必需符合指定的规则

                if "additionalItems" in schema:

                    additional_items_schema = schema['additionalItems']

                    for i in range(index, len(data)):

                        check_data(additional_items_schema, data[i])

            # items如果是对象  当前schema规范了数组内所有元素的格式

            elif type(items_schema) is dict:

                for item_data in data:

                    check_data(items_schema, item_data)

def check_number(data, schema, is_common):

    """

    校验数字类型

    """

    if type(data) not in (int, float):

        log_error("当前校验的json不是一个数字格式", data, schema, is_common)

    else:

        # 判断最大值 maximum 如果exclusiveMaximum该关键字是True 包含本身

        if "maximum" in schema:

            maximum_schema = schema['maximum']

            if 'exclusiveMaximum' in schema and schema['exclusiveMaximum']:

                if data >= maximum_schema:

                    log_error("当前校验的数据大于等于【%s】" % maximum_schema, data, schema, is_common)

            else:

                if data > maximum_schema:

                    log_error("当前校验的数据大于【%s】" % maximum_schema, data, schema, is_common)

        # minimum、exclusiveMinimum

        if "minimum" in schema:

            minimum_schema = schema['minimum']

            if 'exclusiveMinimum' in schema and schema['exclusiveMinimum']:

                if data <= minimum_schema:

                    log_error("当前校验的数据小于等于【%s】" % minimum_schema, data, schema, is_common)

            else:

                if data < minimum_schema:

                    log_error("当前校验的数据小于【%s】" % minimum_schema, data, schema, is_common)

        # multipleOf    整除

        if "multipleOf" in schema:

            multiple_of_schema = schema['multipleOf']

            if not data % multiple_of_schema == 0:

                log_error("当前校验的数据不能被%s整除" % multiple_of_schema, data, schema, is_common)

def check_str(data, schema, is_common):

    """

    校验字符串类型

    涉及的关键字 【maxLength、minLength、pattern、format】

    """

    if type(data) != str:

        log_error("当前校验的数据不是一个字符串格式", data, schema, is_common)

    else:

        # maxLength

        if "maxLength" in schema:

            max_length_schema = schema['maxLength']

            if len(data) > max_length_schema:

                log_error("当前校验的数据长度大于%d" % max_length_schema, data, schema, is_common)

        # minLength

        if "minLength" in schema:

            min_length_schema = schema['minLength']

            if len(data) < min_length_schema:

                log_error("当前校验的数据长度小于%d" % min_length_schema, data, schema, is_common)

        # pattern

        if "pattern" in schema:

            pattern_schema = schema['pattern']

            if not re.match(pattern_schema, data):

                log_error("当前校验的数据不符合正则表达式规则【%s】" % pattern_schema, data, schema, is_common)

        # format

        if 'format' in schema:

            format_schema = schema['format']

            if format_schema == 'email' and not re.match(EMAIL_REGEX, data):

                log_error("当前校验的数据不是正确的邮箱格式", data, schema, is_common)

            elif format_schema == 'phone' and not re.match(PHONE_REGEX, data):

                log_error("当前校验的数据不是正确的手机号码格式", data, schema, is_common)

            elif format_schema == 'hostname' and not re.match(IP_REGEX, data):

                log_error("当前校验的数据不是正确的IP地址格式", data, schema, is_common)

            elif format_schema == 'idCard' and not re.match(ID_CARD_REGEX, data):

                log_error("当前校验的数据不是正确的身份证格式", data, schema, is_common)

            elif format_schema == 'date':

                format_patten = '%Y-%m-%d'

                if 'format_patten' in schema:

                    format_patten = schema['format_patten']

                try:

                    time.strptime(data, format_patten)

                except ValueError:

                    log_error("当前校验的数据不是正确的日期格式格式【%s】" % format_patten, data, schema, is_common)

def check_common(schema, data):

    """

    校验通用的

    涉及到关键字：

    【 enum、const、allOf、anyOf、oneOf、not、 if……then…… 】

    """

    if "enum" in schema:

        enum_schema = schema['enum']

        if data not in enum_schema:

            log_error("当前校验的数据值不存在【%s】中" % str(enum_schema), data, schema)

    if "const" in schema:

        const_schema = schema['const']

        if data != const_schema:

            log_error("当前校验数据值不等于【%s】" % str(const_schema), data, schema)

    if "allOf" in schema:

        all_of_schema = schema['allOf']

        for item_schema in all_of_schema:

            check_data(item_schema, data)

    if "anyOf" in schema:

        any_of_schema = schema['anyOf']

        begin_len = len(COMMON_ERR_LIST)

        for item_schema in any_of_schema:

            check_data(item_schema, data, True)

        end_len = len(COMMON_ERR_LIST)

        if end_len - begin_len == len(any_of_schema):

            log_error("当前校验的数据不符合当前anyof中的任一规则", data, schema)

    if "oneOf" in schema:

        one_of_schema = schema['oneOf']

        begin_len = len(COMMON_ERR_LIST)

        for item_schema in one_of_schema:

            check_data(item_schema, data, True)

        end_len = len(COMMON_ERR_LIST)

        if end_len - begin_len != len(one_of_schema) - 1:

            log_error("待校验JSON元素不能通过oneOf的校验", data, schema)

    if "not" in schema:

        not_schema = schema['not']

        begin_len = len(COMMON_ERR_LIST)

        check_data(not_schema, data, True)

        end_len = len(COMMON_ERR_LIST)

        if end_len == begin_len:

            log_error("待校验JSON元素不能通过not规则的校验", data, schema)

    # if……then……

    if 'if' in schema:

        if_schmea = schema['if']

        begin_len = len(COMMON_ERR_LIST)

        check_data(if_schmea, data, True)

        end_len = len(COMMON_ERR_LIST)

        if end_len == begin_len:

            if "then" in schema:

                then_schema = schema['then']

                check_data(then_schema, data, False)

        else:

            if "else" in schema:

                else_schema = schema['else']

                check_data(else_schema, data, False)

def get_data_type(data):

    """

    获取type

    """

    if type(data) == dict:

        return 'object'

    if type(data) == list:

        return 'array'

    if type(data) in (int, float):

        return 'number'

    if type(data) == str:

        return 'string'

    if type(data) == bool:

        return 'boolean'

def check_data(schema, data, is_common=False):

    # 优先处理 通用的

    check_common(schema, data)

    # 没有type的情况

    # type 默认为string

    type_name = schema['type'] if "type" in schema else get_data_type(data)

    if type_name == 'object':

        check_object(data, schema, is_common)

    elif type_name == 'array':

        check_array(data, schema, is_common)

    elif type_name in ['integer', 'number']:

        check_number(data, schema, is_common)

    elif type_name == 'string':

        check_str(data, schema, is_common)

    # type是布尔类型

    elif type_name == 'boolean':

        if type(data) != bool:

            log_error("当前校验的数据不是一个boolean格式", data, schema, is_common)

JsonSchmea 的数据示例



{

  "$schema": "http://json-schema.org/draft-07/schema#",

  "type": "object",

  "minProperties": 1,

  "maxProperties": 200,

  "properties": {

    "name": {

      "type": "string",

      "enum": [

        "shaofei",

        "upuptop",

        "pyfysf"

      ]

    },

    "email": {

      "type": "string",

      "format": "email",

      "const": "pyfysf@163.com"

    },

    "idCard": {

      "type": "string",

      "format": "idCard",

      "pattern": "\\d+"

    },

    "phone": {

      "type": "string",

      "format": "phone"

    },

    "hostname": {

      "type": "string",

      "format": "hostname"

    },

    "createTime": {

      "format": "date",

      "format_patten": "%Y%m%d"

    },

    "is": {

      "type": "boolean"

    },

    "age": {

      "type": "integer",

      "maximum": 20,

      "minimum": 1,

      "multipleOf": 2

    },

    "like": {

      "type": "array"

    }

  },

  "allOf": [

    {

      "type": "string"

    }

  ],

  "patternProperties": {

    "^\\S+123$": {

      "type": "integer"

    }

  },

  "required": [

    "email"

  ]

}

使用方式



import json

from CheckDataUti import check_data

if __name__ == '__main__':

    with open('../schema/MySchema.json', encoding='utf8') as f:

        my_schema = json.load(f)

    # json数据：

    with open('../data/cece.json', encoding='utf8') as f:

        json_data = json.load(f)

    check_data(my_schema, json_data)

    # print(ERR_LIST)

参考：

schema遵循 http://json-schema.org/，

"$schema": "http://json-schema.org/draft-07/schema#",

使用方法 >>>> 点击这里

学习了JsonSchema，我自定义了一个校验代码的更多相关文章

JVM学习第一篇思考：一个Java代码是怎么运行起来的-上篇
JVM学习第一篇思考:一个Java代码是怎么运行起来的-上篇作为一个使用Java语言开发的程序员,我们都知道,要想运行Java程序至少需要安装JRE(安装JDK也没问题).我们也知道我们Java程序 ...
JavaScript学习12 JS中定义对象的几种方式
JavaScript学习12 JS中定义对象的几种方式 JavaScript中没有类的概念,只有对象. 在JavaScript中定义对象可以采用以下几种方式: 1.基于已有对象扩充其属性和方法 2.工 ...
JavaScript学习12 JS中定义对象的几种方式【转】
avaScript学习12 JS中定义对象的几种方式转自: http://www.cnblogs.com/mengdd/p/3697255.html JavaScript中没有类的概念,只有对象. ...
SpringMVC学习（三）———— springmvc的数据校验的实现
一.什么是数据校验? 这个比较好理解,就是用来验证客户输入的数据是否合法,比如客户登录时,用户名不能为空,或者不能超出指定长度等要求,这就叫做数据校验. 数据校验分为客户端校验和服务端校验客户端校验 ...
【SpringMVC学习06】SpringMVC中的数据校验
这一篇博文主要总结一下springmvc中对数据的校验.在实际中,通常使用较多是前端的校验,比如页面中js校验,对于安全要求较高的建议在服务端也要进行校验.服务端校验可以是在控制层conroller, ...
selenium webdriver学习（十）------------如何把一个元素拖放到另一个元素里面(转)
selenium webdriver学习(十)------------如何把一个元素拖放到另一个元素里面博客分类: Selenium-webdriver 元素拖放drag and drop Q群里 ...
学习vue就是那么简单，一个简单的案例
vue是前端兴起的一个javascript库,相信大家都使用过jQuery,虽然vue和jQuery没有可比性,但从熟悉的角度去理解新的东西或许会容易接受一些,有时候由于思想和模式的转变会带来阵痛,但 ...
用struts2标签如何从数据库获取数据并在查询页面显示。最近做一个小项目，需要用到struts2标签从数据库查询数据，并且用迭代器iterator标签在查询页面显示，可是一开始，怎么也获取不到数据，想了许久，最后发现，是自己少定义了一个变量，也就是var变量。
最近做一个小项目,需要用到struts2标签从数据库查询数据,并且用迭代器iterator标签在查询页面显示,可是一开始,怎么也获取不到数据,想了许久,最后发现,是自己少定义了一个变量,也就是var变 ...
JAVA学习笔记（一）：一个小爬虫的例子
1.import java.io.*; java.io.*不是一个文件,而是一组类.它是在java.io包里的所有类,*是通配符,比如a*.txt代表的就是以a开头的所有txt文件,“?”是单个词 ...

随机推荐

ES6入门一：ES6简介及Babel转码器
ES6简介 Babel转码器 Nodejs中使用ES6 WebPack中使用ES6及Babel转码插件一.ES6简介与转码 1.1一个常见的问题,ECMAScript和JavaScript到底是什 ...
ReactJS中的自定义组件
可控自定义组件: <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> < ...
ubuntu 16.04源码编译和配置caffe详细教程 | Install and Configure Caffe on ubuntu 16.04
本文首发于个人博客https://kezunlin.me/post/b90033a9/,欢迎阅读! Install and Configure Caffe on ubuntu 16.04 Series ...
AE10.0在Visual Studio 2012下安装没有模板（转）
转自百度经验: VS2012中丢失ArcGIS模板的解决方法由于ArcGIS10.0(for .NET)默认是用VS2010作为开发工具的,所以在先安装VS2012后装ArcGIS10.0 桌面版及 ...
PowerMock学习（七）之Mock Constructor的使用
前言我们在编码的时候,总习惯在构造器中传参数,那么在powermock中是怎么模拟带参数构造的呢,这并不难. 模拟场景我们先模拟这样一个场景,通过dao中的传入一个是布尔类型(是否加载)和一个枚举 ...
tcpip协议
几个概念 1.分层(我们使用四层模型更为贴合我们的实际网络) 分层是为什么,其实和公司中职位是一样的,不同职位的人做不同的事情,然后不同职位的人合起来,一起完成了数据传输的事情. 链路层在这个层面 ...
图解 Spring：HTTP 请求的处理流程与机制【5】
5. HTTP 请求处理相关配置文件说明 HTTP 请求穿越的整个空间是分层的,包括:Web 容器.Web 应用.Spring 框架等,它们每层都是通过配置文件配置初始化的,这是一种松耦合的架构设计. ...
01_Numpy基本使用
1.Numpy读取txt/csv文件读取数据 import numpy as np # numpy打开本地txt文件 world_alcohol = np.genfromtxt("D:\\ ...
pymongo的基本操作和使用--练习
1.将MongoDB注册到电脑中安装好MongoDB之后,如何使用MongoDB呢?来到安装目录D:/MongoDB/bin会有如下列表: 其中,mongod.exe是服务端,mongo.exe是客 ...
在React项目中添加ESLint
1. 安装eslint npm install eslint --save-dev // 或者 yarn add eslint --dev 2. 初始化配置文件 npx eslint --init / ...

学习了JsonSchema，我自定义了一个校验代码

JsonSchema

使用fastjsonschema来校验数据

使用jsonschema来校验数据

MySchema

JSONSchema缺点

自定义JSONSchema

代码

JsonSchmea 的数据示例

使用方式

学习了JsonSchema，我自定义了一个校验代码的更多相关文章

随机推荐

热门专题