前言

学会如何安装配置华为云ModelArts、开发板Atlas 200I DK A2。

并打通一个Ascend910训练到Ascend310推理的全流程思路。

在本篇章,我们继续进入推理阶段!

推理阶段

B. 环境搭建

AscendCL 开发板 模型推理

Step1 准备硬件

  1. 基础硬件

    • 开发者套件
    • Micro SD 卡(TF卡):容量推荐不小于64GB
    • 读卡器
    • PC(笔记本或台式机)
  2. 所需配件

    用于后续连接启动&登录开发者套件。

    这里以远程登录模式为例

    • RJ45网线

注:

这里使用Windows系统,通过网线以远程登录模式连接启动登录开发者套件。

详细内容or选择其他系统其他模式的用户可参考昇腾官网文档-快熟开始

Step2 制卡

  1. PC下载并安装制卡工具“Ascend-devkit-imager_latest_win-x86_64.exe”

  2. 将SD卡插入读卡器的卡槽中,接着一起插入PC的USB接口中

  3. 打开制卡工具

    -> 在线制卡(镜像版本选择Ubuntu)

    -> 选择SD卡(烧录镜像时会自动将SD卡格式化,需要提前检查SD卡是否有数据需要提前备份)

    -> 烧录镜像(大概20min)



    烧录成功后,将SD卡从读卡器中取出。

Step3 连接启动开发者套件

  1. 将烧录好的SD卡插入开发者套件的SD插槽,

    并确保完全推入插槽底部。(推到底是有类似弹簧的触感)

  2. 确保开发者套件的拨码开关2、3、4的开关值如图所示:

  3. 使用网线连接开发板套件和PC。

    给开发者套件上电后

Step4 登录开发者套件

  1. 通过PC共享网络联网(Windows)

    控制面板 -> 网络和共享中心 -> 更改适配器设置 ->

    右键“WLAN” -> 属性 ->

    进入“共享”界面



    右键“以太网” -> 属性 ->

    进入“网络”界面 -> 双击“Internet 协议版本 4(TCP/IPv4)” -> 修改IP地址与子网掩码

    (PC需设置IP与开发板处于同一网段。这里使用192.168.137.102为例)



    确认保存。

  2. PC下载并解压SSH远程登录工具“MobaXterm_Personal_22.2.exe”(或者进入官网下载

  3. 打开SSH远程登录工具“MobaXterm_Personal_22.2.exe” -> Session -> SSH

    -> 填写实际与PC连接的开发者套件网口IP(制卡中配置的IP地址,默认为192.168.137.100)

    -> 勾选“Specify username”选项,填写用户名(这里使用root)



    -> Accept



    -> 输入root用户名登录密码(默认为Mind@123)

    输入密码时,界面不会显示密码和输入位数,输入密码后在键盘按Enter键即可



    -> 界面会出现保存密码提示,可以单击“No”,不保存密码直接登录开发者套件。



Step5 确认开发者套件成功联网

  1. 通过能否ping通进行检验网络

    输入

    ping 8.8.8.8

    或者

    ping www.baidu.com

    若回显如图所示,则说明开发者套件还未成功联网。





    请继续后续命令配置操作。

  2. 输入

    ip ro

    回显如下

  3. 删除多余的路由

    输入

    ip ro del default via 192.168.137.1

    添加丢失的路由

    输入

    sudo ip route add default via 192.168.137.102 dev eth1 metric 1

    注:这里填写的IP是前文控制面板中填写的IP地址

  4. 输入

    ip ro

    回显如下

  5. 通过能否ping通进行检验网络

    输入

    ping 8.8.8.8

    或者

    ping www.baidu.com

    若回显如图所示,则说明开发者套件已经成功联网。





    (若正确配置网络后仍无法联网,请参考昇腾官网文档-正确配置网络后仍无法联网

Step6 为开发者套件添加推理阶段项目工程文件

  1. 上传

    将推理阶段项目工程文件压缩包上传到开发者套套件

    (可以通过拖拽文件的方法上传到MobaXterm)

  2. 解压

    打开“Terminal”命令行终端界面 ->

    执行以下命令,解压项目工程文件压缩包

    unzip unet_sdk.zip

    unzip unet_cann.zip

  • 模型转换工程目录结构如下:

    ├── unet_sdk
    ├── model
    │ ├──air2om.sh // air模型转om脚本
    │ ├──xxx.air //训练阶段导出的air模型
    │ ├──aipp_unet_simple_opencv.cfg // aipp文件
    │ ├──xxx.om //训练转换产生的om模型
  • 推理阶段工程目录结构如下:

    ├── unet_cann
    ├── main.py // 推理文件
    ├── image.png //图片数据
    ├── mask.png //标签数据

注:

接下来就可以继续旅程,进入推理阶段。

若中途暂停或完成实验,记得将开发者套件关机和下电

若之后返回或继续实验,再次将开发者套件开机。

如果开发板下电断开连接,重新上电后PC不会主动再次连接,

需要更新状态(例如取消网络共享+再次共享)

七. 执行推理

Step1 acl推理脚本

  • 打开unet_cann/main.py文件

    内容如下,可根据实际开发情况进行修改。

    点击查看代码unet_cann/main.py文件
    #!/usr/bin/python
    # -*- coding: utf-8 -*- import cv2 # 图片处理三方库,用于对图片进行前后处理
    import numpy as np # 用于对多维数组进行计算
    from albumentations.augmentations import transforms # 数据增强库,用于对图片进行变换 import acl # acl 推理文件库 def sigmoid(x):
    y = 1.0 / (1 + np.exp(-x)) # 对矩阵的每个元素执行 1/(1+e^(-x))
    return y def plot_mask(img, msk):
    """ 将推理得到的 mask 覆盖到原图上 """
    msk = msk + 0.5 # 将像素值范围变换到 0.5~1.5, 有利于下面转为二值图
    msk = cv2.resize(msk, (img.shape[1], img.shape[0])) # 将 mask 缩放到原图大小
    msk = np.array(msk, np.uint8) # 转为二值图, 只包含 0 和 1 # 从 mask 中找到轮廓线, 其中第二个参数为轮廓检测的模式, 第三个参数为轮廓的近似方法
    # cv2.RETR_EXTERNAL 表示只检测外轮廓, cv2.CHAIN_APPROX_SIMPLE 表示压缩水平方向、
    # 垂直方向、对角线方向的元素, 只保留该方向的终点坐标, 例如一个矩形轮廓只需要4个点来保存轮廓信息
    # contours 为返回的轮廓(list)
    contours, _ = cv2.findContours(msk, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) # 在原图上画出轮廓, 其中 img 为原图, contours 为检测到的轮廓列表
    # 第三个参数表示绘制 contours 中的哪条轮廓, -1 表示绘制所有轮廓
    # 第四个参数表示颜色, (0, 0, 255)表示红色, 第五个参数表示轮廓线的宽度
    cv2.drawContours(img, contours, -1, (0, 0, 255), 1) # 将轮廓线以内(即分割区域)覆盖上一层红色
    img[..., 2] = np.where(msk == 1, 255, img[..., 2]) return img # 初始化变量
    pic_input = 'image.png' # 单张图片
    model_path = "../unet_sdk/model/unet_hw960_bs1.om" # 模型路径
    num_class = 2 # 类别数量, 需要根据模型结构、任务类别进行改变;
    device_id = 0 # 指定运算的Device
    print("init resource stage:") # acl初始化
    ret = acl.init()
    ret = acl.rt.set_device(device_id) # 指定运算的Device
    context, ret = acl.rt.create_context(device_id) # 显式创建一个Context,用于管理Stream对象
    stream, ret = acl.rt.create_stream() # 显式创建一个Stream, 用于维护一些异步操作的执行顺序,确保按照应用程序中的代码调用顺序执行任务
    print("Init resource success") # 加载模型
    model_id, ret = acl.mdl.load_from_file(model_path) # 加载离线模型文件, 返回标识模型的ID
    model_desc = acl.mdl.create_desc() # 初始化模型描述信息, 包括模型输入个数、输入维度、输出个数、输出维度等信息
    ret = acl.mdl.get_desc(model_desc, model_id) # 根据加载成功的模型的ID, 获取该模型的描述信息
    print("Init model resource success") img_bgr = cv2.imread(pic_input) # 读入图片
    img = cv2.resize(img_bgr, (960,960)) # 将原图缩放到 960*960 大小
    img = transforms.Normalize().apply(img) # 将像素值标准化(减去均值除以方差)
    img = img.astype('float32') / 255 # 将像素值缩放到 0~1 范围内
    img = img.transpose(2, 0, 1) # 将形状转换为 channel first (3, 96, 96) # 准备输入数据集
    input_list = [img, ] # 初始化输入数据列表
    input_num = acl.mdl.get_num_inputs(model_desc) # 得到模型输入个数
    input_dataset = acl.mdl.create_dataset() # 创建输入数据 for i in range(input_num):
    input_data = input_list[i] # 得到每个输入数据 # 得到每个输入数据流的指针(input_ptr)和所占字节数(size)
    size = input_data.size * input_data.itemsize # 得到所占字节数
    bytes_data=input_data.tobytes() # 将每个输入数据转换为字节流
    input_ptr=acl.util.bytes_to_ptr(bytes_data) # 得到输入数据指针 model_size = acl.mdl.get_input_size_by_index(model_desc, i) # 从模型信息中得到输入所占字节数
    # if size != model_size: # 判断所分配的内存是否和模型的输入大小相符
    # print(" Input[%d] size: %d not equal om size: %d" % (i, size, model_size) + ", may cause inference result error, please check model input") dataset_buffer = acl.create_data_buffer(input_ptr, size) # 为每个输入创建 buffer
    _, ret = acl.mdl.add_dataset_buffer(input_dataset, dataset_buffer) # 将每个 buffer 添加到输入数据中
    print("Create model input dataset success") # 准备输出数据集
    output_size = acl.mdl.get_num_outputs(model_desc) # 得到模型输出个数
    output_dataset = acl.mdl.create_dataset() # 创建输出数据 for i in range(output_size):
    size = acl.mdl.get_output_size_by_index(model_desc, i) # 得到每个输出所占内存大小
    buf, ret = acl.rt.malloc(size, 2) # 为输出分配内存。
    dataset_buffer = acl.create_data_buffer(buf, size) # 为每个输出创建 buffer
    _, ret = acl.mdl.add_dataset_buffer(output_dataset, dataset_buffer) # 将每个 buffer 添加到输出数据中
    if ret: # 若分配出现错误, 则释放内存
    acl.rt.free(buf)
    acl.destroy_data_buffer(dataset_buffer)
    print("Create model output dataset success") # 模型推理, 得到的输出将写入 output_dataset 中
    ret = acl.mdl.execute(model_id, input_dataset, output_dataset) # 解析 output_dataset, 得到模型输出列表
    model_output = [] # 模型输出列表
    for i in range(output_size):
    buf = acl.mdl.get_dataset_buffer(output_dataset, i) # 获取每个输出buffer
    data_addr = acl.get_data_buffer_addr(buf) # 获取输出buffer的地址
    size = int(acl.get_data_buffer_size(buf)) # 获取输出buffer的字节数
    byte_data = acl.util.ptr_to_bytes(data_addr, size) # 将指针转为字节流数据
    dims = tuple(acl.mdl.get_output_dims(model_desc, i)[0]["dims"]) # 从模型信息中得到每个输出的维度信息
    output_data = np.frombuffer(byte_data, dtype=np.float32).reshape(dims) # 将 output_data 以流的形式读入转化成 ndarray 对象
    model_output.append(output_data) # 添加到模型输出列表 x0 = 2200 # w:2200~4000; h:1000~2800
    y0 = 1000
    x1 = 4000
    y1 = 2800
    ori_w = x1 - x0
    ori_h = y1 - y0 def _process_mask(mask_path):
    # 手动裁剪
    mask = cv2.imread( mask_path , cv2.IMREAD_GRAYSCALE )
    # [y0:y1, x0:x1]
    return mask[y0:y1, x0:x1] # 后处理
    model_out_msk = model_output[0] # 取出模型推理结果, 推理结果形状为 (1, 1, 96, 96),即(batchsize, num_class, height, width)
    model_out_msk = _process_mask("mask.png") # 抠图后的shape, hw
    # model_out_msk = sigmoid(model_out_msk[0][0]) # 将模型输出变换到 0~1 范围内
    img_to_save = plot_mask(img_bgr, model_out_msk) # 将处理后的输出画在原图上, 并返回 # 保存图片到文件
    cv2.imwrite('result.png', img_to_save) # 释放输出资源, 包括数据结构和内存
    num = acl.mdl.get_dataset_num_buffers(output_dataset) # 获取输出个数
    for i in range(num):
    data_buf = acl.mdl.get_dataset_buffer(output_dataset, i) # 获取每个输出buffer
    if data_buf:
    data_addr = acl.get_data_buffer_addr(data_buf) # 获取buffer的地址
    acl.rt.free(data_addr) # 手动释放 acl.rt.malloc 所分配的内存
    ret = acl.destroy_data_buffer(data_buf) # 销毁每个输出buffer (销毁 aclDataBuffer 类型)
    ret = acl.mdl.destroy_dataset(output_dataset) # 销毁输出数据 (销毁 aclmdlDataset类型的数据) # 卸载模型
    if model_id:
    ret = acl.mdl.unload(model_id) # 释放模型描述信息
    if model_desc:
    ret = acl.mdl.destroy_desc(model_desc) # 释放 stream
    if stream:
    ret = acl.rt.destroy_stream(stream) # 释放 Context
    if context:
    ret = acl.rt.destroy_context(context) # 释放Device
    acl.rt.reset_device(device_id)
    acl.finalize()
    print("Release acl resource success")

Step2 执行脚本

  1. 打开Terminal命令行终端界面:确保是否在工程目录unet_cann/路径下

    输入

    cd /root/project/unet_cann

  2. 运行示例

    输入

    python3 main.py

  • 输出结果:

注:

到此我们就已经走过了从Ascend910训练到Ascend310推理的昇腾开发全流程。

更多内容深入参考下方学习资源推荐

学习资源推荐

【昇腾开发全流程】AscendCL开发板模型推理的更多相关文章

  1. 十分钟带你了解CANN应用开发全流程

    摘要:CANN作为昇腾AI处理器的发动机,支持业界多种主流的AI框架,包括MindSpore.TensorFlow.Pytorch.Caffe等,并提供1200多个基础算子. 2021年7月8日,第四 ...

  2. 监控视频采集与Web直播开发全流程分析

    内容概要: 摄像头 => FFmpeg => Nginx服务器 => 浏览器 从摄像头拉取rtsp流 转码成rtmp流向推流服务器写入 利用html5播放 1.开发流程 1.1 通过 ...

  3. VS2017+QT5.12.10+QGIS3.16环境搭建及开发全流程

    题记:大力发展生产力,助力高效采集.(转载请注明出处https://www.cnblogs.com/1024bytes/p/15477374.html) 本篇随笔分为五个部分: 一.获取QGIS3.1 ...

  4. Odoo9.0模块开发全流程

    构建Odoo模块 模块组成 业务对象 业务对象声明为Python类, 由Odoo自己主动加载. 数据文件 XML或CSV文件格式, 在当中声明了元数据(视图或工作流).配置数据(模块參数).演示数据等 ...

  5. AI全流程开发难题破解之钥

    摘要:通过对ModelArts.盘古大模型.ModelBox产品技术的解读,帮助开发者更好的了解AI开发生产线. 本文分享自华为云社区<[大厂内参]第16期:华为云AI开发生产线,破解AI全流程 ...

  6. 基于昇腾计算语言AscendCL开发AI推理应用

    摘要:本文介绍了昇腾计算语言AscendCL的基本概念,并以示例代码的形式介绍了如何基于AscendCL开发AI推理应用,最后配以实际的操作演示说明如何编译运行应用. 本文分享自华为云社区<基于 ...

  7. 昇思MindSpore全场景AI框架 1.6版本,更高的开发效率,更好地服务开发者

    摘要:本文带大家快速浏览昇思MindSpore全场景AI框架1.6版本的关键特性. 全新的昇思MindSpore全场景AI框架1.6版本已发布,此版本中昇思MindSpore全场景AI框架易用性不断改 ...

  8. 全球首个全流程跨平台界面开发套件,PowerUI分析

    一.       首个全流程跨平台界面开发套件,PowerUI正式发布 UIPower在DirectUI的基础上,自主研发全球首个全流程跨平台界面开发套件PowerUI(PUI)正式发布,PowerU ...

  9. 基于Jenkins的开发测试全流程持续集成实践

    今年一直在公司实践CI,本文将近半年来的一些实践总结一下,可能不太完善或优美,但的确初步解决了我目前所在项目组的一些痛点.当然这仅是一家之言也不够完整,后续还会深入实践和引入Kubernetes进行容 ...

  10. 超全的web开发工具和资源

    首页 新闻 产品 地图 动态 城市 帮助 论坛 关于 登录 注册 · 不忘初心,继续前进,环境云V2接口正式上线 · 环境云测点地图全新改版 · 祝福各位环境云用户中秋快乐!   平台信息 培训互动 ...

随机推荐

  1. Launching Teamviewer remotely through SSH

    Launching Teamviewer remotely through SSH When you need to manage your Server remotely, but you can ...

  2. redis 简单整理——redis 的有序集合基本结构和命令[六]

    前言 简单介绍一下redis的有序集合的基本结构和命令. 正文 有序集合相对于哈希.列表.集合来说会有一点点陌生,但既然叫有序 集合,那么它和集合必然有着联系,它保留了集合不能有重复成员的特性, 但不 ...

  3. 物联网浏览器(IoTBrowser)-整合机器学习yolo框架实现车牌识别

    最近一段时间在研究AI技术在.Net平台的使用,目前AI绝大部分是使用Python开发,偶然一次在头条看到一篇ML.NET的介绍,是Net平台下开放源代码的跨平台机器学习框架.ML.NET详细介绍 h ...

  4. Javascript中的继承?如何实现继承?

    一.是什么 继承(inheritance)是面向对象软件技术当中的一个概念 如果一个类别B"继承自"另一个类别A,就把这个B称为"A的子类",而把A称为&quo ...

  5. 试题B:小球反弹(第十五届蓝桥杯省赛B组c/c++组)

    试题B:小球反弹 我在刷博客的时候看见有人分享了蓝桥杯的题目,我想起了我之前大学打蓝桥杯刷题的时光,还是很怀念当时打比赛的氛围,关于这个小球反弹的题目,我感觉很有意思,我一开始也是走了好多弯路,然后去 ...

  6. 探索Kimi智能助手:如何用超长文本解锁高效信息处理新境界

    目前,Kimi备受瞩目,不仅在社交平台上引起了广泛关注,而且在解决我们的实际问题方面也显示出了巨大潜力.其支持超长文本的特性使得我们能够更加灵活地配置信息,避免了频繁与向量数据库进行交互以及编写提示词 ...

  7. linux系统关闭指定端口

    linux系统关闭指定端口 关闭指定端口 firewall-cmd --zone=public --remove-port=80/tcp --permanent systemctl restart f ...

  8. HL7标准的版本

    HL7V2 HL7v2是用于在系统之间交换临床和患者信息的最广泛使用的医疗保健消息传递标准.HL7v2的目标是使用代表临床事件信息的标准化消息(例如患者管理活动.人口统计.医疗订单.结果和财务信息)在 ...

  9. 力扣1083(MySQL)-销售分析Ⅱ(简单)

    题目: 编写一个 SQL 查询,查询购买了 S8 手机却没有购买 iPhone 的买家.注意这里 S8 和 iPhone 是 Product 表中的产品. 查询结果格式如下图表示: Product t ...

  10. KubeVela 1.5:灵活框选 CNCF 原子能力打造独特的企业应用发布平台

    简介: KubeVela 1.5 于近日正式发布.在该版本中为社区带来了更多的开箱即用的应用交付能力,包括新增系统可观测:新增 Cloud Shell 终端,将 Vela CLI 搬到了浏览器:增强的 ...