摘要:通过将自然语言转化为规范可阅读、无开源漏洞的安全编程语言,提升开发者编程效率,助力企业快速响应市场需求。

本文分享自华为云社区《华为云发布智能编程助手 CodeArts Snap!》,作者:DevAI 。

基于大模型的程序自动生成取得重大突破

数字时代竞争激烈,应用研发效率提升在企业竞争力构建中扮演着重要角色。2022 年 Gartner 选出 12 大战略性技术中最强的 AI 技术之一 “生成式 AI”,其巨大的商业潜力引起科技市场普遍关注,涌现出一批以智能化代码生成为核心的提高开发者编程效率的 AI 产品。

例如,微软以 OpenAI 大规模代码预训练生成模型 Codex 为底座的 AI 辅助编程工具 Github Copilot,一经推出受到业界热评。Github 声明内部团队 30% 的新代码是在 Copilot 的帮助下完成的;另外,在写 web 服务端的对比实验中发现,使用 AI 辅助编程工具的一方平均可减少 55% 的开发时间。可见,AI 辅助编程工具对减轻研发人员工作压力、降低企业研发投入成本、提高编程效率都有着重要价值。

但与此同时,由于生成的内容难以限制,一些 “不安全” 或者 “不应该” 出现在生成结果中的代码会出现在生成结果中,导致市场上各 AI 辅助编程工具质量不一,部分厂商的 AI 辅助编程工具所生成的代码 40% 左右存在网络安全缺陷,出现隐私泄漏、开源风险等问题。

国产最强 AI 代码辅助编程工具 - 华为云 CodeArts Snap

华为云智能编程助手 CodeArts Snap 作为云厂商中首个国产化的 AI 代码辅助编程工具,致力于打造现代化开发新范式。通过将自然语言转化为规范可阅读、无开源漏洞的安全编程语言,提升开发者编程效率,助力企业快速响应市场需求;下面用 3 分钟向大家揭晓华为云 CodeArts Snap 强在哪里。

规避开源风险 | 杜绝业界普遍存在的编程安全隐患

华为云 CodeArts Snap 在各阶段均采取了针对性措施,有效规避了业界产品普遍带来的编程安全隐患。例如为避免开源代码带来的系统性风险,在数据预处理阶段,预训练数据对可能产生问题的 licence 涉及的代码进行了精细的过滤,从根本上杜绝开源 licence 风险,并会尽可能的从多种渠道获取可用的开源数据(如 Gitee 等)。

支持多种场景 | 带你感知代码智能生成的全场景化

我们惊喜地发现,华为云 CodeArts Snap 不仅熟悉常见算法,并且能熟练地使用各种 API 及其它工具;比如能够操作数据库,甚至可以求解高等数学题。华为云 CodeArts Snap 在形形色色任务中的出彩表现,使得其成为编程人员的得力助手。

场景一。函数级代码自动生成

可以通过自然语言识别做到函数级的多行代码生成,开发者仅需在定义好的函数签名末尾处敲下 “回车键”,CodeArts Snap 将生成符合业务逻辑的完整函数代码(如下图)。

函数级代码自动生成

场景二。承上文语义,展智能风采

CodeArts Snap 在已有函数上文的场景下,还可以通过理解上文的语义和逻辑,自动进行行级代码生成(如下图)。

行级代码自动生成

场景三。从光标乍现处捕捉一次编程灵感

在编程过程中,开发者难免会遇到卡壳、停下来思考。此时 CodeArts Snap 在光标处会进行行中代码生成推荐,为开发者提供编程灵感。

光标处代码生成推荐

场景四。让代码生成不止于一个结果方案

每次触发代码生成,CodeArts Snap 会提供多个生成结果方案,开发者可以通过快捷键快速翻阅,也可以调取侧边栏对比查看所有候选代码生成推荐结果,并对结果进行选择。

快速翻阅比对候选代码生成结果

同时查看

圈点皆厚重,呈现即亮眼 | 同规模同算力下一次通过率(Pass@1)业界第一

华为云 CodeArts Snap “全场景代码智能生成” 能力向大家的亮眼呈现,其核心技术沉淀于华为云 PaaS 技术创新 lab 与华为诺亚方舟实验室联合打造的 PanGu-Coder 代码大模型中;华为在业界 PanGu-Coder 技术基础上,对模型方面进行了重点优化调整。

比如,针对函数级的代码生成与补全任务,CodeArts Snap 分别发布了参数量为 3 亿和 26 亿两个规模可用的生成功能。当给定函数名并用自然语言描述需要实现的功能后,模型即可生成完整的函数功能代码。

对比业界,华为云 CodeArts Snap 所采用的模型在使用相对更少的训练数据和计算资源的情况下,代码生成一次通过率大幅超越同等规模的模型,甚至可以做到远超参数量规模更大的模型。华为云 CodeArts Snap 所采用的模型在保障了较强的泛化性能的同时,也大幅降低了研发团队开发成本和缩短产品研发周期,为快速部署应用带来更多的可能性。

附:表 1 与表 2 分别给出了 CodeArts Snap 所采用的模型(PanGu-Coder)在 OpenAI Codex 发布的 Python 程序生成评测数据集 HumanEval 以及谷歌发布的 MBPP 两个函数级代码生成任务的数据集上的表现:

表 1 PanGu-Coder 在 HumanEval 上的一次通过率以及十次通过率

表 2 PanGu-Coder 在 MBPP 上的一次通过率以及十次通过率

邀测开放,即刻扫码体验!

华为内部研发对 CodeArts Snap 期待已久,一经上线就获得多个产品线的关注及积极试用。华为云 CodeArts Snap 目前已对外上线 VSCode 和 JetBrains 插件市场,支持 Python 和 Java,支持 PyCharm、IntelliJ 和 VSCode。现处于限时邀测阶段,感兴趣的小伙伴们快来扫码体验一下吧!

文章来自:PaaS 技术创新 Lab;PaaS 技术创新 Lab 隶属于华为云,致力于综合利用软件分析、数据挖掘、机器学习等技术,为软件研发人员提供下一代智能研发工具服务的核心引擎和智慧大脑。我们将聚焦软件工程领域硬核能力,不断构筑研发利器,持续交付高价值商业特性!加入我们,一起开创研发新 “境界”!

PaaS技术创新Lab主页链接:https://www.huaweicloud.com/lab/paas/home.html

相关链接:

【1】CodeArts Snap以IDE插件的形式提供服务,欢迎感兴趣的小伙伴点击https://devcloud.cn-north-4.huaweicloud.com/codeartssnap/apply注册使用!

【2】CodeArts Snap支持VSCode插件市场,详情请查看:https://marketplace.visualstudio.com/items?itemName=HuaweiCloud.vscode-codebot

点击关注,第一时间了解华为云新鲜技术~

CodeArts Snap:辅助你编程的神器的更多相关文章

  1. 读 RocketMQ 源码,学习并发编程三大神器

    笔者是 RocketMQ 的忠实粉丝,在阅读源码的过程中,学习到了很多编程技巧. 这篇文章,笔者结合 RocketMQ 源码,分享并发编程三大神器的相关知识点. 1 CountDownLatch 实现 ...

  2. scratch少儿编程第一季——01、初识图形化界面编程的神器

    各位小伙伴大家好: 说到2018年互联教育的热门事件,那就不得不提Scratch. 相信各位不关注信息技术领域的各位家长也都听说过这个东西. 对于小学阶段想要接触编程或信息技术学生来说,Scratch ...

  3. 结合RocketMQ 源码,带你了解并发编程的三大神器

    摘要:本文结合 RocketMQ 源码,分享并发编程三大神器的相关知识点. 本文分享自华为云社区<读 RocketMQ 源码,学习并发编程三大神器>,作者:勇哥java实战分享. 这篇文章 ...

  4. 《Node.js 高级编程》简介与第二章笔记

    <Node.js 高级编程> 作者简介 Pedro Teixerra 高产,开源项目程序员 Node 社区活跃成员,Node公司的创始人之一. 10岁开始编程,Visual Basic.C ...

  5. [小北De编程手记] : Lesson 03 - Selenium For C# 之 元素定位

    无论哪一种自动化测试的驱动框架(基于B/S,桌面应用,还是手机App).都应当具有一套优秀的元素定位技术.通常的自动化测试流程也可以简单的归结为是一个从被测试程序中识别或是定位元素以及执行操作和验证元 ...

  6. VS开发中的代码编写小技巧——避免重复代码编写的几种方法

    上一篇文章中程序员的幸福生活--有你的日子,每天都是情人节,收到了大家的很多好评.鼓励和祝福,非常感动,真诚的谢谢大家.也希望每个朋友都能保持一个积极向上的心态,去迎接丰富多彩的人生. 在开发过程中, ...

  7. 有哪些LabVIEW快捷键让你相见恨晚

    前言 任何一门工具,当你使用它到极致的时候,往往都朝着这样子的两个方向发展 1. 具有鼠标操作功能的软件,他的使用的极致就是脱离鼠标,迈向键盘 2. 主要是键盘操作的,他的极致就是脚本自动化,或者说一 ...

  8. eclipse加入git工具

    想必如今搞互联网编程的人没有人没有听过编程协作工具git了吧,命令行以下操作很方便.功能也很的强大. 可是对于java编程的人员,eclipse肯定是他们编程的神器(肯定是首选), 那么怎样在ecli ...

  9. asp.net命名规范

    以下命名规范是在编程中,可以辅助快速编程的良好方式之一,我一点点的整理出来,以便形成自己的编程规范.还有待完善... 0.产品命名规范: 结构 层次 产品 模块 功能 命名规则 UI(界面层) Web ...

  10. C++Primer第5版学习笔记(一)

    C++Primer第5版学习笔记(一) 第一.二章的重难点内容        这个笔记本主要记录了我在学习C++Primer(第5版,中文版)的过程中遇到的重难点及其分析.因为第一.二章都比较简单,因 ...

随机推荐

  1. Android网络请求(3) 网络请求框架OkHttp

    Android网络请求(3) 网络请求框架OkHttp 本节我们来讲解OkHtpp网络请求框架 什么是网络请求框架 在我的理解中,网络请求框架是为了方便我们更加便捷规范的进行网络请求所建的类,我们通过 ...

  2. c++ const和指针

    const int *p: 定义指针,指向的变量的值不能修改(指向整型常量或普通整型,但值不能通过指针修改) int const *p: 同上 int * const p=&a: 一直指向a, ...

  3. git@github.com: Permission denied (publickey). fatal: Could not read from remote repository.

    当我们拿到一天别人用的电脑,里面是上一位前辈的git ssh key,这时候我们要自己改,改完之后上传代码到远程repository时, 可能会报git@github.com: Permission ...

  4. Spring Boot实现任意位置的properties及yml文件内容配置与获取

    〇.参考资料 1.Spring Boot 中文乱码问题解决方案汇总 https://blog.51cto.com/u_15236724/5372824 2.spring boot读取自定义配置prop ...

  5. 【每日一题】【排序】2021年11月13日-215. 数组中的第K个最大元素※

    给定整数数组 nums 和整数 k,请返回数组中第 k 个最大的元素. 请注意,你需要找的是数组排序后的第 k 个最大的元素,而不是第 k 个不同的元素. 方法1:调库 class Solution ...

  6. 一图看懂Hadoop中的MapReduce与Spark的区别:从单机数据系统到分布式数据系统经历了哪些?

    今日博主思考了一个问题:Hadoop中的MapReduce与Spark他们之间到底有什么关系? 直到我看到了下面这张图 废话不多说先上图 我们知道,单机数据系统,在本地主机上针对数据有单机本地存储操作 ...

  7. [编程基础] Python列表解析总结

    在本教程中,我们将学习使用Python列表解析(list comprehensions)相关知识 1 使用介绍 列表解析是一种基于现有列表创建列表的句法结构.列表解析提供了创建列表的简洁方法.通常需要 ...

  8. [图像处理] YUV图像处理入门4

    9 yuv420图像截取 本程序中的函数主要是对YUV420P视频数据流的第一帧图像进行截取.类似opencv中的rect函数,函数的代码如下所示: /** * @file 9 yuv_clip.cp ...

  9. VMware搭建内网渗透环境

    网络结构: 攻击机:kali 192.168.1.103 DMZ区域:防火墙 WAN:192.168.1.104 LAN:192.168.10.10 winserver03 LAN:192.168.1 ...

  10. python 之路 37 Navicat 可视化软件使用、 pymysql模块使用

    多表查询的两种方法 方式1:连表操作 inner join 内连接 select * from emp inner join dep on emp.dep_id=dep.id; 只连接两张表中公有的数 ...