未发表

摘要

本文提出了一种基于元学习的方法,该方法从一系列相关的偏微分方程中学习快速解决问题。作者使用元学习(MAML和LEAP)来识别近似PDE解的神经网络的初始化,以便在新任务中快速最小化 PDE 的残差。由此产生的meta-PDE方法可以在几个梯度步骤内找到大多数问题的解,中等精度下可以比有限元方法快一个数量级。

介绍

目前,求解PDE最常用的方法是有限元分析,解由网格上的分段多项式表示。但是当网格变得精细时,会带来非常大的计算量。

本文的主要目的是使用基于梯度的元学习来加速使用物理信息神经网络(PINN)求解偏微分方程。这使得相对于有限元分析,能以较低计算成本实现比较准确的求解。尽管这些求解器具有初始训练成本,但它们可以在必须重复求解偏微分方程的问题中节省计算成本。

PINN的缺点:

PINN主要存在两个问题。首先,PINN尚未证明可以求解所有的偏微分方程。特别是,PINN难以求解解依赖时间的偏微分方程,其解表现出混沌行为或者湍流。其次,普通的PINN比经典数值方法慢很多。

本文试图通过应用元学习来降低优化成本来缓解第二个问题,用来减少在特定问题上找到准确解决方案所需的时间。

元学习的最新工作集中在如何构建学习算法,这些算法可以通过尽可能少的额外训练来适应新任务。本文主要涉及基于梯度的元学习算法,如MAML、REPTILE和LEAP。这些算法将元学习视为一个双层优化问题:内部学习循环优化给定任务的模型参数,外部学习循环在内部循环可能遇到的任务中优化内部循环的学习过程。

在这里借助一个下图描述我理解的元学习:元学习就是学习函数的函数,就像泛函。

本文的主要贡献:

引入了一个框架,通过结合元学习和PINNs来加速PDE求解。通过使用基于梯度的元学习技术(如 LEAP 和 MAML)来训练 PINN 初始化,该初始化在针对从一组相关任务中提取的任务进行优化时将快速收敛,从而加速偏微分方程求解。

问题的分布由偏微分方程的不同参数化组成,例如不同的边界条件、初始条件、控制方程中的系数,甚至偏微分方程的问题域。这很像以前看过的一篇通过迁移学习加速PINN训练点,那一个是预训练好后,微调最后一个线性层。

在部署期间,元学习模型可用于为分布中的偏微分方程生成快速解决方案。

Meta-PDE

Meta-PDE使用基于梯度的元学习来摊销从参数化偏微分方程分布中求解问题所需的训练时间。本文主要关注两种学习方法:LEAP和MAML。这里主要介绍基于LEAP的方法。

大多数 PDE 都可以通过它们的域、边界、表示控制方程的运算符和表示边界条件的运算符来完全指定。

Meta-PDE的输入规范如下图所示:

其中,算子可以直接提供,不需要特定的参数形式。以上的输入足以计算出对损失L的估计L^^^ ,L是积分形式,L^^^ 是离散形式的损失,当神经网络足够大时,我们允许两个损失不完全相等。

基于LEAP的方法学习模型初始化θ0 对于神经网络f0,然后可以训练它来近似PDE的单个参数化的解u。每个任务都由采样器和约束运算符为边界和损失指定。然后我们可以得到一系列任务的n个损失函数Li

每个内部任务的初始化为θ0 ,并由内部梯度更新规则更新。 在每次内部梯度更新期间,我们都会根据 LEAP 算法更新元梯度。

学习过程如下:

首先,展开内循环训练K次,为n个任务寻找近似解。然后,在内循环训练K次后,利用元梯度更新内部循环中学习模型的初始化θ0

其中 d(θ0 ; Mi ) 是任务i在其流形Mi上的梯度路径的距离。 MAML 涉及略有不同的损失函数,并且还学习每个参数的步长。

在部署期间:

“前向传递”使用随机优化的 K 步计算给定 PDE 参数化的近似解。K 梯度步骤可最大程度地减少任务 L(f) 的训练损失。如果模型已使用基于 LEAP 的元偏微分方程方法进行训练,它将从元学习模型初始化 θ0 开始训练。

人们也可以在K梯度步骤之外进一步微调模型,以延长求解时间为代价实现更高的求解精度。

注:在实验中,作者将梯度的上限设成了100。

实验结果

实验设置

实验结果

META-PDE的更多相关文章

  1. 常用 meta 整理

    <!-- 针对手持设备优化,主要是针对一些老的不识别viewport的浏览器,比如黑莓 --> <meta name="HandheldFriendly" con ...

  2. meta标签

    参考:http://www.jb51.net/web/158860.html META标签分两大部分:HTTP标题信息(HTTP-EQUIV)和页面描述信息(NAME). 一.HTTP标题信息(HTT ...

  3. Django模型类Meta元数据详解

    转自:https://my.oschina.net/liuyuantao/blog/751337 简介 使用内部的class Meta 定义模型的元数据,例如: from django.db impo ...

  4. H5 meta小结

    <meta name="viewport" content="width=device-width,initial-scale=1,minimum-scale=1, ...

  5. Asp.net 后台添加CSS、JS、Meta标签

    Asp.net 后台添加CSS.JS.Meta标签的写法,我这里写成函数方便以后使用.如果函数放在页面类中, Page参数也可以不要. 首先导入命名空间 using System.Web.UI.Htm ...

  6. 较为完整的meta

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  7. 浏览器内核控制Meta标签说明文档【转】

    背景介绍 由于众所周知的情况,国内的主流浏览器都是双核浏览器:基于Webkit内核用于常用网站的高速浏览.基于IE的内核用于兼容网银.旧版网站.以360的几款浏览器为例,我们优先通过Webkit内核渲 ...

  8. HTML <meta> 标签,搜索引擎

    关于Mate标签的详尽解释,请查看w3school 网址为:http://www.w3school.com.cn/tags/tag_meta.asp meta标签作用 META标签是HTML标记HEA ...

  9. 内核控制Meta标签:让360浏览器默认使用极速模式打开网页(转)

    为了让网站页面不那么臃肿,也懒的理IE了,同时兼顾更多的国内双核浏览器,在网页页头中添加了下面两行Meta控制标签. 1,网页头部加入 <meta name="renderer&quo ...

  10. 使用视 meta 标签来控制手机浏览器布局

    移动浏览器的Fennec一样呈现在一个虚拟的"窗口"页面(视),通常比屏幕宽.所以他们不需要去挤每个页面布局到一个小窗口(这会破坏许多非移动优化的网站) .用户可以平移和缩放才能看 ...

随机推荐

  1. centos7搭建postgresql-14

    环境:centos7  + pg 14 1:在postgresql官网下载页面,根据提示下载 https://www.postgresql.org/download/linux/redhat/ 2 连 ...

  2. ATE机台哪家强?

    这是IC男奋斗史的第36篇原创 本文2435字,预计阅读6分钟. ATE的基本概念 ATE是Automatic Test Equipment的缩写,翻译过来也就是自动化测试设备.在所有电子元器件的生产 ...

  3. 7.Java SDK源码分析系列笔记-JDK1.8 HashMap

    目录 1. 是什么 2. 如何使用 3. 原理分析 3.1. uml 3.2. 构造方法 3.3. put方法 3.3.1. 计算key的hash值 3.3.2. 第一次进来table肯定为空,那么扩 ...

  4. lora网关采集温室大棚温湿度数据案例

      1.概述 运用lora网关远程控制温室大棚内风机,日光灯,温湿度传感器等设备.可以实现远程获取现场环境的空气温湿度.土壤水分温度.二氧化碳浓度.光照强度可以自动控制温室湿帘风机.喷淋滴灌.加温补光 ...

  5. 利用PS调整图片光线明暗不均的情况

    根据光源角度,利用快速蒙版和渐变工具选择暗区,借用曲线工具调整亮度,达到整体平衡 快速蒙版 渐变工具 使用黑白渐变从光线暗部拉到光线亮部,使图片蒙上一层渐变的红色 反选 取消快速蒙版,此时图片上会出现 ...

  6. ETL中如何运用好MQ消息集成

    一.ETL的主要作用 ETL(Extract, Transform, Load)是数据仓库中的关键环节,其主要作用是将数据从源系统中抽取出来,经过转换和清洗后加载到数据仓库中.具体而言: Extrac ...

  7. POLIR-Society-Organization-Psychology-Attitude-Life: $\large \bm{Attitude} : 对待\bm{社会生活环境} 的 \bm{Attitude}$

    POLIR-Society-Organization-Life: 对待社会生活环境的正确态度 Question: 我认为对待社会生活环境的正确态度是: Imply when facing Non-Be ...

  8. SciTech-BigDataAIML-Model:模型-变量类型: 自变量 | 因变量 | 外生/内生 变量 | 参数 | 虚拟变量/哑变量 | 控制变量 | 协变量

    自变量/解释变量:决定因变量/被解释变量的变量. 因变量/被解释变量:被自变量/解释变量影响的变量. 内生变量:在模型内部被决定的变量. 外生变量:独立于模型的其他解释变量的解释变量,模型的其他解释变 ...

  9. [Linux]Centos系统离线安装unzip和zip --九五小庞

    问题手里有一台服务器不能联网但是需要使用zip和unzip.使用如下的方法就可以解决. 解决手里这台服务器的系统是CentOS但是哪个版本记不住了: cat /etc/redhat-release C ...

  10. 使用docker部署ELK日志框架

    前言:elk是由Elasticsearch.Logstash.Kibana三个开源组件组合形成的框架. Elasticsearch是个开源分布式搜索引擎,提供搜集.分析.存储数据三大功能.它的特点有: ...