【中英】【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第四周测验
【中英】【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第四周测验
上一篇:【课程1 - 第三周编程作业】※※※※※ 【回到目录】※※※※※下一篇:【课程1 - 第四周编程作业】
第4周测验-深度神经网络的关键概念
在实现前向传播和反向传播中使用的“cache”是什么?
- 【 】用于在训练期间缓存成本函数的中间值。
- 【
★】 我们用它传递前向传播中计算的变量到相应的反向传播步骤,它包含用于计算导数的反向传播的有用值。 - 【 】它用于跟踪我们正在搜索的超参数,以加速计算。
- 【 】 我们使用它将向后传播计算的变量传递给相应的正向传播步骤,它包含用于计算计算激活的正向传播的有用值。
the "cache" records values from the forward propagation units and sends it to the backward propagation units because it is needed to compute the chain rule derivatives.
“cache”记录来自正向传播单元的值并将其发送到反向传播单元,因为需要链式计算导数。以下哪些是“超参数”?
- 【
★】隐藏层的大小\(n^{[l]}\) - 【
★】学习率α - 【
★】迭代次数 - 【
★】神经网络中的层数L
博主注:我只列出了正确选项。
请注意:你可以查看Quora的这篇文章 或者 这篇博客.- 【
下列哪个说法是正确的?
- 【
★】 神经网络的更深层通常比前面的层计算更复杂的输入特征。 - 【 】神经网络的前面的层通常比更深层计算输入的更复杂的特性。
注意:您可以查看视频,我想用吴恩达的用美国有线电视新闻网的例子来解释这个。
- 【
向量化允许您在L层神经网络中计算前向传播,而不需要在层(l = 1,2,...,L)上显式的使用for-loop(或任何其他显式迭代循环),正确吗?
- 【 】正确
- 【
★】 错误
请注意:在层间计算中,我们不能避免for循环迭代。
博主注:请想一下输入的迭代次数的参数,在模型内部是用什么实现的?假设我们将\(n ^ {[l]}\)的值存储在名为layers的数组中,如下所示:layer_dims = [n_x,4,3,2,1]。 因此,第1层有四个隐藏单元,第2层有三个隐藏单元,依此类推。 您可以使用哪个for循环初始化模型参数?
for(i in range(1, len(layer_dims))):
parameter[‘W’ + str(i)] = np.random.randn(layers[i], layers[i - 1])) * 0.01
parameter[‘b’ + str(i)] = np.random.randn(layers[i], 1) * 0.01
下面关于神经网络的说法正确的是:.
- 【
★】层数L为4,隐藏层数为3。
注意:输入层(\(L ^ {[0]}\))不计数。
As seen in lecture, the number of layers is counted as the number of hidden layers + 1. The input and output layers are not counted as hidden layers.
正如视频中所看到的那样,层数被计为隐藏层数+1。输入层和输出层不计为隐藏层。- 【
在前向传播期间,在层\(l\)的前向传播函数中,您需要知道层\(l\)中的激活函数(Sigmoid,tanh,ReLU等)是什么, 在反向传播期间,相应的反向传播函数也需要知道第\(l\)层的激活函数是什么,因为梯度是根据它来计算的,正确吗?
- 【
★】 正确 - 【 】错误
During backpropagation you need to know which activation was used in the forward propagation to be able to compute the correct derivative.
在反向传播期间,您需要知道正向传播中使用哪种激活函数才能计算正确的导数。- 【
有一些功能具有以下属性:
(i) 使用浅网络电路计算函数时,需要一个大网络(我们通过网络中的逻辑门数量来度量大小),但是(ii)使用深网络电路来计算它,只需要一个指数较小的网络。真/假?
- 【
★】 正确 - 【 】错误
请注意:参见视频,完全相同的题。
博主注:没有读懂题,直接机器翻译,你可以在下面的英文原版自己读一下。- 【
在2层隐层神经网络中,下列哪个说法是正确的?
- 【
★】\(W^{[1]}\) 的维度为 (4, 4) - 【
★】\(b^{[1]}\) 的维度为 (4, 1) - 【
★】\(W^{[2]}\)的维度为 (3, 4) - 【
★】\(b^{[2]}\) 的维度为 (3, 1) - 【
★】\(b^{[3]}\) 的维度为 (1, 1) - 【
★】\(W^{[3]}\)的维度为 (1, 3)
请注意:请参阅图片。
博主注:找不到图片23333333。- 【
前面的问题使用了一个特定的网络,与层\(l\)有关的权重矩阵在一般情况下,\(W ^ {[1]}\)的维数是多少
- $W^{[l]} \(的维度是 (\)n{[l]}$,$n$)
请注意:请参阅图片
Week 4 Quiz - Key concepts on Deep Neural Networks
What is the "cache" used for in our implementation of forward propagation and backward propagation?
- It is used to cache the intermediate values of the cost function during training.
- We use it to pass variables computed during forward propagation to the corresponding backward propagation step. It contains useful values for backward propagation to compute derivatives.
- It is used to keep track of the hyperparameters that we are searching over, to speed up computation.
- We use it to pass variables computed during backward propagation to the corresponding forward propagation step. It contains useful values for forward propagation to compute activations.
the "cache" records values from the forward propagation units and sends it to the backward propagation units because it is needed to compute the chain rule derivatives.
Among the following, which ones are "hyperparameters"? (Check all that apply.) I only list correct options.
- size of the hidden layers n[l]
- learning rate α
- number of iterations
- number of layers L in the neural network
Note: You can check this Quora post or this blog post.
Which of the following statements is true?
- The deeper layers of a neural network are typically computing more complex features of the input than the earlier layers.
Correct - The earlier layers of a neural network are typically computing more complex features of the input than the deeper layers.
Note: You can check the lecture videos. I think Andrew used a CNN example to explain this.
- The deeper layers of a neural network are typically computing more complex features of the input than the earlier layers.
Vectorization allows you to compute forward propagation in an L-layer neural network without an explicit for-loop (or any other explicit iterative loop) over the layers l=1, 2, …,L. True/False?
- True
- False
Note: We cannot avoid the for-loop iteration over the computations among layers.
Assume we store the values for n[1] in an array called layers, as follows: layer_dims = [n_x, 4,3,2,1]. So layer 1 has four hidden units, layer 2 has 3 hidden units and so on. Which of the following for-loops will allow you to initialize the parameters for the model?
for(i in range(1, len(layer_dims))):
parameter[‘W’ + str(i)] = np.random.randn(layers[i], layers[i - 1])) * 0.01
parameter[‘b’ + str(i)] = np.random.randn(layers[i], 1) * 0.01
Consider the following neural network.
- The number of layers L is 4. The number of hidden layers is 3.
Note: The input layer (L[2]) does not count.
As seen in lecture, the number of layers is counted as the number of hidden layers + 1. The input and output layers are not counted as hidden layers.
During forward propagation, in the forward function for a layer l you need to know what is the activation function in a layer (Sigmoid, tanh, ReLU, etc.). During backpropagation, the corresponding backward function also needs to know what is the activation function for layer l, since the gradient depends on it. True/False?
- True
- False
During backpropagation you need to know which activation was used in the forward propagation to be able to compute the correct derivative.
There are certain functions with the following properties:
(i) To compute the function using a shallow network circuit, you will need a large network (where we measure size by the number of logic gates in the network), but (ii) To compute it using a deep network circuit, you need only an exponentially smaller network. True/False?
- True
- False
Note: See lectures, exactly same idea was explained.
Consider the following 2 hidden layer neural network:
Which of the following statements are True? (Check all that apply).
- W[3] will have shape (4, 4)
- b[4] will have shape (4, 1)
- W[5] will have shape (3, 4)
- b[6] will have shape (3, 1)
- b[7] will have shape (1, 1)
- W[8] will have shape (1, 3)
Note: See this image for general formulas.
Whereas the previous question used a specific network, in the general case what is the dimension of W[9], the weight matrix associated with layer l?
- W[10] has shape (n[l],n[l−1])
Note: See this image for general formulas.
【中英】【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第四周测验的更多相关文章
- 【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第二周测验【中英】
[中英][吴恩达课后测验]Course 1 - 神经网络和深度学习 - 第二周测验 第2周测验 - 神经网络基础 神经元节点计算什么? [ ]神经元节点先计算激活函数,再计算线性函数(z = Wx + ...
- 【吴恩达课后测验】Course 1 - 神经网络和深度学习 - 第一周测验【中英】
[吴恩达课后测验]Course 1 - 神经网络和深度学习 - 第一周测验[中英] 第一周测验 - 深度学习简介 和“AI是新电力”相类似的说法是什么? [ ]AI为我们的家庭和办公室的个人设备供电 ...
- 【中文】【deplearning.ai】【吴恩达课后作业目录】
[目录][吴恩达课后作业目录] 吴恩达深度学习相关资源下载地址(蓝奏云) 课程 周数 名称 类型 语言 地址 课程1 - 神经网络和深度学习 第1周 深度学习简介 测验 中英 传送门 无编程作业 编程 ...
- 吴恩达课后作业学习1-week4-homework-two-hidden-layer -1
参考:https://blog.csdn.net/u013733326/article/details/79767169 希望大家直接到上面的网址去查看代码,下面是本人的笔记 两层神经网络,和吴恩达课 ...
- 吴恩达课后作业学习1-week4-homework-multi-hidden-layer -2
参考:https://blog.csdn.net/u013733326/article/details/79767169 希望大家直接到上面的网址去查看代码,下面是本人的笔记 实现多层神经网络 1.准 ...
- 吴恩达课后作业学习2-week1-1 初始化
参考:https://blog.csdn.net/u013733326/article/details/79847918 希望大家直接到上面的网址去查看代码,下面是本人的笔记 初始化.正则化.梯度校验 ...
- 吴恩达课后作业学习2-week1-2正则化
参考:https://blog.csdn.net/u013733326/article/details/79847918 希望大家直接到上面的网址去查看代码,下面是本人的笔记 4.正则化 1)加载数据 ...
- 吴恩达老师机器学习课程chapter04——神经网络
吴恩达老师机器学习课程chapter04--神经网络 本文是非计算机专业新手的自学笔记,高手勿喷,欢迎指正与其他任何合理交流. 本文仅作速查备忘之用,对应吴恩达(AndrewNg)老师的机器学期课程第 ...
- 【吴恩达课后编程作业】第二周作业 - Logistic回归-识别猫的图片
1.问题描述 有209张图片作为训练集,50张图片作为测试集,图片中有的是猫的图片,有的不是.每张图片的像素大小为64*64 吴恩达并没有把原始的图片提供给我们 而是把这两个图片集转换成两个.h5文件 ...
- 吴恩达课后作业学习2-week3-tensorflow learning-1-基本概念
参考:https://blog.csdn.net/u013733326/article/details/79971488 希望大家直接到上面的网址去查看代码,下面是本人的笔记 到目前为止,我们一直在 ...
随机推荐
- go context 子Goroutine超时控制
context使用 Go语言第一形参通常都为context.Context类型,1. 传递上下文 2. 控制子Goroutine超时退出 3. 控制子Goroutine定时退出 package mai ...
- go map fatal error: concurrent map iteration and map write 读写锁与深度拷贝的坑
起因 从币安实时拉取交易对的数据,这里使用了 map,用于存放每个交易对的最新价格,由于 map 并不是并发安全的所以加了读写锁. 但系统有时候还是会发生 fatal error: concurren ...
- 开源组件DockerFIle老是Build失败,如何解决
推荐把外网地址替换为国内高速镜像 # 替换源地址 http://dl-cdn.alpinelinux.org/alpine === https://mirrors.aliyun.com/alpine ...
- Oracle AI应用的LLM模型典型配置
最近在做一些基于Oracle的一些AI应用测试工作,AI肯定离不开配置LLM相关,虽然是简单配置类,但实际还是遇到一些卡点,记录下来供今后参考. 1.配置Embedding模型 2.特殊语法传参JSO ...
- BUUCTF---天干地址+甲子
题目 直接参考天干地支表作结,转ASCII flag{Goodjob}
- DP——从入门到放弃 [Did Not Finish]
Part 00 dp 什么时候用? 首先,如果这题数据范围一眼 BFS/DFS/暴力/随机化 可以过,那么还写 dp 干什么 但是,但你决定这题要贪心时,我建议咱还是要看一下它对不对 整一个石子合并这 ...
- 【SpringCloud】SpringCloud Alibaba Nacos服务注册和配置中心
SpringCloud Alibaba Nacos服务注册和配置中心 感悟 注意:凡是cloud里面,你要开哪个组件,新加哪个注解,第一个就是启动,如@EnableFeignClients,第二个就是 ...
- 深入掌握FastAPI与OpenAPI规范的高级适配技巧
title: 深入掌握FastAPI与OpenAPI规范的高级适配技巧 date: 2025/03/30 01:16:11 updated: 2025/03/30 01:16:11 author: c ...
- WebKit Inside: 渲染树
经过CSS的匹配,就要进入渲染树的构建. 渲染树也叫RenderObject树,因为渲染树上每一个节点,都是RenderObject的子类. 首先来看一下RenderObject的继承类图. 1 Re ...
- sql server2008出现set 选项的设置不正确:"ARITHABORT”
( SELECT STUFF(( SELECT '','' + CODE FROM INVNEWSAL11 WHERE (MASTERI=BILRCV.SRCERI) OR (LINKERI IN ( ...