题目内容
(请给出正确答案)
[单选题]
不同的优化器的原理不尽相同,以下哪个优化器是可以为不同的参数设置不同的学习率,而不是针对每一个参数都用相同的学习率进行更新()
A.随机梯度下降算法
B.Adagrad优化器
C.动量优化器
D.小批量梯度下降算法
查看答案
如果结果不匹配,请 联系老师 获取答案
A.随机梯度下降算法
B.Adagrad优化器
C.动量优化器
D.小批量梯度下降算法
A.初始化参数(Parameter),子模块(Ce11),算子(Primitive)等组件,进行初始化的校验
B.construct,定义执行的过程。图模式时,会被编译成图来执行,没有语法限制
C.还有一些optim常用优化器、wrap常用网络包装函数等预定义Cell
D.bprop(可选),自定义模块的反向
A.Keras生成模型工具
B.keras数据处理工具
C.keras模型部署工具
D.keras内置优化器
A.体系原理
B.系统原理
C.集合原理
D.适用原理