02 Mar
memory of nn-01
猜测: 线性关系 \[C \propto n\] 可能有理论依据——线性层有 $n \times V$ 个参数,容量与参数量成正比,而与 V 关系较弱(博客固定 V=40),斜率的具体值可能依赖于学习率和训练epoch数。
研究、思考与生活//Research, thoughts and lives
猜测: 线性关系 \[C \propto n\] 可能有理论依据——线性层有 $n \times V$ 个参数,容量与参数量成正比,而与 V 关系较弱(博客固定 V=40),斜率的具体值可能依赖于学习率和训练epoch数。
这里是文章摘要,会显示在列表页
This is a sample blog post. Lorem ipsum I can’t remember the rest of lorem ipsum and don’t have an internet connectio...
This is a sample blog post. Lorem ipsum I can’t remember the rest of lorem ipsum and don’t have an internet connectio...
This is a sample blog post. Lorem ipsum I can’t remember the rest of lorem ipsum and don’t have an internet connectio...