神经网络
rows 行 column 列
tensorflow全部是第一种形式.
tensor是张量,约等于矩阵.

这里是将z的值(z是logit值,即模型的原始输出)直接传给loss函数,目的是先跳过之前sigmoid函数的转换概率(即a的计算),在最后统一进行操作。
这是为了减低小数计算的误差.


初始值可以进行尝试.



方差是Jcv和Jtrain之间的差距的体现,bias是Jtrain和基准(如人类表现) 之间的差距.