反向传播和神经网络

反向传播

已经讲过用函数f定义一个分类器，函数f的参数是权重矩阵W，输入数据x并对你想要分类的每个类别都输出一个对应的得分向量。还可以定义一个损失函数（svm）对模型预测结果满意或是不满意的程度，然后用它定义一个总的损失函数L，L是由训练数据带来的损失结合一个正则项得到的，正则项表示模型的复杂程度，为了更好地泛化，我们倾向取简单的模型，所以现在想要找到与最小损失对应的参数W。想要最小化损失函数，为了做到这一点，我们想要找到L在W方向的梯度。即为最优化，沿着最陡的下降方向，即梯度的负方向，来一步步迭代，这样就能沿着损失函数从上往下，走到最低点。

梯度计算：有限差分估计，解析梯度计算。

如何计算复杂函数的解析梯度，用到一个叫计算图的框架。大体上，计算图就是我们用这类图来表示任意函数，其中图的节点，表示我们要执行的每一步计算。

好处：用计算图来表示一个函数，就能用反向传播技术，递归地调用链式法则来计算计算图中每个变量的梯度。