<?xml version="1.0"?>

<?xml-stylesheet type="text/xsl" href="../../../xsl/template.xsl"?>

<html  xmlns="http://www.w3.org/1999/xhtml"
  xmlns:html="http://www.w3.org/1999/xhtml">

<head>
<title>Final</title>
</head>

<body bgcolor="#ffffff">

<table cellpadding="0" cellspacing="0" align="center" width="600"><tr><td>

<h2 align="center">Final</h2>
<p align="center">
<a target="_blank" href="http://www.croftsoft.com/people/david/">
David Wallace Croft</a>
</p>

<p align="center">
Neural Net Mathematics<br/>
Richard M. Golden, Ph.D.<br/>
U.T. Dallas
</p>

<p align="center">
2005-04-28
</p>

<p align="center">
<hr align="center"/>
</p>

<h2>
Problem 1
</h2>

<ol>

<li>
Objective Function
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    c(<html:b>w</html:b>)
    <mo>=</mo>
    <msub><mi>&#x03bc;</mi><mn>1</mn></msub>
    <mo>*</mo>
    <msup>
    <mrow>
    <mo>(</mo>
    <msub><mi>o</mi><mn>1</mn></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mn>1</mn></msub>
    <mo>)</mo>
    </mrow>
    <mn>2</mn>
    </msup>
    <mo>+</mo>
    <msub><mi>&#x03bc;</mi><mn>2</mn></msub>
    <mo>*</mo>
    <msup>
    <mrow>
    <mo>(</mo>
    <msub><mi>o</mi><mn>2</mn></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mn>2</mn></msub>
    <mo>)</mo>
    </mrow>
    <mn>2</mn>
    </msup>
  </mrow>
</math>
</p>
</li>

<li>
Response
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>r</mi><mi>k</mi></msub>
  </mrow>
  <mrow>
    <mo>&#x2261;</mo>
    <mi>r</mi>
    <mo>(</mo>
    <mi><html:b>w</html:b></mi>
    <mo>,</mo>
    <msub><mi><html:b>s</html:b></mi><mi>k</mi></msub>
    <mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mo>exp</mo>
    <mo>(</mo>
    <mi>-</mi>
    <msup><mi><html:b>w</html:b></mi><mo>T</mo></msup>
    <mo>*</mo>
    <msub><mi><html:b>s</html:b></mi><mi>k</mi></msub>
    <mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
Weight Update Rule
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>w</html:b></mi>
    (t<mo>+</mo>1)
    <mo>=</mo>
    <mi><html:b>w</html:b></mi>(t)
    <mo>+</mo><mo>&#x0394;</mo><mi><html:b>w</html:b></mi>
  </mrow>
</math>
</p>
</li>

<li>
Gradient Descent
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mo>&#x0394;</mo><mi><html:b>w</html:b></mi>
    <mo>=</mo>
    <mo>-</mo>
    <mi>&#x03b7;</mi>
    <mo>*</mo>
    <mo>&#x2207;</mo>c(<mi><html:b>w</html:b></mi>)
  </mrow>
</math>
</p>
</li>

<li>
Error
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>e</mi><mi>k</mi></msub>
    <mo>=</mo>
    <msub><mi>o</mi><mi>k</mi></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mi>k</mi></msub>
  </mrow>
</math>
</p>
</li>

<li>
Error Squared
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>f</mi><mi>k</mi></msub>
    <mo>=</mo>
    <msubsup><mi>e</mi><mi>k</mi><mn>2</mn></msubsup>
  </mrow>
</math>
</p>
</li>

<li>
Exponent
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>g</mi><mi>k</mi></msub>
    <mo>=</mo>
    <mi>-</mi>
    <msup><mi><html:b>w</html:b></mi><mo>T</mo></msup>
    <mo>*</mo>
    <msub><mi><html:b>s</html:b></mi><mi>k</mi></msub>
  </mrow>
</math>
</p>
</li>

<li>
Vectors
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>&#x03bc;</html:b></mi>
    <mo>=</mo>
    <mo>[</mo>
    <mtable>
    <mtr>
    <mtd>
      <msub><mi>&#x03bc;</mi><mn>1</mn></msub>
    </mtd>
    </mtr>
    <mtr>
    <mtd>
      <msub><mi>&#x03bc;</mi><mn>2</mn></msub>
    </mtd>
    </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
  <mo>,</mo>
  <mrow>
    <mi><html:b>e</html:b></mi>
    <mo>=</mo>
    <mo>[</mo>
    <mtable>
    <mtr>
    <mtd>
      <msub><mi>e</mi><mn>1</mn></msub>
    </mtd>
    </mtr>
    <mtr>
    <mtd>
      <msub><mi>e</mi><mn>2</mn></msub>
    </mtd>
    </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
  <mo>,</mo>
  <mrow>
    <mi><html:b>f</html:b></mi>
    <mo>=</mo>
    <mo>[</mo>
    <mtable>
    <mtr>
    <mtd>
      <msub><mi>f</mi><mn>1</mn></msub>
    </mtd>
    </mtr>
    <mtr>
    <mtd>
      <msub><mi>f</mi><mn>2</mn></msub>
    </mtd>
    </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
  <mo>,</mo>
  <mrow>
    <mi><html:b>g</html:b></mi>
    <mo>=</mo>
    <mo>[</mo>
    <mtable>
    <mtr>
    <mtd>
      <msub><mi>g</mi><mn>1</mn></msub>
    </mtd>
    </mtr>
    <mtr>
    <mtd>
      <msub><mi>g</mi><mn>2</mn></msub>
    </mtd>
    </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
  <mo>,</mo>
  <mrow>
    <mi><html:b>o</html:b></mi>
    <mo>=</mo>
    <mo>[</mo>
    <mtable>
    <mtr>
    <mtd>
      <msub><mi>o</mi><mn>1</mn></msub>
    </mtd>
    </mtr>
    <mtr>
    <mtd>
      <msub><mi>o</mi><mn>2</mn></msub>
    </mtd>
    </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
  <mo>,</mo>
  <mrow>
    <mi><html:b>r</html:b></mi>
    <mo>=</mo>
    <mo>[</mo>
    <mtable>
    <mtr>
    <mtd>
      <msub><mi>r</mi><mn>1</mn></msub>
    </mtd>
    </mtr>
    <mtr>
    <mtd>
      <msub><mi>r</mi><mn>2</mn></msub>
    </mtd>
    </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
</math>
</p>
</li>

<li>
Stimulus Matrix
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>S</html:b></mi>
    <mo>=</mo>
    <mo>[</mo>
    <mtable>
    <mtr>
    <mtd>
      <msub><mi><html:b>s</html:b></mi><mn>1</mn></msub>
    </mtd>
    <mtd>
      <msub><mi><html:b>s</html:b></mi><mn>2</mn></msub>
    </mtd>
    </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
</math>
</p>
</li>

<li>
Objective Function Revised
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    c(<html:b>w</html:b>)
    <mo>=</mo>
    <msup>
      <mrow><mi><html:b>&#x03bc;</html:b></mi></mrow>
      <mo>T</mo>
    </msup>
    <mo>*</mo>
    <mi><html:b>f</html:b></mi>
    <mo>=</mo>
    <msup>
      <mrow><mi><html:b>&#x03bc;</html:b></mi></mrow>
      <mo>T</mo>
    </msup>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <mi><html:b>e</html:b></mi>
    <mo>&#x2299;</mo>
    <mi><html:b>e</html:b></mi>
    <mo>)</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Chain Rule
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mo>&#x2207;</mo>c(<mi><html:b>w</html:b></mi>)
    <mo>=</mo>
    <msup><mrow>c'(<html:b>w</html:b>)</mrow><mo>T</mo></msup>
    <mo>=</mo>
    <msup>    
    <mrow>
    <mo>[</mo>
      c'(<html:b>f</html:b>)
    <mo>*</mo>
    <html:b>f</html:b>'(<html:b>e</html:b>)
    <mo>*</mo>
    <html:b>e</html:b>'(<html:b>r</html:b>)
    <mo>*</mo>
    <html:b>r</html:b>'(<html:b>g</html:b>)
    <mo>*</mo>
    <html:b>g</html:b>'(<html:b>w</html:b>)
    <mo>]</mo>
    </mrow>
    <mo>T</mo>
    </msup>
  </mrow>
</math>
</p>
</li>

<li>
First Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    c'(<html:b>f</html:b>)
    <mo>=</mo>
    <mo>(</mo>
    <msup>
      <mrow><mi><html:b>&#x03bc;</html:b></mi></mrow>
      <mo>T</mo>
    </msup>
    <mo>*</mo>
    <mi><html:b>f</html:b></mi>
    <mo>)</mo>
    <mo>'</mo>
    <mo>=</mo>
    <msup><mrow><mi><html:b>&#x03bc;</html:b></mi></mrow><mo>T</mo></msup>
  </mrow>
</math>
</p>
</li>

<li>
Second Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <html:b>f</html:b>'(<html:b>e</html:b>)
    <mo>=</mo>
    <mrow>
    <mo>(</mo>
    <mi><html:b>e</html:b></mi>
    <mo>&#x2299;</mo>
    <mi><html:b>e</html:b></mi>
    <mo>)</mo>
    <mo>'</mo>
    </mrow>
    <mo>=</mo>
    <mn>2</mn><mo>*</mo><html:b>diag</html:b>(<html:b>e</html:b>)
  </mrow>
</math>
</p>
</li>

<li>
Third Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <html:b>e</html:b>'(<html:b>r</html:b>)
    <mo>=</mo>
    <mo>(</mo>
    <mi><html:b>o</html:b></mi>
    <mo>-</mo>
    <mi><html:b>r</html:b></mi>
    <mo>)</mo>
    <mo>'</mo>
    <mo>=</mo>
    -<html:b>I</html:b>
  </mrow>
</math>
</p>
</li>

<li>
Fourth Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <html:b>r</html:b><mo>'</mo>(<html:b>g</html:b>)
    <mo>=</mo>
    <mo>(</mo>
    <mo>[</mo>
    <mtable>
      <mtr>
        <mtd>
          <mo>exp</mo>
          <mo>(</mo>
          <msub><mi>g</mi><mn>1</mn></msub>
          <mo>)</mo>
        </mtd>
      </mtr>
      <mtr>
        <mtd>
          <mo>exp</mo>
          <mo>(</mo>
          <msub><mi>g</mi><mn>2</mn></msub>
          <mo>)</mo>
        </mtd>
      </mtr>
    </mtable>
    <mo>]</mo>
    <mo>)</mo>
    <mo>'</mo>
    (<html:b>g</html:b>)
  </mrow>
  <mrow>
    <mo>=</mo>
    <mo>[</mo>
    <mtable>
      <mtr>
        <mtd>
          <mo>exp</mo>
          <mo>(</mo>
          <msub><mi>g</mi><mn>1</mn></msub>
          <mo>)</mo>
        </mtd>
        <mtd>
          0
        </mtd>
      </mtr>
      <mtr>
        <mtd>
          0
        </mtd>
        <mtd>
          <mo>exp</mo>
          <mo>(</mo>
          <msub><mi>g</mi><mn>2</mn></msub>
          <mo>)</mo>
        </mtd>
      </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mo>diag</mo>
    <mo>(</mo>
    <mi><html:b>r</html:b></mi>
    <mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
Fifth Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <html:b>g</html:b>'(<html:b>w</html:b>)
    <mo>=</mo>
    <mo>(</mo>
    <mo>-</mo>
    <mo>[</mo>
    <mtable>
      <mtr>
        <mtd>
          <msubsup><mi><html:b>s</html:b></mi><mn>1</mn><mo>T</mo></msubsup>
        </mtd>
      </mtr>
      <mtr>
        <mtd>
          <msubsup><mi><html:b>s</html:b></mi><mn>2</mn><mo>T</mo></msubsup>
        </mtd>
      </mtr>
    </mtable>
    <mo>]</mo>
    <mo>*</mo>
    <html:b>w</html:b>
    <mo>)</mo>
    <mo>'</mo>
    <mo>=</mo>
    <mo>-</mo>
    <mo>[</mo>
    <mtable>
      <mtr>
        <mtd>
          <msubsup><mi><html:b>s</html:b></mi><mn>1</mn><mo>T</mo></msubsup>
        </mtd>
      </mtr>
      <mtr>
        <mtd>
          <msubsup><mi><html:b>s</html:b></mi><mn>2</mn><mo>T</mo></msubsup>
        </mtd>
      </mtr>
    </mtable>
    <mo>]</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mo>-</mo>
    <msup>
      <mi><html:b>S</html:b></mi>
      <mo>T</mo>
    </msup>
  </mrow>
</math>
</p>
</li>

<li>
Combined Terms
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi>c</mi><mo>'</mo><mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mrow>
    <mo>[</mo>
    <msup><mrow><mi><html:b>&#x03bc;</html:b></mi></mrow><mo>T</mo></msup>
    <mo>]</mo>
    </mrow>
    <mo>*</mo>
    <mrow>
    <mo>[</mo>
    <mn>2</mn><mo>*</mo><html:b>diag</html:b>(<html:b>e</html:b>)
    <mo>]</mo>
    </mrow>
    <mo>*</mo>
    <mrow>
    <mo>[</mo>
    -<html:b>I</html:b>
    <mo>]</mo>
    </mrow>
    <mrow>
	    <mo>*</mo>
	    <mo>[</mo>
	    <mo><html:b>diag</html:b></mo>
	    <mo>(</mo>
	    <mi><html:b>r</html:b></mi>
	    <mo>)</mo>
	    <mo>]</mo>
    </mrow>
    <mo>*</mo>
    <mrow>
      <mo>[</mo>
	    <mo>-</mo>
	    <msup>
	      <mi><html:b>S</html:b></mi>
	      <mo>T</mo>
	    </msup>
      <mo>]</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Reduce
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi>c</mi><mo>'</mo><mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <mrow>
      <msup><mrow><mi><html:b>&#x03bc;</html:b></mi></mrow><mo>T</mo></msup>
    </mrow>
    <mrow>
      <mo>*</mo>
      <html:b>diag</html:b>
      <mo>(</mo>
      <mi><html:b>e</html:b></mi>
      <mo>)</mo>
	    <mo>*</mo>
	    <mo><html:b>diag</html:b></mo>
	    (<html:b>r</html:b>)
    </mrow>
    <mrow>
      <mo>*</mo>
	    <msup>
	      <mi><html:b>S</html:b></mi>
	      <mo>T</mo>
	    </msup>
    </mrow>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mn>2</mn>
    <mrow>
      <mo>*</mo>
      <msup>
        <mrow>
          <mo>(</mo>
          <mi><html:b>&#x03bc;</html:b></mi>
          <mo>&#x2299;</mo>
          <html:b>e</html:b>
          <mo>&#x2299;</mo>
          <html:b>r</html:b>
          <mo>)</mo>
        </mrow>
        <mo>T</mo>
      </msup>
    </mrow>
    <mrow>
      <mo>*</mo>
	    <msup>
	      <mi><html:b>S</html:b></mi>
	      <mo>T</mo>
	    </msup>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Transpose
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mo>&#x2207;</mo>c(<mi><html:b>w</html:b></mi>)
  </mrow>
  <mrow>
    <mo>=</mo>
    <msup>
      <mrow>
        <mi>c</mi><mo>'</mo><mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
      </mrow>
      <mo>T</mo>
    </msup>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <mi><html:b>S</html:b></mi>
    <mrow>
      <mo>*</mo>
      <mo>(</mo>
      <mrow><mi><html:b>&#x03bc;</html:b></mi></mrow>
      <mo>&#x2299;</mo>
      <html:b>e</html:b>
      <mo>&#x2299;</mo>
      <html:b>r</html:b>
      <mo>)</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Simplify
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mo>&#x2207;</mo>c(<mi><html:b>w</html:b></mi>)
    <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <mrow>
    <mo>[</mo>
    <mtable>
      <mtr>
        <mtd><msub><mi><html:b>s</html:b></mi><mn>1</mn></msub></mtd>
        <mtd><msub><mi><html:b>s</html:b></mi><mn>2</mn></msub></mtd>
      </mtr>
    </mtable>
    <mo>]</mo>
    </mrow>
    <mo>*</mo>
    <mrow>
    <mo>[</mo>
    <mtable>
    <mtr>
    <mtd>
    <msub><mi>&#x03bc;</mi><mn>1</mn></msub>
    <mo>*</mo>
    <msub><mi>e</mi><mn>1</mn></msub>
    <mo>*</mo>
    <msub><mi>r</mi><mn>1</mn></msub>
    </mtd>
    </mtr>
    <mtr>
    <mtd>
    <msub><mi>&#x03bc;</mi><mn>2</mn></msub>
    <mo>*</mo>
    <msub><mi>e</mi><mn>2</mn></msub>
    <mo>*</mo>
    <msub><mi>r</mi><mn>2</mn></msub>
    </mtd>
    </mtr>
    </mtable>
    <mo>]</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Simplify More
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mo>&#x2207;</mo>c(<mi><html:b>w</html:b></mi>)
    <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <mrow>
    <mo>[</mo>
    <mtable>
      <mtr>
        <mtd>
          <msub><mi>&#x03bc;</mi><mn>1</mn></msub>
          <mo>*</mo>
          <mo>(</mo>
          <msub><mi>o</mi><mn>1</mn></msub>
          <mo>-</mo>
          <msub><mi>r</mi><mn>1</mn></msub>
          <mo>)</mo>
          <mo>*</mo>
          <msub><mi>r</mi><mn>1</mn></msub>
          <mo>*</mo>
          <msub><mi><html:b>s</html:b></mi><mn>1</mn></msub>
          <mo>+</mo>
          <msub><mi>&#x03bc;</mi><mn>2</mn></msub>
          <mo>*</mo>
          <mo>(</mo>
          <msub><mi>o</mi><mn>2</mn></msub>
          <mo>-</mo>
          <msub><mi>r</mi><mn>2</mn></msub>
          <mo>)</mo>
          <mo>*</mo>
          <msub><mi>r</mi><mn>2</mn></msub>
          <mo>*</mo>
          <msub><mi><html:b>s</html:b></mi><mn>2</mn></msub>
        </mtd>
      </mtr>
    </mtable>
    <mo>]</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Weight Update Rule Final
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>w</html:b></mi>
    (t<mo>+</mo>1)
    <mo>=</mo>
    <mi><html:b>w</html:b></mi>(t)
    <mo>-</mo>
    <mn>2</mn>
    <mo>*</mo>
    <mi>&#x03b7;</mi>
    <mo>*</mo>    
    <mrow>
    <mo>[</mo>
    <mtable>
      <mtr>
        <mtd>
          <msub><mi>&#x03bc;</mi><mn>1</mn></msub>
          <mo>*</mo>
          <mo>(</mo>
          <msub><mi>o</mi><mn>1</mn></msub>
          <mo>-</mo>
          <msub><mi>r</mi><mn>1</mn></msub>
          <mo>)</mo>
          <mo>*</mo>
          <msub><mi>r</mi><mn>1</mn></msub>
          <mo>*</mo>
          <msub><mi><html:b>s</html:b></mi><mn>1</mn></msub>
          <mo>+</mo>
          <msub><mi>&#x03bc;</mi><mn>2</mn></msub>
          <mo>*</mo>
          <mo>(</mo>
          <msub><mi>o</mi><mn>2</mn></msub>
          <mo>-</mo>
          <msub><mi>r</mi><mn>2</mn></msub>
          <mo>)</mo>
          <mo>*</mo>
          <msub><mi>r</mi><mn>2</mn></msub>
          <mo>*</mo>
          <msub><mi><html:b>s</html:b></mi><mn>2</mn></msub>
        </mtd>
      </mtr>
    </mtable>
    <mo>]</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

</ol>

<h2>
Problem 2
</h2>

<ol>

<li>
Newton-Raphson Descent
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>w</html:b></mi>
    (t<mo>+</mo>1)
    <mo>=</mo>
    <mi><html:b>w</html:b></mi>(t)
    <mo>-</mo>
    <mn>&#x03b7;</mn>
    <mo>*</mo>
    <msup>
    <mrow>
    <mo>[</mo>
    <msup>
      <mo>&#x2207;</mo>
      <mn>2</mn>
    </msup>
    <mi>c</mi>
    <mfenced>
      <mrow>
        <mi><html:b>w</html:b></mi>
      </mrow>
    </mfenced>
    <mo>]</mo>
    </mrow>
    <mn>-1</mn>
    </msup>
    <mo>*</mo>
      <mrow>
      <mo>&#x2207;</mo>
      <mi>c</mi>
      <mfenced>
        <mrow>
          <mi><html:b>w</html:b></mi>
        </mrow>
      </mfenced>
      </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Hessian (Derivation)
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msup>
      <mo>&#x2207;</mo>
      <mn>2</mn>
    </msup>
    <mi>c</mi>
    <mrow>
      <mfenced>
        <mi><html:b>w</html:b></mi>
      </mfenced>
    </mrow>
    <mo>=</mo>
    <mfrac>
      <mrow>
        <msup>
          <mo>&#x2202;</mo>
          <mn>2</mn>
        </msup>
        <mi>c</mi>
        <mrow>
          <mo>(</mo>
            <mi><html:b>w</html:b></mi>
          <mo>)</mo>
        </mrow>
      </mrow>
      <mrow>
        <mo>&#x2202;</mo>
        <mi><html:b>w</html:b></mi>
        <mspace/>
        <mo>&#x2202;</mo>
        <mi><html:b>w</html:b></mi>
      </mrow>
    </mfrac>
    <mo>=</mo>
    <mfrac>
      <mrow>
        <mo>&#x2202;</mo>
        <mi>c</mi>
        <mo>'</mo>
        <mrow>
          <mo>(</mo>
            <mi><html:b>w</html:b></mi>
          <mo>)</mo>
        </mrow>
      </mrow>
      <mrow>
        <mo>&#x2202;</mo>
        <mi><html:b>w</html:b></mi>
      </mrow>
    </mfrac>
    <mo>=</mo>
    <mfrac>
      <mrow>
        <mo>&#x2202;</mo>
        <msup>
        <mrow>
        <mo>[</mo>
		    <mo>&#x2207;</mo>
		    <mi>c</mi>
		    <mrow>
		      <mfenced>
		        <mi><html:b>w</html:b></mi>
		      </mfenced>
		    </mrow>
		    <mo>]</mo>
		    </mrow>
		    <mo>T</mo>
		    </msup>
      </mrow>
      <mrow>
        <mo>&#x2202;</mo>
        <mi><html:b>w</html:b></mi>
      </mrow>
    </mfrac>
  </mrow>
</math>
</p>
</li>

<li>
From Problem 1
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi>c</mi><mo>'</mo><mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mn>2</mn>
    <mrow>
      <mo>*</mo>
      <msup>
        <mrow>
          <mo>(</mo>
          <mi><html:b>&#x03bc;</html:b></mi>
          <mo>&#x2299;</mo>
          <html:b>e</html:b>
          <mo>&#x2299;</mo>
          <html:b>r</html:b>
          <mo>)</mo>
        </mrow>
        <mo>T</mo>
      </msup>
    </mrow>
    <mrow>
      <mo>*</mo>
	    <msup>
	      <mi><html:b>S</html:b></mi>
	      <mo>T</mo>
	    </msup>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Define y
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mi><html:b>y</html:b></mi>
	<mrow>
	  <mo>=</mo>
	  <mi><html:b>&#x03bc;</html:b></mi>
	  <mo>&#x2299;</mo>
	  <html:b>e</html:b>
	  <mo>&#x2299;</mo>
	  <html:b>r</html:b>
	</mrow>
</math>
</p>
</li>

<li>
Define F
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>F</html:b></mi>
    <mo>=</mo>
    <msup>
	    <mi><html:b>S</html:b></mi>
	    <mo>T</mo>
	  </msup>
  </mrow>
</math>
</p>
</li>

<li>
Derivative of c in terms of y and F
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi>c</mi><mo>'</mo><mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mn>2</mn>
    <mrow>
      <mo>*</mo>
      <msup>
        <mi><html:b>y</html:b></mi>
        <mo>T</mo>
      </msup>
    </mrow>
    <mrow>
      <mo>*</mo>
      <mi><html:b>F</html:b></mi>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Hessian in terms of y and F
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
	<msup>
	  <mo>&#x2207;</mo>
	  <mn>2</mn>
	</msup>
	<mi>c</mi>
	<mrow>
	  <mfenced>
	    <mi><html:b>w</html:b></mi>
	  </mfenced>
	</mrow>
  <mrow>
    <mo>=</mo>
    <mi>c</mi><mo>''</mo><mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mn>2</mn>
	  <mo>*</mo>
	  <mo>(</mo>
	  <msup>
	    <mi><html:b>y</html:b></mi>
	    <mo>T</mo>
	  </msup>
	  <mo>*</mo>
	  <mi><html:b>F</html:b></mi>
	  <mo>)</mo>
	  <mo>'</mo>
  </mrow>
</math>
</p>
</li>

<li>
Identity from Marlow p216
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mo>(</mo>
    <msup>
      <mi><html:b>y</html:b></mi>
      <mo>T</mo>
    </msup>
    <mo>*</mo>
    <mi><html:b>F</html:b></mi>
    <mo>)</mo>
    <mo>'</mo>
    <mo>=</mo>
    <mo>(</mo>
    <msup>
      <mi><html:b>y</html:b></mi>
      <mo>T</mo>
    </msup>
    <mo>&#x2297;</mo>
    <msub>
      <mi><html:b>I</html:b></mi>
      <mi>s</mi>
    </msub>
    <mo>)</mo>
    <mo>*</mo>
    <mi><html:b>F</html:b></mi><mo>'</mo><mo>(</mo>
    <mi><html:b>w</html:b></mi><mo>)</mo>
    <mo>+</mo>
    <msup><mi><html:b>F</html:b></mi><mo>T</mo></msup>
    <mo>*</mo>
    <mi><html:b>y</html:b></mi><mo>'</mo><mo>(</mo>
    <mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
Zero term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>F</html:b></mi><mo>'</mo><mo>(</mo>
    <mi><html:b>w</html:b></mi><mo>)</mo>
    <mo>=</mo>
    <mn>0</mn>
  </mrow>
</math>
</p>
</li>

<li>
Apply identity
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msup>
      <mo>&#x2207;</mo>
      <mn>2</mn>
    </msup>
    <mi>c</mi>
    <mfenced>
      <mi><html:b>w</html:b></mi>
    </mfenced>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <msup><mi><html:b>F</html:b></mi><mo>T</mo></msup>
    <mo>*</mo>
    <mrow>
      <mi><html:b>y</html:b></mi><mo>'</mo><mo>(</mo>
      <mi><html:b>w</html:b></mi><mo>)</mo>
    </mrow>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <msup><mi><html:b>F</html:b></mi><mo>T</mo></msup>
    <mo>*</mo>
    <mrow>
      <mi><html:b>y</html:b></mi><mo>'</mo><mo>(</mo>
      <mi><html:b>w</html:b></mi><mo>)</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Chain rule
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>y</html:b></mi><mo>'</mo><mo>(</mo>
    <mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mi><html:b>y</html:b></mi><mo>'</mo>
      <mo>(</mo><mi><html:b>r</html:b></mi><mo>)</mo>
    <mo>*</mo>
    <mi><html:b>r</html:b></mi><mo>'</mo>
      <mo>(</mo><mi><html:b>g</html:b></mi><mo>)</mo>
    <mo>*</mo>
    <mi><html:b>g</html:b></mi><mo>'</mo>
      <mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
Function of r
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>y</html:b></mi><mo>'</mo><mo>(</mo>
    <mi><html:b>r</html:b></mi><mo>)</mo>
  </mrow>
	<mrow>
	  <mo>=</mo>
	  <mo>(</mo>
	  <mi><html:b>&#x03bc;</html:b></mi>
	  <mo>&#x2299;</mo>
	  <mi><html:b>e</html:b></mi>
	  <mo>&#x2299;</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>)</mo>
	  <mo>'</mo>
	  <mo>(</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>)</mo>
	</mrow>
	<mrow>
	  <mo>=</mo>
	  <mo>(</mo>
	  <mi><html:b>&#x03bc;</html:b></mi>
	  <mo>&#x2299;</mo>
	  <mo>(</mo>
	  <mi><html:b>o</html:b></mi>
	  <mo>-</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>)</mo>
	  <mo>&#x2299;</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>)</mo>
	  <mo>'</mo>
	  <mo>(</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>)</mo>
	</mrow>
	<mrow>
	  <mo>=</mo>
	  <mo><html:b>diag</html:b></mo>
	  <mo>(</mo>
	  <mi><html:b>&#x03bc;</html:b></mi>
	  <mo>&#x2299;</mo>
	  <mo>[</mo>
	  <mi><html:b>o</html:b></mi>
	  <mo>-</mo>
	  <mn>2</mn>
	  <mo>*</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>]</mo>
	  <mo>)</mo>
	</mrow>
</math>
</p>
</li>

<li>
From Problem 1
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <html:b>r</html:b><mo>'</mo>(<html:b>g</html:b>)
  <mrow>
    <mo>=</mo>
    <mo><html:b>diag</html:b></mo>
    <mo>(</mo>
    <mi><html:b>r</html:b></mi>
    <mo>)</mo>
  </mrow>
  <mo>,</mo>
  <mrow>
    <html:b>g</html:b>'(<html:b>w</html:b>)
    <mo>=</mo>
    <mo>-</mo>
    <msup>
      <mi><html:b>S</html:b></mi>
      <mo>T</mo>
    </msup>
  </mrow>
</math>
</p>
</li>

<li>
Combined terms
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>y</html:b></mi><mo>'</mo><mo>(</mo>
    <mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
	<mrow>
	  <mo>=</mo>
	  <mo><html:b>diag</html:b></mo>
	  <mo>(</mo>
	  <mi><html:b>&#x03bc;</html:b></mi>
	  <mo>&#x2299;</mo>
	  <mo>[</mo>
	  <mi><html:b>o</html:b></mi>
	  <mo>-</mo>
	  <mn>2</mn>
	  <mo>*</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>]</mo>
	  <mo>)</mo>
	</mrow>
  <mrow>
    <mo>*</mo>
    <mo><html:b>diag</html:b></mo>
    <mo>(</mo>
    <mi><html:b>r</html:b></mi>
    <mo>)</mo>
  </mrow>
  <mrow>
    <mo>*</mo>
    <mo>-</mo>
    <msup>
      <mi><html:b>S</html:b></mi>
      <mo>T</mo>
    </msup>
  </mrow>
	<mrow>
	  <mo>=</mo>
	  <mo>-</mo>
	  <mo><html:b>diag</html:b></mo>
	  <mo>(</mo>
	  <mi><html:b>&#x03bc;</html:b></mi>
	  <mo>&#x2299;</mo>
	  <mo>[</mo>
	  <mi><html:b>o</html:b></mi>
	  <mo>-</mo>
	  <mn>2</mn>
	  <mo>*</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>]</mo>
	  <mo>&#x2299;</mo>
	  <mi><html:b>r</html:b></mi>
	  <mo>)</mo>
	</mrow>
  <mrow>
    <mo>*</mo>
    <msup>
      <mi><html:b>S</html:b></mi>
      <mo>T</mo>
    </msup>
  </mrow>
</math>
</p>
</li>

<li>
Hessian
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msup>
      <mo>&#x2207;</mo>
      <mn>2</mn>
    </msup>
    <mi>c</mi>
    <mrow>
      <mfenced>
        <mi><html:b>w</html:b></mi>
      </mfenced>
    </mrow>
    <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <msup><mi><html:b>F</html:b></mi><mo>T</mo></msup>
		<mrow>
	    <mo>*</mo>
		  <mo>-</mo>
		  <mo><html:b>diag</html:b></mo>
		  <mo>(</mo>
		  <mi><html:b>&#x03bc;</html:b></mi>
		  <mo>&#x2299;</mo>
		  <mo>[</mo>
		  <mi><html:b>o</html:b></mi>
		  <mo>-</mo>
		  <mn>2</mn>
		  <mo>*</mo>
		  <mi><html:b>r</html:b></mi>
		  <mo>]</mo>
		  <mo>&#x2299;</mo>
		  <mi><html:b>r</html:b></mi>
		  <mo>)</mo>
		</mrow>
	  <mrow>
	    <mo>*</mo>
	    <msup>
	      <mi><html:b>S</html:b></mi>
	      <mo>T</mo>
	    </msup>
	  </mrow>
    <mo>=</mo>
    <mn>-2</mn>
    <mo>*</mo>
    <mi><html:b>S</html:b></mi>
		<mrow>
	    <mo>*</mo>
		  <mo><html:b>diag</html:b></mo>
		  <mo>(</mo>
		  <mi><html:b>&#x03bc;</html:b></mi>
		  <mo>&#x2299;</mo>
		  <mo>[</mo>
		  <mi><html:b>o</html:b></mi>
		  <mo>-</mo>
		  <mn>2</mn>
		  <mo>*</mo>
		  <mi><html:b>r</html:b></mi>
		  <mo>]</mo>
		  <mo>&#x2299;</mo>
		  <mi><html:b>r</html:b></mi>
		  <mo>)</mo>
		</mrow>
	  <mrow>
	    <mo>*</mo>
	    <msup>
	      <mi><html:b>S</html:b></mi>
	      <mo>T</mo>
	    </msup>
	  </mrow>
	</mrow>
</math>
</p>
</li>

<li>
<p align="justify">
Newton-Raphson Descent requires the inverse of the Hessian.  The inverse of
the Hessian exists if the Hessian is positive definite [Haykin p151].
The Hessian is positive definite if the input signal vectors (s) span the
d-dimensional real vector space [Golden p367].
</p>
</li>

</ol>

<h2>
Problem 3
</h2>

<ol>

<li>
Probability Space
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mo>(</mo>
  <msub>
    <mo>&#x03A9;</mo>
    <mi>x</mi>
  </msub>
  <mo>,</mo>
  <msub>
    <mn>F</mn>
    <mi>x</mi>
  </msub>
  <mo>,</mo>
	<msub><mi>&#x03bc;</mi><mi>x</mi></msub>
  <mo>)</mo>
  <mo>,</mo>
	<msub><mi>&#x03bc;</mi><mi>x</mi></msub>
	<mo>(</mo>
  <msub>
    <mo>&#x03A9;</mo>
    <mi>x</mi>
  </msub>
	<mo>)</mo>
	<mo>=</mo>
	<mn>1</mn>  
</math>
</p>
</li>

<li>
Dominating Measure
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
	<msub><mi>&#x03bc;</mi><mi>x</mi></msub>
	<mo>=</mo>
	<msub><mi>&#x03bc;</mi><mi>s</mi></msub>
	<mo>*</mo>
	<msub><mi>&#x03bc;</mi><mi>o</mi></msub>
	<mo>*</mo>
	<msub><mi>&#x03bc;</mi><mi>&#x03bc;</mi></msub>
</math>
</p>
</li>

<li>
Joint Density
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
	<msubsup>
	  <mi>p</mi>
	  <mi>s,o</mi>
	  <mo>*</mo>
	</msubsup>
	<mo>(</mo>
	<msub>
		<mover accent="true">
		  <mi><html:b>s</html:b></mi>
		  <mo>~</mo>
		</mover>
		<mi>t</mi>
	</msub>
	<mo>,</mo>
	<msub>
		<mover accent="true">
		  <mi>o</mi>
		  <mo>~</mo>
		</mover>
		<mi>t</mi>
	</msub>
	<mo>)</mo>
	<mo>=</mo>
	<mi>p</mi>
	<mo>(</mo>
	<msub><mi>o</mi><mi>t</mi></msub>
	<mo>|</mo>
	<msub><mi><html:b>s</html:b></mi><mi>t</mi></msub>
	<mo>)</mo>
	<mo>*</mo>
	<mi>p</mi>
	<mo>(</mo>
	<msub><mi><html:b>s</html:b></mi><mi>t</mi></msub>
	<mo>)</mo>
</math>
</p>
</li>

<li>
Measurable Function
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
	<mi>g</mi>
	<mo>(</mo>
	<mover accent="true">
	  <mi><html:b>x</html:b></mi>
	  <mo>~</mo>
	</mover>
	<mo>)</mo>
	<mo>=</mo>
	<mo>-</mo>
	<msub>
		<mover accent="true">
		  <mi>&#x03bc;</mi>
		  <mo>~</mo>
		</mover>
		<mi>t</mi>
	</msub>
	<mo>*</mo>
	<mo>log</mo>
	<mo>(</mo>
	<msubsup>
	  <mi>p</mi>
	  <mi>s,o</mi>
	  <mo>*</mo>
	</msubsup>
	<mo>(</mo>
	<msub>
		<mover accent="true">
		  <mi><html:b>s</html:b></mi>
		  <mo>~</mo>
		</mover>
		<mi>t</mi>
	</msub>
	<mo>,</mo>
	<msub>
		<mover accent="true">
		  <mi>o</mi>
		  <mo>~</mo>
		</mover>
		<mi>t</mi>
	</msub>
	<mo>)</mo>
	<mo>)</mo>
</math>
</p>
</li>

<li>
Expectation
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
	<mo>E</mo>
	<mo>{</mo>
	<mi>g</mi>
	<mo>(</mo>
	<mover accent="true">
	  <mi><html:b>x</html:b></mi>
	  <mo>~</mo>
	</mover>
	<mo>)</mo>
	<mo>}</mo>
	<mo>=</mo>
	<munder>
	  <mo>&#x222b;</mo>
	  <mrow>
	    <mi><html:b>x</html:b></mi>
	    <mo>&#x2208;</mo>
	    <msub>
	      <mn>&#x03A9;</mn>
	      <mi>x</mi>
	    </msub>
	  </mrow>
	</munder>
	<mi>g</mi>
	<mo>(</mo>
	<html:b>x</html:b>
	<mo>)</mo>
	<mo>*</mo>
	<msubsup><mi>p</mi><mi>x</mi><mo>*</mo></msubsup>
	<mo>(</mo>
	<html:b>x</html:b>
	<mo>)</mo>
	d<msub><mi>&#x03bc;</mi><mi>x</mi></msub>
	<mo>(</mo>
	<html:b>x</html:b>
	<mo>)</mo>
</math>
</p>
</li>

<li>
Summations and Riemann Integrals
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
	<mo>E</mo>
	<mo>{</mo>
	<mi>g</mi>
	<mo>(</mo>
	<mover accent="true">
	  <mi><html:b>x</html:b></mi>
	  <mo>~</mo>
	</mover>
	<mo>)</mo>
	<mo>}</mo>
	<mo>=</mo>
	<munder>
	  <mo>&#931;</mo>
	  <mrow>
	    <mi><html:b>s</html:b></mi>
	    <mo>&#x2208;</mo>
      <mn>&#x03A9;</mn>
	  </mrow>
	</munder>
	&#160;
	<munder>
	  <mo>&#931;</mo>
	  <mrow>
	    <mi>&#x03bc;</mi>
	    <mo>&#x2208;</mo>
	    <mo>{</mo>
	    <mn>0</mn>
	    <mo>,</mo>
	    <mn>1</mn>
	    <mo>}</mo>
	  </mrow>
	</munder>
	&#160;
	<munder>
	  <mo>&#x222b;</mo>
    <mi>o</mi>
	</munder>
	<mo>-</mo>
	<msub>
    <mi>&#x03bc;</mi>
		<mi>t</mi>
	</msub>
	<mo>*</mo>
	<mo>log</mo>
	<mo>(</mo>
	<msubsup>
	  <mi>p</mi>
	  <mi>s,o</mi>
	  <mo>*</mo>
	</msubsup>
	<mo>(</mo>
	<msub>
    <mi><html:b>s</html:b></mi>
		<mi>t</mi>
	</msub>
	<mo>,</mo>
	<msub>
    <mi>o</mi>
		<mi>t</mi>
	</msub>
	<mo>)</mo>
	<mo>)</mo>
	<mo>*</mo>
	<msubsup>
	  <mi>p</mi>
	  <mi>s,o</mi>
	  <mo>*</mo>
	</msubsup>
	<mo>(</mo>
	<msub>
    <mi><html:b>s</html:b></mi>
		<mi>t</mi>
	</msub>
	<mo>,</mo>
	<msub>
    <mi>o</mi>
		<mi>t</mi>
	</msub>
	<mo>)</mo>
	<mo>*</mo>
	<msub>
  	<mi>p</mi>
    <mi>&#x03bc;</mi>
  </msub>
	&#160;
	<mo>d</mo>
	<mi>o</mi>
</math>
</p>
</li>

</ol>

<p align="justify">
p<sub>x</sub><sup>*</sup> is a measurable function because it is piecewise continuous on
R<sup>d</sup>.
</p>

<h2>
Problem 4
</h2>

<ol>

<li>
Objective Function
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mrow>
      <msub><mi>l</mi><mi>n</mi></msub>
      <mo>(</mo>
      <mi><html:b>&#961;</html:b></mi>
      <mo>)</mo>
    </mrow>
    <mo>=</mo>
    <mfrac><mn>1</mn><mi>n</mi></mfrac>
    <mo>*</mo>
    <munderover>
      <mo form="prefix" movablelimits="false">&#931;</mo>
      <mrow>
        <mi>t</mi>
        <mo>=</mo>
        <mn>1</mn>
      </mrow>
      <mrow>
        <mi>n</mi>
      </mrow>
    </munderover>
    <mo>[</mo>
    <msub>
      <mi>&#x03bc;</mi>
      <mi>t</mi>
    </msub>
    <mo>*</mo>
    <msup>
      <mrow>
        <mo>(</mo>
        <msub>
          <mi>o</mi>
          <mi>t</mi>
        </msub>
        <mo>-</mo>
        <msub>
          <mi>r</mi>
          <mi>t</mi>
        </msub>
        <mo>)</mo>
      </mrow>
      <mn>2</mn>
    </msup>
    <mo>+</mo>
    <mi>&#955;</mi>
    <mo>*</mo>
    <msup>
      <mrow>
        <mo>&#x2016;</mo>
        <msub>
          <mi><html:b>h</html:b></mi>
          <mi>t</mi>
        </msub>
        <mo>&#x2016;</mo>
      </mrow>
      <mn>2</mn>
    </msup>
    <mo>]</mo>
  </mrow>
</math>
</p>
</li>

<li>
Squashing Function
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mo>&#x03c3;</mo>
  <mo>(</mo>
  <mi>x</mi>
  <mo>)</mo>
  <mo>=</mo>
  <mfrac>
  <mn>2</mn>
  <mrow>
    <mn>1</mn>
    <mo>+</mo>
    <msup>
      <mo>&#8519;</mo>
      <mi>-x</mi>
    </msup>
  </mrow>
  </mfrac>
  <mo>-</mo>
  <mn>1</mn>
  <mo>=</mo>
  <mfrac>
  <mrow>
    <mn>1</mn>
    <mo>-</mo>
    <msup>
      <mo>&#8519;</mo>
      <mi>-x</mi>
    </msup>
  </mrow>
  <mrow>
    <mn>1</mn>
    <mo>+</mo>
    <msup>
      <mo>&#8519;</mo>
      <mi>-x</mi>
    </msup>
  </mrow>
  </mfrac>
  <mo>=</mo>
  <mo>tanh</mo>
  <mo>(</mo>
  <mfrac>
    <mi>x</mi>
    <mn>2</mn>
  </mfrac>
  <mo>)</mo>
</math>
</p>
</li>

<li>
Derivative of Squashing Function
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mo>&#x03c3;</mo>
  <mo>'</mo>
  <mo>(</mo>
  <mi>x</mi>
  <mo>)</mo>
  <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <mo>-</mo>
    <msup>
    <mrow>
      <mo>(</mo>
      <mn>1</mn>
      <mo>+</mo>
      <msup>
        <mo>&#8519;</mo>
        <mi>-x</mi>
      </msup>
      <mo>)</mo>
    </mrow>
    <mn>-2</mn>
    </msup>
    <mo>*</mo>
    <msup>
      <mrow>
        <mo>-</mo>
        <mo>&#8519;</mo>
      </mrow>
      <mi>-x</mi>
    </msup>
  <mo>=</mo>
  <mfrac>
    <mn>1</mn>
    <mn>2</mn>
  </mfrac>
  <mo>*</mo>
  <mfrac>
  <mrow>
    <mn>4</mn>
    <mo>*</mo>
    <msup>
      <mo>&#8519;</mo>
      <mi>-x</mi>
    </msup>
  </mrow>
  <mrow>
    <msup>
    <mrow>
      <mo>(</mo>
      <mn>1</mn>
      <mo>+</mo>
      <msup>
        <mo>&#8519;</mo>
        <mi>-x</mi>
      </msup>
      <mo>)</mo>
    </mrow>
    <mn>2</mn>
    </msup>
  </mrow>
  </mfrac>
  <mo>=</mo>
  <mfrac>
    <mn>1</mn>
    <mn>2</mn>
  </mfrac>
  <mo>*</mo>
  <mfrac>
  <mrow>
    <msup>
    <mrow>
      <mo>(</mo>
      <mn>1</mn>
      <mo>+</mo>
      <msup>
        <mo>&#8519;</mo>
        <mi>-x</mi>
      </msup>
      <mo>)</mo>
    </mrow>
    <mn>2</mn>
    </msup>
    <mo>-</mo>
    <msup>
    <mrow>
      <mo>(</mo>
      <mn>1</mn>
      <mo>-</mo>
      <msup>
        <mo>&#8519;</mo>
        <mi>-x</mi>
      </msup>
      <mo>)</mo>
    </mrow>
    <mn>2</mn>
    </msup>
  </mrow>
  <mrow>
    <msup>
    <mrow>
      <mo>(</mo>
      <mn>1</mn>
      <mo>+</mo>
      <msup>
        <mo>&#8519;</mo>
        <mi>-x</mi>
      </msup>
      <mo>)</mo>
    </mrow>
    <mn>2</mn>
    </msup>
  </mrow>
  </mfrac>
  <mo>=</mo>
  <mfrac>
    <mn>1</mn>
    <mn>2</mn>
  </mfrac>
  <mo>*</mo>
  <mo>(</mo>
  <mn>1</mn>
  <mo>-</mo>
  <msup>
    <mrow>
      <mi>&#x03c3;</mi>
      <mo>(</mo>
      <mi>x</mi>
      <mo>)</mo>
    </mrow>
    <mn>2</mn>
  </msup>
  <mo>)</mo>
</math>
</p>
</li>

<li>
Weight Update Rule for Output Layer
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>w</html:b></mi>
    <mo>(</mo>
    <mi>k</mi>
    <mo>+</mo>
    <mn>1</mn>
    <mo>)</mo>
    <mo>=</mo>
    <mi><html:b>w</html:b></mi>
    <mo>(</mo>
    <mi>k</mi>
    <mo>)</mo>
    <mo>-</mo>
    <mi>&#x03b7;</mi>
    <mo>*</mo>
    <mrow>
      <mo>&#x2207;</mo>
      <msub><mi>l</mi><mi>n</mi></msub>
      <mo>(</mo>
      <mi><html:b>w</html:b></mi>
      <mo>)</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Weighted Sum to Output Neuron
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>a</mi><mi>t</mi></msub>
    <mo>=</mo>
    <msup><mi><html:b>w</html:b></mi><mo>T</mo></msup>
    <mo>*</mo>
    <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
  </mrow>
</math>
</p>
</li>

<li>
Output Neuron Response
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>r</mi><mi>t</mi></msub>
    <mo>=</mo>
    <mo>&#x03c3;</mo>
    <mo>(</mo>
    <msub><mi>a</mi><mi>t</mi></msub>
    <mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
Error
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>e</mi><mi>t</mi></msub>
    <mo>=</mo>
    <msub><mi>o</mi><mi>t</mi></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mi>t</mi></msub>
  </mrow>
</math>
</p>
</li>

<li>
Error Squared
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>f</mi><mi>t</mi></msub>
    <mo>=</mo>
    <msubsup><mi>e</mi><mi>t</mi><mn>2</mn></msubsup>
  </mrow>
</math>
</p>
</li>

<li>
Observable Error Squared
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>g</mi><mi>t</mi></msub>
    <mo>=</mo>
    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
    <mo>*</mo>
    <msub><mi>f</mi><mi>t</mi></msub>
  </mrow>
</math>
</p>
</li>

<li>
Chain Rule
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>g</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
    <mo>=</mo>
    <msub><mi>g</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>f</mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi>f</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>e</mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi>e</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>r</mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi>r</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>a</mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi>a</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
First Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>g</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>f</mi><mi>t</mi></msub><mo>)</mo>
    <mo>=</mo>
    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
  </mrow>
</math>
</p>
</li>

<li>
Second Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>f</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>e</mi><mi>t</mi></msub><mo>)</mo>
    <mo>=</mo>
    <mn>2</mn>
    <mo>*</mo>
    <msub><mi>e</mi><mi>t</mi></msub>
  </mrow>
</math>
</p>
</li>

<li>
Third Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>e</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>r</mi><mi>t</mi></msub><mo>)</mo>
    <mo>=</mo>
    <mn>-1</mn>
  </mrow>
</math>
</p>
</li>

<li>
Fourth Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>r</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>a</mi><mi>t</mi></msub><mo>)</mo>
    <mo>=</mo>
    <mfrac>
      <mn>1</mn>
      <mn>2</mn>
    </mfrac>
    <mo>*</mo>
    <mo>(</mo>
    <mn>1</mn>
    <mo>-</mo>
    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
    <mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
Fifth Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>a</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  <mrow>
    <mo>=</mo>
    <msubsup><mi><html:b>h</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
  </mrow>
</math>
</p>
</li>

<li>
Combined Terms
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi>g</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><mi><html:b>w</html:b></mi><mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
    <mo>*</mo>
    <mn>2</mn>
    <mo>*</mo>
    <msub><mi>e</mi><mi>t</mi></msub>
    <mo>*</mo>
    <mn>-1</mn>
    <mo>*</mo>
    <mrow>
    <mfrac>
      <mn>1</mn>
      <mn>2</mn>
    </mfrac>
    <mo>*</mo>
    <mo>(</mo>
    <mn>1</mn>
    <mo>-</mo>
    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
    <mo>)</mo>
    </mrow>
    <mo>*</mo>
    <msubsup><mi><html:b>h</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
  </mrow>
  <mrow>
    <mo>=</mo>
    <msub>
      <mrow>
        <mo>-</mo>
        <mi>&#x03bc;</mi>
      </mrow>
      <mi>t</mi>
    </msub>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <msub><mi>o</mi><mi>t</mi></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mi>t</mi></msub>
    <mo>)</mo>
    </mrow>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <mn>1</mn>
    <mo>-</mo>
    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
    <mo>)</mo>
    </mrow>
    <mo>*</mo>
    <msubsup><mi><html:b>h</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
  </mrow>
</math>
</p>
</li>

<li>
Weight Gradient for Output Layer
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mo>&#x2207;</mo>
    <msub><mi>l</mi><mi>n</mi></msub>
    <mo>(</mo>
    <mi><html:b>w</html:b></mi>
    <mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mfrac><mn>1</mn><mi>n</mi></mfrac>
    <mo>*</mo>
    <munderover>
      <mo form="prefix" movablelimits="false">&#931;</mo>
      <mrow>
        <mi>t</mi>
        <mo>=</mo>
        <mn>1</mn>
      </mrow>
      <mrow>
        <mi>n</mi>
      </mrow>
    </munderover>
    <mo>[</mo>
    <msub>
      <mrow>
        <mo>-</mo>
        <mi>&#x03bc;</mi>
      </mrow>
      <mi>t</mi>
    </msub>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <msub><mi>o</mi><mi>t</mi></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mi>t</mi></msub>
    <mo>)</mo>
    </mrow>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <mn>1</mn>
    <mo>-</mo>
    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
    <mo>)</mo>
    </mrow>
    <mo>*</mo>
    <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
    <mo>]</mo>
  </mrow>
</math>
</p>
</li>

<li>
Weight Update Rule for Output Layer Complete
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>w</html:b></mi>
    <mo>(</mo>
    <mi>k</mi>
    <mo>+</mo>
    <mn>1</mn>
    <mo>)</mo>
  </mrow>
  <mo>=</mo>
  <mrow>
    <mi><html:b>w</html:b></mi>
    <mo>(</mo>
    <mi>k</mi>
    <mo>)</mo>
  </mrow>
  <mrow>
    <mo>+</mo>
    <mi>&#x03b7;</mi>
    <mo>*</mo>
    <mfrac><mn>1</mn><mi>n</mi></mfrac>
    <mo>*</mo>
    <munderover>
      <mo form="prefix" movablelimits="false">&#931;</mo>
      <mrow>
        <mi>t</mi>
        <mo>=</mo>
        <mn>1</mn>
      </mrow>
      <mrow>
        <mi>n</mi>
      </mrow>
    </munderover>
    <mo>[</mo>
    <msub>
      <mrow>
        <mi>&#x03bc;</mi>
      </mrow>
      <mi>t</mi>
    </msub>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <msub><mi>o</mi><mi>t</mi></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mi>t</mi></msub>
    <mo>)</mo>
    </mrow>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <mn>1</mn>
    <mo>-</mo>
    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
    <mo>)</mo>
    </mrow>
    <mo>*</mo>
    <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
    <mo>]</mo>
  </mrow>
</math>
</p>
</li>

<li>
Hidden Layer Weight Vector
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>v</html:b></mi>
    <mo>=</mo>
    <mo><html:b>vec</html:b></mo>
    <mo>(</mo>
    <mo><html:b>V</html:b></mo>
    <mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
Weight Update Rule for Hidden Layer
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>v</html:b></mi>
    (t<mo>+</mo>1)
    <mo>=</mo>
    <mi><html:b>v</html:b></mi>(t)
    <mo>-</mo>
    <mi>&#x03b7;</mi>
    <mo>*</mo>
    <mrow>
      <mo>&#x2207;</mo>
      <msub><mi>l</mi><mi>n</mi></msub>
      <mo>(</mo>
      <mi><html:b>v</html:b></mi>
      <mo>)</mo>
    </mrow>
  </mrow>
</math>
</p>
</li>

<li>
Weighted Sum to Hidden Layer
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi><html:b>b</html:b></mi><mi>t</mi></msub>
    <mo>=</mo>
    <mi><html:b>V</html:b></mi>
    <mo>*</mo>
    <msub><mi><html:b>s</html:b></mi><mi>t</mi></msub>
  </mrow>
</math>
</p>
</li>

<li>
Hidden Layer
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
    <mo>=</mo>
    <mo><html:b>&#x03c3;</html:b></mo>
    <mo>(</mo>
    <msub><mi><html:b>b</html:b></mi><mi>t</mi></msub>
    <mo>)</mo>
  </mrow>
</math>
</p>
</li>

<li>
Normalization Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub>
    <mi>c</mi>
    <mi>t</mi>
  </msub>
  <mo>=</mo>
  <mrow>
    <mi>&#955;</mi>
    <mo>*</mo>
    <msup>
      <mrow>
        <mo>&#x2016;</mo>
        <msub>
          <mi><html:b>h</html:b></mi>
          <mi>t</mi>
        </msub>
        <mo>&#x2016;</mo>
      </mrow>
      <mn>2</mn>
    </msup>
  </mrow>
  <mo>=</mo>
  <mi>&#955;</mi>
  <mo>*</mo>
  <msubsup>
    <mi><html:b>h</html:b></mi>
    <mi>t</mi>
    <mo>T</mo>
  </msubsup>
  <mo>*</mo>
  <msub>
    <mi><html:b>h</html:b></mi>
    <mi>t</mi>
  </msub>
</math>
</p>
</li>

<li>
Error Minimization Term plus Normalization Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub>
    <mi>d</mi>
    <mi>t</mi>
  </msub>
  <mo>=</mo>
    <msub>
      <mi>&#x03bc;</mi>
      <mi>t</mi>
    </msub>
    <mo>*</mo>
    <msup>
      <mrow>
        <mo>(</mo>
        <msub>
          <mi>o</mi>
          <mi>t</mi>
        </msub>
        <mo>-</mo>
        <msub>
          <mi>r</mi>
          <mi>t</mi>
        </msub>
        <mo>)</mo>
      </mrow>
      <mn>2</mn>
    </msup>
    <mo>+</mo>
    <mi>&#955;</mi>
    <mo>*</mo>
    <msup>
      <mrow>
        <mo>&#x2016;</mo>
        <msub>
          <mi><html:b>h</html:b></mi>
          <mi>t</mi>
        </msub>
        <mo>&#x2016;</mo>
      </mrow>
      <mn>2</mn>
    </msup>
  <mo>=</mo>
  <msub>
    <mi>g</mi>
    <mi>t</mi>
  </msub>
  <mo>+</mo>
  <msub>
    <mi>c</mi>
    <mi>t</mi>
  </msub>
</math>
</p>
</li>

<li>
Chain Rule
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>d</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
  <msub><mi>g</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>+</mo>
  <msub><mi>c</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
</math>
</p>
</li>

<li>
Chain Rule for Error Minimization Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>g</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
    <msub><mi>g</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>f</mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi>f</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>e</mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi>e</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>r</mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi>r</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi>a</mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi>a</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi><html:b>h</html:b></mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi><html:b>b</html:b></mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi><html:b>b</html:b></mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
</math>
</p>
</li>

<li>
Fifth Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>a</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><msub><mi><html:b>h</html:b></mi><mi>t</mi></msub><mo>)</mo>
  <mrow>
    <mo>=</mo>
    <msubsup><mi><html:b>w</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
  </mrow>
</math>
</p>
</li>

<li>
Sixth Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><msub><mi><html:b>b</html:b></mi><mi>t</mi></msub><mo>)</mo>
  <mo>=</mo>
  <mfrac>
    <mn>1</mn>
    <mn>2</mn>
  </mfrac>
  <mo>*</mo>
  <mo><html:b>diag</html:b></mo>
  <mo>(</mo>
  <mn><html:b>1</html:b></mn>
  <mo>-</mo>
  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
  <mo>&#x2299;</mo>
  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
  <mo>)</mo>
</math>
</p>
</li>

<li>
Seventh Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
    <msub><mi><html:b>b</html:b></mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
  <mi><html:b>I</html:b></mi>
  <mo>&#x2297;</mo>
  <msubsup><mi><html:b>s</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
</math>
</p>
</li>

<li>
Combined Terms for Error Minimization
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>g</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
    <mo>*</mo>
    <mn>2</mn>
    <mo>*</mo>
    <msub><mi>e</mi><mi>t</mi></msub>
    <mo>*</mo>
    <mn>-1</mn>
    <mo>*</mo>
    <mrow>
    <mfrac>
      <mn>1</mn>
      <mn>2</mn>
    </mfrac>
    <mo>*</mo>
    <mo>(</mo>
    <mn>1</mn>
    <mo>-</mo>
    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
    <mo>)</mo>
    </mrow>
  <mo>*</mo>
  <msup><mi><html:b>w</html:b></mi><mo>T</mo></msup>
  <mo>*</mo>
  <mfrac>
    <mn>1</mn>
    <mn>2</mn>
  </mfrac>
  <mo>*</mo>
  <mo><html:b>diag</html:b></mo>
  <mo>(</mo>
  <mi><html:b>1</html:b></mi>
  <mo>-</mo>
  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
  <mo>&#x2299;</mo>
  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
  <mo>)</mo>
  <mo>*</mo>
  <mo>[</mo>
  <mi><html:b>I</html:b></mi>
  <mo>&#x2297;</mo>
  <msubsup><mi><html:b>s</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
  <mo>]</mo>
</math>
</p>
</li>

<li>
Reduce
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>g</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
  <mo>-</mo>
  <mfrac>
    <mn>1</mn>
    <mn>2</mn>
  </mfrac>
  <mo>*</mo>
    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
    <mo>*</mo>
    <mo>(</mo>
    <msub><mi>o</mi><mi>t</mi></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mi>t</mi></msub>
    <mo>)</mo>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <mn>1</mn>
    <mo>-</mo>
    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
    <mo>)</mo>
    </mrow>
  <mo>*</mo>
  <msup>
    <mrow>
		  <mo>[</mo>
		  <mi><html:b>w</html:b></mi>
		  <mo>&#x2299;</mo>
		  <mo>(</mo>
		  <mi><html:b>1</html:b></mi>
		  <mo>-</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
		  <mo>&#x2299;</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>)</mo>
		  <mo>]</mo>
    </mrow>
    <mo>T</mo>
  </msup>
  <mo>&#x2297;</mo>
  <msubsup><mi><html:b>s</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
</math>
</p>
</li>

<li>
Chain Rule for Normalization Term
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>c</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
    <msub><mi>c</mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi><html:b>h</html:b></mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><msub><mi><html:b>b</html:b></mi><mi>t</mi></msub><mo>)</mo>
    <mo>*</mo>
    <msub><mi><html:b>b</html:b></mi><mi>t</mi></msub>
      <mo>'</mo>
      <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
</math>
</p>
</li>

<li>
First Term for Normalization
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>c</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><msub><mi><html:b>h</html:b></mi><mi>t</mi></msub><mo>)</mo>
  <mo>=</mo>
  <mn>2</mn>
  <mo>*</mo>
  <mi>&#955;</mi>
  <mo>*</mo>
  <msubsup><mi><html:b>h</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
</math>
</p>
</li>

<li>
Combined Terms for Normalization
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>c</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
  <mn>2</mn>
  <mo>*</mo>
  <mi>&#955;</mi>
  <mo>*</mo>
  <msubsup><mi><html:b>h</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
  <mo>*</mo>
  <mfrac>
    <mn>1</mn>
    <mn>2</mn>
  </mfrac>
  <mo>*</mo>
  <mo><html:b>diag</html:b></mo>
  <mo>(</mo>
  <mn><html:b>1</html:b></mn>
  <mo>-</mo>
  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
  <mo>&#x2299;</mo>
  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
  <mo>)</mo>
  <mo>*</mo>
  <mo>[</mo>
  <mi><html:b>I</html:b></mi>
  <mo>&#x2297;</mo>
  <msubsup><mi><html:b>s</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
  <mo>]</mo>
</math>
</p>
</li>

<li>
Reduce
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>c</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
  <mi>&#955;</mi>
  <mo>*</mo>
  <msup>
    <mrow>
		  <mo>[</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>&#x2299;</mo>
		  <mo>(</mo>
		  <mn><html:b>1</html:b></mn>
		  <mo>-</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
		  <mo>&#x2299;</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>)</mo>
		  <mo>]</mo>
    </mrow>
    <mo>T</mo>
  </msup>
  <mo>&#x2297;</mo>
  <msubsup><mi><html:b>s</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
</math>
</p>
</li>

<li>
Derivative of Both Terms
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>d</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
  <mo>-</mo>
  <mfrac>
    <mn>1</mn>
    <mn>2</mn>
  </mfrac>
  <mo>*</mo>
    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
    <mo>*</mo>
    <mo>(</mo>
    <msub><mi>o</mi><mi>t</mi></msub>
    <mo>-</mo>
    <msub><mi>r</mi><mi>t</mi></msub>
    <mo>)</mo>
    <mo>*</mo>
    <mrow>
    <mo>(</mo>
    <mn>1</mn>
    <mo>-</mo>
    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
    <mo>)</mo>
    </mrow>
  <mo>*</mo>
  <msup>
    <mrow>
		  <mo>[</mo>
		  <mi><html:b>w</html:b></mi>
		  <mo>&#x2299;</mo>
		  <mo>(</mo>
		  <mi><html:b>1</html:b></mi>
		  <mo>-</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
		  <mo>&#x2299;</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>)</mo>
		  <mo>]</mo>
    </mrow>
    <mo>T</mo>
  </msup>
  <mo>&#x2297;</mo>
  <msubsup><mi><html:b>s</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
  <html:br/>
  &#160;
  <mo>+</mo>
  <mi>&#955;</mi>
  <mo>*</mo>
  <msup>
    <mrow>
		  <mo>[</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>&#x2299;</mo>
		  <mo>(</mo>
		  <mn><html:b>1</html:b></mn>
		  <mo>-</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
		  <mo>&#x2299;</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>)</mo>
		  <mo>]</mo>
    </mrow>
    <mo>T</mo>
  </msup>
  <mo>&#x2297;</mo>
  <msubsup><mi><html:b>s</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
</math>
</p>
</li>

<li>
Reduce
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <msub><mi>d</mi><mi>t</mi></msub>
    <mo>'</mo>
    <mo>(</mo><mi><html:b>v</html:b></mi><mo>)</mo>
  <mo>=</mo>
  <mo>(</mo>
  <msup>
    <mrow>
		  <mo>[</mo>
		  <mo>-</mo>
		  <mfrac>
		    <mn>1</mn>
		    <mn>2</mn>
		  </mfrac>
		  <mo>*</mo>
	    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
	    <mo>*</mo>
	    <mo>(</mo>
	    <msub><mi>o</mi><mi>t</mi></msub>
	    <mo>-</mo>
	    <msub><mi>r</mi><mi>t</mi></msub>
	    <mo>)</mo>
	    <mo>*</mo>
	    <mrow>
	    <mo>(</mo>
	    <mn>1</mn>
	    <mo>-</mo>
	    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
	    <mo>)</mo>
		  <mo>*</mo>
		  <mi><html:b>w</html:b></mi>
		  </mrow>
		  <mo>+</mo>
      <mi>&#955;</mi>
      <mo>*</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
      <mo>]</mo>
		</mrow>
		<mo>T</mo>
  </msup>
  <mo>&#x2299;</mo>
  <msup>
    <mrow>
		  <mo>[</mo>
		  <mi><html:b>1</html:b></mi>
		  <mo>-</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
		  <mo>&#x2299;</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>]</mo>
    </mrow>
    <mo>T</mo>
  </msup>
  <mo>)</mo>
  <mo>&#x2297;</mo>
  <msubsup><mi><html:b>s</html:b></mi><mi>t</mi><mo>T</mo></msubsup>
</math>
</p>
</li>

<li>
Weight Gradient for Hidden Layer
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mo>&#x2207;</mo>
    <msub><mi>l</mi><mi>n</mi></msub>
    <mo>(</mo>
    <mi><html:b>v</html:b></mi>
    <mo>)</mo>
  </mrow>
  <mrow>
    <mo>=</mo>
    <mfrac><mn>1</mn><mi>n</mi></mfrac>
    <mo>*</mo>
    <munderover>
      <mo form="prefix" movablelimits="false">&#931;</mo>
      <mrow>
        <mi>t</mi>
        <mo>=</mo>
        <mn>1</mn>
      </mrow>
      <mrow>
        <mi>n</mi>
      </mrow>
    </munderover>
    <mo>[</mo>
    <mo>(</mo>
    <mrow>
		  <mo>[</mo>
		  <mo>-</mo>
		  <mfrac>
		    <mn>1</mn>
		    <mn>2</mn>
		  </mfrac>
		  <mo>*</mo>
	    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
	    <mo>*</mo>
	    <mo>(</mo>
	    <msub><mi>o</mi><mi>t</mi></msub>
	    <mo>-</mo>
	    <msub><mi>r</mi><mi>t</mi></msub>
	    <mo>)</mo>
	    <mo>*</mo>
	    <mrow>
	    <mo>(</mo>
	    <mn>1</mn>
	    <mo>-</mo>
	    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
	    <mo>)</mo>
		  <mo>*</mo>
		  <mi><html:b>w</html:b></mi>
		  </mrow>
		  <mo>+</mo>
      <mi>&#955;</mi>
      <mo>*</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
      <mo>]</mo>
		</mrow>
    <mo>&#x2299;</mo>
    <mrow>
		  <mo>[</mo>
		  <mi><html:b>1</html:b></mi>
		  <mo>-</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
		  <mo>&#x2299;</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>]</mo>
    </mrow>
    <mo>)</mo>
    <mo>&#x2297;</mo>
    <msub><mi><html:b>s</html:b></mi><mi>t</mi></msub>
    <mo>]</mo>
  </mrow>
</math>
</p>
</li>

<li>
Weight Update Rule for Hidden Layer Complete
<p>
<math xmlns="http://www.w3.org/1998/Math/MathML">
  <mrow>
    <mi><html:b>v</html:b></mi>
    <mo>(</mo>
    <mi>k</mi>
    <mo>+</mo>
    <mn>1</mn>
    <mo>)</mo>
  </mrow>
  <mo>=</mo>
  <mrow>
    <mi><html:b>v</html:b></mi>
    <mo>(</mo>
    <mi>k</mi>
    <mo>)</mo>
  </mrow>
  <html:br/>
  &#160;
  <mrow>
    <mo>+</mo>
    <mi>&#x03b7;</mi>
    <mo>*</mo>
  </mrow>
  <mrow>
    <mfrac><mn>1</mn><mi>n</mi></mfrac>
    <mo>*</mo>
    <munderover>
      <mo form="prefix" movablelimits="false">&#931;</mo>
      <mrow>
        <mi>t</mi>
        <mo>=</mo>
        <mn>1</mn>
      </mrow>
      <mrow>
        <mi>n</mi>
      </mrow>
    </munderover>
    <mo>[</mo>
    <mo>(</mo>
    <mrow>
		  <mo>[</mo>
		  <mfrac>
		    <mn>1</mn>
		    <mn>2</mn>
		  </mfrac>
		  <mo>*</mo>
	    <msub><mi>&#x03bc;</mi><mi>t</mi></msub>
	    <mo>*</mo>
	    <mo>(</mo>
	    <msub><mi>o</mi><mi>t</mi></msub>
	    <mo>-</mo>
	    <msub><mi>r</mi><mi>t</mi></msub>
	    <mo>)</mo>
	    <mo>*</mo>
	    <mrow>
	    <mo>(</mo>
	    <mn>1</mn>
	    <mo>-</mo>
	    <msubsup><mi>r</mi><mi>t</mi><mn>2</mn></msubsup>
	    <mo>)</mo>
		  <mo>*</mo>
		  <mi><html:b>w</html:b></mi>
		  </mrow>
		  <mo>-</mo>
      <mi>&#955;</mi>
      <mo>*</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
      <mo>]</mo>
		</mrow>
    <mo>&#x2299;</mo>
    <mrow>
		  <mo>[</mo>
		  <mi><html:b>1</html:b></mi>
		  <mo>-</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>  
		  <mo>&#x2299;</mo>
		  <msub><mi><html:b>h</html:b></mi><mi>t</mi></msub>
		  <mo>]</mo>
    </mrow>
    <mo>)</mo>
    <mo>&#x2297;</mo>
    <msub><mi><html:b>s</html:b></mi><mi>t</mi></msub>
    <mo>]</mo>
  </mrow>
</math>
</p>
</li>

</ol>

<h2>
Problem 5
</h2>

<p align="justify">
The first part of the objective function minimizes the mean square error
between observable desired responses and actual responses.  The second
part of the objective function minimizes the number of hidden units in the
network.  This reduces the effects of overfitting and improves
generalization performance [Golden pp105-6].
</p>

<p align="justify">
Yes.  "If f is twice-differentiable at every [vector x which is an element
of] D then f is twice-differentiable on D and is a twice-differentiable
function" [Marlow p198].  For any input in the domain, the second derivative
of the objective function exists.
</p>

<p align="justify">
Yes.  The objective function is measurable because it is continuous.
</p>

<h2>
Problem 6
</h2>

<p align="justify">
In my personal opinion, the most important strength of probability theory
and expectation as tools for making rational inferences in environments
characterized by uncertainty is that it puts the framework on solid footing
when compared to more subjective methods such as fuzzy logic.  With fuzzy
logic, providing the fuzzy measures by quantifying the values of the symbols
can be somewhat arbitrary.  I imagine these fuzzy values have to be manually
tweaked until the fuzzy logic roughly equates to what could have been
determined in a more straight-forward manner using expected risk.
</p>

<p align="justify">
The most important limitation is the inability to make fuzzy decisions based
on fuzzy classifications.  By a "fuzzy classification", I mean varying
degrees of membership in a fuzzy set versus all-or-nothing membership in a
crisp set [Golden p248].  For example, a probabilistic decision to eat food
that might be poisoned will be based on the consequences.  I might decide to
avoid the food if the risk is high even if the probability is low.  A fuzzy
decision would provide the alternative option of eating just a little if the
classification is determined to be "mostly safe".
</p>

<p align="justify">
Generalization is the ability to make classification decisions for stimuli
not previously seen based on similarity to previous stimuli and their
classifications.  The problem with this definition is that "similarity" is
vague.  An "appropriate generalization" for a given probability space should
be based on minimizing the expected risk [Golden p276].
</p>

<p>&#160;</p>
<p>&#160;</p>
<p>&#160;</p>

<h2>
References
</h2>

<ul>

<li>
Golden, Richard M.,
<i>Mathematical Methods for Neural Network Analysis and Design</i>,
MIT Press, 1996.
</li>

<li>
Haykin, Simon,
<i>Neural Networks:  A Comprehensive Foundation</i>,
2nd Ed., Prentice Hall, 1999.
</li>

<li>
Marlow, W. H.,
<i>Mathematics for Operations Research</i>,
Dover Publications, 1978.
</li>

</ul>

</td></tr></table>

</body>
</html>