BrainJS
diff --git a/‎index.html
+2,026 b/‎index.html
+2,026
diff --git a/‎lib/recurrent/index.js
+172 b/‎lib/recurrent/index.js
+172
diff --git a/‎lib/recurrent/lstm.js
+126 b/‎lib/recurrent/lstm.js
+126
diff --git a/‎lib/recurrent/matrix/add.js
+25 b/‎lib/recurrent/matrix/add.js
+25
diff --git a/‎lib/recurrent/matrix/index.js
+70 b/‎lib/recurrent/matrix/index.js
+70
@@ -0,0 +1,172 @@
+//http://colah.github.io/posts/2015-08-Understanding-LSTMs/
+var Matrix = require('./matrix'),
+  RNN = require('./rnn'),
+  LSTM = require('./lstm');
+
+// Transformer definitions
+function Graph(needsBackprop) {
+  if(typeof needsBackprop === 'undefined') { needsBackprop = true; }
+  this.needsBackprop = needsBackprop;
+
+  // this will store a list of functions that perform backprop,
+  // in their forward pass order. So in backprop we will go
+  // backwards and evoke each one
+  this.backprop = [];
+}
+Graph.prototype = {
+  backward: function() {
+    while(this.backprop.length > 1) {
+      this.backprop.pop()(); // tick!
+    }
+  },
+  /**
+   *
+   * @param {Matrix} m
+   * @param ix
+   */
+  rowPluck: function(m, ix) {
+    // pluck a row of m with index ix and return it as col vector
+    if (ix < 0 && ix >= m.n) throw new Error('row cannot pluck');
+    var d = m.d;
+    var out = new Matrix(d, 1);
+    for(var i=0,n=d;i<n;i++){ out.weights[i] = m.weights[d * ix + i]; } // copy over the data
+
+    if(this.needsBackprop) {
+      this.backprop.push(function backward() {
+        for(var i=0,n=d;i<n;i++){ m.dw[d * ix + i] += out.dw[i]; }
+      });
+    }
+    return out;
+  },
+
+  /**
+   *
+   * @param {Matrix} m
+   */
+  tanh: function(m) {
+    // tanh nonlinearity
+    var out = new Matrix(m.n, m.d);
+    var n = m.weights.length;
+    for(var i=0;i<n;i++) {
+      out.weights[i] = Math.tanh(m.weights[i]);
+    }
+
+    if(this.needsBackprop) {
+      this.backprop.push(function backward() {
+        for(var i=0;i<n;i++) {
+          // grad for z = tanh(x) is (1 - z^2)
+          var mwi = out.weights[i];
+          m.dw[i] += (1.0 - mwi * mwi) * out.dw[i];
+        }
+      });
+    }
+    return out;
+  },
+
+  /**
+   *
+   * @param {Matrix} m
+   */
+  sigmoid: function(m) {
+    // sigmoid nonlinearity
+    var out = new Matrix(m.n, m.d);
+    var n = m.weights.length;
+    for(var i=0;i<n;i++) {
+      out.weights[i] = sig(m.weights[i]);
+    }
+
+    if(this.needsBackprop) {
+      this.backprop.push(function backward() {
+        for(var i=0;i<n;i++) {
+          // grad for z = tanh(x) is (1 - z^2)
+          var mwi = out.weights[i];
+          m.dw[i] += mwi * (1.0 - mwi) * out.dw[i];
+        }
+      });
+    }
+    return out;
+  },
+
+  /**
+   *
+   * @param {Matrix} m
+   */
+  relu: function(m) {
+    var out = new Matrix(m.n, m.d);
+    var n = m.weights.length;
+    for(var i=0;i<n;i++) {
+      out.weights[i] = Math.max(0, m.weights[i]); // relu
+    }
+    if(this.needsBackprop) {
+      this.backprop.push(function backward() {
+        for(var i=0;i<n;i++) {
+          m.dw[i] += m.weights[i] > 0 ? out.dw[i] : 0.0;
+        }
+      });
+    }
+    return out;
+  }
+};
+
+function Solver() {
+  this.decayRate = 0.999;
+  this.smoothEps = 1e-8;
+  this.stepCache = {};
+  this.ratioClipped = null;
+}
+Solver.prototype = {
+  step: function(stepSize, regc, clipval) {
+    // perform parameter update
+    var model = this.model;
+    var solverStats = {};
+    var numClipped = 0;
+    var numTot = 0;
+    for(var k in model) {
+      if(model.hasOwnProperty(k)) {
+        var m = model[k]; // mat ref
+        if(!(k in this.stepCache)) { this.stepCache[k] = new Matrix(m.n, m.d); }
+        var s = this.stepCache[k];
+        for(var i=0,n=m.weights.length;i<n;i++) {
+
+          // rmsprop adaptive learning rate
+          var mdwi = m.dw[i];
+          s.weights[i] = s.weights[i] * this.decayRate + (1.0 - this.decayRate) * mdwi * mdwi;
+
+          // gradient clip
+          if(mdwi > clipval) {
+            mdwi = clipval;
+            numClipped++;
+          }
+          if(mdwi < -clipval) {
+            mdwi = -clipval;
+            numClipped++;
+          }
+          numTot++;
+
+          // update (and regularize)
+          m.weights[i] += - stepSize * mdwi / Math.sqrt(s.weights[i] + this.smoothEps) - regc * m.weights[i];
+          m.dw[i] = 0; // reset gradients for next iteration
+        }
+      }
+    }
+    this.ratioClipped = numClipped*1.0/numTot;
+
+    return this;
+  }
+};
+
+function sig(x) {
+  // helper function for computing sigmoid
+  return 1.0 / (1 + Math.exp(-x));
+}
+
+// various utils
+module.exports = {
+  // classes
+  LSTM: LSTM,
+  RNN: RNN,
+
+  // optimization
+  Solver: Solver,
+  Graph: Graph
+};
@@ -0,0 +1,126 @@
+var Matrix = require('./matrix'),
+  RandomMatrix = require('./matrix/random'),
+  add = require('./matrix/add'),
+  multiply = require('./matrix/multiply'),
+  multiplyElement = require('./matrix/multiply-element');
+
+function LSTM(inputSize, hiddenSizes, outputSize) {
+  // hidden size should be a list
+
+  this.model = [];
+  this.inputSize = inputSize;
+  this.hiddenSizes = hiddenSizes;
+  this.outputSize = outputSize;
+
+  for(var d=0;d<hiddenSizes.length;d++) { // loop over depths
+    var prevSize = d === 0 ? inputSize : hiddenSizes[d - 1];
+    var hiddenSize = hiddenSizes[d];
+    this.model.push({
+      // gates parameters
+      wix: new RandomMatrix(hiddenSize, prevSize , 0, 0.08),
+      wih: new RandomMatrix(hiddenSize, hiddenSize , 0, 0.08),
+      bi: new Matrix(hiddenSize, 1),
+
+      wfx: new RandomMatrix(hiddenSize, prevSize , 0, 0.08),
+      wfh: new RandomMatrix(hiddenSize, hiddenSize , 0, 0.08),
+      bf: new Matrix(hiddenSize, 1),
+
+      wox: new RandomMatrix(hiddenSize, prevSize , 0, 0.08),
+      woh: new RandomMatrix(hiddenSize, hiddenSize , 0, 0.08),
+      bo: new Matrix(hiddenSize, 1),
+
+      // cell write params
+      wcx: new RandomMatrix(hiddenSize, prevSize , 0, 0.08),
+      wch: new RandomMatrix(hiddenSize, hiddenSize , 0, 0.08),
+      bc: new Matrix(hiddenSize, 1)
+    });
+  }
+  // decoder params
+  this.model.whd = new RandomMatrix(outputSize, hiddenSize, 0, 0.08);
+  this.model.bd = new Matrix(outputSize, 1);
+}
+
+LSTM.prototype = {
+  /**
+   *
+   * @param {Graph} graph
+   * @param prev
+   * @returns {{hidden: Array, cell: Array, output}}
+   */
+  forward: function (graph, prev) {
+    // forward prop for a single tick of LSTM
+    // G is graph to append ops to
+    // model contains LSTM parameters
+    // x is 1D column vector with observation
+    // prev is a struct containing hidden and cell
+    // from previous iteration
+
+    var model = this.model,
+      hiddenSizes = this.hiddenSizes,
+      hiddenPrevs,
+      cellPrevs,
+      d;
+
+    if(typeof prev.hidden === 'undefined') {
+      hiddenPrevs = [];
+      cellPrevs = [];
+      for(d=0;d<hiddenSizes.length;d++) {
+        hiddenPrevs.push(new Matrix(hiddenSizes[d],1));
+        cellPrevs.push(new Matrix(hiddenSizes[d],1));
+      }
+    } else {
+      hiddenPrevs = prev.hidden;
+      cellPrevs = prev.cell;
+    }
+
+    var hidden = [],
+      cell = [];
+    for(d=0;d<hiddenSizes.length;d++) {
+
+      var inputVector = d === 0 ? x : hidden[d-1];
+      var hiddenPrev = hiddenPrevs[d];
+      var cellPrev = cellPrevs[d];
+
+      // input gate
+      var h0 = multiply(model[d].wix, inputVector);
+      var h1 = multiply(model[d].wih, hiddenPrev);
+      var inputGate = graph.sigmoid(add(add(h0,h1),model[d].bi));
+
+      // forget gate
+      var h2 = multiply(model[d].wfx, inputVector);
+      var h3 = multiply(model[d].wfh, hiddenPrev);
+      var forgetGate = graph.sigmoid(add(add(h2, h3),model[d].bf));
+
+      // output gate
+      var h4 = multiply(model[d].wox, inputVector);
+      var h5 = multiply(model[d].woh, hiddenPrev);
+      var outputGate = graph.sigmoid(add(add(h4, h5),model[d].bo));
+
+      // write operation on cells
+      var h6 = multiply(model[d].wcx, inputVector);
+      var h7 = multiply(model[d].wch, hiddenPrev);
+      var cellWrite = graph.tanh(add(add(h6, h7),model[d].bc));
+
+      // compute new cell activation
+      var retainCell = multiplyElement(forgetGate, cellPrev); // what do we keep from cell
+      var writeCell = multiplyElement(inputGate, cellWrite); // what do we write to cell
+      var cellD = add(retainCell, writeCell); // new cell contents
+
+      // compute hidden state as gated, saturated cell activations
+      var hiddenD = multiplyElement(outputGate, graph.tanh(cellD));
+
+      hidden.push(hiddenD);
+      cell.push(cellD);
+    }
+
+    // one decoder to outputs at end
+    var output = add(multiply(model.whd, hidden[hidden.length - 1]), model.bd);
+
+    // return cell memory, hidden representation and output
+    return {
+      hidden: hidden,
+      cell: cell,
+      output: output
+    };
+  }
+};
@@ -0,0 +1,25 @@
+var Matrix = require('./index');
+/**
+ *
+ * @param {Matrix} m1
+ * @param {Matrix} m2
+ * @param backPropagateArray
+ * @returns {Matrix}
+ */
+module.export = function add(m1, m2, backPropagateArray) {
+  if (m1.weights.length !== m2.weights.length) throw new Error('matrix addition dimensions misaligned');
+
+  var out = new Matrix(m1.n, m1.d);
+  for(var i=0,n=m1.weights.length;i<n;i++) {
+    out.weights[i] = m1.weights[i] + m2.weights[i];
+  }
+  if(typeof backPropagateArray !== 'undefined') {
+    backPropagateArray.push(function backward() {
+      for(var i=0,n=m1.weights.length;i<n;i++) {
+        m1.dw[i] += out.dw[i];
+        m2.dw[i] += out.dw[i];
+      }
+    });
+  }
+  return out;
+};
@@ -0,0 +1,70 @@
+var zeros = require('./zeros'),
+  random = require('./random'),
+  randf = random.f,
+  randn = random.n;
+
+/**
+ * A matrix
+ * @param {Number} n
+ * @param {Number} d
+ * @constructor
+ */
+function Matrix(n, d) {
+  // n is number of rows d is number of columns
+  this.n = n;
+  this.d = d;
+  this.weights = zeros(n * d);
+  this.dw = zeros(n * d);
+}
+
+Matrix.prototype = {
+  getWeights: function(row, col) {
+    // slow but careful accessor function
+    // we want row-major order
+    var ix = (this.d * row) + col;
+    if (ix < 0 && ix >= this.weights.length) throw new Error('get accessor is skewed');
+    return this.weights[ix];
+  },
+  setWeights: function(row, col, v) {
+    // slow but careful accessor function
+    var ix = (this.d * row) + col;
+    if (ix < 0 && ix >= this.weights.length) throw new Error('set accessor is skewed');
+    this.weights[ix] = v;
+  },
+  toJSON: function() {
+    var weights = [];
+    for (var i = 0; i < this.weights.length; i++) {
+      weights.push(this.weights[i]);
+    }
+    return {
+      n: this.n,
+      d: this.d,
+      weights: weights
+    };
+  },
+  fromJSON: function(json) {
+    this.n = json.n;
+    this.d = json.d;
+    this.weights = zeros(this.n * this.d);
+    this.dw = zeros(this.n * this.d);
+    for(var i=0,n=this.n * this.d;i<n;i++) {
+      this.weights[i] = json.weights[i]; // copy over weights
+    }
+  },
+
+  // fill matrix with random gaussian numbers
+  fillRandN: function(mu, std) {
+    for(var i=0,n=this.weights.length;i<n;i++) {
+      this.weights[i] = randn(mu, std);
+    }
+  },
+
+  // fill matrix with random gaussian numbers
+  fillRand: function(lo, hi) {
+    for(var i=0,n=this.weights.length;i<n;i++) {
+      this.weights[i] = randf(lo, hi);
+    }
+  }
+};
+
+module.export = Matrix;