zhongkaifu
diff --git a/‎RNNSharp.v12.suo
15 KB b/‎RNNSharp.v12.suo
15 KB
diff --git a/‎RNNSharp/BiRNN.cs
+25-56 b/‎RNNSharp/BiRNN.cs
+25-56
diff --git a/‎RNNSharp/LSTMRNN.cs
+2-9 b/‎RNNSharp/LSTMRNN.cs
+2-9
@@ -141,11 +141,7 @@ public override void GetHiddenLayer(Matrix<double> m, int curStatus)
 
         public override void initMem()
         {
-            for (int i = 0; i < MAX_RNN_HIST; i++)
-            {
-                m_Diff[i] = new double[L2];
-            }
-
+            m_Diff = new Matrix<double>(MAX_RNN_HIST, L2);
             m_tagBigramTransition = new Matrix<double>(L2, L2);
             m_DeltaBigramLM = new Matrix<double>(L2, L2);
 
@@ -166,27 +162,6 @@ public override void initMem()
             }
         }
 
-
-
-        public override Matrix<double> InnerDecode(Sequence pSequence)
-        {
-            Matrix<neuron> mHiddenLayer = null;
-            Matrix<double> mRawOutputLayer = null;
-            neuron[][] outputLayer = InnerDecode(pSequence, out mHiddenLayer, out mRawOutputLayer);
-            int numStates = pSequence.GetSize();
-
-            Matrix<double> m = new Matrix<double>(numStates, L2);
-            for (int currState = 0; currState < numStates; currState++)
-            {
-                for (int i = 0; i < L2; i++)
-                {
-                    m[currState][i] = outputLayer[currState][i].cellOutput;
-                }
-            }
-
-            return m;
-        }
-
         int[] predicted_fnn;
         int[] predicted_bnn;
         public neuron[][] InnerDecode(Sequence pSequence, out Matrix<neuron> outputHiddenLayer, out Matrix<double> rawOutputLayer)
@@ -267,12 +242,10 @@ public override void netFlush()
             backwardRNN.netFlush();
         }
 
-        public override int[] learnSentenceForRNNCRF(Sequence pSequence)
+        public override Matrix<double> learnSentenceForRNNCRF(Sequence pSequence, RunningMode runningMode)
         {
             //Reset the network
             int numStates = pSequence.GetSize();
-            int[] predicted = new int[numStates];
-
             //Predict output
             Matrix<neuron> mergedHiddenLayer = null;
             Matrix<double> rawOutputLayer = null;
@@ -281,12 +254,10 @@ public override int[] learnSentenceForRNNCRF(Sequence pSequence)
             ForwardBackward(numStates, rawOutputLayer);
 
             //Get the best result
-            predicted = new int[numStates];
             for (int i = 0; i < numStates; i++)
             {
                 State state = pSequence.Get(i);
                 logp += Math.Log10(m_Diff[i][state.GetLabel()]);
-                predicted[i] = GetBestZIndex(i);
             }
 
             UpdateBigramTransition(pSequence);
@@ -305,44 +276,48 @@ public override int[] learnSentenceForRNNCRF(Sequence pSequence)
 
             LearnTwoRNN(pSequence, mergedHiddenLayer, seqOutput);
 
-            return predicted;
+            return m_Diff;
         }
 
-        public override int[] PredictSentence(Sequence pSequence)
+        public override Matrix<double> PredictSentence(Sequence pSequence, RunningMode runningMode)
         {
             //Reset the network
             int numStates = pSequence.GetSize();
-            int[] predicted = new int[numStates];
 
             //Predict output
             Matrix<neuron> mergedHiddenLayer = null;
             Matrix<double> rawOutputLayer = null;
             neuron[][] seqOutput = InnerDecode(pSequence, out mergedHiddenLayer, out rawOutputLayer);
 
-            //Merge forward and backward
-            for (int curState = 0; curState < numStates; curState++)
+            if (runningMode != RunningMode.Test)
             {
-                State state = pSequence.Get(curState);
-                logp += Math.Log10(seqOutput[curState][state.GetLabel()].cellOutput);
-
-                predicted[curState] = GetBestOutputIndex(seqOutput, curState, L2);
+                //Merge forward and backward
+                for (int curState = 0; curState < numStates; curState++)
+                {
+                    State state = pSequence.Get(curState);
+                    logp += Math.Log10(seqOutput[curState][state.GetLabel()].cellOutput);
+                    counter++;
+                }
             }
 
-            //Update hidden-output layer weights
-            for (int curState = 0; curState < numStates; curState++)
+            if (runningMode == RunningMode.Train)
             {
-                State state = pSequence.Get(curState);
-                //For standard RNN
-                for (int c = 0; c < L2; c++)
+                //Update hidden-output layer weights
+                for (int curState = 0; curState < numStates; curState++)
                 {
-                    seqOutput[curState][c].er = -seqOutput[curState][c].cellOutput;
+                    State state = pSequence.Get(curState);
+                    //For standard RNN
+                    for (int c = 0; c < L2; c++)
+                    {
+                        seqOutput[curState][c].er = -seqOutput[curState][c].cellOutput;
+                    }
+                    seqOutput[curState][state.GetLabel()].er = 1 - seqOutput[curState][state.GetLabel()].cellOutput;
                 }
-                seqOutput[curState][state.GetLabel()].er = 1 - seqOutput[curState][state.GetLabel()].cellOutput;
-            }
 
-            LearnTwoRNN(pSequence, mergedHiddenLayer, seqOutput);
+                LearnTwoRNN(pSequence, mergedHiddenLayer, seqOutput);
+            }
 
-            return predicted;
+            return rawOutputLayer;
         }
 
         private void LearnTwoRNN(Sequence pSequence, Matrix<neuron> mergedHiddenLayer, neuron[][] seqOutput)
@@ -353,8 +328,6 @@ private void LearnTwoRNN(Sequence pSequence, Matrix<neuron> mergedHiddenLayer, n
             forwardRNN.mat_hidden2output = mat_hidden2output.CopyTo();
             backwardRNN.mat_hidden2output = mat_hidden2output.CopyTo();
 
-
-
             Parallel.Invoke(() =>
                 {
                     for (int curState = 0; curState < numStates; curState++)
@@ -377,8 +350,6 @@ private void LearnTwoRNN(Sequence pSequence, Matrix<neuron> mergedHiddenLayer, n
                 //Learn forward network
                 for (int curState = 0; curState < numStates; curState++)
                 {
-                    System.Threading.Interlocked.Increment(ref counter);
-
                     // error propogation
                     State state = pSequence.Get(curState);
                     forwardRNN.setInputLayer(state, curState, numStates, predicted_fnn);
@@ -396,8 +367,6 @@ private void LearnTwoRNN(Sequence pSequence, Matrix<neuron> mergedHiddenLayer, n
 
                 for (int curState = 0; curState < numStates; curState++)
                 {
-                    System.Threading.Interlocked.Increment(ref counter);
-
                     int curState2 = numStates - 1 - curState;
 
                     // error propogation
 
@@ -184,10 +184,7 @@ public override void loadNetBin(string filename)
             {
                 m_tagBigramTransition = loadMatrixBin(br);
 
-                for (int i = 0; i < MAX_RNN_HIST; i++)
-                {
-                    m_Diff[i] = new double[L2];
-                }
+                m_Diff = new Matrix<double>(MAX_RNN_HIST, L2);
                 m_DeltaBigramLM = new Matrix<double>(L2, L2);
             }
 
@@ -361,11 +358,7 @@ public override void initMem()
         {
             CreateCell(null);
 
-            for (int i = 0; i < MAX_RNN_HIST; i++)
-            {
-                m_Diff[i] = new double[L2];
-            }
-
+            m_Diff = new Matrix<double>(MAX_RNN_HIST, L2);
             m_tagBigramTransition = new Matrix<double>(L2, L2);
             m_DeltaBigramLM = new Matrix<double>(L2, L2);