Evaluation results (Tests, metrics)

Current state, master:

<<NAR Follow test successful goods=502 bads=2 ratio=0.996032

System tests successful!

Now running Q&A experiments:

Q&A stress test results for test ./examples/nal/example1.nal
Total questions = 20.0
Correctly answered ones = 16.0
Answer ratio = 0.8

Narsese integration tests successful!

Q&A metrics for test ./examples/english/story2.english
Average answer time = 534.5
Average answer confidence = 0.6593835
Combined loss = 182.05951925

Q&A metrics for test ./examples/english/story1.english
Average answer time = 27.5
Average answer confidence = 0.597363
Combined loss = 11.0725175

Q&A metrics for test ./examples/english/story3.english
Average answer time = 57.5
Average answer confidence = 0.5894055
Combined loss = 23.60918375

English integration tests successful!

Q&A metrics global
Average answer time = 206.5
Average answer confidence = 0.615384
Combined loss = 79.423204

Q&A answer rate global
Total questions = 37.0
Correctly answered ones = 33.0
Answer ratio = 0.8918918918918919

Now running procedure learning examples for 10K iterations each:
Pong metrics: Hits=489 misses=95 ratio=0.837329 time=29547
Pong2 metrics: Hits=326 misses=19 ratio=0.944928 time=15172
Alien metrics: shots=1812 hits=1780 ratio=0.982340 time=16766

Procedure learning metrics done

Note: successful tests without metrics are not printed, but if they fail they would appear.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Evaluation results (Tests, metrics)

Clone this wiki locally