aggregate_metrics_mem0.json•4.23 kB
{
"correctness": {
"scores": [
0.07295252575012522,
0.7724624642762056,
0.007585817532042317,
0.871594065640353,
0.10043805981830971,
0.33478741530156875,
0.5759655963248086,
0.7300605616942584,
0.7492226943054524,
0.246477843047804,
0.036349893969876805,
0.7002017890372143,
0.7838950112014241,
0.7812519320091226,
0.0,
0.25750920899213414,
0.2052075533281595,
0.580901533908451,
0.027229804120083106,
0.2259421177062108,
0.8893981597693024,
0.38591652004103977,
0.7835216866230825,
0.17279092569374135,
0.5165159066305006,
0.7533344935117745,
0.6580571005494367,
0.0927779376790629,
0.16936690434211205,
0.7677543645911231,
0.00971309716301246,
0.01205341616535242,
0.3227068102525554,
0.5567671386554366,
0.47042523697052996,
0.0,
0.8106843559040244,
0.724660181676092,
0.727537033234668,
0.5800749306235402,
0.007703364639648129,
0.3242417434621426,
0.0,
0.7854680294319161,
0.0,
0.22879546614167506,
0.7335382219036678,
0.078871888947064,
0.813120549426268,
0.7812433329022708
],
"mean": 0.42434149369789287,
"ci_lower": 0.3360995177167779,
"ci_upper": 0.5113808212114568
},
"EM": {
"scores": [
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0,
0.0
],
"mean": 0.0,
"ci_lower": 0.0,
"ci_upper": 0.0
},
"f1": {
"scores": [
0.0,
0.0909090909090909,
0.0,
0.15384615384615385,
0.04347826086956522,
0.03571428571428572,
0.09302325581395349,
0.23529411764705882,
0.16,
0.08,
0.05970149253731343,
0.04878048780487806,
0.3076923076923077,
0.2222222222222222,
0.0,
0.06451612903225806,
0.0,
0.10526315789473684,
0.0,
0.15384615384615385,
0.18181818181818182,
0.1379310344827586,
0.10714285714285715,
0.07142857142857144,
0.33333333333333337,
0.1904761904761905,
0.0689655172413793,
0.05970149253731343,
0.0,
0.0,
0.0,
0.0,
0.026666666666666665,
0.14285714285714285,
0.11764705882352941,
0.0,
0.21052631578947367,
0.05714285714285715,
0.0625,
0.09523809523809523,
0.0,
0.04,
0.0,
0.17142857142857143,
0.25,
0.05194805194805195,
0.2857142857142857,
0.06666666666666667,
0.13333333333333333,
0.1
],
"mean": 0.09633506679798477,
"ci_lower": 0.07301842044612787,
"ci_upper": 0.12170614852235641
}
}