ineqmath
v1.0This adapter brings IneqMath, the dev set of the first inequality-proof Q\&A benchmark for LLMs, into Harbor, enabling standardized evaluation of models on mathematical reasoning and proof construction.
uvx harbor run -d ineqmath@1.0Tasks (100)
0
uvx harbor run -d ineqmath@1.0 -t 0cc647b2
1
uvx harbor run -d ineqmath@1.0 -t 1cc647b2
10
uvx harbor run -d ineqmath@1.0 -t 10cc647b2
11
uvx harbor run -d ineqmath@1.0 -t 11cc647b2
12
uvx harbor run -d ineqmath@1.0 -t 12cc647b2
13
uvx harbor run -d ineqmath@1.0 -t 13cc647b2
14
uvx harbor run -d ineqmath@1.0 -t 14cc647b2
15
uvx harbor run -d ineqmath@1.0 -t 15cc647b2
16
uvx harbor run -d ineqmath@1.0 -t 16cc647b2
17
uvx harbor run -d ineqmath@1.0 -t 17cc647b2
18
uvx harbor run -d ineqmath@1.0 -t 18cc647b2
19
uvx harbor run -d ineqmath@1.0 -t 19cc647b2
2
uvx harbor run -d ineqmath@1.0 -t 2cc647b2
20
uvx harbor run -d ineqmath@1.0 -t 20cc647b2
21
uvx harbor run -d ineqmath@1.0 -t 21cc647b2
22
uvx harbor run -d ineqmath@1.0 -t 22cc647b2
23
uvx harbor run -d ineqmath@1.0 -t 23cc647b2
24
uvx harbor run -d ineqmath@1.0 -t 24cc647b2
25
uvx harbor run -d ineqmath@1.0 -t 25cc647b2
26
uvx harbor run -d ineqmath@1.0 -t 26cc647b2
27
uvx harbor run -d ineqmath@1.0 -t 27cc647b2
28
uvx harbor run -d ineqmath@1.0 -t 28cc647b2
29
uvx harbor run -d ineqmath@1.0 -t 29cc647b2
3
uvx harbor run -d ineqmath@1.0 -t 3cc647b2
30
uvx harbor run -d ineqmath@1.0 -t 30cc647b2
31
uvx harbor run -d ineqmath@1.0 -t 31cc647b2
32
uvx harbor run -d ineqmath@1.0 -t 32cc647b2
33
uvx harbor run -d ineqmath@1.0 -t 33cc647b2
34
uvx harbor run -d ineqmath@1.0 -t 34cc647b2
35
uvx harbor run -d ineqmath@1.0 -t 35cc647b2
36
uvx harbor run -d ineqmath@1.0 -t 36cc647b2
37
uvx harbor run -d ineqmath@1.0 -t 37cc647b2
38
uvx harbor run -d ineqmath@1.0 -t 38cc647b2
39
uvx harbor run -d ineqmath@1.0 -t 39cc647b2
4
uvx harbor run -d ineqmath@1.0 -t 4cc647b2
40
uvx harbor run -d ineqmath@1.0 -t 40cc647b2
41
uvx harbor run -d ineqmath@1.0 -t 41cc647b2
42
uvx harbor run -d ineqmath@1.0 -t 42cc647b2
43
uvx harbor run -d ineqmath@1.0 -t 43cc647b2
44
uvx harbor run -d ineqmath@1.0 -t 44cc647b2
45
uvx harbor run -d ineqmath@1.0 -t 45cc647b2
46
uvx harbor run -d ineqmath@1.0 -t 46cc647b2
47
uvx harbor run -d ineqmath@1.0 -t 47cc647b2
48
uvx harbor run -d ineqmath@1.0 -t 48cc647b2
49
uvx harbor run -d ineqmath@1.0 -t 49cc647b2
5
uvx harbor run -d ineqmath@1.0 -t 5cc647b2
50
uvx harbor run -d ineqmath@1.0 -t 50cc647b2
51
uvx harbor run -d ineqmath@1.0 -t 51cc647b2
52
uvx harbor run -d ineqmath@1.0 -t 52cc647b2
53
uvx harbor run -d ineqmath@1.0 -t 53cc647b2
54
uvx harbor run -d ineqmath@1.0 -t 54cc647b2
55
uvx harbor run -d ineqmath@1.0 -t 55cc647b2
56
uvx harbor run -d ineqmath@1.0 -t 56cc647b2
57
uvx harbor run -d ineqmath@1.0 -t 57cc647b2
58
uvx harbor run -d ineqmath@1.0 -t 58cc647b2
59
uvx harbor run -d ineqmath@1.0 -t 59cc647b2
6
uvx harbor run -d ineqmath@1.0 -t 6cc647b2
60
uvx harbor run -d ineqmath@1.0 -t 60cc647b2
61
uvx harbor run -d ineqmath@1.0 -t 61cc647b2
62
uvx harbor run -d ineqmath@1.0 -t 62cc647b2
63
uvx harbor run -d ineqmath@1.0 -t 63cc647b2
64
uvx harbor run -d ineqmath@1.0 -t 64cc647b2
65
uvx harbor run -d ineqmath@1.0 -t 65cc647b2
66
uvx harbor run -d ineqmath@1.0 -t 66cc647b2
67
uvx harbor run -d ineqmath@1.0 -t 67cc647b2
68
uvx harbor run -d ineqmath@1.0 -t 68cc647b2
69
uvx harbor run -d ineqmath@1.0 -t 69cc647b2
7
uvx harbor run -d ineqmath@1.0 -t 7cc647b2
70
uvx harbor run -d ineqmath@1.0 -t 70cc647b2
71
uvx harbor run -d ineqmath@1.0 -t 71cc647b2
72
uvx harbor run -d ineqmath@1.0 -t 72cc647b2
73
uvx harbor run -d ineqmath@1.0 -t 73cc647b2
74
uvx harbor run -d ineqmath@1.0 -t 74cc647b2
75
uvx harbor run -d ineqmath@1.0 -t 75cc647b2
76
uvx harbor run -d ineqmath@1.0 -t 76cc647b2
77
uvx harbor run -d ineqmath@1.0 -t 77cc647b2
78
uvx harbor run -d ineqmath@1.0 -t 78cc647b2
79
uvx harbor run -d ineqmath@1.0 -t 79cc647b2
8
uvx harbor run -d ineqmath@1.0 -t 8cc647b2
80
uvx harbor run -d ineqmath@1.0 -t 80cc647b2
81
uvx harbor run -d ineqmath@1.0 -t 81cc647b2
82
uvx harbor run -d ineqmath@1.0 -t 82cc647b2
83
uvx harbor run -d ineqmath@1.0 -t 83cc647b2
84
uvx harbor run -d ineqmath@1.0 -t 84cc647b2
85
uvx harbor run -d ineqmath@1.0 -t 85cc647b2
86
uvx harbor run -d ineqmath@1.0 -t 86cc647b2
87
uvx harbor run -d ineqmath@1.0 -t 87cc647b2
88
uvx harbor run -d ineqmath@1.0 -t 88cc647b2
89
uvx harbor run -d ineqmath@1.0 -t 89cc647b2
9
uvx harbor run -d ineqmath@1.0 -t 9cc647b2
90
uvx harbor run -d ineqmath@1.0 -t 90cc647b2
91
uvx harbor run -d ineqmath@1.0 -t 91cc647b2
92
uvx harbor run -d ineqmath@1.0 -t 92cc647b2
93
uvx harbor run -d ineqmath@1.0 -t 93cc647b2
94
uvx harbor run -d ineqmath@1.0 -t 94cc647b2
95
uvx harbor run -d ineqmath@1.0 -t 95cc647b2
96
uvx harbor run -d ineqmath@1.0 -t 96cc647b2
97
uvx harbor run -d ineqmath@1.0 -t 97cc647b2
98
uvx harbor run -d ineqmath@1.0 -t 98cc647b2
99
uvx harbor run -d ineqmath@1.0 -t 99cc647b2