ineqmath

v1.0

This adapter brings IneqMath, the dev set of the first inequality-proof Q\&A benchmark for LLMs, into Harbor, enabling standardized evaluation of models on mathematical reasoning and proof construction.

uvx harbor run -d ineqmath@1.0

Tasks (100)

0
uvx harbor run -d ineqmath@1.0 -t 0
cc647b2
1
uvx harbor run -d ineqmath@1.0 -t 1
cc647b2
10
uvx harbor run -d ineqmath@1.0 -t 10
cc647b2
11
uvx harbor run -d ineqmath@1.0 -t 11
cc647b2
12
uvx harbor run -d ineqmath@1.0 -t 12
cc647b2
13
uvx harbor run -d ineqmath@1.0 -t 13
cc647b2
14
uvx harbor run -d ineqmath@1.0 -t 14
cc647b2
15
uvx harbor run -d ineqmath@1.0 -t 15
cc647b2
16
uvx harbor run -d ineqmath@1.0 -t 16
cc647b2
17
uvx harbor run -d ineqmath@1.0 -t 17
cc647b2
18
uvx harbor run -d ineqmath@1.0 -t 18
cc647b2
19
uvx harbor run -d ineqmath@1.0 -t 19
cc647b2
2
uvx harbor run -d ineqmath@1.0 -t 2
cc647b2
20
uvx harbor run -d ineqmath@1.0 -t 20
cc647b2
21
uvx harbor run -d ineqmath@1.0 -t 21
cc647b2
22
uvx harbor run -d ineqmath@1.0 -t 22
cc647b2
23
uvx harbor run -d ineqmath@1.0 -t 23
cc647b2
24
uvx harbor run -d ineqmath@1.0 -t 24
cc647b2
25
uvx harbor run -d ineqmath@1.0 -t 25
cc647b2
26
uvx harbor run -d ineqmath@1.0 -t 26
cc647b2
27
uvx harbor run -d ineqmath@1.0 -t 27
cc647b2
28
uvx harbor run -d ineqmath@1.0 -t 28
cc647b2
29
uvx harbor run -d ineqmath@1.0 -t 29
cc647b2
3
uvx harbor run -d ineqmath@1.0 -t 3
cc647b2
30
uvx harbor run -d ineqmath@1.0 -t 30
cc647b2
31
uvx harbor run -d ineqmath@1.0 -t 31
cc647b2
32
uvx harbor run -d ineqmath@1.0 -t 32
cc647b2
33
uvx harbor run -d ineqmath@1.0 -t 33
cc647b2
34
uvx harbor run -d ineqmath@1.0 -t 34
cc647b2
35
uvx harbor run -d ineqmath@1.0 -t 35
cc647b2
36
uvx harbor run -d ineqmath@1.0 -t 36
cc647b2
37
uvx harbor run -d ineqmath@1.0 -t 37
cc647b2
38
uvx harbor run -d ineqmath@1.0 -t 38
cc647b2
39
uvx harbor run -d ineqmath@1.0 -t 39
cc647b2
4
uvx harbor run -d ineqmath@1.0 -t 4
cc647b2
40
uvx harbor run -d ineqmath@1.0 -t 40
cc647b2
41
uvx harbor run -d ineqmath@1.0 -t 41
cc647b2
42
uvx harbor run -d ineqmath@1.0 -t 42
cc647b2
43
uvx harbor run -d ineqmath@1.0 -t 43
cc647b2
44
uvx harbor run -d ineqmath@1.0 -t 44
cc647b2
45
uvx harbor run -d ineqmath@1.0 -t 45
cc647b2
46
uvx harbor run -d ineqmath@1.0 -t 46
cc647b2
47
uvx harbor run -d ineqmath@1.0 -t 47
cc647b2
48
uvx harbor run -d ineqmath@1.0 -t 48
cc647b2
49
uvx harbor run -d ineqmath@1.0 -t 49
cc647b2
5
uvx harbor run -d ineqmath@1.0 -t 5
cc647b2
50
uvx harbor run -d ineqmath@1.0 -t 50
cc647b2
51
uvx harbor run -d ineqmath@1.0 -t 51
cc647b2
52
uvx harbor run -d ineqmath@1.0 -t 52
cc647b2
53
uvx harbor run -d ineqmath@1.0 -t 53
cc647b2
54
uvx harbor run -d ineqmath@1.0 -t 54
cc647b2
55
uvx harbor run -d ineqmath@1.0 -t 55
cc647b2
56
uvx harbor run -d ineqmath@1.0 -t 56
cc647b2
57
uvx harbor run -d ineqmath@1.0 -t 57
cc647b2
58
uvx harbor run -d ineqmath@1.0 -t 58
cc647b2
59
uvx harbor run -d ineqmath@1.0 -t 59
cc647b2
6
uvx harbor run -d ineqmath@1.0 -t 6
cc647b2
60
uvx harbor run -d ineqmath@1.0 -t 60
cc647b2
61
uvx harbor run -d ineqmath@1.0 -t 61
cc647b2
62
uvx harbor run -d ineqmath@1.0 -t 62
cc647b2
63
uvx harbor run -d ineqmath@1.0 -t 63
cc647b2
64
uvx harbor run -d ineqmath@1.0 -t 64
cc647b2
65
uvx harbor run -d ineqmath@1.0 -t 65
cc647b2
66
uvx harbor run -d ineqmath@1.0 -t 66
cc647b2
67
uvx harbor run -d ineqmath@1.0 -t 67
cc647b2
68
uvx harbor run -d ineqmath@1.0 -t 68
cc647b2
69
uvx harbor run -d ineqmath@1.0 -t 69
cc647b2
7
uvx harbor run -d ineqmath@1.0 -t 7
cc647b2
70
uvx harbor run -d ineqmath@1.0 -t 70
cc647b2
71
uvx harbor run -d ineqmath@1.0 -t 71
cc647b2
72
uvx harbor run -d ineqmath@1.0 -t 72
cc647b2
73
uvx harbor run -d ineqmath@1.0 -t 73
cc647b2
74
uvx harbor run -d ineqmath@1.0 -t 74
cc647b2
75
uvx harbor run -d ineqmath@1.0 -t 75
cc647b2
76
uvx harbor run -d ineqmath@1.0 -t 76
cc647b2
77
uvx harbor run -d ineqmath@1.0 -t 77
cc647b2
78
uvx harbor run -d ineqmath@1.0 -t 78
cc647b2
79
uvx harbor run -d ineqmath@1.0 -t 79
cc647b2
8
uvx harbor run -d ineqmath@1.0 -t 8
cc647b2
80
uvx harbor run -d ineqmath@1.0 -t 80
cc647b2
81
uvx harbor run -d ineqmath@1.0 -t 81
cc647b2
82
uvx harbor run -d ineqmath@1.0 -t 82
cc647b2
83
uvx harbor run -d ineqmath@1.0 -t 83
cc647b2
84
uvx harbor run -d ineqmath@1.0 -t 84
cc647b2
85
uvx harbor run -d ineqmath@1.0 -t 85
cc647b2
86
uvx harbor run -d ineqmath@1.0 -t 86
cc647b2
87
uvx harbor run -d ineqmath@1.0 -t 87
cc647b2
88
uvx harbor run -d ineqmath@1.0 -t 88
cc647b2
89
uvx harbor run -d ineqmath@1.0 -t 89
cc647b2
9
uvx harbor run -d ineqmath@1.0 -t 9
cc647b2
90
uvx harbor run -d ineqmath@1.0 -t 90
cc647b2
91
uvx harbor run -d ineqmath@1.0 -t 91
cc647b2
92
uvx harbor run -d ineqmath@1.0 -t 92
cc647b2
93
uvx harbor run -d ineqmath@1.0 -t 93
cc647b2
94
uvx harbor run -d ineqmath@1.0 -t 94
cc647b2
95
uvx harbor run -d ineqmath@1.0 -t 95
cc647b2
96
uvx harbor run -d ineqmath@1.0 -t 96
cc647b2
97
uvx harbor run -d ineqmath@1.0 -t 97
cc647b2
98
uvx harbor run -d ineqmath@1.0 -t 98
cc647b2
99
uvx harbor run -d ineqmath@1.0 -t 99
cc647b2