bigcodebench-hard-complete
v1.0.0BigCodeBench-Hard complete benchmark adapter for Harbor - challenging Python programming tasks with reward-based verification
uvx harbor run -d bigcodebench-hard-complete@1.0.0Tasks (145)
bigcodebench_655
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_6554f398de
bigcodebench_657
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_6574f398de
bigcodebench_678
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_6784f398de
bigcodebench_720
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7204f398de
bigcodebench_723
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7234f398de
bigcodebench_752
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7524f398de
bigcodebench_760
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7604f398de
bigcodebench_763
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7634f398de
bigcodebench_765
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7654f398de
bigcodebench_771
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7714f398de
bigcodebench_777
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7774f398de
bigcodebench_785
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_7854f398de
bigcodebench_800
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8004f398de
bigcodebench_82
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_824f398de
bigcodebench_826
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8264f398de
bigcodebench_845
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8454f398de
bigcodebench_854
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8544f398de
bigcodebench_857
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8574f398de
bigcodebench_865
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8654f398de
bigcodebench_870
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8704f398de
bigcodebench_879
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8794f398de
bigcodebench_89
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_894f398de
bigcodebench_897
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_8974f398de
bigcodebench_906
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9064f398de
bigcodebench_914
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9144f398de
bigcodebench_915
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9154f398de
bigcodebench_916
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9164f398de
bigcodebench_917
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9174f398de
bigcodebench_92
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_924f398de
bigcodebench_928
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9284f398de
bigcodebench_93
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_934f398de
bigcodebench_942
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9424f398de
bigcodebench_945
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9454f398de
bigcodebench_952
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9524f398de
bigcodebench_955
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9554f398de
bigcodebench_963
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9634f398de
bigcodebench_964
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9644f398de
bigcodebench_969
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9694f398de
bigcodebench_971
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9714f398de
bigcodebench_985
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9854f398de
bigcodebench_988
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9884f398de
bigcodebench_99
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_994f398de
bigcodebench_990
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9904f398de
bigcodebench_998
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9984f398de
bigcodebench_999
uvx harbor run -d bigcodebench-hard-complete@1.0.0 -t bigcodebench_9994f398de