bfcl
v1.0Berkeley Function-Calling Leaderboard: 3,641 function calling tasks for evaluating LLM tool use capabilities across simple, multiple, parallel, and irrelevance categories.
uvx harbor run -d bfcl@1.0Tasks (3641)
bfcl-live-multiple-66-27-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-66-27-06bedd78
bfcl-live-multiple-660-162-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-660-162-26bedd78
bfcl-live-multiple-661-162-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-661-162-36bedd78
bfcl-live-multiple-662-162-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-662-162-46bedd78
bfcl-live-multiple-663-162-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-663-162-56bedd78
bfcl-live-multiple-664-162-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-664-162-66bedd78
bfcl-live-multiple-665-162-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-665-162-76bedd78
bfcl-live-multiple-666-162-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-666-162-86bedd78
bfcl-live-multiple-667-162-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-667-162-96bedd78
bfcl-live-multiple-668-162-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-668-162-106bedd78
bfcl-live-multiple-669-162-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-669-162-116bedd78
bfcl-live-multiple-67-28-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-67-28-06bedd78
bfcl-live-multiple-670-162-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-670-162-126bedd78
bfcl-live-multiple-671-162-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-671-162-136bedd78
bfcl-live-multiple-672-162-14
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-672-162-146bedd78
bfcl-live-multiple-673-162-15
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-673-162-156bedd78
bfcl-live-multiple-674-162-16
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-674-162-166bedd78
bfcl-live-multiple-675-163-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-675-163-06bedd78
bfcl-live-multiple-676-163-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-676-163-16bedd78
bfcl-live-multiple-677-163-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-677-163-26bedd78
bfcl-live-multiple-678-163-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-678-163-36bedd78
bfcl-live-multiple-679-163-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-679-163-46bedd78
bfcl-live-multiple-68-29-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-68-29-06bedd78
bfcl-live-multiple-680-163-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-680-163-56bedd78
bfcl-live-multiple-681-163-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-681-163-66bedd78
bfcl-live-multiple-682-163-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-682-163-76bedd78
bfcl-live-multiple-683-163-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-683-163-86bedd78
bfcl-live-multiple-684-164-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-684-164-06bedd78
bfcl-live-multiple-685-164-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-685-164-16bedd78
bfcl-live-multiple-686-164-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-686-164-26bedd78
bfcl-live-multiple-687-164-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-687-164-36bedd78
bfcl-live-multiple-688-164-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-688-164-46bedd78
bfcl-live-multiple-689-164-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-689-164-56bedd78
bfcl-live-multiple-69-30-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-69-30-06bedd78
bfcl-live-multiple-690-164-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-690-164-66bedd78
bfcl-live-multiple-691-164-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-691-164-76bedd78
bfcl-live-multiple-692-164-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-692-164-86bedd78
bfcl-live-multiple-693-164-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-693-164-96bedd78
bfcl-live-multiple-694-164-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-694-164-106bedd78
bfcl-live-multiple-695-164-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-695-164-116bedd78
bfcl-live-multiple-696-164-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-696-164-126bedd78
bfcl-live-multiple-697-164-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-697-164-136bedd78
bfcl-live-multiple-698-164-14
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-698-164-146bedd78
bfcl-live-multiple-699-164-15
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-699-164-156bedd78
bfcl-live-multiple-7-3-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-7-3-26bedd78
bfcl-live-multiple-70-30-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-70-30-16bedd78
bfcl-live-multiple-700-164-16
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-700-164-166bedd78
bfcl-live-multiple-701-164-17
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-701-164-176bedd78
bfcl-live-multiple-702-164-18
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-702-164-186bedd78
bfcl-live-multiple-703-164-19
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-703-164-196bedd78
bfcl-live-multiple-704-164-20
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-704-164-206bedd78
bfcl-live-multiple-705-164-21
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-705-164-216bedd78
bfcl-live-multiple-706-164-22
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-706-164-226bedd78
bfcl-live-multiple-707-164-23
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-707-164-236bedd78
bfcl-live-multiple-708-164-24
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-708-164-246bedd78
bfcl-live-multiple-709-164-25
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-709-164-256bedd78
bfcl-live-multiple-71-31-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-71-31-06bedd78
bfcl-live-multiple-710-164-26
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-710-164-266bedd78
bfcl-live-multiple-711-164-27
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-711-164-276bedd78
bfcl-live-multiple-712-164-28
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-712-164-286bedd78
bfcl-live-multiple-713-165-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-713-165-06bedd78
bfcl-live-multiple-714-165-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-714-165-16bedd78
bfcl-live-multiple-715-165-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-715-165-26bedd78
bfcl-live-multiple-716-165-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-716-165-36bedd78
bfcl-live-multiple-717-165-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-717-165-46bedd78
bfcl-live-multiple-718-165-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-718-165-56bedd78
bfcl-live-multiple-719-165-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-719-165-66bedd78
bfcl-live-multiple-72-32-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-72-32-06bedd78
bfcl-live-multiple-720-165-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-720-165-76bedd78
bfcl-live-multiple-721-165-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-721-165-86bedd78
bfcl-live-multiple-722-165-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-722-165-96bedd78
bfcl-live-multiple-723-165-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-723-165-106bedd78
bfcl-live-multiple-724-165-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-724-165-116bedd78
bfcl-live-multiple-725-166-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-725-166-06bedd78
bfcl-live-multiple-726-166-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-726-166-16bedd78
bfcl-live-multiple-727-166-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-727-166-26bedd78
bfcl-live-multiple-728-166-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-728-166-36bedd78
bfcl-live-multiple-729-167-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-729-167-06bedd78
bfcl-live-multiple-73-33-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-73-33-06bedd78
bfcl-live-multiple-730-167-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-730-167-16bedd78
bfcl-live-multiple-731-167-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-731-167-26bedd78
bfcl-live-multiple-732-167-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-732-167-36bedd78
bfcl-live-multiple-733-167-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-733-167-46bedd78
bfcl-live-multiple-734-167-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-734-167-56bedd78
bfcl-live-multiple-735-167-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-735-167-66bedd78
bfcl-live-multiple-736-167-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-736-167-76bedd78
bfcl-live-multiple-737-167-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-737-167-86bedd78
bfcl-live-multiple-738-168-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-738-168-06bedd78
bfcl-live-multiple-739-168-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-739-168-16bedd78
bfcl-live-multiple-74-34-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-74-34-06bedd78
bfcl-live-multiple-740-168-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-740-168-26bedd78
bfcl-live-multiple-741-168-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-741-168-36bedd78
bfcl-live-multiple-742-168-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-742-168-46bedd78
bfcl-live-multiple-743-168-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-743-168-56bedd78
bfcl-live-multiple-744-168-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-744-168-66bedd78
bfcl-live-multiple-745-169-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-745-169-06bedd78
bfcl-live-multiple-746-169-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-746-169-16bedd78
bfcl-live-multiple-747-169-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-747-169-26bedd78
bfcl-live-multiple-748-169-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-748-169-36bedd78
bfcl-live-multiple-749-169-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-749-169-46bedd78