bfcl

v1.0

Berkeley Function-Calling Leaderboard: 3,641 function calling tasks for evaluating LLM tool use capabilities across simple, multiple, parallel, and irrelevance categories.

uvx harbor run -d bfcl@1.0

Tasks (3641)

bfcl-live-multiple-66-27-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-66-27-0
6bedd78
bfcl-live-multiple-660-162-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-660-162-2
6bedd78
bfcl-live-multiple-661-162-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-661-162-3
6bedd78
bfcl-live-multiple-662-162-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-662-162-4
6bedd78
bfcl-live-multiple-663-162-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-663-162-5
6bedd78
bfcl-live-multiple-664-162-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-664-162-6
6bedd78
bfcl-live-multiple-665-162-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-665-162-7
6bedd78
bfcl-live-multiple-666-162-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-666-162-8
6bedd78
bfcl-live-multiple-667-162-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-667-162-9
6bedd78
bfcl-live-multiple-668-162-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-668-162-10
6bedd78
bfcl-live-multiple-669-162-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-669-162-11
6bedd78
bfcl-live-multiple-67-28-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-67-28-0
6bedd78
bfcl-live-multiple-670-162-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-670-162-12
6bedd78
bfcl-live-multiple-671-162-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-671-162-13
6bedd78
bfcl-live-multiple-672-162-14
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-672-162-14
6bedd78
bfcl-live-multiple-673-162-15
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-673-162-15
6bedd78
bfcl-live-multiple-674-162-16
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-674-162-16
6bedd78
bfcl-live-multiple-675-163-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-675-163-0
6bedd78
bfcl-live-multiple-676-163-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-676-163-1
6bedd78
bfcl-live-multiple-677-163-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-677-163-2
6bedd78
bfcl-live-multiple-678-163-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-678-163-3
6bedd78
bfcl-live-multiple-679-163-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-679-163-4
6bedd78
bfcl-live-multiple-68-29-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-68-29-0
6bedd78
bfcl-live-multiple-680-163-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-680-163-5
6bedd78
bfcl-live-multiple-681-163-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-681-163-6
6bedd78
bfcl-live-multiple-682-163-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-682-163-7
6bedd78
bfcl-live-multiple-683-163-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-683-163-8
6bedd78
bfcl-live-multiple-684-164-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-684-164-0
6bedd78
bfcl-live-multiple-685-164-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-685-164-1
6bedd78
bfcl-live-multiple-686-164-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-686-164-2
6bedd78
bfcl-live-multiple-687-164-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-687-164-3
6bedd78
bfcl-live-multiple-688-164-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-688-164-4
6bedd78
bfcl-live-multiple-689-164-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-689-164-5
6bedd78
bfcl-live-multiple-69-30-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-69-30-0
6bedd78
bfcl-live-multiple-690-164-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-690-164-6
6bedd78
bfcl-live-multiple-691-164-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-691-164-7
6bedd78
bfcl-live-multiple-692-164-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-692-164-8
6bedd78
bfcl-live-multiple-693-164-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-693-164-9
6bedd78
bfcl-live-multiple-694-164-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-694-164-10
6bedd78
bfcl-live-multiple-695-164-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-695-164-11
6bedd78
bfcl-live-multiple-696-164-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-696-164-12
6bedd78
bfcl-live-multiple-697-164-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-697-164-13
6bedd78
bfcl-live-multiple-698-164-14
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-698-164-14
6bedd78
bfcl-live-multiple-699-164-15
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-699-164-15
6bedd78
bfcl-live-multiple-7-3-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-7-3-2
6bedd78
bfcl-live-multiple-70-30-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-70-30-1
6bedd78
bfcl-live-multiple-700-164-16
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-700-164-16
6bedd78
bfcl-live-multiple-701-164-17
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-701-164-17
6bedd78
bfcl-live-multiple-702-164-18
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-702-164-18
6bedd78
bfcl-live-multiple-703-164-19
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-703-164-19
6bedd78
bfcl-live-multiple-704-164-20
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-704-164-20
6bedd78
bfcl-live-multiple-705-164-21
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-705-164-21
6bedd78
bfcl-live-multiple-706-164-22
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-706-164-22
6bedd78
bfcl-live-multiple-707-164-23
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-707-164-23
6bedd78
bfcl-live-multiple-708-164-24
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-708-164-24
6bedd78
bfcl-live-multiple-709-164-25
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-709-164-25
6bedd78
bfcl-live-multiple-71-31-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-71-31-0
6bedd78
bfcl-live-multiple-710-164-26
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-710-164-26
6bedd78
bfcl-live-multiple-711-164-27
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-711-164-27
6bedd78
bfcl-live-multiple-712-164-28
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-712-164-28
6bedd78
bfcl-live-multiple-713-165-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-713-165-0
6bedd78
bfcl-live-multiple-714-165-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-714-165-1
6bedd78
bfcl-live-multiple-715-165-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-715-165-2
6bedd78
bfcl-live-multiple-716-165-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-716-165-3
6bedd78
bfcl-live-multiple-717-165-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-717-165-4
6bedd78
bfcl-live-multiple-718-165-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-718-165-5
6bedd78
bfcl-live-multiple-719-165-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-719-165-6
6bedd78
bfcl-live-multiple-72-32-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-72-32-0
6bedd78
bfcl-live-multiple-720-165-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-720-165-7
6bedd78
bfcl-live-multiple-721-165-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-721-165-8
6bedd78
bfcl-live-multiple-722-165-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-722-165-9
6bedd78
bfcl-live-multiple-723-165-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-723-165-10
6bedd78
bfcl-live-multiple-724-165-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-724-165-11
6bedd78
bfcl-live-multiple-725-166-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-725-166-0
6bedd78
bfcl-live-multiple-726-166-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-726-166-1
6bedd78
bfcl-live-multiple-727-166-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-727-166-2
6bedd78
bfcl-live-multiple-728-166-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-728-166-3
6bedd78
bfcl-live-multiple-729-167-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-729-167-0
6bedd78
bfcl-live-multiple-73-33-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-73-33-0
6bedd78
bfcl-live-multiple-730-167-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-730-167-1
6bedd78
bfcl-live-multiple-731-167-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-731-167-2
6bedd78
bfcl-live-multiple-732-167-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-732-167-3
6bedd78
bfcl-live-multiple-733-167-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-733-167-4
6bedd78
bfcl-live-multiple-734-167-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-734-167-5
6bedd78
bfcl-live-multiple-735-167-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-735-167-6
6bedd78
bfcl-live-multiple-736-167-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-736-167-7
6bedd78
bfcl-live-multiple-737-167-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-737-167-8
6bedd78
bfcl-live-multiple-738-168-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-738-168-0
6bedd78
bfcl-live-multiple-739-168-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-739-168-1
6bedd78
bfcl-live-multiple-74-34-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-74-34-0
6bedd78
bfcl-live-multiple-740-168-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-740-168-2
6bedd78
bfcl-live-multiple-741-168-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-741-168-3
6bedd78
bfcl-live-multiple-742-168-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-742-168-4
6bedd78
bfcl-live-multiple-743-168-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-743-168-5
6bedd78
bfcl-live-multiple-744-168-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-744-168-6
6bedd78
bfcl-live-multiple-745-169-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-745-169-0
6bedd78
bfcl-live-multiple-746-169-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-746-169-1
6bedd78
bfcl-live-multiple-747-169-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-747-169-2
6bedd78
bfcl-live-multiple-748-169-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-748-169-3
6bedd78
bfcl-live-multiple-749-169-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-749-169-4
6bedd78