bfcl
v1.0Berkeley Function-Calling Leaderboard: 3,641 function calling tasks for evaluating LLM tool use capabilities across simple, multiple, parallel, and irrelevance categories.
uvx harbor run -d bfcl@1.0Tasks (3641)
bfcl-live-multiple-57-22-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-57-22-46bedd78
bfcl-live-multiple-570-155-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-570-155-106bedd78
bfcl-live-multiple-571-155-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-571-155-116bedd78
bfcl-live-multiple-572-155-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-572-155-126bedd78
bfcl-live-multiple-573-155-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-573-155-136bedd78
bfcl-live-multiple-574-156-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-574-156-06bedd78
bfcl-live-multiple-575-156-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-575-156-16bedd78
bfcl-live-multiple-576-156-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-576-156-26bedd78
bfcl-live-multiple-577-156-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-577-156-36bedd78
bfcl-live-multiple-578-156-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-578-156-46bedd78
bfcl-live-multiple-579-157-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-579-157-06bedd78
bfcl-live-multiple-58-22-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-58-22-56bedd78
bfcl-live-multiple-580-157-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-580-157-16bedd78
bfcl-live-multiple-581-157-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-581-157-26bedd78
bfcl-live-multiple-582-157-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-582-157-36bedd78
bfcl-live-multiple-583-157-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-583-157-46bedd78
bfcl-live-multiple-584-157-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-584-157-56bedd78
bfcl-live-multiple-585-157-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-585-157-66bedd78
bfcl-live-multiple-586-157-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-586-157-76bedd78
bfcl-live-multiple-587-157-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-587-157-86bedd78
bfcl-live-multiple-588-157-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-588-157-96bedd78
bfcl-live-multiple-589-157-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-589-157-106bedd78
bfcl-live-multiple-59-22-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-59-22-66bedd78
bfcl-live-multiple-590-157-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-590-157-116bedd78
bfcl-live-multiple-591-157-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-591-157-126bedd78
bfcl-live-multiple-592-157-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-592-157-136bedd78
bfcl-live-multiple-593-157-14
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-593-157-146bedd78
bfcl-live-multiple-594-158-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-594-158-06bedd78
bfcl-live-multiple-595-158-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-595-158-16bedd78
bfcl-live-multiple-596-158-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-596-158-26bedd78
bfcl-live-multiple-597-158-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-597-158-36bedd78
bfcl-live-multiple-598-158-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-598-158-46bedd78
bfcl-live-multiple-599-158-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-599-158-56bedd78
bfcl-live-multiple-6-3-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-6-3-16bedd78
bfcl-live-multiple-60-22-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-60-22-76bedd78
bfcl-live-multiple-600-158-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-600-158-66bedd78
bfcl-live-multiple-601-158-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-601-158-76bedd78
bfcl-live-multiple-602-158-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-602-158-86bedd78
bfcl-live-multiple-603-158-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-603-158-96bedd78
bfcl-live-multiple-604-158-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-604-158-106bedd78
bfcl-live-multiple-605-158-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-605-158-116bedd78
bfcl-live-multiple-606-158-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-606-158-126bedd78
bfcl-live-multiple-607-159-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-607-159-06bedd78
bfcl-live-multiple-608-159-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-608-159-16bedd78
bfcl-live-multiple-609-159-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-609-159-26bedd78
bfcl-live-multiple-61-23-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-61-23-06bedd78
bfcl-live-multiple-610-159-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-610-159-36bedd78
bfcl-live-multiple-611-159-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-611-159-46bedd78
bfcl-live-multiple-612-159-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-612-159-56bedd78
bfcl-live-multiple-613-159-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-613-159-66bedd78
bfcl-live-multiple-614-159-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-614-159-76bedd78
bfcl-live-multiple-615-159-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-615-159-86bedd78
bfcl-live-multiple-616-159-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-616-159-96bedd78
bfcl-live-multiple-617-159-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-617-159-106bedd78
bfcl-live-multiple-618-159-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-618-159-116bedd78
bfcl-live-multiple-619-159-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-619-159-126bedd78
bfcl-live-multiple-62-24-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-62-24-06bedd78
bfcl-live-multiple-620-160-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-620-160-06bedd78
bfcl-live-multiple-621-160-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-621-160-16bedd78
bfcl-live-multiple-622-160-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-622-160-26bedd78
bfcl-live-multiple-623-160-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-623-160-36bedd78
bfcl-live-multiple-624-160-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-624-160-46bedd78
bfcl-live-multiple-625-160-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-625-160-56bedd78
bfcl-live-multiple-626-160-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-626-160-66bedd78
bfcl-live-multiple-627-160-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-627-160-76bedd78
bfcl-live-multiple-628-160-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-628-160-86bedd78
bfcl-live-multiple-629-160-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-629-160-96bedd78
bfcl-live-multiple-63-25-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-63-25-06bedd78
bfcl-live-multiple-630-160-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-630-160-106bedd78
bfcl-live-multiple-631-160-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-631-160-116bedd78
bfcl-live-multiple-632-161-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-632-161-06bedd78
bfcl-live-multiple-633-161-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-633-161-16bedd78
bfcl-live-multiple-634-161-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-634-161-26bedd78
bfcl-live-multiple-635-161-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-635-161-36bedd78
bfcl-live-multiple-636-161-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-636-161-46bedd78
bfcl-live-multiple-637-161-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-637-161-56bedd78
bfcl-live-multiple-638-161-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-638-161-66bedd78
bfcl-live-multiple-639-161-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-639-161-76bedd78
bfcl-live-multiple-64-26-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-64-26-06bedd78
bfcl-live-multiple-640-161-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-640-161-86bedd78
bfcl-live-multiple-641-161-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-641-161-96bedd78
bfcl-live-multiple-642-161-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-642-161-106bedd78
bfcl-live-multiple-643-161-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-643-161-116bedd78
bfcl-live-multiple-644-161-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-644-161-126bedd78
bfcl-live-multiple-645-161-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-645-161-136bedd78
bfcl-live-multiple-646-161-14
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-646-161-146bedd78
bfcl-live-multiple-647-161-15
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-647-161-156bedd78
bfcl-live-multiple-648-161-16
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-648-161-166bedd78
bfcl-live-multiple-649-161-17
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-649-161-176bedd78
bfcl-live-multiple-65-26-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-65-26-16bedd78
bfcl-live-multiple-650-161-18
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-650-161-186bedd78
bfcl-live-multiple-651-161-19
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-651-161-196bedd78
bfcl-live-multiple-652-161-20
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-652-161-206bedd78
bfcl-live-multiple-653-161-21
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-653-161-216bedd78
bfcl-live-multiple-654-161-22
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-654-161-226bedd78
bfcl-live-multiple-655-161-23
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-655-161-236bedd78
bfcl-live-multiple-656-161-24
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-656-161-246bedd78
bfcl-live-multiple-657-161-25
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-657-161-256bedd78
bfcl-live-multiple-658-162-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-658-162-06bedd78
bfcl-live-multiple-659-162-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-659-162-16bedd78