bfcl

v1.0

Berkeley Function-Calling Leaderboard: 3,641 function calling tasks for evaluating LLM tool use capabilities across simple, multiple, parallel, and irrelevance categories.

uvx harbor run -d bfcl@1.0

Tasks (3641)

bfcl-live-multiple-57-22-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-57-22-4
6bedd78
bfcl-live-multiple-570-155-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-570-155-10
6bedd78
bfcl-live-multiple-571-155-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-571-155-11
6bedd78
bfcl-live-multiple-572-155-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-572-155-12
6bedd78
bfcl-live-multiple-573-155-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-573-155-13
6bedd78
bfcl-live-multiple-574-156-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-574-156-0
6bedd78
bfcl-live-multiple-575-156-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-575-156-1
6bedd78
bfcl-live-multiple-576-156-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-576-156-2
6bedd78
bfcl-live-multiple-577-156-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-577-156-3
6bedd78
bfcl-live-multiple-578-156-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-578-156-4
6bedd78
bfcl-live-multiple-579-157-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-579-157-0
6bedd78
bfcl-live-multiple-58-22-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-58-22-5
6bedd78
bfcl-live-multiple-580-157-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-580-157-1
6bedd78
bfcl-live-multiple-581-157-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-581-157-2
6bedd78
bfcl-live-multiple-582-157-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-582-157-3
6bedd78
bfcl-live-multiple-583-157-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-583-157-4
6bedd78
bfcl-live-multiple-584-157-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-584-157-5
6bedd78
bfcl-live-multiple-585-157-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-585-157-6
6bedd78
bfcl-live-multiple-586-157-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-586-157-7
6bedd78
bfcl-live-multiple-587-157-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-587-157-8
6bedd78
bfcl-live-multiple-588-157-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-588-157-9
6bedd78
bfcl-live-multiple-589-157-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-589-157-10
6bedd78
bfcl-live-multiple-59-22-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-59-22-6
6bedd78
bfcl-live-multiple-590-157-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-590-157-11
6bedd78
bfcl-live-multiple-591-157-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-591-157-12
6bedd78
bfcl-live-multiple-592-157-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-592-157-13
6bedd78
bfcl-live-multiple-593-157-14
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-593-157-14
6bedd78
bfcl-live-multiple-594-158-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-594-158-0
6bedd78
bfcl-live-multiple-595-158-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-595-158-1
6bedd78
bfcl-live-multiple-596-158-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-596-158-2
6bedd78
bfcl-live-multiple-597-158-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-597-158-3
6bedd78
bfcl-live-multiple-598-158-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-598-158-4
6bedd78
bfcl-live-multiple-599-158-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-599-158-5
6bedd78
bfcl-live-multiple-6-3-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-6-3-1
6bedd78
bfcl-live-multiple-60-22-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-60-22-7
6bedd78
bfcl-live-multiple-600-158-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-600-158-6
6bedd78
bfcl-live-multiple-601-158-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-601-158-7
6bedd78
bfcl-live-multiple-602-158-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-602-158-8
6bedd78
bfcl-live-multiple-603-158-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-603-158-9
6bedd78
bfcl-live-multiple-604-158-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-604-158-10
6bedd78
bfcl-live-multiple-605-158-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-605-158-11
6bedd78
bfcl-live-multiple-606-158-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-606-158-12
6bedd78
bfcl-live-multiple-607-159-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-607-159-0
6bedd78
bfcl-live-multiple-608-159-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-608-159-1
6bedd78
bfcl-live-multiple-609-159-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-609-159-2
6bedd78
bfcl-live-multiple-61-23-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-61-23-0
6bedd78
bfcl-live-multiple-610-159-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-610-159-3
6bedd78
bfcl-live-multiple-611-159-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-611-159-4
6bedd78
bfcl-live-multiple-612-159-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-612-159-5
6bedd78
bfcl-live-multiple-613-159-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-613-159-6
6bedd78
bfcl-live-multiple-614-159-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-614-159-7
6bedd78
bfcl-live-multiple-615-159-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-615-159-8
6bedd78
bfcl-live-multiple-616-159-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-616-159-9
6bedd78
bfcl-live-multiple-617-159-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-617-159-10
6bedd78
bfcl-live-multiple-618-159-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-618-159-11
6bedd78
bfcl-live-multiple-619-159-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-619-159-12
6bedd78
bfcl-live-multiple-62-24-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-62-24-0
6bedd78
bfcl-live-multiple-620-160-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-620-160-0
6bedd78
bfcl-live-multiple-621-160-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-621-160-1
6bedd78
bfcl-live-multiple-622-160-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-622-160-2
6bedd78
bfcl-live-multiple-623-160-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-623-160-3
6bedd78
bfcl-live-multiple-624-160-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-624-160-4
6bedd78
bfcl-live-multiple-625-160-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-625-160-5
6bedd78
bfcl-live-multiple-626-160-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-626-160-6
6bedd78
bfcl-live-multiple-627-160-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-627-160-7
6bedd78
bfcl-live-multiple-628-160-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-628-160-8
6bedd78
bfcl-live-multiple-629-160-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-629-160-9
6bedd78
bfcl-live-multiple-63-25-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-63-25-0
6bedd78
bfcl-live-multiple-630-160-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-630-160-10
6bedd78
bfcl-live-multiple-631-160-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-631-160-11
6bedd78
bfcl-live-multiple-632-161-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-632-161-0
6bedd78
bfcl-live-multiple-633-161-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-633-161-1
6bedd78
bfcl-live-multiple-634-161-2
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-634-161-2
6bedd78
bfcl-live-multiple-635-161-3
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-635-161-3
6bedd78
bfcl-live-multiple-636-161-4
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-636-161-4
6bedd78
bfcl-live-multiple-637-161-5
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-637-161-5
6bedd78
bfcl-live-multiple-638-161-6
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-638-161-6
6bedd78
bfcl-live-multiple-639-161-7
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-639-161-7
6bedd78
bfcl-live-multiple-64-26-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-64-26-0
6bedd78
bfcl-live-multiple-640-161-8
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-640-161-8
6bedd78
bfcl-live-multiple-641-161-9
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-641-161-9
6bedd78
bfcl-live-multiple-642-161-10
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-642-161-10
6bedd78
bfcl-live-multiple-643-161-11
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-643-161-11
6bedd78
bfcl-live-multiple-644-161-12
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-644-161-12
6bedd78
bfcl-live-multiple-645-161-13
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-645-161-13
6bedd78
bfcl-live-multiple-646-161-14
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-646-161-14
6bedd78
bfcl-live-multiple-647-161-15
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-647-161-15
6bedd78
bfcl-live-multiple-648-161-16
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-648-161-16
6bedd78
bfcl-live-multiple-649-161-17
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-649-161-17
6bedd78
bfcl-live-multiple-65-26-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-65-26-1
6bedd78
bfcl-live-multiple-650-161-18
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-650-161-18
6bedd78
bfcl-live-multiple-651-161-19
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-651-161-19
6bedd78
bfcl-live-multiple-652-161-20
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-652-161-20
6bedd78
bfcl-live-multiple-653-161-21
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-653-161-21
6bedd78
bfcl-live-multiple-654-161-22
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-654-161-22
6bedd78
bfcl-live-multiple-655-161-23
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-655-161-23
6bedd78
bfcl-live-multiple-656-161-24
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-656-161-24
6bedd78
bfcl-live-multiple-657-161-25
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-657-161-25
6bedd78
bfcl-live-multiple-658-162-0
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-658-162-0
6bedd78
bfcl-live-multiple-659-162-1
uvx harbor run -d bfcl@1.0 -t bfcl-live-multiple-659-162-1
6bedd78