Hellobench

Metrics

average

chat-rescaled score

heuristic text generation-rescaled score

llm_model

model_url

open-ended qa-rescaled score

organization

parameters

release_date

summarization-rescaled score

text completion-rescaled score

updated_time

Results

Performance results of various models on this benchmark

													Paper Title	Code
API	48.55	42.88	47.87	GPT-4o-2024-08-06	https://platform.openai.com/docs/guides	54.82	OpenAI	N/A	2024/8/6	29.71	67.49	2024/9/24	-

0 of 1 row(s) selected.

Hellobench

Metrics

average

chat-rescaled score

heuristic text generation-rescaled score

llm_model

model_url

open-ended qa-rescaled score

organization

parameters

release_date

summarization-rescaled score

text completion-rescaled score

updated_time

Results

Performance results of various models on this benchmark

													Paper Title	Code
API	48.55	42.88	47.87	GPT-4o-2024-08-06	https://platform.openai.com/docs/guides	54.82	OpenAI	N/A	2024/8/6	29.71	67.49	2024/9/24	-

0 of 1 row(s) selected.

Hellobench | SOTA | HyperAI超神经