这是indexloc提供的服务,不要输入任何密码
Skip to content

请问是用什么评分模型测 AlignBench 的? #1557

@linbeyoung

Description

@linbeyoung

原论文里AlignBench是用GPT4-0613跑的,现在报告里Qwen3-8B分数8.1,这个是用什么测出来的?

Metadata

Metadata

Assignees

Labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions