这是indexloc提供的服务,不要输入任何密码
Skip to content

作者你好,我想请问一下,为什么minimind的效果这么好呢? #467

@lwdnxu

Description

@lwdnxu

你好!

我最近在预训练模型,用的是0.1B参数的模型, 用的就是minimind的代码,相同数据集的情况下,我想请问,为什么minimind的效果这么好呢?因为作者多次测试,对参数进行了优化吗?

我自己训练了有十几次,没有一次的效果比得上minimind的。

Metadata

Metadata

Assignees

No one assigned

    Labels

    questionFurther information is requested

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions