如何定义“大模型” #14

GradientGuru · 2023-07-13T04:48:45Z

我最近也在梳理，感觉有一个问题不知道如何解决。目前这份榜单是基于之前流传的一个93家大模型的名单扩充的。但是，
例如SenseTime的日日新，是一套to B的产品，其中大模型部分没有专门的名字，SenseChat是其中GPT大模型包装的产品。出门问问的序列猴子也是一样。以后一个公司只要把GPT技术用到了自己的产品，并且发了新闻，然后被列出来，那这个榜单很快就会非常庞大。

wgwang · 2023-07-14T13:32:22Z

网上流传的各种版本都是引用了本仓库【https://github.com/wgwang/LLMs-In-China】或公众号【走向未来】的，本仓库是从零开始整理的，是目前搜集国内大模型最全的仓库。

xjwspeak · 2023-07-19T03:40:30Z

认同这个观点，大模型肯定要原创的，基于别人的模型做了微调的这种就不要放进来了，或者弄个微调的榜单区分开

wgwang · 2023-07-24T00:33:42Z

开放开源的比较简单，可以区分。但很多“只发布”没公开细节的，就没法区分了，所以，“国产大模型” 就不区分了。

另外有一个单独的开源开放大模型列表，只收录基础大模型，包括国内外的，可参考，也欢迎补充。

https://github.com/wgwang/awesome-LLMs-In-China/blob/main/Open-LLMs.md

NeoZhangTCL · 2024-01-03T03:03:31Z

认同这个观点，大模型肯定要原创的，基于别人的模型做了微调的这种就不要放进来了，或者弄个微调的榜单区分开

闭源很多，很难保证是不是微调还是原创

Duan-JM · 2024-01-05T02:01:39Z

闭源的情况下甚至你很难判断这个是一个算法系统，还是是一个e2e的模型。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

如何定义“大模型” #14

如何定义“大模型” #14

GradientGuru commented Jul 13, 2023

wgwang commented Jul 14, 2023

xjwspeak commented Jul 19, 2023

wgwang commented Jul 24, 2023 •

edited

Loading

NeoZhangTCL commented Jan 3, 2024

Duan-JM commented Jan 5, 2024

如何定义“大模型” #14

如何定义“大模型” #14

Comments

GradientGuru commented Jul 13, 2023

wgwang commented Jul 14, 2023

xjwspeak commented Jul 19, 2023

wgwang commented Jul 24, 2023 • edited Loading

NeoZhangTCL commented Jan 3, 2024

Duan-JM commented Jan 5, 2024

wgwang commented Jul 24, 2023 •

edited

Loading