-
Notifications
You must be signed in to change notification settings - Fork 518
如何定义“大模型” #14
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Comments
网上流传的各种版本都是引用了本仓库 【https://github.com/wgwang/LLMs-In-China】 或 公众号【走向未来】 的,本仓库是从零开始整理的,是目前搜集国内大模型最全的仓库。 |
认同这个观点,大模型肯定要原创的,基于别人的模型做了微调的这种就不要放进来了,或者弄个微调的榜单区分开 |
开放开源的比较简单,可以区分。但很多“只发布”没公开细节的,就没法区分了,所以,“国产大模型” 就不区分了。 另外有一个单独的开源开放大模型列表,只收录基础大模型,包括国内外的,可参考,也欢迎补充。 https://github.com/wgwang/awesome-LLMs-In-China/blob/main/Open-LLMs.md |
闭源很多,很难保证是不是微调还是原创 |
闭源的情况下甚至你很难判断这个是一个算法系统,还是是一个e2e的模型。 |
我最近也在梳理,感觉有一个问题不知道如何解决。目前这份榜单是基于之前流传的一个93家大模型的名单扩充的。但是,
例如SenseTime的日日新,是一套to B的产品,其中大模型部分没有专门的名字,SenseChat是其中GPT大模型包装的产品。出门问问的序列猴子也是一样。以后一个公司只要把GPT技术用到了自己的产品,并且发了新闻,然后被列出来,那这个榜单很快就会非常庞大。
The text was updated successfully, but these errors were encountered: