文章分类

热门文章

iMyShare,公众号:神秘的热心网友 关注微信公众号

定期分享神兵利器,优质资源,精品学习资料,实用互联网小技巧!

大语言模型工具——GPT平替产品介绍

MeetUp
2023-09-10
373
0

前往网站首页查看更多精彩内容👉https://imyshare.com/


 

ClaudeAI​

 

ClaudeAI Chat是Anthropic基于Claude2发布的一个与GPT很像的产品。Claude2模型被认为是与GPT-4最接近的商业模型,尽管Claude2模型的API接口非常难申请,只有部分合作企业有权限。但是,Anthropic发布的ClaudeAI Chat确实免费向UK和US地区用户开放。

 

特点:

效果好,与GPT不相上下​

支持PDF,一次最多5个,一个文件最大10MB,分析效果惊人​

上下文长度最高100K​

中文支持非常好​

如果你是UK/US地区,免费使用,其它地区暂不支持

 

Google Bard​

 

Google Bard是谷歌发布的与GPT直接竞争的产品。尽管刚开始发布的时候Google Bard能力很弱,但是如今经过不断地迭代,Google Bard已经变得非常强大,可以生成代码、直接导出代码到colab,也支持多模态输入等。目前,Google Bard内核已经进化到PaLM2

 

特点:

迭代速度快,并且有更新历史查看,轻松理解新特性​

支持多模态输入,可以理解图片或者生成图片​

代码能力很强​

已经支持中文​

开放很多国家和地区,都是免费使用

 

Bing Chat​

作为最早接入GPT模型的服务提供商,Bing Chat一度被认为是Google搜索的挑战者。但是,之前的Bing Chat表现真的很一般。而最近Bing Chat更新后的能力明显比之前强很多。该服务与Google Bard类似,不过更新的速度和特性不如Google Bard快

 

特点:

支持多模态输入,可以理解图片或者生成图片​

支持中文​

开放很多国家和地区,都是免费使用​

可以基于网络检索结果回答问题,实时性好​

免费使用,覆盖全球大部分地区

 

ChatGLM​

清华大学系的公司智谱AI推出的在线体验版本。背后基于强大的ChatGLM模型提供服务。ChatGLM-6B系列是国产开源领域最强大的模型,效果很好,知名度很高。这个在线服务是基于ChatGLM标准版提供的,支持代码生成,中文理解能力很强。

 

不过这是一个收费的服务,最开始会赠送18元人民币的额度,用完之后需要充值

 

特点:

中文支持非常好,理解能力强​

大陆地区合法使用

 

POE​

背靠美国版知乎Quora,本身并没有发布任何大模型,但是集成了业界目前最优秀的API接口,提供GPT系列、Claude系列、PaLM系列(包括GPT-4-32K、Claude-2-100K等非常难以申请的API)等接口。每天可以免费使用一定数量的接口。订阅之后所有接口可用。

 

特点:

提供目前全球最强的模型接口​

每天有一定免费额度​

支持上传附件分析

 

HuggingChat​

这是由HuggingFace提供的一个基于LLM的在线聊天机器人服务。最大的特点是免费,背后提供了多个开源领域最强大的模型。响应速度很快,且没有啥限制,基本上能连上就能使用。尽管最初发布的时候性能较差,但是随着开源模型的强势进展,可用性很高了。而且更新速度快,最新的已经支持LLaMA2了。

 

特点:

完全免费,基本没有地区和账号限制​

支持联网搜索

 

Perplexity AI​

Perplexity AI是比较低调的一个产品了。但其实是一个非常值得大家关注的产品。首先,它有客户端!非常简洁易用,基本上可以当作一个GPT-4增强的搜索产品了。此前背后接入的是GPT-4,但是完全免费,主要定位是搜索引擎的替代。

 

相比较其它的产品,这个产品对搜索的支持非常完善,可以指定全网内容或者是维基百科、Youtube等热门网站。提供订阅方式免费使用高级模型。免费账户可以每隔4个小时使用一次Copilot,之前就是GPT-4,目前不清楚。

 

特点:

免费可用,收费可用高级模型​

支持联网搜索​

支持基于指定著名的网站搜索,目前包括学术、YouTube、reddit、Wikipedia等。​

包含非常好用的移动客户端

 

讯飞星火​

 

著名的国产的面向C端用户的产品。大多数评测都觉得其已经接近GPT的水平。官方说10月份的版本会追平GPT-3.5,实际使用体验良好。大陆地区合法免费可用。​

 

文心一言​

 

百度提供的产品,号称与GPT差不多。国内最早开放给普通用户使用的大模型。支持多模态,免费使用。​

 

通义千问​

 

阿里巴巴出品的大模型。需要申请,不过经过实际测试,普遍认为效果不错。最近应该已经开放申请,通过概率较高。

 

Colossal AI​

 

“夸父”AI,大规模并行AI训练系统,基于LLaMA预训练模型。作为GPT的平替,开源了完整的RLHF流水线,包括,监督数据收集、监督微调、奖励模型训练和强化学习微调等。​

 

优势:高效、简单、可扩展,功能多,包含AIGC​

缺点:不完全支持中文,基于GPT-3​

模型能力:集成现有的GPT-3 、GPT-2模型,能够提升模型效率

 

训练:​

  1. 第一阶段(stage1_sft.py):SFT监督微调阶段,该开源项目没有实现,这个比较简单,因为ColossalAI无缝支持Huggingface,直接用Huggingface的Trainer函数几行代码轻松实现,在这里我用了一个gpt2模型,从其实现上看,其支持GPT2、OPT和BLOOM模型;​
  2. 第二阶段(stage2_rm.py):奖励模型(RM)训练阶段,即项目Examples里train_reward_model.py部分;​
  3. 第三阶段(stage3_ppo.py):强化学习(RLHF)阶段,即项目train_prompts.py。​

代码中的cores即原始工程中的GPT,cores.nn在原始工程中变成了chatgpt.models。

 

开源地址:https://github.com/hpcaitech/ColossalAI

 

LLaMa-ChatLLaMA​

 

由于 LLaMA 大模型系列没有使用 RLHF 方法,因此初创公司 Nebuly AI 开源了 RLHF 版 LLaMA(ChatLLaMA)的训练方法。​

 

优势:​

更便宜,完整的开源实现,允许用户基于预训练的 LLaMA 模型构建 ChatGPT 风格的服务;​

LLaMA 架构更小,使得训练过程和推理速度更快,成本更低;​

内置了对 DeepSpeed ZERO 的支持,以加速微调过程;​

支持各种尺寸的 LLaMA 模型架构,用户可以根据自身偏好对模型进行微调​

 

缺点:不支持中文

 

BELLE​

 

精通中文,基于斯坦福 Alpaca项目,70 亿参数的中文对话大模型。​

 

优势:​

数据:参考斯坦福大学的Alpaca项目,针对中文场景进行了优化,利用GPT生了多样化、高质量的数据,包括日常对话、知识问答、文本生成等,有助于模型在各种中文场景中的表现。​

模型:基于Bloom和LLAMA,训练了出具效果的对话模型,并完全开放了这些模型的参数,大大降低使用和科研的门槛​

轻量化:开源了对话模型的量化版本,包括8bit, 4bit, 其中4bit版本模型checkpoint大小仅为6.9G,运行仅需8.4G显存。​

开源地址:https://github.com/LianjiaTech/BELLE

 

OpenAssistant​

 

旨在让每一个人都可以访问基于聊天的大语言模型。​

 

优势:​

开源聊天助手,其可以理解任务、与第三方系统交互、动态检索信息。​

据说是第一个在人类数据上进行训练的完全开源的大规模指令微调模型​

 

缺点:中文效果不佳、受底层模型的限制​

 

开源地址:https://github.com/LAION-AI/Open-Assistant

 

MPT 30b Chat​

 

MPT是MosaicML发布的开源大模型,这个MPT 30b Chat是其中最强大的一个版本,模型开源但是不可上商用。目前在HuggingFace上提供了一个托管的服务免费使用。​

 

Vicuna Chat​

 

著名的开源羊驼系列。虽然不可商用,但是免费且支持很多模型可选。


前往网站首页查看更多精彩内容👉https://imyshare.com/

									
交流评论
按Ctrl + D添加至书签,从此不迷路!
关注公众号
iMyShare,公众号:神秘的热心网友
有些东西我只想与你们聊聊,赶紧微信扫码上车!
个人微信:niceso-friend(有微信群)
合作邮箱:niceso@163.com