Meta最近发布了Llama 3.1,这款模型在某些基准测试中已经超越了最好的闭源语言模型,如GPT-4o、Gemma 2和Claude 3.5 Sonnet。
Llama 3.1系列支持多语言模型,包括法语、德语、印地语、意大利语、葡萄牙语、西班牙语和泰语,提供80亿、700亿和4050亿参数规模的版本。尤其是4050亿参数模型,使用超过16,000个Nvidia H100 GPU进行训练,并拥有高达128K的上下文窗口。
接下来,我将分享五种免费体验Llama 3.1的方法,最后还有一个小彩蛋哦!
Ollama是一个先进的AI工具,允许用户轻松地在本地机器上设置和运行大模型。
下载并安装Ollama:访问Ollama的官网并下载安装包。安装成功后,在终端运行ollama -v
查看版本信息。
官网:Ollama
下载Llama 3.1模型:根据你的电脑性能选择合适的版本。由于运行4050亿参数模型的硬件要求较高,建议先尝试80亿参数模型。
开始使用:运行以下命令即可开始体验Llama 3.1。
ollama run llama3.1:8b
如果你已经参加过AI生产力工作坊二期,那么你应该对这些操作非常熟悉,可以结合课程中的技巧进行更多尝试,欢迎在群内分享你的经验。
HuggingChat是由Hugging Face开发的开源AI聊天机器人,托管了多个生成式AI模型。
访问HuggingChat:前往Hugging Face的官网并创建账户。
网址:HuggingChat
激活Llama 3.1模型:在设置页面中选择meta-llama/Meta-Llama-3.1–405B-Instruct-FP8
模型。
开始使用:关闭设置窗口后,你就可以开始与Llama 3.1互动了。
HuggingChat还提供了增强功能的附加工具,如网页搜索和PDF解析,甚至可以生成图像。启用图像生成工具后,你可以让Llama 3.1生成图片,例如:
Groq因其专门设计用于加速AI推理工作负载的硬件和软件而闻名,Llama 3.1目前已经在Groq Playground上托管。
访问Groq Playground:前往Groq的官网并登录。
使用Groq Chat:虽然目前在Playground上无法使用4050亿参数模型,但你可以使用Groq Chat,它的速度非常快。
Groq Chat官网:Groq Chat
Groq的LPU(学习处理单元)可以实现领先的推理速度,例如在700亿参数模型上每秒250个token,在80亿参数模型上每秒超过1200个token。
Fireworks是一个构建和部署生成式AI API的平台,支持Llama 3.1的所有模型。
访问Fireworks AI:前往Fireworks AI的官网并登录。
页面:Fireworks AI
调整参数并调用API:在右侧部分调整参数设置,并使用你的配置调用API。
请注意,你需要一个API密钥才可以使用更多功能,适合开发者。
Cloudflare是互联网上最大的网络平台之一,最近他们推出了一个AI运用,允许用户探索不同的文本生成模型。
访问Cloudflare Playground:前往Cloudflare的官网并登录。
选择模型并开始聊天:无需创建账户即可免费使用。
Poe是免费体验Llama 3.1的最佳方式之一。
访问Poe官网并创建账户:每天赠送3,000个免费积分,可发送6条免费消息。
官网:Poe
找到Llama-3.1–405B-T机器人:在官方机器人部分找到并打开它,然后开始与Llama 3.1聊天。该机器人由Together.ai托管。
Poe还支持下载到手机或Mac上使用,功能强大,推荐大家试试!