本文最后更新于 2025年10月21日。
以下是一些提供每日免费API额度的大模型平台及其主要免费模型和相关限制,信息综合自近期搜索结果[citation:2][citation:5][citation:7]:
一、国际平台
-
Google Gemini
- 主力模型:Gemini-2.5-Pro
- 免费额度:每日1500次请求,每分钟15次请求,每分钟100万tokens[citation:5][citation:10]。
- 特点:支持多模态(文本、图像等)、长文本、音视频处理。
-
Groq
- 主力模型:Llama3、Mixtral等开源模型
- 免费额度:每日14400次请求,每秒500tokens,适合高速推理[citation:5]。
-
OpenRouter
- 聚合多模型(如Gemma、Llama3等)
- 免费额度:每日50次请求,若账户充值10美元(约10 credits),可提升至每日1000次[citation:2][citation:6]。
- 优势:国内直连,兼容OpenAI SDK。
-
Cloudflare Workers AI
- 所有模型(如DeepSeek、Gemma等)
- 免费额度:每日1万次请求,每月30万次[citation:9][citation:10]。
- 特点:Beta模型无限制,适合快速验证。
二、国内平台
-
阿里云百炼
- 主力模型:Qwen全系列(如Qwen-Code、Qwen-Long)、Llama4系列(限时免费)
- 免费额度:新用户最高赠送1.125亿tokens(约8.5万行代码)[citation:4]。
- 特点:支持多模态,适合企业级开发。
-
百度智能云千帆
- 主力模型:ERNIE-Speed-8K、ERNIE-Lite等
- 免费额度:每分钟300次请求,30万tokens[citation:3][citation:5]。
- 场景:通用对话、数据分析。
-
腾讯混元
- 主力模型:hunyuan-lite
- 免费额度:并发5路,适合中小规模应用[citation:3][citation:9]。
-
讯飞星火
- 主力模型:spark-lite
- 免费额度:无限tokens,每秒2次请求(QPS=2)[citation:3][citation:5]。
- 场景:轻量级应用、开发测试。
-
字节跳动
- 扣子(coze.cn):
- 模型:豆包·Function call、MiniMax、Moonshot等
- 免费额度:每秒2次请求,每分钟60次,每日3000次[citation:3][citation:9]。
- 火山方舟:
- 限时免费:doubao系列、Moonshot系列等,2024年5月至8月期间最高5亿tokens[citation:9][citation:10]。
- 扣子(coze.cn):
-
智谱AI
- 主力模型:GLM-4-Flash、GLM-Z1-Flash
- 免费额度:完全免费(Flash系列),新用户赠送2000万tokens[citation:1]。
- 场景:文本、视觉、推理多模态。
-
魔搭社区(ModelScope)
- 主力模型:Qwen、Flux.1、QWen-Image等多模态
- 免费额度:每日2000次请求,涵盖文本、图像生成[citation:2][citation:7]。
- 亮点:支持多模态API。
-
硅基流动
- 主力模型:Qwen2-7B-Instruct等
- 免费额度:每分钟100次请求(RPM=100),每秒3次(QPS=3)[citation:5]。
三、开源与第三方聚合
-
Hugging Face
- 免费层:每月30k tokens,部分模型如Mistral 7B可直接调用[citation:6]。
- 适合学术与开源项目。
-
Replicate
- 免费层:每月150次推理,部分模型如Stable Diffusion可免费用[citation:6]。
- 特点:Docker化部署,社区活跃。
四、总结推荐
- 个人开发/轻量级:讯飞星火(无限tokens)、Google Gemini(多模态)、阿里云Qwen(大tokens)。
- 多模态/图像:魔搭社区、智谱GLM-4V-Flash。
- 高速推理:Groq。
- 企业级/高并发:阿里云百炼、百度千帆。
- 快速验证:Cloudflare Workers AI(无限制)。
提示:各平台政策可能随时变动,建议注册时查看最新额度说明,部分平台如火山方舟为限时活动。详细API文档可参考各平台官网。