Free Forever

Free LLM APIs

รวม API ของโมเดล AI ที่มี free tier ถาวร — ไม่มีหมดอายุ ไม่ต้องใส่บัตรเครดิต

15/15

🎯 เลือก Provider ที่เหมาะกับคุณ

สิ่งที่ต้องการแนะนำ
Rate limits สูงสุดGroq, Cerebras (30 RPM, 14.4K RPD)
โมเดลเยอะสุดCloudflare Workers AI (49+), OpenRouter (32+)
โมเดล ProprietaryGoogle Gemini (2.5 Pro), GitHub Models (GPT-4o)
Inference เร็วสุดGroq, Cerebras
Token budget สูงสุดMistral AI (1B tokens/เดือน)
Provider ยุโรปMistral AI (EU), LLM7.io (UK)
ไม่ต้องสมัครLLM7.io (basic tier ไม่ต้องมี token)
15 providers13 OpenAI-compatible~69+ โมเดลรวมทั้งหมดฟรี 100%
🇺🇸

Google Gemini

PROVIDEROpenAI SDK ✓
Gemini 2.5 Pro ฟรี

โมเดลหลัก

Gemini 2.5 ProFlashFlash-Lite

Rate Limits

5–15 RPM100–1K RPD

Free tier ไม่รองรับ EU / UK / Switzerland

aistudio.google.com
Docs
🇪🇺

Mistral AI

PROVIDEROpenAI SDK ✓
1B tokens/เดือน

โมเดลหลัก

Mistral Large 3Small 3.1Ministral 8B

Rate Limits

1 req/s1B tok/mo
console.mistral.ai
Docs
🇺🇸

Cohere

PROVIDERCustom SDK
RAG + Embeddings ฟรี

โมเดลหลัก

Command ACommand R+Aya Expanse 32B

Rate Limits

20 RPM1K req/mo
dashboard.cohere.com
Docs
🇨🇳

Zhipu AI

PROVIDEROpenAI SDK ✓
Flash models จากจีน

โมเดลหลัก

GLM-4.7-FlashGLM-4.5-Flash

Rate Limits

ไม่ระบุ
open.bigmodel.cn
Docs
🇺🇸

Groq

INFERENCEOpenAI SDK ✓
Inference เร็วที่สุด

โมเดลหลัก

Llama 3.3 70BLlama 4 ScoutKimi K2

Rate Limits

30 RPM1K RPD14,400 RPD (Llama 3.1 8B)

14,400 RPD เฉพาะ Llama 3.1 8B Instant เท่านั้น

console.groq.com
Docs
🇺🇸

OpenRouter

INFERENCEOpenAI SDK ✓
30+ โมเดลฟรีในที่เดียว

โมเดลหลัก

DeepSeek R1Llama 3.3 70BGPT-OSS-120B

Rate Limits

20 RPM50 RPD (ฟรี)1K RPD (เติม $10+)

เติมเงิน $10 ครั้งเดียว ได้ 1K RPD ตลอดชีพ + มี Free Model Router

openrouter.ai
Docs
🇺🇸

Cerebras

INFERENCEOpenAI SDK ✓
14,400 RPD สูงมาก

โมเดลหลัก

Llama 3.3 70BQwen3 235B

Rate Limits

30 RPM14,400 RPD
cloud.cerebras.ai
Docs
🇺🇸

Cloudflare Workers AI

INFERENCEOpenAI SDK ✓
50+ โมเดล บน Edge

โมเดลหลัก

Llama 3.3 70BQwen QwQ 32B

Rate Limits

10K neurons/day
dash.cloudflare.com
Docs
🇺🇸

GitHub Models

INFERENCEOpenAI SDK ✓
ใช้ GPT-4o ฟรีได้

โมเดลหลัก

GPT-4oLlama 3.3 70BDeepSeek-R1

Rate Limits

10–15 RPM50–150 RPD
github.com
Docs
🇺🇸

Hugging Face

INFERENCEOpenAI SDK ✓
เข้าถึงโมเดลนับพัน

โมเดลหลัก

Llama 3.3 70BQwen2.5 72BMistral 7B

Rate Limits

$0.10/เดือน (free credits)
huggingface.co
Docs
🇺🇸

NVIDIA NIM

INFERENCEOpenAI SDK ✓
GPU-optimized inference

โมเดลหลัก

Llama 3.3 70BQwen3 235BMistral Large

Rate Limits

40 RPM
build.nvidia.com
Docs
🇨🇳

SiliconFlow

INFERENCEOpenAI SDK ✓
1K RPM สูงสุด

โมเดลหลัก

Qwen3-8BDeepSeek-R1-DistillGLM-4.1V

Rate Limits

1K RPM50K TPM
cloud.siliconflow.cn
Docs
🇺🇸

Kluster AI

INFERENCEOpenAI SDK ✓
DeepSeek R1 ฟรี

โมเดลหลัก

DeepSeek-R1Llama 4 MaverickQwen3-235B

Rate Limits

ไม่ระบุ
platform.kluster.ai
🇬🇧

LLM7.io

INFERENCEOpenAI SDK ✓
30 โมเดล จาก UK

โมเดลหลัก

DeepSeek R1Qwen2.5 Coder

Rate Limits

30 RPM (120 RPM มี token)
token.llm7.io
🇺🇸

Ollama Cloud

INFERENCECustom SDK
จาก Ollama ใช้คู่ local ได้

โมเดลหลัก

DeepSeek-V3.2Qwen3.5Kimi-K2.5

Rate Limits

light usagereset ทุก 5 ชม. / 7 วัน

วัดด้วย GPU time ไม่ใช่ tokens — ไม่ compatible กับ OpenAI SDK

ollama.com
Docs

ข้อมูลอ้างอิงจาก awesome-free-llm-apis

เนื้อหาในหน้านี้อ้างอิงจาก open-source repository mnfst/awesome-free-llm-apis ซึ่งเป็นแหล่งรวมข้อมูล Free LLM API ที่อัพเดตอยู่เสมอ หากต้องการดูข้อมูลล่าสุด สามารถเข้าไปดูที่ repo โดยตรงได้เลย

ดู Repo ต้นทาง
RPM = requests/minRPD = requests/dayTPM = tokens/min