Free Forever

Free LLM APIs

รวม API ของโมเดล AI ที่มี free tier ถาวร — ไม่มีหมดอายุ ไม่ต้องใส่บัตรเครดิต

16/16

🎯 เลือก Provider ที่เหมาะกับคุณ

สิ่งที่ต้องการ	แนะนำ
Rate limits สูงสุด	Groq, Cerebras (30 RPM, 14.4K RPD)
โมเดลเยอะสุด	Cloudflare Workers AI (49+), OpenRouter (32+)
โมเดล Proprietary	Google Gemini (2.5 Pro), GitHub Models (GPT-4o)
Inference เร็วสุด	Groq, Cerebras
Token budget สูงสุด	Mistral AI (1B tokens/เดือน)
Provider ยุโรป	Mistral AI (EU), LLM7.io (UK)
ไม่ต้องสมัคร	LLM7.io (basic tier ไม่ต้องมี token)

16 providers14 OpenAI-compatible~75+ โมเดลรวมทั้งหมดฟรี 100%

🇺🇸

Google Gemini

PROVIDEROpenAI SDK ✓

✦ Gemini 2.5 Pro ฟรี

โมเดลหลัก

Gemini 2.5 ProFlashFlash-Lite

Rate Limits

5–15 RPM100–1K RPD

※ Free tier ไม่รองรับ EU / UK / Switzerland

aistudio.google.com

Docs

🇪🇺

Mistral AI

PROVIDEROpenAI SDK ✓

✦ 1B tokens/เดือน

โมเดลหลัก

Mistral Large 3Small 3.1Ministral 8B

Rate Limits

1 req/s1B tok/mo

console.mistral.ai

Docs

🇺🇸

Cohere

PROVIDERCustom SDK

✦ RAG + Embeddings ฟรี

โมเดลหลัก

Command ACommand R+Aya Expanse 32B

Rate Limits

20 RPM1K req/mo

dashboard.cohere.com

Docs

🇨🇳

Zhipu AI

PROVIDEROpenAI SDK ✓

✦ Flash models จากจีน

โมเดลหลัก

GLM-4.7-FlashGLM-4.5-Flash

Rate Limits

ไม่ระบุ

open.bigmodel.cn

Docs

🇺🇸

Groq

INFERENCEOpenAI SDK ✓

✦ Inference เร็วที่สุด

โมเดลหลัก

Llama 3.3 70BLlama 4 ScoutKimi K2

Rate Limits

30 RPM1K RPD14,400 RPD (Llama 3.1 8B)

※ 14,400 RPD เฉพาะ Llama 3.1 8B Instant เท่านั้น

console.groq.com

Docs

🇺🇸

OpenRouter

INFERENCEOpenAI SDK ✓

✦ 30+ โมเดลฟรีในที่เดียว

โมเดลหลัก

DeepSeek R1Llama 3.3 70BGPT-OSS-120B

Rate Limits

20 RPM50 RPD (ฟรี)1K RPD (เติม $10+)

※ เติมเงิน $10 ครั้งเดียว ได้ 1K RPD ตลอดชีพ + มี Free Model Router

openrouter.ai

Docs

🇺🇸

Cerebras

INFERENCEOpenAI SDK ✓

✦ 14,400 RPD สูงมาก

โมเดลหลัก

Llama 3.3 70BQwen3 235B

Rate Limits

30 RPM14,400 RPD

cloud.cerebras.ai

Docs

🇺🇸

Cloudflare Workers AI

INFERENCEOpenAI SDK ✓

✦ 50+ โมเดล บน Edge

โมเดลหลัก

Llama 3.3 70BQwen QwQ 32B

Rate Limits

10K neurons/day

dash.cloudflare.com

Docs

🇺🇸

GitHub Models

INFERENCEOpenAI SDK ✓

✦ ใช้ GPT-4o ฟรีได้

โมเดลหลัก

GPT-4oLlama 3.3 70BDeepSeek-R1

Rate Limits

10–15 RPM50–150 RPD

github.com

Docs

🇺🇸

Hugging Face

INFERENCEOpenAI SDK ✓

✦ เข้าถึงโมเดลนับพัน

โมเดลหลัก

Llama 3.3 70BQwen2.5 72BMistral 7B

Rate Limits

$0.10/เดือน (free credits)

huggingface.co

Docs

🇺🇸

NVIDIA NIM

INFERENCEOpenAI SDK ✓

✦ GPU-optimized inference

โมเดลหลัก

Llama 3.3 70BQwen3 235BMistral Large

Rate Limits

40 RPM

build.nvidia.com

Docs

🇨🇳

SiliconFlow

INFERENCEOpenAI SDK ✓

✦ 1K RPM สูงสุด

โมเดลหลัก

Qwen3-8BDeepSeek-R1-DistillGLM-4.1V

Rate Limits

1K RPM50K TPM

cloud.siliconflow.cn

Docs

🇺🇸

Kluster AI

INFERENCEOpenAI SDK ✓

✦ DeepSeek R1 ฟรี

โมเดลหลัก

DeepSeek-R1Llama 4 MaverickQwen3-235B

Rate Limits

ไม่ระบุ

platform.kluster.ai

🇬🇧

LLM7.io

INFERENCEOpenAI SDK ✓

✦ 30 โมเดล จาก UK

โมเดลหลัก

DeepSeek R1Qwen2.5 Coder

Rate Limits

30 RPM (120 RPM มี token)

token.llm7.io

🇺🇸

Ollama Cloud

INFERENCECustom SDK

✦ จาก Ollama ใช้คู่ local ได้

โมเดลหลัก

DeepSeek-V3.2Qwen3.5Kimi-K2.5

Rate Limits

light usagereset ทุก 5 ชม. / 7 วัน

※ วัดด้วย GPU time ไม่ใช่ tokens — ไม่ compatible กับ OpenAI SDK

ollama.com

Docs

🇨🇳

Z.ai (GLM)

PROVIDEROpenAI SDK ✓

✦ GLM-4.7-Flash ใช้ฟรี · GLM-5 แทน Opus ราคาประหยัด

โมเดลหลัก

GLM-5GLM-4.7GLM-4.5-Air

Rate Limits

GLM-4.7-Flash ฟรีรุ่นอื่นจ่ายตามใช้

※ ราคา (ต่อ 1M tokens): GLM-5 $1/$3.2 · GLM-4.7 $0.6/$2.2 · GLM-4.5-Air $0.2/$1.1 · ใช้แทน Claude Opus ใน Claude Code ได้ผ่าน Anthropic endpoint (api.z.ai/api/anthropic)

z.ai

Docs

ข้อมูลอ้างอิงจาก awesome-free-llm-apis

เนื้อหาในหน้านี้อ้างอิงจาก open-source repository mnfst/awesome-free-llm-apis ซึ่งเป็นแหล่งรวมข้อมูล Free LLM API ที่อัพเดตอยู่เสมอ หากต้องการดูข้อมูลล่าสุด สามารถเข้าไปดูที่ repo โดยตรงได้เลย

ดู Repo ต้นทาง

RPM = requests/minRPD = requests/dayTPM = tokens/min