هزینهٔ واقعی ChatGPT API چقدر است؟ محاسبه با تومان
محاسبهٔ دقیق هزینهٔ ChatGPT API به تومان: قیمت مدلهای GPT-5، GPT-4o، Whisper و DALL-E با چهار سناریوی واقعی و چهار راه کاهش هزینه.
CONTENTS · در این مقاله (۲۰)
- درک مدل قیمتگذاری OpenAI
- قیمتهای دقیق امروز (آبان ۱۴۰۵)
- مدلهای چت
- Embeddings
- صوت
- تصویر
- فرمول طلایی محاسبه
- چهار سناریوی واقعی با محاسبهٔ کامل
- سناریو ۱: چتبات پشتیبانی فروشگاه آنلاین
- سناریو ۲: تولید محتوای بلاگ خودکار
- سناریو ۳: سیستم RAG با ۱۰٬۰۰۰ سند
- سناریو ۴: پادکستساز تمامخودکار
- چهار راه عملی برای کاهش هزینه
- ۱. Prompt Caching
- ۲. Batch API
- ۳. مدل ارزانتر برای ٪۸۰ موارد
- ۴. کوتاهسازی هوشمندانهٔ context
- یک ابزار سریع برای محاسبهٔ هزینهٔ پروژه
- چرا تومان؟ مزیت پروکسی API بومی
- جمعبندی
یکی از سؤالهای همیشگی توسعهدهندههای ایرانی این است: «اگر بخواهم محصولی روی ChatGPT API بسازم، ماهی چقدر باید پرداخت کنم؟» پاسخ «بستگی دارد» قابل قبول نیست — این مقاله میخواهد فرمولهای دقیق و مثالهای واقعی بدهد تا قبل از خط زدن یک خط کد، بدانی پروژهات از نظر اقتصادی منطقی است یا نه. همهٔ اعداد به دلار و معادل تومان (با نرخ ۶۰٬۰۰۰ تومان به ازای هر دلار) محاسبه میشوند، چون اگر از داخل ایران از طریق پروکسی API بومی مثل 1xAi استفاده کنی، صورتحساب نهایی به تومان است.
درک مدل قیمتگذاری OpenAI
OpenAI چهار نوع endpoint اصلی دارد و هر کدام مدل قیمتگذاری متفاوتی دارد:
| endpoint | کاربرد | واحد قیمت |
|---|---|---|
| /v1/chat/completions و /v1/responses | چت، agent، کدنویسی | به ازای هر ۱M توکن (ورودی + خروجی جدا) |
| /v1/embeddings | جستوجوی معنایی، RAG | به ازای هر ۱M توکن (فقط ورودی) |
| /v1/audio/transcriptions | تبدیل صوت به متن | به ازای هر دقیقهٔ صوت |
| /v1/audio/speech | تبدیل متن به صوت | به ازای هر ۱M کاراکتر |
| /v1/images/generations | تولید تصویر | به ازای هر تصویر (بسته به resolution و کیفیت) |
دو تا قاعدهٔ ساده که همیشه حاکم است:
- توکن خروجی همیشه گرانتر از ورودی است (معمولاً ۴ تا ۸ برابر).
- یک توکن تقریباً = ۴ کاراکتر انگلیسی، یا ۲ تا ۳ کاراکتر فارسی. در فارسی توکنسازی کمتر بهینه است، یعنی متن فارسی توکن بیشتری مصرف میکند.
قیمتهای دقیق امروز (آبان ۱۴۰۵)
مدلهای چت
| مدل | ورودی ($/M) | خروجی ($/M) | ورودی (تومان/M) | خروجی (تومان/M) |
|---|---|---|---|---|
| gpt-5 | 1.25 | 10.00 | ۷۵٬۰۰۰ | ۶۰۰٬۰۰۰ |
| gpt-5-mini | 0.25 | 2.00 | ۱۵٬۰۰۰ | ۱۲۰٬۰۰۰ |
| gpt-5-nano | 0.05 | 0.40 | ۳٬۰۰۰ | ۲۴٬۰۰۰ |
| gpt-4.1 | 2.00 | 8.00 | ۱۲۰٬۰۰۰ | ۴۸۰٬۰۰۰ |
| gpt-4.1-mini | 0.40 | 1.60 | ۲۴٬۰۰۰ | ۹۶٬۰۰۰ |
| gpt-4o | 2.50 | 10.00 | ۱۵۰٬۰۰۰ | ۶۰۰٬۰۰۰ |
| gpt-4o-mini | 0.15 | 0.60 | ۹٬۰۰۰ | ۳۶٬۰۰۰ |
| o3 | 2.00 | 8.00 | ۱۲۰٬۰۰۰ | ۴۸۰٬۰۰۰ |
| o4-mini | 1.10 | 4.40 | ۶۶٬۰۰۰ | ۲۶۴٬۰۰۰ |
Embeddings
| مدل | قیمت ($/M) | قیمت (تومان/M) | ابعاد |
|---|---|---|---|
| text-embedding-3-small | 0.02 | ۱٬۲۰۰ | ۱۵۳۶ |
| text-embedding-3-large | 0.13 | ۷٬۸۰۰ | ۳۰۷۲ |
صوت
| مدل | کاربرد | قیمت | قیمت (تومان) |
|---|---|---|---|
| whisper-1 | تبدیل به متن | $0.006/min | ۳۶۰/دقیقه |
| gpt-4o-transcribe | تبدیل به متن | $0.006/min | ۳۶۰/دقیقه |
| gpt-4o-mini-transcribe | تبدیل به متن | $0.003/min | ۱۸۰/دقیقه |
| tts-1 | متن به صوت | $15/M کاراکتر | ۹۰۰٬۰۰۰/M کاراکتر |
| tts-1-hd | متن به صوت با کیفیت | $30/M کاراکتر | ۱٬۸۰۰٬۰۰۰/M کاراکتر |
تصویر
| مدل | اندازه | قیمت | قیمت (تومان) |
|---|---|---|---|
| dall-e-3 | 1024×1024 standard | $0.040 | ۲٬۴۰۰ |
| dall-e-3 | 1024×1024 HD | $0.080 | ۴٬۸۰۰ |
| dall-e-3 | 1792×1024 standard | $0.080 | ۴٬۸۰۰ |
| dall-e-3 | 1792×1024 HD | $0.120 | ۷٬۲۰۰ |
| gpt-image-1 (low) | 1024×1024 | $0.011 | ۶۶۰ |
| gpt-image-1 (medium) | 1024×1024 | $0.042 | ۲٬۵۲۰ |
| gpt-image-1 (high) | 1024×1024 | $0.167 | ۱۰٬۰۲۰ |
فرمول طلایی محاسبه
برای هر فراخوانی chat، فرمول هزینه به تومان:
هزینهٔ فراخوانی =
(تعداد توکن ورودی × قیمت ورودی به تومان/M ÷ 1,000,000)
+ (تعداد توکن خروجی × قیمت خروجی به تومان/M ÷ 1,000,000)
برای محاسبهٔ توکن، میتوانی از tokenizer رسمی OpenAI یا کتابخانهٔ tiktoken در پایتون استفاده کنی:
import tiktoken
enc = tiktoken.encoding_for_model("gpt-4o")
text = "این یک متن نمونهٔ فارسی است."
tokens = len(enc.encode(text))
print(f"تعداد توکن: {tokens}")
چهار سناریوی واقعی با محاسبهٔ کامل
سناریو ۱: چتبات پشتیبانی فروشگاه آنلاین
فروشگاهی با ۵۰۰ مکالمهٔ روزانه. هر مکالمه:
- System prompt: ۸۰۰ توکن (یکبار محاسبه)
- تاریخچهٔ ۴ پیام قبلی: ۱۲۰۰ توکن
- پیام جدید کاربر: ۲۰۰ توکن
- پاسخ: ۳۰۰ توکن
کل ورودی هر فراخوانی ≈ ۲۲۰۰ توکن، خروجی ≈ ۳۰۰ توکن. هر مکالمه میانگین ۵ تبادل دارد، یعنی ۵ فراخوانی.
| مدل | هزینهٔ هر مکالمه (تومان) | روزانه (تومان) | ماهانه (تومان) |
|---|---|---|---|
| gpt-5 | ۱٬۷۲۵ | ۸۶۲٬۵۰۰ | ۲۵٬۸۷۵٬۰۰۰ |
| gpt-5-mini | ۳۴۵ | ۱۷۲٬۵۰۰ | ۵٬۱۷۵٬۰۰۰ |
| gpt-4o-mini | ۱۵۳ | ۷۶٬۵۰۰ | ~۲٬۳۰۰٬۰۰۰ |
| gpt-5-nano | ۶۹ | ۳۴٬۵۰۰ | ~۱٬۰۳۵٬۰۰۰ |
تفاوت چشمگیر است. برای یک چتبات پشتیبانی، gpt-5-nano یا gpt-4o-mini عملاً همان کیفیت را با یکبیستم هزینه میدهند.
سناریو ۲: تولید محتوای بلاگ خودکار
یک سایت محتوایی که روزی ۱۰ مقالهٔ ۱۵۰۰ کلمهای فارسی تولید میکند. هر مقاله:
- Prompt + outline: ۲٬۰۰۰ توکن ورودی
- متن ۱۵۰۰ کلمهٔ فارسی: ~۳٬۵۰۰ توکن خروجی
کیفیت اینجا حیاتی است، پس gpt-5 معقول است:
هزینهٔ هر مقاله = (2000 × 75000 / 1M) + (3500 × 600000 / 1M)
= 150 + 2100 = ۲٬۲۵۰ تومان
هزینهٔ روزانه = 10 × 2250 = ۲۲٬۵۰۰ تومان
هزینهٔ ماهانه ≈ ۶۷۵٬۰۰۰ تومان
کمتر از یک نیروی پارهوقت نوسنده، با خروجی پایدار شبانهروزی.
سناریو ۳: سیستم RAG با ۱۰٬۰۰۰ سند
یک شرکت میخواهد دانش داخلیاش (۱۰٬۰۰۰ سند، میانگین ۲٬۰۰۰ کلمه) را قابل جستوجو کند:
یکبار: indexing
- ۱۰٬۰۰۰ سند × ۲٬۰۰۰ کلمه × ۱.۵ توکن = ۳۰M توکن
- هزینه با text-embedding-3-small: 30 × ۱٬۲۰۰ = ۳۶٬۰۰۰ تومان
روزانه: queries
- ۱٬۰۰۰ جستوجو × ۵۰ توکن: ۵۰٬۰۰۰ توکن embedding (~۶۰ تومان)
- هر query: ۵ سند بازیابیشده × ۸۰۰ توکن = ۴٬۰۰۰ توکن context + ۵۰۰ توکن خروجی
- ۱۰۰۰ × (4500 × 15000 + 500 × 120000) / 1M = ۱۲۷٬۵۰۰ تومان
کل ماهانه: ~۴ میلیون تومان برای یک سیستم دانش داخلی پاسخگو به ۱۰۰۰ پرسش روزانه. در مقیاس شرکت متوسط، عدد بسیار منطقی.
سناریو ۴: پادکستساز تمامخودکار
یک ابزار که از یک مقاله، پادکست تولید میکند:
- تبدیل مقاله به دیالوگ پادکست با gpt-5: ~۲٬۵۰۰ تومان
- تبدیل دیالوگ ۲۰ دقیقهای به صوت با tts-1-hd: ۲۵٬۰۰۰ کاراکتر × ۱٬۸۰۰٬۰۰۰ ÷ 1M = ۴۵٬۰۰۰ تومان
- کاور تصویر با dall-e-3 HD: ۴٬۸۰۰ تومان
کل: ~۵۲٬۰۰۰ تومان به ازای هر پادکست. اگر ماهی ۳۰ پادکست تولید کنی: ~۱.۶ میلیون تومان.
چهار راه عملی برای کاهش هزینه
۱. Prompt Caching
OpenAI بهصورت خودکار درخواستهای مشابه را cache میکند. اگر system prompt تو ثابت است (مثلاً ۲٬۰۰۰ توکن دستورالعمل)، در فراخوانیهای بعدی همان prompt حدود ٪۵۰ تخفیف میخورد. کافی است system prompt را در ابتدای messages بگذاری و آن را تغییر ندهی.
۲. Batch API
اگر کاری داری که نیاز به پاسخ آنی ندارد (مثلاً برچسبگذاری ۱۰٬۰۰۰ کامنت)، از Batch API استفاده کن. ٪۵۰ ارزانتر است، با پاسخدهی تا ۲۴ ساعت. برای کارهای async ایدهآل است.
۳. مدل ارزانتر برای ٪۸۰ موارد
این الگو واقعاً کار میکند: یک router میسازی که با gpt-4o-mini تشخیص میدهد سؤال ساده است یا پیچیده. اگر ساده، با gpt-5-nano پاسخ میدهد؛ اگر پیچیده، escalate به gpt-5. در عمل، ۸۰ تا ۹۰ درصد سؤالات سادهاند.
۴. کوتاهسازی هوشمندانهٔ context
بهجای فرستادن کل تاریخچهٔ مکالمه، فقط ۳ پیام آخر + یک خلاصهٔ پویا از قبلیها بفرست. تکنیک «sliding window with summary» میتواند مصرف توکن را ٪۴۰ تا ٪۶۰ کم کند بدون از دست دادن context.
یک ابزار سریع برای محاسبهٔ هزینهٔ پروژه
این تابع به تو کمک میکند برای پروژهات قبل از launch تخمین واقعی بزنی:
def estimate_monthly_cost_toman(
daily_requests: int,
avg_input_tokens: int,
avg_output_tokens: int,
model: str = "gpt-5-mini"
) -> dict:
rates = {
"gpt-5": {"in": 75000, "out": 600000},
"gpt-5-mini": {"in": 15000, "out": 120000},
"gpt-5-nano": {"in": 3000, "out": 24000},
"gpt-4.1": {"in": 120000, "out": 480000},
"gpt-4.1-mini": {"in": 24000, "out": 96000},
"gpt-4o": {"in": 150000, "out": 600000},
"gpt-4o-mini": {"in": 9000, "out": 36000},
}
r = rates[model]
daily = (avg_input_tokens * r["in"] + avg_output_tokens * r["out"]) / 1_000_000
daily *= daily_requests
return {
"daily_toman": round(daily),
"monthly_toman": round(daily * 30),
"yearly_toman": round(daily * 365)
}
print(estimate_monthly_cost_toman(
daily_requests=2500,
avg_input_tokens=2200,
avg_output_tokens=300,
model="gpt-5-mini"
))
چرا تومان؟ مزیت پروکسی API بومی
اگر مستقیم به OpenAI پرداخت میکردی، به یک کارت اعتباری خارجی نیاز داشتی، نرخ ارز هرروز نوسان میکرد، و گزارش هزینه به دلار بود — که با تومان حسابداری ایرانی سازگار نیست. پروکسیهای API بومی مثل 1xAi این مشکلات را حل میکنند:
- پرداخت با هر کارت شتاب از طریق درگاه زرینپال.
- صورتحساب به تومان، با امکان فاکتور رسمی برای شرکتها (از طریق فرم تماس).
- گزارش مصرف لحظهای در داشبورد فارسی.
- حداقل شارژ ۱۰۰ هزار تومان، حداکثر ۲۵ میلیون تومان در هر تراکنش (برای بیشتر، تماس با پشتیبانی).
جمعبندی
هزینهٔ ChatGPT API با تصور رایج «گران» بسیار فاصله دارد. برای یک چتبات پشتیبانی متوسط، ماهی یک تا سه میلیون تومان کافی است. برای یک سیستم RAG شرکتی، چهار تا ده میلیون تومان. برای یک پلتفرم تولید محتوای کوچک، زیر یک میلیون. کلید کاهش هزینه دو چیز است: انتخاب درست مدل برای هر کار (به مقالهٔ تفاوت GPT-5، GPT-4o و GPT-4.1 رجوع کن) و بهینهسازی استفاده از توکن. اگر داری از داخل ایران شروع میکنی، یک حساب در یک پروکسی API بومی باز کن، با ۲۰۰ هزار تومان شارژ یک هفته با کد واقعی پروژهات کار کن، و بعد بر اساس مصرف واقعی تصمیم بگیر. اعداد همیشه بهتر از حدس هستند.
ABOUT THE AUTHOR · نویسنده
تیم 1xAi
تیمِ 1xAi پروکسیِ تخصصیِ مدلهای OpenAI، Claude و Gemini برای کاربرانِ ایرانی را اداره میکند — از زیرساختِ شبکه تا صورتحسابِ تومانی. هرچه اینجا مینویسیم بر اساسِ تجربهٔ روزانه با APIهای OpenAI، Anthropic و Google و نیازهای واقعیِ توسعهدهندگانِ داخلِ ایران است.
۷ دقیقه
تفاوت GPT-5، GPT-4o و GPT-4.1 — راهنمای انتخاب مدل
مقایسهٔ عملی GPT-5، GPT-4o و GPT-4.1 از نظر قیمت، سرعت، کانتکست و کیفیت در کدنویسی، چت و استدلال — با راهنمای انتخاب برای هر کاربرد.
۷ دقیقه
دسترسی به ChatGPT از داخل ایران در سال ۱۴۰۵ — راههای واقعی
از VPN تا پروکسی API بومی؛ مقایسهٔ پنج روش واقعی دسترسی به ChatGPT و OpenAI از ایران در ۱۴۰۵ با هزینه، پایداری و ریسک هرکدام.
۱۲ دقیقه
اتصال LangChain و LangGraph به OpenAI از ایران
آموزش گامبهگام اتصال LangChain و LangGraph به OpenAI از داخل ایران: ساخت RAG، tool agent، LangGraph حالتمند با کد Python آماده.
