← روزنامه‌نگاری۸ دقیقه مطالعه

هزینهٔ واقعی ChatGPT API چقدر است؟ محاسبه با تومان

محاسبهٔ دقیق هزینهٔ ChatGPT API به تومان: قیمت مدل‌های GPT-5، GPT-4o، Whisper و DALL-E با چهار سناریوی واقعی و چهار راه کاهش هزینه.

BYتیم 1xAi·منتشر: ۲۰۲۶/۰۵/۱۲ ۱۶:۲۲·بروزرسانی: ۲۰۲۶/۰۵/۱۳ ۰۹:۲۳·

قیمت‌گذاریمحاسباتراهنما

CONTENTS · در این مقاله (۲۰)

درک مدل قیمت‌گذاری OpenAI
قیمت‌های دقیق امروز (آبان ۱۴۰۵)
مدل‌های چت
Embeddings
صوت
تصویر
فرمول طلایی محاسبه
چهار سناریوی واقعی با محاسبهٔ کامل
سناریو ۱: چت‌بات پشتیبانی فروشگاه آنلاین
سناریو ۲: تولید محتوای بلاگ خودکار
سناریو ۳: سیستم RAG با ۱۰٬۰۰۰ سند
سناریو ۴: پادکست‌ساز تمام‌خودکار
چهار راه عملی برای کاهش هزینه
۱. Prompt Caching
۲. Batch API
۳. مدل ارزان‌تر برای ٪۸۰ موارد
۴. کوتاه‌سازی هوشمندانهٔ context
یک ابزار سریع برای محاسبهٔ هزینهٔ پروژه
چرا تومان؟ مزیت پروکسی API بومی
جمع‌بندی

یکی از سؤال‌های همیشگی توسعه‌دهنده‌های ایرانی این است: «اگر بخواهم محصولی روی ChatGPT API بسازم، ماهی چقدر باید پرداخت کنم؟» پاسخ «بستگی دارد» قابل قبول نیست — این مقاله می‌خواهد فرمول‌های دقیق و مثال‌های واقعی بدهد تا قبل از خط زدن یک خط کد، بدانی پروژه‌ات از نظر اقتصادی منطقی است یا نه. همهٔ اعداد به دلار و معادل تومان (با نرخ ۶۰٬۰۰۰ تومان به ازای هر دلار) محاسبه می‌شوند، چون اگر از داخل ایران از طریق پروکسی API بومی مثل 1xAi استفاده کنی، صورت‌حساب نهایی به تومان است.

درک مدل قیمت‌گذاری OpenAI

OpenAI چهار نوع endpoint اصلی دارد و هر کدام مدل قیمت‌گذاری متفاوتی دارد:

endpoint	کاربرد	واحد قیمت
/v1/chat/completions و /v1/responses	چت، agent، کدنویسی	به ازای هر ۱M توکن (ورودی + خروجی جدا)
/v1/embeddings	جست‌وجوی معنایی، RAG	به ازای هر ۱M توکن (فقط ورودی)
/v1/audio/transcriptions	تبدیل صوت به متن	به ازای هر دقیقهٔ صوت
/v1/audio/speech	تبدیل متن به صوت	به ازای هر ۱M کاراکتر
/v1/images/generations	تولید تصویر	به ازای هر تصویر (بسته به resolution و کیفیت)

دو تا قاعدهٔ ساده که همیشه حاکم است:

توکن خروجی همیشه گران‌تر از ورودی است (معمولاً ۴ تا ۸ برابر).
یک توکن تقریباً = ۴ کاراکتر انگلیسی، یا ۲ تا ۳ کاراکتر فارسی. در فارسی توکن‌سازی کمتر بهینه است، یعنی متن فارسی توکن بیشتری مصرف می‌کند.

قیمت‌های دقیق امروز (آبان ۱۴۰۵)

مدل‌های چت

مدل	ورودی ($/M)	خروجی ($/M)	ورودی (تومان/M)	خروجی (تومان/M)
gpt-5	1.25	10.00	۷۵٬۰۰۰	۶۰۰٬۰۰۰
gpt-5-mini	0.25	2.00	۱۵٬۰۰۰	۱۲۰٬۰۰۰
gpt-5-nano	0.05	0.40	۳٬۰۰۰	۲۴٬۰۰۰
gpt-4.1	2.00	8.00	۱۲۰٬۰۰۰	۴۸۰٬۰۰۰
gpt-4.1-mini	0.40	1.60	۲۴٬۰۰۰	۹۶٬۰۰۰
gpt-4o	2.50	10.00	۱۵۰٬۰۰۰	۶۰۰٬۰۰۰
gpt-4o-mini	0.15	0.60	۹٬۰۰۰	۳۶٬۰۰۰
o3	2.00	8.00	۱۲۰٬۰۰۰	۴۸۰٬۰۰۰
o4-mini	1.10	4.40	۶۶٬۰۰۰	۲۶۴٬۰۰۰

Embeddings

مدل	قیمت ($/M)	قیمت (تومان/M)	ابعاد
text-embedding-3-small	0.02	۱٬۲۰۰	۱۵۳۶
text-embedding-3-large	0.13	۷٬۸۰۰	۳۰۷۲

صوت

مدل	کاربرد	قیمت	قیمت (تومان)
whisper-1	تبدیل به متن	$0.006/min	۳۶۰/دقیقه
gpt-4o-transcribe	تبدیل به متن	$0.006/min	۳۶۰/دقیقه
gpt-4o-mini-transcribe	تبدیل به متن	$0.003/min	۱۸۰/دقیقه
tts-1	متن به صوت	$15/M کاراکتر	۹۰۰٬۰۰۰/M کاراکتر
tts-1-hd	متن به صوت با کیفیت	$30/M کاراکتر	۱٬۸۰۰٬۰۰۰/M کاراکتر

تصویر

مدل	اندازه	قیمت	قیمت (تومان)
dall-e-3	1024×1024 standard	$0.040	۲٬۴۰۰
dall-e-3	1024×1024 HD	$0.080	۴٬۸۰۰
dall-e-3	1792×1024 standard	$0.080	۴٬۸۰۰
dall-e-3	1792×1024 HD	$0.120	۷٬۲۰۰
gpt-image-1 (low)	1024×1024	$0.011	۶۶۰
gpt-image-1 (medium)	1024×1024	$0.042	۲٬۵۲۰
gpt-image-1 (high)	1024×1024	$0.167	۱۰٬۰۲۰

فرمول طلایی محاسبه

برای هر فراخوانی chat، فرمول هزینه به تومان:

هزینهٔ فراخوانی =
   (تعداد توکن ورودی × قیمت ورودی به تومان/M ÷ 1,000,000)
 + (تعداد توکن خروجی × قیمت خروجی به تومان/M ÷ 1,000,000)

برای محاسبهٔ توکن، می‌توانی از tokenizer رسمی OpenAI یا کتابخانهٔ tiktoken در پایتون استفاده کنی:

import tiktoken

enc = tiktoken.encoding_for_model("gpt-4o")
text = "این یک متن نمونهٔ فارسی است."
tokens = len(enc.encode(text))
print(f"تعداد توکن: {tokens}")

چهار سناریوی واقعی با محاسبهٔ کامل

سناریو ۱: چت‌بات پشتیبانی فروشگاه آنلاین

فروشگاهی با ۵۰۰ مکالمهٔ روزانه. هر مکالمه:

System prompt: ۸۰۰ توکن (یک‌بار محاسبه)
تاریخچهٔ ۴ پیام قبلی: ۱۲۰۰ توکن
پیام جدید کاربر: ۲۰۰ توکن
پاسخ: ۳۰۰ توکن

کل ورودی هر فراخوانی ≈ ۲۲۰۰ توکن، خروجی ≈ ۳۰۰ توکن. هر مکالمه میانگین ۵ تبادل دارد، یعنی ۵ فراخوانی.

مدل	هزینهٔ هر مکالمه (تومان)	روزانه (تومان)	ماهانه (تومان)
gpt-5	۱٬۷۲۵	۸۶۲٬۵۰۰	۲۵٬۸۷۵٬۰۰۰
gpt-5-mini	۳۴۵	۱۷۲٬۵۰۰	۵٬۱۷۵٬۰۰۰
gpt-4o-mini	۱۵۳	۷۶٬۵۰۰	~۲٬۳۰۰٬۰۰۰
gpt-5-nano	۶۹	۳۴٬۵۰۰	~۱٬۰۳۵٬۰۰۰

تفاوت چشمگیر است. برای یک چت‌بات پشتیبانی، gpt-5-nano یا gpt-4o-mini عملاً همان کیفیت را با یک‌بیستم هزینه می‌دهند.

سناریو ۲: تولید محتوای بلاگ خودکار

یک سایت محتوایی که روزی ۱۰ مقالهٔ ۱۵۰۰ کلمه‌ای فارسی تولید می‌کند. هر مقاله:

Prompt + outline: ۲٬۰۰۰ توکن ورودی
متن ۱۵۰۰ کلمهٔ فارسی: ~۳٬۵۰۰ توکن خروجی

کیفیت اینجا حیاتی است، پس gpt-5 معقول است:

هزینهٔ هر مقاله = (2000 × 75000 / 1M) + (3500 × 600000 / 1M)
                = 150 + 2100 = ۲٬۲۵۰ تومان
هزینهٔ روزانه = 10 × 2250 = ۲۲٬۵۰۰ تومان
هزینهٔ ماهانه ≈ ۶۷۵٬۰۰۰ تومان

کمتر از یک نیروی پاره‌وقت نوسنده، با خروجی پایدار شبانه‌روزی.

سناریو ۳: سیستم RAG با ۱۰٬۰۰۰ سند

یک شرکت می‌خواهد دانش داخلی‌اش (۱۰٬۰۰۰ سند، میانگین ۲٬۰۰۰ کلمه) را قابل جست‌وجو کند:

یک‌بار: indexing

۱۰٬۰۰۰ سند × ۲٬۰۰۰ کلمه × ۱.۵ توکن = ۳۰M توکن
هزینه با text-embedding-3-small: 30 × ۱٬۲۰۰ = ۳۶٬۰۰۰ تومان

روزانه: queries

۱٬۰۰۰ جست‌وجو × ۵۰ توکن: ۵۰٬۰۰۰ توکن embedding (~۶۰ تومان)
هر query: ۵ سند بازیابی‌شده × ۸۰۰ توکن = ۴٬۰۰۰ توکن context + ۵۰۰ توکن خروجی
۱۰۰۰ × (4500 × 15000 + 500 × 120000) / 1M = ۱۲۷٬۵۰۰ تومان

کل ماهانه: ~۴ میلیون تومان برای یک سیستم دانش داخلی پاسخگو به ۱۰۰۰ پرسش روزانه. در مقیاس شرکت متوسط، عدد بسیار منطقی.

سناریو ۴: پادکست‌ساز تمام‌خودکار

یک ابزار که از یک مقاله، پادکست تولید می‌کند:

تبدیل مقاله به دیالوگ پادکست با gpt-5: ~۲٬۵۰۰ تومان
تبدیل دیالوگ ۲۰ دقیقه‌ای به صوت با tts-1-hd: ۲۵٬۰۰۰ کاراکتر × ۱٬۸۰۰٬۰۰۰ ÷ 1M = ۴۵٬۰۰۰ تومان
کاور تصویر با dall-e-3 HD: ۴٬۸۰۰ تومان

کل: ~۵۲٬۰۰۰ تومان به ازای هر پادکست. اگر ماهی ۳۰ پادکست تولید کنی: ~۱.۶ میلیون تومان.

چهار راه عملی برای کاهش هزینه

۱. Prompt Caching

OpenAI به‌صورت خودکار درخواست‌های مشابه را cache می‌کند. اگر system prompt تو ثابت است (مثلاً ۲٬۰۰۰ توکن دستورالعمل)، در فراخوانی‌های بعدی همان prompt حدود ٪۵۰ تخفیف می‌خورد. کافی است system prompt را در ابتدای messages بگذاری و آن را تغییر ندهی.

۲. Batch API

اگر کاری داری که نیاز به پاسخ آنی ندارد (مثلاً برچسب‌گذاری ۱۰٬۰۰۰ کامنت)، از Batch API استفاده کن. ٪۵۰ ارزان‌تر است، با پاسخ‌دهی تا ۲۴ ساعت. برای کارهای async ایده‌آل است.

۳. مدل ارزان‌تر برای ٪۸۰ موارد

این الگو واقعاً کار می‌کند: یک router می‌سازی که با gpt-4o-mini تشخیص می‌دهد سؤال ساده است یا پیچیده. اگر ساده، با gpt-5-nano پاسخ می‌دهد؛ اگر پیچیده، escalate به gpt-5. در عمل، ۸۰ تا ۹۰ درصد سؤالات ساده‌اند.

۴. کوتاه‌سازی هوشمندانهٔ context

به‌جای فرستادن کل تاریخچهٔ مکالمه، فقط ۳ پیام آخر + یک خلاصهٔ پویا از قبلی‌ها بفرست. تکنیک «sliding window with summary» می‌تواند مصرف توکن را ٪۴۰ تا ٪۶۰ کم کند بدون از دست دادن context.

یک ابزار سریع برای محاسبهٔ هزینهٔ پروژه

این تابع به تو کمک می‌کند برای پروژه‌ات قبل از launch تخمین واقعی بزنی:

def estimate_monthly_cost_toman(
    daily_requests: int,
    avg_input_tokens: int,
    avg_output_tokens: int,
    model: str = "gpt-5-mini"
) -> dict:
    rates = {
        "gpt-5":        {"in": 75000,  "out": 600000},
        "gpt-5-mini":   {"in": 15000,  "out": 120000},
        "gpt-5-nano":   {"in": 3000,   "out": 24000},
        "gpt-4.1":      {"in": 120000, "out": 480000},
        "gpt-4.1-mini": {"in": 24000,  "out": 96000},
        "gpt-4o":       {"in": 150000, "out": 600000},
        "gpt-4o-mini":  {"in": 9000,   "out": 36000},
    }
    r = rates[model]
    daily = (avg_input_tokens * r["in"] + avg_output_tokens * r["out"]) / 1_000_000
    daily *= daily_requests
    return {
        "daily_toman": round(daily),
        "monthly_toman": round(daily * 30),
        "yearly_toman": round(daily * 365)
    }

print(estimate_monthly_cost_toman(
    daily_requests=2500,
    avg_input_tokens=2200,
    avg_output_tokens=300,
    model="gpt-5-mini"
))

چرا تومان؟ مزیت پروکسی API بومی

اگر مستقیم به OpenAI پرداخت می‌کردی، به یک کارت اعتباری خارجی نیاز داشتی، نرخ ارز هرروز نوسان می‌کرد، و گزارش هزینه به دلار بود — که با تومان حسابداری ایرانی سازگار نیست. پروکسی‌های API بومی مثل 1xAi این مشکلات را حل می‌کنند:

پرداخت با هر کارت شتاب از طریق درگاه زرین‌پال.
صورت‌حساب به تومان، با امکان فاکتور رسمی برای شرکت‌ها (از طریق فرم تماس).
گزارش مصرف لحظه‌ای در داشبورد فارسی.
حداقل شارژ ۱۰۰ هزار تومان، حداکثر ۲۵ میلیون تومان در هر تراکنش (برای بیشتر، تماس با پشتیبانی).

جمع‌بندی

هزینهٔ ChatGPT API با تصور رایج «گران» بسیار فاصله دارد. برای یک چت‌بات پشتیبانی متوسط، ماهی یک تا سه میلیون تومان کافی است. برای یک سیستم RAG شرکتی، چهار تا ده میلیون تومان. برای یک پلتفرم تولید محتوای کوچک، زیر یک میلیون. کلید کاهش هزینه دو چیز است: انتخاب درست مدل برای هر کار (به مقالهٔ تفاوت GPT-5، GPT-4o و GPT-4.1 رجوع کن) و بهینه‌سازی استفاده از توکن. اگر داری از داخل ایران شروع می‌کنی، یک حساب در یک پروکسی API بومی باز کن، با ۲۰۰ هزار تومان شارژ یک هفته با کد واقعی پروژه‌ات کار کن، و بعد بر اساس مصرف واقعی تصمیم بگیر. اعداد همیشه بهتر از حدس هستند.

ABOUT THE AUTHOR · نویسنده

تیم 1xAi

تیمِ 1xAi پروکسیِ تخصصیِ مدل‌های OpenAI، Claude و Gemini برای کاربرانِ ایرانی را اداره می‌کند — از زیرساختِ شبکه تا صورت‌حسابِ تومانی. هرچه اینجا می‌نویسیم بر اساسِ تجربه‌ٔ روزانه با APIهای OpenAI، Anthropic و Google و نیازهای واقعیِ توسعه‌دهندگانِ داخلِ ایران است.

دربارهٔ ما مستندات تماس

RELATED · ادامهٔ مطالعه

← مقاله‌های دیگر