TEHRAN
هزینهٔ واقعی ChatGPT API چقدر است؟ محاسبه با تومان
← روزنامه‌نگاری۸ دقیقه مطالعه

هزینهٔ واقعی ChatGPT API چقدر است؟ محاسبه با تومان

محاسبهٔ دقیق هزینهٔ ChatGPT API به تومان: قیمت مدل‌های GPT-5، GPT-4o، Whisper و DALL-E با چهار سناریوی واقعی و چهار راه کاهش هزینه.

BYتیم 1xAi·منتشر: ۲۰۲۶/۰۵/۱۲ ۱۶:۲۲·بروزرسانی: ۲۰۲۶/۰۵/۱۳ ۰۹:۲۳·
قیمت‌گذاریمحاسباتراهنما
CONTENTS · در این مقاله (۲۰)
  1. درک مدل قیمت‌گذاری OpenAI
  2. قیمت‌های دقیق امروز (آبان ۱۴۰۵)
  3. مدل‌های چت
  4. Embeddings
  5. صوت
  6. تصویر
  7. فرمول طلایی محاسبه
  8. چهار سناریوی واقعی با محاسبهٔ کامل
  9. سناریو ۱: چت‌بات پشتیبانی فروشگاه آنلاین
  10. سناریو ۲: تولید محتوای بلاگ خودکار
  11. سناریو ۳: سیستم RAG با ۱۰٬۰۰۰ سند
  12. سناریو ۴: پادکست‌ساز تمام‌خودکار
  13. چهار راه عملی برای کاهش هزینه
  14. ۱. Prompt Caching
  15. ۲. Batch API
  16. ۳. مدل ارزان‌تر برای ٪۸۰ موارد
  17. ۴. کوتاه‌سازی هوشمندانهٔ context
  18. یک ابزار سریع برای محاسبهٔ هزینهٔ پروژه
  19. چرا تومان؟ مزیت پروکسی API بومی
  20. جمع‌بندی

یکی از سؤال‌های همیشگی توسعه‌دهنده‌های ایرانی این است: «اگر بخواهم محصولی روی ChatGPT API بسازم، ماهی چقدر باید پرداخت کنم؟» پاسخ «بستگی دارد» قابل قبول نیست — این مقاله می‌خواهد فرمول‌های دقیق و مثال‌های واقعی بدهد تا قبل از خط زدن یک خط کد، بدانی پروژه‌ات از نظر اقتصادی منطقی است یا نه. همهٔ اعداد به دلار و معادل تومان (با نرخ ۶۰٬۰۰۰ تومان به ازای هر دلار) محاسبه می‌شوند، چون اگر از داخل ایران از طریق پروکسی API بومی مثل 1xAi استفاده کنی، صورت‌حساب نهایی به تومان است.

درک مدل قیمت‌گذاری OpenAI

OpenAI چهار نوع endpoint اصلی دارد و هر کدام مدل قیمت‌گذاری متفاوتی دارد:

endpointکاربردواحد قیمت
/v1/chat/completions و /v1/responsesچت، agent، کدنویسیبه ازای هر ۱M توکن (ورودی + خروجی جدا)
/v1/embeddingsجست‌وجوی معنایی، RAGبه ازای هر ۱M توکن (فقط ورودی)
/v1/audio/transcriptionsتبدیل صوت به متنبه ازای هر دقیقهٔ صوت
/v1/audio/speechتبدیل متن به صوتبه ازای هر ۱M کاراکتر
/v1/images/generationsتولید تصویربه ازای هر تصویر (بسته به resolution و کیفیت)

دو تا قاعدهٔ ساده که همیشه حاکم است:

  • توکن خروجی همیشه گران‌تر از ورودی است (معمولاً ۴ تا ۸ برابر).
  • یک توکن تقریباً = ۴ کاراکتر انگلیسی، یا ۲ تا ۳ کاراکتر فارسی. در فارسی توکن‌سازی کمتر بهینه است، یعنی متن فارسی توکن بیشتری مصرف می‌کند.

قیمت‌های دقیق امروز (آبان ۱۴۰۵)

مدل‌های چت

مدلورودی ($/M)خروجی ($/M)ورودی (تومان/M)خروجی (تومان/M)
gpt-51.2510.00۷۵٬۰۰۰۶۰۰٬۰۰۰
gpt-5-mini0.252.00۱۵٬۰۰۰۱۲۰٬۰۰۰
gpt-5-nano0.050.40۳٬۰۰۰۲۴٬۰۰۰
gpt-4.12.008.00۱۲۰٬۰۰۰۴۸۰٬۰۰۰
gpt-4.1-mini0.401.60۲۴٬۰۰۰۹۶٬۰۰۰
gpt-4o2.5010.00۱۵۰٬۰۰۰۶۰۰٬۰۰۰
gpt-4o-mini0.150.60۹٬۰۰۰۳۶٬۰۰۰
o32.008.00۱۲۰٬۰۰۰۴۸۰٬۰۰۰
o4-mini1.104.40۶۶٬۰۰۰۲۶۴٬۰۰۰

Embeddings

مدلقیمت ($/M)قیمت (تومان/M)ابعاد
text-embedding-3-small0.02۱٬۲۰۰۱۵۳۶
text-embedding-3-large0.13۷٬۸۰۰۳۰۷۲

صوت

مدلکاربردقیمتقیمت (تومان)
whisper-1تبدیل به متن$0.006/min۳۶۰/دقیقه
gpt-4o-transcribeتبدیل به متن$0.006/min۳۶۰/دقیقه
gpt-4o-mini-transcribeتبدیل به متن$0.003/min۱۸۰/دقیقه
tts-1متن به صوت$15/M کاراکتر۹۰۰٬۰۰۰/M کاراکتر
tts-1-hdمتن به صوت با کیفیت$30/M کاراکتر۱٬۸۰۰٬۰۰۰/M کاراکتر

تصویر

مدلاندازهقیمتقیمت (تومان)
dall-e-31024×1024 standard$0.040۲٬۴۰۰
dall-e-31024×1024 HD$0.080۴٬۸۰۰
dall-e-31792×1024 standard$0.080۴٬۸۰۰
dall-e-31792×1024 HD$0.120۷٬۲۰۰
gpt-image-1 (low)1024×1024$0.011۶۶۰
gpt-image-1 (medium)1024×1024$0.042۲٬۵۲۰
gpt-image-1 (high)1024×1024$0.167۱۰٬۰۲۰

فرمول طلایی محاسبه

برای هر فراخوانی chat، فرمول هزینه به تومان:

هزینهٔ فراخوانی =
   (تعداد توکن ورودی × قیمت ورودی به تومان/M ÷ 1,000,000)
 + (تعداد توکن خروجی × قیمت خروجی به تومان/M ÷ 1,000,000)

برای محاسبهٔ توکن، می‌توانی از tokenizer رسمی OpenAI یا کتابخانهٔ tiktoken در پایتون استفاده کنی:

import tiktoken

enc = tiktoken.encoding_for_model("gpt-4o")
text = "این یک متن نمونهٔ فارسی است."
tokens = len(enc.encode(text))
print(f"تعداد توکن: {tokens}")

چهار سناریوی واقعی با محاسبهٔ کامل

سناریو ۱: چت‌بات پشتیبانی فروشگاه آنلاین

فروشگاهی با ۵۰۰ مکالمهٔ روزانه. هر مکالمه:

  • System prompt: ۸۰۰ توکن (یک‌بار محاسبه)
  • تاریخچهٔ ۴ پیام قبلی: ۱۲۰۰ توکن
  • پیام جدید کاربر: ۲۰۰ توکن
  • پاسخ: ۳۰۰ توکن

کل ورودی هر فراخوانی ≈ ۲۲۰۰ توکن، خروجی ≈ ۳۰۰ توکن. هر مکالمه میانگین ۵ تبادل دارد، یعنی ۵ فراخوانی.

مدلهزینهٔ هر مکالمه (تومان)روزانه (تومان)ماهانه (تومان)
gpt-5۱٬۷۲۵۸۶۲٬۵۰۰۲۵٬۸۷۵٬۰۰۰
gpt-5-mini۳۴۵۱۷۲٬۵۰۰۵٬۱۷۵٬۰۰۰
gpt-4o-mini۱۵۳۷۶٬۵۰۰~۲٬۳۰۰٬۰۰۰
gpt-5-nano۶۹۳۴٬۵۰۰~۱٬۰۳۵٬۰۰۰

تفاوت چشمگیر است. برای یک چت‌بات پشتیبانی، gpt-5-nano یا gpt-4o-mini عملاً همان کیفیت را با یک‌بیستم هزینه می‌دهند.

سناریو ۲: تولید محتوای بلاگ خودکار

یک سایت محتوایی که روزی ۱۰ مقالهٔ ۱۵۰۰ کلمه‌ای فارسی تولید می‌کند. هر مقاله:

  • Prompt + outline: ۲٬۰۰۰ توکن ورودی
  • متن ۱۵۰۰ کلمهٔ فارسی: ~۳٬۵۰۰ توکن خروجی

کیفیت اینجا حیاتی است، پس gpt-5 معقول است:

هزینهٔ هر مقاله = (2000 × 75000 / 1M) + (3500 × 600000 / 1M)
                = 150 + 2100 = ۲٬۲۵۰ تومان
هزینهٔ روزانه = 10 × 2250 = ۲۲٬۵۰۰ تومان
هزینهٔ ماهانه ≈ ۶۷۵٬۰۰۰ تومان

کمتر از یک نیروی پاره‌وقت نوسنده، با خروجی پایدار شبانه‌روزی.

سناریو ۳: سیستم RAG با ۱۰٬۰۰۰ سند

یک شرکت می‌خواهد دانش داخلی‌اش (۱۰٬۰۰۰ سند، میانگین ۲٬۰۰۰ کلمه) را قابل جست‌وجو کند:

یک‌بار: indexing

  • ۱۰٬۰۰۰ سند × ۲٬۰۰۰ کلمه × ۱.۵ توکن = ۳۰M توکن
  • هزینه با text-embedding-3-small: 30 × ۱٬۲۰۰ = ۳۶٬۰۰۰ تومان

روزانه: queries

  • ۱٬۰۰۰ جست‌وجو × ۵۰ توکن: ۵۰٬۰۰۰ توکن embedding (~۶۰ تومان)
  • هر query: ۵ سند بازیابی‌شده × ۸۰۰ توکن = ۴٬۰۰۰ توکن context + ۵۰۰ توکن خروجی
  • ۱۰۰۰ × (4500 × 15000 + 500 × 120000) / 1M = ۱۲۷٬۵۰۰ تومان

کل ماهانه: ~۴ میلیون تومان برای یک سیستم دانش داخلی پاسخگو به ۱۰۰۰ پرسش روزانه. در مقیاس شرکت متوسط، عدد بسیار منطقی.

سناریو ۴: پادکست‌ساز تمام‌خودکار

یک ابزار که از یک مقاله، پادکست تولید می‌کند:

  • تبدیل مقاله به دیالوگ پادکست با gpt-5: ~۲٬۵۰۰ تومان
  • تبدیل دیالوگ ۲۰ دقیقه‌ای به صوت با tts-1-hd: ۲۵٬۰۰۰ کاراکتر × ۱٬۸۰۰٬۰۰۰ ÷ 1M = ۴۵٬۰۰۰ تومان
  • کاور تصویر با dall-e-3 HD: ۴٬۸۰۰ تومان

کل: ~۵۲٬۰۰۰ تومان به ازای هر پادکست. اگر ماهی ۳۰ پادکست تولید کنی: ~۱.۶ میلیون تومان.

چهار راه عملی برای کاهش هزینه

۱. Prompt Caching

OpenAI به‌صورت خودکار درخواست‌های مشابه را cache می‌کند. اگر system prompt تو ثابت است (مثلاً ۲٬۰۰۰ توکن دستورالعمل)، در فراخوانی‌های بعدی همان prompt حدود ٪۵۰ تخفیف می‌خورد. کافی است system prompt را در ابتدای messages بگذاری و آن را تغییر ندهی.

۲. Batch API

اگر کاری داری که نیاز به پاسخ آنی ندارد (مثلاً برچسب‌گذاری ۱۰٬۰۰۰ کامنت)، از Batch API استفاده کن. ٪۵۰ ارزان‌تر است، با پاسخ‌دهی تا ۲۴ ساعت. برای کارهای async ایده‌آل است.

۳. مدل ارزان‌تر برای ٪۸۰ موارد

این الگو واقعاً کار می‌کند: یک router می‌سازی که با gpt-4o-mini تشخیص می‌دهد سؤال ساده است یا پیچیده. اگر ساده، با gpt-5-nano پاسخ می‌دهد؛ اگر پیچیده، escalate به gpt-5. در عمل، ۸۰ تا ۹۰ درصد سؤالات ساده‌اند.

۴. کوتاه‌سازی هوشمندانهٔ context

به‌جای فرستادن کل تاریخچهٔ مکالمه، فقط ۳ پیام آخر + یک خلاصهٔ پویا از قبلی‌ها بفرست. تکنیک «sliding window with summary» می‌تواند مصرف توکن را ٪۴۰ تا ٪۶۰ کم کند بدون از دست دادن context.

یک ابزار سریع برای محاسبهٔ هزینهٔ پروژه

این تابع به تو کمک می‌کند برای پروژه‌ات قبل از launch تخمین واقعی بزنی:

def estimate_monthly_cost_toman(
    daily_requests: int,
    avg_input_tokens: int,
    avg_output_tokens: int,
    model: str = "gpt-5-mini"
) -> dict:
    rates = {
        "gpt-5":        {"in": 75000,  "out": 600000},
        "gpt-5-mini":   {"in": 15000,  "out": 120000},
        "gpt-5-nano":   {"in": 3000,   "out": 24000},
        "gpt-4.1":      {"in": 120000, "out": 480000},
        "gpt-4.1-mini": {"in": 24000,  "out": 96000},
        "gpt-4o":       {"in": 150000, "out": 600000},
        "gpt-4o-mini":  {"in": 9000,   "out": 36000},
    }
    r = rates[model]
    daily = (avg_input_tokens * r["in"] + avg_output_tokens * r["out"]) / 1_000_000
    daily *= daily_requests
    return {
        "daily_toman": round(daily),
        "monthly_toman": round(daily * 30),
        "yearly_toman": round(daily * 365)
    }

print(estimate_monthly_cost_toman(
    daily_requests=2500,
    avg_input_tokens=2200,
    avg_output_tokens=300,
    model="gpt-5-mini"
))

چرا تومان؟ مزیت پروکسی API بومی

اگر مستقیم به OpenAI پرداخت می‌کردی، به یک کارت اعتباری خارجی نیاز داشتی، نرخ ارز هرروز نوسان می‌کرد، و گزارش هزینه به دلار بود — که با تومان حسابداری ایرانی سازگار نیست. پروکسی‌های API بومی مثل 1xAi این مشکلات را حل می‌کنند:

  • پرداخت با هر کارت شتاب از طریق درگاه زرین‌پال.
  • صورت‌حساب به تومان، با امکان فاکتور رسمی برای شرکت‌ها (از طریق فرم تماس).
  • گزارش مصرف لحظه‌ای در داشبورد فارسی.
  • حداقل شارژ ۱۰۰ هزار تومان، حداکثر ۲۵ میلیون تومان در هر تراکنش (برای بیشتر، تماس با پشتیبانی).

جمع‌بندی

هزینهٔ ChatGPT API با تصور رایج «گران» بسیار فاصله دارد. برای یک چت‌بات پشتیبانی متوسط، ماهی یک تا سه میلیون تومان کافی است. برای یک سیستم RAG شرکتی، چهار تا ده میلیون تومان. برای یک پلتفرم تولید محتوای کوچک، زیر یک میلیون. کلید کاهش هزینه دو چیز است: انتخاب درست مدل برای هر کار (به مقالهٔ تفاوت GPT-5، GPT-4o و GPT-4.1 رجوع کن) و بهینه‌سازی استفاده از توکن. اگر داری از داخل ایران شروع می‌کنی، یک حساب در یک پروکسی API بومی باز کن، با ۲۰۰ هزار تومان شارژ یک هفته با کد واقعی پروژه‌ات کار کن، و بعد بر اساس مصرف واقعی تصمیم بگیر. اعداد همیشه بهتر از حدس هستند.

ABOUT THE AUTHOR · نویسنده

تیم 1xAi

تیمِ 1xAi پروکسیِ تخصصیِ مدل‌های OpenAI، Claude و Gemini برای کاربرانِ ایرانی را اداره می‌کند — از زیرساختِ شبکه تا صورت‌حسابِ تومانی. هرچه اینجا می‌نویسیم بر اساسِ تجربه‌ٔ روزانه با APIهای OpenAI، Anthropic و Google و نیازهای واقعیِ توسعه‌دهندگانِ داخلِ ایران است.

RELATED · ادامهٔ مطالعه