سرویس فناوری - دادههای جدیدی که توسط Tracking AI جمعآوری شدهاند، با استفاده از آزمون هوش منسا نروژ، رتبهبندی جالبی از باهوشترین مدلهای هوش مصنوعی ارائه میدهند. این آزمون که به سختی و دقتش در سنجش هوش انسانی مشهور است، اکنون معیاری برای ارزیابی تواناییهای شناختی هوش مصنوعی شده است. ...
به گزارش سرویس فناوری جیرجیرک به نقل از فرادید - در دنیای امروز که هوش مصنوعی به سرعت در حال پیشرفت است، این سوال مطرح می شود که مدل های هوش مصنوعی چقدر باهوش هستند و در مقایسه با هوش انسانی چگونه عمل می کنند؟
داده های جدیدی که توسط Tracking AI جمع آوری شده اند، با استفاده از آزمون هوش منسا نروژ، رتبه بندی جالبی از باهوش ترین مدل های هوش مصنوعی ارائه می دهند. این آزمون که به سختی و دقتش در سنجش هوش انسانی مشهور است، اکنون معیاری برای ارزیابی توانایی های شناختی هوش مصنوعی شده است.
مقیاس هوش: انسان در برابر هوش مصنوعی
برای درک بهتر امتیازات کسب شده توسط هوش مصنوعی، یادآوری این نکته ضروری است که میانگین نمره هوش انسانی بین ۹۰ تا ۱۱۰ قرار دارد. کسب نمره ای بالاتر از ۱۳۰ در این آزمون، نشانه ای از سطح نبوغ و هوش فوق العاده محسوب می شود.
پیشتازان هوش مصنوعی در آستانه نبوغ
در این رتبه بندی، مدل OpenAI o3 با کسب نمره ۱۳۵ در آزمون هوش منسا، در صدر قرار گرفته و به وضوح در دسته «نابغه» جای می گیرد. این مدل که بخشی از ChatGPT، یکی از پرکاربردترین ابزارهای هوش مصنوعی در جهان است، توانایی های چشمگیری در پردازش و تولید متن از خود نشان داده است.
پس از OpenAI o3، مدل های دیگری نیز با امتیازات بالا خودنمایی می کنند. Claude-4 Sonnet از Anthropic با نمره ۱۲۷ و Gemini 2.0 Flash Thinking از گوگل با نمره ۱۲۶، فاصله چندانی با صدر جدول ندارند. همچنین، نسخه های جدیدتر مانند Gemini 2.5 Pro و OpenAI o4 mini هر دو امتیاز بالای ۱۲۰ را کسب کرده اند که نشان دهنده عملکردی بالاتر از میانگین هوش انسانی است.
جدول زیر، رتبه بندی کامل مدل های هوش مصنوعی بر اساس نمرات آزمون هوش منسا نروژ را نشان می دهد:
| نام مدل | نمره آزمون هوش منسا نروژ |
|---|---|
| OpenAI o3 | ۱۳۵ |
| Claude-4 Sonnet | ۱۲۷ |
| Gemini 2.0 Flash Thinking Exp. | ۱۲۶ |
| Gemini 2.5 Pro Exp. | ۱۲۴ |
| OpenAI o4 mini | ۱۲۲ |
| Claude-4 Opus | ۱۲۰ |
| Grok-3 Think | ۱۱۲ |
| DeepSeek R1 | ۱۰۶ |
| Llama 4 Maverick | ۱۰۵ |
| OpenAI o1 Pro | ۱۰۲ |
| DeepSeek V3 | ۱۰۰ |
| GPT4.5 Preview | ۹۹ |
| Grok-3 | ۹۷ |
| Gemini 2.5 Pro Exp. (Vision) | ۹۶ |
| GPT-4o | ۹۳ |
| OpenAI o4 mini high | ۹۲ |
| Claude-3.7 (Vision) | ۹۱ |
| Bing Copilot | ۸۶ |
| Mistral | ۸۵ |
| OpenAI o1 Pro (Vision) | ۸۳ |
| OpenAI o3 (Vision) | ۷۲ |
| Llama-3.2 (Vision) | ۷۰ |
| GPT-4o (Vision) | ۶۳ |
| Grok-3 Think (Vision) | ۶۰ |
تفاوت های چشمگیر: هوش متنی در برابر هوش بینایی
نکته قابل توجه در این بررسی، تسلط مدل های متن محور در ۱۰ رتبه برتر است. این مدل ها که قابلیت پردازش تصاویر را ندارند، نشان داده اند که در استدلال و تفکر مبتنی بر کلمات، بسیار قوی عمل می کنند. این موضوع نشان می دهد که استدلال از طریق زبان، هنوز یک نقطه قوت بزرگ برای هوش مصنوعی محسوب می شود.
در مقابل، مدل های هوش مصنوعی چندوجهی که قادر به پردازش تصاویر نیز هستند، عملکرد ضعیف تری را از خود نشان داده اند. پنج مدل آخر در این رتبه بندی، همگی مدل های بینایی هستند. به عنوان مثال، GPT-4o (Vision) از OpenAI با نمره ۶۳ و Grok-3 Think (Vision) از xAI با نمره ۶۰، به طور قابل توجهی پایین تر از میانگین هوش انسانی قرار گرفته اند. این امر به این معناست که تفسیر و حل مسائل بصری، همچنان یک چالش بزرگ برای هوش مصنوعی محسوب می شود.
نتیجه گیری
در مجموع، این نتایج نشان می دهند که مدل های پیشرو هوش مصنوعی به سطوح بالایی از هوش دست یافته اند، به طوری که برخی از آن ها حتی از باهوش ترین ذهن های انسانی نیز پیشی گرفته اند. با ادامه این روند، انتظار می رود که تفاوت های بین هوش مصنوعی و هوش انسانی در آینده بیش از پیش نمایان شود.
منبع: روزیاتو