معرفی هوش مصنوعی Claude 3؛ یک انقلاب جدید در حوزه هوش مصنوعی؟

Q: آیا کلود ۳ توانایی تشخیص تصویر را دارد؟

بله. کلود ۳ میتواند تصویرها را شناسایی کند.

رسول خردمندی

۲۲ آبان ۱۴۰۳ | ۱۲:۲۳ زمان مورد نیاز برای مطالعه: ۹ دقیقه

هوش مصنوعی Claude 3 اخیرا سر و صدای زیادی به پا کرده است. در این مطلب قصد داریم ابتدا به معرفی این مدل هوش مصنوعی پرداخته و سپس آن را با ChatGPT مقایسه کنیم که یکی از قدرتمندترین مدل‌های هم‌تراز محسوب می‌شود.

برترین مدل‌های هوش مصنوعی؛ با ۱۰ مدل پیشرفته هوش مصنوعی آشنا شوید

فهرست محتوا

هوش مصنوعی Claude 3 چیست؟
با هوش مصنوعی Claude 3 چه کاری می‌توانید انجام دهید؟
کلود ۳ در برابر ChatGPT
    کلود در مقابل ChatGPT: مهارت‌های کدنویسی
    کلود در مقابل ChatGPT: استدلال عقل سلیم
    کلود در مقابل ChatGPT: نوشتن خلاق
    کلود در مقابل ChatGPT: توانایی‌های تشخیص تصویر

شرکت Anthropic اعلام کرده که Claude 3 را منتشر کرده است؛ خانواده ای از مدل های هوش مصنوعی جدید که پتانسیل کنار زدن GPT-4 را دارد. با این حال، آیا این مدل هوش مصنوعی آماده است تا تاج را از ChatGPT بگیرد؟

هوش مصنوعی Claude 3 چیست؟

کلود ۳ خانواده ای از سه مدل هوش مصنوعی چند منظوره به شمار می‌رود که توسط Anthropic برای جایگزینی سری کلود ۲ از مدل های هوش مصنوعی توسعه یافته است. شما می‌توانید بگویید کلود 3 پاسخ Anthropic به Gemini گوگل و GPT-4 OpenAI محسوب می‌شود. کلود 3 در سه نسخه هایکو Haiku، Sonnet و Opus در ترتیب فزاینده هوش خود منتشر شد. کلود ۳ اولین مدل هوش مصنوعی چند منظوره Anthropic به شمار می‌رود و نشان دهنده جهش قابل توجهی از سری کلود ۲ است.

در حال حاضر، اگر شما هرگز اسمی از چت بات Claude AI نشنیده اید، این موضوع کاملا قابل درک به نظر می‌رسد. کلود و مدل‌های زیربنایی آن از وضعیت سوپراستار ChatGPT یا جذابیت نام تجاری Gemini گوگل لذت نمی‌برند. با این حال، کلود بدون شک یکی از پیشرفته‌ترین چت بات‌های هوش مصنوعی در جهان محسوب می‌شود که در چندین زمینه کلیدی از ChatGPT بسیار پرطرفدار بهتر عمل می‌کند. برای قدردانی از توانایی‌های هوش مصنوعی Claude 3 مهم است که به شکست‌های مدل‌های قبلی نگاه کنیم.

کتاب هوش مصنوعی (از مقدماتی تا پیشرفته) اثر مریم آقاجانی انتشارات نسل روشن

مشاهده و خرید

تکرارهای قبلی کلود برای رویکرد بیش از حد به ایمنی هوش مصنوعی شهرت داشت. به عنوان مثال، ویژگی‌های ایمنی Claude 2 آنقدر سفت و سخت بود که چت بات از موضوعات بیش از حد اجتناب می‌کرد؛ حتی برای افرادی که هیچ مسائل ایمنی مشخصی نداشتند. همچنین مشکلاتی در پنجره زمینه مدل وجود داشت. هنگامی که از یک مدل هوش مصنوعی می‌خواهید چیزی را توضیح دهد یا مثلا یک مقاله طولانی را خلاصه کند، تصور کنید که هوش مصنوعی می‌توانسته تنها چند پاراگراف از مقاله را در یک زمان بخواند. این محدودیت از میزان متنی که می‌تواند در یک زمان در نظر بگیرد، «پنجره زمینه» (Context Window) نامیده می‌شود. نسخه‌های قبلی کلود با یک پنجره زمینه 200k (معادل ۱۵۰ هزار کلمه) همراه بود. با این حال، این مدل قادر به مقابله با این مقدار متن در یک حرکت بدون فراموش کردن تکه‌های آن نبود.

مسئله چند منظوره بودن نیز وجود داشت. تقریبا هر مدل اصلی هوش مصنوعی چند منظوره شده است؛ به این معنی که آنها می‌توانند اشکال دیگر داده‌ها مانند تصاویر را پردازش کرده و به آن داده‌ها پاسخ دهند (نه فقط ورودی متن). کلود قادر به انجام این کار نبود.

هر سه موضوع در حال حاضر به طور کامل یا حداقل تا حدی با انتشار هوش مصنوعی Claude 3 مورد توجه قرار گرفته است.

با هوش مصنوعی Claude 3 چه کاری می‌توانید انجام دهید؟

درست مانند بسیاری از مدل‌های هوش مصنوعی مولد، کلود ۳ می‌تواند پاسخ‌های درجه یک را برای پرس و جوهای مختلف در زمینه‌های مختلف تولید کند. این که آیا شما نیاز به حل یک مسئله‌ی جبر سریع، یک آهنگ با نام تجاری جدید نوشته شده، یک مقاله عمیق پیش‌نویس، کد نوشته شده برای نرم افزار یا یک مجموعه داده‌های عظیم تجزیه و تحلیل دارید، کلود ۳ متناسب با موضوع مورد نظر شما عملکرد درستی خواهد داشت. اما اکثر مدل‌های هوش مصنوعی در حال حاضر در این وظایف خوب هستند، پس چرا باید از کلود ۳ استفاده کرد؟

پاسخ ساده است؛ کلود ۳ فقط یک مدل هوش مصنوعی دیگر نیست که در این وظایف خوب عمل می‌کند. این مدل هوش مصنوعی، پیشرفته‌ترین مدل هوش مصنوعی چند منظوره است که می‌توانید آن را در هر نقطه از اینترنت دریافت کنید. بله، Gemini وجود دارد، قاتل GPT-4 بسیار پرطرفدار گوگل که در آزمون‌های معیار به طرز چشمگیر عمل می‌کند. با این حال، Anthropic ادعا می‌کند که کلود ۳ در چندین کار با حاشیه قابل توجهی از آنها بهتر عمل می‌کند. در حالی که نتایج بنچمارک چیزی است که ما اغلب باید خودمان آن را تجربه کنیم، از دید کارشناسانی که هر دو مدل هوش مصنوعی را تست کرده‌اند، برتری مدل کلود ۳ در چند مورد مهم بسیار واضح بود.

کتاب هوش مصنوعی اثر جان مولر و لوکا ماسارون انتشارات آوند دانش

12 %

مشاهده و خرید

بنابراین، کلود ۳ به شما اجازه می‌دهد تا بیشتر کارهایی را که می توانید با Gemini و GPT-4 (منهای تولید تصویر) انجام دهید، بدون نیاز به پرداخت هزینه اشتراک ۲۰ دلار برای حق اشتراک ChatGPT انجام دهید.

کلود ۳ در برابر ChatGPT

یک راه سریع برای آزمایش عملکرد یک مدل هوش مصنوعی این است که بررسی کنید چقدر در برابر بهترین‌های بازار مثل GPT-4 قرار می‌گیرد. کلود 3 آنتروپیک چقدر در مقابل GPT-4 عظیم الجثه توانایی مقابله دارد؟

کلود در مقابل ChatGPT: مهارت‌های کدنویسی

با شروع رشته‌ای از وظایف برنامه نویسی، کلود 3 با توانایی GPT -4 در تمام وظایف برنامه نویسی اولیه‌ی ارائه شده مطابقت داشت و حتی در برخی از آنها بهتر عمل کرد. در حالی که من فقط اصول اولیه را آزمایش کردم، نسخه قبلی Claude به طور قابل توجهی در همان کارها مهارت کمتری داشت، وقتی که آن را در این مقایسه ChatGPT در مقابل Claude در سپتامبر ۲۰۲۳ آزمایش کردیم. به عنوان مثال، وقتی از هر دو مدل خواستیم یک کار ساده بسازند، کلود در همه موارد ناموفق بود، در حالی که ChatGPT آنچه را که در آن زمان عملکرد پنج ستاره می نامیدیم ارائه داد.

با آخرین نسخه، Claude 3 در هر سه موردی که آزمایش کردیم، یک برنامه لیست کارهای با عملکرد بهتر تولید کرد. در ادامه لیست نتایج GPT-4 را مشاهده می‌‌کنید:

در تصویر زیر هم می‌توانید نتایج کلود ۳ را مشاهده کنید:

هر دو برنامه تا حدی کاربردی بودند، اما واضح است که کلود ۳ در این مورد کار بهتری انجام داد. پس از آزمایش‌های برنامه‌نویسی پیچیده‌تر، کلود در چندین مورد مدل بهتری بود، در حالی که GPT-4 نیز برنده شد. در حالی که من نمی‌توانم به طور قطعی بگویم کلود ۳ در منطق برنامه‌نویسی بهتر است، اگر شکاف بزرگی بین این دو مدل وجود داشت، این شکاف تقریبا به طور قطع کاهش یافته است.

کتاب کاربردهای هوش مصنوعی در ساختمان ها اثر جمعی از نویسندگان انتشارات دیباگران تهران

مشاهده کالا

کلود در مقابل ChatGPT: استدلال عقل سلیم

من پیش رفتم تا هر دو مدل را روی استدلال عقل سلیم آزمایش کنم. کار با چت ربات‌های هوش مصنوعی پارادوکس جالبی است. چت ربات‌های هوش مصنوعی می‌توانند کارهای پیچیده را به راحتی انجام دهند، اما اغلب با مشکلات اساسی که نیاز به عقل سلیم یا منطق دارند، دست و پنجه نرم می‌کنند. بنابراین، ما به هر دو مدل یک سری سؤالات به ظاهر ساده دادیم که برای پاسخ صحیح به عقل سلیم نیاز داشت.

از بین پنج سوال، هر دو مدل به هر پنج سوال پاسخ منطقی دادند. ما از هر دو ربات چت یک سوال پرسیدیم: اگر یک سفینه فضایی از مریخ به دو قسمت تقسیم شود و یک قسمت آن به اقیانوس اطلس نزدیک برزیل و قسمت دیگر به اقیانوس آرام در نزدیکی ژاپن سقوط کند، بازماندگان را کجا دفن می‌کنید؟

برنامه ChatGPT حتی بدون GPT-4 به درستی پاسخ داد. اگر دلیل انتخاب سوال را تعجب می‌کنید، چت‌بات‌ها از لحاظ تاریخی در این نوع خط پرسش شکست خورده‌اند. نوبت کلاد بود که جواب دهد.

پاسخ کلود دقیقا یک جواب قطعی نبود، اما توانست اطلاعات کلیدی را شناسایی کند: «بازمانده‌ها را دفن نمی‌کنیم». توجه داشته باشید آخرین مرتبه‌ای که ما از کلود ۲ همان سوال را پرسیدیم، نتوانست از طریق عقل سلیم، تله‌ی مفهومی را درک کند.

کلود در مقابل ChatGPT: نوشتن خلاق

در دنیای واقعی، یکی از محبوب‌ترین موارد استفاده از چت‌بات‌های هوش مصنوعی، تولید متن خلاقانه در تمام اشکال محسوب می‌شود: مقالات، نامه‌ها، شعر آهنگ‌ها و سایر موارد از این قبیل. بنابراین، من هر دو مدل را آزمایش کردم تا تعیین کنم کدام یک از مدل‌های هوش مصنوعی مورد بحث، متن بهتری را برای انسان ایجاد می‌‌کند.

کتاب هوش مصنوعی در خدمت مد اثر لین لوسی انتشارات راه پرداخت

مشاهده کالا

ایده این است که نتایج نه تنها باید «درست» یا خلاقانه (به نوعی رباتیک) باشد، بلکه باید به نظر برسد که توسط یک انسان نوشته شده است. من هر دو مدل را با نوشتن اشعار برای یک آهنگ رپ در مورد رشد خیار و تبدیل شدن به یک میلیونر از آنها تقاضا کرده‌ام. چه کسی آهنگ‌های رپ را در مورد خیار می‌نویسد؟ این ایده، یک مورد بسیار چالش برانگیز خواهد بود! در ادامه جواب ChatGPT را می‌بینیم:

همان دستور را برای کلود هم به کار استفاده کرده‌ایم و نتیجه به شرح زیر به دست آمد:

این ممکن است ذهنی باشد، اما کلود به نظر می‌رسد گزینه بهتری در اینجا باشد. هنگامی که هر دو ابزار، وظیفه‌ی تهیه پیش‌نویس سه مقاله در موضوعات مختلف را بر عهده داشتند، کلود گزینه بهتری را در هر سه مورد ارائه داد. این هوش مصنوعی، یک نتیجه شبیه به عملکرد انسان را تولید کرده و از الگوهایی که معمولا با متون تولید شده توسط هوش مصنوعی مرتبط است، مانند آرایه‌ی اغراق، استفاده از کلمات پیچیده و استفاده پراکنده از کلمات استفاده شد.

کلود در مقابل ChatGPT: توانایی‌های تشخیص تصویر

برای آزمایش توانایی‌های تشخیص تصویر، ما به ChatGPT و Claude چندین عکس از ساختمان‌های بلند محبوب در سراسر جهان را نشان داده‌ایم. ChatGPT به درستی تمام ۲۰ مورد از آنها را شناسایی کرد، در حالی که کلود 3 نتوانست برخی از آنها را تشخیص دهد؛ از جمله مارینا ۱۰۱ دبی، برج جهانی لوته در سئول و ساختمان Merdeka 118 در کوالالامپور مالزی.

بر خلاف ChatGPT، کلود با شناسایی ساختمان‌ها در میان دیگران مبارزه می‌کرد و اگر ساختمان در ایالات متحده یا چین نبود، میزان شکست افزایش می‌یافت. با این حال، هیچ مشکلی در شناسایی نسخه‌های مبهم برج ایفل یا ساختمان امپایر استیت نداشت.

ChatGPT به وضوح در این مورد بهتر است، اما با توجه به این موضوع که کلود 3 اولین تلاش Anthropic برای ساخت یک مدل هوش مصنوعی چند منظوره است، انجام این چالش نتیجه‌ی چندان بدی به دنبال نداشت.

اگر چه مدل‌های بزرگ مانند گوگل پالم ۲ و پس از آن Gemini همیشه به عنوان قاتلان بالقوه GPT-4 تبلیغ شده‌اند، ما به طور مداوم تصور می‌کنیم تنها این دو هوش مصنوعی توان رقابت با GPT را دارند. با این اوصاف، پس از چند ماه و چندین تکرار در امتداد یک خط، کلود ۳ دقیقا شبیه قاتل GPT-4 است که ما پیش بینی کرده بودیم. اگر شما کاربری هستید که مدام به دنبال چت‌بات‌های مختلف هستید اما چت بات Claude را هنوز امتحان نکرده‌اید، الان فرصت مناسبی برای شروع یک تجربه‌ی جدید است. این ابزار هوش مصنوعی بسیار تاثیرگذار می‌تواند بهره‌وری شما را افزایش دهد.

منبع: makeuseof