هوش مصنوعی DeepMind مسائل هندسه سخت المپیاد ریاضی را حل می کند

مسائل هندسی شامل اثبات حقایق در مورد زوایا یا خطوط در اشکال پیچیده است

Google DeepMind

یک هوش مصنوعی از Google DeepMind می تواند برخی از سؤالات المپیاد بین المللی ریاضی (IMO) را در مورد هندسه تقریباً مانند بهترین شرکت کنندگان انسانی حل کند.

گرگور دولینار، رئیس IMO می‌گوید: «نتایج AlphaGeometry خیره‌کننده و نفس‌گیر هستند». به نظر می رسد که هوش مصنوعی خیلی زودتر از آن چیزی که حتی چند ماه پیش تصور می شد، مدال طلای IMO را به دست خواهد آورد.

IMO، با هدف دانش آموزان دبیرستانی، یکی از دشوارترین مسابقات ریاضی در جهان است. پاسخگویی صحیح به سوالات نیازمند خلاقیت ریاضی است که سیستم های هوش مصنوعی مدت هاست با آن دست و پنجه نرم می کنند. به عنوان مثال، GPT-4 که توانایی استدلال قابل توجهی را در حوزه های دیگر نشان داده است، در سؤالات هندسه IMO نمره 0 درصد کسب می کند، در حالی که حتی هوش مصنوعی های تخصصی نیز مانند شرکت کنندگان معمولی برای پاسخ دادن به آن تلاش می کنند.

این تا حدودی به سختی مشکلات مربوط می شود، اما همچنین به دلیل کمبود داده های آموزشی است. این مسابقه از سال 1959 به صورت سالانه برگزار می شود و هر نسخه فقط از شش سؤال تشکیل شده است. با این حال، برخی از موفق ترین سیستم های هوش مصنوعی به میلیون ها یا میلیاردها نقطه داده نیاز دارند. به ویژه مسائل هندسی، که یک یا دو سؤال از شش سؤال را تشکیل می دهند و شامل اثبات حقایق در مورد زوایا یا خطوط در اشکال پیچیده است، به ویژه برای ترجمه به یک قالب کامپیوتری دشوار است.

Thang Luong در Google DeepMind و همکارانش با ایجاد ابزاری که می تواند صدها میلیون اثبات هندسی قابل خواندن توسط ماشین تولید کند، این مشکل را دور زده اند. هنگامی که آنها هوش مصنوعی به نام AlphaGeometry را با استفاده از این داده ها آموزش دادند و آن را روی 30 سؤال هندسه IMO آزمایش کردند، به 25 سؤال از آنها به درستی پاسخ داد، در مقایسه با امتیاز تخمینی 25.9 برای یک دارنده مدال طلای IMO بر اساس نمرات آنها در مسابقه.

“ما [current] سیستم‌های هوش مصنوعی هنوز با توانایی انجام کارهایی مانند استدلال عمیق دست و پنجه نرم می‌کنند، جایی که ما باید برای بسیاری از مراحل از قبل برنامه‌ریزی کنیم و همچنین تصویر بزرگ را ببینیم، به همین دلیل است که ریاضیات معیار و تست مهمی برای ما در تلاش است. لونگ در یک کنفرانس مطبوعاتی گفت: به هوش عمومی مصنوعی.

هندسه آلفا از دو بخش تشکیل شده است که Luong آن را با سیستم های تفکر مختلف در مغز مقایسه می کند: یک سیستم سریع و شهودی و دیگری کندتر و تحلیلی تر. بخش اول و بصری یک مدل زبان است، شبیه به فناوری پشت ChatGPT، به نام GPT-f. بر روی میلیون‌ها دلیل ایجاد شده آموزش داده شده است و پیشنهاد می‌کند که کدام قضایا و استدلال‌ها را در مرحله بعد برای یک مسئله امتحان کنید. هنگامی که گام بعدی را پیشنهاد می‌کند، یک موتور «استدلال نمادین» کندتر اما دقیق‌تر از قواعد منطقی و ریاضی برای ساختن کامل استدلالی که GPT-f پیشنهاد کرده است استفاده می‌کند. سپس این دو سیستم پشت سر هم کار می کنند و تا زمانی که مشکل حل شود، بین یکدیگر سوئیچ می کنند.

لوونگ می‌گوید در حالی که این روش در حل مسائل هندسه IMO بسیار موفق است، پاسخ‌هایی که می‌سازد نسبت به اثبات‌های انسانی طولانی‌تر و کمتر «زیبا» هستند. با این حال، می تواند چیزهایی را که انسان از دست می دهد نیز تشخیص دهد. برای مثال، راه‌حل بهتر و کلی‌تری برای یک سوال از IMO 2004 نسبت به آنچه در پاسخ‌های رسمی ذکر شده بود، کشف کرد.

یانگ هوی هی در مؤسسه علوم ریاضی لندن می‌گوید حل مسائل هندسه IMO به این روش قابل توجه است، اما این سیستم ذاتاً در ریاضیاتی که می‌تواند از آن استفاده کند محدود است زیرا مسائل IMO باید با استفاده از قضایایی که در سطح کارشناسی آموزش داده می‌شوند قابل حل باشند. او می‌گوید که گسترش مقدار دانش ریاضی که AlphaGeometry به آن دسترسی دارد، می‌تواند سیستم را بهبود بخشد یا حتی به آن کمک کند تا اکتشافات جدید ریاضی را انجام دهد.

همچنین جالب است که ببینیم AlphaGeometry چگونه با ندانستن چیزهایی که نیاز به اثبات دارد کنار می‌آید، زیرا بینش ریاضی اغلب می‌تواند از کاوش قضایا بدون هیچ اثبات مشخصی حاصل شود. «اگر نمی‌دانید نقطه پایانی شما چیست، می‌توانید در مجموعه همه آن‌ها پیدا کنید [mathematical] آیا قضیه‌ای وجود دارد که واقعاً جالب و جدید باشد؟»

سال گذشته، شرکت تجارت الگوریتمی XTX Markets یک صندوق جایزه 10 میلیون دلاری برای مدل‌های ریاضی هوش مصنوعی، با جایزه بزرگ 5 میلیون دلاری برای اولین مدل هوش مصنوعی مشترک عمومی که می‌تواند مدال طلای IMO را کسب کند، و همچنین جوایز پیشرفت کوچک‌تری برای نقاط عطف کلیدی اعلام کرد.

الکس گرکو در XTX Markets می گوید: «حل یک مسئله هندسه IMO یکی از جوایز پیشرفت برنامه ریزی شده است که توسط صندوق چالش AIMO 10 میلیون دلاری پشتیبانی می شود. دیدن پیشرفت به سوی این هدف هیجان‌انگیز است، حتی قبل از اینکه تمام جزئیات این جایزه پیشرفت را اعلام کنیم، که شامل در دسترس قرار دادن مدل و داده‌ها به‌طور آشکار و همچنین حل یک مسئله هندسه واقعی در طول مسابقه زنده IMO است.»

DeepMind از بیان اینکه آیا قصد دارد در مسابقه زنده IMO در AlphaGeometry شرکت کند یا اینکه در حال گسترش سیستم برای حل سایر مشکلات IMO است که بر اساس هندسه نیستند، خودداری کرد. با این حال، DeepMind قبلاً برای آزمایش سیستم AlphaFold خود وارد مسابقات عمومی برای پیش‌بینی تا شدن پروتئین شده است.

موضوعات: