
AI rozwiązuje zadania olimpijskie z matematyki
Zespół badaczy z DeepMind opracował AlphaGeometry2, system AI, który wykazał się umiejętnościami na poziomie złotego medalu w Międzynarodowej Olimpiadzie Matematycznej (IMO). Testy obejmowały zadania z ostatnich 25 lat, a wyniki wskazują na jego wysoką skuteczność w rozwiązywaniu skomplikowanych problemów geometrycznych.
Znaczenie rozwiązywania zadań geometrycznych
Badania wykazały, że zdolność AI do rozwiązywania problemów geometrycznych może prowadzić do powstania bardziej zaawansowanych aplikacji. Wymaga to zarówno wysokiego poziomu rozumowania, jak i umiejętności wyboru najlepszych kroków w dążeniu do rozwiązania.
Rozwój systemu AlphaGeometry
DeepMind sukcesywnie rozwija swoje systemy do rozwiązywania zadań geometrycznych. Pierwsza wersja, nazwana AlphaGeometry, została zaprezentowana w styczniu 2023 roku. Jej udoskonalona wersja, AlphaGeometry2, została stworzona, by osiągać jeszcze lepsze wyniki.
Połączenie z systemem Alpha Proof
Nowa wersja systemu została zintegrowana z Alpha Proof, narzędziem opracowanym do prowadzenia dowodów matematycznych. W letniej edycji IMO AlphaGeometry2 poprawnie rozwiązało cztery z sześciu zadań konkursowych.
Testowanie na archiwalnych zadaniach IMO
Aby dokładniej ocenić skuteczność systemu, przeprowadzono testy na 45 zadaniach pochodzących z różnych edycji IMO. Po koniecznej konwersji na bardziej przystępną formę liczba testowanych problemów wzrosła do 50.
Kluczowe elementy AlphaGeometry2
System AlphaGeometry2 łączy w sobie kilka istotnych komponentów, w tym model językowy Gemini od Google oraz reguły matematyczne umożliwiające generowanie rozwiązań dla problemów geometrycznych.
Tworzenie dodatkowych konstrukcji
Rozwiązywanie wielu zadań IMO wymaga dodania odpowiednich konstrukcji geometrycznych. AlphaGeometry2 musi przewidywać, które z nich należy zastosować, aby przeprowadzić wymagane dedukcje i uzyskać poprawne rozwiązanie.
Strategia działania systemu
AlphaGeometry2 sugeruje możliwe kroki prowadzące do rozwiązania problemu, a następnie weryfikuje ich logiczność przed ich ostatecznym zastosowaniem. W ten sposób unika błędów i optymalizuje proces rozwiązywania.
Wyniki testów
Podczas przeprowadzonych testów system AlphaGeometry2 poprawnie rozwiązał 42 z 50 zadań, co jest wynikiem nieco wyższym niż średni wynik uczestników zdobywających złote medale w IMO.