Sebuah tolok ukur baru yang membandingkan kecerdasan buatan dengan permasalahan matematika yang belum pernah terjadi sebelumnya menunjukkan bahwa sistem ini masih jauh dari mencapai tingkat pakar manusia terbaik.