Крис Саад, бывший глава отдела разработки продуктов в Uber, разработал новую платформу для оценки интеллекта искусственного интеллекта. Фреймворк основан на теории о том, что ИИ не является монолитной конструкцией.
Идея проверки предполагала общение человека с другим, используя компьютерную программу в течение пяти минут, только в текстовом режиме. Если компьютер сможет обмануть как минимум 30% собеседников, тест считается пройденным. Эксперты общаются одновременно с живым человеком и роботом, находясь в разных комнатах и не видя друг друга. По окончании теста каждый из них должен сказать, кто из двух его собеседников был человеком, а кто — программой.
Крис Саад назвал эту концепцию «идеальной в качестве основы для фреймворка классификации ИИ» и создал структуру классификации на ее основе. Она оценивает инструменты ИИ по нескольким измерениям: лингвистическо-вербальному, логико-математическому, музыкальному, зрительно-пространственному, телесно-кинестетическому, межличностному и внутриличностному интеллекту.
ИИ генерирует и/или анализирует совершенно новые математические формулы и доказательства экспертного уровня на основе подсказок на обычном языке. Также он создает и/или анализирует совершенно новый письменный контент экспертного уровня на основе подсказок на естественном языке.
В остальных измерениях — музыкальном, зрительно-пространственном, телесно-кинестетическом, межличностном и внутриличностном ИИ получил ноль или «не показал способностей в этой области».