Исследователи из Массачусетского технологического института совместно с лабораторией искусственного интеллекта MIT-IBM Watson предложили метод оценки надежности ИИ общего назначения перед использованием для решения конкретных задач.
Эти модели, как и те, что используются в таких передовых инструментах ИИ, как ChatGPT и DALL-E, обучаются на больших объемах данных и применяются в различных областях, что создает «потенциальный риск получения некорректных результатов в критических ситуациях». Как сообщает Science Daily, метод основывается на создании ансамбля слегка отличающихся моделей и оценке их согласованности в представлении данных. Измерив соответствие этих представлений в разных моделях, исследователи могут оценить надежность прогнозов без проверки в реальных условиях.