ChatGPT перелопатил почти весь интернет, но пока не научился рассуждать
Языковые модели ИИ переживают бум. В настоящее время лидером является ChatGPT, который может делать все — от сдачи экзамена на адвоката, создания кадровой политики до написания сценария фильма.
Но эта и другие модели все еще не могут рассуждать как человек. Доктор Веред Шварц, доцент кафедры информатики UBC, и студентка магистратуры Мехар Бхатия объясняют, почему рассуждения могут стать следующим шагом в развитии ИИ и почему важно обучать эти модели, используя разнообразные наборы данных из разных культур.
Что такое «рассуждения» для ИИ
Шварц: Большие языковые модели, такие как ChatGPT, обучаются путем чтения миллионов документов, по сути, всего интернета, и распознавания закономерностей для получения информации. Это означает, что они могут предоставлять информацию только о тех вещах, которые задокументированы в Интернете. С другой стороны, люди способны рассуждать. Мы используем логику и здравый смысл, чтобы понять смысл, выходящий за рамки сказанного в явном виде.
Бхатия: Способности рассуждать мы приобретаем с рождения. Например, мы знаем, что нельзя включать блендер в 2 часа ночи, потому что это всех разбудит. Нас этому не учат, но это то, что вы понимаете, исходя из ситуации, обстановки и вашего окружения. В ближайшем будущем многие наши задачи будут решать модели искусственного интеллекта. Мы не можем вписать в этих роботов все правила здравого смысла, поэтому мы хотим, чтобы они понимали, как правильно поступить в конкретном контексте.
Шварц: Добавление здравого смысла к существующим моделям, таким как ChatGPT, поможет им давать более точные ответы и, таким образом, создавать более мощные инструменты для использования людьми. Современные модели ИИ в той или иной форме демонстрируют рассуждения на основе здравого смысла. Например, если вы спросите последнюю версию ChatGPT о детском и взрослом пироге с грязью, она сможет правильно отличить десерт от лица, полного грязи, основываясь на контексте.
Где языковые модели ИИ дают сбой
Шварц: Рассуждения на основе здравого смысла в моделях ИИ далеки от совершенства. Мы сможем добиться таких результатов, только тренируясь на огромных объемах данных. Людям все равно придется вмешиваться и обучать модели, в том числе предоставляя правильные данные.
Например, мы знаем, что англоязычные тексты в Интернете в основном написаны в Северной Америке, поэтому англоязычные модели, которые используются чаще всего, как правило, имеют североамериканский уклон и рискуют либо не узнать о концепциях других культур, либо увековечить стереотипы. В недавней работе мы обнаружили, что обучение модели рассуждений на основе здравого смысла на данных из разных культур, включая Индию, Нигерию и Южную Корею, привело к получению более точных, учитывающих культурные особенности ответов.
Бхатия: Один из примеров — показать модели изображение женщины из Сомали, делающей татуировку хной, и спросить, зачем ей это нужно. При обучении с использованием культурно разнообразных данных модель правильно предположила, что она собирается выйти замуж, тогда как раньше она говорила, что хочет купить хну.
Шварц: Мы также обнаружили примеры того, что ChatGPT не хватает культурной осведомленности. В гипотетической ситуации, когда пара дала четыре процента чаевых в ресторане в Испании, модель предположила, что они, возможно, были недовольны обслуживанием. Это предполагает, что в Испании действует североамериканская культура чаевых, в то время как на самом деле чаевые в этой стране не распространены, и четыре процента чаевых, скорее всего, означают исключительное обслуживание.
Почему нам необходимо обеспечить более широкое применение ИИ
Шварц: Языковые модели распространены повсеместно. Если эти модели предполагают набор ценностей и норм, связанных с западной или североамериканской культурой, их информация о людях из других культур может быть неточной и дискриминационной. Другая проблема заключается в том, что людям из разных слоев общества, использующим продукты на основе англоязычных моделей, придется адаптировать свои данные к североамериканским нормам, иначе они могут получить неоптимальную производительность.
Бхатия: Мы хотим, чтобы этими инструментами могли пользоваться все, а не только одна группа людей. Канада — культурно разнообразная страна, и мы должны быть уверены, что инструменты ИИ, которые обеспечивают нашу жизнь, не отражают только одну культуру и ее нормы. Наши текущие исследования направлены на обеспечение инклюзивности, разнообразия и культурной восприимчивости при разработке и внедрении технологий ИИ.