Повстання машин на Землі точно не буде: ChatGPT "завалив" іспит з бухгалтерського обліку
Через постійні дискусії на тему підміни студентських та учнівських робіт на праці ChatGPT, вчені вирішили провести експеримент, наскільки чат-бот досконалий в різних галузях. Тому ChatGPT протестували з іспиту бухгалтерського обліку.
Про це повідомляє Portaltele.
ChatGPT "завалив" іспит з бухгалтерського обліку
Вчені з Університету Бригама Янга та 186 інших установ цікавилися ефективністю технології OpenAI на іспитах з бухгалтерського обліку. Тому вони протестували оригінальну модель ChatGPT. Дослідники заявили, що хоча ChatGPT все ще потребує вдосконалення у сфері бухгалтерського обліку, він має потенціал революціонізувати спосіб навчання та навчання на краще.
Дослідники залучили студентів з усього світу, надавши 25 181 запитання до іспиту з бухгалтерського обліку. Питання стосувалися інформаційних систем бухгалтерського обліку (АІС), аудиту, фінансового обліку, управлінського обліку та оподаткування, і були різними за складністю та типом (правда/неправда, кілька варіантів відповіді, коротка відповідь тощо).
Попри чудову продуктивність чат-бота, студенти впоралися краще, набравши загальний середній бал 76,7%, що в порівнянні з результатом ChatGPT — 47,4%. Він показав добре володіння знаннями AIS та аудиту, але гірше справився з податковими, фінансовими та управлінськими оцінками.
Що стосується типу запитання, ChatGPT показав кращий результат із запитаннями "правда/неправда" (68,7% правильних) і запитаннями з кількома варіантами відповіді (59,5%), але було важко із запитаннями з короткою відповіддю (від 28,7% до 39,1%). Загалом чат-боту було важче відповісти на питання вищого рівня.
"Це не ідеально; ти не збираєшся використовувати його для всього. Спроба вчитися виключно за допомогою ChatGPT — це дурна справа", — сказала одна з учасниць експерименту студентка Джессіка Вуд.
Крім того, у ході експерименту дослідники помітили, що ChatGPT не завжди розпізнає, коли виконує математику, і допускає безглузді помилки, як-от додавання двох чисел у задачі на віднімання або неправильне ділення чисел; надає пояснення до своїх відповідей, навіть якщо вони неправильні; також іноді фальсифікує факти — авторів та джерел, запропонованих ним, може й не існувати
Нагадаємо, що в іспанській лікарні успішно завершили першу в світі повністю роботизовану операцію з пересадки легень. Медики заявляють, що операція може стати світовим стандартом.
Читайте Новини.live!