Повстання машин на Землі точно не буде: ChatGPT "завалив" іспит з бухгалтерського обліку

Повстання машин на Землі точно не буде: ChatGPT "завалив" іспит з бухгалтерського обліку
Штучний інтелект у роботизованому вигляді. Фото: freepik.com

Через постійні дискусії на тему підміни студентських та учнівських робіт на праці ChatGPT, вчені вирішили провести експеримент, наскільки чат-бот досконалий в різних галузях. Тому ChatGPT протестували з іспиту бухгалтерського обліку.

Про це повідомляє Portaltele.

Читайте також:

ChatGPT "завалив" іспит з бухгалтерського обліку

Вчені з Університету Бригама Янга та 186 інших установ цікавилися ефективністю технології OpenAI на іспитах з бухгалтерського обліку. Тому вони протестували оригінальну модель ChatGPT. Дослідники заявили, що хоча ChatGPT все ще потребує вдосконалення у сфері бухгалтерського обліку, він має потенціал революціонізувати спосіб навчання та навчання на краще.

Дослідники залучили студентів з усього світу, надавши 25 181 запитання до іспиту з бухгалтерського обліку. Питання стосувалися інформаційних систем бухгалтерського обліку (АІС), аудиту, фінансового обліку, управлінського обліку та оподаткування, і були різними за складністю та типом (правда/неправда, кілька варіантів відповіді, коротка відповідь тощо).

Попри чудову продуктивність чат-бота, студенти впоралися краще, набравши загальний середній бал 76,7%, що в порівнянні з результатом ChatGPT — 47,4%. Він показав добре володіння знаннями AIS та аудиту, але гірше справився з податковими, фінансовими та управлінськими оцінками.

Що стосується типу запитання, ChatGPT показав кращий результат із запитаннями "правда/неправда" (68,7% правильних) і запитаннями з кількома варіантами відповіді (59,5%), але було важко із запитаннями з короткою відповіддю (від 28,7% до 39,1%). Загалом чат-боту було важче відповісти на питання вищого рівня. 

"Це не ідеально; ти не збираєшся використовувати його для всього. Спроба вчитися виключно за допомогою ChatGPT — це дурна справа", — сказала одна з учасниць експерименту студентка Джессіка Вуд.

Крім того, у ході експерименту дослідники помітили, що ChatGPT не завжди розпізнає, коли виконує математику, і допускає безглузді помилки, як-от додавання двох чисел у задачі на віднімання або неправильне ділення чисел; надає пояснення до своїх відповідей, навіть якщо вони неправильні; також іноді фальсифікує факти — авторів та джерел, запропонованих ним, може й не існувати

Нагадаємо, що в іспанській лікарні успішно завершили першу в світі повністю роботизовану операцію з пересадки легень. Медики заявляють, що операція може стати світовим стандартом.