Повстання машин на Землі точно не буде: ChatGPT "завалив" іспит з бухгалтерського обліку

Повстання машин на Землі точно не буде: ChatGPT "завалив" іспит з бухгалтерського обліку
Штучний інтелект у роботизованому вигляді. Фото: freepik.com

Через постійні дискусії на тему підміни студентських та учнівських робіт на праці ChatGPT, вчені вирішили провести експеримент, наскільки чат-бот досконалий в різних галузях. Тому ChatGPT протестували з іспиту бухгалтерського обліку.

Про це повідомляє Portaltele.

Читайте також:

ChatGPT "завалив" іспит з бухгалтерського обліку

Вчені з Університету Бригама Янга та 186 інших установ цікавилися ефективністю технології OpenAI на іспитах з бухгалтерського обліку. Тому вони протестували оригінальну модель ChatGPT. Дослідники заявили, що хоча ChatGPT все ще потребує вдосконалення у сфері бухгалтерського обліку, він має потенціал революціонізувати спосіб навчання та навчання на краще.

Дослідники залучили студентів з усього світу, надавши 25 181 запитання до іспиту з бухгалтерського обліку. Питання стосувалися інформаційних систем бухгалтерського обліку (АІС), аудиту, фінансового обліку, управлінського обліку та оподаткування, і були різними за складністю та типом (правда/неправда, кілька варіантів відповіді, коротка відповідь тощо).

Попри чудову продуктивність чат-бота, студенти впоралися краще, набравши загальний середній бал 76,7%, що в порівнянні з результатом ChatGPT — 47,4%. Він показав добре володіння знаннями AIS та аудиту, але гірше справився з податковими, фінансовими та управлінськими оцінками.

Що стосується типу запитання, ChatGPT показав кращий результат із запитаннями "правда/неправда" (68,7% правильних) і запитаннями з кількома варіантами відповіді (59,5%), але було важко із запитаннями з короткою відповіддю (від 28,7% до 39,1%). Загалом чат-боту було важче відповісти на питання вищого рівня. 

"Це не ідеально; ти не збираєшся використовувати його для всього. Спроба вчитися виключно за допомогою ChatGPT — це дурна справа", — сказала одна з учасниць експерименту студентка Джессіка Вуд.

Крім того, у ході експерименту дослідники помітили, що ChatGPT не завжди розпізнає, коли виконує математику, і допускає безглузді помилки, як-от додавання двох чисел у задачі на віднімання або неправильне ділення чисел; надає пояснення до своїх відповідей, навіть якщо вони неправильні; також іноді фальсифікує факти — авторів та джерел, запропонованих ним, може й не існувати

Нагадаємо, що в іспанській лікарні успішно завершили першу в світі повністю роботизовану операцію з пересадки легень. Медики заявляють, що операція може стати світовим стандартом.

Актуальне по темі

LEVCHYK SPECTRUMHUB LEVCHYK SPECTRUMHUB LEVCHYK SPECTRUMHUB

Допоможіть дітям
із розладами спектру аутизму

адаптуватись до нових умов життя під час війни

Допомогти зараз