🔎 Чи можна надій
…
🔎 Чи можна надійно визначити, що текст написаний ШІ?
Bloomberg поспілкувалися з засновником Pangram — сервісу для виявлення ШІ-тексту. Цікаве інтерв’ю.
Кілька цифр звідти:
— ~40% усіх сторінок в інтернеті вже написано ШІ (переважно SEO-сміття);
— 50%+ нових статей на Medium — ШІ-генерація;
— Reddit: 7% рік тому, вже понад 10% зараз;
— Хибнопозитивний результат у Pangram (людину прийняли за ШІ) — 1 на 10 000;
— Хибнонегативний (ШІ не впіймали) — близько 1%.
Кілька тез звідти:
🛑Модель вчиться на мільйонах прикладів і розпізнає патерни прийняття рішень: з сотень способів сформулювати речення — ШІ стабільно обирає одні й ті самі. Навіть якщо пропустити текст через переклади китайською, а потім івритом — модель все одно впізнає;
🛑Навіщо боти на Reddit? Виявляється, є стартапи, які продають компаніям «органічні згадки» через ШІ-акаунти. А оскільки моделі тренуються на Reddit — це ще й спосіб потрапити у відповіді ChatGPT чи Claude. Пошук «best nose hair trimmer» все частіше веде на Reddit, де вже чекають боти з рекомендаціями.
***
Сліз визнати, що скептицизм щодо «сірих зон» нікуди не дівся — тексти у співпраці людини та ШІ навряд чи можна якісно виявити. Але принаймні найлінивіше базове використання — відловлюється.
*детальне інтерв’ю на 50 хв тут.

