AI системата разкрива прозрения за ранното усвояване на езика.
Големите езикови модели като GPT на OpenAI, който захранват неговия чатбот ChatGPT, са обучени на зетабайти и йотабайти данни, така че да могат да разговарят с хората по начин, който е междуличностен и разговорен.
Но малките деца не могат да поддържат разговор с ChatGPT. Само си представете дете, което казва „бла-бла-блу“, а ChatGPT отговаря с „Изглежда, че сте въвели произволна или безсмислена фраза“. Това не би било много полезно.
За да проверят дали AI може да научи думи и идеи, които едно дете среща всеки ден, изследователи от Нюйоркския университет решават, че най-добрият път напред би бил да записват какво казва и прави малкото дете през целия ден и създават AI модел, който да се учи от него.
20-месечен експеримент
Проучването има размер на извадката от един. Шестмесечно дете, на което изследователите монтират видео с камера, за да записват движенията и думите му.
Експериментът продължава до момента, в който детето навършва две години, точно около възрастовия диапазон, когато повечето деца започват да произнасят първите си думи.
Камерата не е монтирана на главата на детето 24/7. Изследователите записват около един процент от часовете на будност на детето, за предпочитане по време на сесии за игра, време за хранене или сесии за четене, на полуседмична база, което е достатъчно за истинско езиково обучение.
Те натрупват 60 часа кадри, които съдържаха приблизително 250 000 думи, съобщени от детето, много от които многократно.
Улавяне на говора на малко дете
След като преглеждат данните, събрани от мултимодалния AI, изследователите забелязват, че техният модел е в състояние да учи думи в ежедневна среда.
AI успява да картографира думи с визуалните препратки, които е видял чрез камерата на главата на детето, или думите на детето към обектите в света, когато са били посочени.
„Нашите резултати демонстрират как скорошният напредък в алгоритмите, съчетан с натуралистичния опит на едно дете, има потенциала да промени нашето разбиране за ранното усвояване на език и концепции“, казва Уай Кийн Вонг, изследовател в Центъра за наука за данни на Нюйоркския университет и първият автор на статията.
Но AI моделът не е напълно перфектен. Аномалия, която изследователите забелязват, е, че не е в състояние да определи правилно някой неща. Например, той обърква думата „ръка“ с „пясък“.
„Като използваме AI модели за изучаване на реалния проблем с изучаването на езици, пред който са изправени децата, можем да отговорим на класическите дебати за това какви предпоставки са необходими на децата, за да научат думи – дали имат нужда от специфични за езика пристрастия, вродени знания или просто асоциативно обучение, за да продължат“, казва Брендън Лейк, асистент в Центъра за наука за данни и Департамента по психология на Нюйоркския университет и старши автор на статията.
„Изглежда, че само с учене можем да постигнем повече, отколкото обикновено се смята“, добавя той.
Резултатите от този експеримент дават представа за това как малките деца учат нов език и също какво би означавало да променим начина, по който големите езикови модели обработват данни, като го направят по-детински. Ще направи ли това процеса потенциално по-ефективен?
Резултатите от изследването са публикувани в списание Science.
Източник: InterestingEngineering

































