Първите умове зад машината: Основателите на изкуствения интелект

от

07.04.2025

144

Founders of artificial intelligence — Снимка: John Vincent Atanasoff, Alan Turing, Herbert Simon, Frank Rosenblatt, John McCarthy, Marvin Minsky, Joseph Weizenbaum /

Всичко започва с един прост въпрос „Могат ли машините да мислят?“

Преди още да е измислен терминът изкуствен интелект през 1955 г., има проблясъци за потенциала на ИИ във фолклора, художествената литература и ранните инженерни подвизи от 19-ти и началото на 20-ти век. Тези предшественици показват, че механични или програмируеми устройства могат един ден да възпроизвеждат задачи, изискващи човешки интелект.

Например още през 1726 г. „Пътешествията на Гъливер“ на Джонатан Суифт въвежда сатиричното понятие „Двигателят“, въображаема измишльотина, която генерира нови идеи чрез механично пренареждане на думите.

Докато Суифт се подиграва на учените педанти на своето време, неговата визия за алгоритмично генериране на текст предвещава какво ще направят езиковите модели на ИИ векове по-късно.

В началото на 1900 г. испански инженер и изобретател, Леонардо Торес Кеведо, създава автомат за игра на шах, наречен El Ajedrecista („Шахматистът“), който използва електромагнити, за да играе опростен ендшпил на цар и топ срещу цар.

Той може автономно да открива неразрешени ходове и надеждно да постига мат, ако бъде поставен в печеливша позиция. Въпреки че е механичен, El Ajedrecista показва как интелигентното инженерство може да симулира задача, изискваща логическо прозрение, основен градивен елемент за бъдещия AI.

До 40-те години на миналия век развитието на цифровите електронни компютри започва да променя нашите предположения за това какво могат да правят машините. Компютърът Atanasoff-Berry (ABC) на Джон Винсънт Атанасов и Клифърд Бери представя двоични изчисления и електронни схеми, критичен хардуер, който е основополагащ за бъдещите програми за ИИ.

През 1943 г. Уорън Маккълох и Уолтър Питс публикуват своята пионерска статия „Логическо смятане на идеите, присъщи на нервната дейност“, в която се предлага мозъкът да се счита за изчислителна мрежа.

Тази идея за математическо моделиране на неврони и синапси води до десетилетия изследвания в областта на невронните мрежи, област на ИИ, която в крайна сметка ще възроди полето през 21-ви век.

Алън Тюринг: Математическият гений, който попита: „Могат ли машините да мислят?“

В разговора за концептуалния произход на ИИ няма по-голяма фигура от Алън Тюринг. Роден през 1912 г., Тюринг е британски математик, чиято работа полага основите на съвременната компютърна наука.

През 1950 г. той публикува „Компютърни машини и интелигентност“, документ, който директно разглежда въпроса: „Могат ли машините да мислят?”.

Вместо да се потопи в метафизични дебати, Тюринг предлага оперативен тест, по-късно наречен „Тест на Тюринг“. В този тест човешки съдия участва в разговори на естествен език (чрез въведен текст) с невидим събеседник, който може да бъде или човек, или машина. Ако съдията не може надеждно да ги различи, тогава, според оперативната дефиниция на Тюринг, машината може да се счита за „интелигентна“.

Този подход е революционен по няколко причини. Първо, той заобикаля мътните дефиниции за „мислене“, като се фокусира върху представянето. Второ, той подчертава разбирането и генерирането на езика като ключови индикатори за интелигентност, пророчески избор предвид централната роля на обработката на естествен език в съвременния AI. И трето, тестът на Тюринг става популярен еталон в изследователските лаборатории и научната фантастика, оформяйки начина, по който хората извън тази област разбират ИИ.

Влиянието на Тюринг върху ИИ надхвърля теста. Неговата по-широка работа върху изчислимостта, формалните системи и криптографията поставят началото на мисленето на компютъра като „универсална машина“, която по принцип може да прави всичко, ако получи правилните инструкции.

Той умира през 1954 г., без да види официално приемането на термина „AI“, но следата му на терена остава незаличима.

Джон Маккарти: Човекът, който създава „изкуствен интелект“

Ако Тюринг е засадил концептуалните семена, Джон Маккарти им помага да покълнат. Математик и компютърен учен в Дартмутския колеж, Маккарти е главният организатор на Летния изследователски проект за изкуствен интелект в Дартмут през 1956 г. , семинар, който днес е признат за официалното родно място на ИИ като област.

През 1955 г. Маккарти, заедно с Марвин Мински (от Харвард), Клод Шанън (Bell Labs) и Натаниел Рочестър (IBM), представят предложение за лятна конференция в Dartmouth College. Това предложение за първи път използва термина „изкуствен интелект“. Амбицията е ясна, но и смела: съберете водещи мислители, за да видите дали могат да бъдат направени машини, които да имитират интелекта на човешко ниво.

Въпреки че конференцията не води до нито еден „Еврика!“ момент, тя привлича светли умове, които установяват първоначалната изследователска програма на ИИ.

Приносът на Маккарти не спира дотук. През плодотворната си кариера той разработва Lisp (1958), език за програмиране, подходящ за символна манипулация, който бързо се превръща в lingua franca (език за международна комуникация, използван за преодоляване на езикови бариери между хора, които говорят различни езици) в изследванията на ИИ в продължение на десетилетия.

Концепциите за споделяне на времето, които оказват влияние върху начина, по който множество потребители могат да взаимодействат с компютри едновременно, насърчават среда, която ускорява експериментите с ИИ.

Advice Taker (1959), програмна концепция, която използва формална логика за съхраняване и манипулиране на знания, полагайки основите на системи за разсъждение с ИИ.

Маккарти вярва, че компютрите трябва да разсъждават за света, използвайки формална логика и основани на знанието методи, подход, който често се противопоставя на тези, които предпочитат по-биологичен, вдъхновен от мозъка път.

Независимо от подхода, името на Маккарти завинаги ще бъде свързано с официалното начало на ИИ като изследователска област.

Марвин Мински: Свързване на психологията и изчисленията

Марвин Мински, друг ключов организатор на семинара в Дартмут, е професор в MIT, който интегрира прозрения от психологията, математиката и компютърните науки.

През 1951 г., заедно с Дийн Едмъндс, Мински създава Стохастичния невронно-аналогов подсилващ калкулатор (SNARC), който се счита за първата машина за изкуствена невронна мрежа.

Това е устройство, което се опитва да подражава на начина, по който плъх се научава да се движи в лабиринт, използвайки 3000 вакуумни тръби и синаптични тежести, които могат да се регулират чрез симулирани награди и наказания.

Ранната работа на Мински показва дълбоко любопитство към биологично вдъхновеното обучение. Въпреки това, с напредването на полето, той става яростен критик на простите персептронни модели (със Сиймор Пейпърт), посочвайки основните им ограничения при справянето с по-сложни задачи.

Тази критика е документирана в книгата от 1969 г. „Perceptrons“, която ефективно потушаваа изследователския ентусиазъм за невронните мрежи през 70-те години на миналия век – понякога наричана AI зима.

И все пак Марвин Мински не е просто критик. По-широката му работа оформя начина, по който изследователите мислят за интелигентността и когнитивната архитектура. Той се застъпва за теорията за обществото на ума, предполагайки, че интелигентността възниква от колектив от специализирани агенти, работещи паралелно.

Той също така помага за основаването на Лабораторията за изкуствен интелект на Масачузетския технологичен институт (сега Лаборатория за компютърни науки и изкуствен интелект, CSAIL), откъдето започват много новаторски изследователи на ИИ.

Напрежението между биологично вдъхновените невронни мрежи и символичния AI е в основата на много дебати през следващите десетилетия. Влиянието на Мински обхваща и двете страни, напомняйки на общността, че символизирането и манипулирането на знанието е жизненоважно, дори ако новата вълна от невронни мрежи е обещаваща.

Хърбърт А. Саймън и Алън Нюел: Пионерски машини за решаване на проблеми

Докато Маккарти и Мински дефинират ИИ от гледна точка на логиката и изчисленията, Хърбърт А. Саймън (политолог и по-късно Нобелов лауреат по икономика) и Алън Нюел (математик и компютърен учен) подхождата към ИИ с фокус върху решаването на проблеми и когнитивните процеси.

Тяхното сътрудничество в университета Карнеги Мелън води до две от най-ранните програми на ИИ.

Logic Theorist (1956), често считана за първата работеща AI програма, доказва 38 от първите 52 теореми в Principia Mathematica. General Problem Solver (1957), продължение, което се опитва да имитира човешките стратегии за решаване на проблеми в по-широк смисъл, моделирайки задачи като криптаритметика и пъзела на Ханойската кула.

Саймън и Нюел вярват, че могат да програмират компютрите да правят същото, като идентифицират как хората подхождат към решаването на проблеми. Тяхната интердисциплинарна позиция комбинира когнитивна психология, компютърни науки и организационна теория, за да изследва как знанието може да бъде представено, търсено и приложено.

Те въвеждат концепции за евристика, практически правила или стратегии, позволявайки на машината да изрязва големи пространства за търсене и да намира решения по-ефективно. С целия оптимизъм на онази епоха, Саймън предсказва, че скоро машините могат да вършат „всяка работа, която човек може да върши“.

Въпреки че тази времева линия е твърде смела, неговото убеждение подчертава вярата му в обединяването на изследванията на човешкото познание и изчислителното моделиране.

Артър Самуел: Обучава машините да учат

Фразата машинно обучение се използва толкова често днес, че може да изглежда като модерно изобретение. Истината е, че изследователят от IBM, Артър Самуел, го популяризира за първи път в края на 50-те години.

Работата на Самуел по създаването на програма за игра на шашки, която се учи от грешките си, е новаторска. Той разработва програмата за шашки (1959), като играе хиляди игри срещу себе си; тя се самоусъвършенства, като в крайна сметка надмина нивото на умение на Самуел в пуловете.

Той също така работи върху концепции за обучение с подсилване. Неговият подход включва функция за точкуване, която оценява позициите на борда, коригирайки тези оценки, когато програмата печели или губи.

Програмата на Samuel’s Checkers е не просто новост, а ярка демонстрация, че компютрите могат да развиват своята производителност с течение на времето чрез опит, предвещавайки основен принцип на ИИ. Днес тази техника отеква във всичко – от системи за препоръки до модерно обучение с дълбоко укрепване, приложено в сложни среди.

Франк Розенблат: Перцептронът предизвиква революция в невронните мрежи

Докато Мински изтъква ограниченията на простите невронни архитектури, Франк Розенблат въвежда Перцептрон през 1957 г.

Перцептронът е по същество двуслойна мрежа с регулируеми тегла, която може да се научи да класифицира входове, когато се обучава върху обозначени примери. Визията на Розенблат е, че Перцептронът ще се развие в система, способна да изпълнява по-сложни задачи за възприятие, като например разпознаване на изображения.

През 1958 г. Розенблат осигурява финансиране от американския флот за изграждане на хардуерни реализации на Перцептронът. Ранните експерименти показват, че персептроните могат да се научат да разпознават определени букви от азбуката, разпалвайки вълнението, че машините скоро могат да съперничат на човешката визуална дискриминация.

Въпреки това, Перцептронът е ограничен до решаване на линейно разделими проблеми, което подтиква Мински и Пейпърт към критиката от 1969 г. Полето на невронните мрежи ще стои в сянката на тези критики в продължение на почти две десетилетия.

И все пак, Перцептронът на Розенблат е критичен крайъгълен камък, ранно въплъщение на идеята, че компютрите могат да научават представяния директно от данни.

Тази концепция се появява отново мощно в края на 80-те години с изобретяването и популяризирането на обратното разпространение и в крайна сметка води до вълната на задълбочено обучение десетилетия по-късно.

Джоузеф Вайзенбаум: Ранният създател на чатбот

Един от пионерите в обработката на естествен език е Джоузеф Вайзенбаум, който разработва известната програма ELIZA в средата на 60-те години. ELIZA имитира човешки разговор, като отговаря на въведените данни чрез прости скриптове за съвпадение на шаблони.

Проектирана отчасти да критикува повърхностната комуникация между човек и компютър, ELIZA неволно изненадва Вайзенбаум, когато потребителите приписват истински емоции и съпричастност на програмата.

ELIZA е важен крайъгълен камък, който илюстрира възможностите и етичните сложности на проектирането на машини, които участват в привидно човешки диалог.

Вайзенбаум също става важен критик на прекалено оптимистичните възгледи за ИИ, предупреждавайки, че обществото трябва да остане наясно с моралните последици от изграждането на такива системи.

От вълнение до зими: Циклите на ранния ИИ

През 60-те и 70-те години на миналия век се наблюдава първата златна епоха на ИИ: изследователи от Масачузетския технологичен институт, Карнеги Мелън, Станфорд и другаде се занимават с всичко – от роботиката (роботът Shakey на SRI) до експертните системи (като DENDRAL и MYCIN на Станфорд).

Оптимизмът се повишава, стимулиран от стабилното финансиране и заглавията, обещаващи, че машините с интелект на човешко ниво са точно зад ъгъла. И все пак две зими за ИИ слагат край на купона.

През 70-те години на миналия век, през AI Winter, след доклада Lighthill в Обединеното кралство (1973) и общото разочарование от недостатъчно изпълнените обещания, финансирането е ограничено в Съединените щати и Великобритания. Напредъкът в символичния ИИ се забавя, особено след като изследователските лаборатории изместват фокуса си или затварят.

Зимата на AI в края на 80-те години идва след бума на експертните системи в началото на 80-те години. Прекомерната реклама отново води до разочарование и намалено финансиране. Критици като Роджър Шанк и Марвин Мински предупреждават, че идва нов срив в очакванията, и са прави.

Въпреки тези неуспехи, семената, засадени от Тюринг, Маккарти, Мински, Нюел, Саймън, Самуел и Розенблат, продължават да растат бавно.

Ключови пробиви в обратното разпространение (особено докладът на Дейвид Румелхарт, Джефри Хинтън и Роналд Уилямс от 1986 г.) и появата на по-мощен хардуер поставят началото на ренесанса в невронните мрежи в края на 90-те и началото на 2000-те години.

Поглед към по-късните новатори

Въпреки че първите пионери циментират концептуалната рамка на ИИ, траекторията на областта през 80-те, 90-те и началото на 2000-те години извежда нови светила на преден план, макар и с различен фокус. Джудея Пърл представя байесови мрежи, внасяйки моделиране на несигурността в системите с изкуствен интелект. Джефри Хинтън, Ян Лекюн и Йошуа Бенджио съживяват невронните мрежи чрез техники за дълбоко обучение.

Групата на Хинтън от университета в Торонто удивява света през 2012 г., като печели състезанието ImageNet с AlexNet, дълбока конволюционна невронна мрежа, която смазва традиционните методи за разпознаване на изображения. Тази история на успеха отбелязва неудържимия възход на дълбокото обучение.

От търговска гледна точка, Deep Blue на IBM побеждава гросмайстора по шах Гари Каспаров през 1997 г., доказвайки, че със специализиран хардуер и усъвършенствани алгоритми за търсене, машините могат да надделеят дори и с най-талантливия човек в любима стратегическа игра.

През 2011 г. IBM Watson, компютърна система за изкуствен интелект, спечели в телевизионното шоу Jeopardy!, побеждавайки двама от най-успешните играчи в историята на шоуто, доказвайки скока в разбирането на естествения език.

Бързият напредък продължава, когато AlphaGo (DeepMind) побеждава световния шампион в древната игра Go (2016).

Усъвършенствани езикови модели като GPT-3 (2020) на OpenAI демонстрират удивително генериране на текст и способности за бързо обучение. ИИ се разпространява в ежедневни приложения като гласови асистенти, системи за препоръки и автоматизирано създаване на съдържание.

Тези пробиви проследяват произхода си до фундаменталните въпроси и методологии, въведени от бащите-основатели. Въпреки че няма да се гмурнем надълбоко в тези съвременни постижения тук, важно е да осъзнаем, че всички тези чудеса на ИИ от 21-ви век са изградени върху основата, изградена от Тюринг, Маккарти, Мински, Саймън, Нюел, Самуел, Розенблат и техните колеги.

Защо ранните новатори на ИИ имат значение?

Човек може да се чуди защо все още е важно да се подчертават тези ранни разработки, като се има предвид колко радикално се трансформира AI с масивни изчислителни клъстери, големи данни и рамки за дълбоко обучение. Отговорът се крие в установените от тях принципи.

Прагматичният подход на Тюринг повлиява на начина, по който оценяваме ИИ днес, от чатботове до системи за разпознаване на реч. Акцентът на Маккарти върху формалната логика и представянето на знания остава централен в много подполета на ИИ, като автоматизирано разсъждение, планиране и графики на знания. Визията за невронни мрежи от МакКълоч, Питс и Розенбла до съвременното дълбоко обучение е изградена върху идеята, че можем да моделираме изчислително аспекти на човешкия мозък.

Акцентът на Нюел и Саймън върху търсенето и евристиката създава шаблон за алгоритми, които бързо преминават през сложни пространства за решения, приложими във всичко – от планиране на маршрут до решаване на пъзели. Програмата за проверка на Артър Самуел възвестява възхода на подходи, управлявани от данни. Днес повечето истории за успех на ИИ се основават на модели на обучение от масивни набори от данни.

Също така е поучително, че много ранни противоречия все още отекват днес, особено дебатът за символичния ИИ срещу невронни мрежи или въпроса как най-добре да се представя и манипулира знанието.

Като оставим настрана технологичните усъвършенствания, основните напрежения остават динамична сила, стимулираща по-нататъшни иновации.

Историята на AI не започва с дълбоките невронни мрежи от 2010 г. Започва със смели въпроси и малки прототипи, създадени от хора, които се осмеляват да се чудят дали машините могат да подражават на забележителните способности на човешкия ум.

Тези мислители пионери не просто изграждат нови технологии, но преформулираха начина, по който концептуализираме интелигентността, познанието и ученето. Въпреки че изкуственият интелект преминава през периоди на висок оптимизъм и студени зими, основните прозрения на ранните иноватори се запазват.

Докато гледаме напред към по-нататъшен напредък, автономни превозни средства, сложна мултимодална креативност и евентуално суперинтелигентни системи, трябва да помним, че дори и най-сложната архитектура за дълбоко обучение проследява произхода си обратно към експерименти с вакуумни тръби, аналогови „неврони “ и един основополагащ въпрос.

Могат ли машините да мислят?

Сегашната слава на областта се гради върху блясъка, постоянството и далновидността на онези, които са прозрели отвъд механичните ограничения на своето време и са посочили пътя към една ера, в която интелигентните машини са едновременно реалност и предизвикателство, което изисква нашето непрекъснато етично и научно изследване.

Източник: InterestingEngineering

Валута	За единица	Лева (BGN)	За 1 лев
EUR	1	1.95583	0.511292
USD	1	1.66355	0.601124
TRY	100	3.87564	25.8022
RUB
GBP	1	2.24498	0.445438
CAD	1	1.2145	0.823384