Статьи
Скоро мы перестанем программировать компьютеры. Мы будем обучать их как собак.
Но вот в чем дело: с машинным обучением инженер никогда в точности не знает как компьютер выполняет свои задачи. Операции нейронных сетей в значительной степени непрозрачны и непостижимы. Другими словами, это и есть черный ящик. И поскольку эти черные ящики берут на себя ответственность за все большее и большее количество наших ежедневных цифровых задач, они не только изменят наше отношение к технологиям, они изменят то, что мы думаем о себе, нашем мире и нашем месте в нем.
Джейсон Таня из Wired описал то, куда нас заведет машинное обучение. Блог The Idealist, занимающийся переводами интересной периодики, сделал русский вариант статьи. С разрешения авторов мы приводим его на Apptractor.ru.
До изобретения компьютера большинство психологов-экспериментаторов думали, что человеческий мозг — это непостижимый черный ящик. Вы можете анализировать поведение субъекта — позвонить в звонок и наблюдать, как у собаки выделится слюна — но мысли, воспоминания, эмоции? Эти вещи был непонятными и непостижимыми, вне досягаемости науки. Таким образом, бихевиористы, как они сами себя называли, ограничили свою работу на изучении стимула и реакции, ответной реакции и подкреплении, звонках и слюне. Они оставили попытки понять внутреннюю деятельность разума. Они господствовали в этом направлении в течение четырех десятилетий.
Затем в середине 1950-х группа мятежных психологов, лингвистов, информационных теоретиков и ранних исследователей искусственного интеллекта выступили с иной концепцией разума. Они утверждали, что люди представляли собой не просто собрание условных рефлексов. Они поглощали информацию, обрабатывали ее и затем действовали в соответствии с ней. У них есть системы для написания, хранения и вызова в памяти воспоминаний. Они действовали с помощью логики и формального синтаксиса. Мозг — совсем не черный ящик. Он больше похож на компьютер.
Так называемая когнитивная революция началась с малого, но по мере того, как компьютеры стали стандартным оборудованием в лабораториях психологов по всей стране, она завоевала широкое признание. К концу 1970-х годов когнитивная психология свергла бихевиоризм, и с новым режимом пришел совершенно новый язык для разговора о психической жизни. Психологи начали описывать мысли как программы, обычные люди говорили о способности запоминать и хранить факты, как о биологических жестких дисках, и бизнес-гуру беспокоились об ограничениях психической пропускной способности и вычислительной мощности на современном рабочем месте.
Эта история повторяется снова и снова. По мере того, как цифровая революция проникает в каждую часть наших жизней, она также распространяется на наш язык и наши глубокие основные теории о том, как устроен мир. Технологии всегда это делают. В эпоху Просвещения Ньютон и Декарт вдохновили людей думать о Вселенной как о сложных часах. В индустриальную эпоху это были поршневые машины (идея психодинамики Фрейда была позаимствована из термодинамики паровых двигателей). Сейчас это компьютер, который, если подумать об этом, является принципиально новой идеей. Потому что если мир — это компьютер, значит его можно запрограммировать.
Код логичен. Код можно взломать. Код — это судьба. Это основные принципы (и самореализующиеся пророчества) жизни в цифровой век. Перефразируя венчурного капиталиста Марка Андрессена: по мере того, как программное обеспечение поедает мир, мы окружили себя машинами, которые конвертируют наши действия, мысли и эмоции в данные — сырье, которым манипулируют армии владеющих кодом инженеров. Мы пришли к тому, что видим саму жизнь как что-то управляемое рядом инструкций, которые можно обнаружить, использовать в своих интересах, оптимизировать, может быть даже переписать. Компании используют код для понимания наших самых близких связей. Основатель Facebook Марк Цукерберг зашел так далеко, что предположил, будто существует «фундаментальный математический закон, лежащий в основе отношений между людьми, который определяет баланс того, о ком и о чем мы заботимся больше всего». В 2013 году Крейг Вентер объявил, что через десять лет после расшифровки генома человека он начал писать код, который позволит ему создать синтетические организмы. «Становится ясно, что все живые клетки, о которых мы знаем, на этой планете являются биологическими машинами, управляемыми ПО на основе ДНК» — заявил он. Даже литература по самосовершенствованию настаивает на том, что вы можете взломать свой исходный код, перепрограммировать вашу личную жизнь, ваш режим сна и привычки.
В современном мире способность писать код стала не только желанным умением, но и языком, который предоставляет статус инсайдера тем, кто говорит на нем. У них есть доступ к тому, что в более механический век назвали бы уровнями власти. «Если вы контролируете код, вы контролируете мир», — написал футурист Марк Гудман (в Bloomberg Businessweek Пол Форд был чуть более осмотрительным: «Если кодеры и не правят миром, они управляют вещами, которые правят миром»).
Но независимо от того, нравится ли вам такое положение вещей или вы его ненавидите, являетесь ли членом этой элиты кодеров или тем, кто едва чувствует себя компетентным в процессе настройки своего телефона — не привыкайте к этому. Сейчас наши машины начинают разговаривать на другом языке, таком, что даже лучшие кодеры не всегда его понимают.
За последние несколько лет крупнейшие технологические компании в Кремниевой Долине активно продвигают подход в вычислениях под названием машинное обучение. В традиционном программировании инженер пишет точные и поэтапные инструкции для компьютера. С машинным обучением программисты не зашифровывают инструкции в форме кода для компьютеров. Они их тренируют. Если вы хотите научить нейронную сеть распознавать кошку, например, вы не говорите ей искать усы, уши, шерсть и глаза. Вы просто показываете ей тысячи и тысячи фотографий кошек, и, со временем, она понимает. Если компьютер продолжает принимать лис за кошек, вы не переписываете код. Вы просто продолжаете его тренировать.
Этот подход не нов и существует десятилетиями, но недавно он стал чрезвычайно мощным, отчасти благодаря развитию глубоких нейронных сетей, массивно распространенным вычислительным системам, которые имитируют многоуровневые соединения нейронов в мозге. И уже, понимаете вы это или нет, машинное обучение снабжает большие участки нашей онлайн-активности. Facebook использует это для определения того, какие истории показывать в вашей новостной ленте, и Google Photos использует это для идентификации лиц. Машинное обучение вшито в Microsoft Skype Translator, который переводит речь на разные языки в режиме реального времени. Самоуправляемые автомобили используют машинное обучение, чтобы избегать аварий. Даже поисковая система Google, которая на протяжении многих лет основывалась на правилах, написанных человеком, стала полагаться на эти глубокие, нейронные сети. В феврале компания заменила своего бессменного главу поискового подразделения экспертом машинного обучения Джоном Гианнандреа, и инициировала крупную программу по переквалификации своих инженеров под новую специфику. «Выстраивая обучающиеся системы» — Гианнандреа заявил журналистам этой осенью – «нам не нужно будет больше писать эти правила».
Но вот в чем дело: с машинным обучением инженер никогда в точности не знает как компьютер выполняет свои задачи. Операции нейронных сетей в значительной степени непрозрачны и непостижимы. Другими словами, это и есть черный ящик. И поскольку эти черные ящики берут на себя ответственность за все большее и большее количество наших ежедневных цифровых задач, они не только изменят наше отношение к технологиям, они изменят то, что мы думаем о себе, нашем мире и нашем месте в нем.
Если в старом мире программисты были подобны богам, издающим законы, которые управляли компьютерными системами, сейчас они как родители или кинологи. Любой родитель или владелец собаки может вам сказать, что это куда более загадочные отношения, в которых можно себя обнаружить.
Энди Рубин — заядлый ремесленник и кодер. Один из создателей операционной системы Android, Рубин известен в Кремниевой Долине пристрастием окружать свои рабочее место и дом роботами. Он сам их программирует. «Я попал в компьютерные науки когда был еще совсем юн, и полюбил это потому, что мог раствориться в компьютерном мире. Это был чистый лист, пустой холст и я мог создать что-либо с нуля», — говорит он. «Это дало мне полный контроль над миром, в который я играл в течение многих, многих лет».
Сейчас он говорит что мир приближается к своему концу. Рубин очень взволнован развитием машинного обучения — его новая компания Playground Global инвестирует в стартапы в области машинного обучения и позиционирует себя как лидера в сфере распространения умных устройств — но это также печалит его немного, потому что машинное обучение меняет то, что значит быть программистом.
«Люди пишут программы не линейно», — говорит Рубин. «После того, как нейронная сеть научится распознавать речь, программист не сможет войти внутрь и посмотреть как это случилось. Это также, как ваш мозг. Вы не можете отрезать себе голову и посмотреть, что вы думаете». Когда программисты погружаются в глубокую нейронную сеть, они видят океан математики: массивный, многоуровневый набор вычислительных проблем, которые, постоянно делая выводы из отношений между миллиардами точек данных, генерируют догадки о мире.
Искусственный интеллект не должен был работать таким образом. Еще несколько лет назад главные исследователи искусственного интеллекта предположили, что для того, чтобы создать интеллект мы просто должны были внедрить в машину правильную логику. Написать достаточно правил и в конце концов мы бы создали систему, достаточно сложную, чтобы понять мир. Они в значительной степени игнорировали, даже поносили ранних сторонников машинного обучения, которые высказывались в пользу насыщения машин данными, пока они не достигнут своих собственных выводов. Годами компьютеры были недостаточно мощными, чтобы подтвердить достоинства одного из двух подходов, поэтому спор стал философским. «Большинство этих споров было основано на фиксированных взглядах о том, как должен быть организован мир и как работал мозг», — говорит бывший профессор Стэнфорда по искусственному интеллекту и создатель самоуправляемого автомобиля Google Себастьян Трун. «В нейронных сетях не было символов или правил, только числа. Это отчуждало от них многих людей».
Последствия неразборчивости машинного языка не только философские. За последние два десятилетия изучение кода было одним из самых верных путей к надежному трудоустройству — факт, который сложно отрицать, учитывая как много родителей отдавали своих детей в академии программирования, которые они посещали после школы. Но мир, который работает за счет нейронных сетей с глубоким машинным обучением требует иной рабочей силы. Аналитики уже начали волноваться о том, какое влияние окажет искусственный интеллект на рынок труда, так как машины превращают старые навыки в не имеющие значения. Программисты могут вскоре почувствовать каково это на собственной шкуре.
«Этим утром у меня был разговор на эту тему» — сказал IT-гуру Тим О’Райлли, когда я спросил его об этом изменении. «Я указывал на то, как будут различаться работы в сфере программирования, когда все эти дети со STEM-образованием вырастут». Традиционное кодирование не исчезнет полностью, на самом деле О’Райлли предсказывает, что мы по-прежнему будем нуждаться в кодерах в течение длительного времени, но вероятно в гораздо меньшем количестве, чем сейчас. Написание кода превратится в метаскилл, способ создания, который CEO Института искусственного интеллекта Аллена Орен Этциони называет «строительным лесом» в пределах которого машинное обучение сможет действовать. Также как ньютоновская физика не была устранена с помощью квантовой механики, код останется мощным инструментом, предназначенным для исследования мира. Но когда дело дойдет до определенных функций, машинное обучение будет делать большую часть работы за нас.
Конечно людям по-прежнему нужно будет тренировать эти системы. Но на сегодня, по крайней мере, это редкое умение. Эта работа требует как исключительных познаний в математике, так и интуицию педагогического обмена любезностями. «Это почти как вид искусства, позволяющий получить лучшее из этих систем» — сказал Дэмис Хассаби, который стоит во главе команды Google DeepMind Al. «Есть всего несколько сотен людей в мире, которые могут делать это действительно хорошо». Но даже этого небольшого числа было достаточно, чтобы преобразовать индустрию высоких технологий всего за пару лет.
Какими бы не были профессиональные последствия этого сдвига, культурные последствия будут даже больше. Если расцвет программного обеспечения, написанного человеком, приведет к культу инженера и пониманию, что человеческий опыт в конечном счете может быть уменьшен до серий понятных инструкций, машинное обучение запускает маятник в обратном направлении. Код, на котором работает вселенная, может пренебрегать человеческим анализом. Например, уже сейчас Google стал объектом антимонопольного расследования в Европе, в рамках которого компанию обвиняют в оказании чрезмерного влияния на поисковые результаты. Подобные обвинения будет сложно доказать, когда даже сами инженеры компании не могут точно сказать как именно эти поисковые алгоритмы работают изначально.
Такой взрыв неопределенности назревал давно. Не является новостью то, что даже простые алгоритмы могут создать непредсказуемое поведение, что отсылает нас к теории хаоса и генераторам случайных чисел. За последние несколько лет по мере того, как росли и сплетались сети, а их функции становились все более сложными, код стал все больше напоминать что-то вроде инопланетной силы, призраков в машинах, все более неуловимых и неуправляемых. Самолеты, приземляющиеся без причин. Кажущиеся неминуемыми вспышки аварий на фондовом рынке. Веерные отключения.
Эти силы побудили технолога Данни Гиллиса объявить конец эпохи Просвещения — нашей процветающей веками веры в логику, детерминизм и контроль над природой. Гиллис говорит, что мы движемся к тому, что он называет эпохой Запутанности. «Так как наши технологические и институциональные творения стали более сложными, наше отношение к ним изменилось» — написал он в «Журнале Дизайна и Науки». «Вместо того, чтобы быть хозяевами своих созданий, мы научились с ними торговаться, уговаривать и направлять их на достижение наших целей. Мы построили свои собственные джунгли, и они живут своей собственной жизнью». Развитие машинного обучения является заключительным, и возможно последним шагом в данном путешествии.
Все это может быть достаточно пугающе. В конце концов, кодирование, по крайней мере, являлось такой вещью, научиться которой в тренировочном лагере мог любой желающий. Кодеры были по крайней мере людьми. Сейчас технологическая элита даже меньше, и ее власть над своими творениями ослабла и стала косвенной. Компании, которые создали все это, уже сейчас столкнулись с трудностями по управлению поведением своих творений. Прошлым летом Google поспешил извиниться, когда его система распознавания лиц стала помечать изображения темнокожих людей как горилл. Компания попыталась решить эту проблему тупым запретом системе определять что-либо как горилл, в том числе и самих горилл.
Под определенным углом все это говорит о том, что наступает время, когда мы утратим контроль за нашими машинами. «Можно представить, что такие технологии перехитрят финансовые рынки, опередят человеческие исследования, превзойдут человеческих лидеров и создадут оружие, которое мы даже не сможем понять» — написал Стивен Хокинг, чьему мнению среди прочих вторят Элон Маск и Билл Гейтс. «В то время как в краткосрочной перспективе влияние искусственного интеллекта зависит от того, кто его контролирует, в долгосрочной перспективе все зависит от того, можно ли его вообще будет контролировать».
Но не будьте слишком напуганы — это не восход Скайнета. Мы просто изучаем правила работы с новой технологией. Уже сейчас инженеры работают над визуализацией того, что происходит «в голове» обучающих систем. Но даже если мы никогда полностью не поймем, как мыслят эти новые машины, это совсем не означает, что мы бессильны перед ними. В будущем мы не будем заботиться так сильно об основных источниках их поведения, мы научимся концентрироваться на их поведении как таковом. Код станет менее важен по отношению к данным, которые мы используем для их тренировки.
Все это кажется вам знакомым, наверное, потому, что напоминает старый добрый бихевиоризм 20-го века. На самом деле процесс обучения машины часто сравнивают с великими поведенческими экспериментами начала 1900-х. Павлов, исследуя условные рефлексы, вызывал у своей собаки слюноотделение не через глубокое понимание голода, а просто повторяя последовательность событий снова и снова. Он предоставлял данные снова и снова, пока код сам себя не воспроизвел. И можете говорить все, что угодно о бихевиористах, но они знали, как контролировать свои объекты.
Трун говорил, что в долгосрочной перспективе машинное обучение будет иметь демократизирующее влияние. Точно также как вам не нужно знать HTML для того, чтобы создать сайт в наши дни, со временем вам не понадобится докторская степень для того, чтобы задействовать невероятную мощь глубокого обучения. Программирование перестанет быть исключительной областью обученных кодеров, которые выучили несколько таинственных языков. Оно будет доступно каждому, кто хотя бы однажды научил собаку перекатываться. «Для меня это самая крутая вещь в программировании, потому что теперь любой сможет программировать» — говорит Трун.
В истории компьютеров мы часто сталкиваемся с вывернутым наизнанку понимаем того, как машины работают. Сначала мы пишем код, затем машина его выражает. Такое мировоззрение предполагает пластичность, но также предлагает нечто вроде основанного на правилах детерминизма, чувства, что вещи являются продуктом лежащих в их основе инструкций. Машинное обучение предлагает обратное, где код не просто определяет поведение, но поведение также определяет код. Машины являются продуктами нашего мира.
В конечном счете мы будем ценить как силу написанного кода, так и алгоритмов машинного обучения, которые будут его настраивать — обмен любезностями в возникновении и дизайне. Вполне возможно, что биологи уже начали работать в этом направлении. Технологии генной инженерии, такие, как Crispr, дают им возможность манипулировать кодом, которым орудовали традиционные программисты. Но открытия в области эпигенетики предполагают, что генетический материал — на самом деле не неизменный набор инструкций, а скорее динамический набор переключателей, которые регулируются в зависимости от условий и опыта своего хозяина. Наш код не существует отдельно от физического мира, он находится под глубоким влиянием мира, который его трансформирует. Вентер может верить, что клетки — это машины, управляемые ПО на основании ДНК, но эпигенетик Стив Коул предлагает другую формулировку: «Клетка — эта машина для превращения опыта в биологию».
И сейчас, спустя 80 лет после того, как Алан Тьюринг впервые нарисовал эскиз своей вычислительной машины, компьютеры становятся устройствами по превращению опыта в технологии. Десятилетиями мы искали секретный код, который мог объяснить, и, с некоторыми изменениями, оптимизировать наш мировой опыт. Но наши машины будут работать по такому принципу недолго, и наш мир на самом деле никогда так не работал. У нас будут более сложные, но в конечном итоге более плодотворные отношения с технологиями. Мы пройдем путь от управления нашими устройствами до их воспитания.