Ускладнення пам "яті у нейромережах

Читаючи статтю "21 століття: що таке життя з точки зору фізики "натрапив на опис пам'яті як у живій так і не живій матерії. Під пам'яттю в живій матерії всі розуміють, що мається на увазі, ну а під пам'яттю в неживій маються на увазі всі способи зберігання інформації у вашому комп'ютері і безліч інших способів. Отже, з точки зору автора статті Г. Іваницького відмінною рисою життя є використання пам'яті для прогнозування Все б добре, але тільки ми створили вже безліч програм з прогнозуванням і автоматів які керуються такими програмами. Мені не хочеться піднімати як мінімум кілька філософських питань з приводу, де ж межа живого і не живого, чи живі тоді роботи, а ми може просто складні композитні автомати і т. д. А просто вивести ланцюжок міркувань до більш цікавої мене проблеми, використовуючи матеріал статті.


Дарвін припускав, що рушійною силою еволюції є спадковість, відбір і мінливість. Однак відбір не може бути рушійною силою, він походить з того, що вже існує, зменшуючи різноманітність. Відбір це операція редукції. А замість терміну «мінливості» слід було б використовувати термін «самовкладнення». Але як реалізується механізм самозкладення?

Як і для будь-якого процесу для ускладнення необхідна енергія і напрямна використання цієї енергії. Автор не дає прямої відповіді, що і як тут має відбуватися. Він проводить максимально наближену на його погляд до цього процесу аналогію. Як з випадкового симетричного хаотичного процесу виникає спрямований процес і накопичення енергії. Чому симетричний хаотичний процес, тому що виникнення життя розглядається на молекулярному рівні в рідині, що характеризується термодинамічною рівновагою. А для простоти і наочності пояснення симетричний хаотичний процес зводиться до ймовірнісної двійкової гри.

А ймовірнісна двійкова гра це просте підкидання монетки. Така гра симетрична, для нескінченної кількості кидків середні ймовірності виграшу і програшу рівні. Питання полягає в тому, чи може гравець яким-небудь способом порушити симетрію в свою сторону?

Умови гри досить суворі, кожен раз, коли підкидається монета, гра починається знову, всі попередні результати ігор забуті. Ймовірність кожної нової гри не залежить від попередньої. Це означає, що не існує стратегії, що дозволяє виграти, а оптимальна стратегія, протиставлення випадковості випадання однієї зі сторін монети повністю випадкової стратегії вгадування сторони, гарантує нічию.

Проте, якщо гравець буде володіти пам'яттю хоча б на один раунд і можливістю змінювати величину ставки, то можна вибрати таку стратегію зміни величини ставки, яка привносить асиметрію в бік гравця. При розгляді результатів ігор у часі їх можна уявити, як послідовність кластерів виграшів і програшів різної довгості. Стратегія полягає в збільшенні ставки з одиниці за арифметичною прогресією, як тільки ви виграли. У загальній сумі після застосування такої стратегії кластери виграшів приноситимуть більше, ніж забиратимуть кластери програшів.

Така стратегія це найпростіший приклад системи управління зі змінним коефіцієнтом зворотного зв'язку. У нашому випадку стратегію придумав гравець, як це сталося в природі невідомо. Але очевидно, що центральною ідеєю всіх живих об'єктів є стратегія виживання, що вимагає наявності системи управління. У живих організмах такі системи реалізовані як на молекулярному рівні в одноклітинних, так і на клітинному рівні - на нейронах у нервовій системі вищих форм життя.

Вищеописана система управління володіє пам'яттю використовуваної для зберігання результату останньої гри в підкидання монети. З кожною новою грою комірка пам'яті оновлює своє значення. Така пам'ять заснована на простій структурі і легко реалізується на нейромережах, але все ж вона тримається рівно один такт роботи. І це можливо був перший крок природи в еволюції систем управління життям.

Зараз найскладнішим продуктом еволюції є людський мозок, що складається з безлічі нейронів. Нейрони і зв'язки між нейронами дуже, дуже складно структуровані. Досі уточнюється і вдосконалюється карта мозку, що описує які є структурні ділянки мозку і за що вони відповідають. І нам далеко навіть до складання «коннекто ́ ма» мозку людини - повного опису структури зв'язків у нервовій системі організму.

Але однією з важливих властивостей людського мозку є «постійна пам'ять», що дозволяє навчитися і реалізовувати вищеописану і подібні їй стратегії без володіння ними з народження. Логічно було б припустити, що витворяти такі фокуси нам дозволяє структура нашого мозку. І ось якщо максимально відкинути всі ускладнюючі властивості і поставити перед собою завдання створити модель системи управління, структура якої дозволяла б утримувати в пам'яті найпростішу стратегію і одночасно керуватися нею. (Мене пробиває на жорстку аналогію з виразом «система усвідомлює що робить») Чи зможемо ми вирішити таке завдання на нейронах? Як таке рішення вже існує, але у вигляді експертних систем, програм виводять нові теореми і їм подібних, але не на нейронах. І я не чув, що б хтось серйозно займався побудовою таких структур на нейромережах. Останні серйозні спроби працювати зі складними структурами нейронів це реалізація нервової системи найпростішого круглого хробака по конектому. Але в черв'яку немає структури «постійної» пам'яті, ця властивість є тільки у більш вищих форм життя. Або ж з моєї точки зору слабо усвідомлене моделювання одночасної роботи нейронів кількістю трохи більше ніж у звичайної кішки.

У мене є стаття, про те як я моделював на нейромережі систему управління простої амеби, яка йде до мети. Зараз же я хочу побудувати керуючу структуру на нейронах, яка б відповідала наступним вимогам:

  • амеба, потрапляючи в кімнату з двома орієнтирами довільно гуляючи по кімнаті, натикається на приховану їжу і розташовану випадковим чином щодо орієнтирів.
  • далі амеба потрапляє в іншу кімнату без зазначених вище орієнтирів, але з будь-якими іншими.
  • далі амеба знову потрапляє в першу кімнату і першим ділом йде на старе місце, де вона знайшла їжу.

Зі свого попереднього досвіду можу сказати, що напевно завдання буде спрощено ще більше до самого примітивного рівня зі збереженням центральної ідеї реалізувати «постійну» пам'ять. Ну а результат буде у вигляді ще одного способу як це не працює.

Матеріали:

Стаття "21 століття: що таке життя з точки зору фізики "Г.Р. Іваницький в журналі" Успіхи фізичних наук ".

Відео програма «Популярна наука» з обговоренням статті.