Samozavedajoči se roboti

SiNAPSA, torek, 16. april 2024

eSiNAPSA

Spletna revija za znanstvenike, strokovnjake
in nevroznanstvene navdušence

Naslovnica Članki Intervjuji Mnenja Zdravje Korenine eSinapsa Številke

Martina Starc

članki

eSinapsa, 2011-1

eSinapsa, 2011-2

eSinapsa, 2011-3

eSinapsa, 2012-4

eSinapsa, 2013-5

eSinapsa, 2013-6

eSinapsa, 2014-7

eSinapsa, 2014-8

eSinapsa, 2015-9

eSinapsa, 2015-10

eSinapsa, 2016-11

eSinapsa, 2016-12

eSinapsa, 2017-13

eSinapsa, 2017-14

eSinapsa, 2018-15

eSinapsa, 2019-16

eSinapsa, 2019-17

eSinapsa, 2020-18

eSinapsa, 2020-19

eSinapsa, 2021-20

eSinapsa, 2021-21

eSinapsa, 2022-22

eSinapsa, 2022-23

eSinapsa, 2023-24

eSinapsa, 2023-25

Uganko človeške zavesti je leta 1995 David J. Chalmers označil za težek problem¹. Težavnost je v tem, kako razložiti odnos med fizičnimi, objektivnimi pojavi kot so procesi v možganih in njihovo subjektivno izkušnjo, npr. doživljanjem določenih valovnih dolžin kot kakovost rdeče barve.

Martina Starc Ni nenavadno, da se z zavestjo veliko ukvarjajo tudi ustvarjalci robotov in umetne inteligence. Hod Lipson se v TED predavanju² sprašuje: «Kje so roboti?« Že štirideset let se zdi, da so le korak stran od realnosti, še malo pa bodo naše male gospodinje, čistili, kuhali, prali in likali za nas. V čem je problem? Roboti obstajajo in so v uporabi že dolgo, vendar zgolj za dela, ki so povsem (ali skoraj povsem) predvidljiva. Njihova zmožnost prilagajanja je še vedno na zelo nizki ravni. Resnično uporaben gospodinjski robot, kot smo ga vajeni iz znanstveno fantastičnih filmov, je, kot človek, zmožen prilagajanja novim situacijam, samostojnega mišljenja in tudi samozavedanja, tega pa današnji roboti še ne zmorejo.

Ker umetno ustvarjanje inteligence ni prineslo želene prilagodljivosti, so se raziskovalci obrnili k naravi in mehanizmu evolucije kot »najboljšemu oblikovalcu«. Novi pristopi združeni v pojmu utelešene kognicije (embodied cognition)³ temeljijo na dejstvu, da se večina mišljenja v realnem svetu dogaja v zelo posebnih in pogosto zelo kompleksnih okoljih. Namenjeno je praktičnim ciljem, izkorišča možnosti interakcije z in manipulacije zunanjih pripomočkov. Kognicija je tako visoko utelešena oziroma situacijska aktivnost, torej bi morali misleča bitja najprej dojemati kot dejavna bitja.

Taki agenti pa ne morejo biti že vnaprej in togo sprogramirani za točno določene rigidne naloge (kot računalniki), pač pa morajo biti do neke mere samoustvarjeni v interakciji z okoljem. Koncept okolja (tj. vsega ostalega) pa zahteva kot svoje nasprotje tudi koncept sebe. Večina današnjih praktičnih robotov tipično uporablja notranje matematične modele samega sebe, ki zahtevajo skrbno načrtovanje s strani inženirjev. Josh Bongard, Victor Zykoc in Hod Lipson z Univerze Cornell pa so želeli ustvariti robota, ki si na podlagi svojih izkušenj v okolju sam izdela in kasneje tudi prilagaja model samega sebe⁴. Model torej ni del njegove predprogramirane strukture. Temelji na njegovih izkušnjah okolja in je v tem smislu korak bližje subjektivnosti. Seveda ne moremo trditi, da ima robot subjektivne izkušnje oz. je celo zelo verjetno, da jih nima. Vendar pa na ta način ustvarjen model sebe bistveno vpliva na nekaj drugega – robotovo sposobnost prilagajanja. Kar nam lahko, obratno, odgovori tudi na vprašanje, zakaj je zavedanje samega sebe pomembno pri ljudeh.

Raziskovalce je zanimalo predvsem prilagajanje spremembam v lastnem sistemu npr. pri poškodbi. Njihov robot ima obliko štirikrake zvezde s skupno osmimi sklepi s senzorji ter dvema senzorjema nagiba (Slika 1). O sebi ima na voljo omejeno količino informacij, ve iz kakšnih delov je sestavljen, ne pa tudi kako so ti deli povezani med seboj.

Slika 1: Zvezdasti robot. Vir: Univerza Cornell

Robot najprej izvede naključen gib. Na podlagi povratnih informacij, ki jih prejme s senzorjev, izdela več alternativnih modelov samega sebe. Nato izvede naslednji gib, ki pa ni več naključen, pač pa izbran na podlagi izdelanih modelov tako, da bo kar najbolj informativen, tj. da ustvari največ neskladja med posameznimi modeli in robotu omogoči, da izbere najboljše. S povratnimi informacijami giba robot zopet prilagodi modele in cikel se ponovi 16-krat. Na koncu izbere najboljši oz. najverjetnejši model in sintenzira tarčno vedenje – premikanje naprej. Tak način modeliranja so raziskovalci primerjali z modeliranjem na podlagi poskusov in napak in ugotovili, da je robot, ki aktivno izbere, katero dejanje bo izvedel na podlagi trenutno predpostavljenih modelov samega sebe, uspešnejši pri sklepanju o svoji zgradbi in tudi v nalogi premikanja.

V nadaljnjem delu raziskave so robotu odstranili del noge (Slika 2). Robot je z uporabo istega postopka popravil model samega sebe in se prilagodil svoji novi obliki. Ustvarjanja lastnih kompleksnih vedenj ali prilagajanja spremembam so sicer zmožni tudi robotski sistemi brez samoustvarjenega notranjega modela, vendar le s poskusi in napakami. Učinkovitost postopka poskusov in napak je nizka, saj zahteva stotine tisoče testov na fizičnih strojih, kar je v splošnem prepočasno, energetsko neučinkovito ali tvegano. Robot v raziskavi pa se je uspel po poškodbi dokaj uspešno prilagoditi zgolj s šestnajstimi fizičnimi poskusi. To je torej prvi korak v smeri k bodočim strojem, ki bodo lahko kontinuirano zaznavali spremembe v lastni zgradbi ali okolju in uporabljali prilagojene modele za ustvarjanje prilagojenih nadomestnih vedenj.

Slika 2: Poškodovani robot. Vir: Univerza Cornell

Prvi korak je narejen, vendar je pot še dolga. Zunanji opazovalec bi zvezdastemu robotku verjetno pripisal nekakšno štirinožno pajkovsko premikanje, tako kot v predavanju pove tudi Hod Lipson: »Upali smo, da bo imel nekakšen zloben, pajkast način hoje, vendar je namesto tega ustvaril ta precej beden način premikanja.« »Hoja«, ki jo je ustvaril robot, je neke vrste plazenje, ki deluje daleč od optimalnega (video, 12.9MB).

Človek si ne more pomagati, da ne bi čutil rahlega razočaranja ob robotkovem nerodnem premikanju. Hkrati pa je nekaj ganljivega v potresavanju njegovih nožic, ko se trudi ugotoviti, metaforično rečeno, kdo je, čemu je namenjen, kam naj gre in kako. Zveni znano, kajne?

Na Univerzi Čile v Santiagu pa sta Jual Cristobal Zagal in Hod Lipson preučevala zmožnosti prilagajanja na spremembe v okolju⁵. Tokrat je bil narejen korak proti metakogniciji, tj. sposobnosti razmišljanja o lastnih miselnih procesih in samoregulaciji le-teh. Samorefleksija je v človeškem vedenju podlaga za prilagajanje novim situacijam z malo ali nič dejanskega fizičnega eksperimentiranja. Ustvarjalci so želeli ustvariti sistem, ki je sposoben uporabljati podobne procese, da se prilagodi svojemu okolju.

V nasprotju s prvim poskusom, je bila v tem primeru narejena zgolj računalniška simulacija. Glavni junak je simulirani robot na dveh kolesih, ki se nahaja v svetu premikajočih se rdečih in modrih luči. Robot je v fazi učenja nagrajen za to, da išče modre luči in se izogiba rdečim lučem. Robota neposredno nadzirajo t. i. notranji možgani, ki so popolnoma reaktivni, se torej brez refleksije odzivajo v skladu z vgrajenimi pravili. Gre za enostavno nevronsko mrežo osmih nevronov, od katerih so štirje namenjeni vhodnim signalom, dva izhodnim, dva pa sta skrita in pretvarjata vhodne signale v izhodne. Notranji možgani tako sprejemajo signale iz okolja in jih pretvarjajo v robotove premike. Na podlagi vgrajenega sistema nagrajevanja se robot nauči pravilnega vedenja (iskanja modrih luči in izogibanja rdečih).

Poleg notranjih pa ima robot tudi t. i. reflektivne možgane. Ti so kompleksnejši, saj imajo v primerjavi z notranjimi iste vhode in izhode, a več skritih nevronov. Naloga reflektivnih možganov je, da opazujejo notranje možganje, ustvarijo njihov model in jih nadzorujejo. Nadzor poteka preko nadzornih nevronskih mrež, ki filtrirajo vhodne in izhodne signale notranjih možganov.

V prvem delu eksperimenta reflektivni možgani izdelajo model notranjih možganov, ki dobro sledi in napoveduje robotovo vedenje. Pravi izziv pa pride, ko se robotovo okolje spremeni, zdaj je rdeča luč dobra, modra pa slaba. Robotovi notranji možgani zdaj niso dobro prilagojeni na okolje, in raziskovalce je zanimalo, ali lahko nadzorne nevronske mreže zgolj na podlagi preteklih izkušenj filtrirajo informacije tako, da se robot zopet začne pravilno vesti. Z vidika subjektivne izkušnje bi to pomenilo, da filtri spremenijo rdečo luč tako, da notranjim možganom izgleda bolj modra in modro tako, da izgleda bolj rdeča. Na ta način reflektivni možgani izkoristijo robotove vgrajene mehanizme prilagajanja, brez da bi direktno spreminjali robotovo notranjo arhitekturo, kar je lažji in varnejši način, saj se robot vedno lahko vrne na začetno stanje.

Samorefleksija omogoča hitro prilagajanje brez velikega števila fizičnih poskusov. Robot se je lahko prilagodil z manj kot desetimi poskusi, kar je ogromen napredek od tradicionalnih evolucijskih metod v robotiki. Ostaja pa dejstvo, da sta oba raziskana sistema relativno enostavna in je zato izdelava notranjega modela dokaj lahka. Izziv za nadaljnje raziskave pa je, v kolikšni meri je mogoče tak način modeliranja prenesti na kompleksnejše sisteme.

Chalmers D. J. (1995). Facing up to the problem of consciousness. Journal of Consciousness Studies, 2 (3), 200–219 ↩
http://www.ted.com/talks/hod_lipson_builds_self_aware_robots.html ↩
Anderson, M. L. (2003). Embodied Cognition: A field guide. Artificial Intelligence, 149, 91–130 ↩
Bongard, J., Zykov, V., in Lipson, H. (2006). Resilient machines through continuous self-modeling. Science, 314 (5802), 1118–1121 ↩
Zagal, J. C. in Lipson, H. (2009). Towards Self-Reflecting Machines: Two-Minds in One Robot. ECAL 2009: Tenth European Conference on the Simulation and Synthesis of Living Systems, Budapest, Hungary. ↩

Martina Starc,
Sinapsa