2010-11-18 10 views
5

Chodzi o to, że agent komputerowy będzie programowany w dwóch warstwach - świadomej i nieświadomej.Jak można dać komputerowi "naturalną potrzebę"?

Część nieprzytomna to zasadniczo zestaw urządzeń wejściowych i wyjściowych, które zazwyczaj uważam za czujniki (klawiaturę, temperaturę itp. Do granic wyobraźni) i metody wyjściowe (ekran i głośniki, szczególnie w przypadku domowy komputer, ale znowu do granic swojej wyobraźni). Czujniki można dodawać lub usuwać w dowolnym momencie, a ta warstwa zapewnia dwa główne kanały do ​​świadomej warstwy, pojedynczego wejścia i pojedynczego wyjścia. Zdefiniowanie, jakiego rodzaju informacje przemieszczają się między tymi dwiema warstwami, jest trudne, ale podstawową ideą jest to, że świadoma część stale otrzymuje sygnały (o różnych poziomach abstrakcji) z wyjścia części nieświadomej, a świadoma część może wysłać cokolwiek chce dotrzeć do nieświadomej warstwy przez kanał wejściowy.

Świadoma warstwa początkowo nic nie wie, jest po prostu całkowicie zniszczona przez sygnały z nieświadomej warstwy, i wie, jak wysłać sygnały z powrotem, chociaż nie wie nic o tym, jak jakiś konkretny sygnał wpłynie na część podświadomości. Świadoma część ma dużą pojemność i moc obliczeniową, jednak jest to pamięć ulotna.

Teraz za pytanie. Chciałbym, aby świadoma część systemu "rosła" w tym sensie, że nie ma pojęcia, co może zrobić, po prostu wie, że może wysyłać sygnały, a więc zaczyna się od wysłania sygnałów w dół rury i zobaczenia, jak to wpływa na dane z czujnika, które odbiera. Ślepy zaułek polega na tym, że komputer początkowo nie próbuje osiągnąć celu. Po prostu wysyła sygnały. Myślenie o tym jak narodziny dziecka, potrzebują pożywienia, snu lub przeniesienia ze słońca itd. Wrażenia sensoryczne dziecka są przekazywane do jego mózgu, który następnie decyduje się spróbować wykorzystać jego wyniki w aby uzyskać to, czego potrzebuje.

Jaką naturalną potrzebę może mieć komputer?

What have I tried?
Myślenie konkretnie o jak dziecko staje się głodny, na pewno nie czytałem żadnych badań na kota wykonać skany na płacz dzieci głodne ani nic, ale pomyślałem, że może dany sygnał pochodzi z nieświadomości z rosnącą prędkością stale, który jest zaspokojony tylko wtedy, gdy sygnały odesłane powodują, że dziecko je. Zadaniem świadomego mózgu byłoby zminimalizowanie szybkości, z jaką przychodzi każdy rodzaj sygnału. Innymi słowy, "instynktem" komputera jest ograniczanie tempa każdego nadchodzącego sygnału. Jakie inne "instynkty" mogłyby tam być? Problem z tą analogią jest oczywiście taki, że komputery nie muszą jeść. Albo przynajmniej nie potrafiłem przetłumaczyć jedzenia na coś, czego potrzebuje komputer.

Outside of the scope of this question
Ostatecznym celem jest to, aby nauczyć komputer, który wie nic oprócz jak współdziała ze światem grać Kółko i krzyżyk. Innym pomysłem było dostarczenie przycisku, który można nacisnąć, aby ręcznie stymulować szybkość danego sygnału docierającego do świadomego, gdy robi coś złego lub ręcznie łagodzi szybkość danego sygnału, gdy robi to dobrze.

+0

Fajny pomysł, podoba mi się.Losowe myślenie: jeśli chodzi o sztuczną inteligencję, czy "natura działa w ten sposób" ma niewielkie znaczenie, jeśli uważasz, że komputer powinien "chcieć"/"potrzebować" (myślę, że w tym kontekście można bezpiecznie powiedzieć, że są prawie tak samo, dopóki świadomie nie nauczyło się ich rozróżniać), a następnie sprawić, by komputer "chciał/potrzebował" tego. Ostatecznie dbasz tylko o to, czy działa, czy nie. – Crisfole

+0

Nie martwię się naturą, ponieważ znajduję cel komputera, który nigdy się nie kończy, i zmusza komputer do robienia rzeczy, aby łatwiej zaspokoić nieuniknioną "potrzebę" nadchodzącą za rogiem. Zasadniczo szukam czegoś w nieświadomej warstwie, która byłaby regularnie atakowana, aby wymusić takie zachowanie. Nie chcę mówić systemowi, co mam robić, chcę, żeby to on jak najlepiej dostarczył to, czego potrzebuje. Ponieważ w pewnym sensie mam pracę i idę do pracy, aby uzyskać jedzenie łatwiejsze. –

+0

Czy możesz porównać swój problem z problemem uczenia się wzmacniania i podkreślić różnice? – ziggystar

Odpowiedz

3

Programy wywiadowcze dotyczące maszyn zazwyczaj rozpoczynają się od poziomu nagrody na Mazlow's Hierarchy of Needs, ponieważ nie mają sposobu na dostrzeżenie potrzeb fizjologicznych, bezpieczeństwa lub potrzeb społecznych. Jednak ...

Na poziomie fizjologicznym komputer pobiera prąd. Podłącz zasilacz UPS, który informuje komputer, gdy jest zasilany z akumulatora, i masz potencjalnie przydatny sygnał wejściowy do spostrzegania potrzeb fizjologicznych.

Daj mu możliwość "dostrzeżenia", że stracił czas lub ma przerwy w zapisie czasu (z powodu awarii zasilania) i może być w stanie wprowadzić potrzebę bezpieczeństwa.

Przedstaw potrzeby społeczne dzięki interakcji. Może "czuć się" samotny, gdy wiele czasu upłynie między wprowadzaniem danych z klawiatury.

Wykrywanie straconego czasu, czasu minionego od ostatniej interakcji z klawiaturą i pracy na baterii może być jednym z wejść dostępnych dla nieprzytomnej warstwy, która może być okresowo atakowana na uwagę świadomej warstwy.

Naukowcy zajmujący się komputerami w Two Faces of Tomorrow podchodzą do podobnego problemu, szkoląc komputer po piaskownicy na satelicie, aby się uświadomić. Dają one te potrzeby, na przykład, uświadamiając, że przestanie funkcjonować bez prądu, a następnie zapewniając odpowiednią stymulację i obserwując reakcję.

to kolejna interesująca praca według tych zasad.

+1

Przepraszamy za opóźnienie w powrocie do tej odpowiedzi. Nie zdawałem sobie sprawy, że czytam powieść aż do kilku rozdziałów. –

+0

Niesamowite usprawiedliwienie @ NickLarsen ♦ – aitchnyu

3

Robot zaprogramowano tak, aby sądził, że lubi kanapki śledzia. To była najtrudniejsza część całego eksperymentu. Po zaprogramowaniu robota, by sądził, że lubi kanapki śledzia, przed nim umieszczono kanapkę śledzia. Po czym robot pomyślał: "Ach, kanapka ze śledziami! Lubię kanapki śledzia".

Następnie pochyliłby się i zgarnął kanapkę ze śledziami w swojej kanapkowej kanapce, a następnie wyprostował się ponownie. Na nieszczęście dla robota został zaprojektowany w taki sposób, że działanie prostowania spowodowało, że kanapka ze śledziami zsunęła się prosto z szufelki śledzia i spadła na podłogę przed robotem. Po czym robot pomyślał: "Ach, kanapka ze śledziem ..." itd. Powtarzaj tę samą czynność w kółko, jedyną rzeczą, która uniemożliwiła kanapkę ze śledzia znudzenie się całym cholernym biznesem i czołganiem się w poszukiwaniu innych sposobów spędzania czasu było to, że kanapka ze śledziami, będąc zaledwie kawałkiem martwej ryby pomiędzy kilkoma kromkami chleba, była nieznacznie mniej czujna na to, co się działo, niż robot.

Naukowcy z Instytutu odkryli w ten sposób siłę napędową wszelkich zmian, rozwoju i innowacji życiowych, a mianowicie: kanapki śledzia, publikując artykuł na ten temat, który został powszechnie skrytykowany jako wyjątkowo głupi. to, co odkryli, to "nuda", a raczej praktyczna funkcja nudy. W gorączce ekscytacji następnie odkrył inne emocje, takie jak "drażliwość", "depresja", "niechęć", "otyłość" i tak dalej. Następny wielki przełom nastąpił, gdy przestali używać kanapek śledzia, po czym nagle zaczęły pojawiać się nowe uczucia do nauki, takie jak "ulga", "radość", "rozbrykanie", "apetyt", "zadowolenie" i najważniejsze, pragnienie „szczęścia.

był to największy przełom wszystkim.

~ od Autostopem przez galaktykę przez Douglas Adams

Bonus

Ha Spójrz na Szkolenie wzmacniające.

+0

Dobra książka, kiepska odpowiedź. –

+0

@NickLarsen, W pełni sprawiedliwie, twoje pytanie brzmi, jakby to był pierwszy dzień, w którym kiedykolwiek zastanawiałeś się nad uczeniem maszynowym. Nic nie kwantyfikujesz i używasz tylko niejasnych terminów pseudo-psychologii, aby zrównoważyć komputer z dzieckiem. Krótko mówiąc, skutecznie nic nie pytasz i otrzymałeś odpowiednią odpowiedź. Ale tak, uczenie się wzmacniania jest tym, czego szukasz. – Cerin

+0

@ Chris S, zapytałem o coś konkretnego, wyróżnione pogrubioną czcionką w moim oryginalnym wpisie. W rzeczywistości spędziłem bardzo dużo czasu na rozmyślaniu nad pytaniem i uczeniu maszynowym w ogóle. Pytanie jest trudne, dlatego nie byłem w stanie znaleźć praktycznej odpowiedzi na własną rękę, a więc i ja pytając społeczność. Poprosiłem o coś konkretnego, a ta odpowiedź jest równoznaczna z powiedzeniem mi, żebym zbadał rolnictwo, jeśli zapytam, co jest na obiad. Ponadto, jeśli spojrzysz na znaczniki czasu, zauważysz "Bonus" został dodany po mojej odpowiedzi. –

Powiązane problemy