遗传算法

首先来一个视频,示范一个模拟模型人如何学会把秋千荡起来

从视频里可以看出,作者把这个荡秋千的动作分成了32份,每份用0或1来表示。由于我看不懂日文,所以以下是我的猜测。

应该是用0和1来表示是否做腿的收缩运动,利用数量极多的模型来把进化(学习)过程加快64倍,
每次都会得出一个或几个动作点的最佳方案,
然后重新把方案排序,
依次从头到尾赋予动作方案(即实验开始后视频下面BEST GENE后面的32位数字,这里显示的为到这时为止的最佳方案,你可以发现每一轮过后这串数字都会变化),
不停的循环,
最终得到了可以直接顺利让秋千荡起来的动作方案(11111110010011111110001001000000)。

这个例子看了可能不会有什么感触,但是还有两个和人类行动有些关联的例子
学习行走:http://www.bilibili.tv/video/av756943/index_2.html
学习爬行:http://www.bilibili.tv/video/av756943/index_1.html
(这真是一个励志的故事。。。。。)
经过一代又一代的探索和尝试,最后得出了可以正常行走和爬行的方法,我觉得还是比较值得学习的(尽管这个物理引擎真是渣到极点。。。)





如文中无特殊说明,本站均使用以下协议:知识共享许可协议
知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议进行许可。

本博客使用Disqus评论系统,如果看不到评论框,请尝试爬墙。