Q-LEARNING 最后得到的一个图寻路最佳路径;---直接转化为图关于多顶点深度遍历热度传递
V(level+1) = 0.8 * Max(Vi(level)) 这个方法可以在O时间收敛
原方法Q-LEARNING需要大量的POINT随机出一个数据, 对于大矩阵,前期会有大量的0单元,浪费计算
Q-LEARNING 最后得到的一个图寻路最佳路径;---直接转化为图关于多顶点深度遍历热度传递
V(level+1) = 0.8 * Max(Vi(level)) 这个方法可以在O时间收敛
原方法Q-LEARNING需要大量的POINT随机出一个数据, 对于大矩阵,前期会有大量的0单元,浪费计算
道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。