2017年八大最值得期待的科技-强化学习(8/8)

2017年八大最值得期待的科技-强化学习(8/8)


强化学习(ReinforcementLearning)

期待指数:★★★★★

强化学习(reinforcement learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。但在传统的机器学习分类中没有提到过强化学习,而在连接主义学习中,把学习算法分为三种类型,即非监督学习(unsupervised learning)、监督学习(supervised leaning)和强化学习。

所谓强化学习就是智能系统从环境到行为映射的学习,以使奖励信号(强化信号)函数值最大,强化学习不同于连接主义学习中的监督学习,主要表现在教师信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

当机器像人一样学习思考,各个领域的自动化发展将会替代大部分人类岗位,这对于人类自身而言是危机,还是机遇?

通过实验,计算机正在弄清楚如何做程序员无法教会它们的事情。强化学习技术,很大程度上就是Alphabet旗下人工智能子公司DeepMind开发的AlphaGo掌握复杂的围棋游戏、并击败世界最强职业选手的关键所在。