Introduction of Deep Reinforcement Learning (RL)强化学习 强化学习与监督学习 监督学习 监督学习(supervised learning) 假设我们有大量被标注的数据,比如汽车、飞机、椅子这些被标注的图片,这些图片都要满足独立同分布,即它们之间是没有关联关系的。假设我们训练一个分类器,比如神经网络。为了分辨输入的图片中是汽车还是飞机,在训练过程中,需要把正确的标签信息传递给神经网络。 当神经网络做出错误的预测时,比如输入汽车的图片,它预测出来是飞机,我们就会直接告诉它,该预测是错误的,正确的标签应该是汽车。最后...
Domain Adaptation 本质是一个二元分类器 Domain Adaptation技术,也可以看做是 Transfer Learning 的一种 在A任务上学习的技能可以用在B上,一个Domain上学到的用在另一个Domain上 Domain Shift 只有少许标注需要做Adapt...
HW11 任务介绍 通过使用Domain Adaptation的方法将有label的真实照片(5000)来预测没有label的黑白的图案(100000)物体的类别。 训练数据来自GTA-5的街景,测试数据来自真实世界的街景,要求将Feat-A和Feat-B越接近越好 : def init(self, args, dictionary, embed_tokens): super().init(dictionary) self.embed_tokens = embed_tokens self.embed_dim = args.encoder_embed_dim self.hidden_dim = args.encoder_ffn_embed_dim self.num_layers = args.encoder_layers ...
Sequence to sequence Batch Normalization Transformer Transformer和Bert有很大联系 Sequence-to-sequence (Seq2seq) 不知道output的长度,需要机器自行决定,例如语音辨识输入语音信号,输出是语音辨识的结果 语音合成 语音辨识反过来就是语音合成 聊...
MachineLearning 介绍 机器学习春季:https://speech.ee.ntu.edu.tw/~hylee/ml/2022-spring.php 学习计划 7月11日 Lecture 1:Introduction of Deep Learning 7月14日 Lecture 2:What to do if my network fails to train 7月17日 Lecture 3:Image as input 7月20日 Lecture 4:Sequence as input 7月23日 Lecture 5:Seque...