模型细节 Meta开发并发布了Llama 2系列的大型语言模型(LLMs),这是一系列预训练和微调的生成文本模型,参数规模从70亿到700亿不等。我们经过微调的LLMs称为Llama-2-Chat,专为对话场景进行了优化。在我们测试的大多数基准测试中,Llama-2-Chat模型表现优于开源的聊天模型,并且在我们的人类评估中在帮助性和安全性方面与一些流行的闭源模型(如ChatGPT和PaLM)相当。 模型开发者 Meta 变体 Llama 2有多种参数大小,包括7B、13B和70B,以及预训练和微调的变体。 输入 模型只接受文本输入。 输出...
HW12 作业描述 Policy Gradient agent.network.train()...
jieba、hanlp词性对照表 jieba a 形容词 ad 副形词 ag 形容词性语素 an 名形词 b 区别词 c 连词 d 副词 df dg 副语素 e 叹词 f 方位词 g 语素 h 前接成分 i 成语 j 简称略称 k 后接成分 l 习用语 m 数词 mg mq 数量词 n 名词 ng 名词性语素 nr 人名 nrfg nrt ...
HW14 什么是Life long learning Life long learning意思是终身学习,是指一直使用同一个神经网络去学习不同的任务。 实现life long learning大致分为三方面:knowledge retention,knowledge transfer,model expansion。 为什么不让一个模型就学习一个任务,而是要让一个模型学习多个任务? 如果是让一个模型学习一个任务,那实现一个功能多样的机器人就会面临下面这两个问题: 最终没有足够的空间存储所有模型 不同的任务之间不能够互通有无,没法从别的任务里面学到在单一任...
HW10 Attact 任务描述 ● Those are methodologies which you should be familiar with first 这些是您应该首先熟悉的方法 ○ Attack objective: Non-targeted attack 攻击目标:非目标攻击 ○ Attack constraint: L-infinity norm and Parameter ε 攻击约束 ○ Attack algorithm: FGSM attack ○ Attack schema: Black box attack (perform att...
Introduction of Deep Reinforcement Learning (RL)强化学习 强化学习与监督学习 监督学习 监督学习(supervised learning) 假设我们有大量被标注的数据,比如汽车、飞机、椅子这些被标注的图片,这些图片都要满足独立同分布,即它们之间是没有关联关系的。假设我们训练一个分类器,比如神经网络。为了分辨输入的图片中是汽车还是飞机,在训练过程中,需要把正确的标签信息传递给神经网络。 当神经网络做出错误的预测时,比如输入汽车的图片,它预测出来是飞机,我们就会直接告诉它,该预测是错误的,正确的标签应该是汽车。最后...
Domain Adaptation 本质是一个二元分类器 Domain Adaptation技术,也可以看做是 Transfer Learning 的一种 在A任务上学习的技能可以用在B上,一个Domain上学到的用在另一个Domain上 Domain Shift 只有少许标注需要做Adapt...
HW11 任务介绍 通过使用Domain Adaptation的方法将有label的真实照片(5000)来预测没有label的黑白的图案(100000)物体的类别。 训练数据来自GTA-5的街景,测试数据来自真实世界的街景,要求将Feat-A和Feat-B越接近越好 ![](ht...
HW9 作业九---Explainable AI 任务介绍 **本次作业分为两个部分,第一个部分使用了作业三的食物分类的model和dataset,第二个部分使用了作业七的BERT模型相关资料,第一部分要求使用Lime,Saliency Map,Smooth Grad,Filter Visualization,Integrated Gradients5种方法来解释,第二部分则要求使用Attention Visualization,Embedding Visualization,Embedding Analysis这 ...
Explainable AI 白马做出算术题是因为它察觉到周围观众的情绪而做对,并不是因为真的会做数学题 Why we need Explainable ML? 法律要求贷款发行人解释他们的模型。 医疗诊断模式对人的生命负责。 它可以是一个黑匣子吗? 如果在法庭上使用模型,我们必须确保模型以非歧视的方式行事 如果自动驾驶汽车突然出现异常,我们需要解释原因。 ![](htt...