文章列表 - 一些学习与部分故事

别着急，坐和放宽

关于关于本站关于我关于此项目

更多时间线友链监控

联系写留言发邮件 GitHub

© 2020-2025 莫叶. | RSS | 站点地图 | | Stay hungry. Stay foolish.

Powered by Mix Space&. | 浙 ICP 备 2024104483 号 |

深度学习-李沐-第三节-感知机
感知机单层感知机什么是感知机感知机为二分类，非黑即白 softmax多分类，输出可能为某类别的概率感知机训练算法这里的判断负负得正、正正得正。得正说明训练正常。同时也引出了异或的问题收敛定理异或问题 ![](https:/...
2022 年 8 月 16 日星期二
1
阅读全文
深度学习-李沐-第二节-数据处理与操作
摘要： n维数组，也称为张量（tensor），在深度学习框架中被广泛应用。张量支持GPU加速计算和自动微分，相较于NumPy的ndarray更适合深度学习任务。数据操作包括创造张量、运算符、张量连结与比较、广播机制与切片索引以及节省内存与转换对象。数据预处理包括读取数据集、处理缺失值（使用fillna()填充缺失值和利用get_dummies函数处理离散值）以及转换为张量格式。
数据操作及数据预处理定义 n维数组，也称为张量（tensor）。张量类（在MXNet中为ndarray，在PyTorch和TensorFlow中为Tensor）都与Numpy的ndarray类似。但深度学习框架⼜⽐Numpy的ndarray多⼀些重要功能：⾸先，GPU很好地⽀持加速计算，⽽NumPy仅⽀持CPU计算；其次，张量类⽀持⾃动微分。这些功能使得张量类更适合深度学习。数据操作创造张量 x = torch.arange(12) print(x) print(x.shape) print(x.numel()) ...
2022 年 8 月 16 日星期二(已编辑)
2
阅读全文
深度学习-李沐-第二节-线性代数、微积分、概率
线性代数、微积分、概率线性代数标量标量变量由普通⼩写字⺟表⽰（例如，x、y和z）定义两个标量与标量的运算向量将向量视为标量值组成的列表。标量的值称为向量的元素（element）或分量（component）。例如： x = torch.arange(4) ⻓度、维度和形状向量只是⼀个数字数组，就像每个数组都有⼀个⻓度⼀样，每个向量也是如此。向量的⻓度通常称为向量维度（dimension）。 len(x)输出向量长度，`x.s...
2022 年 8 月 16 日星期二
3
阅读全文
深度学习-李沐-第二节-线性回归
线性回归难点、疑点梯度下降线性回归的代码实现定义回归（regression）是能为一个或多个自变量与因变量之间关系建模的一类方法。在自然科学和社会科学领域，回归经常用来表示输入和输出之间的关系。 y = w1x1 + w2x2 + w3x3 + b 损失评估梯度下降 ![](https://qiniu.kanes.top/blog/4...
2022 年 8 月 16 日星期二
2
阅读全文
深度学习-李沐-第一节
conda、miniconda、anaconda的区别 conda conda是一种通用包管理系统，旨在构建和管理任何语言和任何类型的软件。包管理与pip的使用类似，环境管理则允许用户方便地安装不同版本的python并可以快速切换。 Miniconda 只包含最基本的内容——python与conda，以及相关的必须依赖项，对于空间要求严格的用户，Miniconda是一种选择。就只包含最基本的东西，其他的库得自己装。 Anaconda 一个打包的集合，里面预装好了conda、某个版本的python、众多packages、科学计算工具等等。 conda常用...
2022 年 8 月 16 日星期二
1
阅读全文
深度学习-李沐-第十一节-OptimizationAlgorithms
优化算法 ![](https:...
2022 年 8 月 16 日星期二
1
阅读全文
深度学习-李沐-第十三节-语义分割和数据集
语义分割和数据集语义分割可以识别并理解图像中每一个像素的内容：其语义区域的标注和预测是像素级的语义分割与目标检测应用场景 ![](https://qiniu.kanes.top/blog...
2022 年 8 月 16 日星期二
2
阅读全文
深度学习-李沐-第十三节-转置卷积
转置卷积在空间维度被卷积神经网络层缩小后，可以使用转置卷积用于逆转下采样导致的空间尺寸减小。基本操作填充、步幅和多通道与矩阵变换的联系小结与通过卷积核减少输入元素的常规卷积相反，转置卷积通过卷积核广播输入元素，从而产生形状大于输入的输出。 !...
2022 年 8 月 16 日星期二
1
阅读全文
深度学习-李沐-第十四节-BERT: Bidirectional Encoder Representations from Transformers
BERT来自Transformers的双向编码器表示在预训练之后，输出可以被认为是一个矩阵，其中每一行都是一个表示预定义词表中词的向量。事实上，这些词嵌入模型都是与上下文无关的。 BERT 是“Bidirectional Encoder Representations from Transformers”的首字母缩写，整体是一个自编码语言模型（Autoencoder LM），并且其设计了两个任务来预训练该模型。第一个任务是采用 MaskLM 的方式来训练语言模型，通俗地说就是在输入一句话的时候，随机地选一些要预测的词，然后用一个特殊的符号[MASK]来代替它们，之后...
2022 年 8 月 16 日星期二
阅读全文
深度学习-李沐-第十四节-微调BERT
微调BERT 一方面，在提出时，BERT改进了各种自然语言处理任务的技术水平。另一方面，原始BERT模型的两个版本分别带有1.1亿和3.4亿个参数。因此，当有足够的计算资源时，我们可以考虑为下游自然语言处理应用微调BERT。单文本分类单文本分类将单个文本序列作为输入，并输出其分类结果。语言可接受性语料库（Corpus of Linguistic Acceptability，COLA）也是一个单文本分类的数据集，它的要求判断给定的句子在语法上是否可以接受。例如，“I should study.”是可以接受的，但是“I should studying....
2022 年 8 月 16 日星期二
10
阅读全文