Published onDecember 9, 2021tensor2tensor框架记录AI这篇文章主要讨论了tensor2tensor和tensorflow的版本依赖问题,以及一些重要参数的设置。文章重点介绍了学习率的计算方式,包括constant、linear_warmup、rsqrt_decay和rsqrt_hidden_size四个部分,并提供了一个Python函数来计算学习率。
Published onDecember 5, 2021邻近搜索AI这篇文章主要介绍了几种用于大数据场景下邻近搜索的算法,包括Annoy、HNSW、KD Tree和LSH。文章重点讲解了Annoy和HNSW两种算法的原理和实现方法,Annoy通过建立二叉树来实现快速查找,HNSW则是基于图结构并引入了分层机制来提高搜索效率。
Published onNovember 28, 2021HMM_参数估计AI这篇文章主要介绍了隐马尔可夫模型(HMM)的基本概念和两个主要任务:推断和参数估计。文章详细讲解了完整数据和不完整数据情况下的参数估计方法,包括EM算法、前向-后向算法等,并给出了估计初始概率分布、发射概率和转移概率矩阵的具体步骤。
Published onNovember 28, 2021梯度消失和BNAI这篇文章主要讨论了深度学习中的梯度消失问题及其解决方案,以及不同的归一化方法(如BN、LN、WN等)。文章指出,归一化方法可以缓解协变量偏移问题,加速网络收敛,并具有权重和数据伸缩不变性,从而提高模型的鲁棒性和泛化能力。
Published onNovember 22, 2021常用正则_python_reOngoing这篇文章介绍了使用Python的re模块进行文本处理的几个实用技巧。主要包括移除标点符号、拆分连在一起的英文句子、匹配特殊符号以及替换多余空格等操作,展示了正则表达式在文本清理和格式化中的应用。